Das Übersetzen eines Textes erfordert Sprachverständnis,
Allgemeinwissen und Fachwissen. Seit
Jahrzehnten wird versucht, Maschinen diese Denkleistungen beizubringen.
Bisher haben jedoch weder spezielle Hardware (neuronale Netzwerke,
Parallelrechner) noch besondere Programmiertechniken, Algorithmen und
umfangreiche Datenbanken zum Erfolg geführt. Es ist nur zu
offensichtlich, dass die größenwahnsinnigen und weltfremden
Ankündigungen der KI-Forschung immer nur der Freisetzung neuer
Fördermittel gedient haben. Übersetzen bedeutet Denkarbeit,
und Computer können nach wie vor nicht denken, so einfach ist das.
Schaut man sich einmal die heute zur Verfügung stehenden
"Hilfsmittel" an, so wird schnell klar, dass das Verstehen und
Übersetzen von Text wohl noch für längere Zeit eine
reine Menschaufgabe bleiben wird:
Machine Translation, MT
Die simpelsten Ansätze zur maschinellen Übersetzung basieren auf der 1-zu-1 Übertragung einzelner Vokabeln, wobei
Nebensächlichkeiten, wie Grammatik und Kontext weitgehend unter den Tisch fallen. Entsprechend
amüsant sehen
dann auch die Ergebnisse aus. Sicher hat MT eine
Existenzberechtigung - als Orientierungshilfe für einen
ersten Einblick in fremdsprachige Webseiten. Hier kann man sich
über eine online verfügbare
Übersetzungsmaschine (
Beispiel)
einen ersten
Überblick verschaffen.
Computer Aided Translation, CAT
Effizientere Arbeitsweise, enorme Zeitersparnis, weniger
Tipparbeit, problemlose Einhaltung festgelegter Terminologien,
Professionalität schlechthin - das sind die mit CAT-Software
verknüpften Heilsversprechungen.
Bei Phantasiepreisen um
die 1000 Euro für ein Komplettpaket müssen sich die Anbieter
argumentativ schon etwas einfallen lassen...
Aber ist CAT denn wenigstens eine Hilfe bei der professionellen Übersetzerarbeit? Ich behaupte: Nichtmal das.
Wie arbeiten CAT-Systeme?
Gängige CAT-Systeme teilen einen unbekannten Text nicht in
einzelne Wörter auf (wie MT), sondern in größere
Einheiten, wie Ausdrücke, Sätze oder Absätze. Nach
dieser Fragmentierung durchsucht das Programm sein sogenanntes
"Translation Memory" (TM) nach einer passenden Entsprechung in
der Zielsprache. Wenn für eine bestimmte Phrase noch keine passende Übersetzung vorliegt,
wird der Benutzer gebeten, eine oder mehrere Varianten anzugeben. Auf
diese Weise baut sich nach längerer Interaktion mit einem oder
mehreren fachkundigen(!) Übersetzern ein mächtiger
Phrasenspeicher auf.
Im Idealfall sollen sich unbekannte Texte aus demselben Fachbereich
praktisch in einem Rutsch verarbeiten lassen; der Benutzer soll nur
noch die angebotenen Übersetzungsfragmente abnicken müssen
und das Ganze vielleicht am Ende noch einmal korrekturlesen.
Wer ein CAT-System einsetzt, geht also von folgenden
Grundannahmen aus:
- Die Quelle lässt sich ohne Berücksichtigung
des Kontextes fragmentieren
- Ähnliche Ausdrücke können immer auf die gleiche Weise übersetzt werden
- Häufig gebrauchte Ausdrücke sind relevanter
als selten gebrauchte
- Der Benutzer muss den Ausgangstext nicht als Ganzes
durcharbeiten (...oder gar verstehen)
Und wie bewähren sich diese Annahmen in der Realität?
Extremfall: Die Quelle besteht aus einer Aneinanderreihung von
Standardformulierungen.
Sowas läuft mit dem passenden TM ruckzuck durch! Das Ergebnis ist
logischerweise wieder eine Aneinanderreihung von
Standardformulierungen, nur eben in der Zielsprache. Feine Sache, wenn
es vor allem schnell und billig gehen soll und die Qualität der Übersetzung
niemanden interessiert.
Normalfall: Der Quelltext stammt von einem "natürlichen" Autor;
Originalität und abwechslungsreicher Schreibstil nicht
ausgeschlossen...
So ein Text wird nun leider trotz umfangreicher TMs niemals in einem Rutsch
übertragbar sein. Viele Passagen müssen "von Hand" bearbeitet
werden, und man kommt doch wieder nicht umhin, sich am
Ende noch einmal mit dem Quelltext zu befassen. Na, hoffentlich
hat das TM dazu gelernt und gerät bei weiteren Texten dieser Art
nicht mehr so häufig ins Stocken...? (Erwarten'se nix!)
So ein TM entwickelt nach intensiver Benutzung einen
enormen Speicherbedarf, viel mehr als ein umfangreiches Wörterbuch oder Glossar. Damit die Suche nach bestimmten Phrasen
nicht immer länger dauert, muss die Anzahl von
Übersetzungsalternativen schon aus technischen Gründen
begrenzt werden.
Der euphemistische Ausdruck dafür lautet
"Bereinigung": Ähnliche Satzpaare werden zusammengefasst und
selten benutzte Satzpaare verschwinden wieder aus dem TM, um Speicherplatz freizugeben.
Durch diese
Praxis kristallisieren sich die am häufigsten gebrauchten Floskeln
zwangsläufig als "Standard" heraus.
Schon die reguläre
Arbeit mit einem TM-basierten System produziert Zieltexte, die sprachlich verarmt, schablonenhaft und langweilig sind.
Wer
das vermeiden will, darf in einem freien
Land selbstverständlich die Übersetzung nochmal
umformulieren, wenn Zeit und Muße vorhanden sind. Am besten
nochmal "old school" übersetzen, Satz für Satz, und sich
immer wieder über die Irrungen und Wirrungen der maschinell
erzeugten Interpretation wundern. (Moment mal, wäre es nicht
besser gewesen, von Anfang an eine
vernünftige Arbeit abzuliefern?!)
Die Ideologie von der Terminologie
Vielbeschworenes Argument der CAT-Fetischisten ist die "Einhaltung
vorgegebener Terminologien". Sie soll ja durch den Einsatz von TMs
so unglaublich viel einfacher geworden sein.
Im Grunde ist dieses Argument eine bodenlose Frechheit, denn es
unterstellt
dem konventionell arbeitenden menschlichen Übersetzer, er
könne nicht einmal die nötige Disziplin und Sorgfalt
aufbringen, um sich innerhalb eines
längeren Textprojektes an festgelegte Terminologien zu halten.
Dabei versagt das tollste CAT-System bei der Einhaltung von
terminologischen Festlegungen, wenn schon der
Quelltext in seiner Terminologie inkonsistent war. Dann wird
nämlich das Ergebnis ebenso uneinheitlich ausfallen, es sei denn,
man bringt dem System in jedem Einzelfall bei, was zu vereinheitlichen
ist, und was nicht. Es läuft immer auf dasselbe hinaus. Am Ende
muss der menschliche
Übersetzer wieder mit seinem Kontextwissen Korrektur lesen, damit
das Ergebnis
einigermaßen verständlich bleibt. Anderenfalls ist die
Gefahr doch recht groß, dass wichtge Aussagen des Originaltextes
durch die CAT-bedingte Vereinheitlichung vollkommen untergehen!
(Computer kennen keinen Kontext...)
CAT-Systeme können
hochgradig phrasierte Texte nahezu ohne Bedeutungsverlust in eine
andere Sprache übertragen und erreichen in solchen Fällen
einen Zeitvorsprung im Vergleich zur mühsamen manuellen
Übersetzung.
Jeder einigermaßen natürliche Text erzeugt jedoch
erheblichen Korrekturbedarf, insbesondere dann, wenn die
Übersetzung stilistische und fachliche Mindestanforderungen
erfüllen soll.
Eine literarische Übersetzung, eine originelle
Werbebotschaft, eine informative Website oder auch eine
frustrationsarme Gebrauchsanleitung - diese Texte bestehen gerade nicht aus einer Aneinanderreihung von Phrasen!
Für eine gute Übersetzung muss der Text im Zusammenhang
betrachtet werden. Dieses Kontextverständnis kann bis dato
kein CAT-System mit noch so umfangreichen TMs imitieren. Meine
Erfahrungen mit einigen prominenten CAT-Tools deuten darauf hin, dass
man mit so einem System auch nach längerer Einarbeitung
bestenfalls eine mittelmäßige Qualität
erzeugen kann.
CAT ist demnach das genaue Gegenteil von "Herz und Verstand". Und
deswegen verwendet der Julien Thomas in seiner Übersetzerpraxis
grundsätzlich keine
MT- oder CAT-Software!