englisch

Julien Thomas

Switch to English
Übersetzung mit Herz und Verstand






 
Auf einen Blick



Angebot

Qualifikation

Arbeitsweise

Referenzen

Tarife

Kontakt





Service



Übersetzerprofil
als PDF zum Download

Online-Ressourcen
Hilfreiche Links



Sonstiges



Maschinenübersetzung
Just for Fun...



 
Maschinelle "Übersetzung", und was ich davon halte...


BeispieleEinleitung | Wie arbeiten CAT-Systeme? | Schlussfolgerungen



Stand der Technik - "Machine Translation" und "Computer Aided Translation"

Das Übersetzen eines Textes erfordert Sprachverständnis,  Allgemeinwissen und Fachwissen. Seit Jahrzehnten wird versucht, Maschinen diese Denkleistungen beizubringen. Bisher haben jedoch weder spezielle Hardware (neuronale Netzwerke, Parallelrechner) noch besondere Programmiertechniken, Algorithmen und umfangreiche Datenbanken zum Erfolg geführt. Es ist nur zu offensichtlich, dass die größenwahnsinnigen und weltfremden Ankündigungen der KI-Forschung immer nur der Freisetzung neuer Fördermittel gedient haben. Übersetzen bedeutet Denkarbeit, und Computer können nach wie vor nicht denken, so einfach ist das.
Schaut man sich einmal die heute zur Verfügung stehenden "Hilfsmittel" an, so wird schnell klar, dass das Verstehen und Übersetzen von Text wohl noch für längere Zeit eine reine Menschaufgabe bleiben wird:


Machine Translation, MT

Die simpelsten Ansätze zur maschinellen Übersetzung basieren auf der 1-zu-1 Übertragung einzelner Vokabeln, wobei Nebensächlichkeiten, wie Grammatik und Kontext weitgehend unter den Tisch fallen. Entsprechend amüsant sehen dann auch die Ergebnisse aus. Sicher hat MT eine Existenzberechtigung - als Orientierungshilfe  für einen ersten Einblick in fremdsprachige Webseiten. Hier kann man sich über eine online verfügbare Übersetzungsmaschine (Beispiel) einen ersten Überblick verschaffen.


Computer Aided Translation, CAT

Effizientere Arbeitsweise, enorme Zeitersparnis, weniger Tipparbeit, problemlose Einhaltung festgelegter Terminologien, Professionalität schlechthin - das sind die mit CAT-Software verknüpften Heilsversprechungen.
Bei Phantasiepreisen um die 1000 Euro für ein Komplettpaket müssen sich die Anbieter argumentativ schon etwas einfallen lassen...
Aber ist CAT denn wenigstens eine Hilfe bei der professionellen Übersetzerarbeit? Ich behaupte: Nichtmal das.


Wie arbeiten CAT-Systeme?
Gängige CAT-Systeme teilen einen unbekannten Text nicht in einzelne Wörter auf (wie MT), sondern in größere Einheiten, wie Ausdrücke, Sätze oder Absätze. Nach dieser Fragmentierung durchsucht das Programm sein sogenanntes "Translation Memory" (TM) nach einer passenden Entsprechung in der Zielsprache. Wenn für eine bestimmte Phrase noch keine passende Übersetzung vorliegt, wird der Benutzer gebeten, eine oder mehrere Varianten anzugeben. Auf diese Weise baut sich nach längerer Interaktion mit einem oder mehreren fachkundigen(!) Übersetzern ein mächtiger Phrasenspeicher auf.
Im Idealfall sollen sich unbekannte Texte aus demselben Fachbereich praktisch in einem Rutsch verarbeiten lassen; der Benutzer soll nur noch die angebotenen Übersetzungsfragmente abnicken müssen und das Ganze vielleicht am Ende noch einmal korrekturlesen.

Wer ein CAT-System einsetzt, geht also von folgenden Grundannahmen aus:
  • Die Quelle lässt sich ohne Berücksichtigung des Kontextes fragmentieren
  • Ähnliche Ausdrücke können immer auf die gleiche Weise übersetzt werden
  • Häufig gebrauchte Ausdrücke sind relevanter als selten gebrauchte
  • Der Benutzer muss den Ausgangstext nicht als Ganzes durcharbeiten (...oder gar verstehen)

Und wie bewähren sich diese Annahmen in der Realität?

Extremfall: Die Quelle besteht aus einer Aneinanderreihung von Standardformulierungen.
Sowas läuft mit dem passenden TM ruckzuck durch! Das Ergebnis ist logischerweise wieder eine Aneinanderreihung von Standardformulierungen, nur eben in der Zielsprache. Feine Sache, wenn es vor allem schnell und billig gehen soll und die Qualität der Übersetzung niemanden interessiert.

Normalfall: Der Quelltext stammt von einem "natürlichen" Autor; Originalität und abwechslungsreicher Schreibstil nicht ausgeschlossen...
So ein Text wird nun leider trotz umfangreicher TMs niemals in einem Rutsch übertragbar sein. Viele Passagen müssen "von Hand" bearbeitet werden, und man kommt doch wieder nicht umhin, sich am Ende noch einmal mit dem Quelltext zu befassen. Na, hoffentlich hat das TM dazu gelernt und gerät bei weiteren Texten dieser Art nicht mehr so häufig ins Stocken...? (Erwarten'se nix!)

So ein TM entwickelt nach intensiver Benutzung einen enormen Speicherbedarf, viel mehr als ein umfangreiches Wörterbuch oder Glossar. Damit die Suche nach bestimmten Phrasen nicht immer länger dauert, muss die Anzahl von Übersetzungsalternativen schon aus technischen Gründen begrenzt werden.
Der euphemistische Ausdruck dafür lautet "Bereinigung": Ähnliche Satzpaare werden zusammengefasst und selten benutzte Satzpaare verschwinden wieder aus dem TM, um Speicherplatz freizugeben.
Durch diese Praxis kristallisieren sich die am häufigsten gebrauchten Floskeln zwangsläufig als "Standard" heraus.

Schon die reguläre Arbeit mit einem TM-basierten System produziert Zieltexte, die sprachlich verarmt, schablonenhaft und langweilig sind.


Wer das vermeiden will, darf in einem freien Land selbstverständlich die Übersetzung nochmal umformulieren, wenn Zeit und Muße vorhanden sind. Am besten nochmal "old school" übersetzen, Satz für Satz, und sich immer wieder über die Irrungen und Wirrungen der maschinell erzeugten Interpretation wundern.  (Moment mal, wäre es nicht besser gewesen, von Anfang an eine vernünftige Arbeit abzuliefern?!)

Die Ideologie von der Terminologie
Vielbeschworenes Argument der CAT-Fetischisten ist die "Einhaltung vorgegebener Terminologien". Sie soll ja durch den Einsatz von TMs so unglaublich viel einfacher geworden sein.
Im Grunde ist dieses Argument eine bodenlose Frechheit, denn es unterstellt dem konventionell arbeitenden menschlichen Übersetzer, er könne nicht einmal die nötige Disziplin und Sorgfalt aufbringen, um sich innerhalb eines längeren Textprojektes an festgelegte Terminologien zu halten.
Dabei versagt das tollste CAT-System bei der Einhaltung von terminologischen Festlegungen, wenn schon der Quelltext in seiner Terminologie inkonsistent war. Dann wird nämlich das Ergebnis ebenso uneinheitlich ausfallen, es sei denn, man bringt dem System in jedem Einzelfall bei, was zu vereinheitlichen ist, und was nicht. Es läuft immer auf dasselbe hinaus. Am Ende muss der menschliche Übersetzer wieder mit seinem Kontextwissen Korrektur lesen, damit das Ergebnis einigermaßen verständlich bleibt. Anderenfalls ist die Gefahr doch recht groß, dass wichtge Aussagen des Originaltextes durch die CAT-bedingte Vereinheitlichung vollkommen untergehen! (Computer kennen keinen Kontext...)





Schlussfolgerungen:

CAT-Systeme können hochgradig phrasierte Texte nahezu ohne Bedeutungsverlust in eine andere Sprache übertragen und erreichen in solchen Fällen einen Zeitvorsprung im Vergleich zur mühsamen manuellen Übersetzung.

Jeder einigermaßen natürliche Text erzeugt jedoch erheblichen Korrekturbedarf, insbesondere dann, wenn die Übersetzung stilistische und fachliche Mindestanforderungen erfüllen soll.

Eine literarische Übersetzung, eine originelle Werbebotschaft, eine informative Website oder auch eine frustrationsarme Gebrauchsanleitung - diese Texte bestehen gerade nicht aus einer Aneinanderreihung von Phrasen!

Für eine gute Übersetzung muss der Text im Zusammenhang betrachtet werden. Dieses Kontextverständnis kann bis dato kein CAT-System mit noch so umfangreichen TMs imitieren. Meine Erfahrungen mit einigen prominenten CAT-Tools deuten darauf hin, dass man mit so einem System auch nach längerer Einarbeitung bestenfalls eine mittelmäßige Qualität erzeugen kann.

CAT ist demnach das genaue Gegenteil von "Herz und Verstand". Und deswegen verwendet der Julien Thomas in seiner Übersetzerpraxis grundsätzlich keine MT- oder CAT-Software!








Maschinenhumor


In einem Zeitalter umfangreicher elektronischer Kommunikationsmöglichkeiten geben sich künstliche Intelligenz und natürliche Inkompetenz ein Stelldichein...

Beispiel 1: Offensichtlich maschinell übersetzte Programmbeschreibung


"iRadioNet Details - Software Description:
Superlicht und bedienungsfreundliches Internet senden Spieler für Microsoft Windows zu strömender Musik des Spiels und der Aufzeichnung von den Tausenden der freien on-line-Stationen und zum Spielen der Audioakten von lokalen oder des Netzes Festplatten. Unterstützung nach Formaten: Strom, der mp3, wma, asf spielt und notiert; Audiospielen - mp3, mp2, mp1, wav, cda, Umb., usw.. Er ist wie ein Radio in Ihrem Auto: eine volle Funktionsvorrichtung mit Super-einfacher Benutzerschnittstelle (sogar kann ein Zicklein sie benutzen). Keine unbrauchbaren Tasten und Wahlen, Datenbank easy-to-use/keep/edit/add radio/audio, Minimum Systembetriebsmittel. Eigenschaften umfassen die Führung, die anfaßt, ein haltenes, Lautstärkeregler, Satz nützliche Konfigurationswahlen, verbesserte Stabilität und Einfachheit Station-DB! Im Metaaufzeichnungsmodus kann vollständiger Song gespeichert werden, selbst wenn Sie Aufnahme mitten in dem Song beginnen! Und sogar mehr - Sie können das Programm von der Befehlslinie laufen lassen, um Musik zu notieren, während Sie schlafen!"
(Quelle: www.filehungry.com)


Beispiel 2: SYSTRAN-Elaborat:

"[...] Was ist HTML?
HTML ist ein spezielle Sprache, in der alle Webseiten geschrieben werden. Es besteht aus Anweisungen für die Internet-Browser, wie "schau ein Bild here" oder "start ein neues paragraph". Die Browsers liest die HTML Code Ihrer Webseite und zeigt ihn entsprechend den Anweisungen an, die Code spezifiziert werden.
Um zu sehen wie HTML ist, beschließt Rechtklicken auf dieser Seite und das "View Source" Option. Sie sehen die HTML Code für diese Seite. Merken Sie Lose Wörter, die zwischen &quot gesetzt werden; " Buchstaben. Diese Wörter sind die HTML Anweisungen.
Das ist nicht eine Notwendigkeit, HTML zu kennen, um Webseiten zu verursachen. Programme wie * Microsoft Frontpage * verursachen es automatisch für Sie. Jedoch wenn Sie es erlernen, haben Sie mehr Steuerung über wie Ihre Web site aussieht. HTML ist nicht hart zu erlernen, obgleich es etwas Praxis erfordert."











© 05/2007 Julien Thomas