DeepL vs. Google Translate:Wie eine Kölner Firma Googles Übersetzer herausfordert

DeepL vs. Google Translate: Der Ruhm wächst, wenn man zu Asche geworden ist, meinte Ovid. DeepL kommt da noch nicht richtig mit.

Der Ruhm wächst, wenn man zu Asche geworden ist, meinte Ovid. DeepL kommt da noch nicht richtig mit.

  • Übersetzung durch Software wird immer besser, ist aber noch weit von Perfektion entfernt.
  • Mit DeepL konkurriert auch eine Kölner Firma mit Google um den Titel des besten digitalen Übersetzers.
  • Vor allem bei alltagssprachlichen Texten punkten die Kölner, das liegt laut Experten wohl an den Trainingsdaten für die Übersetzungsmaschinen.

Von Jan Schwenkenbecher

Klein, gelb, egelartig und das wahrscheinlich seltsamste Geschöpf im Universum soll er sein. Er nistet sich im Ohr seines Trägers ein. Er ernährt sich von den Strömen, die andere Gehirne absondern und scheidet die Überreste im Sprachzentrum seines Wirts aus. Die Überreste - das sind Übersetzungen aus allen nur erdenklichen Sprachen.

Das Geschöpf heißt Babelfisch. Erfunden hat ihn der britische Schriftsteller Douglas Adams in seinem 1979 erschienenen Science-Fiction-Roman "Per Anhalter durch die Galaxis". Genau dieser Babelfisch wurde bald zu einer Utopie, von der Menschen träumen und an der Forscher seit Generationen arbeiten: ein Übersetzungswerkzeug, das alle Sprachbarrieren der Welt überwindet. Vor eineinhalb Jahren schien es zum ersten Mal greifbar zu sein. Da ging der Übersetzungsdienst einer kleinen Kölner Firma online. Er nennt sich DeepL und verspricht, besser zu sein als alles bisher Dagewesene.

Über Nacht, so schien es, hatte eine kleine Firma mit nur 30 Mitarbeitern die Tech-Giganten überflügelt, noch dazu in einer ihrer Paradedisziplinen. Den Beweis dafür lieferte ein Blindtest. Die Erfinder von DeepL ließen 100 Sätze von Google, Microsoft, Facebook und dem eigenen Programm übersetzen. Professionelle Übersetzer kürten dann den Sieger - ohne zu wissen, welcher Text woher stammt. Das überraschende Ergebnis: DeepL gewann dreimal häufiger als der Rest. Viele Selbstversuche im Internet konnten das bestätigen. In einer Studie der Universität Genf schnitt DeepL für Übersetzungen vom Deutschen ins Französische ebenfalls besser ab als der Übersetzer von Microsoft. Ein kleines Wunder. Vor allem, wenn man bedenkt, wo die Suche nach der perfekten Übersetzung vor 70 Jahren begann.

1954: IBM präsentiert die erste maschinelle Übersetzung

Im Jahr 1947 meldete sich der amerikanische Mathematiker Warren Weaver per Brief bei seinem Fachkollegen Norbert Wiener, Mathematikprofessor am MIT. Weaver schrieb damals, das Problem der Übersetzung beeinträchtige die Kommunikation zwischen den Völkern. Und damit auch das friedliche Zusammenleben auf dem ganzen Planeten. Und weiter: "Ich habe mich gefragt, ob es undenkbar wäre, einen Computer zu entwerfen, der übersetzen würde."

Sein Kollege Wiener hielt das für reichlich unrealistisch. Er entgegnete, die Computersprache sei viel zu vage und die emotionalen und internationalen Bedeutungen seien viel zu umfangreich für mechanische Übersetzungen. Weaver ließ sich trotzdem nicht von seiner Idee abbringen. Es gelang ihm, das Interesse der US-Regierung zu wecken. Der Staat investiere in den Folgejahren viel Geld, um den Babelfisch zu bauen.

Ein erster Coup gelang am 7. Januar 1954. In New York präsentierten Wissenschaftler von IBM und der Georgetown-Universität geladenen Journalisten die erste maschinelle Übersetzung der Geschichte. Erledigt von einem mannshohen IBM 701-Computer, der russische Sätze ins Englische übersetzte. 250 Wörter und sechs Grammatikregeln schaffte die Maschine. Die Journalisten waren begeistert, einer der beteiligten Forscher ließ sich sogar zu der gewagten Prognose hinreißen, in drei bis fünf Jahren werde das Problem maschineller Übersetzungen für einige Sprachen erledigt sein. Es sollte anders kommen. Eine von der US-Regierung eingesetzte Kommission erteilte der Vision Jahre später eine gründliche Absage, weil praktisch keine Fortschritte erzielt werden konnten. Die Forschung kam zum Erliegen. Nur ein paar wenige Anhänger wollten nicht aufgeben. Sie pflegten weiter Wörterbücher in Programme ein, codierten Regeln zur Übersetzung, verfeinerten die Vorschriften.

Altavista-Übersetzer war noch nahezu unbrauchbar

Einer der größten Erfolge in dieser sogenannten regelbasierten Übersetzung gelang dem Informatiker Peter Toma. Er arbeitete seit Mitte der 1960er-Jahre an einem Übersetzungsprogramm namens Systran. Erster Kunde wurde die US Air Force. Sie wollte damit russische Texte für die US-Amerikaner lesbar machen. Auch die Nasa und die Europäische Kommission gehörten bald zu den Kunden. Später ging Systran eine Kooperation mit dem Suchmaschinenanbieter Altavista ein, das 1997 den ersten Online-Übersetzungsdienst anbot. Der Name: Babelfish.

DeepL vs. Google Translate: "When they go low, we go high", sagte First Lady Michele Obama 2016 und meinte damit sinngemäß: "Wir werden uns nicht auf deren Niveau herablassen". Übersetzungs-Apps sehen das anders.

"When they go low, we go high", sagte First Lady Michele Obama 2016 und meinte damit sinngemäß: "Wir werden uns nicht auf deren Niveau herablassen". Übersetzungs-Apps sehen das anders.

Wie viel zur Perfektion fehlte, wurde spätestens ein Jahr später deutlich. Altavista bot auf seiner Webseite eine maschinell übersetzte Version des Starr-Reports an - des berühmt gewordenen Berichts von Sonderermittler Kenneth Starr zur Causa Bill Clinton und Monica Lewinsky. Ein Auszug: "Im Verlauf des Flirtings mit ihm, hob sie ihre Jacke in der Rückseite an und zeigte ihm die Brücken ihrer Zapfenunterwäsche, die über ihr Hosen ausdehnten."

Die nächste technische Revolution lösten Ingenieure von IBM aus. Auf die Spur gebracht hatte sie Ende der 1980er eine Idee aus dem Bereich der Spracherkennung: Statt den Softwareprogrammen Regeln vorzugeben, könnten Computer doch mit fertigen Übersetzungen selbst lernen, wie sie einen Satz am sinnvollsten übersetzen. Gewissermaßen die Geburtsstunde der statistischen maschinellen Übersetzung. Die Ingenieure fütterten das Programm mit von Menschen übersetzten Texten, um ihm so die häufigste Übersetzung eines jeden Wortes beizubringen. Gleichzeitig las das Programm etliche Texte in der Zielsprache. Um zu lernen, wie man schöne Sätze baut.

Weil sich die Satzstrukturen von Sprachen unterscheiden, stießen diese Wort-für-Wort-Übersetzungen aber schnell an eine Grenze. Also brachten die Entwickler den Programmen bei, die Wörter neu anzuordnen. Ein anderes Problem ließ sich damit nicht lösen: Manche Wörter ergeben in einer anderen Sprache zwei Wörter, umgekehrt können zwei hintereinanderstehende Wörter auch durch ein einzelnes Wort übersetzt werden. Die "daily newspaper" ist eben die "Tageszeitung", nicht die "tägliche Zeitung".

"Klitoris-Festival" statt Rübenfest für ein spanisches Dorf

Kurz nach der Jahrtausendwende kam Wissenschaftlern eine neue Idee: statt einzelner Wörter ganze Phrasen zu übersetzen. Man teilte den Satz vor der Bearbeitung in bis zu drei Wörter lange Glieder ein - mit einem deutlich besseren Ergebnis. Einer der beteiligten Wissenschaftler, der damals an der RWTH Aachen forschende Franz Josef Och, wechselte daraufhin zu Google. Er stieg zum Chef-Architekten von Google Translate auf, einem Dienst, der 2006 online ging. Anfangs allerdings nur für Übersetzungen zwischen Englisch und Arabisch.

Vor dem Start fütterten die Google-Wissenschaftler ihre Maschine mit Milliarden geschriebener Wörter. Weitere Milliarden folgten, das Programm lernte immer neue Sprachen. Probleme bereiteten nur solche Sprachen, für die es wenig Übungsmaterial gab. Zum Beispiel das galicische Spanisch. Die kleine, spanische Gemeinde As Pontes wurde dadurch vor vier Jahren weltberühmt. Es gibt dort das Fest "Feira do Grelo", bei dem die Veranstalter jedes Jahr einen Wettbewerb um die besten Grelos ausrichten, die besten Rübstiel-Rezepte. Um das Event landesweit zu bewerben, übersetzten die Organisatoren den Namen kurzerhand per Google Translate aus dem Galicischen ins Spanische. Ein Fehler. Über Monate hinweg bewarb die Gemeinde das "Feria Clitoris". Das Klitoris-Festival. Auf der städtischen Webseite konnte man nachlesen, dass die Klitoris eines der typischen Produkte der galicischen Küche sei.

Japan - Sushi + Bratwurst = Deutschland

Während die Übersetzungsprogramme sich mit solchen Fehlern noch in Internet-Anekdoten verewigten, war die dritte Revolution schon in vollem Gange. Künstliche neuronale Netze sollten der maschinellen Übersetzung ihren dritten und vorerst letzten Hype bescheren. Gemeint sind Programme, die nicht nur Wörter oder Phrasen, sondern einen ganzen Satz übersetzen. "Ein Wort wird als Vektor repräsentiert, der aus mehreren Dimensionen besteht", sagt Josef van Genabith, Professor für Translationale Sprachtechnologie an der Uni des Saarlandes und Leiter des Forschungsbereichs multilinguale Technologien am Deutschen Forschungszentrum für künstliche Intelligenz. Allerdings ist ein solcher Vektor nicht wie im Matheunterricht in der Oberstufe nur zwei- oder dreidimensional. Auf bis zu 1000 Dimensionen kann er verschiedene Werte einnehmen. "Man hat also diesen hochdimensionalen Raum", sagt van Genabith, "in dem jedes Wort irgendwo liegt. Je ähnlicher sich Wörter sind, desto enger liegen sie beieinander."

So verstehen die neuronalen Netze Synonyme von Wörtern. Das ist ein riesiger Vorteil zur statistischen Methode, für die "Katze" und "Katzen" zwei vollkommen unabhängige Begriffe sind. "Das Tolle ist, dass wir mit Vektoren rechnen können", sagt van Genabith. "Man kann zum Beispiel den Vektor von 'Japan' nehmen. Subtrahiert man den Vektor von 'Sushi' und addiert 'Deutschland', dann kommt 'Bratwurst' raus." Aus den einzelnen Wörtern baut das System eine neuronale Repräsentation für den ganzen Satz, den es dann übersetzt. So erkennt es den Kontext besser, weil nicht einzelne Satzteile unabhängig voneinander übersetzt werden.

Im Mai 2015 stellte die chinesische Suchmaschine Baidu als erster Anbieter ihren Übersetzungsdienst auf neuronale maschinelle Übersetzung um. Google und Microsoft zogen kurz darauf nach. Die meisten Anbieter setzten seither auf sogenannte rekurrente neuronale Netze. Sie "lesen" einen Satz, ganz wie der Mensch, von links nach rechts oder von rechts nach links, sagt van Genabith. DeepL scheint dagegen nach Meinung von Experten konvolutionale Netze einzusetzen. Die Kölner Firma will sich dazu nicht äußern. Man kann sie derzeit weder besuchen, noch mit dem Chef telefonieren. Dass die Netze konvolutional sind, will ein Pressesprecher nicht bestätigen. Er dementiert es aber auch nicht.

Konvolutionale Netze werden häufig in der Bilderkennung eingesetzt. "Im Unterschied zu rekurrenten Netzen arbeiten sie viel besser parallel, weshalb man sie deutlich schneller trainieren kann", sagt van Genabith. In der Qualität macht das angeblich nicht so viel Unterschied. Trotzdem kann der Wissenschaftler van Genabith dem Kölner Übersetzungsdienst DeepL einiges abgewinnen: "Übersetzt man Fachtexte aus bestimmten Bereichen, gibt es zwar genauere Anbieter. Aber was die allgemeine Sprache angeht, ist DeepL oft besser als die Konkurrenz."

Google hat wohl mehr Daten als DeepL, doch DeepL hat bessere

Wahrscheinlich machen die Trainingsdaten am Ende den Unterschied. Gereon Frahling, Chef von DeepL, arbeitete bis 2007 selbst bei Google. Dann kündigte er und begann ein neues Projekt, das zwei Jahre später erschien. Es heißt Linguee und ist eine Suchmaschine für Übersetzungen. Statt Wörter oder Sätze direkt zu übersetzen, sucht das Programm im Internet nach Texten, die in beiden Sprachen vorliegen und in denen derselbe Ausdruck schon mal übersetzt wurde.

"DeepL hat, als sie noch Linguee waren, ganz viele parallele Daten kuratiert", sagt van Genabith. Er glaubt, dass der Datensatz sehr sauber ist, weil die Firma viel Arbeit in die Aufbereitung gesteckt hat. Sehr wahrscheinlich besitzt Google mehr Daten, nur sind die womöglich nicht so gut. Sehen kann man das auch in der sprachlichen Vielfalt der Dienste: DeepL ging mit sieben Sprachen an den Start, heute kann es neun Sprachen übersetzen. Google Translate hingegen vermittelt mehr als 100 Sprachen. Die Qualität hängt stark vom Bereich ab, den man sich anschaut. "Bei Texten zur Medizintechnik ist Google besser", sagt van Genabith. Viel hängt davon ab, mit welchen Texten trainiert wird. Wer regelmäßig Texte zum Wetter bearbeitet, kann eben super Wetterberichte übersetzen.

Van Genabith glaubt trotzdem nicht, dass aus DeepL ein Babelfisch werden könnte, wie ihn der Science-Fiction-Autor Douglas Adams im Sinn hatte. Dafür stehen die neuronalen Systeme noch vor zu großen Hürden. Die Maschinen können sich nämlich nur sehr beschränkt in Kulturen hineindenken. Genau das wäre aber nötig, wenn man einen Satz wie "Pana Po'o" übersetzen will. Hawaiianer beschreiben damit, wenn sich jemand den Kopf kratzt, während er etwas Verlegtes sucht, aber nicht findet. Ein Gefühl der Verzweiflung, wie es bei digitalen Programmen entstehen müsste, die den Satz übersetzen sollen. Vorausgesetzt sie hätten Gefühle.

Zur SZ-Startseite

Microsoft
:Diese Frau bringt Computern Witze bei

Deborah Harrison entwickelt Microsofts Assistentin Cortana. Sie soll ihr Persönlichkeit einhauchen und Nutzern die Angst vor künstlicher Intelligenz nehmen.

Lesen Sie mehr zum Thema

Jetzt entdecken

Gutscheine: