Google Translate Trauen Sie nicht diesem Roboter!

Google kommerzialisiert sein automatisches Übersetzungsprogramm, da sollte es inzwischen ausgereift sein. Könnte man denken. Leider kommt schon auf kürzesten Strecken der totale Quatsch heraus - egal, ob man den alten Römer Livius oder Dagobert Duck übersetzen lässt. Ein Praxistest.

Von Burkhard Müller

Wer im Netz die beiden Textfelder von "Google Translate" aufruft, um eine von 57 Sprachen in Sekundenschnelle in eine andere übersetzen zu lassen, muss nach wie vor nichts bezahlen. Software-Firmen aber, die den Service in eigene Produkte einbauen wollen, werden seit Ende August zur Kasse gebeten.

Vier Chancen hat Google Translate bekommen, in vier Gattungen und aus drei Sprachen. Die Resultate stellen nicht etwa eine maliziöse Blütenlese dar, sondern verdanken sich einem völlig unbedachten Schuss ins Blaue.

(Foto: Screenshot)

Die neue, automatische Maschinenintelligenz als kommerzielles Produkt - da könnte man auf die Idee kommen, die Programmierung im Hintergund, an der Google seit dem Start 2006 mit Hochdruck weiterarbeitet, sei inzwischen ausgereift. Gibt es entscheidende Fortschritte, ist der Durchbruch zur digitalen Weltverständigung nun schon zum Greifen nah?

Google Translate" arbeitet nicht, wie ältere Ansätze, mit Algorithmen, die meist eher schlecht als recht grammatische Regeln zu erkennen und in der Zielsprache Entsprechendes nachzubilden suchten. Heraus kamen meist Gebilde wie "Der Schnaps ist gut, aber das Fleisch ist verdorben", wenn man eingegeben hatte "Der Geist ist willig, aber das Fleisch ist schwach."

"Google Translate" verlässt sich lieber darauf, dass eine Wendung wie die vom schwachen Fleisch bestimmt schon mal irgendwo aufgetaucht ist, vermutlich sogar schon öfters, und behandelt sie darum als Einheit. Es unterlässt Versuche, zu "verstehen", was gesagt wurde, die gerade zu den unverständlichsten Resultaten geführt hatten, und verfährt ausschließlich statistisch.

Englisch als Drehpunkt

Da macht die Maschine es gar nicht so sehr viel anders als die heutigen Simultan-Dolmetscher, deren Geistesgegenwart schon nach drei Wörtern ahnt, worauf der Sprecher hinaus will, weil auf den immer gleichen Konferenzen immer Ähnliches geredet wird.

Diese statistische Methode setzt zweierlei voraus: ein großes Corpus, mindestens eine Million Wörter umfassend, von Texten, die bereits von einer Sprache in die andere übersetzt worden sind, verlässlich, weil von Hand verfertigt; und ein riesiges Corpus, etwa eine Milliarde Wörter stark, von Texten in jeder Sprache für sich.

Google hat dafür z. B. sämtliche je von der UNO produzierten Dokumente als Grundlage benutzt, die ja in jeder der sechs Hauptsprachen vorliegen müssen. Da kommt schon was zusammen. Vom Isländischen ins Urdu ist natürlich noch nicht so viel übertragen worden. Aber auch hier weiß das System sich zu behelfen, indem es die englische Sprache als "pivot" benutzt, als Drehpunkt, der zwischen beiden vermittelt: Erst vom Isländischen ins Englische, dann vom Englischen weiter ins Urdu.

Erhebliche Rechenkapazität

Als hilfreich erweisen sich hier vor allem erfolgreiche Werke, die in sehr viele und auch kleinere Sprachen übersetzt worden sind - vielleicht sind hier die wahren Zauberkräfte von Harry Potter am Werk.

Damit das Ganze in der gebotenen rasenden Geschwindigkeit abgeglichen werden kann, ist ferner natürlich eine erhebliche Rechenkapazität erforderlich. 57 Sprachen (nach anderen Angaben sogar schon 64), das macht 1568 Sprachpaare auf Knopfdruck: von Baskisch in Telugu, von Tagalog in Afrikaans, vom Lateinischen ins Aserbaidschanische und zurück.

Fehler, das gibt auch Google zu, seien natürlich, wie bei einer statistisch fundierten Methode nicht anders denkbar, immer möglich. Aber sie hätten den großen Vorzug, dass sie sich, anders als bei den verkehrt sinnstiftenden Anstrengungen der übersetzenden Handwerker, sofort als Unfug erkennen und rasch ausbessern ließen.

Google und wie es die Welt sah

mehr...