Süddeutsche Zeitung

Japanische Literaturgeschichte:Zerbrochene Zeichen

Die japanische Schrift war lange Zeit ein Wildwuchs - den heute kaum mehr einer entziffern kann. Nun soll künstliche Intelligenz das literarische Erbe wieder lesbar machen.

Von Christoph Neidhart

Jimbocho ist ein kleinteiliges Viertel zwischen Bürotürmen und Stadtautobahn, das auch "Hon-no-machi" genannt wird, "Bücherstadt". Nirgendwo auf der Welt gibt es auf so engem Raum so viele Buchläden wie hier, zumeist Antiquariate. Sie haben mehr als zehn Millionen alte Titel auf Lager. Tokio war seit dem 17. Jahrhundert eine Metropole des Buches.

Von dem literarischen Erbe, das in diesen Läden und den Archiven liegt, sind 99 Prozent der Japaner heute abgeschnitten. Sie kaufen zwar alte Bücher, können sie aber nicht lesen. Die Texte sind in Kuzushiji verfasst und gedruckt, einer Schrift, die das Erziehungsministerium im Jahr 1900 abschaffte. Sie entstand beim schwungvollen Schreiben mit dem Pinsel, als Kurrent oder "Laufschrift", wie man im Deutschen früher sagte. Kuzushiji bedeutet übersetzt "zusammengebrochene Zeichen". Etwa 3,5 Millionen Bücher und Dokumente in Kuzushiji wurden nie ins moderne Japanisch übertragen. Selbst die meisten Historiker können diese Texte nicht oder nur schwer lesen. Sie zu entziffern und zu transkribieren würde mehr als ein Jahrhundert dauern, wenn sich die wenigen verbliebenen Kuzushiji-Experten zusammentun, hat die aus Thailand stammende Literaturwissenschaftlerin Tarin Clanuwat errechnet.

Irgendwann habe sie eine Idee gehabt, sagt sie. "Wie viel schneller ginge das, wenn der Computer die Texte umschreiben würde?"

Das aus China importierte Schriftsystem eignet sich eigentlich gar nicht für das Japanische

Clanuwat hat seit ihrer Jugend auch programmiert und wollte es mit "künstlicher Intelligenz" versuchen - der Computer sollte sich das Kuzushiji-Lesen selbst beibringen. Zusammen mit einem Team erarbeitete sie an Japans nationalem Institut für Informatik einen Algorithmus: "KuroNet". In einfacheren Texten erkannte das Programm schon in frühen Versionen rund 90 Prozent der Zeichen richtig. Ein solider Wert, denn einem Computer Kuzushiji beizubringen, galt bis vor Kurzem noch als unmöglich. Künstliche Intelligenzen suchen nach Mustern und Regelmäßigkeiten. Die Kuzushiji-Schreibenden reduzierten ihre Zeichen aber individuell, jeder anders. Außerdem kommen in Texten Hunderte oder Tausende verschiedener Zeichen vor.

Das Problem wurzelt darin, dass sich das aus China importierte Schriftsystem eigentlich gar nicht für das Japanische eignet. In den ersten Jahrhunderten, nachdem Japan die chinesischen Zeichen übernahm, spielte das keine Rolle. Die wenigen Menschen, die schrieben, taten das auf Chinesisch. Es war sozusagen Japans Schriftsprache. Schwieriger wurde es, als die Japaner im 8. Jahrhundert begannen, mit der chinesischen Schrift Japanisch zu schreiben.

Die Wörter des chinesischen Grundwortschatzes bestehen aus einer einzigen Silbe, das Chinesische konjugiert und dekliniert nicht. Daher lässt es sich gut mit ideografischen Zeichen schreiben - grafischen Symbolen, die für einen Gegenstand oder ein Konzept stehen. Japanische Wörter hingegen sind meist mehrsilbig, das Japanische konjugiert nicht nur Verben, es setzt sogar Adjektive in die Vergangenheit. Dafür benötigt seine Schrift grammatische Elemente. Das chinesische Schreibsystem bietet dafür keine Lösung.

Also begannen die Japaner, manche chinesische Zeichen auf einen phonetischen Wert zu reduzieren. Zugleich vereinfachten sie diese Zeichen radikal. So entstanden die japanischen Silbenalphabete, die allerdings bis 1900 nie standardisiert wurden. Jeder schrieb seine Silbenzeichen, wie er wollte. Manche Schreibweisen setzten sich durch, andere verschwanden wieder. Die in Kuzushiji verfassten Dokumente zeugen von diesem Wildwuchs.

In Kanji, den von China übernommenen Schriftzeichen, schrieben jahrhundertelang nur die Männer, um ihre klassische Bildung und ihre Überlegenheit zu demonstrieren. Die Frauen seien ungebildet, hieß es, sie verwendeten die auf phonetische Silben reduzierten, in der schwungvollen Handschrift "zusammengebrochenen" Zeichen, weil sie keine Kanji gelernt hätten. Was in einigen Fällen gar nicht stimmte. Aber die Kanji waren den Männern vorbehalten.

"Im 14. Jahrhundert definierte ein Hofdichter drei Kategorien", sagte Clanuwat: "Korrekt geschriebene Kanji verglich er mit einer stehenden Person, lockerer geschriebene mit einer gehenden Person. Von den Kuzushiji-Kanji sagte er, sie würden rennen."

Die KI-Programmierer können kein Japanisch, übersetzen aber alte japanische Texte

KuroNet ist inzwischen online frei zugänglich, allerdings nur auf Japanisch. Pro Schriftzeichen braucht das System etwa zwei Sekunden. Um es zu verbessern, schrieb Clanuwats Institut vor drei Jahren einen Wettbewerb für selbstlernende Kuzushiji-Leseprogramme auf Kaggle aus, einer Plattform, auf der Unternehmen und Institute Software-Probleme publizieren. Zu gewinnen gab es Geldpreise in Höhe von insgesamt 15 000 Dollar. 293 Teams nahmen teil.

Den zweiten Preis belegte damals Konstantin Lopuhin aus Moskau, ein auf Deep Learning spezialisierter Software-Entwickler. Er hatte zuvor mit künstlicher Intelligenz Satellitenbilder ausgewertet und Seelöwen kategorisiert. Im Skype-Interview spricht Lopuhin nicht von Kanjis oder Schriftzeichen, sondern von "Objekten" und "Klassen". Ist es ein Unterschied, wenn der Computer Schriftzeichen statt Seelöwen erkennen muss? "Schon", sagt Lopuhin, "bei den Seelöwen gab es fünf Klassen, bei den Satellitenbildern etwa zwanzig. Bei den Kuzushiji dagegen mehr als 4000. Außerdem kann ich kein Japanisch, ich konnte selbst offensichtliche Fehler nicht erkennen."

Lopuhin weiß bis heute nicht, was in den Texten steht, die sein Programm entziffert hat. Ein Drittel der 45 für den Wettbewerb zu entschlüsselnden Texte waren Kochbücher, dazu kam ein Buch aus dem Jahr 1639 über das Christentum, eines über die Seidenraupenzucht und viel Literatur. Darunter auch eine Abschrift des ersten Kapitels des "Genji", das als japanisches Buch der Bücher und als erster Roman der Literaturgeschichte gilt. Die Hofdame Murasaki Shikibu schrieb die Geschichte über die Liebesabenteuer eines Prinzen im ersten Jahrzehnt des vergangenen Jahrtausends - zu einer Zeit, in der sich die Menschen trafen, um sich ihre Gedichte von Kirschblüten, Herbstblättern, vom Nebel und vom Mond vorzulesen, von der Liebe und ihrer Vergänglichkeit. Sie tranken Reiswein und hatten Affären. Die Liebe war frei, jedenfalls für die Männer. Die Frauen immerhin hatten ihre selbst erschaffenen Zeichendickichte. Sie schrieben Kuzushiji - schwungvoll, "rennend".

Kann man mit der Entdeckung unbekannter Meisterwerke rechnen, wenn die Computer massenweise Kuzushiji-Texte transkribieren? "Das glaube ich nicht", sagt Clanuwat. "Aber man wird Erläuterungen alter Begriffe finden, die wir bisher nicht genau verstehen. Kleine Puzzle-Teile, mit denen dann plötzlich alles Sinn macht."

Bestens informiert mit SZ Plus – 4 Wochen kostenlos zur Probe lesen. Jetzt bestellen unter: www.sz.de/szplus-testen

URL:
www.sz.de/1.5684244
Copyright:
Süddeutsche Zeitung Digitale Medien GmbH / Süddeutsche Zeitung GmbH
Quelle:
SZ/phbo
Jegliche Veröffentlichung und nicht-private Nutzung exklusiv über Süddeutsche Zeitung Content. Bitte senden Sie Ihre Nutzungsanfrage an syndication@sueddeutsche.de.