Süddeutsche Zeitung

Künstliche Intelligenz:Robo-Journalismus

Vom Wetterbericht bis zur Fußball-Kreisliga: Maschinen verfassen Texte, die keiner schreiben will. Die Leser lieben sie.

Von Bernd Graff

Dieser Text wurde von einer Maschine aufgezeichnet und von anderen Maschinen in einer Druckerei zu Papier gebracht. Aber geschrieben wurde er von einem Menschen. Im Jahr 2018 ist das keine Selbstverständlichkeit, denn Zeitungstexte werden nicht mehr ausschließlich von Menschen verfasst.

Beginnen wir mit Zach Seward, einem Mitgründer des Business-Magazins Quartz, der Ende vergangenen Jahres nach einem Vortrag in Shanghai seine Überraschung auf Twitter kundtat: "Noch bevor ich die Bühne verlassen hatte, war bereits ein gar nicht mal so schlechter Artikel über mich und meinen Vortrag erschienen, den die Künstliche Intelligenz 'Dreamwriter' für die Agentur Tencent verfasst hatte." Die publizistischen Erfolge jenes Dreamwriter, Traumschreibers, haben nicht nur die staatliche chinesische Nachrichtenagentur Xinhua dazu gebracht, auf die Dienste automatisierter Schreibsysteme zurückzugreifen. Überall auf der Welt sind inzwischen voll automatisierte Textgenerierungssysteme im Einsatz.

Denn die Produkte des "Robo-Journalismus" - die Rede ist auch von "Algorithmischem Journalismus" oder "Automatisiertem Journalismus" - ähneln den Texten von menschlichen Journalisten nicht nur. Es sind tatsächlich ernst zu nehmende Texte: frappierend sachkundig, mit Hintergrundwissen und präzisem Satzbau, detaillierter Terminologie und abwechslungsreichen Formulierungen.

Themen sind: Sport, Finanzdaten, Unternehmensberichte und sehr viel Wetter

Dies alles basiert auf den bahnbrechenden Erfolgen in der Entwicklung von K.I.-Systemen in den letzten zwei, drei Jahren. Seit die L. A. Times im Jahr 2014 erstmals einen Text über ein Erdbeben publizierte, der vollständig aus der Retorte stammte, ist im dortigen Newsroom ein System im Einsatz, das mit den Netzwerken des "US Geological Service" verdrahtet ist und seitdem automatisiert (und verzögerungsfrei) in ganzen Sätzen über die Bewegungen der Erdplatten am Marianengraben informiert. Dummerweise erfolgte im Januar dann allerdings eine vermeintliche USGS-Alarmmeldung, die in Wahrheit eine seismische Bewegung des Jahres 1925 beschrieb. Ein USGS-Mitarbeiter hatte die historischen mit den aktuellen Datensätze vertauscht. Die größten Probleme auch in der K.I. bereitet eben die "Wet Ware", das menschliche Gehirn, das die Apparate bedient.

Trotz dieses Patzers scheint die schreibende Blechzunft an Boden zu gewinnen. Der Publizist Alexander Fanta hat im vergangenen Jahr für das "Reuters Institute" der Universität Oxford die Studie "Automatisierter Journalismus in Europäischen Nachrichtenagenturen" herausgebracht. Schon jetzt werden in europäischen News-Diensten täglich Tausende Storys ohne jeden menschlichen Beitrag und jede menschliche Kontrolle produziert und veröffentlicht. Themen sind Sport, Finanzdaten, Vierteljahresberichte von Unternehmen und sehr viel Wetter, also genau jene Bereiche, die über messbare und strukturiert erfasste Datensätze verfügen. Als Gründe für diesen dann doch massiven Einsatz werden genannt: Tiefe wie Breite der Information und Schnelligkeit in der Berichterstattung.

Und die Leser merken bei diesen Themen offenbar keinen Unterschied, so zeigt Fantas Studie aus Oxford, im Gegenteil, sie lieben die fundierten, vermeintlich supersoliden Berichte. So werden die "Natural Language Generationssysteme" genannten Supersmartschreiber von der niederländischen Agentur ANP nun sogar dazu eingesetzt, Texte menschlicher Kollegen zu redigieren, um sie sachkundiger, verständlicher, sprich: besser zu machen.

Auch in Deutschland sinnieren viele in der Branche, wie man Computer bei der redaktionellen Arbeit zu mehr als nur zur Rechtschreibprüfung einsetzen kann. Das Stuttgarter Start-up "AX Semantics" und das Meckenheimer Unternehmen "text-on" etwa versuchen, sich mit ihren Produkten, die aus gut aufbereiteten Daten automatisiert Texte erstellen, einen Namen zu machen. Das in Berlin ansässige Unternehmen "Retresco" spielt schon in der ersten Liga, es will gerade ganz Europa mit Texten versorgen, die aus der Feder williger, unermüdlicher und bestens informierter Roboter stammen.

Intellektualität, Kreativität, und Assoziation sind für Computer unerreichbar

Gute Automatentexte entstehen in einer klug orchestrierten Mischung aus profunder semantischer Programmierung, strukturierten Daten, starken Algorithmen und Schnittstellen zu weiteren Datenwelten, die je nach Bedarf zu immer neuen Texttänzen aufgefordert werden können. Seit zwei Jahren, so sagt Sebastian Golly, der Retresco-Leiter der Abteilung "Textgenerierung", sei der Bedarf "riesig". Angebote der Firma werden von Unternehmen, Agenturen, Onlinemedien und Verkaufsportalen abgefragt. Automatentexte können inzwischen abonniert werden wie eine Nachrichtenagentur. Journalismus wird zu einer Frage avancierter Software.

Die "Retresco Text-Engine" verfasst binnen Sekunden Spielberichte zu allen 30 000 Begegnungen in allen Fußball-Ligen, die sämtliche Vereine des Deutschen Fußballbundes jedes Wochenende austragen. Auch Texte zur Beschreibung von Objekten in Immobilien-Anzeigen, Produktbeschreibungen technischer Geräte, Gebrauchsanweisungen und - wir sind in Deutschland - Wettervorhersagen. Und dies alles nicht in Maschinensprache, sondern in natürlichem, verständlichen Deutsch. Und da zu ihrem Datenfundus, etwa zu Fußballspielen, auch Daten aus der (Spieler- und Vereins-) Geschichte gehören, vermögen die Automatenschreiber auch dieses historische Wissen in ihre Berichte "klug" einzupflegen: Hat ein Fußballer nicht nur in einem Spiel getroffen, sondern auch in denen zuvor, dann wird der Roboterreporter formulieren, dass dieser Spieler "gerade einen Lauf hat". Wissen bleibt Sprachmacht, wenn es sich auf gut gepflegte Datensätze stützen kann.

Damit ist es Zeit, um die Techno-Euphorie ein wenig zu bremsen: Es bleiben positivistische, klar definierte Ereignisfelder, die Roboter sprachlich bearbeiten können. Sprachliche Kreativität, Assoziation, Intellektualität sind für Computer nach wie vor unerreichbar. Die Aufgabenareale für die Automaten sind stark begrenzt. Das macht ihre journalistische Breite trotz des prinzipiell unendlichen Wissens- und Wortschatzes überschaubar. Die unermüdlichen Strom-Texter erstellen nun die Kolumnen, die noch nie jemand schreiben wollte: Detaillierte Vorberichte zu allen Spielen der untersten Amateurligen etwa.

Ein Zitat aus dem PR-Material belegt denn auch den ganzen Stolz der Firmen: "Die hohe natürlichsprachige Qualität der Texte aus der Textengine macht das prüfende Auge des Redakteurs entbehrlich." Und darum, wegen dieser kalten Perfektion, bauen wir hier im Feuilleton ab und zu klitzekleine Fehlerchen in unsere rauschhaften Fließtexte ein. So merken Sie, dass wir immer noch da sind.

Bestens informiert mit SZ Plus – 4 Wochen kostenlos zur Probe lesen. Jetzt bestellen unter: www.sz.de/szplus-testen

URL:
www.sz.de/1.3921660
Copyright:
Süddeutsche Zeitung Digitale Medien GmbH / Süddeutsche Zeitung GmbH
Quelle:
SZ vom 27.03.2018/doer
Jegliche Veröffentlichung und nicht-private Nutzung exklusiv über Süddeutsche Zeitung Content. Bitte senden Sie Ihre Nutzungsanfrage an syndication@sueddeutsche.de.