Süddeutsche Zeitung

Wissenschaftszirkus:"Offensichtlicher Nonsens"

Ihr Forschungsbericht strotzt vor Fachbegriffen, ist aber ohne Sinn: Wie es drei US-Studenten geschafft haben, mit einem automatisch erstellten Text zu einer Konferenz eingeladen zu werden.

Von Jürgen Schmieder

Anselm von Canterbury hat es schon im 11. Jahrhundert gewusst. "Hinter diesen Mauern verbirgt sich die größte Ansammlung von Irrtümern", urteilte der Theologe und Philosoph über Bibliotheken. Wie Recht er mit seiner Behauptung hatte, führten in der vergangenen Woche drei Studenten des Massachusetts Institute of Technology (MIT) vor. Mit einem vollkommen sinnfreien Paper wurden sie zugelassen zur 9th World Multi-Conference on Systemics, Cybernetics and Informations (WMSCI).

Konferenzen haben vor allem für Studenten der Computer-Wissenschaften eine besondere Bedeutung. "Während in Fächern wie Biologie Ergebnisse in Fachzeitschriften publiziert werden, bleibt in den 'computer sciences' aufgrund der Schnelllebigkeit die Konferenz als Mittel der Veröffentlichung", sagt Kilian Weinberger, Promotionskandidat in "machine learning" an der University of Pennsylvania. Die Referate und Forschungsberichte werden in einem Buch zusammengefasst und gelten als Publikation.

Angesehene Konferenzen akzeptieren nur etwa 20 Prozent der Einsendungen. Weniger bekannte Veranstalter verschicken eine Unmenge Einladungen in der Hoffnung, dass sich talentierte Forscher dafür interessieren. Was schwer ist, denn sie stehen in dem Ruf nicht die weltbesten Experten zur Kontrolle der Texte einzuladen oder gar Forschungsberichte ungesehen zuzulassen.

Jeremy Stribling, Max Krohn und Dan Aguayo, graduate students am MIT wollten testen, ob auch ein schlecht recherchiertes und fehlerhaftes Paper die Chance hat, in einem Buch veröffentlicht zu werden. Sie entwickelten "SCIgen", ein Programm, das automatisch Texte erstellt.

Es basiert auf der Probabilistic Context Free Grammar-Methode. Dies bedeutet nichts anderes, als dass die vom Computer erstellten Texte grammatikalisch einwandfrei sind, der Inhalt jedoch zufällig gewählt wird. Der Benutzer kann bei jedem einzelnen Satz aus verschiedenen Optionen wählen. Soll es sich um eine Frage oder einen Aussagesatz handeln? Soll der Satz etwas vorstellen, erklären oder gar zusammenfassen? Das Programm stellt aus den vorgegebenen Baublöcken einen Satz zusammen. Ist dieser fertig, können noch einzelne Wörter eingefügt werden.

Wählt der Benutzer für den Anfang seines Textes einen Aussagesatz, der etwas vorstellen soll, generiert das Programm das Fragment: "Die Autoren möchten in dieser Arbeit beweisen, dass die Leistung von (x) durch ein neuartiges Prinzip gesteigert wird." Nun fehlt nur noch die Information, wessen Leistung denn gesteigert werden soll: des Prozessors, des Bildschirms, des neuen Betriebssystems? Dabei wählt das Programm ein Wort aus einem vorher erstellten Wörter-Pool und setzt es grammatikalisch korrekt in das Fragment ein. Es entsteht ein Satz, der jeglichen Sinns entbehrt. Sogar Grafiken und Statistiken fügt das Programm zufällig in den Forschungsbericht ein.

Stribling, Krohn und Aguayo haben auf diese Weise eine Arbeit geschrieben mit dem Titel "Rooter: A Methodology for the Typical Unification of Access Points and Redundancy".

In ihren Bericht hat das Programm zahlreiche Fachbegriffe aus der Computer-Wissenschaft eingefügt, ohne dass sie einen Sinn im Kontext ergeben würden. Prozessorforschung wird vermischt mit Fragen zu künstlicher Intelligenz, das Ergebnis wird garniert mit einem Kommentar aus der Sparte Hardware. Ein Laie, der nicht mit den Themen der Informatik vertraut ist, könnte die Arbeit der drei Studenten durchaus als ernst gemeinte Forschung ansehen. Beim Überfliegen ist es anscheinende tatsächlich möglich, den Irrtum zu übersehen. "Das Paper ist wirklich gut gemacht", sagt Weinberger. "Aber jemand, der sich ein bisschen auskennt, sollte erkennen, dass es sich um offensichtlichen Nonsens handelt."

Den Organisatoren fiel anscheinend nichts auf und sie luden die drei Forscher zu der Konferenz ein, die von 10. bis 13. Juli in Orlando/Florida stattfinden wird.

Seitdem amüsiert sich die US-Computerszene über den Fauxpas der Konferenz. Einer der Organisatoren entschuldigte sich beim Fernsehsender CNN für den Fehler: "Eine der Personen, die den Bericht lesen sollten, hat uns nicht geantwortet. Wir hielten es für unfair, ein Paper abzulehnen, nur weil es nicht gelesen wurde", so die lapidare Erklärung.

Dass WMSCI nicht den besten Ruf unter den Konferenzen genießt, zeigt auch die Publikations-Liste von David Mazières und Eddie Kohler, Studenten an der New York University. Sie reagierten vor kurzem auf die wiederholte Aufforderung des WMSCI, ein Paper für die Konferenz einzureichen, auf ihre eigene Art. Sie nahmen in ihre Veröffentlichungen einen Bericht auf, der nur aus einem Satz besteht: "Get me off your fucking mailing list!" - 4813 Mal hintereinander.

Bestens informiert mit SZ Plus – 4 Wochen kostenlos zur Probe lesen. Jetzt bestellen unter: www.sz.de/szplus-testen

URL:
www.sz.de/1.563300
Copyright:
Süddeutsche Zeitung Digitale Medien GmbH / Süddeutsche Zeitung GmbH
Quelle:
sueddeutsche.de
Jegliche Veröffentlichung und nicht-private Nutzung exklusiv über Süddeutsche Zeitung Content. Bitte senden Sie Ihre Nutzungsanfrage an syndication@sueddeutsche.de.