Komm auf den Plapperberg

Man fragt sich natürlich, was das soll und ob das eine kluge Idee ist. Die US-amerikanische Library of Congress (LOC) hat im April 2010 ein Abkommen mit dem Mikroblogging-Dienst Twitter abgeschlossen, welches vorsieht, dass alle (!) dort öffentlich abgesetzten Kurznachrichten, die Tweets, vom ersten Tag der Unternehmensgründung Twitters bis zum Tag des Vertragsabschlusses in die Kongressbibliothek überführt werden. Beauftragt wurde damit die Firma Gnip mit Sitz in Colorado, die in zwei großen Chargen lieferte: Die erste umfasste etwa 21 Milliarden Gezwitscher-Einträge, eine Datei in der Größe von 2,3 Terabytes. Die zweite, größere, wurde Ende 2012 übermittelt. Sie enthielt mehr als 150 Milliarden weitere Einträge. Insgesamt verfügt die Bibliothek nun über 133,2 Terabytes Weltbefindlichkeit, über vier Jahre im Sekundentakt abgesetzt und jede maximal 140 Zeichen lang.

Jede dieser Nachrichten enthält aber nicht nur den Text, sondern auch mehr als 50 weitere Einträge und Angaben, die Meta-Daten, etwa über die Orte, an denen sie verfasst wurden und natürlich die persönlichen Angaben der Sender. Inzwischen laufen alle drei Tage eine Milliarde neuer Posts über Twitter ein. Und auch derer will die Bibliothek habhaft werden. Man hat den Vertrag mit Twitter gerade verlängert.

"Methode der Wahl für Kommunikation"

Wozu? Man wolle, so die LOC, "mit den Twitter-Daten künftigen Forschergenerationen ermöglichen, sich ein gründlicheres Bild von heutigen Kommunikationsformen und Normen, von Dialogen und Trends, von neuen Formen der Erziehung und Autorschaft - und vielem anderen mehr" zu machen. Social Media seien "zur Methode der Wahl für Kommunikation geworden", sie ersetzen "Briefe, Magazine, Serien-Publikationen und all das, was Bibliotheken früher archiviert haben."

Fein. Nur: Noch weiß niemand genau, wie man der Datenmassen technologisch Herr werden soll, um sinnvoll damit arbeiten zu können. Fach-Kommentatoren führen ins Feld, dass eine Anfrage an den konservierten Plapperberg jetzt noch bis zu 24 Stunden benötige, um irgendetwas ausspucken zu können, das dann aber auch kaum mehr ist als "irgendwas".

Und der Datenschutz, eben das "viele Andere mehr"? Der Sprecher der LOC, Robert Dizard Jr., antwortete der Washington Post: "Man kann sagen, dass jemand, der twittert, auch publiziert. Wir hatten zwar noch nie eine Kollektions-Übernahme, die auf diesem 'Click-Through-Agreement' basiert, aber das ist auch schon der einzige Unterschied." Noch kann der Mann so reden, denn noch weiß niemand, was alles in den Daten steckt.