Internet Jäger des virtuellen Schatzes

Die Deutsche Nationalbibliothek soll alle deutschsprachigen Internetseiten archivieren - ein ehrgeiziges Projekt mit enormen Problemen.

Von Jürgen Schmieder

Sisyphos bekam von den Göttern eine Strafe auferlegt: Jeden Tag musste er einen Felsbrocken einen steilen Hang hinaufrollen. Bevor er den Gipfel erreichte, rutschte ihm der Stein aus den Händen, und er musste von vorne beginnen. Seine Aufgabe sollte trotz aller Mühen niemals erledigt sein. Das Gesetz zur Deutschen Nationalbibliothek vom 22. Juni 2006 hört sich an, als wäre es direkt der griechischen Mythologie entsprungen.

Dort steht, dass vom 29. Juni an auch Internet-Publikationen gespeichert werden. Jede einzelne deutsche Webseite. Auch Homepages von Privatleuten. Ein ehrgeiziges Projekt, das 2005 von Christina Weiss, zu dieser Zeit noch Beauftragte der Bundesregierung für Kultur und Medien, ins Kabinett eingebracht wurde. Der Vorschlag geht zurück auf die Generalkonferenz der Unesco im Jahr 2001, die eine Resolution zur Bewahrung des digitalen Erbes annahm. Seitdem wird gesammelt. Großbritannien versucht bereits seit drei Jahren, nicht gedruckte Veröffentlichungen zu archivieren.

Übermotiviert oder verrückt?

Es hat jedoch den Anschein, dass der Gesetzgeber bei der Formulierung des Textes ein wenig übermotiviert gehandelt hat. Denn: Das Internet ist groß. Sehr groß. Am 27. Juni überstieg die Anzahl der Webseiten, die auf -.de enden, zum ersten Mal die Zehn-Millionen-Marke. Würde man jede Seite nur einmal aufrufen und sie sich eine Minute lang ansehen - man wäre 19 Jahre lang beschäftigt. Dann ginge es wieder von vorne los. Wer also versucht, sämtliche Netzinhalte zu archivieren, muss verrückt sein. Und über einen riesigen Speicher verfügen.

Es ist eine unglaubliche Datenmenge, die da auf die Nationalbibliothek zukommt. Bisher sind an den drei Standorten der Bibliothek 22,2 Millionen Einheiten gesammelt - alle deutschen, deutschsprachigen und aus dem Deutschen übersetzten Publikationen seit 1913, dazu noch alle Veröffentlichungen über Deutschland. Es ist nicht möglich, auch nur grob zu schätzen, wie viele Internetseiten zusätzlich zu den zehn Millionen Seiten, die auf -.de enden, in deutscher Sprache veröffentlicht sind oder sich mit Deutschland beschäftigen.

Die Nationalbibliothek hat bereits angekündigt, die Suche in drei Schritten anzugehen. Zuerst sollen alle Publikationen gesammelt werden, die eine Entsprechung im Printbereich haben - Monografien, Dissertationen, Online-Ableger von Zeitungen etwa. Dann folgen webspezifische Veröffentlichungen wie Forenbeiträge und Weblogs. Im dritten Stadium soll dann das gesamte deutsche Netz archiviert werden. Inklusive jener Homepages, die nicht unbedingt für die Öffentlichkeit bestimmt sind.