Internet Archive in San Francisco Wo das ganze Netz gespeichert wird

Illustration: Stefan Dimitrov

(Foto: )

Das Internet Archive in San Francisco erfasst alles, was im World Wide Web passiert - inklusive Katzenvideos, peinlichen Partyfotos und Geständnissen von Verbrechern.

Von Jürgen Schmieder

Ist das jetzt ziemlich cool oder so richtig gruselig? Das ist die Frage, die einem bei einem Besuch im Internet Archive sofort in den Sinn kommt. Hier, in diesem neoklassischen Monumentalbau im Norden von San Francisco, das bis 2009 der Fourth Church of Christ, Scientist gehört hat, ist eines der ehrgeizigsten Projekte in der Geschichte der Menschheit beheimatet: Es soll eine wahnwitzige Ansammlung von Wissen entstehen, eine digitale Bibliothek von Alexandria, für jeden zugänglich und jederzeit abrufbar.

In dem Raum, in dem Gottesdienste gefeiert worden sind, stehen nun keine Heiligenfiguren mehr, sondern 100 bauchnabelhohe Keramikfiguren der Mitarbeiter. In den Einbuchtungen gibt es keine Kerzen, sondern riesige Server. Auf der Liedertafel sind keine Psalme vermerkt, sondern die Dezimalen der Kreiszahl Pi. Welch wunderbare Metapher dafür, dass Technologie zur Religion geworden ist.

300 Milliarden Webseiten, zwölf Millionen Bücher, vier Millionen Audiodateien

Im Internet Archive sind derzeit mehr als 30 Petabyte Daten gespeichert, das sind 300 Milliarden Webseiten, zwölf Millionen Bücher, vier Millionen Audiodateien, 3,3 Millionen Videos, 1,5 Millionen Fotos und 170 000 Software-Programme. Die gemeinnützige Organisation will nicht nur das Gedächtnis des Internets sein und möglichst viele Versionen sämtlicher Webseiten weltweit speichern, sondern auch analoge Inhalte wie Bücher, Lieder und Filme digitalisieren und zugänglich machen.

Warum die neofeudale Cybersecurity-Struktur gefährlich ist

Eigentlich sollten Regierungen in einer Demokratie das zerstörerische Wirken von Unternehmen zügeln. Doch Cyberattacken wie "WannaCry" kehren die Verhältnisse um. Von Evgeny Morozov mehr ...

"Millionen Menschen haben Zeit und Mühen hineingesteckt, um das zu teilen, was wir als Internet kennen. Wir wollen eine Bibliothek für diese neue Publikations-Plattform schaffen", sagt Gründer Brewster Kahle, der ein bisschen wie der kauzige Professor aus dem Film "Independence Day" rüberkommt und damit zweifellos ein cooler Typ ist. Er hat vor 25 Jahren eine Suchmaschine entwickelt und an AOL verkauft, sein Online-Dienst Alexa Internet wurde 1999 für 250 Millionen Dollar von Amazon übernommen. Seit 20 Jahren leitet er diese Bibliothek, deren ehrgeiziges Ziel er mit nur fünf Wörtern beschreibt: "Universeller Zugang zu allem Wissen."

Die virtuelle Bibliothek kann jeder unter der Internet-Adresse "archive.org" betreten, das Herzstück ist die Wayback Machine, die eine digitale Zeitreise zurück bis ins Jahr 1996 ermöglicht. Das komplette Internet soll permanent durchforstet, jede einzelne der 300 Milliarden erfassten Webseiten mindestens alle zwei Monate in einer aktuellen Version archiviert werden. Die nach der von Kahle entwickelten Internet-Rangliste Alexa wichtigen Homepages werden mehrmals täglich erfasst. Was der Besucher findet: die Homepage der New York Times am Abend der Terrorabschläge vom 11. September 2001 etwa, aber auch die witzige Webseite des Fußballkollegen aus der Saison 2001/2002, die der längst gelöscht hat. Es ist ein bisschen, als würde man im Keller eine alte Schallplatte der Lieblingsband finden. Und dann noch eine, und noch eine.

100 Angestellte, 1000 freiwillige Helfer

Apropos Schallplatte, in diesem Archiv ist auch zu finden: ein Livekonzert der Rockband Grateful Dead 1971 im Hollywood Palladium. Ein Video, das die Apollo-11-Astronauten vom Sonnenaufgang über der Erde gedreht haben. Eine Folge des Radiokrimis "The New Adventures of Nero Wolfe" aus dem Jahr 1950. Das Drehbuch von "Casablanca". Ein Foto von Marilyn Monroe. Computerspiele wie den Apple-II-Klassiker "The Oregon Trail", die C-64-Simulation "Winter Games" und das bei Achtzigerjahre-Teenagern überaus beliebte Amiga-Kartenspiel "Strip Poker 2 Plus" - direkt im Browser spielbar.

Wer das nicht ziemlich cool findet, der ist entweder nach dem Jahr 2000 zur Welt gekommen oder hat den Großteil seines Lebens in einer Holzkiste verbracht. Es kann schon mal passieren, dass man drei Tage lang nichts anderes tut, als sich durch die gesammelten Schätze dieser Bibliothek zu klicken und dies damit zu entschuldigen, dass es der Recherche diene und dass jeden Tag mehr als 500 000 Menschen das Gleiche tun. Die digitale Bibliothek gehört zu den 300 meist besuchten Homepages der Welt, 100 Angestellte und mehr als 1000 freiwillige Helfer weltweit verwalten die gespeicherten Daten oder sammeln permanent neue. Gerade aktuell hinzugekommen: Hillbilly-Musik aus den 1970er -Jahren.

Natürlich fragen nun viele Menschen, was das eigentlich soll, dieses Internet Archive? Wen bitteschön interessiert heutzutage die Homepage von gestern? Muss denn wirklich jedes verdammte Katzenvideo gespeichert werden? Wird das soziale Netzwerk Snap nicht auch deshalb an der Börse mit mehr als 24 Milliarden Dollar bewertet, weil Inhalte nicht gespeichert werden?

Das Archiv kämpft auch dagegen, Google die Deutungshoheit zu überlassen

Gründer Kahle lächelt, als er diese Fragen hört. Er sieht sich selbst als Nachfolger des Pharaos Ptolemaios III., der einst die von seinem Großvater erbaute Bibliothek von Alexandria mit möglichst vielen Schriftrollen füllen wollte - das konnten Werke von Sophokles und Euripides sein, aber auch von Schiffen konfiszierte Rechnungen und Reiseberichte. "Wir wissen nicht, was mal wichtig sein wird, wenn die Menschen in Zukunft die Gegenwart beurteilen werden. Ein Amateurfilm oder ein Schnappschuss kann einem genauso viel erzählen wie ein Roman. Wir wollen alles, das ganze verdammte Ding", sagt Kahle und deutet auf die Server: "Wann immer ein Licht blinkt, dann wird was herunter- oder hochgeladen." Und es blinkt wie bei einem Meteoritenschauer.

Kahle geht hinunter in die Bürohalle, wo solch herrliche Artefakte wie ein Game Boy der ersten Generation oder eine Originalausgabe des Videospielklassikers "Duke Nuke'em" herumliegen. Die Mitarbeiter feiern gerade eine neue Lösung für Macintosh-Software oder sprechen darüber, dass ein Kollege in Hongkong asiatische TV-Sendungen digitalisieren wird.

Historiker und Kriminalisten interessieren sich für das Archiv

Das Archiv kämpft gegen das Vergessen an und dagegen, die Deutungshoheit der Gegenwart den Google-Algorithmen zu überlassen. Es soll das komplette Netz abbilden, ungefiltert und unverzerrt. Wie am 17. Juli 2014, als der Separatistenführer Igor Girkin auf der russischen Social-Media-Plattform VKontakte schrieb: "Wir haben gerade ein Flugzeug runtergeholt, eine AN-26. Wir haben davor gewarnt, in unseren Luftraum zu fliegen. Der Vogel ist auf einen Müllhaufen gefallen, wir haben Videobeweise." Girkin löschte den Eintrag, als bekannt wurde, dass es sich nicht um eine Militärmaschine, sondern um ein Passagierflugzeug von Malaysian Airlines gehandelt hatte. Der Eintrag wäre für immer verloren gewesen, hätte das Internet Archive nicht einen Screenshot gemacht.

Die Bibliothek ist aber nicht nur für Historiker interessant, sondern bisweilen auch für Kriminalisten, die Bundesbehörde FBI etwa hat bereits mehrere Anfragen gestellt. Dabei wird einem aber auch klar: Es gibt einen Konflikt zwischen dem Recht auf Information und dem Recht auf Vergessenwerden. Wer im Internet Archive stöbert, der findet eben auch Fotos von wilden Uni-Partys, die kein Arbeitgeber je sehen sollte und von denen man glaubte, dass sie längst gelöscht und damit unauffindbar seien. Oder die Hochzeits-Homepage eines befreundeten Paares, das seit Jahren geschieden ist und gemeint hatte, sämtliche Erinnerungen an die gemeinsame Zeit getilgt zu haben. Oder auch ein paar Einträge in Gästebücher, deren dazugehörige Webseiten seit Jahren nicht mehr existieren.

Das Internet, wie es wirklich ist

"Wir bekommen jeden Tag mehrere Mails mit der Bitte, etwas zu löschen. Dem kommen wir natürlich nach", sagt Kahle. Nur: Wer nicht weiß, was alles in der Bibliothek gespeichert ist, der kann sich auch nicht beschweren. Und wer hat schon die Zeit zu überprüfen, was die digitale Bibliothek alles über einen gesammelt hat? Daten sind eine mächtige Währung heutzutage. Das streitet Kahle nicht ab, doch genau deshalb sieht er das Internet Archive als gewaltige Bibliothek, deren Inhalte nicht einigen milliardenschweren Firmen überlassen werden dürfen, sondern der Allgemeinheit.

Er hält das Internet Archive, das wird bei diesem Besuch deutlich, nicht nur für eine ziemlich tolle Einrichtung - es wäre für ihn richtig gruselig, gäbe es sie nicht. Diese gemeinnützige Organisation, finanziert über Spenden und mit einem Budget von ein bisschen mehr als zehn Millionen Dollar pro Jahr, bildet das Internet so ab, wie es wirklich war, wie es wirklich ist, wie es wirklich sein wird. Jammern wir nicht dauernd darüber, dass die Internet-Platzhirsche Alphabet, Amazon, Apple, Facebook and Microsoft ein Oligopol auf Daten errichten? Ist es da nicht wunderbar, dass es eine digitale Bibliothek gibt, deren Ziel es nicht ist, möglichst viel Geld zu verdienen - sondern die einfach nur möglichst viel Wissen sammeln möchte?

Viele finden es deshalb cool, was da in dieser ehemaligen Kirche in San Francisco passiert. Neben Geld, das Problem wohl jeder Bibliothek der Welt, treibt Kahle nur eine Sorge um: "Fast jede Bibliothek der Geschichte wurde von Regierungen zerstört. Das ist keine politische Aussage, sondern eine Tatsache. Hätten die Leute in Alexandria damals Kopien erstellt, bevor die Bibliothek zerstört wurde, könnten wir heute vielleicht alle Schriften von Aristoteles lesen." Das Internet Archive hat deshalb jede einzelne Datei vervielfältigt und über die Welt verteilt. Es gibt Versionen des Archivs im kalifornischen Richmond, in Amsterdam und bald auch in Kanada. Es gibt auch eine Kopie der Daten, ja wirklich, in der neuen Bibliothek von Alexandria.

Was Facebook mit Ihren Whatsapp-Daten vorhat

Ein gebrochenes Versprechen und nun eine Millionenstrafe: Die Handynummern der Whatsapp-Nutzer wurden zu Facebooks Sündenfall. Von Marvin Strathmann mehr...