Identität im Netz:Man erkennt uns, weil wir leben

Wir erleben gerade das Entstehen der digitalen Identifizierung. Sie weiß zwar nicht, wer wir sind, aber alles über das Mosaik unserer Existenz.

Bernd Graff

Unsere Vorstellungen von Datensicherheit und unsere Forderungen zum Schutz der Privatsphäre sind an zentraler Stelle von einem Begriff von Identität geprägt, die sich über klassische Merkmale definiert: Name, Geburtsdatum, Wohnort, Signatur und unveränderliche biometrische Kennzeichen wie Narben, Gebiss, Augenfarbe und Fingerabdrücke. Diese Parameter beschreiben den Menschen anhand von Personalien, die in ihrer konkreten Ausprägung nur genau einem Individuum zugeschrieben werden können. Es sind also gewissermaßen Zuschreibungen von außen: Der zu identifizierende Mensch wird - das Passiv steckt schon im Begriff - erkennungsdienstlich behandelt. Er muss nichts tun, kann passiv bleiben bei seiner Identifizierung. Im tragischen Fall als Toter für ein gerichtsmedizinisches Gutachten.

Internet-Cafè, Reuters

Online sein, heißt Privatsphäre preisgeben.

(Foto: Foto: Reuters)

Wahrung der Privatsphäre heißt dementsprechend, dass diese Personendaten nicht in falsche Hände geraten dürfen, damit keine Bankkonten mit okkupierter Autorität geplündert oder Grenzen mit angenommenen Identitäten überschritten werden. Dieser statische Identitätsbegriff entstammt der Hemisphäre des Analogen, des Sichtbaren und Mechanischen: der Politik und Polizei, der Armee und Arbeitswelt und der Medizin. Er wird nicht verschwinden, denn krank werden die Leute ja auch weiterhin werden, und sterben tun sie sowieso.

Wir erleben jedoch gerade das Entstehen einer neuen Form der Identifizierung und damit das Entstehen neuer Identität. Dieser Identifizierung ist die alte statische Identität der Merkmale einer Person herzlich egal. Nicht einmal mehr das. Denn die Instanzen dieser neuen Identifizierung haben kein Herz. Es sind Maschinen: Computer, gefüttert mit gewaltigen Datenbeständen, die von Typisierungsalgorithmen durchkämmt werden. Ihr Wissen, ihre Potentiale und vermutlich auch ihre Macht stecken in Datenbanken, die sie durchforsten. Wir selber sind es, die diese Datenbanken kontinuierlich füllen. Denn wir hinterlassen digitale Spuren: Kommunikationsspuren, Ortsangaben, Konsumnachweise. Je länger wir die Speicher füllen, desto feiner und detaillierter wird das Mosaik unserer Existenz. Diese neue Form der Identifikation also ist dynamisch, prozessual. Man erkennt uns, weil wir leben.

Erste Ergebnisse solcher Typisierung liefert der Internethändler Amazon bereits: "Menschen, die dieses Buch gekauft haben, interessieren sich auch für diese Bücher." Inzwischen ist es in einem Experiment gelungen, allein aufgrund der Twitter-Verbindungen von Mitgliedern des US-Kongresses deren Parteizugehörigkeit nachzuweisen. Dazu wurden die Tweets, die Twitter-Texte, nicht gelesen, und es wurden auch keine Namen offen gelegt. Es wurde einzig analysiert, welche Teilnehmer miteinander und wie oft sie miteinander kommunizierten. Analysiert wurde wie in der Äsop-Fabel, in welcher ein Esel daran erkannt wird, in welcher Gesellschaft er sich befindet. Mat Morrison, der Mann, der diese Twitter-Analyse durchgeführt, hält übrigens die Frage, ob man Parteizugehörigkeit errechnen könne, für beantwortet.

Wissenschaftler des Massachusetts Institute of Technology und der Harvard University untersuchten in einer Studie über 94 Personen, ob man deren Freundschaften und Cliquenbildung besser aus Interviews der Beteiligten oder aus deren Handy-Verbindungsdaten ermitteln könne. Die Forschergruppe fand heraus, dass die Verbindungsdaten aufschlussreicher waren als die Befragungen. Wie Christiane Schulzki-Haddouti in der Fachzeitschrift c't dazu weiter ausführt, entsprachen die für diese Studie in wenigen Wochen mit technischen Mitteln erhobenen und analysierten Daten dem Aufwand von 330.000 Wissenschaftler-Arbeitsstunden - oder einer klassischen Feldforschung von fast 38 Jahren.

Die neuen Techniken der Identifizierung von Menschen verlangen geradezu nach derartig großer Zahl und langer Dauer der Aufzeichnungen. Je mehr Daten von Menschen die Maschinen verarbeiten können (und sie können es immer schneller), je unterschiedlicher diese Datentypen tatsächlich sind und je länger der Zeitraum ist, über den sie erfasst werden, umso feiner wird das Raster zur Erkennung von Stereotypien. Umso genauer können sie Muster im Verhalten der Menschen erkennen und prognostizieren.

Das vor wenigen Jahren noch kaum überbrückbare Problem, das komplexen Massen-Screenings von Populationen entgegenstand, das Problem des Abgleichs unterschiedlicher Datenbanken, wird inzwischen als nur noch gering bewertet. Im erwähnten Artikel der c't sagt Hannah Seiffert, die Justiziarin des Internet-Provider-Verbands eco, "dass man sich für die Verknüpfung und den Zugriff auf die unterschiedlichsten Datenbanken nur (noch) darauf einigen muss, in welchem Datenformat die Ausleitung zu erfolgen hat."

Passgenaue Konsumentenprofile

Letztlich geht es dabei gar nicht mehr um Informationen über einzelne Personen und deren Verhalten. Es geht um Trends, Neigungen, Tendenzen, Wahrscheinlichkeiten, Muster, die sich eben aus den Spuren Vieler ableiten lassen. Menschen mittleren Alters, die zweimal täglich zu kaum variierenden Zeiten dieselben Wegstrecken mit dem Auto zurücklegen, dürften aller Voraussicht nach einer geregelten Arbeit nachgehen. Wenn sich diese Menschen im Internet plötzlich für Wickeltische und Babywindeln interessieren, ist es nicht unwahrscheinlich, ihnen bald Autositze für Kleinkinder verkaufen zu können.

Wenn man will, kann man diese Datenwälzer schon "Bewusstseinsmaschinen" (Jaron Lanier in der SZ vom 23./24. Januar) nennen. Und es stimmt: Sie arbeiten wie Profiler, wie Ermittler, die Schlüsse für künftiges Handeln ziehen aus einer Welt der hinterlassenen Spuren und Indizien. Doch ihre mutmaßliche Intelligenz steckt im Code, der auch nur so schlau ist wie die Programmierer, die ihn geschrieben haben. Was signifikant an uns sein soll, muss man den Maschinen schon sagen, da sie lediglich dumpfe Schürfarbeit leisten.

Doch je mehr Telekommunikationsdaten und Internet-Verkehrsdaten mit den dazu gehörenden Ortsangaben verknüpft werden können und je langfristiger solche Daten erhoben und -vor allem - zusammengeführt werden, umso besser lassen sie sich analysieren und umso auskunftsfreudiger sind sie. Selbst dann, wenn sie anonyme Massen rastern. Darum können die "big player" unter den Datensammlern, Facebook etwa und Google, ohne mit der Wimper zu zucken behaupten, dass sie selbstverständlich die personenbezogenen Daten (unsere alte Identität) für schützenswert erachten, während sie andererseits jede Form menschlicher Verkehrsdaten abgreifen, konsolidieren, interpolieren, speichern, um passgenaue Konsumenten-Profile daraus zu extrahieren.

Wir korrumpieren unsere Privatsphäre beständig selbst

Die kürzeste Definition von Privatsphäre stammt von Samuel D. Warren und Louis D. Brandeis aus dem Jahr 1890. Sie lautet: "Privacy is the right to be let alone." Das Recht, in Ruhe gelassen zu werden. Diese Privatsphäre korrumpieren wir gerade beständig selber, weil wir es sind, die das Datenmaterial liefern, auf das die Maschinen warten. Nein, das muss man nicht per se schlimm finden. Man sollte nur wissen, dass nahezu alle unsere Lebensartikulationen inzwischen von einer Technik registriert werden, die diese nach einprogrammierten Kriterien in ihre Matrix sortiert. Data-Mining ist Human-Mining. Das vermögen wir (und die guten alten Datenschützer) indes noch kaum zu begreifen.

Man könnte also von einer vitalistischen Identifizierung sprechen, die je mehr über den Menschen weiß, je länger sie sein Verhalten in seinem Konsum und in den offenbarten Interessen und Präferenzen aufzeichnet. Doch wird diese neue Identität, herausdestilliert aus der Summe unserer Akte und Verlautbarungen, nicht einmal die letzte bleiben, in der das Informationszeitalter zu sich selber findet.

Anne Wojcicki, die Gattin von Sergey Brin, einem der Google-Gründer, betreibt seit 2006 das kalifornische Internet-Unternehmen 23andMe. Ein sprechender Name: Das Erbgut des Menschen besteht aus 23 Chromosomenpaaren. Die Biotech-Firma bietet ihre Kunden für unter fünfhundert Dollar den Service an, die eigene DNS analysieren und auf mögliche Erbkrankheiten hin untersuchen zu lassen - und damit das genetische Wissen überhaupt zu befördern. Denn 23AndMe will zugleich auch ein Soziales Netzwerk knüpfen, in dem sich die Kundschaft über Befunde und Symptome austauscht. So heißt es auf der Webseite: "Wir glauben, dass die Vorteile, die genetischen Informationen untereinander austauschen zu können, mögliche Fragen zum Schutz der Privatsphäre überwiegen."

Denn auch hier gilt, dass schiere Datenmasse die Möglichkeiten befördert, an präzise Detail-Informationen zu gelangen: Wann bricht eine Krankheit aus, welche Gene müssen zusammenkommen, wie also bringt man Befund und Krankheit zusammen? Nirgends können die notwendigen Informationen zur Klärung dieser Fragen besser hinterlegt sein als in einem Netzwerk, in dem nur diese Fragen diskutiert werden. Zu den weiteren "Kern-Werten" des Unternehmens gehört denn auch: "Wir glauben, dass der Wert Ihrer genetischen Information im Lauf der Zeit immer weiter wachsen wird." Denn "in der vernetzten Informationswelt von heute geht es nicht länger nur um das 'Ich'. Vielmehr geht es darum, das Verständnis von uns selbst dadurch zu verändern, dass wir alle alles zusammen bringen."

Keine Sorge, das tun wir schon. Eines nicht allzu fernen Tages könnte es daher passieren, dass uns ein Vertreter dieser Firma über eine personalisierte Werbung angeht: "Wir wissen zwar nicht, wer Sie sind, aber wir wissen, dass Sie mit sehr hoher Wahrscheinlichkeit an Alzheimer erkranken werden. Andere Patienten mit diesem Befund haben sich in dieser Situation für diese Medikamente interessiert."

Zur SZ-Startseite

Lesen Sie mehr zum Thema

Jetzt entdecken

Gutscheine: