Identität im Netz Man erkennt uns, weil wir leben

Wir erleben gerade das Entstehen der digitalen Identifizierung. Sie weiß zwar nicht, wer wir sind, aber alles über das Mosaik unserer Existenz.

Von Bernd Graff

Unsere Vorstellungen von Datensicherheit und unsere Forderungen zum Schutz der Privatsphäre sind an zentraler Stelle von einem Begriff von Identität geprägt, die sich über klassische Merkmale definiert: Name, Geburtsdatum, Wohnort, Signatur und unveränderliche biometrische Kennzeichen wie Narben, Gebiss, Augenfarbe und Fingerabdrücke. Diese Parameter beschreiben den Menschen anhand von Personalien, die in ihrer konkreten Ausprägung nur genau einem Individuum zugeschrieben werden können. Es sind also gewissermaßen Zuschreibungen von außen: Der zu identifizierende Mensch wird - das Passiv steckt schon im Begriff - erkennungsdienstlich behandelt. Er muss nichts tun, kann passiv bleiben bei seiner Identifizierung. Im tragischen Fall als Toter für ein gerichtsmedizinisches Gutachten.

Wahrung der Privatsphäre heißt dementsprechend, dass diese Personendaten nicht in falsche Hände geraten dürfen, damit keine Bankkonten mit okkupierter Autorität geplündert oder Grenzen mit angenommenen Identitäten überschritten werden. Dieser statische Identitätsbegriff entstammt der Hemisphäre des Analogen, des Sichtbaren und Mechanischen: der Politik und Polizei, der Armee und Arbeitswelt und der Medizin. Er wird nicht verschwinden, denn krank werden die Leute ja auch weiterhin werden, und sterben tun sie sowieso.

Wir erleben jedoch gerade das Entstehen einer neuen Form der Identifizierung und damit das Entstehen neuer Identität. Dieser Identifizierung ist die alte statische Identität der Merkmale einer Person herzlich egal. Nicht einmal mehr das. Denn die Instanzen dieser neuen Identifizierung haben kein Herz. Es sind Maschinen: Computer, gefüttert mit gewaltigen Datenbeständen, die von Typisierungsalgorithmen durchkämmt werden. Ihr Wissen, ihre Potentiale und vermutlich auch ihre Macht stecken in Datenbanken, die sie durchforsten. Wir selber sind es, die diese Datenbanken kontinuierlich füllen. Denn wir hinterlassen digitale Spuren: Kommunikationsspuren, Ortsangaben, Konsumnachweise. Je länger wir die Speicher füllen, desto feiner und detaillierter wird das Mosaik unserer Existenz. Diese neue Form der Identifikation also ist dynamisch, prozessual. Man erkennt uns, weil wir leben.

Erste Ergebnisse solcher Typisierung liefert der Internethändler Amazon bereits: "Menschen, die dieses Buch gekauft haben, interessieren sich auch für diese Bücher." Inzwischen ist es in einem Experiment gelungen, allein aufgrund der Twitter-Verbindungen von Mitgliedern des US-Kongresses deren Parteizugehörigkeit nachzuweisen. Dazu wurden die Tweets, die Twitter-Texte, nicht gelesen, und es wurden auch keine Namen offen gelegt. Es wurde einzig analysiert, welche Teilnehmer miteinander und wie oft sie miteinander kommunizierten. Analysiert wurde wie in der Äsop-Fabel, in welcher ein Esel daran erkannt wird, in welcher Gesellschaft er sich befindet. Mat Morrison, der Mann, der diese Twitter-Analyse durchgeführt, hält übrigens die Frage, ob man Parteizugehörigkeit errechnen könne, für beantwortet.

Wissenschaftler des Massachusetts Institute of Technology und der Harvard University untersuchten in einer Studie über 94 Personen, ob man deren Freundschaften und Cliquenbildung besser aus Interviews der Beteiligten oder aus deren Handy-Verbindungsdaten ermitteln könne. Die Forschergruppe fand heraus, dass die Verbindungsdaten aufschlussreicher waren als die Befragungen. Wie Christiane Schulzki-Haddouti in der Fachzeitschrift c't dazu weiter ausführt, entsprachen die für diese Studie in wenigen Wochen mit technischen Mitteln erhobenen und analysierten Daten dem Aufwand von 330.000 Wissenschaftler-Arbeitsstunden - oder einer klassischen Feldforschung von fast 38 Jahren.

Die neuen Techniken der Identifizierung von Menschen verlangen geradezu nach derartig großer Zahl und langer Dauer der Aufzeichnungen. Je mehr Daten von Menschen die Maschinen verarbeiten können (und sie können es immer schneller), je unterschiedlicher diese Datentypen tatsächlich sind und je länger der Zeitraum ist, über den sie erfasst werden, umso feiner wird das Raster zur Erkennung von Stereotypien. Umso genauer können sie Muster im Verhalten der Menschen erkennen und prognostizieren.

Das vor wenigen Jahren noch kaum überbrückbare Problem, das komplexen Massen-Screenings von Populationen entgegenstand, das Problem des Abgleichs unterschiedlicher Datenbanken, wird inzwischen als nur noch gering bewertet. Im erwähnten Artikel der c't sagt Hannah Seiffert, die Justiziarin des Internet-Provider-Verbands eco, "dass man sich für die Verknüpfung und den Zugriff auf die unterschiedlichsten Datenbanken nur (noch) darauf einigen muss, in welchem Datenformat die Ausleitung zu erfolgen hat."

Im Zweifel gegen den Verbraucher

mehr...