Was Facebook, Google und Co. alles sammeln Deine Spuren im Netz

Profile bei Online-Netzwerken lassen viele Rückschlüsse zu.

(Foto: dpa)

Selber schuld, wer auf Facebook alles über sich verrät. Aber auch wer nur ein bisschen googelt und im Internet einkauft, ist erfasst: Die Datenbanken kennen uns besser, als wir denken.

Von Helmut Martin-Jung

Es war bloß ein Experiment. Jeder hätte es machen können, umso erschreckender das Ergebnis: Ist es möglich, öffentlich zugängliche Informationen im Internet zu einem persönlichen Profil zu verdichten, Adresse, Beruf, Familie, Hobbys - das volle Programm? Das fragte sich die Redaktion der Computerzeitschrift c't und bat Ende 2010 den Mitarbeiter eines Internetunternehmens, bei dem Versuch mitzumachen. Der Mann, ganz vernetzter Mensch, stimmte einem Artikel mit voller Namensnennung zu. Doch dann las er den fertigen Text. Und war so schockiert, dass er darum bat, den Artikel nur in anonymisierter Form zu veröffentlichen.

Es war nicht schwer gewesen herauszufinden, unter welchem Pseudonym der Mann in sozialen Netzwerken auftrat. Konsequenz: Das private Beziehungsgeflecht lag offen zutage, Fotos aus der Wohnung, das Autokennzeichen. Selbst schuld, könnte man sagen, warum stellt er auch so viel über sich und seine Familie ins Netz. Doch auch wer das nicht tut, wer nicht bei Facebook, Twitter und so weiter ist, wer nur surft, nach Begriffen googelt und hin und wieder online einkauft, ist längst erfasst in gigantischen Datenbanken. Und eine ganze Industrie lebt davon, dass sie uns viel besser kennt, als wir denken. Aber wie geht das eigentlich? Hier ein paar Beispiele, ohne Anspruch auf Vollständigkeit.

Schuhe online kaufen

Die meisten haben es schon einmal erlebt: Man sucht auf Shopping-Seiten nach bestimmten Schuhen, sagen wir Sneakers, und plötzlich erscheinen Anzeigen für Sneakers auf ganz anderen Seiten, die man aufruft. So ein Zufall? Von wegen. Werbung im Netz wird beherrscht von einigen großen Firmen. Ihre Netzwerke kann man sich vorstellen wie Pilze: An der Oberfläche sieht man bloß den Fruchtkörper, das wäre die einzelne Shopping-Seite. Doch der eigentliche Pilz ist das Myzel - ein unterirdisches Geflecht, das sich über riesige Gebiete erstreckt. So erfährt Webseite B, dass sich der Surfer X auf Webseite A Schuhe angeschaut hat, wenn beide Seiten zum selben Netzwerk gehören. Und das tun sie oft. Der Internetkonzern Google beispielsweise, Marktführer bei Werbung im Internet, ist Eigentümer des Werbenetzwerks DoubleClick. Dessen Anzeigen laufen auf sehr vielen Webseiten. Und auf vielen Seiten sind Anzeigen gleich mehrerer solcher Werbenetzwerke vertreten. Dazu gehören Firmen wie zum Beispiel Rubicon Project aus Los Angeles. Die kennt außerhalb von Fachkreisen niemand, ihre Anzeigen aber wurden 2012 an mehr Internetsurfer ausgespielt als die von Google.

Bleibt nur noch die Frage, wie der Surfer wiedererkannt wird. Woher also weiß Webseite B, dass man der Surfer X ist, der auf Webseite A nach Sneakers gesucht hat, und nicht Y? Dazu gibt es mehrere Methoden. Am bekanntesten sind Cookies. Das sind kleine Textdateien, die auf den eigenen Computer geschrieben werden, wenn man eine Internetseite aufruft. Man kann das zwar abschalten, nur funktionieren dann viele Internetseiten nicht mehr. Man kann Browser auch so einstellen, dass Cookies automatisch gelöscht werden, wenn man das Programm wieder schließt.

Doch mit Cookies alleine arbeiten die meisten Anbieter schon lange nicht mehr. Surft man eine Seite an, erfährt diese eine ganze Reihe von Kenndaten, zum Beispiel, ob man einen Windows- oder einen Mac-Rechner hat, wie viel Punkte der Bildschirm anzeigen kann, die Internet-Adresse und einiges mehr. Aus der Summe dieser Daten ergibt sich eine Art Fingerabdruck des Computers - bei den meisten Rechnern ist er so individuell, dass er ausreicht, um den Rechner wiederzuerkennen. Es gibt noch ein paar andere Möglichkeiten - mithin also genug, um einen Nutzer immer wieder zu identifizieren. Sogar wenn dieser einigermaßen vorsichtig ist.

Mit identifizieren ist dabei nicht zwingend gemeint, dass man die Nutzer namentlich kennt. Für Werbezwecke reicht es ja zu wissen, mit welcher Werbung man einen potenziellen Kunden am besten zuballert. Es gibt aber genügend Beispiele dafür, dass man aus anonymisierten Daten relativ einfach die Identität einzelner Nutzer ermitteln kann. Und von Anfang an vorbei ist es mit der Anonymität natürlich dann, wenn man sich bei Webseiten anmeldet.