Wissenschaft mit Facebook-Daten:Kernschmelze der Privatsphäre

Facebook Inc. Opens New Data Center In The Arctic Circle

Auch Wissenschaftler mögen Facebook

(Foto: Bloomberg)

Der gigantische Datenschatz von Facebook weckt auch bei Wissenschaftlern große Begehrlichkeiten. Doch was, wenn Nutzer gar nicht wissen, dass sie beobachtet und vermessen werden?

Von Christoph Behrens

Im Herbst 2005 trat ein hoffnungsvoller neuer Jahrgang an der Harvard University an. Die "Freshmen" hatten es geschafft: Eine der besten Hochschulen der Welt hielt sie für würdig, hier zu studieren. Diese Chance wollten die 1600 jungen Frauen und Männer nutzen. Sie wollten lernen und Wissen aufsaugen, Sport, Wirtschaft, amerikanische Geschichte.

Doch niemand von ihnen ahnte, dass zugleich sie selbst studiert wurden.

Der Soziologe Jason Kaufman, ebenfalls aus Harvard, interessierte sich sehr für die Studenten - oder eher für ihre Facebook-Profile. Seine Arbeitsgruppe lud sämtliche öffentliche Facebook-Daten der 1600 Novizen herunter, dazu Fotos, Freundeslisten, Informationen über Herkunftsländer, Musikgeschmack und sexuelle Interessen. Den Download wiederholten die Soziologen die nächsten drei Jahre immer wieder. Zudem wussten sie aus Unidatenbanken, wo jeder Student auf dem Campus wohnte, auch diese Informationen speicherten sie. "Ein komplettes soziales Universum" nannten die Forscher das. Sie betrachteten so die gesamte Collegekarriere dieser Studenten mit der Lupe. Die Forscher sahen in den Datensätzen, wie sich der Musikgeschmack der Studenten entwickelte, welche Filme auf dem Campus angesagt waren, wer sich in wen verliebte. Sie erzählten den Studenten aber nie etwas davon.

Sexuelle Orientierung oder Scheidungskind - das lässt sich mit Facebook-Daten ablesen, glauben Forscher

Facebook hat in den zehn Jahren seines Bestehens nicht nur bei Geheimdiensten und Werbern Begehrlichkeiten geweckt. Das soziale Netzwerk sitzt auf einem gigantischen Datenschatz, der sich der Größenordnung Exabyte nähert - das sind eine Milliarde Gigabyte Informationen. Auch immer mehr Wissenschaftler unterliegen der Versuchung, diese Quellen anzuzapfen. "Wir stehen an der Schwelle zu einer neuen Sozialwissenschaft", schwärmte ein Forscher des Harvard-Projekts "Tastes, Ties and Time" (Geschmäcker, Bindungen und Zeit). "Unsere Vorgänger konnten von diesen Daten nur träumen."

Längst ist die Forschung mit Facebook-Daten nicht mehr auf die Sozialwissenschaften beschränkt. Geisteswissenschaftler untersuchen mit ihnen, welche Wörter in Mode kommen, Informatiker, wie Informationen sich ihren Weg durch den Cyberspace bahnen. Eine Forschungsgruppe der Universität Cambridge konnte zeigen, dass sie anhand der Likes eines Facebook-Nutzers dessen sexuelle Orientierung, religiöse und politische Ansichten relativ genau vorhersagen kann. Sie erkannten sogar, ob er oder sie ein Scheidungskind ist.

Psychologen nutzen Facebook zur Stimmungsanalyse, etwa um depressive Züge von Menschen anhand ihrer Textmuster zu erkennen. "Eine typische Fragestellung ist, ob schlechte Laune ansteckend ist", sagt Viktor Mayer-Schönberger von der Universität Oxford. Der Professor für Internet Governance und Regulierung glaubt allerdings, Wissenschaft mit Daten aus sozialen Netzwerken sei "im Moment noch stark für die jungen Wilden", also für Wissenschaftler aus jüngeren Jahrgängen, die sich trauen, die Realität mit unkonventionellen Methoden zu untersuchen. Till Keyling von der Universität München etwa hat gemeinsam mit Jakob Jünger von der Universität Greifswald das Tool Facepager entwickelt. Damit können Wissenschaftler öffentlich zugängliche Daten aus Facebook-Profilen untersuchen. Etwa 200 Kollegen nutzen das Werkzeug regelmäßig, schätzt Keyling.

Das große Ziel: in die Zukunft sehen

So versuchten Forscher des Unternehmens Microsoft kürzlich, anhand der Facebook-Profile von 165 jungen Müttern auf etwaige Wochenbett-Depressionen zu schließen. Mit dem Einverständnis der Frauen betrachteten die Wissenschaftler rund ein Jahr ihres Lebens auf Facebook. Mütter, die nach der Geburt ihres Kindes eine depressive Phase erlebten, waren nach der Geburt weniger im Netzwerk aktiv als andere Mütter. Sie teilten weniger Bilder und kommunizierten seltener mit Freunden. Zudem konnten die depressiven Frauen nicht so viel soziales Kapital aufbauen: Wenn sie Inhalte teilten, klickten Freunde seltener auf "Gefällt mir".

Nach Ansicht der Microsoft-Forscher geht eine geringe Online-Aktivität mit einer Abschottung auch im echten Leben einher, denn "soziale Netzwerke wie Facebook unterstützen die Kommunikation mit der Außenwelt und helfen dabei, soziales Kapital zu erzeugen und zu erhalten". Im nächsten Schritt wagten die Forscher den Blick in die Zukunft. Anhand der Online-Aktivität vor der Entbindung sagten sie voraus, welche Frauen Depressionen bekommen würden und welche nicht.

Bislang ist die Genauigkeit solcher Vorhersagen beschränkt, die Modelle produzieren auch viel Unsinn. Doch die Wissenschaftler werden immer besser darin, aus vergangener Aktivität auf künftige Taten zu schließen. Genau davor warnt der Oxford-Wissenschaftler Mayer-Schönberger: "Der Wunsch, mit Big Data menschliches Verhalten vorherzusagen, muss Grenzen haben."

Darf man Menschen auf Facebook wie Labormäuse beobachten?

Wie rasch Grenzen im Digitalen überschritten sind, mussten auch die Harvard-Wissenschaftler feststellen. Im Jahr 2008, nachdem sie die College-Kids fast drei Jahre vermessen hatten, veröffentlichten sie die Ergebnisse in einer Datenbank. Sie hatten alle Vorkehrungen getroffen, um die Anonymität der Studenten zu wahren, Ethikkommissionen eingeweiht, Klarnamen gelöscht. Es half nichts: Nur wenige Tage später ermittelten findige Kollegen Harvard als Ursprungsuniversität. Damit war klar, um welche Studenten es ging. Einige aufgezählte Nationalitäten gab es in dem Jahrgang nur ein einziges Mal, somit konnten Einzelpersonen in dem vermeintlich anonymen Wust leicht identifiziert werden. Ein Beobachter nannte den Vorgang eine "Kernschmelze für die Privatsphäre". Auf Druck von Kollegen ging die Datenbank deshalb schnell offline.

Soziologe Kaufman konnte die Aufregung allerdings nicht verstehen: "Die Daten waren ja schon öffentlich", sagte Kaufman später, alle Informationen stammten aus Facebook selbst. Er verglich seine Arbeit damit, auf einem öffentlichen Platz zu sitzen und sich Notizen über Passanten zu machen. Die müsse man ja auch nicht um Erlaubnis bitten, oder?

"Allein die Tatsache, dass persönliche Informationen von der Sphäre des Profils gesaugt, in einer Datenbank angehäuft und zugänglich für externe Blicke gemacht werden, ist ein Angriff auf die Würde (der Studenten)", widerspricht Michael Zimmer von der Universität Wisconsin in einem Fachartikel. Im Kern geht es also um die Frage: Nur weil sich jemand in einem öffentlichen Raum wie Facebook bewegt - darf man ihn dann jahrelang wie eine Labormaus beobachten?

Geheimniskrämerei um Konzerndaten

Auch einige Jahre nach der kontroversen Harvard-Studie folgt die Forschung mit Facebook-Daten keinen festen Regeln. "Viele Fragen sind ungeklärt", sagt etwa die Medienwissenschaftlerin Nele Heise von der Uni Hamburg. "Ab wann ist eine Aussage öffentlich? Wie und wann offenbare ich meine Forschung? Da fangen wir gerade erst an, Regeln zu entwickeln." Auch sie arbeitet mit Facebook, etwa um zu analysieren, welchen Anklang Politikeraussagen finden. Doch würde sie vorher fragen, ob sie ein Profil analysieren darf. "Da geht es um Menschen, die dort leben, dessen müssen wir uns bewusst sein", sagt Heise.

Die Forscherin macht auf ein weiteres Problem aufmerksam. In Facebook steht plötzlich ein "dritter Akteur" zwischen Wissenschaftler und Proband, der die Spielregeln mitbestimmt. Dadurch entstünden neue Abhängigkeiten. "Daten aus sozialen Netzwerken können auch falsche Ergebnisse produzieren", gibt Till Keyling von der Uni München zu bedenken. So nutze etwa in Deutschland nur eine Minderheit Twitter, repräsentativ für die Bevölkerung sei diese Gruppe nicht.

Beide Forscher kritisieren, dass die Konzerne zum Teil Geheimniskrämerei um ihre Daten betreiben. Facebook kooperiert nur äußerst selten mit Universitäten. Stattdessen unterhält der Konzern eine eigene elitäre Gruppe von Datenwissenschaftlern. Diese untersucht zum Beispiel, wie oft Frauen nach der Heirat ihren Namen ändern. Oder wie ein millionenfach geteiltes Mem auf Facebook mit der Zeit mutiert, ähnlich wie sich Sätze im Spiel "Stille Post" verändern. Dazu greifen die Wissenschaftler teilweise auf Methoden aus der Evolutionsbiologie zurück.

Man kann auch selbst mit Facebook-Daten Wissenschaftler spielen. Mit dem Tool "Wolfram Alpha Personal Analytics" lässt sich der eigene Freundeskreis untersuchen - etwa daraufhin, wer am meisten kommentiert oder wer der "Top Social Connector" ist, wer also den Freundeskreis im Digitalen zusammenhält (die Richtlinien zum Datenschutz finden Sie hier). Und das Werkzeug "You Are What You Like" analysiert die eigene Persönlichkeit anhand der Vorlieben, die man auf Facebook kundtut.

© SZ vom 13.03.2014/cwb
Zur SZ-Startseite

Lesen Sie mehr zum Thema

Süddeutsche Zeitung
  • Twitter-Seite der SZ
  • Facebook-Seite der SZ
  • Instagram-Seite der SZ
  • Mediadaten
  • Newsletter
  • Eilmeldungen
  • RSS
  • Apps
  • Jobs
  • Datenschutz
  • Kontakt und Impressum
  • AGB