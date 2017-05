25. April 2017, 14:13 Uhr Der Facebook-Faktor So haben wir die Daten recherchiert









Sechs Monate, knapp 5000 User, mehr als eine Million Likes - das ist die Datenbasis für das Projekt Der Facebook-Faktor. Woher die Daten stammen und was in ihnen steckt.

Von Katharina Brunner

Auf welchen Daten basiert das Projekt?

Im Zuge der Datenrecherche haben Datenjournalisten, Programmierer und Redakteure der SZ.de-Redaktion mehr als eine Million öffentliche Facebook-Likes von etwas weniger als 5000 politisch interessierten Facebook-Nutzern ausgewertet. Diese gut eine Million Klicks auf "Gefällt mir" zeigen die Vorlieben und Interessen dieser Nutzer. Sie waren darüber hinaus auf einer oder mehreren Facebook-Seiten von Parteien aktiv. So ließen sie sich einer politischen Richtung zuordnen, wodurch wiederum Rückschlüsse auf Parteienmilieus und die politische Landschaft auf Facebook möglich waren.

Warum sind diese Daten überhaupt interessant?

In Deutschland läuft gerade der Wahlkampf zur Bundestagswahl an. Es ist absehbar, dass Facebook als zusätzliches Feld für den Wahlkampf eine wichtige Rolle spielen wird. Vor dem Hintergrund der Diskussion um Filterblasen und Einfluss von sozialen Netzwerken auf politische Vorgänge und Entscheidungen im Wahljahr wollen wir Erkenntnisse darüber gewinnen, wie politisch Facebook ist, wie dort Politik gemacht wird, wie sich die einzelnen politischen Sphären darstellen, was sie prägt und was wiederum vielleicht diejenigen prägt und beeinflusst, die sich in ihnen bewegen.

Wie wurden die Nutzer ausgewählt?

Im Fokus der Recherche lag die politische Dimension Facebooks, vor allem in Hinblick auf den beginnenden Bundestagswahlkampf. Ausgangspunkt waren deshalb die Facebook-Seiten der Parteien, die eine realistische Chance auf den Einzug in den Bundestag haben: AfD, CDU, CSU, FDP, Grüne, Linke und die SPD. Von diesen Seiten lassen sich über die offizielle Programmier-Schnittstelle, die Facebook Graph API, alle Posts der politischen Parteien abrufen. Für Posts im Zeitraum von Oktober bis März 2017 wurden anschließend je Partei auf zufälliger Basis einzelne Nutzer ausgewählt, die den Post gelikt haben.

Wichtig ist: Es wurden keine persönlichen, eindeutig zuzuordnenden Informationen ausgewertet, sondern lediglich die Likes, also die auf öffentliche Seiten bezogenen "Gefällt-mir-Angaben", die wiederum die Nutzer öffentlich zugänglich gemacht haben. In der Recherche ging es nicht um den einzelnen Nutzer und private Daten, sondern lediglich um die Summe von Vorlieben, also um eine Verallgemeinerung und Abstrahierung - ähnlich einer anonymen Befragung. Außerdem wurden die Nutzer zufällig ausgewählt. Mathematisch werden Ergebnisse, bei denen von einer kleinen Gruppe auf eine größere geschlossen wird, qualitativ besser, wenn solch eine Zufallskomponente eingebaut ist.

Welche Rückschlüsse auf die Parteimilieus lassen die Likes der Nutzer zu?

In der Datenbank liegen 1 036 539 Likes, von 4986 verschiedenen Usern, verteilt auf 452 282 Facebook-Seiten. In einer solchen Menge an Daten ist eine Systematik mit bloßem Auge nicht erkennbar. Deshalb wurden die Daten aggregiert, also zusammengezählt. Zum Beispiel wurde analysiert, für welche Seiten sich die User interessieren, die dem Umfeld einer Partei zugeordnet werden konnten - also welche Seiten sie liken und in einem zweiten Schritt welche von den meisten Usern aus diesem Umfeld gelikt werden.

Das Ergebnis sind Listen von Facebook-Seiten, die einer jeweiligen Partei zuzuordnen sind und die damit einen Überblick darüber geben, welche Seiten in der jeweiligen politischen Sphäre von besonderer Bedeutung sind. Zum Beispiel eben die Top-100-Seiten, die User aus dem Umfeld der AfD gelikt haben, oder die 100 beliebtesten Seiten von Usern aus dem Umfeld der SPD. Die Listen gibt es für alle Parteien hier.

Werden die Nutzer den Parteimilieus auch richtig zugeordnet?

Mit hundertprozentiger Sicherheit lässt sich das nicht garantieren, aber die Analysemethoden wurden so angelegt, dass am Ende möglichst plausible Ergebnisse stehen. Natürlich gibt es bei allen Parteien Nutzer, bei denen der bloße Akt des Likens eines Posts noch nicht als Zustimmung gewertet werden kann. Da aufgrund der großen Datenmenge eine qualitative Auswertung im Detail nicht möglich war, haben wir uns quantitativ beholfen: Je mehr Daten ausgewertet werden, desto weniger fallen diejenigen ins Gewicht, die eher nicht auf Parteilinie sind. Sie sind in der Summe eine Minderheit und fallen durch das Aggregieren aus den Listen der populärsten Seiten hinaus.

Sind 5000 Nutzer genug, angesichts der um ein Vielfaches größeren Menge an deutschen Facebook-Accounts?

Die Auswertung musste aufgrund der großen Datenmenge auf einen vergleichsweise kleinen Ausschnitt des deutschsprachigen Facebooks beschränkt werden. Das Zufallsverfahren ermöglicht es, dass die Daten trotzdem so aussagekräftig wie möglich sind.