Big Data Demoskopen brauchen Demut

"The Silent Majority" - diese Größe hatten die Wahlforscher in den USA tatsächlich unterschätzt

(Foto: AFP)
  • Bei der US-Wahl und der Abstimmung zum Brexit lagen viele Umfragen daneben, trotz großer Datenmengen.
  • Wie genau können Prognosen im Zeitalter von Big Data sein? Das versucht eine Reihe neuer Studien zu klären.
  • Mathematische Modelle und Umfragen liefern demnach bei Wahlen nach wie vor gute Ergebnisse. Ein neues Prognose-Werkzeug von US-Forschern kann beispielsweise länderübergreifend recht zuverlässig den Ausgang von Abstimmungen vorhersagen.
  • Dennoch beklagen Demoskopen, dass die Unsicherheit bei Prognosen tendenziell zunimmt. Das hat auch mit einem veränderten Wählerverhalten zu tun.
Von Christoph Behrens

Lange hieß es: Je mehr Daten es gibt, umso genauer lassen sich Vorhersagen über politische Entscheidungen treffen. Dann stimmte Großbritannien für den Brexit und die USA wählte Donald Trump zum Präsidenten. In beiden Fällen lagen Wahlforscher trotz ausgefeiltester mathematischer Modelle, gespeist von Tera-, Peta- und Exabytes an Daten, grob daneben.

Eine Reihe Artikel im Wissenschaftsmagazin Science versucht nun zu klären, was Big Data und Vorhersage-Techniken heute angesichts politischer und wirtschaftlicher Krisen leisten können. Die Antwort: Es wird komplizierter gute Prognosen zu treffen. Aber es ist weiterhin möglich - und etwas mehr Demut vonseiten der Wissenschaftler wäre dabei hilfreich.

Menschen verhalten sich selten wie berechnet

Zunächst der positive Teil: Zwar lagen Demoskopen bei Brexit und der aktuellen US-Wahl größtenteils falsch, insgesamt schneiden sie aber nicht schlecht ab. Bei den US-Wahlen 2012 etwa sagte der Datenwissenschaftler Nate Silver die Ergebnisse aller 50 Bundesstaaten richtig voraus, auch andere Wahlforscher lagen sehr nahe am tatsächlichen Ergebnis. In Science berichtet ein Team um Ryan Kennedy von der Universität Houston nun von einem neuen mathematischen Modell, das 80 bis 90 Prozent aller Wahlen korrekt vorhersagen kann. Meist weiß ihr Programm im Vorfeld einer Wahl, ob der Amtsinhaber gewinnt oder der Herausforderer.

Big Data: Wie die IT-Industrie die Privatsphäre aushöhlt

Europa ist beim Rohstoff private Daten dabei, das Afrika des Informationszeitalters zu werden. Gastbeitrag von Werner Meixner mehr ...

Bemerkenswert ist an dem Prognose-Werkzeug, dass es nicht auf ein Land beschränkt ist. Die Datenwissenschaftler verwendeten als Grundlage 621 Wahlergebnisse seit 1945 aus 86 verschiedenen Ländern, um zu einem globalen Wahl-Modell zu kommen. So unterschiedliche Faktoren wie der Grad der Demokratisierung, die Stärke der Wirtschaft oder die Außenpolitik eines Landes fließen darin ein - aber auch die Ergebnisse von Wählerbefragungen vor Ort. Anhand dieser 21 Faktoren sagten die Forscher zehn von elf Wahlen in Südamerika zwsichen 2013 und 2014 korrekt voraus, und 29 von 36 Wahlen in anderen Weltregionen.

Überraschenderweise hatte die wirtschaftliche Lage eines Landes kaum einen Einfluss, ob der Amtsinhaber gewinnt oder der Herausforderer. Ein stärkerer Indikator war beispielsweise, wie viele internationale Hilfsgelder ein Staat erhält - je mehr, umso bessere Chancen hatten neue Parteien. Der beste Faktor für die Pronose seien aber unabhängige Umfragen unter den Wählern, schreiben die US-Forscher. "Umfragen können nicht nur in den USA, sondern global dazu dienen, Wahlen vorherzusagen", sagt der Autor der Studie Ryan Kennedy. Es sei daher ein Fehler, auf solche Umfragen künftig zu verzichten - Kritik daran wurde beispielsweise nach der US-Wahl laut.

Doch warum gelang es in den USA trotzdem nicht, den Wählerwillen verlässlich abzufragen? Hier beginnt der aus wissenschaftlicher Sicht unangenehme Teil. Jake Hofman von der Forschungsabteilung von Microsoft zieht zur Erklärung zwei Extreme der Vorhersehbarkeit heran: regelmäßige Ereignisse und sogenannte "Schwarze Schwäne". Regelmäßige Ereignisse sind einfach vorherzusagen. Beispielsweise zeigte eine Studie von 50 000 Handynutzern, dass diese sich 70 Prozent der Zeit an ihrem bevorzugten Ort aufhalten, beispielsweise dem Arbeitsplatz oder Zuhause. Mit 70-prozentiger Genauigkeit lässt sich also recht einfach vorhersagen, wo sich jemand zu einem beliebigen Zeitpunkt befindet. "Schwarze Schwäne" dagegen werden Ereignisse wie die Finanzkrise von 2008 genannt. Sie sind sehr selten und völlig unmöglich vorherzusagen. Das Ergebnis einer US-Präsidentschaftswahl bewegt sich in ihrer Vorhersehbarkeit irgendwo dazwischen - eine richtige Prognose ist zwar nicht völlig unmöglich, aber auch nicht völlig sicher.

"Wenn Vorhersagen nicht perfekt sind, könnte das an einer zu geringen Datenmenge liegen", schreibt Hofman, "aber es könnte auch sein, dass das Phänomen selbst unvorhersehbar ist und die Genauigkeit der Vorhersage an eine fundamentale Grenze stößt". Das bedeutet, dass eine komplexe Welt sich niemals vollständig vermessen lässt, sondern immer ein Rest Unsicherheit bleibt. Der Erfolg Donald Trumps lässt sich nicht allein mit seinem Auftreten in den Medien, seinen politischen Fähigkeiten oder dem Zustand der USA erklären. Auch der Zufall spielt eine wichtige Rolle, und dies lasse sich nicht durch genauere Modelle wegrechnen , argumentiert Hofman. Je höher solche externen Zufallsfaktoren, umso niedriger ist die Chance einer richtigen Vorhersage.