WM-Statistik Weltmeister der Orakel

Vor Beginn des Turniers lagen Neymar und Co. in den Prognosen noch unangefochten vorne

(Foto: AP)

Mit Big-Data-Techniken gelang es Google und Microsoft, fast die gesamte K.-o.-Runde der WM richtig zu tippen. Eine Schlappe musste hingegen Statistik-Star Nate Silver einstecken - wegen eines "schwarzen Schwans".

Von Christoph Behrens

Nate Silver wusste es früh: Brasilien wird Weltmeister. "Es ist wirklich schwer, Brasilien in Brasilien zu besiegen", schrieb der Statistiker Anfang Juni auf seinem Blog FiveThirtyEight. Eigentlich unmöglich, meinte er.

Silver ist so etwas wie der König Midas der Zahlen: Er fasst statistisches Rohmaterial an und veredelt es zur Wahrheit über die Zukunft. So sagte der Amerikaner 2012 bei den Präsidentschaftswahlen in allen 50 US-Bundesstaaten den Sieger korrekt voraus - ein Kunststück, an dem zuvor alle Demoskopen zuverlässig gescheitert waren. Nun also die WM: Mit einer Wahrscheinlichkeit von 45,2 Prozent werde die Seleção Erster, legte Silver sich vor Turnierbeginn fest - im Laufe des Wettbewerbs erhöhte er diesen Wert sogar noch auf 54 Prozent. Man könne ja darüber reden, wer Favorit sei, würde die WM irgendwo inmitten der Wüste gespielt. "Aber diese Weltmeisterschaft wird in Brasilien gespielt", schrieb Silver. "Kein Land hat Brasilien seit fast zwölf Jahren zu Hause besiegt." Und Deutschland? Ach, Deutschland. Zu offensiv eingestellt, leichte Beute für Konter. Auf Silvers Rangliste abgeschlagen mit Elf-Prozent-Chance auf den Pokal - noch hinter Argentinien.

Dann kamen die Schockwellen. Mit sieben Treffern fegten die Deutschen die Brasilianer am vergangenen Dienstag hinweg - und damit auch die Prognose des Star-Statistikers. Mit 1 zu 4500 bezifferte Silver die Wahrscheinlichkeit eines solchen Ergebnisses, umgerechnet 0,022 Prozent.

Wie konnte sich der Zahlenmeister so täuschen?

Tatsächlich ist es auch ohne solche Schocker ziemlich schwierig, Nationalmannschaften zu vergleichen, weil sie so selten gegeneinander spielen. Abgesehen von Freundschaftsspielen traf Deutschland seit der letzten WM in Südafrika nur sechs Mal auf Länder, die dann auch in Brasilien dabei waren. Die holländische Elf spielte in den letzten vier Jahren sogar nur zwei solcher Partien. Eine äußerst dünne Datenbasis, um die teilnehmenden Teams mathematisch zu sortieren. Hinzu kommt, dass sich die Aufstellung der Mannschaften ständig ändert. Silver versucht dies zu korrigieren, indem er Offensiv- und Defensivstärken einzelner Spieler in sein Modell einfließen lässt. Dieser "Soccer Power Index" (SPI) soll die Torgefährlichkeit eines Messi oder Ronaldo berücksichtigen, und so den Einfluss der Stars auf die Mannschaft messen (hier finden Sie ausführlichere Infos zum SPI).

Der 7:1-Sieg Deutschlands - ein "schwarzer Schwan" der Statistik

Doch selbst so ein ausgefeiltes Modell versagt in den Extremen. Ein 7:1-Sieg gegen Brasilien ist ein solches Extrem, ein "schwarzer Schwan", wie der Ökonom Nassim Nicholas Taleb solche Ereignisse nennt. Schwarze Schwäne haben paradoxe Eigenschaften: Sie sind extrem unwahrscheinlich, zugleich aber recht häufig und im Nachhinein völlig nachvollziehbar. Zwei Beispiele:

  • Wie hoch hätte ein Statistiker die Wahrscheinlichkeit für die Entdeckung Australiens geschätzt, bevor man Australien entdeckte?
  • Für wie wahrscheinlich hielt man um 1970, dass ein weltumspannendes Computernetzwerk in den nächsten 50 Jahren die Wirtschaft umkrempelt?

Diese Dinge scheinen im Nachhinein logisch, doch im Voraus kann kein Modell sie vorhersagen, oder gar eine Wahrscheinlichkeit dafür angeben. "Es gibt oft nicht einmal genug Daten, um eine 1:400 von einer 1:4000 oder einer 1:40.000-Wahrscheinlichkeit zu unterscheiden", schreibt Silver.

Umso überraschender angesichts solcher Ausreißer ist es, dass andere Prognosen bei der WM zutreffender waren. Google sagte 14 der 16 Spiele der K.-o.-Runde korrekt voraus. Der Konzern griff dazu auf Daten des Big-Data-Anbieters "Opta" zurück, der massenhaft Sportereignisse auswertet, gelbe Karten, Tore und Zweikämpfe Tausender Spieler zählt. Die Firma rühmt sich, jeden Ballkontakt aus rund 100 nationalen Ligen und internationalen Turnieren zu analysieren - darunter die Bundesliga, die Champions League und selbstverständlich die Fifa-Fußball-Weltmeisterschaft. Einziger Fehler, der Google mit Big Data als Verbündetem unterlief: Frankreich würde Deutschland im Viertelfinale mit einer Wahrscheinlichkeit von 69 Prozent besiegen, sagte das Modell voraus. Beim Finale gab der Google-Algorithmus Deutschland wieder einen knappen Vorteil von 55 Prozent - angesichts des packenden Spielverlaufs also eine durchaus realistische Einschätzung.

Fingerübung für das Silicon Valley

Die Tech-Giganten haben den Sport längst als Übungsplatz für die Fertigkeiten ihrer Programmierer entdeckt. Noch besser lag Microsofts Suchmaschine Bing mit seiner Prognose. Diese kann auf Fragen des Benutzers antworten - nach dem Wetter, Aktienkursen, oder seit kurzem auch nach dem Ausgang von WM-Spielen.

Der Bing-Algorithmus tippte jedes Spiel der K.-o.-Runde richtig. Im Unterschied zu den Konkurrenten verarbeitet Microsoft nicht nur vergangene Spiele, um eine Prognose über die Zukunft abzugeben. Auch sekundäre Faktoren spielen eine Rolle: Anfahrtswege der Teams, Beschaffenheit des Rasens, die Wettervorhersage. Und, vermutlich das Entscheidende: Bing bedient sich aus den Datenbanken von Sportwettenanbietern. Diese Marktdaten werden so zum Korrektiv für die Zukunftsvorhersage, und das Bauchgefühl Tausender menschlicher Tippgeber zur "Schwarmintelligenz". Das Wissen der Masse fließt so in die Bewertung ein.

Nach dem Turniersieg der Deutschen änderte auch Nate Silver seine Meinung. "Das deutsche Team könnte die beste Nationalmannschaft aller Zeiten sein", schrieb Silver in einem neuen Blogeintrag. Der letzte Beweis, dass Statistik eine äußerst dynamische Wissenschaft sein kann.