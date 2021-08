Umfragen, kombiniert mit politikwissenschaftlichen Erklärungsansätzen. So will die SZ in diesem Jahr vorhersagen, wie die Wahl im September ausgehen könnte. Ein Blick hinter die Kulissen.

Von Benedict Witzenberger

30 Prozent erreicht die Union am Dienstag und Mittwoch, 28 Prozent am Freitag, in der Woche darauf landet sie zwischen 24 und 26 Prozent. Das ist der momentane Veröffentlichungsrhythmus der Umfrageinstitute. Angesichts dieser Flut an Befragungen zur Bundestagswahl verlieren selbst politikinteressierte Wählerinnen und Wähler schnell mal den Überblick. Und manche haben womöglich ihre Zweifel, inwieweit solche Befragungen überhaupt ein verlässlicher Blick in die Zukunft sein können.

Dabei bezieht sich die Frage "Welche Partei würden Sie wählen, wenn am kommenden Sonntag Bundestagswahl wäre" gar nicht auf den Wahltermin am 26. September. Eigentlich nicht einmal auf die Zukunft. Die Frage beantwortet eigentlich nur, welche Partei die Umfrageteilnehmer zum Zeitpunkt der Befragung bevorzugen - eine Momentaufnahme. Niemand weiß, ob sie sich vor dem Wahltermin nicht noch einmal umentscheiden oder ob die Antwort überhaupt stimmt.

Auch wenn die Institute diese Deutung ablehnen: Viele Menschen interpretieren die Umfragen dennoch als Vorhersage, welche Partei wie bei der Bundestagswahl abschneiden wird. "Die Umfragen heute haben nur bedingt etwas mit dem Wahlausgang im September zu tun", sagt dagegen Thomas Gschwend, Professor für quantitative Methoden der Sozialwissenschaften an der Universität Mannheim. Die Befragungen seien zwar qualitativ gut, aber eben keine Vorhersage, nur ein Zwischenstand.

Die SZ versucht in ihrem Dashboard und ihren Grafiken zur Wahl, dieses Problem zu berücksichtigen und stärker die Unsicherheit dieser Umfragen darzustellen. Die einzelnen Umfrageergebnisse rücken etwas in den Hintergrund, stattdessen bilden wir einen Mittelwert, der einzelne Ausreißer ausgleicht, aber Trends über die Zeit deutlich sichtbar macht.

Das Problem, dass die Umfragen keine Vorhersage sind, bleibt aber natürlich bestehen. Daher schafft die SZ in diesem Wahljahr noch zusätzliche Angebote, um Prognosen besser einzuordnen und eine andere Perspektive auf den möglichen Wahlausgang zu liefern, und zwar indem die Bundestagswahl vorher Tausende Male simuliert wird. Die SZ kooperiert dazu mit Zweitstimme.org - ein Projekt, das Gschwend zusammen mit anderen Forschenden der Uni Mannheim 2017 gestartet hat. Eine Website, die das Wahlergebnis schon ein halbes Jahr vor der Wahl vorhersagen will, mithilfe von politikwissenschaftlichen Erklärungsansätzen für das Wahlverhalten. Für die Bundestagswahl 2021 stellt Zweitstimme.org ihr Modell der SZ für die Wahlprognose zur Verfügung.

Wie die Vorhersage zustande kommt

Die Vorhersage betrachtet zwei Ebenen: ganz Deutschland und jeden einzelnen Wahlkreis.

Für die Vorhersage des Gesamtergebnisses arbeitet auch Zweitstimme.org mit den aktuellen Umfragen. Die Forscher reichern sie allerdings mit historischen Ergebnissen an, sowie mit einer Angabe, welche Partei gerade den Kanzler oder die Kanzlerin stellt. Weil diese Daten schon lange vor der Wahl vorliegen, lässt sich schon sehr früh eine Aussage treffen, wo die Parteien landen dürften, weil so Projektionen basierend auf längerfristigen Trends möglich werden. Die Berg- und Talfahrten in den Umfragewerten während des Wahlkampfs werden dabei bewusst gedämpft.

Doch allein mit den Zweitstimmen lässt sich die Zusammensetzung des Bundestags nicht komplett vorhersagen: Es fehlen die Direktkandidaten, die in den einzelnen Wahlkreisen gewählt werden. Lokal führen die Umfrageinstitute in der Regel keine Befragungen durch, das wäre zu aufwändig.

Auch die Erststimmen spielen eine Rolle

Zweitstimme.org versucht, auch auf dieser Ebene Vorhersagen zu treffen. Die Grundannahme dafür ist, dass die Parteien bei ihren Erststimmen in den Wahlkreisen proportional zum Bundestrend Anteile verlieren oder gewinnen.

Weil diese Vorhersage der Wahlkreise auch Daten über die Kandidierenden benötigt, die bislang noch nicht vom Bundeswahlleiter bereitgestellt wurden, wird sie vermutlich erst ab Anfang September veröffentlicht.

Ein Beispiel: Die SPD hat bei der Wahl 2017 20,5 Prozent der Zweitstimmen geholt — nehmen wir an, derzeit wären es in den Umfragen nur noch 16 Prozent, also minus 4,5 Prozentpunkte. Oder anders gesagt: ein Verlust von 22 Prozent im Vergleich zum Wahlergebnis vor vier Jahren. Für jeden Wahlkreis zieht das Modell diesen Wert vom Wahlkreisergebnis der vergangenen Wahl ab.

Diese Werte kombinieren die Forschenden mit bereits erforschten Erklärungsansätzen für das Wahlverhalten aus der Politikwissenschaft, wobei Faktoren wie die Zahl der Kandidierenden im Wahlkreis, der Amtsinhaberbonus, die Lage des Wahlkreises in West- oder Ostdeutschland, der Listenplatz der Kandidierenden, ob sie schon einmal angetreten sind, ihr Geschlecht und ein möglicherweise vorhandener akademischer Grad berücksichtigt werden.

Ein komplexes mathematisches Verfahren aus dem Bereich des maschinellen Lernens berechnet mit diesen Variablen aus den Wahlen von 2009 bis 2017 ein umfassendes Modell für die Wahl. Es beschreibt, wie der Zusammenhang zwischen den Variablen und einem möglichen Wahlergebnis aussehen könnte: Die Umfrageergebnisse werden also mit anderen erklärenden Variablen zusammengebracht, das Computermodell versucht einen optimalen mathematischen Weg zu finden, wie sich die Variablen zu einem Wahlergebnis verhalten.

Vom Modell zur Wahrscheinlichkeit

Weil Modelle die Wirklichkeit vereinfachen und auf ein paar Variablen reduzieren, nutzen die Forschenden zudem noch Simulationen, um Varianz in den Vorhersagen zu erzeugen. Mit dem Modell wird die Bundestagswahl 9000 Mal wiederholt, das Ergebnis jedes Durchgangs wird notiert. Je häufiger in diesen Tausenden Wiederholungen eine Partei die Mehrheit erreicht hat, desto sicherer ist das Ergebnis.

Die folgende Grafik zeigt die Verteilung der Simulationsergebnisse für die wahrscheinlichsten Koalitionen. Für jede Koalition zeigt die Kurve, bei welchem Sitzanteil die meisten Simulationsergebnisse landen. Je mehr dieser Ergebnisse über der 50-Prozentmarke liegen, umso wahrscheinlicher hat diese Koalition im Modell eine Mehrheit.

Aus diesen Simulationsergebnissen lassen sich wiederum Wahrscheinlichkeiten berechnen — und zwar für ganz verschiedene Fragestellungen dieser Bundestagswahl: Wie oft erreicht ein Kandidat in einem Wahlkreis die meisten Stimmen? Wie oft kommt eine Koalition auf eine Mehrheit?

Und diese Daten geben uns noch mehr Informationen: Weil über die Erststimmen auch mögliche Überhangmandate entstehen, kann das Modell einen Hinweis geben, wie groß der nächste Bundestag werden könnte. Angesichts der Debatten um das neue Wahlrecht eine wesentliche Information.

Aus der Kombination von Erst- und Zweitstimmenmodell ergibt sich schließlich eine Vorhersage, welche Partei im Bundestag wie viel Sitze erhalten wird. Diese lässt sich wiederum in Anteile umrechnen, und ist daher — anders als die Sonntagsfragen — eine Prognose, wie die Bundestagswahl im September ausgehen könnte: