Spätestens durch Stefan Niggemeier kennt ja doch jeder fivethirtyeight.com, wo Nate Silver die letzten US-Präsidentschaftswahlen anhand akribischer statischer Methoden prognostiziert und simuliert hat. Tatsächlich traf er das finale Ergebnis außerordentlich genau, nachdem er schon vorher viele vermeintlich professionelle Wahlbeobachter und ihre Umfragen geigelhast hatte. Die namensgebende Zahl 538 bezieht sich auf den Präsidenten wählenden Elektoren, und mehr Information gibt’s nebenan bei der Wikipedia.
Nicht alles anders machen
So etwas wie fivethirtyeight wird das hier nicht. Zum anderen, weil Datenlage und Zeit für mich leider anders sind.
Und zum einen, weil das deutsche Wahlrecht, sieht man von den voraussichtlich überreichlichen Überhangmandaten ab, genau die spannende Bundesland-nach-Bundesland-Analyse wenig erquicklich macht. Ob sich beim hiesigen Wahlrecht Landeslisten etwa untereinander verschieben wie 2005 bei der FDP, ist en detail in Simulationen weitaus weniger lohnenswert zu erörtern als das Durchrattern eines Algorithmus, der 10.000 mal jeden Staatsbürger wählen lasst und davon die Elektoren des jeweiligen Staates komplett abhängig macht.
Das klingt jetzt, insbesondere für eine vorgeschobene Begründung, unverhältnismäßig komplex und muss auch nicht weiter interessieren. Ich werde entsprechende Testsimulationen durchaus durchführen, nur sind die Ergebnisse weit weniger spektakulär, weil sie eben nur Prozentzahlkorridore abklappern, statt ganze Staaten umzufärben.
Anfang: Die Demoskopen
Ein vergleichsweise leichter Einstieg heute: Ich habe einmal zusammengetragen, wie die fünf wichtigsten Forschungsinstitute bei den letzten drei Bundestagswahlen in der jeweils letzten Umfrage gelegen haben. Quelle hierfür ist das vorzügliche Archiv von Wahlrecht.de.
1998: Die große Koalition kommt … nicht
Damit folgt also die erste Tabelle dieser Analysereihe. Ich werde bald noch einmal ein paar grundsätzliche Erörterungen folgen lassen, zunächst der Erklärung halber: Hier ist das jeweils letzte veröffentlichte Resultat der Institute vor der Bundestagswahl angegeben. Lesebeispiel: Die Forschungsgruppe Wahlen prognostizierte für die FDP 5,5%. Zeilenweise ergeben sich somit die Werte für Parteien, spaltenweise die Prognosen einzelner Institute. Am Ende führe ich auch den Mittelwert, das einfache arithmetische Mittel, an, und danach das effekte Ergebnis der Bundestagswahl 1998.
Allensbach | Emnid | Forsa | Forschungsgruppe Wahlen | Infratest dimap | Mittelwert | Ergebnis | |
Union | 36,0% | 39,0% | 38,0% | 37,5% | 38,0% | 37,7% | 35,1% |
SPD | 40,5% | 40,0% | 42,0% | 39,5% | 40,0% | 40,4% | 40,9% |
Grüne | 6,0% | 7,0% | 6,0% | 6,0% | 7,0% | 6,4% | 6,7% |
FDP | 6,5% | 5,0% | 4,0% | 5,5% | 6,0% | 5,4% | 6,2% |
Linke (PDS) |
5,0% | 4,0% | 5,0% | 4,5% | 5,0% | 4,7% | 5,2% |
Hier kann man schon einiges herauslesen – zum Beispiel scheint es, dass als Institute die CDU/CSU für zu stark bewerteten. Solche absoluten Ergebnisse sind zwar der Vollständigkeit halber wichtig und helfen auch, einen ersten Überblick zu schaffen über die Korridore, in denen jeweils die Einschätzung stattfand, für eine schnelle Auf-einen-Blick-Erkenntnis der Abweichungen der Prognosen allerdings bedarf es etwas zu viel Hin- und Herrechnerei.
Daher folgt hier die Aufschlüsselung der Abweichungen, also der Differenz zwischen Prognose und tatsächlichem Resultat. Ein positives Ergebnis heißt dabei, dass eine Partei überschätzt wurde, ein negativer heißt, dass sie tatsächlich stärker wurde als prognostiziert.
Differenz pro Partei
Allensbach | Emnid | Forsa | Forschungsgruppe Wahlen | Infratest dimap | Mittelwert | |
Union | 0,9% | 3,9% | 2,9% | 2,4% | 2,9% | 2,6% |
SPD | -0,4% | -0,9% | 1,1% | -1,4% | -0,9% | -0,5% |
Grüne | -0,7% | 0,3% | -0,7% | -0,7% | 0,3% | -0,3% |
FDP | 0,3% | -1,2% | -2,2% | -0,7% | -0,2% | -0,8% |
Linke (PDS) |
-0,2% | -1,2% | -0,2% | -0,7% | -0,2% | -0,5% |
In dieser Ansicht ebenfalls klar erkennbar: 1998 haben alle Umfrageinstitute die Union stärker bewertet, als sie es letztlich wurde, und dabei immerhin mit bis zu beinahe vier Prozenpunkten. Alle anderen Parteien wurden mäßig unterbewertet, im Mittelwert allerdings nie über einem Prozentpunkt. Der Unterschied ist allerdings im Resultat ein erheblicher. Im Mittelwert (wir nehmen an, dass die PDS ihre notwendigen Direktmandate erhalten hat und in jedem Fall Gruppenstärke angenommen hat) verfügt rot-grün über 46,8% der Zweitstimmen gegenüber den übrigen Parteien mit 47.8% – hier hätte es vieler SPD-Erststimmen bedurft, um an einer großen Koaltion vorbeizukommen. Das Endergebnis (47.6% gegen 46.5%) war damit trotz der vergleichsweise kleinen Abweichungen doch komplett rot-grün.
2002: Mehrheit ist Mehrheit
2002 war ziemlich klar, dass die PDS es nicht in den Bundestag schaffen würde, so dass die meisten glaubten, dass sich ein Zweier-Bündnis durchsetzen würde – nur welches?
Allensbach | Emnid | Forsa | Forschungsgruppe Wahlen | GMS | Infratest dimap | Mittelwert | Ergebnis | |
Union | 37,0% | 37,0% | 37,5% | 37,0% | 39,5% | 36,0% | 37,3% | 38,5% |
SPD | 37,5% | 39,0% | 39,0% | 40,0% | 36,0% | 38,5% | 38,3% | 38,5% |
Grüne | 7,5% | 7,0% | 7,0% | 7,0% | 7,0% | 8,0% | 7,3% | 8,6% |
FDP | 9,5% | 8,0% | 7,5% | 7,5% | 9,0% | 8,5% | 8,3% | 7,4% |
Linke (PDS) |
4,5% | 5,0% | 4,3% | 4,5% | 5,0% | 4,7% | 4,7% | 4,0% |
Auch hier zeigt eine erste Analyse, dass die Unionsparteien wieder durchgängig zu stark gewichtet wurden. FDP und Grüne dagegen sind quasi vertauscht, die Ökopartei hängt die Liberalen um mehr als 1 Prozentpunkt ab, beim Prognosemittelwert war das noch anders. Ein Blick auf die Differenzen zwischen Ergebnis und Prognose verdeutlicht einige Tendenzen.
Differenz pro Partei
Allensbach | Emnid | Forsa | Forschungsgruppe Wahlen | GMS | Infratest dimap | Mittelwert | |
Union | -1,5% | -1,5% | -1,0% | -1,5% | 1,0% | -2,5% | -1,2% |
SPD | -1,0% | 0,5% | 0,5% | 1,5% | -2,5% | 0,0% | -0,2% |
Grüne | -1,1% | -1,6% | -1,6% | -1,6% | -1,6% | -0,6% | -1,4% |
FDP | 2,1% | 0,6% | 0,1% | 0,1% | 1,6% | 1,1% | 0,9% |
Linke (PDS) |
0,5% | 1,0% | 0,3% | 0,5% | 1,0% | 0,7% | 0,7% |
Die Demoskopen sagten im Mittelwert (Achtung: Mit GMS!) einen Patt voraus , im Endeffekt schnitten die Grünen deutlich besser ab als prognostiziert, die FDP notierte dagegen schwächer, die Union lag über den Prognosen, die SPD minimal darunter.
2005: Ein weiterer vergeblicher Anlauf für schwarz-gelb
Die dank der Agenda 2010 wiedererstarkte und umbenannte PDS linderte die Wahrscheinlichkeit eines Zweier-Bündnisses – andererseits sagten die Institute in den Wochen lange vor der Wahl (dazu in einem der nächsten Beiträge) eine überstarke Union in den 40ern und eine SPD ohne 3 als erste Ziffer voraus.
Allensbach | Emnid | Forsa | Forschungsgruppe Wahlen | GMS | Infratest dimap | Mittelwert | Ergebnis | |
Union | 42% | 42% | 42% | 41% | 42% | 41% | 41,6% | 35,2% |
SPD | 33% | 34% | 33% | 34% | 33% | 34% | 33,3% | 34,2% |
Grüne | 7% | 7% | 7% | 7% | 8% | 7% | 7,1% | 8,1% |
FDP | 8% | 7% | 8% | 7% | 8% | 7% | 7,3% | 9,8% |
Linke | 9% | 8% | 8% | 8% | 7% | 9% | 7,9% | 8,7% |
Die Umfragen (mit GMS) direkt vor der Wahl maßen die SPD genauer (wenn auch alle zu schwach), dagegen wurde die Union mit in der Betrachtung unerreichten 5,8 Prozentpunkten im Mittelwert überschätzt, die kleinen Parteien, besonders die FDP (3,3%) insgesamt 4,6 Prozentpunkte unterbewertet. Und so kam es dann anders: Aus 48.9% für schwarz-gelb in den Umfragemittelwerten (gegen 48.3 für SPD, Grüne und Linke) wurde eine Pattsituation, die einzig mögliche Zweierkoaltion das amtierende Bündnis (siehe hierzu auch die übersicht bei Wahlrecht zu den Konstellationen). Die genaue Betrachtung der Tendenzen verdeutlicht das Problem.
Differenz pro Partei
Allensbach | Emnid | Forsa | Forschungsgruppe Wahlen | GMS | Infratest dimap | Mittelwert | |
Union | 6,3% | 6,8% | 6,8% | 5,8% | 6,8% | 5,8% | 6,4% |
SPD | -1,7% | -0,7% | -1,2% | -0,2% | -1,2% | -0,2% | -0,9% |
Grüne | -1,1% | -1,1% | -1,6% | -1,1% | -0,1% | -1,1% | -1,0% |
FDP | -1,8% | -3,3% | -2,3% | -2,8% | -1,8% | -3,3% | -2,6% |
Linke | -0,2% | -0,7% | -1,2% | -0,7% | -1,7% | -0,2% | -0,8% |
Über alle Wahlen hinweg
Es ergibt sich in den letzten Wahlen kein einheitliches Bild über die Fehlerquote: Fast jede Partei wurde bei den letzten Wahlen abwechselnd in die falsche Richtung fehlgeschätzt, wie die kumulierte Übersicht der Parteien zeigt (bitte alphabetische Sortierung beachten):
Institut | ||||||
Partei | Jahr | Allensbach | Emnid | Forsa | Forschungsgruppe Wahlen | Infratest dimap |
FDP | 1998 | 0,3% | -1,2% | -2,2% | -0,7% | -0,2% |
2002 | 2,1% | 0,6% | 0,1% | 0,1% | 1,1% | |
2005 | -1,8% | -3,3% | -2,3% | -2,8% | -3,3% | |
Grüne | 1998 | -0,7% | 0,3% | -0,7% | -0,7% | 0,3% |
2002 | -1,1% | -1,6% | -1,6% | -1,6% | -0,6% | |
2005 | -1,1% | -1,1% | -1,6% | -1,1% | -1,1% | |
Linke | 1998 | -0,2% | -1,2% | -0,2% | -0,7% | -0,2% |
2002 | 0,5% | 1,0% | 0,3% | 0,5% | 0,7% | |
2005 | -0,2% | -0,7% | -1,2% | -0,7% | -0,2% | |
SPD | 1998 | -0,4% | -0,9% | 1,1% | -1,4% | -0,9% |
2002 | -1,0% | 0,5% | 0,5% | 1,5% | 0,0% | |
2005 | -1,7% | -0,7% | -1,2% | -0,2% | -0,2% | |
Union | 1998 | 0,9% | 3,9% | 2,9% | 2,4% | 2,9% |
2002 | -1,5% | -1,5% | -1,0% | -1,5% | -2,5% | |
2005 | 6,3% | 6,8% | 6,8% | 5,8% | 5,8% |
Nur bei den Grünen ist die Unterschätzung (Ausnahmen: Emnid und Forsa 1998) beinahe konstant. Die nachfolgende Tabelle summiert die Ergebnisse von 1998, 2002 und 2005 jeweils in einer Zelle. Beispiel: Für die Kombination Allensbach und FDP ergibt sich als Summe aus 0,3%, 2,1% und -1,8% also 0,6%.
Eine solche Addition, welche die Vorzeichen der Abweichungen berücksichtigt, gibt keine Auskunft über die Genauigkeit der Schätzung: Schließlich können sich starke positive und negative Fehleinschätzungen gegenseitig aufheben. Vielmehr lässt sich im Ansatz erkennen, wie welches Insitut welche Partei in der Summe einschätzt. Der anschließende Mittelwert wurde dabei in einer separaten Spalte noch einmal durch drei (Anzahl der beobachteten Wahlen) dividiert, um die groß scheinenenden Zahlen zu relativieren, die auf eine Wahl heruntergebrochen weniger imposant wirken.
Summe der Differenzen | Institut | ||||||
Partei | Allensbach | Emnid | Forsa | Forschungsgruppe Wahlen | Infratest dimap | Mittelwert aller Institute |
Mittelwert / 3 (=pro Wahl) |
FDP | 0,6% | -3,9% | -4,4% | -3,4% | -2,4% | -2,7% | -0,9% |
Grüne | -2,9% | -2,4% | -3,9% | -3,4% | -1,4% | -2,8% | -0,9% |
Linke | 0,1% | -0,9% | -1,2% | -0,9% | 0,3% | -0,5% | -0,2% |
SPD | -3,1% | -1,1% | 0,4% | -0,1% | -1,1% | -1,0% | -0,3% |
Union | 5,7% | 9,2% | 8,7% | 6,7% | 6,2% | 7,3% | 2,4% |
Schaut man sich diese Aufstellung an, fällt auf:
- Die Union ist nicht nur als einzige Partei im Mittelwert aller Institute überbewertet, sie weist darüber hinaus auch noch den größten Betrag auf. Auf 7,3% summieret sich der Mittelwert aller Parteien, daraus ergibt sich, auf die einzelne Wahl heruntergebrochen, immer noch eine Überwertung um über zwei Prozentpunkte.
- Fast alle anderen Abweichungen gehen in der Summe ins Negative, hier schneiden die Parteien also später stärker ab als prognostiziert – allerdings, auf eine Wahl gerechnet, weniger als 1 Prozentpunkt.
- Beim Überschätzen der Union haben Forsa und Emnid die Nase vorn, beim Unterbewerten der FDP sind sie ebenfalls gut im Rennen.