Zur Kritik an der Demoskopie

Bevor ich mich die Berichterstattung zu den ins Haus stehenden Landtags- und Bundestagswahlen beginne, möchte ich noch einmal meine Gedanken zu einer oft geäußerten Kritik der letzten Jahre verfassen: Dass auf die Demoskopie eh kein Verlass sei, dass sie sich immer am Wahltag als an der Realität vorbeigehende Scharlatanerie entpuppe. (Der Aspekt, inwieweit sie als Herrschaftsinstrument genutzt werden, ist ein anderer und außerhalb dieser Betrachtung.)

Das ist eine per se berechtige Wahrnehmung, die sich natürlich immer nach einer besonders krassen gemeinsamen Fehleinschätzung einstellt. Der überraschende Triumph der FDP in Niedersachsen, der Blitzeinzug der Piraten ins Berliner Abgeordnetenhaus, nicht zuletzt natürlich das deutlich-unter-40-Ergebnis der CDU/CSU 2005. Alles richtig. Dennoch glaube ich, ist es mindestens zu vereinfachend, wenn nicht irreführend, die Demoskopie an und für sich von der Bühne reden zu wollen.

Der Faktor Zeit

Richtig ist, dass es zahlreiche Faktoren gibt, welche die Zuverlässigkeit der veröffentlichten Zahlen beeinträchtigen. Der wichtigste: Zeit. Je nach Institut dauert die Befragung etliche Tage bis eine Woche, die eigentliche Veröffentlichung ist noch etwas später. So können zwischen einem signifikanten Teil der Befragungsstichprobe und dem Tag der Veröffentlichung auch mal zehn Tage liegen. Zehn Tage, in denen die Elbe über die Ufer treten, die USA die Kriegsrasseln schütteln oder Rainer Brüderle den Mund aufmachen kann.

Beispiele dafür in jüngster Zeit:

  • In Berlin zeigte sich ein enormer Unterschied zwischen Brief- und Präsenzwählern, die Piraten kam bei ersteren lediglich auf, bei letzteren erzielten sie gar ein zweistelliges Ergebnis. Ihr großer Aufschwung geschah tatsächlich in der letzten Woche, wie sich auch an der letzten veröffentlichten Umfrage zeigt.
  • Die Forschungsgruppe Wahlen veröffentlicht nach den Erfahrungen mit Niedersachsen künftig auch in der Woche unmittelbar vor der Wahl ihre Zahlen, eben weil die enormen Latenzen sonst fast unausweichlich zu hohen Abweichungen führten. In Niedersachsen etwa lagen zwischen dem ersten Befragungstag der letzten FGW-Umfrage und dem eigentlichen Wahltag 3 Wochen!

Gerade in Zeiten, in denen mehr Wählerinnen und Wähler ihre Meinungsbildung unmittelbar vor der Wahl abschließen, ist daher Zeit das wichtigste Erfolgskriterium. Das zeigt sich auch, wenn wir einen genaueren Blick auf die „Vorhersagen“ für 2009 werfen: Es sind schlichtweg die Institute am genauesten, die zuletzt veröffentlicht haben. Zwangsläufig bilden Umfragen eben das verrechnete Stimmungsbild zum Befragungszeitpunkt ab.

Der Faktor Extremismus

Ein weiteres Problem, dass sich in unterschiedlich starker Ausprägung zeigt, ist die Einschätzung von extremistischen Parteien oder solchen, die zu Recht oder zu Unrecht von einem signifikanten Teil der Bevölkerung und/oder meinungsbildenden Medien dafür gehalten werden. Bei den eindeutig rechtsextremen Parteien geben Menschen ihre Wahlabsicht ungern zu – auch nicht in anonymen Umfragen am Telefon. Somit werden Ergebnisse wie das der NPD in Mecklenburg-Vorpommern erklärbar, insbesondere wenn eine zeitliche Komponente hinzukommt.

Das Institut Allensbach hat in der Vergangenheit zudem bewusst die Werte für die Republikaner „nach unten korrigiert“, um taktische wählende Menschen von einer Wahl für sie abzubringen. Das hat dem Institut viel Kritik eingebracht, es lässt sich zudem trefflich darüber diskutieren, inwieweit der erhoffte Effekt wirklich eintritt. Es erscheint daher äußerst unwahrscheinlich, dass sich dieses Vorgehen künftig wiederholen wird, zudem eindeutig rechtsextreme Parteien auf Bundesebene bedeutungslos sind.

Schwieriger wird die Einschätzung bei Parteien wie der Allianz für Deutschland oder ehemals der Partei Rechtsstaatliche Offensive/Schill-Partei. Es ist möglich, dass hier eine leichte Unterbewertung des öffentlichen Meinungsbildes stattfindet, zumal es für die AfD die erste Wahl überhaupt ist und daher jegliche Echtweltkalibrierung für die Institute fehlt.

Der Faktor Erreichbarkeit

Fürderhin betrifft eine weitere Herausforderung schließlich keine spezifische Partei, sondern schlichtweg die Auswahl der Stichprobe. Das Festnetztelefon ist insbesondere für jüngere Menschen keineswegs mehr häusliches Standardinventar, geschweige denn primäres Kommunikationsmedium. Um lediglich mobil Telefonierende zu erreichen, können die Institute also entweder zusätzlich auch Mobilfunknummern anrufen (kostet, ist womöglich mit mehr Anläufen und Störungen verbunden, Gefahr der doppelten Befragung Festnetz/mobil) oder versuchen, die fehlende Demographie aus dem Festnetzpool heraus zu evaluieren und gegenzurechnen. Diese Evaluation/Veränderung geschieht gerade.

Das scheint derzeit kein sonderlich großes Problem zu sein. Die Ergebnisse von jenen Instituten, die unterschiedliche Methoden verwenden, unterscheiden sich nicht systematisch in eine Richtung; die chronische leichte Überbewertung der Union mag der Tatsache geschuldet sein, dass ihre Anhängerschaft auch am einfachsten zu erreichen ist; das scheint aber ein fortwährender Fakt.

Der Faktor Zeit (Reprise)

Wie entsteht dann aber der Eindruck, dass Demoskopen häufiger zu tief ins (natürlich nur mit Kaffeesatz gefüllte) Glas geschaut haben? Weiter oben erwähnte ich, dass in unmittelbarer Nähe zur Wahl Unterschiede meistens marginal sind. Das gilt aber überhaupt nicht, wenn bis zum Wahltag noch etliche Monate oder gar Jahre vergehen. Wenn Institute hier, aus welchen Motiven auch immer, größere Dynamiken oder wechselnde Verrechnungsalgorithmen nutzen, ist die Lage eine andere.

Insbesondere die liberalen Allensbach-Höhenflüge im Frühjahr 2002 und die Forsa-Ergebnisse zu Grünen und SPD seit einigen Jahren lassen hier die Augenbraue heben.  Die Stimmung bis zum Wahltag kann sich noch massiv ändern, wer vermag zu sagen, dass Negativ- oder Positivrekorde zum jeweiligen Tag nicht doch zutrafen? Die Vermutung liegt nahe, dass hier ein paar Demoskopie-Spezialeffekte eingestreut werden, die natürlich größeren Nachrichtenwert erhalten, aber damit langfristig der Branche oder zumindest dem eigenen Institut eher schaden.

Ein Fazit

Wie so oft, ist das finale Ergebnis einer solchen Analyse ein Graustufengradient, bestenfalls schwarz-weiß gepunktet. Kein Institut hat ein Interesse daran, komplett unsinnige Studien zu veröffentlichen, die den Einsatz für zum Beispiel kommerzielle Marktforschung wertlos erscheinen lassen. Gleichzeitig möchten die Umfrageerhebenden im Gespräch bleiben, und die Nachrichtenseiten der Republik freuen sich natürlich über spektaluär niedrige/hohe Balken. In weitem Abstand zur Wahl gibt es gute Gründe, Forsa und Allensbach kritisch zu betrachten; doch je näher der eigentliche Urnengang rückt, desto mehr gleich sich Institute an und vermeiden oder begehen Fehler gleichzeitig.

Disclaimer: Ich bin seit 2009 Mitglied der Grünen und war von 2002/2003 bis 2009 bei der FDP.

Leave a Reply

Your email address will not be published. Required fields are marked *