Nein, kein Schreibfehler, nein, es soll nicht „herumfragen“ heißen, auch wenn sich die Sache für manchen so anfühlen mag. Mit „Umfragen“ sind gemeint: Techniken zur Feststellung der Anzahl von Meinungen, Wertvorstellungen, Verhalten in der Bevölkerung. Diese Techniken gehören zur Empirischen Sozialforschung, gelegentlich auch als Demoskopie bezeichnet.
Erstaunlich, was diese Technik kann. Dass von 66 000 000 (sechsundsechzig Millionen) Erwachsenen in Deutschland 13 000000 (dreizehn Millionen) nicht an Gott glauben, weiß man mit ziemlicher Gewissheit, wenn man nur 1 000 (tausend) Erwachsene danach fragt.
Hokuspokus? Nein, Wissenschaft, nämlich die von der Stichprobe. Und da hat man etwas Verwunderliches gefunden, was jeder Suppenkoch intuitiv weiß: Die Größe des Löffels zum Probieren hängt nicht von der Größe des Suppentopfes ab. Ob 10, 100 oder 1000 Liter Suppe, der normale Suppenlöffel reicht zum Probieren aus. Es muss nicht die Kelle sein, aber ein Teelöffel reicht dann auch nicht. Irgendwo zwischen Teelöffel und Kelle gibt es eine optimale Probierlöffelgröße, die auch beim größten Topf zuverlässig den Salzgeschmack zu prüfen erlaubt: der Suppenlöffel. Die Prüfung wird nicht besser, wenn wir den Löffel zur Kelle aufblasen. Sie wird nur kostspieliger, weil wir mehr Suppe zum Probieren herausnehmen. Geil, gell!
Für die Umfrage hat man herausgefunden, dass die ausreichende Probiergröße etwa 1000 Leute umfasst, wenn man die per Zufall aussucht (https://www.surveymonkey.com/curiosity/how-many-people-do-i-need-to-take-my-survey/)
Und so macht man das dann, theoretisch.
Praktisch geht das nicht so leicht. Weil, ja weil die Welt kein gut umgerührter Suppentopf ist. In der gesellschaftlichen Wirklichkeit klebt ein Teil am Boden, ein anderer am Rand, Brocken schwimmen unregelmäßig herum, ein Teil flutscht immer vom Löffel, kurz: Nichts ist homogen oder gleichförmig, sondern bestenfalls geschichtet oder geklumpt. Eine ziemlich trübe Brühe diese Wirklichkeit.
Wieso sagen die Wahlprognostiker dann doch so oft ein Wahlergebnis ordentlich voraus und wieso geht das Geschäft dann wieder mal voll daneben? Im Prinzip ist es wie beim Suppenkochen: die erste glückt oft nicht, mit der Zeit bekommt man Erfahrung und mischt die Zutaten immer besser. Versalzen wird sie dann nur noch im Liebesfall oder durch Schlamperei. So geht das auch bei den Wahlen. Nach 50 und mehr Wahlen in einem Land weiß man, wo die roten, grünen, schwarzen, gelben, blauen und blöden Klumpen sind und korrigiert seine Daten entsprechend. Ein guter Statistiker überlässt wenn nur irgend möglich nichts dem Zufall. Deshalb steckt er alles Wissen über frühere Wahlen in ihre Stichprobe – dass bestimmte Wahlkreise typisch sind, dass alle großen Städte eingeschlossen werden, kein Bundesland vergessen wird und so weiter. Erst ganz zum Schluss, wenn man sich zwischen verschiedenen Haushalten in einer Straße oder einem Stadtteil entscheiden muss, wird gelost. Das nennt sich „geschichtete Stichprobe“ – in ihr ist die ganze Wahl-Geschichte des Landes berücksichtigt. Aber das reicht nicht. Denn an zwei weiteren Stellen kommt die Wirklichkeit der Wahlforschung in die Quere. Die erste sind wir Bürger. Nicht immer haben wir Zeit, uns befragen zu lassen. Also nehmen von 1000 ausgewählten Haushalte nicht alle Teil. Das wäre nicht so schlimm, wenn man ganz einfach diejenigen, die keine Zeit für Umfragen haben, durch solche ersetzt, die Zeit haben. Aber, oh weh, woher weiß ich, ob beide Gruppen das gleiche Wahlverhalten haben? Bis heute gibt es kein allgemeingültiges System, wie man damit vernünftig umgeht. Und wieder sind wir in der Suppenküche: Die erfahrene Köchin greift in ihre Trickkiste (geheim, natürlich) und macht die Suppe essbar, so Gott will. In der Wahlforschung nennt sich das verharmlosend „gewichten“. Wenn das mehr oder weniger gelungen ist, dann kommt dem Forscher das Wahlrecht in die Quere. In Amerika ist das zum Beispiel die von Bundestaat zu Bundestaat unterschiedliche Art die Wahlpersonen (Wahlmänner) zu bestimmen. Bekanntlich hatte Trump bei seiner letzten Wahl 3 000 000 (drei Millionen) Stimmen weniger, am Schluß aber die Mehrheit der Wahlpersonen. In Deutschland sind das die Überhangmandate, die erst nach der Wahl berechnet werden. Damit ist die Zahl der Parlamentssitze vor der Wahl unbekannt. Wenn sich da viel tut, können Effekte wie bei der Trump-Wahl auftreten. Unglaublich, wie die Wahlforschung auch das so oft in den Griff bekommt, es sei denn…
Es sei denn sie stolpert über ihre eigenen Füße, meistens als „Geiz ist geil“ Effekt. Irgendwann mal wurde in England wieder ein Kopf-an-Kopf-Rennen ausgerufen (verkauft sich besser in der Zeitung), wobei Labour mit einer Kopflänge in den Umfragen voran lag (zur Kopflänge kommen wir noch mal am Schluss). Geizig wie die Engländer sind, sparten viele Umfrager es sich, an der Haustür zu klingeln und zu warten bis eine aufmacht. War es doch einfacher die Leute auf der Straße anzusprechen. Dummerweise gingen im Winter weniger ältere Leute auf die Straße. Blöd, dass die eher konservativ wählten. Das gab dann auch eine heftige Bruchlandung für die Wahlforschung. Die Trump-Wahl dagegen war ein Beispiel für gesellschaftliche Veränderungen, die der bisherigen Wahlgeschichte eine andere Wendung gaben. Hier war es nicht nur der Geiz, sondern die festgefressene Borniertheit der Forscher. Sie haben die beobachtbaren Veränderungen „weggewichtet“, anders gesagt, Demoskopen, die den Kontakt zur Bevölkerung verloren hatten, machten sich selber blind.
Um das Wunder der zutreffenden Wahlprognose zu einem Superwunder zu machen, müssen wir uns noch kurz die Pferdekopflängen betrachten. Wie jeder weiß oder gleich wissen wird, gibt es keine absolut „richtige“ Messung. Beim Bau genügt beispielsweise der Faltmeter, beim Computerbau braucht man das Rastermikroskop. In der Umfrageforschung handelt man mit Ungenauigkeiten von 3-5% (sehr hoffnungsvoll, übrigens). Will heißen, dass die eingangs erwähnten 13 Millionen eigentlich plus/minus 650 000 lauten sollte. Oder in Prozenten ausgedrückt: In Deutschland 2018 zwischen 15 und 25 Prozent der Erwachsenen nicht an Gott glauben. Übertragen auf die Wahlforschung bedeutet dies, dass eine Aussage „die SPD liegt 2 Prozent vor der AfD“ bei der bekannten statistischen Ungenauigkeit Unsinn ist.
Fassen wir zusammen: Von der schlichten Idee der Suppenstichprobe bis zur Ungenauigkeit aller statischen Messungen ist es ein weiter, steiniger Weg. Das Superwunder der Umfrageforschung ist: Sie irrte sich relativ selten. Leider zu oft, wenn es wichtig wird.
Peter Mohler
Neueste Kommentare