Amt für Statistik Berlin-Brandenburg

Case Study: Repräsentative Wahl­statistik für Bundes­tags­wahl mit FormPro

Bei allen Bundestags- und Landtagswahlen in Deutschland werden in ausgewählten Wahlbezirken spezielle Stimmzettel mit vorgedruckten Angaben zu Geschlecht und Altersgruppe ausgegeben. Die Auswertung dieser Merkmale in Kombination mit den angekreuzten Erst- und Zweitstimmen ermöglicht die Repräsentative Wahlstatistik und gibt Aufschluss über das Wahlverhalten verschiedener Bevölkerungsgruppen. Durch die Beschränkung auf ausreichend große Wahlbezirke wird dabei sichergestellt, dass die Anonymität der Wähler gewahrt bleibt.

Erstmals wurden wir 2017 vom Amt für Statistik Berlin-Brandenburg mit der Auszählung von 147.000 Stimmzetteln für diese beiden Bundesländer beauftragt. Weitere Aufträge folgten 2019 für die Europawahl sowie die Landtagswahl in Brandenburg. Bei der Bundestagswahl 2021 konnten wir mit Sachsen-Anhalt und dem Saarland zwei weitere Bundesländer hinzugewinnen. Innerhalb von vier Wochen scannten wir insgesamt 250.000 Stimmzettel und erfassten deren Aufdrucke und Ankreuzungen mit unserer Software FormPro.

Stimmzettel der Bundestagswahl 2021

Eine besondere Herausforderung beim Scannen der Stimmzettel ist deren außergewöhnliche Länge. Je nach Bundesland und Wahlbezirk kann sie bis zu 90 cm betragen! Damit ist natürlich die Einzugsmechanik handelsüblicher Dokumentenscanner heillos überfordert, da sie meist auf A3-Dokumente im Querformat ausgelegt ist. A0-Scanner für Technische Zeichnungen wiederum sind viel zu langsam und können stets nur ein Blatt auf einmal einziehen.
Nach vielen mühsamen Versuchen fanden wir schließlich mit dem Canon DR-G2110 einen leistungsstarken und äußerst robusten Scanner. In Ergänzung mit einem von uns entwickelten “Doppelstockeinzug” ist dieses Gerät in der Lage, Stapel von 250 oder mehr Stimmzetteln hintereinanderweg einzuziehen und mit etwas manueller Hilfe auch halbwegs geordnet wieder auszugeben.

Den Rest der Arbeit erledigt FormPro fast schon routinemäßig. Die Stimmzettel werden ungeachtet ihrer Länge ausgerichtet und mit der Leervorlage in Übereinstimmung gebracht. Danach liest die OCR in der rechten oberen Ecke den Aufdruck mit dem Geschlecht und der Altersgruppe. Eventuelle Erkennungsfehler gleicht ein spezielles Add-On aus, das sich Redundanzen in den Formulierungen zu Nutze macht.
Die Auswertung der angekreuzten Erst- und Zweitstimmen ist für FormPro relativ einfach, da pro Spalte nur ein Kreuz gesetzt sein darf. Ungültige Stimmzettel mit fehlenden oder überzähligen Ankreuzungen wurden bereits bei der Handauszählung am Wahltag identifiziert und ans Stapelende sortiert. Nichtsdestotrotz unterziehen wir alle unplausiblen Stimmzettel noch einmal einer visuellen Prüfung.
Als Ergebnis gibt FormPro eine CSV-Datei in einem vom Statistikamt vorgegebenen Format aus.