Peilingen voor de presidentsverkiezingen in Frankrijk in 2022

Op 24 april 2022 waren er weer presidentsverkiezingen in Frankrijk. De eerste ronde werd gewonnen door Emmanuel Macron. En Marine Le Pen eindigde op de tweede plaats. Dus namen zij het in de tweede ronde tegen elkaar op. De verschillen tussen beide kandidaten waren klein. Het was spannend. Macron leek in de peilingen een kleine voorsprong te hebben. Hoe goed waren die peilingen? Tijd voor een andere analyse.

De tabel hieronder bevat de uitkomsten en andere gegevens van elf peilingen die in de laatste dagen voor de verkiezingsdag werden gehouden. Na 23 april is niet meer gepeild. De peilers zijn eensgezind in hun prognose van de winnaar. Ze voorspellen allemaal dat Macron gaat winnen. Bij negen van de elf peilingengen is het verschil met Le Pen minstens 10%. Het verschil is alleen wat minder groot (6%) bij de peilingen van Odoxa en AtlasIntel.

Op Wikipedia is meer informatie te vinden over de methodologische opzet en uitvoering van de peilingen. Daaruit blijkt dat de omvang van de steekproef in de meeste gevallen ligt tussen de 1.400 en 3.100 personen. Dat zijn behoorlijk grote steekproeven. Alleen de peiling van Ipsos op 22 april wijkt af (in positieve zin). Die peiling heeft een omvang van meer dan 12.000 personen. Dat leidt overigens niet tot een wezenlijk andere prognose.

Als je de methodologische informatie over de peilingen nader bekijkt, dan valt het op dat alle peilingen in bovenstaande tabel op dezelfde manier zijn opgezet en uitgevoerd. Alle peilingen zijn online peilingen. En voor geen enkele peiling is een aselecte steekproef getrokken. Steekproeven zijn gevormd op basis van zelfselectie. Soms krijgen de respondenten een kleine financiƫle beloning.

Om de steekproeven toch zoveel mogelijk representatief te maken, gebruiken de peilers quota-steekproeven. Ze verdelen de populatie van Franse kiezers op basis van de variabelen geslacht, leeftijdsklasse, sociaaleconomische groep, mate van verstedelijking en regio in groepen. Het INSEE, het Franse CBS, weet precies hoe de verdeling van de bevolking over deze groepen is. De peilers zetten vervolgens de steekproef zo in elkaar dat de verdeling over de groepen in de steekproef overeenkomt met de verdeling in de hele bevolking. Het gaat er dus om dat de steekproef-quota de juiste omvang krijgen.

In de meeste gevallen voeren de peilers ook nog een weging uit op de verzamelde gegevens. Daarmee kunnen ze eventueel nog corrigeren voor een gebrek aan representativiteit (bijvoorbeeld als gevolg van oververtegenwoordiging of ondervertegenwoordiging van bepaalde groepen in de steekproef).

Omdat de peilingen in de tabel allemaal op dezelfde manier zijn opgezet en uitgevoerd, is het niet zo verbazingwekkend dat de prognoses elkaar niet veel ontlopen. Alle schattingen voor Macron liggen tussen 53% en 57%.

De uiteindelijke verkiezingsuitslag was dat Macron 58,55% van de stemmen kreeg (en Le Pen 41,45%). Macron kreeg dus 17,1 procentpunten meer dan Le Pen. Als je de werkelijke uitslag vergelijkt met de prognoses, dan moet je tot de conclusie komen dat alle prognoses te laag uitvielen. Het verschil varieerde tussen de 2 en de 6 procentpunten.

Als je ervan mag uitgaan dat de steekproef lijkt op een aselecte steekproef, dan kun je onzekerheidsmarges uitrekenen. Dat is gedaan in de grafiek hieronder. De blauwe punten geven de prognoses (voor Macron) aan en de blauwe lijnstukken de onzekerheidsmarges. De rode verticale lijn geeft de werkelijke verkiezingsuitslag voor Macron weer (58,55%).

Bij negen van de elf peilingen is de prognose significant lager dan de werkelijke uitslag. In die gevallen zaten de peilers er dus naast (al waren de verschillen niet heel groot).
Het lijkt erop dat de peilingen allemaal dezelfde afwijking naar beneden hadden. Wat zou daarvan de reden kunnen zijn? Een mogelijk oorzaak zou de wijze van peilen kunnen zijn. Die was dezelfde bij alle peilers. In alle gevallen werden uitgegaan van een quota-steekproef in plaats van een aselecte steekproef. Alle peilingen hadden dus hetzelfde probleem.

In een andere mogelijke oorzaak voor de systematische afwijking was dat wellicht veel Fransen aarzelden of ze zouden gaan stemmen, en als ze al gingen stemmen, ze nog aarzelden over de kandidaat op wie ze zouden gaan stemmen. Dit kan ertoe geleid hebben dat veel kiezers op het laatste moment, dus na de laatste peilingen, nog van mening veranderden.

We kunnen concluderen dat de uitkomsten van de Franse peilingen een (kleine) systematische afwijking hadden. Het zou mooi zijn als nog eens uitgezocht kon worden waaraan dit precies ligt.

Zaten de peilingen misschien niet goed in elkaar? Of is het bijzonder lastig om van te voren het stemgedrag van de kiezers te meten en prognoses te maken? Zijn peilingen slechts momentopnames die niet de toekomst kunnen voorspellen?