Peilingen

Een peiling is een onderzoek waarbij je aan een steekproef uit een grote groep mensen op systematische wijze vragen stelt. Die vragen meten meningen, gedrag, feitelijke zaken of andere kenmerken van die mensen. Met de gegevens uit de steekproef kun je vervolgens uitspraken doen over de groep als geheel.

De groep waaruit je de steekproef trekt, noemen we de doelpopulatie. Je kunt de uitkomsten van de peiling alleen generaliseren naar de doelpopulatie als je de steekproef op een correcte manier hebt getrokken. Een verkeerde steekproef leidt tot verkeerde uitkomsten en dus verkeerde conclusies.

Voorbeeld: een politieke peiling

Een voorbeeld van een peiling is een politieke peiling in een gemeente naar aanleiding van gemeenteraadsverkiezingen. De doelpopulatie bestaat uit alle inwoners in een gemeente vanaf een leeftijd van 18 jaar. Alle stemgerechtigden dus. In zo’n onderzoek kun je vragen op welke partij de mensen denken te gaan stemmen.

Met de antwoorden kun je vervolgens schatten welk percentage mensen in de gemeente op die partij gaat stemmen.

Een steekproef trekken

Als je de mening of het gedrag van een groep in kaart willen brengen, dan ligt het op het eerste gezicht voor de hand om je vragen aan elk lid van de groep voor te leggen. Zo ging dat vroeger altijd. En zo gaat het nu nog steeds bij volkstellingen die in veel landen elke 10 jaar worden gehouden. Miljoenen mensen ondervragen kost echter veel tijd en geld. Daar komt ook nog bij dat veel mensen er niet van gediend zijn om voortdurend te worden lastig gevallen. Vandaar dat we nu meestal gebruik maken van steekproeven.

Om de problemen van een integraal onderzoek van een hele doelpopulatie te omzeilen, kun je een steekproef trekken. Als die steekproef een goede afspiegeling is van de doelpopulatie, dan kun je de uitkomsten van de peiling generaliseren naar de doelpopulatie. Dit is alleen mogelijk als de steekproef aan de volgende voorwaarden voldoet:

  • Je moet de mensen in de steekproef selecteren met een echt lotingsmechanisme.
  • Elke persoon in de doelpopulatie moet dezelfde kans hebben om in de steekproef getrokken te worden.
  • Al die selectiekansen moeten bekend zijn.
Een steekproef die door loting tot stand komt, noemen we ook wel een kanssteekproef. Als je met gelijke kansen loten, dan noemen we dat een aselecte steekproef.

Er zijn nog allerlei andere manieren om een steekproef te trekken. Als die steekproef niet voldoet aan bovenstaande twee voorwaarden, dan kun je de uitkomsten van de peiling niet generaliseren naar de doelpopulatie. Je kunt dan op geen enkele manier vaststellen hoe goed of slecht de uitkomsten zijn.

Schattingen maken

Met de gegevens uit de steekproef kun je allerlei kenmerken van de doelpopulatie schatten. Als je een aselecte steekproef hebt getrokken, dan is een percentage in de steekproef een goede schatting voor een percentage in de doelpopulatie. En een gemiddelde in de steekproef is een goede schatting voor het gemiddelde in de doelpopulatie.

Maar wat is eigenlijk een goede schatting? Schattingen voor een aselecte steekproef hebben twee belangrijke eigenschappen:

  • De schattingen zijn zuiver. Als je het onderzoek een heleboel keer zou herhalen, dan zullen die schattingen gemiddeld uitkomen op de waarde in de doelpopulatie die je wilt schatten. De schattingen zijn dus gemiddeld goed. Er is geen systematische onder- of overschatting.
  • De omvang van de steekproef bepaalt de precisie van de schatting. De precisie geeft aan hoeveel variatie er in de mogelijk uitkomsten kan zitten. Naarmate de omvang van de steekproef groter is, zullen de schattingen preciezer zijn.
Er bestaat geen verband tussen de precisie van een schatting en de omvang van de doelpopulatie. Het is dus niet zo dat je voor een grotere populatie een grotere steekproef nodig hebt om dezelfde precisie te bereiken.

Demonstratie: Verkiezingen in Samplona

Aan de hand van een demonstratie laten we zien wat de invloed van de steekproefomvang is op de precisie van een schatting. We gaan daarvoor naar de denkbeeldige gemeente Samplona.

De lokale verkiezingen staan voor de deur in Samplona. Vooral de Nationale Ouderen Partij (NOP) lijkt veel aanhang te hebben. In een opinieonderzoek schatten we hoeveel procent van de kiezers gaat stemmen op die partij. Om een idee te krijgen van hoe goed of slecht de schattingen kunnen zijn, herhalen we het trekken van de steekproef een groot aantal malen. Voor elke steekproef opnieuw berekenen we het percentage stemmers op de NOP. Zo krijgen we een hele reeks schattingen. Daarmee bouwen we een histogram op.

Van al die schattingen berekenen we het gemiddelde. Als dit gemiddelde dicht in de buurt ligt van het werkelijke gemiddelde in de hele doelpopulatie (25,4%), dan is het steekproefpercentage een zuivere schatter.

Van al die schattingen kun je ook de standaardfout uitrekenen. Dit is een maat voor de variatie in de mogelijk uitkomsten. Je zult zien dat die standaardfout kleiner is (en de schatter dus preciezer) als de steekproefomvang groter is.

Voordat je begint met trekken van steekproeven, moet je eerst de omvang van de steekproef instellen. Dat kan door klikken op het groene vierkantje onder Steekproef. Na elke keer klikken verschijnt een andere waarde. Er kan worden gekozen uit een steekproefomvang van 200, 400 of 800. Je start het trekken van de steekproeven door te klikken op het groene vierkantje bij Start.

Je zult zien dat al die schattingen geconcentreerd liggen rondom het werkelijke populatiepercentage. De schattingen zijn niet systematisch te hoog of te laag. De schatter is dus zuiver. Je zult ook zien dat de schattingen dichter bij de te schatten waarde liggen naarmate de omvang van de steekproef groter is.

Onzekerheidsmarges

Met de gegevens uit een steekproef kun je schattingen maken van allerlei kenmerken in de doelpopulatie. Een schatting komt nooit exact overeen met de waarde in de doelpopulatie. Hij kan er wel dicht in de buurt liggen. Maar wat is dicht in de buurt?

Omdat je loot bij het trekken van de steekproef, kun je de theorie van de kansrekening toepassen. Die zegt dat grootheden als het steekproefgemiddelde en het steekproefpercentage bij benadering een zogenaamde normale verdeling hebben. Dit betekent dat je kunt uitrekenen hoe ver je schatting maximaal kan afwijken van de werkelijke waarde. Die maximale afwijking noemen we de onzekerheidsmarge.

Met de onzekerheidsmarge kun je ook een betrouwbaarheidsinterval bepalen. Dat interval heeft een ondergrens en een bovengrens. Daartussen ligt de werkelijke waarde in de doelpopulatie met een zeer grote waarschijnlijkheid. Meestal wordt voor die waarschijnlijkheid een waarde van 95% genomen. Zo krijgt je dan het 95%-betrouwbaarheidsinterval. Je kunt dan zeggen dat met 95% zekerheid de werkelijke waarde in het interval zal liggen.

Voorbeeld: schatting van het percentage stemmers op de NOP

Om te bepalen hoeveel mensen naar een lokale omroep luisteren, trekken we een steekproef van 1000 inwoners. Het blijkt dat 25,0% van de kiezers in de steekpoef op de NOP gaat stemmen. Het bijbehorende 95%-betrouwbaarheidsinterval heeft dan een ondergrens van 22,3% en een bovengrens van 27,7%. Dat betekent dat met een zeer grote waarschijnlijkheid het percentage stemmers in de gehele populatie zal liggen tussen de 22,3% en 27,7%.

Er is een direct verband tussen de breedte van het betrouwbaarheidsinterval en de omvang van de steekproef. Naarmate de steekproef groter is, zal het betrouwbaarheidsinterval kleiner zijn. De schatting is dan dus preciezer.

Bij het publiceren van de uitkomsten van een peiling is het belangrijk om niet alleen schattingen te vermelden maar ook de onzekerheidsmarges. Daarmee krijgen de gebruikers een duidelijk beeld van de precisie van de cijfers.

Voorbeeld: Mening over de oorlog Irak

In een opinieonderzoek op 17 maart 2003 werd aan een steekproef van 776 Amerikanen (telefonische) gevraagd of ze het eens waren met de oorlogsverklaring van Amerika aan Irak. 665 personen waren het er mee eens.

sampling

Naast de cijfers wordt ook de onzekerheidsmarge vermeld (sampling error). Deze is gelijk aan 4,5%. Dit betekent dat het betrouwbaarheidsinterval loopt van 61,5% tot 70,5%. We kunnen dus concluderen dat het aantal voorstanders in de populatie met grote waarschijnlijkheid zal liggen tussen 61,5% en 70,5%.