Peilingen

Een peiling is een onderzoek waarbij je aan een steekproef uit een grote groep mensen op systematische wijze vragen stelt. Die vragen meten meningen, motieven, gedrag of andere kenmerken van die mensen. Met de gegevens uit de steekproef kun je vervolgens uitspraken doen over de hele groep.

De groep waaruit je de steekproef trekt, noemen we de doelpopulatie. Je kunt de uitkomsten van de peiling alleen generaliseren naar de doelpopulatie als je de steekproef op een correcte manier hebt getrokken. Een foute steekproef leidt tot verkeerde uitkomsten en dus verkeerde conclusies.

Voorbeeld: een luisteronderzoek

Een voorbeeld van een peiling is een luisteronderzoek van een lokale omroep. De doelpopulatie bestaat uit alle inwoners in een gemeente vanaf een zekere leeftijd (bijvoorbeeld vanaf 13 jaar). In zo’n onderzoek kun je vragen of mensen wel eens naar de lokale omroep luisteren en hoeveel uur per week ze dan luisteren.

Met de antwoorden kun je vervolgens schatten welk percentage mensen in de gemeente wel eens naar de omroep luistert en hoeveel uur ze gemiddelde luisteren.

Een steekproef trekken

Als je de mening of het gedrag van een groep in kaart willen brengen, dan ligt het op het eerste gezicht voor de hand om je vragen aan elk lid van de groep voor te leggen. Zo ging dat vroeger altijd. En zo gaat het nu nog steeds bij volkstellingen die in veel landen elke 10 jaar worden gehouden. Miljoenen mensen ondervragen kost echter veel tijd en geld. Daar komt ook nog bij dat veel mensen er niet van gediend zijn om voortdurend te worden lastig gevallen. Vandaar dat we nu meestal gebruik maken van steekproeven.

Om de problemen van een integraal onderzoek van een hele doelpopulatie te omzeilen, kun je een steekproef trekken. Als die steekproef een goede afspiegeling is van de doelpopulatie, dan kun je de uitkomsten van de peiling generaliseren naar de doelpopulatie. Dit is alleen mogelijk als de steekproef aan twee voorwaarden voldoet:

  • Je moet de mensen in de steekproef selecteren met een echt lotingsmechanisme.
  • Elke persoon in de doelpopulatie moet dezelfde kans hebben om in de steekproef getrokken te worden.
Een steekproef die door loting tot stand komt, noemen we ook wel een kanssteekproef. Als we met gelijke kansen loten, dan noemen we dat een aselecte steekproef.

Er zijn nog allerlei andere manieren om een steekproef te trekken. Als die steekproef niet voldoet aan bovenstaande twee voorwaarden, dan kun je de uitkomsten van de peiling niet generaliseren naar de doelpopulatie. Je kunt dan op geen enkele manier vaststellen hoe goed of slecht de uitkomsten zijn.

Schattingen maken

Met de gegevens uit de steekproef kun je allerlei kenmerken van de doelpopulatie schatten. Als je een aselecte steekproef hebt getrokken, dan is een percentage in de steekproef een goede schatting voor een percentage in de doelpopulatie. En een gemiddelde in de steekproef is een goede schatting voor het gemiddelde in de doelpopulatie.

Maar wat is eigenlijk een goede schatting? Schattingen voor een aselecte steekproef hebben twee belangrijke eigenschappen:

  • De schattingen zijn zuiver. Als je het onderzoek een heleboel keer zou herhalen, dan zullen die schattingen gemiddeld uitkomen op de waarde in de doelpopulatie die je wilt schatten. De schattingen zijn dus gemiddeld goed. Er is geen systematische onder- of overschatting.
  • De omvang van de steekproef bepaalt de precisie van de schatting. De precisie geeft aan hoeveel variatie er in de mogelijk uitkomsten kan zitten. Naarmate de omvang van de steekproef groter is, zullen de schattingen preciezer zijn.
Er bestaat geen verband tussen de precisie van een schatting en de omvang van de doelpopulatie. Het is dus niet zo dat je voor een grotere populatie een grotere steekproef nodig hebt om dezelfde precisie te bereiken.

Demonstratie: Verkiezingen in Samplonië

Aan de hand van een demonstratie laten we zien wat de invloed van de steekproefomvang is op de precisie van een schatting. We gaan daarvoor naar het denkbeeldige land Samplonië.

De verkiezingen staan voor de deur in Samplonië. Vooral de Nationale Ouderen Partij (NOP) lijkt veel aanhang te hebben. In een opinieonderzoek schatten we hoeveel procent van de kiezers gaat stemmen op die partij. Om een idee te krijgen van hoe goed of slecht de schattingen kunnen zijn, herhalen we het trekken van de steekproef een groot aantal malen. Voor elke steekproef opnieuw bepalen we het percentage stemmers op de NOP. Zo krijgen we een hele reeks schattingen. Daarvan bouwen we een histogram op.

Van al die schattingen berekenen we het gemiddelde. Als dit gemiddelde dicht in de buurt ligt van het werkelijke gemiddelde in de hele doelpopulatie (25,4) ligt, dan is het steekproefpercentage een zuivere schatter.

Van al die schattingen kun je ook de standaardfout uitrekenen. Dit is een maat voor de variatie in de mogelijk uitkomsten. Je zult zien dat die variatie kleiner is (en de schatter dus preciezer) als de steekproefomvang groter is.

Voordat je begint met trekken van steekproeven, moet je eerst de omvang van de steekproef instellen. Dat kan door klikken op het groene vierkantje onder Steekproef. Na elke keer klikken verschijnt een andere waarde. Er kan worden gekozen uit een omvang van 200, 400 of 800. Je start het trekken van de steekproeven door klikken op het groene vierkantje bij Start.

Onzekerheidsmarges

Met de gegevens uit een steekproef kun je schattingen maken van allerlei kenmerken in de doelpopulatie. Een schatting komt nooit exact overeen met de waarde in de doelpopulatie. Hij kan er wel dicht in de buurt liggen. Maar wat is dicht in de buurt?

Omdat je loot bij het trekken van de steekproef, kun je de theorie van de kansrekening toepassen. Die zegt dat grootheden als het steekproefgemiddelde en het steekproefpercentage bij benadering een zogenaamde normale verdeling hebben. Dit betekent dat je kunt uitrekenen hoe ver je schatting maximaal kan afwijken van de werkelijke waarde. Die maximale afwijking noemen we de onzekerheidsmarge.

Met de onzekerheidsmarge kun je ook een betrouwbaarheidsinterval bepalen. Dat interval heeft een ondergrens en een bovengrens. Daartussen ligt de werkelijke waarde in de doelpopulatie met een zeer grote waarschijnlijkheid. Meestal wordt voor die waarschijnlijkheid een waarde van 95% genomen. Zo krijgt je dan het 95%-betrouwbaarheidsinterval. Je kunt dan zeggen dat met 95% zekerheid de werkelijke waarde in het interval zal liggen.

Voorbeeld: schatting van het percentage luisteraars

Om te bepalen hoeveel mensen naar een lokale omroep luisteren, trekt je een steekproef van 1000 inwoners. Het blijkt dat 30% daarvan regelmatig naar de lokale omroep luistert. Het bijbehorende 95%-betrouwbaarheidsinterval heeft dan een ondergrens van 27% en een bovengrens van 33%. Dat betekent dat met een zeer grote waarschijnlijkheid het percentage luisteraars in de gehele populatie zal liggen tussen de 27% en 33%.

Er is een direct verband tussen de breedte van het betrouwbaarheidsinterval en de omvang van de steekproef. Naarmate de steekproef groter is, zal het betrouwbaarheidsinterval kleiner zijn. De schatting is dan dus preciezer.

Bij het publiceren van de uitkomsten van een peiling is het belangrijk om niet alleen schattingen te vermelden maar ook de onzekerheidsmarges. Daarmee krijgen de gebruikers een duidelijk beeld van de precisie van de cijfers.

Voorbeeld: Mening over de oorlog Irak

In een opinieonderzoek op 17 maart 2003 werd aan een steekproef van 776 Amerikanen (telefonische) gevraagd of ze het eens waren met de oorlogsverklaring van Amerika aan Irak. 665 personen waren het er mee eens.

sampling

Naast de cijfers wordt ook de onzekerheidsmarge vermeld (sampling error). Deze is gelijk aan 4,5%. Dit betekent dat het betrouwbaarheidsinterval loopt van 61,5% tot 70,5%. We kunnen dus concluderen dat het aantal voorstanders in de populatie met grote waarschijnlijkheid zal liggen tussen 61,5% en 70,5%.