Wegen

Er zijn allerlei verschijnselen die de representativiteit van een peiling kunnen aantasten. Door non-respons, onderdekking en zelfselectie is de steekproef dan geen goede afspiegeling meer van de doelpopulatie. Daardoor trek je de verkeerde conclusies uit de peiling. Om dit te voorkomen moet je proberen de uitkomsten van de peiling te corrigeren.

Een veel toegepaste methode om de uitkomsten van de peiling te corrigeren is het uitvoeren van een weegprocedure. Die kent aan elke respondent een gewicht toe. Personen in groepen die ondervertegenwoordigd zijn in de steekproef, krijgen een gewicht groter dan 1. Daardoor tellen ze zwaarder mee. En personen in oververtegenwoordigde groepen krijgen een gewicht kleiner dan 1. Daardoor tellen ze minder zwaar mee. Voor het berekenen van de percentages tel je daarna niet meer simpelweg de personen in de diverse groepen op. In plaats daarvan tel je de bijbehorende gewichten op.

Hulpvariabelen

Het uitvoeren van een weging staat of valt met de beschikbaarheid van geschikte hulpvariabelen. Dat zijn variabelen die je hebt gemeten in de steekproef en waarvoor ook de verdeling in de doelpopulatie bekend is. Voorbeelden van dit soort variabelen zijn geslacht, leeftijd, burgerlijke staat en provincie. Als het om landelijke peilingen gaat, kan bijvoorbeeld het Centraal Bureau voor de Statistiek de verdeling van dit soort variabelen in de doelpopulatie leveren.

Door de procentuele verdeling van een hulpvariabele in de steekproef te vergelijken met die in de doelpopulatie, kun je nagaan of de respons representatief is met betrekking tot deze hulpvariabele. Zijn er grote verschillen tussen de verdeling in de respons en de verdeling in de doelpopulatie, dan moeten we concluderen dat de steekproef, althans voor deze variabele, niet representatief is. Het is dan zinvol deze hulpvariabele in de weging te gebruiken.

Wegen met één hulpvariabele

Om wegen met één hulpvariabele te illustreren, geven we een eenvoudig voorbeeld. In een online-peiling vragen we naar de leeftijd van de respondenten. Omdat we de verdeling van de leeftijd in de gehele bevolking kennen, kunnen we de verdelingen in de steekproef vergelijken met de verdeling in de doelpopulatie.

Stel dat de steekproef voor 60% uit jongeren, voor 30% uit mensen van middelbare leeftijd en voor 10% uit ouderen bestaat. Die percentages zijn duidelijk anders in de gehele doelpopulatie. Zo bestaat de doelpopulatie voor 30% uit jongeren. Die jongeren zijn dus duidelijk oververtegenwoordigd in het onderzoek. We kunnen concluderen dat het onderzoek niet representatief is met betrekking tot leeftijd.

We kunnen nu de steekproef representatief maken met betrekking tot de variabele leeftijd door de jongeren een gewicht te geven dat gelijk is aan

30,0 / 60,0= 0,500

Je krijgt dit gewicht dus door het populatiepercentage (30%) te delen door het bijbehorende steekproefpercentage (60%). Voor personen van middelbare leeftijd wordt het gewicht dan

50,0 / 30,0 = 1,667

En het gewicht voor de ouderen wordt

20,0 / 10,0 = 2,000.

Dat de jongeren een gewicht kleiner dan 1 krijgen, is niet verwonderlijk. Ze zijn immers oververtegenwoordigd in de steekproef. In feite telt na weging elke jongere in de steekproef nog maar mee voor een halve jongere. Ouderen zijn ondervertegenwoordigd en krijgen een gewicht groter dan 1. Elke oudere in de steekproef telt mee voor twee ouderen.

Zouden we nu op grond van de (gewogen) steekproef het percentage jongeren willen schatten, dan vinden we

0,500 x 60% = 30%

en dat is precies het percentage jongeren in de populatie. Evenzo komen de schattingen voor de andere leeftijdscategorieën precies goed uit. De gewogen steekproef is dus representatief met betrekking tot de variabele leeftijd.

Wegen met twee hulpvariabelen

Zijn er meer hulpvariabelen, dat wordt de zaak ingewikkelder. Ook dan kunnen we indeling in groepen maken op basis van de hulpvariabelen. Hebben we één hulpvariabele, dan zijn er evenveel groepen als de hulpvariabele categorieën heeft. Bijvoorbeeld: bij de variabele geslacht zijn er twee groepen: mannen en vrouwen. Bij gebruik van meer variabelen is het aantal groepen het product van de aantallen categorieën per variabele.

Stel we hebben ook nog de beschikking over de hulpvariabele leeftijd in drie categorieën (jong, middelbaar en oud). Dan is er bij wegen naar de hulpvariabelen leeftijd en geslacht een groep voor elke combinatie van leeftijd en geslacht. Er zijn dus 2 x 3 = 6 groepen: jonge mannen, middelbare mannen, oude mannen, jonge vrouwen, middelbare vrouwen en oude vrouwen. Kennen we nu de procentuele verdeling in de populatie over de aldus gevormde groepen, dan kunnen we voor elke groep een gewicht bepalen.

We hebben nu bereikt dat de steekproef representatief is geworden met betrekking tot zowel leeftijd als geslacht. Sterker nog, de steekproef is ook representatief voor geslacht binnen elke leeftijdscategorie en, omgekeerd, voor leeftijd binnen elk geslacht.

Wegen met nog meer hulpvariabelen

Het is belangrijk om zoveel mogelijk hulpvariabelen te gebruiken, want dan wordt de steekproef in zoveel mogelijk opzichten representatief. En als de steekproef representatief is met betrekking tot heel veel hulpvariabelen, dan zal hij misschien ook wel steeds meer representatief zijn met betrekking tot de doelvariabelen van het onderzoek (de variabelen waar het onderzoek in wezen over gaat).