Zijn er echt minder dan een half miljoen werklozen?
Voor het eerst sinds begin 2012 is de werkloosheid weer onder de half miljoen uitgekomen. Het aantal werklozen bedroeg in november 499 duizend. Daarmee was 5,6 procent van de beroepsbevolking werkloos. Dat was het bericht waarmee het Centraal Bureau voor de Statistiek (CBS) op 15 december 2016 naar buiten kwam. Veel media namen het bericht over. Helaas klopt het bericht niet. Je kunt uit de CBS-cijfers niet concluderen dat het aantal werklozen onder de half miljoen ligt.
Hoe komt het CBS aan het cijfer van 499 duizend werklozen? Met enig gezoek op de website van het CBS kun je reconstrueren hoe dit cijfer tot stand is gekomen. Aan de basis staat de EnquĂȘte Beroepsbevolking (EBB). Dat is een peiling die elke maand opnieuw wordt uitgevoerd. De omvang van de steekproef bedraagt steeds 30.000 personen. Met de uitkomsten van de EBB kun je het aantal werklozen schatten.
Op grond van de cijfers van november 2016 bestond de beroepsbevolking uit 9 miljoen personen, waarvan er 8,965 miljoen werk hadden en 0,499 miljoen werkloos waren. Dit komt neer op een werkloosheidspercentage van 5,6%.
Zoals gezegd, deze cijfers zijn verkregen op basis van een steekproef uit de bevolking. Daarom hebben de cijfers een onzekerheidsmarge. Volgens het CBS zit die steekproef nogal ingewikkeld in elkaar. Daardoor is het niet zo eenvoudig om die onzekerheidsmarges uit te rekenen. In de documentatie van de EBB staat echter een tabel waaruit je kunt aflezen dat de onzekerheidsmarge voor de 499 duizend werklozen ongeveer gelijk is aan 19.700. Dat betekent dat je hooguit de conclusie kunt trekken dat het aantal werklozen met grote waarschijnlijkheid tussen de 479 duizend en 519 duizend ligt. Je kunt hieruit dus niet de conclusie trekken dat het aantal werklozen onder de half miljoen ligt.
Ook al is een steekproef op een ingewikkelde manier getrokken, dan kun je toch nog als een soort eerste benadering doen alsof het een simpele aselecte steekproef met gelijke kansen is. Dan kun je een simpele formule gebruiken voor het berekenen van de onzekerheidsmarge van een percentage:
Hierin is p het in de steekproef gevonden percentage (hier 5,6%) en n is de omvang van de steekproef (hier 30.000). De berekening levert een marge van 0,26% op en dat komt overeen met 23,4 duizend personen. Dus het aantal werklozen ligt hoogst waarschijnlijk tussen de 476 duizend en de 522 duizend. Ook zo kun je niet de conclusie trekken dat het aantal werklozen onder de 500 duizend ligt.
Dit voorbeeld laat nog een zien hoe belangrijk het is om bij de uitkomsten van peilingen altijd de onzekerheidsmarges te vermelden. Daarmee kun je voorkomen dat je verkeerde conclusies trekt.