Wie is er niet online?

Het aantal online peilingen neemt steeds verder toe. De bekende onderzoeksbureaus in Nederland doen vrijwel al hun peilingen online. In het Verenigd Koninkrijk zijn de peilingen deels online en deels telefonisch. En ook in de Verenigde Staten zie je een mix van online en telefonisch. Voor een valide internet peiling moet de bevolking met internet een goede afspiegeling zijn van de hele bevolking. En daarbij helpt het als de internetdekking (het percentage mensen met internet) hoog is. Is dat zo?

De internetdekking in Europa wordt van jaar tot jaar bijgehouden door Eurostat, het statistische bureau van de Europese Unie. De grafiek hierboven bevat de gegevens over het jaar 2017. Een nadere blik op de grafiek maakt duidelijk dat Nederland en IJsland de grootste internetdekking hebben. In beide landen heeft 98% van de huishoudens internet. Dat is dus bijna alle huishoudens. De internetdekking is verder vooral hoog in Luxemburg en een aantal Scandinavische landen (Noorwegen, Denemarken, Zweden). In het noorden van Europa zit het dus wel goed met de internetdekking.

Hoe anders is de situatie in het zuidoosten van Europa. De vijf landen onderaan in de lijst liggen allemaal in de Balkan. Het zijn Macedonië, Montenegro, Griekenland, Servië en Bulgarije. Bulgarije heeft met 67% de laagste dekking. Maar liefst 1 op de 3 huishoudens heeft geen internet. Het is hachelijk om in deze landen een online peiling te doen. Je loopt het risico dat allerlei groepen onder- of oververtegenwoordigd zijn, waardoor je een verkeerde conclusie trekt uit de peiling. In de lijst is ook de Verenigde Staten (VS) opgenomen. Dat is uiteraard geen Europees land, maar zo kun je internetdekking van de VS en de Europese landen met elkaar vergelijken. De dekking in de VS is redelijk hoog (89%), maar toch niet zo hoog als je misschien zou verwachten voor een land waarin het internet is uitgevonden. Uit de grafiek blijkt dat 10 Europese landen een grotere dekking hebben.

Het is lastig om aan cijfers over de internetdekking in de VS te komen. Er is geen organisatie zoals Eurostat die dit op regelmatige basis bijhoudt. Gelukkige zijn er nu wel actuele cijfers. Die zijn verzameld door het Pew Research Center. Zie: 11% of Americans don’t use the internet. Who are they?.

Om na te gaan of mensen met internet representatief zijn voor alle mensen in de populatie, kun je de internetdekking voor allerlei groepen in de samenleving met elkaar vergelijken. Het Pew Research Center heeft dit voor een beperkt aantal variabelen gedaan. Het resultaat staat in de grafiek hieronder. Groepen met een percentage onder de 11 zijn ondervertegenwoordigd en groepen met een dekking boven de 11% zijn oververtegenwoordigd.

Voor de variabelen geslacht en etnische achtergrond lijken er geen problemen te zijn de percentages van alle subgroepen liggen immers rond de 11%. Bij de variabele leeftijd gaat het mis. Het percentage jongeren zonder internet is heel erg laag. En het percentage ouderen zonder internet is juist heel hoog. Maar liefst 1 op de 3 personen van 65 jaar en ouder heeft geen internet.

Ook bij de variabele inkomen zijn er problemen. Vooral bij de lage inkomens hebben veel mensen geen internet. Kijken we naar opleidingsniveau, dan zien we dat vooral mensen met een lage opleiding geen internet hebben. En er is een verschil tussen de steden en het platteland. Op het platteland is het internetbezit een stuk lager dan in de steden. Uit deze cijfers kun je concluderen dat de groep mensen met internet niet representatief is. Vooral ouderen, lage inkomens, laag opgeleiden en plattelanders zijn ondervertegenwoordigd.

Hoe zou het in Nederland zijn? In ieder geval is de internetdekking met 98% veel hoger dan in de VS (89%). In de Statline-databank van het CBS kun je cijfers vinden over het internetbezit door de jaren heen. De meest recente zijn van 2017. Daarvan is een grafiek gemaakt die zoveel mogelijk lijkt op die van het Pew Research Center. Dus de schaalverdelingen op de horizontale as zijn hetzelfde.

Merk op dat het internetbezit in Nederland volgens Eurostat gelijk is aan 98%, terwijl het volgens het CBS gelijk is aan 97,1%. Dit kleine verschil ontstaat door een iets andere manier van meten.

Wat meteen opvalt is dat de staven in de grafiek veel korter zijn dan de staven van de Amerikaanse grafiek. Dat komt door de hogere internetdekking in Nederland. Er is daardoor simpelweg geen ruimte meer voor grote afwijkingen.

Ook in Nederland zijn er problemen met de ouderen. Bij personen van 65 jaar en ouder is het internetbezit behoorlijk wat lager. Ook de lagere inkomens (1e en 2e groep) zijn ondervertegenwoordigd. Verder is het internetbezit bij laag opgeleiden laag. In Statline stonden geen cijfers over internetbezit en mate van verstedelijking, maar wel over internetbezit bij werkenden en niet-werkenden. Duidelijk is dat vooral bij niet-werkenden het internetbezit relatief laag is.

Het beeld in Nederland is dus min of meer hetzelfde als in de VS. Alleen zijn in de VS de verschillen wat extremer. Een online peiling zal dus vaak niet representatief zijn. Vooral ouderen, mensen met lage inkomens, laag opgeleiden en niet-werkenden zijn ondervertegenwoordigd. Om de aantasting van de validiteit te corrigeren, moet je de uitkomsten wegen. Uit bovenstaande grafiek blijkt dat in ieder geval leeftijd, inkomen, opleiding en werkend/niet-werkend belangrijke weegvariabelen zijn.

Hierboven is voor een beperkt aantal variabelen het verband met internetbezit onderzocht. Er zouden natuurlijk nog meer variabelen kunnen zijn die samenhang vertonen met internetbezit. Die moeten we allemaal meenemen in de weging om zo alle vertekening te kunnen wegwerken. Probleem is dat we deze variabelen niet kennen en we dus ook niet hun relatie met internetbezit kunnen vaststellen. Dus enige voorzichtigheid met online peilingen is geboden.