Gaan zoveel Groningers stemmen op een regionale partij?

In de uitzending van EenVandaag van 14 februari 2015 ging het over de verkiezingen voor de Provinciale Staten van 18 maart. Eén van de vragen was of de kiezers op een regionale partij gaan stemmen. Het antwoord op die vraag werd met een grafiek in beeld gebracht. Dat was een thematische kaart. Vooral Groningen springt eruit. Het leek erop dat wel heel veel Groningers op een regionale partij gaan stemmen. Helaas gaf die thematische kaart de verhoudingen niet helemaal goed weer.

provinciale-partij2

Je gebruikt een thematische kaart om statistische gegevens open landkaart weer te geven. Een belangrijk probleem bij dit soort kaarten is area bias. Die kan zich voordoen als je de waarde van een variabele in een geografisch gebied wilt tonen door het gebied in te kleuren. Gebieden met een groot oppervlak vallen dan meer op dan gebieden met een klein oppervlak, ook al heeft dat gebied een lagere waarde. Je kunt het probleem van de area bias omzeilen door de gebieden niet in te kleuren, maar door symbolen in de gebieden te tekenen waarvan de grootte overeenkomt met de waarde van de variabele. Dat is gebeurt bij de kaart van EenVandaag. Het percentage stemmers op een regionale partij in een provincie is weergegeven door een oranje cirkel.

Bij een goede thematische kaart moeten de symbolen de waarden van de variabele weerspiegelen. De oppervlakten van de cirkels moeten dus evenredig zijn met de percentage stemmers op een regionale partij. Bij de grafiek van EenVandaag klopt dit niet. Bijvoorbeeld: de 15% van Groningen is 5 keer zoveel als de 3% van Drenthe. Dan moet de cirkel van Groningen ook 5 keer zo groot zijn als de cirkel van Drenthe. Dat is niet het geval: het oppervlak van de cirkel van Groningen is maar liefs 22 keer zo groot als het oppervlak van de cirkel van Drenthe. Hetzelfde zie je als je Friesland met Groningen vergelijkt. De waarde voor Groningen is 2,5 keer zo groot als die van Friesland, maar de cirkel voor Groningen is 5,5 keer zo groot als die van Friesland.

De bekende grafisch deskundige Edward Tufte heeft in zijn boek The Visual Display of Quantitative Information (1983) voor dit soort zaken de Lie Factor (liegfactor) geïntroduceerd. Die geeft aan hoeveel je liegt bij de weergave van een verschijnsel. In een goede grafiek is de liegfactor altijd 1. De liegfactor bij de vergelijking van Groningen en Drenthe is 4,4. Het verschijnsel wordt dus vier keer zo groot voorgesteld als het in werkelijkheid is. Kortom, de symbolenkaart is suggestief omdat hij allerlei effecten veel erger weergeeft dan ze in werkelijkheid zijn.

Vermoedelijk heeft de ontwerper van de grafiek een fout heeft gemaakt, en naar de diameter van de cirkels gekeken in plaats van naar de oppervlakte. Die fout wordt vaker gemaakt. Kijk maar eens in het boek van Tufte. Hieronder staat een versie van de thematische kaart waarin het probleem is opgelost. De oppervlaktes van de cirkels zijn nu wel evenredig met de percentages stemmen.

kaart-nl4

De verschillen tussen Groningen, Friesland en Drenthe zijn op deze nieuwe kaart minder groot, maar hij geeft wel een eerlijker beeld van de situatie.