Deze grafiek wordt niet beter van al die pompoenen

Op 31 oktober is het Halloween. Dit feest wordt traditioneel gevierd in Angelsaksische landen als Amerika, Engeland, Canada en Ierland. Het feest wordt echter ook steeds populairder in Nederland en andere Europese landen. Eurostat, het statistisch bureau van de EU, vond het zelfs nodig een statistiek over de pompoenproductie te publiceren. Helaas was het wel een slechte grafiek.

Deze grafiek is in feite een staafdiagram. Alleen zijn er geen staven getekend, maar pompoenen. Die pompoenen zijn zo getekend dat de breedte ervan overeenkomt met de pompoenproductie in het bijbehorende land. Zo is de pompoen voor Bulgarije ongeveer 1,7 keer zo breed als de pompoen voor Portugal. Dat komt overeen met de verhouding tussen de producties in beide landen: 133 000 is ongeveer 1,7 keer zo groot als 75 000.

Door met symbolen te werken in plaats van met staven, wordt echter een essentiële fout gemaakt. De ontwerper ziet namelijk over het hoofd dat als een pompoen breder wordt, hij ook hoger wordt. En bij het bekijken van de pompoenen kijkt de lezer naar het oppervlak en niet alleen naar de breedte. Het oppervlak van de Bulgaarse pompoen is 2,9 keer zo groot als het oppervlak van de Portugese pompoen. Het verschil in grootte tussen beide pompoenen komt dus niet overeen met het verschil in productie.

Je ziet deze fout wel vaker langskomen bij grafieken waarin symbolen worden gebruikt. Al in 1983 wees de bekende statisticus Edward Tufte in zijn bekende boek ‘The Visual Display of Quantitative Information’ op de gevaren hiervan. Hij introduceerde zelf een maat voor de mate waarin een grafiek de waarde van bepaalde verschijnselen verkeerd weergeeft. Dat is de ‘Liegfactor’. Die krijg je door de waargenomen waarde in de grafiek te delen door de werkelijk waarde. Bij een goede grafiek is de Liegfactor gelijk aan 1. In de pompoenengrafiek is de verhouding tussen de Bulgaarse en Portugese grafiek gelijk aan 2,9, terwijl de verhouding tussen de producties 1,7 is. De Liegfactor is hier dus gelijk aan 2,9 / 1,7 = 1,7.

De eenvoudigste manier om problemen met de omvang van symbolen te vermijden, is helemaal geen symbolen te gebruiken, maar gewoon een staafdiagram. Hieronder is de grafiek van Eurostat omgebouwd tot zo’n grafiek. Alle staven zijn even breed. Daardoor komen de oppervlaktes van de staven overeen met de bijbehorende producties. Miischien wel saaier dan de pompoenengrafiek, maar wel een eerlijker grafiek.