Een staafdiagram of toch maar liever een dotplot?

Op 3 mei 2015 publiceerde het CBS via Twitter een grafiek van de percentages mensen (naar leeftijd) die voldoende fruit, groente en vis eten. Die grafiek was een staafdiagram. De vormgeving van dit staafdiagram was nogal ongebruikelijk. Dat maakte de interpretatie van deze grafiek lastiger. Kan het ook anders? Ja, zeker!

voeding0

Er is in feite sprake van drie staafdiagrammen. Er is een staafdiagram voor elke soort voeding (fruit, groente en vis). De staven geven leeftijdsklassen aan. Bij elkaar vormen de drie grafieken een vrolijk gekleurd geheel. Toch vallen er wel wat kritische opmerkingen te maken.

In de eerste plaats hebben alle staven binnen een staafdiagram een andere kleur. Dat is ongebruikelijk en meestal ook niet nodig bij een staafdiagram. Bovendien corresponderen de staven met leeftijdsklassen. Die hebben een logische ordening (van jong naar oud). Wil je die klassen van elkaar onderscheiden, dan ligt het meer voor de hand om verschillende (oplopende of aflopende) tinten van één kleur te gebruiken. Verschillende kleuren voor de verschillende staven gebruik je alleen als er geen natuurlijke ordening is (bijvoorbeeld als je leeftijd zou vervangen door provincie).

In de tweede plaats zijn de staven verticaal getekend. Het heeft voordelen om de staven horizontaal te tekenen. Dan is er meestal meer ruimte om teksten kwijt te kunnen. Nu is er te weinig ruimte om de aanduidingen voor de leeftijdsklassen onder de staven te zetten. Dat is hier opgelost via een legenda. Als je wilt weten welke staaf bij een leeftijdsklasse hoort, dan moet je de corresponderende kleur in de legenda opzoeken. Dat maakt het interpreteren van de grafiek toch wel wat moeizamer.

De genoemde problemen kunnen we oplossen door de staafdiagrammen te kantelen. Dat is hieronder gedaan voor het staafdiagram over groente. Er zijn geen verschillende kleuren meer nodig. En ook kunnen we de namen van de leeftijdsklassen gewoon in de grafiek opnemen. Toegegeven, de grafiek ziet er wel wat saaier uit. Maar de winst is dat we hem nu veel makkelijker kunnen interpreteren.

voeding1

We zouden ook nog kunnen overwegen om een heel ander type grafiek te gebruiken. Het is misschien wel een goed idee om eens naar een dotplot te kijken. De dotplot is al in 1984 voorgesteld door William Cleveland (Graphical Methods for Data Presentation: Full scale breaks, dot charts and multibased logging, The American Statistician 38, blz. 270-280). Hij deed uitgebreid onderzoek naar de beste manieren om grafieken goed en simpel te kunnen interpreteren. Eén van zijn conclusies was dat een dotplot beter werkt dan een staafdiagram.

Hieronder staat een voorbeeld van een dotplot. Dezelfde gegevens over het eten van groente zijn weer gebruikt. Er is een stippellijn voor elk categorie (hier leeftijdsklasse). De positie van het symbool (hier een vierkantje) geeft de waarde in corresponderende categorie aan. Volgens Cleveland is de interpretatie van een dotplot vooral eenvoudiger als er veel categorieën zijn.

voeding2

De grafiek van het CBS bestaat in uit drie staafdiagrammen. Je zou kunnen overwegen die drie grafieken samen te brengen in één samengesteld staafdiagram. Dat zou dan zoveel staven gaan bevatten dat die grafiek wel eens erg onoverzichtelijk kan verder. In een dotplot ligt het combineren van grafieken veel meer voor de hand. In de grafiek hieronder staat een dotplot voor de drie voedingsgroepen bij elkaar.

voeding3

Er zijn verschillende symbolen gebruikt voor de verschillende soorten voeding: rode cirkels voor fruit, groene vierkantjes voor groente en blauwe driehoeken voor vis. Door de symbolen ook van vorm te laten verschillen, is de grafiek ook nog goed leesbaar op een print of kopie in zwart/wit.

Deze dotplot maakt het makkelijker de scores voor de verschillende soorten voeding met elkaar te vergelijken. Overduidelijk is dat de percentages voor vis voor alle leeftijden lager is dan de percentages voor groente en fruit. Er lijkt ook sprake te zijn van een soort omslag van groente en fruit. Voor jongeren zijn de percentages voor groente groter dan die voor fruit. Boven de 65 jaar is dat omgekeerd. Het is vrijwel onmogelijk om zo’n verschijnsel af te lezen uit de grafiek van het CBS.

De conclusie? Pas op als je afwijkt van de richtlijnen voor het maken van een staafdiagram. Dat kan de leesbaarheid van de grafiek in negatieve zijn beïnvloeden. En overweeg eens om een dotplot te maken.