Verwarrende grafieken over roken in het Leidsch Dagblad

Op 31 oktober 2018 presenteerde het Leidsch Dagblad de resultaten van een onderzoek over het stoppen met roken. Het onderzoek was uitgevoerd door RegioPeil/HMC. In het artikel had de krant ook een aantal grafieken opgenomen. Helaas klopten er diverse zaken niet in die grafieken. Het begint er al mee dat de titel van de grafiek in de papieren versie (Wat vindt u van de toenemende anti-rookmaatregelen in de samenleving?) een heel andere was dan die van dezelfde grafiek in de digitale versie (Pakje sigaretten duurder dan 10 euro?). Maar er is meer mis.

Bovenstaande grafiek stond op woensdag 31 oktober in de digitale versie van het Leidsch Dagblad. Kennelijk moesten de respondenten aangeven of ze het eens waren met het plan een pakje sigaretten duurder te maken dan 10 euro. Maar zoals gezegd, in de papieren versie staat dezelfde grafiek maar met een volledig andere titel (Wat vindt u van de toenemende anti-rookmaatregelen in de samenleving?).

Als we dan wat beter naar de grafiek zelf kijken, dan zien we een aantal merkwaardige zaken. Neem bijvoorbeeld het groepje van drie staven in het midden. De bijbehorende waarden verschillen niet veel (25,7%, 26,7% en 19,6%, maar de staven verschillen wel behoorlijk in lengte. De staaf voor de rokers is 6,5 keer zo groot als die voor nooit gerookt, terwijl de waarde maar 1,3 keer zo groot is.

Het eerste groepje van drie staven ziet er ook merkwaardig uit. De lengtes van de drie staven kloppen totaal niet met de waarden. De middelste staaf (63,4%) is maar amper groter dan die van de eerste staaf (16,6%), terwijl de waarde van de middelste staaf bijna vier keer zo groot is.

En een laatste merkwaardige zaak is dat de lengtes van de staven met de grootste waarden (75,7%, 63,4%) veel korter zijn dan die van de staaf met waarde 57,7%. Kortom, er klopt helemaal niets van de onderlinge verhoudingen in deze grafiek.

In de grafiek hieronder is gepoogd de grafiek te repareren en wel de juiste verhoudingen in de grafiek weer te geven. Staven die eerst veel te kort waren, hebben nu de juiste hoogte gekregen. Duidelijk zijn nu de twee grote groep voorstanders te zien. Ook zijn verschillende kleuren gebruikt voor het aangeven voor de drie groepen (rokers, ex-rokers en niet-rokers). Het is niet logisch om verschillende tinten van één kleur te gebruiken als de verschillende waarden geen natuurlijke volgorde hebben.

Eigenlijk is de grafiek in deze vorm niet zo makkelijk te interpreteren. De verschillende antwoorden voor een groep (Prima, Maakt niet uit en Slecht plan) zijn verspreid over drie deelgrafieken. Daarom is het lastig om de samenstelling van een groep te bekijken.

Hieronder is een andere grafiek gemaakt van dezelfde gegevens. We noemen dit een stapeldiagram. De staven van één groep tellen nu op tot 100%. Je kunt nu duidelijk de samenstelling van de verschillende groepen vergelijken.

Grafieken zijn een nuttig en krachtig instrument om de patronen in de verzamelde gegevens zichtbaar te maken. Maar dan moet het ontwerpen van die grafieken wel zorgvuldig gebeuren, en bij voorkeur door een deskundige.