Ziekenhuisbezetting van coronapatiënten: welke grafiek is het beste?

De maatregelen tegen corona worden in drie grote stappen snel versoepeld. Dat maakte minister Ernst Kuipers van Volksgezondheid bekend op een coronapersconferentie op dinsdag 15 februari 2022. Volgens Kuipers kon dit omdat het aantal besmettingen over de piek heen is en de ziekenhuisbezetting (het aantal coronapatiënten) nagenoeg stabiel blijft. Hij illustreerde zijn betoog met een grafiek. Dat is wel een redelijk goede grafiek, maar besef dat je met een andere vormgeving een heel ander beeld kan oproepen.

De verticale as in bovenstaande grafiek speelt een cruciale rol bij de interpretatie ervan. Gerald Everitt Jones (2007) beschrijft in zijn boek ‘How to lie with charts’ hoe je door manipulatie van deze as je enerzijds een bijna rimpelloze horizontale trend kunt produceren of anderzijds een wild variërende trend vol hoge pieken en diepe dalen. Welke grafiek is dan de juiste?

De vorm van de trendline in de grafiek wordt bepaald door het beginpunt en het eindpunt van de verticale as. Als je in de grafiek aantallen of percentages wilt weergeven, dan ligt het voor de hand om de waarde 0 als beginpunt te nemen. Dit is de laagste waarde die kan voorkomen. En de posities boven de (horizontale) as corresponderen met de werkelijke waarden. Een tweemaal zo grote waarde ligt tweemaal zo hoog boven de as. Als de verticale as niet bij 0 begint, dan zie je effecten die meestal groter lijken dan ze in werkelijkheid zijn. In de grafiek van Kuipers begin de verticale as gelukkig bij 0.

Welke waarde gebruik je als eindpunt van de verticale as? We laten aan de hand van een paar voorbeelden zien hoe een andere keuze van het eindpunt tot een heel andere grafiek kan leiden. Als het te tonen verschijnsel een maximale waarde heeft, zou je kunnen overwegen de as te laten eindigen bij dat maximum. Als je, bijvoorbeeld, percentages op de as wilt zetten, dan weet je dat de waarde niet boven de 100% kan uitstijgen.

In de grafiek van Kuipers is ervoor gekozen de verticale as te laten lopen tot 5.000. Het is niet duidelijk waar die waarde vandaan komt. Geeft die waarde het maximaal mogelijke aantal coronapatiënten in de ziekenhuizen aan? Of is het misschien het totaal aantal bedden in de ziekenhuizen? Volgens cijfers van het Landelijk Coördinatiecentrum Patiënten Spreiding (LCPS) ligt deze beddencapaciteit eerder in de buurt van de 15.000.

Laten we nu de verticale as eens aanpassen. De gegevens suggereren dat de ziekenhuisbezetting van de coronapatiënten niet boven de 2.000 uitkomt. Die waarde nemen we als eindpunt. Dit leidt tot de grafiek hieronder (Alternatief 1). Deze grafiek toont een minder stabiele ontwikkeling als de oorspronkelijke grafiek van Kuiper. Er is eerst sprake van een daling van de ziekenhuisbezetting en na 26 januari stijgt die weer.

Als je vooral de variatie in de bezetting wilt benadrukken, dan kan dat door een andere keuze van beginpunt en eindpunt. Dat is gedaan in de alternatieve grafiek hieronder (Alternatief 2). Het beginpunt (1000) is net iets lager genomen dan de kleinste waarde. En het eindpunt (1800) is net iets hoger dan de grootste waarde. Merk op dat hier van het principe is afgeweken om de as te laten beginnen bij 0. Daarom kun je deze grafiek eigenlijk alleen gebruiken om de variatie in ziekenhuisbezetting te analyseren, en niet het niveau van de cijfers. De variatie in de cijfers is behoorlijk groot. De grafiek toont niet bepaald een stabiele trend.

Als je erop uit bent om vooral te laten zien dat er sprake is van een stabiele trend zonder veel fluctuatie, dan moet je de as laten beginnen bij 0 en het eindpunt zo groot mogelijk nemen. In voorbeeld daarvan is te zien in de grafiek hieronder (Alternatief 3). Voor het eindpunt van de as is hier de waarde 16.000 genomen. Dat is ongeveer de totale beddencapaciteit van de ziekenhuizen in Nederland (volgens cijfers van het LCPS). De ziekenhuisbezetting van coronapatiënten lijkt nu inderdaad heel stabiel. Er zit vrijwel geen variatie in. Je kunt uit de grafiek ook aflezen dat coronapatiënten maar een heel klein deel van alle bedden bezetten.

Welke grafiek geeft nu het beste het verloop van de ziekenhuisbezetting van de coronapatiënten weer? Alternatief 2 van de grafiek is het ene uiterste. Je brengt dan vooral de variatie van de cijfers in beeld. Over het niveau van de cijfers kun je weinig of niets zeggen. Alternatief 3 van de grafiek is het andere uiterste. Hij toont vooral het verloop in de tijd van de cijfers. Je kunt vrijwel niets zeggen over de variatie ervan.

Alternatief 1 van de grafiek is misschien wel het beste. Beide aspecten van de data (trend en variatie) komen daarin redelijk goed tot uiting. Merk ook op dat de as van Alternatief 1 keurig bij 0 begint. Bij Alternatief 2 is dat niet het geval, met alle gevaren van dien.

Literatuur:
Jones, Gerald Everret (2007), How to lie with charts. LaPuerta, Santa Monica, Californië.