Drukte in de metro van Moskou

Op donderdag 19 januari 2017 stuurde Gert-Jan Dennekamp, verslaggever van NOS/Nieuwsuur, een tweet rond met een aardige grafiek over de metro in Moskou. Die grafiek probeert de drukte op de verschillende stations in beeld te brengen. Zo op het eerste gezicht lijkt een heldere, informatieve grafiek. Toch zitten er onvolkomenheden in.

De grafiek is een soort stroomdiagram. Hij brengt de passagiersstromen in beeld. De stations zijn als cirkels weergegeven. In elke station staat het aantal passagiers per dag (in duizendtallen). Het is een heldere grafiek. Allerlei zaken kun je vrij eenvoudig aflezen. Zo komen op het drukste station 163.000 reizigers per dag langs. De namen van de stations staan er ook bij, maar die zijn in deze versie van de grafiek niet zo goed te lezen.

Er zitten helaas wat slordigheden in de grafiek. Het was ongetwijfeld de bedoeling dat de omvang van de cirkels de drukte om de stations weerspiegelde. Dat is niet gelukt. Neem bijvoorbeeld het vijfde station in de bruine lijn (van boven gezien). Daar komen 104.000 passagiers langs. In het volgende station komen 50.000 passagiers langs. 104.000 is 2,1 keer zoveel als 50,000. Dan zou de bijbehorende cirkel van het vijfde station ook 2,1 keer zo groot moeten zijn als die van het zesde station. Maar dit is niet zo. Het vijfde station is 7,1 keer zo groot als het zesde. De cirkels overdrijven dus de verschillen.

De bekende grafisch deskundige Edward Tufte heeft in zijn boek The Visual Display of Quantitative Information (1983) voor dit soort zaken de Lie Factor (liegfactor) geïntroduceerd. Die geeft aan hoeveel je liegt bij de weergave van een verschijnsel. In een goede grafiek is de liegfactor altijd 1. Bij de vergelijking van het vijfde en de zesde station is de liegfactor gelijk aan 7,1 / 2,1 = 3,4. Het verschill wordt dus ruim drie keer zo groot voorgesteld als het in werkelijkheid is. Kortom, de grafiek is suggestief omdat hij allerlei effecten veel erger weergeeft dan ze in werkelijkheid zijn.

Nog erger is het als je kijkt naar het verschil tussen twee stations op de blauwe lijn, aan de linkerkant van de grafiek. Het ene station heeft 85,000 passagiers en het voorgaande station 22,000. Hiertussen zit een factor 3,9. De bijbehorende cirkels verschillen echter een factor 25. Er kunnen 25 kleine cirkeltjes in de grote cirkel. Dus de verschillen worden overdreven met een factor 25,0 / 3,9 = 6,4. Daarmee wordt de liegfactor dus 6,4.

Het is jammer dat de autoriteiten de passagiersstromen niet wat beter hebben weergegeven. Dan zou de grafiek nog beter zijn.

Met dank aan Hayo Bethlehem voor het uitzoekwerk.