Hoe interpreteert u (wetenschappelijke) cijfers?

Bruine speelgoedblokken met cijfers. Foto: Susan Holt Simpson via Unsplash

In de media worden we overspoeld met cijfers en wetenschappelijke inzichten. Denk maar aan de dagelijkse rapportering van de coronacijfers in het journaal, of weer maar eens een wetenschappelijk artikel dat zegt dat wijn drinken dan toch gezond is. Maar hoe moeten we die cijfers nu interpreteren? Hoe onderscheiden we de correcte info van het ‘fake news’?

Enkele tips

Daarvoor geven we u graag enkele tips mee. Waarmee moet u rekening houden bij de interpretatie van (wetenschappelijke) cijfers?

  1. Pas op met absolute getallen. Maak steeds ook gebruik van relatieve grootheden (zoals percentages, verhoudingen …) om de cijfers in de juiste context te plaatsen. Bijvoorbeeld: gebruik naast een cijfer voor het aantal bewoners ook het cijfer voor de bevolkingsdichtheid (aantal inwoners/km²).
     
  2. Pas op met percentages. Gebruik, zeker bij kleine steekproeven, ook steeds absolute cijfers. Bijvoorbeeld: "50% van de deelnemers gaf aan niet tevreden te zijn van de vorming." Als slechts twee deelnemers de vragenlijst hebben ingevuld, zegt dit uiteraard weinig.
     
  3. Vergelijk waar mogelijk in tijd en ruimte. Gebruik zoveel mogelijk trendcijfers om evoluties doorheen de tijd weer te geven. Maak gebruik van prognoses en toekomstverkenningen. Of vergelijk met buurgemeenten, regio, arrondissement, provincie, Vlaanderen. Dit helpt om de cijfers in hun context te zetten. Hebt u te maken met afwijkende cijfers of is de situatie eerder gelijkend?
     
  4. Onderzoek van enkele jaren geleden telt ook nog. Maatschappelijke evoluties treden slechts bruusk op zodat onderzoek ze pas na een paar jaar zal oppikken. Maar zoek wel steeds naar de meest recente cijfers.
     
  5. Denk goed na over het specifieke cijfer dat u zal gebruiken. Sommige cijfers kunnen een vertekend beeld opleveren. Bijvoorbeeld: gebruik liever de mediaanleeftijd dan de gemiddelde leeftijd. Idem voor inkomen: hoge inkomens kunnen net als uitschieters in oude of jonge leeftijden kunnen een gemiddelde vertekenen. Door gebruik te maken van de mediaan worden deze uitschieters uitgefilterd.
     
  6. Wees u er van bewust dat heel wat cijfers en samengestelde maten op basis van een aantal cijfers indicatoren zijn van een feitelijke toestand. Ze geven een richting aan en niet de werkelijkheid. Bijvoorbeeld: de maat voor socio-economische achtergrond van leerlingen in het onderwijs, die de basis vormt voor extra omkadering en werkingsmiddelen voor de school. De maat wordt samengesteld door volgende indicatoren: de thuistaal van de leerling, een schooltoeslag ontvangen, het hoogst behaalde opleidingsniveau van de moeder.
     
  7. Gebruik nooit cijfers op zich, maar plaats ze altijd in context. Cijfers op zich geven geen verklaring voor de realiteit. Ze hebben eerder een signaalfunctie. Ze moeten dus altijd geduid worden, vaak met kwalitatieve informatie of door ze te combineren met andere cijfers. Vraag uzelf af hoe het komt dat deze cijfers er zijn. Zoek naar mogelijke verklaringen. We leggen daarbij de focus op meerdere, mogelijke verklaringen. Causale verklaringen zijn heel moeilijk tot niet te vinden. Er is vaak invloed van heel wat factoren. Bijvoorbeeld: wat is de oorzaak van de hoge werkloosheidscijfers in een bepaalde regio? Niet de ‘luie jeugd’, maar mogelijks wel de teloorgang van bepaalde industrietakken en het gebrek aan alternatieven.
     
  8. Wie heeft de cijfers verzameld en/of gepubliceerd? Wie heeft opdracht gegeven tot het onderzoek? Bijvoorbeeld: opiniepeilingen van politieke partijen kunnen door de partij zelf zijn opgezet, of door de media. Bij deze laatste gaat het vaak om een bepaald segment van de bevolking dat dan bevraagd wordt.
     
  9. Hoe werden de cijfers verzameld? Welke vragen werden er gesteld? Werden de vragen wel zo objectief mogelijk gesteld of waren ze toch eerder subjectief? Gaat het echt om objectieve cijfers, of werd er naar een mening gevraagd? Bijvoorbeeld: ons museum lokte 200 bezoekers op Erfgoeddag. Zijn deze cijfers geteld aan de hand van het aantal verkochte tickets? Of gaat het om een inschatting van de medewerkers?

Cijfers kunnen ook misbruikt worden

Bijvoorbeeld om een eigen standpunt te verdedigen of om bepaalde feiten te verdoezelen. Onderstaand voorbeeld laat duidelijk zien waarover het gaat:

Interracial violent crime incidents 2018, bron: Knack online, 08/06/2020, artikel Brecht Castel

Kijk even naar de grafiek hiernaast, die gaat over interraciale gewelddaden in 2018 in de Verenigde Staten. De grafiek is gemaakt op basis van cijfers van het Bureau of Justice Statistics (National Crime Victimization Survey). 

Deze grafiek werd veelvuldig geretweet en diende als basis voor heel wat interpretaties en beweringen. Zo lijkt vooral het geweld van zwarten op blanken een probleem in de VS. Maar krijgen we hier wel de juiste informatie?

Laten we er even de cijfers bijhalen waarop deze grafiek gebaseerd werd.

© Agentschap voor Justitiële Statistiek, Nationale Misdaadbevraging, 2018 (tabel 14), bron: Knack online, 08/06/2020, artikel Brecht Castel

In de linkerkolom kunt u de etniciteit van het slachtoffer terugvinden. De eerste kolom cijfers toont het totale aantal gewelddaden tegenover deze etniciteit. Aan de rechterkant van de tabel ziet u de cijfers opgedeeld naargelang de etniciteit van de dader. Die worden weergegeven in percentages. Als we de percentages toepassen op het totale aantal gewelddaden komen we inderdaad tot de cijfers in de grafiek.

Maar in de grafiek werden slechts een aantal cijfers meegenomen, terwijl andere achterwege werden gelaten, bv. de gevallen waarbij zowel slachtoffer als dader dezelfde etniciteit hebben. Het weglaten van deze informatie wordt ook wel cherrypicking (feiten selectief selecteren om een standpunt te verdedigen) genoemd. Wanneer we deze informatie wél toevoegen aan de grafiek krijgen we onderstaand beeld.

© Knack met data van Agentschap voor Justitiële Statistiek, bron: Knack online, 08/06/2020, artikel Brecht Castel

Nu zien we een heel ander beeld. Vooral de ‘white on white’ grafiek valt nu op, gewelddaden waarbij zowel slachtoffer als dader blank zijn. Kunnen we het hier dan bij laten en deze grafiek zonder meer de wereld insturen? Neen, ook nu hebben we nog enkele zaken nodig ter duiding van de cijfers. Een beetje context.

Uit de censusdata van de VS (2020) kunnen we namelijk opmaken dat de Verenigde Staten veel meer blanke mensen dan mensen van een andere etniciteit telt:

  • 57,8% White alone, not Hispanic or Latino
  • 18,7% Hispanic or Latino
  • 12,1% Black or African American alone, not Hispanic or Latino

Als we dus het aantal gewelddaden willen interpreteren aan de hand van de absolute cijfers in de laatste grafiek, moeten we deze in verhouding zetten tot het aantal inwoners van die etniciteit. Er zijn meer gewelddaden van blanken tegenover blanken, maar er wordt daarbij ook uit een grotere poel geput. Is er in verhouding tot het aantal inwoners inderdaad een groot aantal gewelddaden bij blanken?

Daarnaast kunnen we ons ook de vraag stellen hoe deze cijfers worden gemeten. Zo blijkt dat het rapport is gebaseerd op de waarneming van de slachtoffers. Het gaat dus niet om een objectieve meting waarbij zowel slachtoffer als dader gekend zijn. De etniciteit van het slachtoffer is gekend en aan hen wordt gevraagd welke etniciteit de dader had. Deze subjectieve meting kan door heel wat factoren vertekend worden. Bijvoorbeeld de eigen achtergrond of de eigen attitudes, maar ook maatschappelijke gebeurtenissen of berichten in de media die een vertekend beeld kunnen geven.

Cijfers zijn niet zomaar cijfers …

... er moeten altijd kritische bedenkingen bij komen kijken.

Wat dacht u ten slotte van deze aandachtspunten?