A Priori

Ik was laatst in een supermarkt en moest kiezen tussen grapefruits en sinaasappels. Zonder veel nadenken nam ik de grapefruits. Natuurlijk had ik even online kunnen gaan om uit te zoeken welke van de twee gezonder zijn. Of ik had na kunnen gaan hoeveel van beide opties ik het meest gegeten heb in de afgelopen tijd. Of ik had mijn vrouw kunnen appen met de vraag welke zij het lekkerst vind. In al die gevallen had ik meer complete informatie gehad en vermoedelijk een beter besluit genomen. Maar ik deed het niet. Genoeg is genoeg, ook als het om informatie gaat.

Zo gaat het natuurlijk steeds. We nemen verreweg de meeste beslissingen in ons leven met incomplete informatie en daar maken we ons meestal niet druk over. Toch zullen de meesten zeggen dat je beslissingen, als het enigszins kan, moet nemen op basis van de beste informatie die je kunt krijgen. Je moet er niet aan denken dat een dokter zich onvoldoende informeert voor hij een besluit om je te laten opereren of dat een rechter op basis van een half gelezen dossier een straf uitdeelt.

Toch was het juist een berichtje over de rechtspraak – ze willen er algoritmes inzetten om de strafmaat te helpen bepalen – dat voor mij de vraag de vraag opriep of je altijd wel alles moet willen meewegen. Het korte antwoord was nee. Vaak moet je dat niet willen, zeker in de rechtspraak niet.

Vergeef me dat ik om dat toe te lichten er even wat wiskunde bijhaal. Het gaat hier om de wet van Bayes. Thomas Bayes was een Engelse predikant uit de 18e eeuw die de basis legde voor een speciaal soort kansrekening. Hij vroeg zich af hoe je bewijs uit een reeks experimenten mee kon nemen in de kansrekening. Zijn ideeën zijn ook zonder wiskundige basis goed te begrijpen.

Hoe groot is de kans dat er bij jou thuis ingebroken wordt? Er zijn zo’n 45.000 inbraken per jaar in Nederland en zo’n 7,5 miljoen huizen. Dat maakt de kans dat er in een willekeurig huis in Nederland ingebroken wordt zo’n 0,6 procent. Niet erg veel.

Nu zijn er natuurlijk veel redenen te bedenken waarom inbrekers jouw huis sneller zullen uitkiezen. Misschien heb je een hoekhuis, slechte sloten of woon je in een slechte buurt. Als die eigenschappen kun je meewegen in de statistiek. Je kijkt hoeveel vaker er in hoekhuizen ingebroken word, hoeveel vaker in slechte buurten en hoeveel vaker in huizen met slechte sloten en je vermenigvuldigd dit met de algemene kans dat er ergens ingebroken wordt. Misschien kom je dan zelfs wel op 2 of 3 procent uit.

Bayes zou zeggen dat de kans van 0,6 procent dat er in je huis ingebroken wordt de kans vooraf is of de a priori kans. De kans nadat je alle relevante omstandigheden hebt meegewogen is de kans achteraf ofwel de a posteriori kans. Of om de inleiding er nog maar eens bij te halen: a priori zijn sinaasappels even goed als grapefruits, maar als ik meeweeg dat grapefruits iets gezonder zijn, ik ze weinig gegeten heb de laatste tijd en mijn vrouw een voorkeur heeft voor grapefruits winnen ze, a posteriori, de strijd om mijn voorkeur.

De wet van Bayes geeft ons krachtig wiskundig gereedschap om van ruwe inschattingen vooraf, meer verfijnde en precieze inschattingen ‘achteraf’ te maken, door kennis van omstandigheden in te brengen. En dat is precies wat die algoritmen waar de rechtspraak gebruik van wil maken doen.

Stel dat je voor de rechter komt vanwege een licht vergrijp zoals winkeldiefstal. Om je strafmaat te bepalen weegt de rechter allerlei omstandigheden. Misschien werd je er toe verleid doordat je foute vrienden hebt of misschien omdat in de schulden zit. Misschien denkt de rechter dat er een grote kans op recidive (herhaling) is omdat je het al eens gedaan hebt of misschien verwacht de rechter dat je nu je een keer gepakt bent het niet meer zal doen. De rechter past geen vaste straf toe op een vast vergrijp, maar wikt en weegt omstandigheden.

Dat laatste kan enorm verbeterd worden met de Bayesiaanse wiskunde die die algoritmen gebruiken. Er bestaat al een databank met alle gegevens van verdachten: zijn ze bijvoorbeeld man of vrouw, allochtoon of autochtoon, arm of rijk?; van heel veel rechtszaken uit het verleden is dit bekend. Vervolgens kun je met de wet van Bayes in de hand uitrekenen wat de invloed is van al die eigenschappen op recidive – en zo wiskundig bewijs gebruiken bij het bepalen van de strafmaat voor een allochtone, arme vrouw die iemand beroofd heeft.

Je kan dit natuurlijk zien als een verbetering. De rechter woog omstandigheden al mee bij het bepalen van de strafmaat maar nu is ze in staat dit op een preciezere manier te doen. Je zou het ook als een zorgelijke ontwikkeling kunnen opvatten. Het gebruik van algoritmes het proces mechaniseert dat proces. En de rechter gaat zwaarder tillen aan die aspecten die je kan meten (zoals recidive) en minder aan onmeetbare aspecten (zoals sociale invloed).

Maar, ik hoop dat het voorbeeld ook meer fundamentele vragen oproept. Verdien je als vrouw een lichtere straf omdat andere vrouwen minder vaak opnieuw de fout ingegaan zijn? Of verdien je als allochtoon een zwaardere straf omdat andere allochtonen notoire recidivisten bleken? Als het goed is voelt dat idee niet helemaal goed. Ineens blijkt de weging van individuele omstandigheden af te hangen van allemaal groepslidmaatschappen. Dat gaat tegen het gelijkheidsbeginsel in. Het is klassenjustitie.

Als je als individu voor de rechter staat dan wil je je als individu beoordeeld worden. Maar, vreemd genoeg moet de rechter dan heel terughoudend moet zijn met het wegen van persoonlijke omstandigheden. Want hoewel de rechter niet letterlijk Bayesiaanse wiskunde gebruikt, is het onderliggende denkproces natuurlijk vergelijkbaar. Elke inschatting over een ‘omstandigheid’ is gebaseerd op groepslidmaatschap: andere gevallen waar die ‘omstandigheden’ ook speelden. De paradoxale conclusie is dus dat als je wil dat de rechter je als individu beoordeeld, dat deze je persoonlijke omstandigheden niet mee zou moeten wegen en de rechter juist op basis van onvolledige informatie een besluit kan nemen. Het gelijkheidsbeginsel vraagt eigenlijk om de a priori benadering: vaste straffen voor elk vergrijp.

Meer lezen?
In glazen bol besprak ik het gebruik van algoritmen bij de politie al kritisch. In groepsidentificaties en in eerlijk vergelijken lichte ik de relatie tussen groepslidmaatschappen en individuen al eens door. In IQ en waarheidsinjecties besprak ik al eens wat de impact kan zijn van een overdreven focus op metingen.

Eerlijk Vergelijken

Mensen vergelijken veel en dat kan nog knap moeilijk zijn. Neem dit zinnetje bijvoorbeeld.

Ze voeren alle slechte lijstjes aan: de kinderen van Turkse en Marrokaanse gastarbeiders. Drugs, schoolverlaten, kleine criminaliteit, noem maar op…

Je komt uitspraken van deze vorm voortdurend tegen in het spraakgebruik en in de krant. Meestal denk je er ook niet al te veel bij na. Misschien was het je zonder mijn inleiding niet eens opgevallen het hier om een vergelijking tussen groepen gaat. Laat staan dat je je had afgevraagd of die vergelijking wel deugt. Maar, in dit éne zinnetje zitten niet minder dan drie veel gemaakte vergelijkingsslordigheden.

Slordigheid 1: In het midden laten met wie vergeleken is.

De kinderen van gastarbeiders voeren blijkbaar slechte lijstjes aan, maar wie staan er eigenlijk nog meer op die lijstjes? Zijn ze crimineler dan hun ouders? Dan leraren? Dan honden? Dan Russische maffia? Als je er dat er niet bij zegt wordt het wel erg moeilijk conclusies trekken en stel je de luisteraar ook niet echt in de gelegenheid na te gaan of het wel om een eerlijke vergelijking gaat. Toch komt deze slordigheid heel vaak voor. Omdat de spreker denkt bijvoorbeeld dat het wel duidelijk is met wie vergeleken is, omdat het makkelijker leest of om dat het zo nog net iets feitelijker klinkt allemaal.

Nu zijn er best wat tegenwerpingen te bedenken. Je zou kunnen zeggen: “Het is toch niet zo belangrijk wie er verder nog op het lijstje staan? Allochtonen staan bovenaan, dus de aanpak van drugs onder deze groep heeft hoe dan ook prioriteit”. Een variant hiervan is de volgende: “wat hier eigenlijk vergeleken wordt zijn allochtonen in vergelijking tot alle Nederlanders – en ze doen het slechter, dus we moeten daar wat mee”. Ik ben het met allebei grondig oneens, wat me bij een tweede slordigheid brengt.

Slordigheid 2: Appels en peren vergelijken.

Is het eerlijk om kinderen van gastarbeiders te vergelijken met alle Nederlanders? Of laat ik de vraag anders stellen: kan je verwachten dat kinderen van gastarbeiders het even goed doen als alle Nederlanders? Nee natuurlijk. Gastarbeiders zijn naar Nederland gekomen om fabriekswerk te doen: meestal waren ze laag opgeleid. Als je een groep laagopgeleiden vergelijkt met een groep met alle opleidingsniveaus erin, doet die eerste groep het al snel slechter. Dat blijkt hier ook het geval: kinderen van gastarbeiders doen het in de slechte lijstjes beter dan kinderen van laag opgeleide Nederlandse ouders, maar die worden in de meeste onderzoeken niet als aparte groep gemeten. Het maakt dus wel degelijk uit wie er in het lijstje staan, want waren kinderen van laagopgeleide ouders apart gemeten, was er een hele andere ranglijst uitgerold.

Als je twee groepen vergelijkt moeten die dus ook echt vergelijkbaar zijn. Daarom moeten ze gelijksoortig zijn, op alle aspecten behalve die waar je iets over wil zeggen. Het is vaak echt als appels en peren vergelijken. Appels en peren zijn goed vergelijkbaar op sommige aspecten suikergehalte of de prijs, maar heel moeilijk te vergelijken op andere aspecten zoals de vorm en de smaak. Als die moeilijke aspecten wel een rol spelen in je redenering wordt het lastig. Dit is extra problematisch bij groepen omdat er binnen groepen grote verschillen kunnen zijn en een groepsgemiddelde daar van af kan hangen. Het is meestal niet handig om een smalle groep met een brede groep te vergelijken. De prestaties van Nederlandse topsporters zijn uitstekend in vergelijking met die van Nederlanders in het algemeen, maar misschien niet in vergelijking met andere topsporters. Maar ook het vinden van een kleinere groep die echt vergelijkbaar is kan knap moeilijk zijn. Vaak wordt je ‘score’ bepaald door iets wat wel samenhangt met de keuze van je groepen, maar niet hetgeen is waar je iets over wil zeggen; wat me brengt bij een derde slordigheid.

Slordigheid 3: Niet zeggen waarom je vergelijkt.

Dit is de meest controversiële slordigheid. Misschien vind je het juist prettig aan het zinnetje waar ik mee begonnen ben. Dat het lekker feitelijk is. Elke vorm van argumentatie ontbreekt. Er staat niet of we het een probleem vinden dat kinderen van gastarbeiders de slechte lijstjes aanvoeren. Er staat niet waarom we denken dat ze aanvoerder zijn: is het cultuur, intelligentie, taalachterstand, zijn het de genen? En er staat niet wat er zou moet gebeuren: moeten allochtonen uitgezet of moeten we op de thee, moeten ze worden bijgeschoold of moeten we rustig wachten tot het probleem zich vanzelf oplost?

Ook dit is iets wat je erg vaak tegenkomt. Soms is het omdat de conclusie wel ‘voor zich spreekt’. In zo’n geval dan zorgt de weglating ervoor dat de lezer de conclusie zelf trekt – en komt het nog beter binnen. Je vindt deze stijlfiguur veel in kroegenpraat en onder politici. Soms wil de schrijver er ook gewoon zijn vingers niet aan branden. Hij is zeker van de feiten, maar minder zeker van de conclusies of acties, dus die laat hij aan de lezer. Dit treffen we wel aan onder journalisten en wetenschappers. Of het is omdat de schrijver je de ruimte voor je eigen conclusies wil laten. De redenering is dan, dat we de feiten het best los kunnen zien van de discussie. We beginnen met de feiten en dan kan de discussie daarna de vrije loop hebben, toch?

Nee dus. Ik denk dat hier feiten en meningen niet gescheiden zouden moeten zijn. Groepen vergelijken is zo moeilijk dat als je niet zegt wat de achterliggende reden voor de vergelijking was je ook niet na kan gaan of de groepen die vergeleken worden handig gekozen zijn. Er zit bijna altijd wel een addertje onder het gras, waardoor de groepen toch niet zo veel op elkaar lijken als eerst gedacht. Denk maar aan het voorbeeld van de intelligentie van de ouders van de kinderen op de slechte lijstjes. Natuurlijk zou je kunnen zeggen dat dit in de discussie wel naar voren kan komen en zo loop het vaak, uiteindelijk, ook. Maar, door niet te vertellen waarom je vergelijkt zet je de lezer eigenlijk op een achterstand. Eerst vraag je de uitkomst van de vergelijking als feit te accepteren en pas in de discussie komt de reden van vergelijking naar boven en kan iemand pas nagaan of de feiten wel kloppen. Maar, dan wordt de discussie al op het scherpst van de snede gevoerd en is er weinig ruimte om nog eens goed naar de feiten te kijken.

Hoe wel?

Dat brengt me tot een drietrapsraket voor groepsvergelijkingen. Ten eerste moet het duidelijk zijn waarom er een vergelijking uitgevoerd wordt, ten tweede moet duidelijk zijn wie er vergeleken worden en ten derde moeten die groepen goed gekozen, gezien het doel van de vergelijking. Eigenlijk zou je alle drie moeten nagaan voor je de uitkomst als een feit accepteert en er over gaat discussiëren, maar meestal is dat niet te doen natuurlijk. Wat wel kan is voorzichtig zijn met vergelijkingen waar de informatie over een van de drie trappen ontbreekt. En dat zijn verreweg de meesten.

Meer lezen?

Dit is het tweede deel uit een tweeluik over groepsvergelijkingen. In het eerste deel stelde ik aan de orde dat een verschil tussen groepen niet zoveel hoeft te zeggen over de personen in een groep.

Ik schreef natuurlijk ook al eerder over onze meet- en vergelijkcultuur. Ik ben er nog niet uit of dat iets goeds is. Soms blijk ik warm voorstander zoals in waardendragers en eksters. Maar soms ook niet, zoals in dit blogje en in waarheidsinjecties.

Het enige ‘feitje’ uit dit blogje. Dat de kinderen van gastarbeiders het beter doen dan kinderen van laag opgeleide Nederlandse ouders komt uit een hoorcollege van Leo Lucassen over de geschiedenis van migratie. Ik heb hier geen verder ‘fact-check’ op uitgevoerd.