A Priori

Ik was laatst in een supermarkt en moest kiezen tussen grapefruits en sinaasappels. Zonder veel nadenken nam ik de grapefruits. Natuurlijk had ik even online kunnen gaan om uit te zoeken welke van de twee gezonder zijn. Of ik had na kunnen gaan hoeveel van beide opties ik het meest gegeten heb in de afgelopen tijd. Of ik had mijn vrouw kunnen appen met de vraag welke zij het lekkerst vind. In al die gevallen had ik meer complete informatie gehad en vermoedelijk een beter besluit genomen. Maar ik deed het niet. Genoeg is genoeg, ook als het om informatie gaat.

Zo gaat het natuurlijk steeds. We nemen verreweg de meeste beslissingen in ons leven met incomplete informatie en daar maken we ons meestal niet druk over. Toch zullen de meesten zeggen dat je beslissingen, als het enigszins kan, moet nemen op basis van de beste informatie die je kunt krijgen. Je moet er niet aan denken dat een dokter zich onvoldoende informeert voor hij een besluit om je te laten opereren of dat een rechter op basis van een half gelezen dossier een straf uitdeelt.

Toch was het juist een berichtje over de rechtspraak – ze willen er algoritmes inzetten om de strafmaat te helpen bepalen – dat voor mij de vraag de vraag opriep of je altijd wel alles moet willen meewegen. Het korte antwoord was nee. Vaak moet je dat niet willen, zeker in de rechtspraak niet.

Vergeef me dat ik om dat toe te lichten er even wat wiskunde bijhaal. Het gaat hier om de wet van Bayes. Thomas Bayes was een Engelse predikant uit de 18e eeuw die de basis legde voor een speciaal soort kansrekening. Hij vroeg zich af hoe je bewijs uit een reeks experimenten mee kon nemen in de kansrekening. Zijn ideeën zijn ook zonder wiskundige basis goed te begrijpen.

Hoe groot is de kans dat er bij jou thuis ingebroken wordt? Er zijn zo’n 45.000 inbraken per jaar in Nederland en zo’n 7,5 miljoen huizen. Dat maakt de kans dat er in een willekeurig huis in Nederland ingebroken wordt zo’n 0,6 procent. Niet erg veel.

Nu zijn er natuurlijk veel redenen te bedenken waarom inbrekers jouw huis sneller zullen uitkiezen. Misschien heb je een hoekhuis, slechte sloten of woon je in een slechte buurt. Als die eigenschappen kun je meewegen in de statistiek. Je kijkt hoeveel vaker er in hoekhuizen ingebroken word, hoeveel vaker in slechte buurten en hoeveel vaker in huizen met slechte sloten en je vermenigvuldigd dit met de algemene kans dat er ergens ingebroken wordt. Misschien kom je dan zelfs wel op 2 of 3 procent uit.

Bayes zou zeggen dat de kans van 0,6 procent dat er in je huis ingebroken wordt de kans vooraf is of de a priori kans. De kans nadat je alle relevante omstandigheden hebt meegewogen is de kans achteraf ofwel de a posteriori kans. Of om de inleiding er nog maar eens bij te halen: a priori zijn sinaasappels even goed als grapefruits, maar als ik meeweeg dat grapefruits iets gezonder zijn, ik ze weinig gegeten heb de laatste tijd en mijn vrouw een voorkeur heeft voor grapefruits winnen ze, a posteriori, de strijd om mijn voorkeur.

De wet van Bayes geeft ons krachtig wiskundig gereedschap om van ruwe inschattingen vooraf, meer verfijnde en precieze inschattingen ‘achteraf’ te maken, door kennis van omstandigheden in te brengen. En dat is precies wat die algoritmen waar de rechtspraak gebruik van wil maken doen.

Stel dat je voor de rechter komt vanwege een licht vergrijp zoals winkeldiefstal. Om je strafmaat te bepalen weegt de rechter allerlei omstandigheden. Misschien werd je er toe verleid doordat je foute vrienden hebt of misschien omdat in de schulden zit. Misschien denkt de rechter dat er een grote kans op recidive (herhaling) is omdat je het al eens gedaan hebt of misschien verwacht de rechter dat je nu je een keer gepakt bent het niet meer zal doen. De rechter past geen vaste straf toe op een vast vergrijp, maar wikt en weegt omstandigheden.

Dat laatste kan enorm verbeterd worden met de Bayesiaanse wiskunde die die algoritmen gebruiken. Er bestaat al een databank met alle gegevens van verdachten: zijn ze bijvoorbeeld man of vrouw, allochtoon of autochtoon, arm of rijk?; van heel veel rechtszaken uit het verleden is dit bekend. Vervolgens kun je met de wet van Bayes in de hand uitrekenen wat de invloed is van al die eigenschappen op recidive – en zo wiskundig bewijs gebruiken bij het bepalen van de strafmaat voor een allochtone, arme vrouw die iemand beroofd heeft.

Je kan dit natuurlijk zien als een verbetering. De rechter woog omstandigheden al mee bij het bepalen van de strafmaat maar nu is ze in staat dit op een preciezere manier te doen. Je zou het ook als een zorgelijke ontwikkeling kunnen opvatten. Het gebruik van algoritmes het proces mechaniseert dat proces. En de rechter gaat zwaarder tillen aan die aspecten die je kan meten (zoals recidive) en minder aan onmeetbare aspecten (zoals sociale invloed).

Maar, ik hoop dat het voorbeeld ook meer fundamentele vragen oproept. Verdien je als vrouw een lichtere straf omdat andere vrouwen minder vaak opnieuw de fout ingegaan zijn? Of verdien je als allochtoon een zwaardere straf omdat andere allochtonen notoire recidivisten bleken? Als het goed is voelt dat idee niet helemaal goed. Ineens blijkt de weging van individuele omstandigheden af te hangen van allemaal groepslidmaatschappen. Dat gaat tegen het gelijkheidsbeginsel in. Het is klassenjustitie.

Als je als individu voor de rechter staat dan wil je je als individu beoordeeld worden. Maar, vreemd genoeg moet de rechter dan heel terughoudend moet zijn met het wegen van persoonlijke omstandigheden. Want hoewel de rechter niet letterlijk Bayesiaanse wiskunde gebruikt, is het onderliggende denkproces natuurlijk vergelijkbaar. Elke inschatting over een ‘omstandigheid’ is gebaseerd op groepslidmaatschap: andere gevallen waar die ‘omstandigheden’ ook speelden. De paradoxale conclusie is dus dat als je wil dat de rechter je als individu beoordeeld, dat deze je persoonlijke omstandigheden niet mee zou moeten wegen en de rechter juist op basis van onvolledige informatie een besluit kan nemen. Het gelijkheidsbeginsel vraagt eigenlijk om de a priori benadering: vaste straffen voor elk vergrijp.

Meer lezen?
In glazen bol besprak ik het gebruik van algoritmen bij de politie al kritisch. In groepsidentificaties en in eerlijk vergelijken lichte ik de relatie tussen groepslidmaatschappen en individuen al eens door. In IQ en waarheidsinjecties besprak ik al eens wat de impact kan zijn van een overdreven focus op metingen.

IQ

Ik houd een lijstje bij met slechtst begrepen wetenschappelijke begrippen en bijna bovenaan, ver boven relativiteit, staat IQ. Mensen schijnen over IQ onder andere te geloven dat het echt bestaat, dat we weten wat het is, en dat we er nuttige dingen mee kunnen doen. Allemaal hardnekkige misverstanden. IQ vormt een perfect voorbeeld van wat er allemaal mis kan gaan als je iets gaat meten.

Even een prikkelend feitje over IQ: het IQ van de wereldbevolking gaat al jaren omhoog. Dit stijgende IQ wordt het Flynn effect genoemd, naar de psycholoog James Flynn die liet zien dat de gemiddelde Amerikaan tussen 1932 en 1978 zo’n 10% slimmer was geworden. Of Amerikanen nog steeds elk jaar slimmer worden durf ik niet te zeggen, maar de rest van de wereld word dat blijkbaar wel.

Dat is natuurlijk heel erg fijn voor ons allemaal. Maar het roept ook heel erg veel vragen op. Want was het IQ niet een meting van een aangeboren eigenschap? Is intelligentie niet het best te begrijpen als een soort van talent om moeilijke dingen te snappen, te leren en misschien om in het algemeen handige dingen te doen? Hoe kan het dat de genen van onze soort zo snel veranderen dat we in razend tempo slimmer worden? Is er soms een sterke selectiedruk op intelligentie in onze maatschappij?

Het antwoord laat zich raden: intelligentietests meten helemaal geen intelligentie. Tenminste niet als je dat ziet als een aangeboren leertalent. IQ tests stellen vast hoeveel lastige puzzels je in een bepaalde tijd kan oplossen. Ze meten dus breinprestaties op een bepaald moment en niet het leertalent wat daarvoor gezorgd heeft. Breinprestaties zijn van natuurlijk van veel meer dingen afhankelijk dan je aangeboren talenten. Heb je meer scholing gehad, of specifieke IQ test training? Dan doe je het beter op IQ tests.

Nu zou je kunnen zeggen dat breinprestaties op een bepaald moment een aardige voorspeller kunnen zijn van leervermogen gedurende een bepaalde tijd, maar dan ga je er wel vanuit dat leervermogen een constante is. Dat hoeft natuurlijk niet zo te zijn.Steeds als je iets leert veranderd je brein een beetje. Zou een dergelijke verandering niet ook kunnen zorgen dat je daarna gemakkelijker nieuwe dingen leert? Met andere woorden: zou het kunnen dat je leertalent afhankelijk is van wat je leert?

Veel wetenschappers denken tegenwoordig van wel. Dit wordt fluïde intelligentie genoemd. Onderwijs verhoogt niet alleen je vermogen om puzzels op te lossen, maar ook je vermogen om te leren om puzzels op te lossen. Intelligentie is helemaal niet alleen aangeboren: je kan ook leren om intelligent te zijn.

Het zou allemaal niet uitmaken als IQ tests een aardige voorspelling zouden geven van dingen waar je wat aan hebt in het leven: bijvoorbeeld studiesucces of succes in een toekomstige baan. Maar ook dat blijkt tegen te vallen: IQ tests kunnen bar weinig voorspellen. Niet alleen omdat de IQ tests zelf niet deugen, maar ook omdat er meerdere soorten intelligentie zijn en omdat heel andere menselijke eigenschappen zoals doorzettingsvermogen of een houding ten aanzien van leren veel belangrijkere voorspellers blijken te zijn van later succes.

Ik heb zelf veel te danken aan een IQ test. Mijn basisschooldocent dacht dat ik beter naar de Mavo kon, maar de IQ test die ik deed wees Havo uit en daar ging ik dus heen. Op de Havo – en later op de universiteit – ontwikkelde ik vervolgens veel van mijn huidige talent om te leren. Ik dank mijn IQ aan een IQ test. Want stel je eens voor dat die test Vmbo had uitgewezen, dan was ik vast lang zo slim niet geworden. IQ test worden dus eigenlijk verkeerd gebruikt. We doen alsof IQ tests iets belangrijks kunnen voorspellen, maar we gebruiken hem tegen de laatbloeiers in onze samenleving. Heb ben je niet snel genoeg slim geworden, dan krijg je dankzij het gebruik van de IQ test geen kans meer om van een dubbeltje naar een kwartje te groeien. Naar vind ik dat.

Als we de balans op maken voor IQ tests komen we op het volgende ontluisterende lijstje. IQ tests maken op basis van breinprestaties op een bepaald moment een schatting van het gemiddelde leervermogen tot dan toe, waarbij de omgeving weggedacht en het feit dat leertalent kan veranderen weggedacht worden. Vervolgens doen we net alsof dat IQ allerlei successen kan voorspellen, terwijl we allang beter weten. IQ meten is koffiedik kijken in psychologie-vermomming.

Dat roept de vraag op hoe het zo ver heeft kunnen komen… Hoe verklaren we de populariteit van de IQ test als het ding zo overduidelijk niet deugt?  Een deel van het antwoord is dat we pas sinds kort weten wat er allemaal mis is met IQ tests. Je hebt behoorlijk wat tijd nodig om te meten hoe goed een test studiesucces kan voorspellen en wat eventueel betere voorspellers zijn. Ook het idee van fluïde intelligentie is vrij nieuw en hoe fluïde onze intelligentie precies is, is niet bekend. Dat maakt het moeilijk inschatten wat je wel en niet uit een IQ kan voorspellen.

Toch denk ik dat er een belangrijkere reden is voor de aanhoudende populariteit van IQ en de IQ test en dat is deze: het meten van dingen maakt ze tastbaar. Dingen die je in een getal kan uitdrukken zijn echt. Kilometertellers maken afstanden tastbaar, klokken maken de tijd tastbaar en IQ tests maken intelligentie tastbaar.

Veel van ons hebben wel eens een IQ test gedaan. Als ik zelf een IQ van 120 heb, dan moet intelligentie wel bestaan. Hoe kan je het anders meten? Dat is misschien een cirkelredenering, maar tegen de achtergrond van mijn eigen IQ van 120, lijken die verhaaltjes over fluïde intelligentie en slechte voorspellende waarde echt een beetje geneuzel. Mijn indrukwekkende IQ staat immers zo vast als een huis.

Mijn voorspelling is dus dat IQ tests, ondanks de aanzwellende kritiek, nog tot in jaar en dag tot de vaste uitrusting van de psychologen blijft behoren. Werkgevers willen weten wat het IQ is van het personeel dat ze gaan aannemen. De mensen willen weten wat hun IQ is. Dus blijven we het meten en als we het kunnen meten dan zal het wel bestaan.

En laat dat dan een les zijn voor als je zelf eens iets onzichtbaars aan de man wil brengen of het nou om astrologie, aardstraling, een of ander -isme of om boze geesten gaat… Zorg voor een betrouwbare meting en je zit gebeiteld.

Meer lezen?

In waarheidsinjecties betoog ik dat we teveel proberen te meten in deze samenleving. In doeloorzaken bespreek ik een andere tactiek om moeilijke dingen te begrijpen. In evolutiesnelheid stel ik misverstanden rondom de evolutietheorie aan de kaak.