A Priori

Ik was laatst in een supermarkt en moest kiezen tussen grapefruits en sinaasappels. Zonder veel nadenken nam ik de grapefruits. Natuurlijk had ik even online kunnen gaan om uit te zoeken welke van de twee gezonder zijn. Of ik had na kunnen gaan hoeveel van beide opties ik het meest gegeten heb in de afgelopen tijd. Of ik had mijn vrouw kunnen appen met de vraag welke zij het lekkerst vind. In al die gevallen had ik meer complete informatie gehad en vermoedelijk een beter besluit genomen. Maar ik deed het niet. Genoeg is genoeg, ook als het om informatie gaat.

Zo gaat het natuurlijk steeds. We nemen verreweg de meeste beslissingen in ons leven met incomplete informatie en daar maken we ons meestal niet druk over. Toch zullen de meesten zeggen dat je beslissingen, als het enigszins kan, moet nemen op basis van de beste informatie die je kunt krijgen. Je moet er niet aan denken dat een dokter zich onvoldoende informeert voor hij een besluit om je te laten opereren of dat een rechter op basis van een half gelezen dossier een straf uitdeelt.

Toch was het juist een berichtje over de rechtspraak – ze willen er algoritmes inzetten om de strafmaat te helpen bepalen – dat voor mij de vraag de vraag opriep of je altijd wel alles moet willen meewegen. Het korte antwoord was nee. Vaak moet je dat niet willen, zeker in de rechtspraak niet.

Vergeef me dat ik om dat toe te lichten er even wat wiskunde bijhaal. Het gaat hier om de wet van Bayes. Thomas Bayes was een Engelse predikant uit de 18e eeuw die de basis legde voor een speciaal soort kansrekening. Hij vroeg zich af hoe je bewijs uit een reeks experimenten mee kon nemen in de kansrekening. Zijn ideeën zijn ook zonder wiskundige basis goed te begrijpen.

Hoe groot is de kans dat er bij jou thuis ingebroken wordt? Er zijn zo’n 45.000 inbraken per jaar in Nederland en zo’n 7,5 miljoen huizen. Dat maakt de kans dat er in een willekeurig huis in Nederland ingebroken wordt zo’n 0,6 procent. Niet erg veel.

Nu zijn er natuurlijk veel redenen te bedenken waarom inbrekers jouw huis sneller zullen uitkiezen. Misschien heb je een hoekhuis, slechte sloten of woon je in een slechte buurt. Als die eigenschappen kun je meewegen in de statistiek. Je kijkt hoeveel vaker er in hoekhuizen ingebroken word, hoeveel vaker in slechte buurten en hoeveel vaker in huizen met slechte sloten en je vermenigvuldigd dit met de algemene kans dat er ergens ingebroken wordt. Misschien kom je dan zelfs wel op 2 of 3 procent uit.

Bayes zou zeggen dat de kans van 0,6 procent dat er in je huis ingebroken wordt de kans vooraf is of de a priori kans. De kans nadat je alle relevante omstandigheden hebt meegewogen is de kans achteraf ofwel de a posteriori kans. Of om de inleiding er nog maar eens bij te halen: a priori zijn sinaasappels even goed als grapefruits, maar als ik meeweeg dat grapefruits iets gezonder zijn, ik ze weinig gegeten heb de laatste tijd en mijn vrouw een voorkeur heeft voor grapefruits winnen ze, a posteriori, de strijd om mijn voorkeur.

De wet van Bayes geeft ons krachtig wiskundig gereedschap om van ruwe inschattingen vooraf, meer verfijnde en precieze inschattingen ‘achteraf’ te maken, door kennis van omstandigheden in te brengen. En dat is precies wat die algoritmen waar de rechtspraak gebruik van wil maken doen.

Stel dat je voor de rechter komt vanwege een licht vergrijp zoals winkeldiefstal. Om je strafmaat te bepalen weegt de rechter allerlei omstandigheden. Misschien werd je er toe verleid doordat je foute vrienden hebt of misschien omdat in de schulden zit. Misschien denkt de rechter dat er een grote kans op recidive (herhaling) is omdat je het al eens gedaan hebt of misschien verwacht de rechter dat je nu je een keer gepakt bent het niet meer zal doen. De rechter past geen vaste straf toe op een vast vergrijp, maar wikt en weegt omstandigheden.

Dat laatste kan enorm verbeterd worden met de Bayesiaanse wiskunde die die algoritmen gebruiken. Er bestaat al een databank met alle gegevens van verdachten: zijn ze bijvoorbeeld man of vrouw, allochtoon of autochtoon, arm of rijk?; van heel veel rechtszaken uit het verleden is dit bekend. Vervolgens kun je met de wet van Bayes in de hand uitrekenen wat de invloed is van al die eigenschappen op recidive – en zo wiskundig bewijs gebruiken bij het bepalen van de strafmaat voor een allochtone, arme vrouw die iemand beroofd heeft.

Je kan dit natuurlijk zien als een verbetering. De rechter woog omstandigheden al mee bij het bepalen van de strafmaat maar nu is ze in staat dit op een preciezere manier te doen. Je zou het ook als een zorgelijke ontwikkeling kunnen opvatten. Het gebruik van algoritmes het proces mechaniseert dat proces. En de rechter gaat zwaarder tillen aan die aspecten die je kan meten (zoals recidive) en minder aan onmeetbare aspecten (zoals sociale invloed).

Maar, ik hoop dat het voorbeeld ook meer fundamentele vragen oproept. Verdien je als vrouw een lichtere straf omdat andere vrouwen minder vaak opnieuw de fout ingegaan zijn? Of verdien je als allochtoon een zwaardere straf omdat andere allochtonen notoire recidivisten bleken? Als het goed is voelt dat idee niet helemaal goed. Ineens blijkt de weging van individuele omstandigheden af te hangen van allemaal groepslidmaatschappen. Dat gaat tegen het gelijkheidsbeginsel in. Het is klassenjustitie.

Als je als individu voor de rechter staat dan wil je je als individu beoordeeld worden. Maar, vreemd genoeg moet de rechter dan heel terughoudend moet zijn met het wegen van persoonlijke omstandigheden. Want hoewel de rechter niet letterlijk Bayesiaanse wiskunde gebruikt, is het onderliggende denkproces natuurlijk vergelijkbaar. Elke inschatting over een ‘omstandigheid’ is gebaseerd op groepslidmaatschap: andere gevallen waar die ‘omstandigheden’ ook speelden. De paradoxale conclusie is dus dat als je wil dat de rechter je als individu beoordeeld, dat deze je persoonlijke omstandigheden niet mee zou moeten wegen en de rechter juist op basis van onvolledige informatie een besluit kan nemen. Het gelijkheidsbeginsel vraagt eigenlijk om de a priori benadering: vaste straffen voor elk vergrijp.

Meer lezen?
In glazen bol besprak ik het gebruik van algoritmen bij de politie al kritisch. In groepsidentificaties en in eerlijk vergelijken lichte ik de relatie tussen groepslidmaatschappen en individuen al eens door. In IQ en waarheidsinjecties besprak ik al eens wat de impact kan zijn van een overdreven focus op metingen.