Bewusteratuur

Is het mogelijk om de hoeveelheid bewustzijn van mensen te meten? Sommige dingen doe je onbewust en andere dingen bewust. Als je onder narcose bent heb je geen ervaringen; als je slaapt weinig, terwijl je als je wakker bent ‘volledig’ bewust bent. Zou je hier een maat aan kunnen hangen? Kunnen we, met andere woorden, bewustzijn meten zoals je ook temperatuur kan meten? Onze ‘bewusteratuur’?

Onschuld en belofte

Dat is natuurlijk geen onschuldige vraag. Als je iets meetbaar maakt, geef je het ook een nauwkeurige definitie. Vroeger was temperatuur een vaag begrip. Iedereen was het erover eens dat het overdag warmer is dan ‘s nachts en dat het in de schaduw koeler is dan in de zon, maar er waren toen ook kwesties waar discussie over bestond.

De uitvinding van de kwikthermometer was een flinke stap voorwaarts. Hierdoor konden we de verschillen tussen dag en nacht precies duiden, maar we verloren ook iets. We ontdekten dat verschillen in hoe warm iets aanvoelt niet altijd precies samenhangt met de temperatuur. In de zon voelt het bijvoorbeeld warmer aan dan in de schaduw, maar dat ligt niet alleen aan de temperatuur van de lucht, maar ook aan de warmte van de zonnestralen zelf. Door temperatuur meetbaar te maken zijn we ook iets anders gaan bedoelen met het begrip. Vroeger verwees het vooral naar hoe warm iets aanvoelt, nu zien we het als één van de mogelijke oorzaken van dat gevoel. We hebben temperatuur op zijn plek gezet; dankzij de thermometer moest temperatuur een stapje terug doen in ons denken over warmte. Het idee van een gevoelstemperatuur roept eigenlijk nostalgie op naar de tijd dat de temperatuur en ons gevoel erover nog netjes samenliepen.

Om die reden is het bewustzijn ‘meten’ riskant. Er is veel discussie over wat bewustzijn precies is. Als we het meetbaar gaan maken, zijn we niet meer vrij om allerlei ideeën over het karakter van bewustzijn te verzinnen. Hoe we het meten, gaat bepalen wat het is. Maar dat is ook de grote kracht ervan. Als we weten hoe we bewustzijn kunnen meten krijgen we ook antwoorden op vragen die nu buiten ons bereik liggen. Zoals de vraag wie er allemaal bewustzijn hebben. Ik zou er eindelijk achter kunnen komen of de boom buiten mijn raam bewustzijn heeft, en of ze wakker is, of slaapt, of dat ze geniet van het zonnetje, simpelweg door te meten hoe bewust ze is.

Het ontwikkelen van een meetinstrument.

Natuurlijk zijn we nog niet zo ver. Net zoals dat het meten van temperatuur begon met het idee van gevoelstemperatuur, waarna we langzaam gezocht hebben naar manieren om dit idee handen en voeten te geven, moeten dat proces bij het meten van de hoeveelheid bewustzijn ook moeten doorlopen.

Tegenwoordig meten we de grootheid temperatuur in de eenheid Celsius. Maar hoe zat het voor Celsius? Om een grootheid meetbaar te maken, moeten je hem koppelen aan iets anders dat je al kunt meten. De oude Grieken wisten dat gassen en vloeistoffen uitzetten bij hogere temperaturen – en dat je temperatuur dus kan uitdrukken als een volume van een bepaalde hoeveelheid vloeistof. Kwik zet bijvoorbeeld per graad Celsius 0,018% uit. Zo kun je met de uitzetting en krimp van kwik temperatuurverschillen meten.

Maar alleen een werkprincipe is niet genoeg. Je hebt ook nog of ijkpunten, nodig. Iets waarvan weet dat ze een bepaalde temperatuur hebben. Celsius gebruikte smeltend ijs en kokend water. Dat lijkt een eenvoudige oplossing omdat deze een vaste temperatuur hebben, maar dat konden de uitvinders van de eerste thermometers niet weten, aangezien ze geen thermometers hadden.

Er is dus een Catch-22 situatie bij het ontwikkelen van meetinstrumenten. Je kunt je meetinstrument pas in elkaar zetten als je zeker bent van de ijkpunten en je kunt daar pas zeker van zijn als je een meetinstrument hebt. Eigenlijk is het nog iets ingewikkelder, want ook het werkprincipe was nog onzeker. De uitzetting per graad van veel vloeistoffen is bijvoorbeeld afhankelijk van de temperatuur. En ook dat kun je pas meten als je een betrouwbare thermometer hebt.

Het ontwikkelen van de thermometer was daarom een lang en ingewikkeld proces. We probeerden verschillende vloeistoffen en vaste stoffen, zochten andere ijkpunten, en vergeleken maten. Elke keer werd de techniek een beetje verbeterd. Totdat de metingen stabiel waren. Al die tijd tastten we in het duister over hoe nauwkeurig ze eigenlijk waren. Hoewel de basisideeën voor temperatuur meting al bij de oude Grieken bekend waren, duurde het tot ongeveer 1800 voordat we betrouwbare thermometers hadden

Metingen van de bewusteratuur

Ook bij het meten van bewustzijnsniveaus is het lastig om goede ijkpunten te vinden.

Narcose is een mooie kandidaat voor het nulpunt van bewustzijn. We voelen dan immers geen pijn en kunnen ons later niets herinneren. Helaas zijn er genoeg verhalen van patiënten waarvan men dacht dat ze buiten bewustzijn waren die plotseling hun ogen open deden of die zich konden herinneren wat artsen zeiden tijdens de operatie. Slaap is ook geen ideaal ijkpunt. Mensen dromen en er zijn daardoor grote verschillen in hersenactiviteit tijdens de slaap. Het is onduidelijk hoe die slaapfasen verband houden met bewustzijn.

En ook aan de bovenkant van de schaal zijn er problemen. Een gezonde, wakkere volwassene zou een goed ijkpunt kunnen zijn, maar niet iedereen is even bewust misschien en het fluctueert misschien ook door de dag heen. En wat moeten we met bewustzijnsverruimende middelen zoals LSD? Deze zorgen voor hallucinaties? Veel gebruikers ervaren dit als een ‘hoger niveau’ van bewustzijn, maar veel artsen en onderzoekers op dit gebied betwijfelen dat.

En dan is er het werkprincipe. Wat kunnen we al meten dat samenhangt met bewustzijnsniveau? Ik hoor jullie denken ‘hersenactiviteit (!)’, maar de meeste activiteiten van het brein leiden niet tot bewuste ervaringen. Het lijkt er dus niet op dat algehele hersenactiviteit een goede maat is. Wetenschappers hebben ook geen specifieke plek in de hersenen gevonden waar bewuste ervaringen ontstaan. Hersenactiviteit op één bepaalde plek meten, is daarom ook geen oplossing.

Ergens is dat geruststellend. Blijkbaar is het bewustzijn geen specialisatie van het brein en hoeft het er niet buitenproportioneel hard voor te werken. Maar wat kan het dan wel zijn? Een populaire theorie komt uit een onverwachte hoek: bestandscompressie op de computer. Je hebt vast wel eens een zip-bestand gemaakt van een programma, document of afbeelding zodat het minder ruimte op je harde schijf innam of makkelijker te versturen was. Wat WinZip doet, is de lange reeks enen en nullen in het bestand door te nemen en te kijken of er overbodige informatie in zit. Op het moment dat de combinatie 1101011 vijftien keer achter elkaar voorkomt kun je in plaats van al die enen en nullen uit te schrijven ook een code invoeren die zegt vijftien keer deze serie graag. Dat bespaart ruimte.

Wat interessant is aan deze benadering, is dat het ook iets zegt over de complexiteit van de code. Als een bestand flink kleiner kan worden gemaakt, bevat het veel overbodige informatie en is het blijkbaar niet erg complex. Maar bestanden die moeilijk te verkleinen zijn, hebben complexe code: alle informatie is nodig.

Deze aanpak kun je ook toepassen op hersenactiviteit. Je meet de hersenactiviteit onder gecontroleerde omstandigheden en bekijkt hoeveel overbodige informatie erin zit. Door de hersenactiviteit om te zetten in een reeks enen en nullen, kun je zien hoeveel kleiner het bestand wordt. Het blijkt dat als hersenactiviteit veel overbodige informatie bevat en flink gecomprimeerd kan worden, mensen minder bewust zijn.

Dat is een spannende ontdekking. Het lijkt erop dat bewustzijn te maken heeft met hoe goed de hersenen informatie samenvatten. Het gaat om integratie van informatie, of gerichte hersenactiviteit, niet alleen om hoeveel activiteit of informatie die er is. Dit betekent dat middelen zoals LSD en paddo’s, die vaak bewustzijnsverruimend worden genoemd, eigenlijk je bewustzijn verlagen. Je hersenen integreren informatie dan minder goed. Bewustzijnsverruiming betekent dus juist minder bewustzijn.

De boom der wijsheid

Tegelijkertijd zijn we nog verre van een werkend meetinstrument. De zipmethode kan een ruwe indicatie geven van bewustzijnsniveau, die ongeveer overeenkomt met hoe artsen het ook zien, maar er moet nog heel wat water door de Rijn voordat we een gestandaardiseerde maat hebben die breed toepasbaar is.

Het idee dat ‘het bewustzijnsniveau overeenkomt met de hoeveelheid geïntegreerde informatie’ klinkt goed, maar er zijn veel problemen met de definitie. Wat tel je als ‘informatie’ en wat niet. Integratie betekent dat het geheel meer is dan de som der delen, maar hoe definieer je de delen en het geheel? Aantal hersencellen? Hoeveelheid stroompjes? Wat is de eenheid van informatie in het brein? Dit zijn vragen die nog lang niet beantwoord zijn.

De ontwikkeling rondom het meten van de bewusteratuur laten zien dat het niet ondenkbaar is dat we tot een maat voor de mate van bewustzijn kunnen komen. En dat we daarmee ons begrip van bewustzijn voorgoed veranderen. Als we bewustzijn zien als geïntegreerde informatie, kunnen we nieuwe antwoorden vinden op vragen zoals welke organismen (of apparaten) bewustzijn hebben. Maar we verliezen ook iets. De ‘bewusteratuur’ beantwoordt niet de vraag hoe het voelt om een vleermuis te zijn, en misschien zullen we die vraag in de toekomst dan ook niet meer stellen. Ik zelf zou dat enorm jammer vinden.

Meer lezen?

Dit blogje maakt uit van een serie over het bewustzijn. In bewust besprak hoe het maar de vraag is of het bewustzijn maar één vraagstuk, of eerder een familie van losse problemen die elkaar soms wel en soms niet raken. In ervaring ging ik in op de vraag of dieren ervaringen hebben en hoe we dat kunnen weten. In dualisme zette ik een aantal filosofische posities over het bewustzijn uiteen. In een volgend blogje ga ik nog in op de vraag of computers een vorm van bewustzijn kunnen hebben.

Ik scheef al eerder over de hersenwetenschap in: breinquintologie, op zoek naar het brein, informatieverwerker, gedachtenmeting en het onbegrijpelijke brein.

Voor dit blogje maakte ik dankbaar gebruik van het boek Being You van Anil Seth.

Significantie

Ik zou er een serie van kunnen maken. Het plot gaat ongeveer zo. Onderzoeker (m/v) wil grip krijgen op een probleem. De onderzoeker ontwikkelt een meetinstrument. Met succes: de ontwikkelde maat blijkt een prima middel om een beetje meer grip te krijgen op het probleem.

Maar dan gaat het mis omdat het te goed gaat. Veel andere onderzoekers willen ook graag meer grip krijgen op het probleem. Iedereen slaat aan het meten. Het instrument en de nieuwe maat worden populair en krijgen veel status. Sluipenderwijs verandert het instrument van gedaante. Ooit was het maar een middel, maar nu wordt het een doel op zich – nee het doel.

Het is een verhaal over hoogmoed en val. Of eigenlijk het verhaal van doctor Frankenstein: die macht over leven en dood wilde – en zodoende iets schiep dat hij niet meer in de hand had. Want een meetinstrument dat een doel op zich is geworden doet gewoonlijk meer kwaad dan goed. Als een uitkomst van een meetinstrument een doel wordt, gaan we de boel zo inrichten dat we hoog scoren op die uitkomst; vaak ten koste van dingen die eigenlijk gewoon belangrijker zijn. We bedenken een lat om de wereld de maat te nemen maar de lat neemt ons de maat.

Eerder schreef ik zo’n verhaal over IQ, maar vandaag is er aanleiding om statistische significantie: ofwel de p-waarde onder de loep te nemen. Die p-waarde wordt veel gebruikt, zo veel dat zo’n 800 wetenschappers een opiniestuk in het wetenschappelijke tijdschrift Nature ondertekenden dat argumenten gaf voor het afschaffen ervan – of tenminste pleitten deze wetenschappers voor een andere omgang met de p-waarde.

Wat gaat hier mis? Die p-waarde is echt heel erg belangrijk. Het gaat feitelijk om een groep wetenschappers die vinden dat het gebruikte wetenschappelijke gereedschap verboden moet worden. Je kan ook lezen: “tuindersvereniging protesteert tegen het gebruik van heggenscharen” of “ANWB pleit voor het afschaffen van wielen”. Niet echt het nieuws dat je verwacht.

Het zit zo. De p-waarde meet de kans dat een wetenschappelijke bevinding toeval kan zijn. Dus de kans dat je per ongeluk bewijs hebt gevonden voor een stelling. Als je de lengte van de jongens en meisjes in de klas meet en je vindt dat de jongens gemiddeld 1,3 cm langer zijn, dan wil je vaak ook weten of dit in alle klassen zo is óf alleen in jouw klas. Er is best een kans dat er in jouw klas toevallig een paar extra lange jongens zaten terwijl dat in andere klassen helemaal niet zo is en jongens dus ook niet gemiddeld langer zijn. Als je die mogelijkheid niet kan uitsluiten, ga je als wetenschapper niet zomaar roepen dat jongens gemiddeld langer zijn dan meisjes.

Daarvoor is dus statistiek uitgevonden. Of een uitkomst van een experiment toeval is, weet je natuurlijk nooit helemaal zeker. Wat je kunt doen, is op basis van het soort meting, het aantal metingen en de spreiding een schatting maken van hoe groot de kans is dat je elders hetzelfde zult vinden: de p-waarde.

Die p-waarde is populair. Of eigenlijk: zij is zò populair dat ze een norm is geworden. Het is knap lastig om nog resultaten te publiceren als de kans dat het toeval is wat je gevonden hebt niet kleiner is dan 5%, of liever nog 1%. Dit geldt zeker in de sociale wetenschappen?

Is dat slecht? Nou ja, misschien. Het bespaart ons zeker een hoop onzinbevindingen die zonder de p-waarde misschien enorm serieus genomen zouden worden.

Maar de ellende met de p-waarde als norm is natuurlijk dat wetenschappers – mensen – proberen die waarde op te krikken. Ze nemen bijvoorbeeld meer proefpersonen, of ze sluiten erg afwijkende proefpersonen uit of een enkeling verzint misschien wat data. Ik zou hier een hele lijst misstanden kunnen noemen, maar het punt is steeds: de p-waarde is het doel geworden in plaats van de waarheidsvinding. Einde wetenschap.

En dat is wat die onderzoekers van dat manifest dwars zit. Het gaat ze om misbruik, verkeerd gebruik en onbegrip; waardoor waardevolle bevindingen verloren gaan en waardeloze bevindingen enorm belangrijk gevonden worden. Daarom stellen ze voor om de p-waarde-norm los te laten en de p-waarde weer een bescheidener plek te geven naast datgene waar het écht om draait: het effect en de grootte daarvan.

Mijn steun hebben ze: dat moge duidelijk zijn, maar of het kansrijk is durf ik te betwijfelen. Ik begin te ontdekken dat normen makkelijker ontstaan dan verdwijnen. Natuurlijk is de eerste stap om je ertegen uit te spreken. Maar dan begint de lange, lange weg om de praktijk te veranderen. Of deze wetenschappers daar zo goed in zijn als in zich uitspreken? We gaan het zien.

Meer lezen?

Ik schreef al eens hoe enorm overschat de IQ test is en wat daar de gevolgen van zijn. Meer in het algemeen stelde ik vragen bij een doorgedreven vorm van empirisme in waarheidsinjecties. Het vergelijken van groepen (mannen en vrouwen bijvoorbeeld) stelde ik aan de kaak in groepsidentificaties en in eerlijk vergelijken.

Sanne Blauw besprak op de Correspondent op heldere manier wat de p-waarde is en waarom wetenschappers hem willen afschaffen. Het oorspronkelijke Nature artikel vind je hier.

A Priori

Ik was laatst in een supermarkt en moest kiezen tussen grapefruits en sinaasappels. Zonder veel nadenken nam ik de grapefruits. Natuurlijk had ik even online kunnen gaan om uit te zoeken welke van de twee gezonder zijn. Of ik had na kunnen gaan hoeveel van beide opties ik het meest gegeten heb in de afgelopen tijd. Of ik had mijn vrouw kunnen appen met de vraag welke zij het lekkerst vindt. In al die gevallen had ik meer informatie gehad en vermoedelijk een beter besluit genomen. Maar ik deed het niet. Genoeg is genoeg, ook als het om informatie gaat.

Zo gaat het natuurlijk steeds. We nemen verreweg de meeste beslissingen in ons leven met onvolledige informatie en daar maken we ons meestal niet druk over. Toch zullen de meesten zeggen dat je beslissingen, als het enigszins kan, moet nemen op basis van de beste informatie die je kunt krijgen. Je moet er niet aan denken dat een dokter zich onvoldoende informeert voor hij een besluit neemt om je te laten opereren of dat een rechter op basis van een half gelezen dossier een straf uitdeelt.

Toch was het juist een berichtje over de rechtspraak – ze willen er algoritmes inzetten om de strafmaat te helpen bepalen – dat voor mij de vraag opriep of je altijd wel alles moet willen meewegen. Het korte antwoord was nee. Vaak moet je dat niet willen, zeker in de rechtspraak niet.

Vergeef me dat ik om dat toe te lichten er even wat wiskunde bijhaal. Het gaat hier om de wet van Bayes. Thomas Bayes was een Engelse predikant uit de 18e eeuw die de basis legde voor een speciaal soort kansrekening. Hij vroeg zich af hoe je bewijs uit een reeks experimenten mee kon nemen in de inschatting van een uitkomst. Zijn ideeën zijn ook zonder wiskundige basis goed te begrijpen.

Hoe groot is de kans dat er bij jou thuis ingebroken wordt? Er zijn zo’n 45.000 inbraken per jaar in Nederland en zo’n 7,5 miljoen huizen. Dat maakt de kans dat er in een willekeurig huis in Nederland ingebroken wordt zo’n 0,6 procent. Niet erg veel.

Nu zijn er natuurlijk veel redenen te bedenken waarom inbrekers jouw huis sneller zullen uitkiezen. Misschien heb je een hoekhuis, slechte sloten of woon je in een slechte buurt. Al die omstandigheden kun je meewegen in de statistiek. Je kijkt hoeveel vaker er in hoekhuizen ingebroken wordt, hoeveel vaker in slechte buurten en hoeveel vaker in huizen met slechte sloten en je vermenigvuldigt dit met de algemene kans dat er ergens ingebroken wordt. Misschien kom je dan zelfs wel op 2 of 3 procent uit.

Bayes zou zeggen dat de kans van 0,6 procent dat er in je huis ingebroken wordt de kans vooraf is, ofwel de a priori-kans. De kans nadat je alle relevante omstandigheden hebt meegewogen is de kans achteraf, ofwel de a posteriori-kans. Of om de inleiding er nog maar eens bij te halen: a priori zijn sinaasappels even goed als grapefruits, maar als ik meeweeg dat grapefruits iets gezonder zijn, ik er weinig van gegeten heb de laatste tijd en mijn vrouw een voorkeur heeft voor grapefruits winnen ze, a posteriori, de strijd om mijn voorkeur.

De wet van Bayes geeft ons krachtig wiskundig gereedschap om van ruwe inschattingen vooraf, meer verfijnde en precieze inschattingen achteraf te maken, door kennis van omstandigheden in te brengen. En dat is precies wat die algoritmen waar de rechtspraak gebruik van wil maken doen.

Stel dat je voor de rechter komt vanwege een licht vergrijp zoals winkeldiefstal. Om je strafmaat te bepalen weegt de rechter allerlei omstandigheden. Misschien werd je ertoe verleid doordat je foute vrienden hebt of misschien omdat je in de schulden zit. Misschien denkt de rechter dat er een grote kans op herhaling is omdat je het al eens gedaan hebt of misschien verwacht de rechter dat je nu je een keer gepakt bent het niet meer zal doen. De rechter past geen vaste straf toe op een vast vergrijp, maar wikt en weegt omstandigheden.

Dat laatste kan enorm verbeterd worden met de Bayesiaanse wiskunde die algoritmen gebruiken. Er bestaat al een databank met alle gegevens van verdachten: zijn ze bijvoorbeeld man of vrouw, allochtoon of autochtoon, arm of rijk? Dit soort gegevens zijn van heel veel rechtszaken uit het verleden bekend. Vervolgens kun je met de wet van Bayes in de hand uitrekenen wat de invloed is van al die eigenschappen op herhaling – en zo wiskundig bewijs gebruiken bij het bepalen van de strafmaat voor een allochtone, arme vrouw die iemand beroofd heeft.

Je kan dit natuurlijk zien als een verbetering. De rechter woog omstandigheden al mee bij het bepalen van de strafmaat maar nu is ze in staat dit op een preciezere manier te doen. Je zou het ook als een zorgelijke ontwikkeling kunnen opvatten. Het gebruik van algoritmen mechaniseert dat proces namelijk. En de rechter gaat zwaarder tillen aan die aspecten die je kan meten (zoals de kans op herhaling) en minder aan onmeetbare aspecten (zoals sociale invloed).

Maar, ik hoop dat het voorbeeld ook meer fundamentele vragen oproept. Verdien je als vrouw een lichtere straf omdat andere vrouwen minder vaak een tweede misdrijf hebben gepleegd? Of verdien je als allochtoon een zwaardere straf omdat andere allochtonen draaideurcriminelen bleken te zijn? Als het goed is voelt dat idee niet helemaal goed. Ineens blijkt de weging van individuele omstandigheden af te hangen van allemaal groepslidmaatschappen. Dat gaat tegen het gelijkheidsbeginsel in. Het is klassenjustitie.

Als je als individu voor de rechter staat dan wil je je als individu beoordeeld worden. Maar, vreemd genoeg moet de rechter dan heel terughoudend zijn met het wegen van persoonlijke omstandigheden. Want hoewel de rechter niet letterlijk Bayesiaanse wiskunde gebruikt, is het onderliggende denkproces natuurlijk vergelijkbaar. Elke inschatting over een omstandigheid is gebaseerd op groepslidmaatschap: andere gevallen waar die omstandigheden ook speelden. De paradoxale conclusie is dus dat het meewegen van persoonlijke omstandigheden het besluit minder persoonlijk maakt. Het gelijkheidsbeginsel vraagt eigenlijk om de a priori benadering: vaste straffen voor elk vergrijp.

Meer lezen?
In glazen bol besprak ik het gebruik van algoritmen bij de politie al kritisch. In groepsidentificaties en in eerlijk vergelijken lichte ik de relatie tussen groepslidmaatschappen en individuen al eens door. In IQ en waarheidsinjecties besprak ik al eens wat de impact kan zijn van een overdreven focus op metingen.

IQ

Ik houd een lijstje bij met slechtst begrepen wetenschappelijke begrippen en bijna bovenaan, ver boven relativiteit, staat IQ. Mensen schijnen over IQ onder andere te geloven dat het echt bestaat, dat we weten wat het is – èn dat we er nuttige dingen mee kunnen doen. Allemaal hardnekkige misverstanden. IQ vormt een perfect voorbeeld van wat er allemaal mis kan gaan als je iets gaat meten.

Even een prikkelend feitje over IQ: het IQ van de wereldbevolking gaat al jaren omhoog. Dit stijgende IQ wordt het Flynn-effect genoemd, naar de psycholoog James Flynn die liet zien dat de gemiddelde Amerikaan tussen 1932 en 1978 zo’n 10% slimmer was geworden. Of Amerikanen nog steeds elk jaar slimmer worden durf ik niet te zeggen, maar de rest van de wereld wordt dat blijkbaar wel.

Dat is natuurlijk heel erg fijn voor ons allemaal. Maar het roept ook heel erg veel vragen op. Want was het IQ niet een meting van een aangeboren eigenschap? Is intelligentie niet het best te begrijpen als een soort van talent om moeilijke dingen te snappen, te leren en misschien om in het algemeen handige dingen te doen? Hoe kan het dat de genen van onze soort zo snel veranderen dat we in razend tempo slimmer worden? Is er soms een sterke selectiedruk op intelligentie in onze maatschappij?

Het antwoord laat zich raden: intelligentietests meten helemaal geen intelligentie. Tenminste niet als je dat ziet als een aangeboren leertalent. IQ-tests stellen vast hoeveel lastige puzzels je in een bepaalde tijd kan oplossen. Ze meten dus breinprestaties op een bepaald moment en niet het leertalent wat daarvoor gezorgd heeft. Breinprestaties zijn natuurlijk van veel meer dingen afhankelijk dan je aangeboren talenten. Heb je meer scholing gehad, of specifieke IQ-testtraining? Dan doe je het beter op IQ-tests.

Nu zou je kunnen zeggen dat breinprestaties op een bepaald moment een aardige voorspeller kunnen zijn van leervermogen gedurende een bepaalde tijd, maar dan ga je er wel vanuit dat leervermogen een constante is. Dat hoeft natuurlijk niet zo te zijn. Steeds als je iets leert verandert je brein een beetje. Zou een dergelijke verandering niet ook kunnen zorgen dat je daarna gemakkelijker nieuwe dingen leert? Met andere woorden: zou het kunnen dat je leertalent afhankelijk is van wat je leert?

Veel wetenschappers denken tegenwoordig van wel. Dit wordt fluïde intelligentie genoemd. Onderwijs verhoogt niet alleen je vermogen om puzzels op te lossen, maar ook je vermogen om te leren om puzzels op te lossen. Intelligentie is niet alleen aangeboren: je kan ook leren om intelligent te zijn.

Daarmee blijft er weinig over de aannames achter de intelligentietest: intelligentie is een aangeboren eigenschap, die je kunt meten. Dat zou allemaal niet uitmaken als IQ-tests een aardige voorspelling zouden geven van dingen waar je wat aan hebt in het leven: bijvoorbeeld studiesucces of succes in een toekomstige baan. Maar ook dat blijkt tegen te vallen: IQ-tests kunnen bar weinig voorspellen. Niet alleen omdat de IQ-tests zelf niet deugen, maar ook omdat er meerdere soorten intelligentie zijn en omdat heel andere menselijke eigenschappen zoals doorzettingsvermogen of een houding ten aanzien van leren veel belangrijkere voorspellers blijken te zijn van later succes.

Ik heb zelf veel te danken aan een IQ-test. Mijn basisschooldocent dacht dat ik beter naar de Mavo kon, maar de IQ-test die ik deed wees Havo uit – en daar ging ik dus heen. Op de Havo – en later op de universiteit – ontwikkelde ik vervolgens veel van mijn huidige talent om te leren. Ik dank mijn IQ dus aan een IQ-test. Want stel je eens voor dat die test Vmbo had uitgewezen, dan was ik vast lang zo slim niet geworden. IQ-test worden dus eigenlijk verkeerd gebruikt. We doen alsof IQ-tests iets belangrijks kunnen voorspellen, maar ze veroorzaken dingen.

Dat is niet erg als ze positieve dingen zouden veroorzaken, zoals in mijn geval, maar vaker gebeurt het tegenovergestelde. We gebruiken de IQ-test tegen de laatbloeiers in onze samenleving. Ben je niet snel genoeg slim geworden, dan krijg je dankzij het gebruik van de IQ test geen kans meer om van een dubbeltje naar een kwartje te groeien. Naar vind ik dat.

Als we de balans opmaken voor IQ-tests komen we op het volgende ontluisterende lijstje. IQ-tests maken op basis van breinprestaties op een bepaald moment een schatting van het gemiddelde leervermogen tot dan toe, waarbij de omgeving weggedacht is en het feit dat leertalent kan veranderen weggedacht wordt. Vervolgens doen we net alsof dat IQ allerlei successen kan voorspellen, terwijl we allang beter weten. IQ meten is een beetje koffiedik kijken in psychologie-vermomming.

Dat roept de vraag op hoe het zo ver heeft kunnen komen… Hoe verklaren we de populariteit van de IQ-test als het ding zo overduidelijk niet deugt? Een deel van het antwoord is dat we pas sinds kort weten wat er allemaal mis is met IQ-tests. Je hebt behoorlijk wat tijd nodig om te meten hoe goed een test studiesucces kan voorspellen en wat eventueel betere voorspellers zijn. Ook het idee van fluïde intelligentie is vrij nieuw en hoe fluïde onze intelligentie precies is, is niet bekend. Dat maakt het moeilijk inschatten wat je wel en niet uit een IQ-test kan voorspellen.

Toch denk ik dat er een belangrijkere reden is voor de aanhoudende populariteit van IQ en de IQ-test en dat is deze: het meten van dingen maakt ze tastbaar. Dingen die je in een getal kan uitdrukken zijn echt. Kilometertellers maken afstanden tastbaar, klokken maken de tijd tastbaar en IQ-tests maken intelligentie tastbaar.

Veel van ons hebben wel eens een IQ-test gedaan. Als ik zelf een IQ van 120 heb, dan moet intelligentie wel bestaan. Hoe kan je het anders meten? Dat is misschien een cirkelredenering, maar tegen de achtergrond van mijn eigen IQ van 120, lijken die verhaaltjes over fluïde intelligentie en slechte voorspellende waarde echt een beetje geneuzel. Mijn indrukwekkende IQ staat immers zo vast als een huis.

Mijn voorspelling is dus dat IQ-tests, ondanks de aanzwellende kritiek, nog tot in jaar en dag tot de vaste uitrusting van de psychologen blijven behoren. Werkgevers willen weten wat het IQ is van het personeel dat ze gaan aannemen. De mensen willen weten wat hun IQ is. Dus blijven we het meten en als we het kunnen meten dan zal het wel bestaan.

En laat dat dan een les zijn voor als je zelf eens iets onzichtbaars aan de man wil brengen: of het nou om astrologie, aardstraling, één of ander -isme of om boze geesten gaat… Zorg voor een betrouwbare meting en je zit gebeiteld!

Meer lezen?

In waarheidsinjecties betoog ik dat we teveel proberen te meten in deze samenleving. In doeloorzaken bespreek ik een andere tactiek om moeilijke dingen te begrijpen. In evolutiesnelheid stel ik misverstanden rondom de evolutietheorie aan de kaak. In zelfvervullend bespreek de self-fulfilling prophecy in meer detail.