Nobel

De week waarin de Nobelprijzen worden uitgereikt vind ik altijd spannend. Zelf ben ik natuurlijk geen kanshebber en vaak ken ik de prijswinnaars ook helemaal niet. Maar de Nobelprijs is een bijzondere prijs. Zeker de prijzen voor natuur en scheikunde – en vaak ook die voor economie –  zetten onderzoek in het zonnetje dat toen het werd uitgevoerd heel fundamenteel en soms onzinnig leek, maar waarvan door de jaren heen gebleken is dat er veel nuttige toepassingen uit zijn voortgevloeid. Dat is vrij uitzonderlijk: veel fundamenteel onderzoek is helemaal niet zo direct tot toepassingen te herleiden; en het levert altijd een mooi verhaal op: hoe een of andere bizarre zoektocht van een of andere wetenschapper ons uiteindelijk allemaal raakt.

Dit jaar ging de Nobelprijs voor de chemie bijvoorbeeld naar John Goodenough, Stanley Whittingham en Akiray Yoshina voor fundamenteel onderzoek dat de basis legde voor de oplaadbare batterijen in onze telefoons en andere draagbare apparaten – en natuurlijk elektrische auto’s. Dit werk stamt uit de jaren 70 van de vorige eeuw. Geen van deze moderne toepassingen was in die tijd in het zicht. Het was toen al prachtig werk, en het bleek een noodzakelijke schakel te vormen in latere technische ontwikkelingen die het gezicht van de huidige tijd bepalen. .

Of niet? Hoewel veel mensen de Nobelprijs op deze manier aangrijpen om het belang van fundamenteel onderzoek voor de maatschappij nog eens te onderstrepen, denk ik dat ze het Nobel-verhaaltje te serieus nemen. Natuurlijk ben ik een voorstander om stevig te investeren in fundamenteel onderzoek, maar dat er soms jaren later nuttige toepassingen uit voortvloeien vind ik een slecht, onwetenschappelijk, argument voor dat type onderzoek.

De drogredenering die onder de letterlijke interpretatie van het Nobelprijsverhaaltje zit doe ik uit de doeken in mijn blogje stokoude kennis . Zoals ik daar al stel: je kunt voor elke bestaande toepassing wel fundamentele kennis aanwijzen die er aan ten grondslag ligt, maar dat zegt niet zoveel. In verreweg de meeste gevallen was die toepassing er ook wel gekomen zonder dat specifieke stukje onderzoek. Soms omdat de toepassing ronduit voor de kennis uitliep: de ontwikkeling van de thermodynamica is een gevolg van de ontwikkeling van de stoommachine en niet andersom, maar meestal omdat de anders gewoon iets later door andere wetenschappers ontwikkeld zou zijn. Niemand is onmisbaar voor de tand des tijds, die kan echt wel wachten op de tweede of derde uitvinder.

Je kunt dus wel fundamenten aanwijzen bij een bepaalde toepassing, maar daarmee heb je geen bewijslast aangeleverd voor de stelling dat dat specifieke onderzoek een noodzakelijke of zelfs maar een belangrijke schakel was in de ontwikkeling van die toepassing. Het beste wat je achteraf kan zeggen is dat het best van pas kwam. Het belang van fundamenteel onderzoek in het algemeen kun je er al helemaal niet uit afleiden, want dan moet je ook al dat fundamentele onderzoek meerekenen waar nooit iets nuttigs uit is voortgevloeid.

Daar komt nog bij dat de Nobelprijs met zevenmijlslaarzen door de geschiedenis fietst. Het is niet het oorspronkelijke, nogal explosieve, 2 V batterijtje van Wittingham dat in onze telefoons zit. Voor dat die gemaakt kon worden waren nog honderden of misschien wel duizenden nieuwe ontdekkingen en ontwikkelingen nodig. Er ging niet voor niets 50 jaar overheen. Hoe verhoudt de mankracht die in het fundamentele onderzoek zit zich eigenlijk tot de mankracht die nodig was om die batterijen echt werkend te krijgen?

Je kunt allerlei redenen hebben om fundamenteel onderzoek in het zonnetje te zetten. Dat er soms mooie toepassingen uit voort komen spreekt tot de verbeelding, maar het is misleidend. De rol die het betreffende onderzoek écht heeft gespeeld voor die toepassingen is niet precies te achterhalen en vermoedelijk relatief klein.

Natuurlijk kunnen toepassingen en fundamentele kennis elkaar informeren en het is een Nobel-feestje waard om die bevruchting te vieren, maar dat feestje deugt op haar beurt niet als rechtvaardiging voor het bestaan van fundamenteel onderzoek. Daarom denk ik dat het contraproductief is om (oud) fundamenteel onderzoek te rechtvaardigen door te wijzen op moderne toepassingen. Als het argument niet klopt prikt iemand er op een dag doorheen.

Ik denk dat het beter is om het nut van fundamenteel onderzoek te verdedigen aan de hand van de waarde die het in het hier en nu voor ons heeft. Er zijn verschillende manieren waarop je dit kan doen, maar ik zie het nut van fundamenteel onderzoek vooral vanuit zijn invloed op ander onderzoek. In fundamenteel onderzoek verkennen we wegen die we niet zouden verkennen als we ons druk maakten over toepassingen. Fundamenteel onderzoek vergroot zo onze horizon; het maakt ons slimmer. Als fundamenteel onderzoek andere wetenschappers, fundamenteel, of toegepast op een nieuwe manier aan het denken zet is het goed onderzoek.

En of het ooit de lange weg naar een praktische toepassing vind? Ach.

Meer lezen?
In stokoude kennis bespreek ik uitgebreider waarom de toepassingen van nu niet herleidbaar zijn tot de oude kennis van toen. Ik ben van plan een blogje te schrijven over valorisatie waar ik nog eens in ga op kennis die wel tot toepassingen moet leiden.

Voor de informatie over de Nobelprijzen van dit jaar heb ik vooral gebruik gemaakt van het artikel daarover in het NRC, ik kende het onderzoek zelf niet voor de prijs uitgereikt werd. Ik heb me in deze post geconcentreerd op de verbinding die in de Nobelprijzen wordt gelegd tussen onderzoek en toepassing, maar ook andere aspecten van de Nobelprijs, zoals de focus op een individueel genie zijn kritiek waar. In Chemistry World verscheen daarover dit artikel.

Evidence-based Practice

Zou het niet mooi zijn als professionals hun handelen wat meer zouden baseren op wetenschappelijk bewijs? Zodat leerlingen onderwijs krijgen waarvan we weten dat het werkt; zorgverleners die dingen doen die objectief het beste zijn voor hun patiënten; en zodat – waarom ook niet? – accountants de boeken op de best denkbare manier controleren? Het is eigenlijk moeilijk om daar tegen te zijn, toch? Nou ja, je raad het al…. Ik vind op zijn minst dat een paar kanttekeningen op hun plaats zijn.

Een van de lastige dingen van het bespreken van evidence based practice – het gebruiken van wetenschappelijk bewijs in de praktijk dus – is dat er verschillend varianten van het idee bestaan. De strikte variant legt de nadruk op de wetenschappelijkheid van het bewijs dat gebruikt wordt. De zachte variant legt vooral de nadruk op het gebruik van bewijs in de praktijk.

In de strikte variant moeten professionals dus op de hoogte zijn van de uitkomsten van wetenschappelijk onderzoek en hun praktijken daarop baseren. De strikte variant stelt eigenlijk dat het enige bewijs dat professionals mogen gebruiken, wetenschappelijk van aard zou moeten zijn. In de zachte variant moet een professional óók zoveel mogelijk bewijs gebruiken, maar dat hoeft niet persé wetenschappelijk te zijn. Een professional mag in de zachte variant ook zelf bewijs verzamelen door collega’s of haar doelgroep te ondervragen of door dingen aan hen voor te leggen. Met die zachte variant is ook van alles mis, maar dat bespreek ik later nog eens. In dit blogje wil ik vooral de strikte variant eens onder de loep nemen.

Laat me duidelijk zijn: ik ben een voorstander van evidence based medicin. Ik vind het belangrijk dat medische behandelingen die ik onderga eerst wetenschappelijk bewezen zijn. Behandelingen die die toets der kritiek niet kunnen weerstaan zoals gebedsgenezing, acupunctuur en homeopathie, kunnen bij mij rekenen op veel scepsis. Maar de vraag is volgens mij of dit idee van evidence based medicin te verplaatsen is naar onderwijs, (zachte) zorg en accounting; of dat die vakgebieden juist om een wezenlijk andere benadering vragen?

Mijn antwoord laat zich raden. Ik denk dat zorg, onderwijs en accounting anders zijn. In mijn ogen is evidence-based-practice namelijk gebaseerd op een one-size-fits all gedachte terwijl deze vakgebieden -goede accountancy misschien uitgezonderd – eerder vragen om professioneel maatwerk. Maatwerk is nooit gebaseerd op een enkele bron van bewijs. Maatwerk stelt de situatie of de omgeving centraal waarin bepaalde ingrepen effectief kunnen zijn, terwijl veel wetenschappelijk werk die afhankelijkheid van context juist buiten beschouwing laat.

Dat zit hem in wat telt als wetenschappelijk bewijs. De heilige graal van aanhangers van evidence based practice aanhangers is vaak de randomised controlled trial (RCT). Het idee van een RCT is dat we onderzoeken of een benadering werkt ongeacht van wie het ondergaat of van wie het uitvoert. Één groep patiënten krijgt een medicijn, een andere groep krijgt een nepmedicijn. Niemand weet wie in welke groep zit, de patiënten niet, de doctoren niet, de onderzoekers niet. Hierdoor kunnen we vaststellen of een medicijn werkzaam is los van de context: wie de patiënt is, wie de behandelaar is, hoe het contact tussen die twee verloopt. De bedoeling is immers om de effectiviteit van een bepaalde benadering contextvrij vast te stellen; dus zonder rekening te houden met de capaciteiten van de betrokken professionals en de individuele behoeften van patiënten of gebruikers. En dat is meteen de grote zwakte.

Zeker: als een medicijn door een RCT komt weten we zeker dat het werkt voor de meeste behandelaars en de meeste mensen. Dat is waardevolle kennis voor behandelaars. En ik zou zeker niet willen dat ze dingen voorschreven waarvan de werkzaamheid niet is aangetoond.

Maar, nu die leraar. Die bijvoorbeeld rare grappen maakt om de aandacht vast te houden. Mag hij dit wel doen als niet wetenschappelijk is aangetoond dat het werkt?

We willen zeker graag dat docenten zich bedienen van methoden waarvan we weten dat ze werken zoals het gebruik van passende werkvormen, waaronder directe instructie. Daar heeft hij een opleiding voor genoten. Maar de grappen die hij maakt horen daar niet bij. Het interesseert ons niet of die voor alle docenten en alle leerlingen werken.

Sterker nog dat soort generalisaties zit misschien alleen maar in de weg. De details van zijn werk: hoe hij een relatie opbouwt hoe hij verschillende leerlingen verschillend aanpakt, de duizenden andere beslissingen die een docent elke dag weer maakt? Die zijn aan het professionele oordeel van de docent. Dat finetunen moet hij zelf doen, dat vraagt om fingerspitsen gefühl. Je wil dat zijn aandacht in de klas is bij hoe zijn leerlingen reageren, niet bij wat de wetenschap er van zal vinden. Dit zijn contextspecifieke beslissingen, daarover kunnen RCT’s geen uitspraken doen.

Wat we van een docent willen is dat hij goed waarneemt, ervaringskennis gebruikt, fouten maakt en daarvan leert binnen een grofmazig wetenschappelijk kader. Nu is dat in de medicijnen niet anders. Artsen, zeker huisartsen voegen dat stukje professionaliteit aan de wetenschap toe dat het mogelijk maakt mensen goede zorg te leveren, zonder ze te reduceren tot een statistiek. De evidence based practice discussie is dus, zoals zo vaak geen zwart-wit discussie. Het is vooral een gevecht om ruimte. Hoe strak moeten de wetenschappelijke kaders zijn en met hoeveel autonomie gedijen professionals.

Interessant genoeg, wordt deze discussie niet op basis van wetenschappelijk bewijs gevoerd. De wetenschappers trekken typisch aan de evidence based kant en onderbouwen hun standpunten met anekdotes over professionals die helemaal niet blijken te handelen naar hun mooie wetenschappelijke inzichten. De professionals trekken aan de autonomie kant en komen met allerlei uitzonderingen waar de wetenschap niets over te zeggen heeft, of zelfs het verkeerde zei. Volgens mijn komen we zo – al touwtrekkend dus – niet verder.

Je zou een meta-studie willen doen, waar afhankelijk van het vakgebied vergeleken wordt of het vergroten of juist verkleinen van de professionele ruimte beter werkt. Dan kunnen we het debat op een wetenschappelijke in plaats van een anekdotische manier beslechten. Mits we het eerst wel eens eens kunnen worden over de 1000000 dollar vraag: wat bedoelen we eigenlijk met “beter”?

Meer lezen?

Ik schreef al eens een kritisch stuk over de praktijk van evidence based medicin getiteld ongezond. Die misstanden doen natuurlijk niets af aan de principes. In verkoudheid bespreek ik dat er verschillende soorten bewijs en manieren om die te wegen zijn. In A Priori ga ik in op situaties waar je juist liever niet het beste bewijs inzet.

Significantie

Ik zou er een serie van kunnen maken. Het plot gaat ongeveer zo. Onderzoeker (m/v) wil grip krijgen op een probleem. De onderzoeker ontwikkelt een meetinstrument. Met succes: de ontwikkelde maat blijkt een prima middel om een beetje meer grip te krijgen op het probleem.

Maar dan gaat het mis omdat het tè goed gaat. Veel andere onderzoekers willen ook graag meer grip krijgen op het probleem. Iederen slaat aan het meten. Het instrument en de nieuwe maat worden populair en krijgen veel status. Sluipenderwijs verandert het instrument van gedaante. Ooit was het maar een middel, maar nu wordt het een doel op zich – nee hèt doel.

Het is een verhaal over hoogmoed en val. Of eigenlijk het verhaal van doctor Frankenstein, die macht over leven en dood wou en zodoende iets schiep dat hij niet meer in de hand had. Want een meetinstrument dat een doel op zich is geworden doet gewoonlijk meer kwaad dan goed. Als een uitkomst van een meetinstrument een doel wordt, gaan we de boel zo inrichten dat we hoog scoren op die uitkomst; vaak ten koste van dingen die nuchter beschouwd belangrijker zijn. We bedenken een lat om de wereld de maat te nemen maar de lat neemt ons de maat.

Eerder schreef ik zo’n verhaal over IQ, maar vandaag is er aanleiding statistische significantie: ofwel de p-waarde onder de loep te nemen. Die p-waarde wordt veel gebruikt, zo veel dat zo’n 800 wetenschappers een opiniestuk in het wetenschappelijke tijdschrift Nature ondertekenden dat pleitte voor het afschaffen ervan – of tenminste pleitten ze voor een andere omgang met de p-waarde.

Wat gaat hier mis? Die p-waarde is echt heel erg belangrijk. Het gaat feitelijk om een groep wetenschappers die er voor pleiten om het meest gebruikte wetenschappelijke gereedschap af te schaffen. Je kan ook lezen: “tuindersvereniging protesteert tegen het gebruik van heggescharen” of “ANWB pleit voor het afschaffen van wielen”. Niet echt het nieuws dat je verwacht.

De p-waarde meet de kans dat een wetenschappelijke bevinding toeval kan zijn. De kans op kans. Als je de lengte van de jongens in de klas meet en de lengte van de meisjes en je vindt dat de jongens gemiddeld 1,3 cm langer zijn, dan wil je vaak ook weten of dit in alle klassen zo is óf alleen in jouw klas. Er is best een kans dat er in jouw klas toevallig een paar extra lange jongens zaten terwijl dat in andere klassen helemaal niet zo is en jongens dus ook niet gemiddeld langer zijn. Als je die mogelijkheid niet kan uitsluiten ga je niet zomaar roepen dat jongens gemiddeld langer zijn dan meisjes.

Daarvoor is dus statistiek uitgevonden. Of een uitkomst van een experiment toeval is weet je natuurlijk nooit helemaal zeker, maar op basis van het soort meting, hoeveel metingen je gedaan hebt en de spreiding kan je een aardige schatting maken over of de kans groot of klein is dat je elders hetzelfde zal vinden: de p-waarde.

Die p-waarde is populair. Of eigenlijk: zij is zò populair dat ze een norm is geworden. Het is knap lastig om nog resultaten te publiceren als de kans dat het toeval is wat je gevonden hebt niet kleiner is dan 5%, of liever nog 1%.  Zeker als je een sociaal wetenschapper bent.

Is dat slecht? Nou misschien. Het bespaart ons zeker van een hoop onzinbevindingen die zonder de p-waarde misschien enorm serieus genomen zouden worden.

Maar, de ellende met de p-waarde als norm is natuurlijk dat wetenschappers – mensen – proberen die waarde op te krikken. Ze nemen meer proefpersonen, ze sluiten erg afwijkende proefpersonen uit, een enkeling verzint misschien wat data. Ik zou hier een hele lijst misstanden kunnen noemen, maar het punt is steeds: de p-waarde is het doel geworden in plaats van de waarheidsvinding. Einde wetenschap.

En dat is wat die onderzoekers van dat manifest dwars zit. Misbruik, verkeerd gebruik en onbegrip waardoor waardevolle bevindingen verloren gaan en waardeloze bevindingen enorm belangrijk gevonden worden. Daarom stellen ze voor om de p-waarde-norm los te laten en de p-waarde weer een bescheidener plek te geven naast datgene waar het écht om draait: het effect en de grootte daarvan.

Mijn steun hebben ze: dat moge duidelijk zijn, maar of het kansrijk is durf ik te betwijfelen. Ik begin te ontdekken dat normen makkelijker ontstaan dan dat ze verdwijnen. Natuurlijk is je er tegen uitspreken het begin: maar dan begint de lange, lange weg om de praktijk te veranderen. Of deze wetenschappers daar zo goed in zijn als in zich uitspreken? We gaan het zien.

Meer lezen?

Ik schreef al eens hoe enorm overschat de IQ test is en wat daar de gevolgen van zijn. Meer in het algemeen stelde ik vragen bij een doorgedreven vorm van empirisme in waarheidsinjecties. Het vergelijken van groepen (mannen en vrouwen bijvoorbeeld) stelde ik aan de kaak in groepsidentificaties en in eerlijk vergelijken.

Sanne Blauw besprak op de Correspondent op heldere manier wat de p-waarde is en waarom wetenschappers hem willen afschaffen. Het oorspronkelijke Nature artikel vind je hier.

Poetsvissen

Poetsvissen hebben zelfbewustzijn! Althans… er is en poetslipvis door een test gekomen die vaak gebruikt wordt om dat te meten. De krant maakte er maar tussen neus en lippen melding van, maar het zou wel eens een heel belangrijke- zo niet ontwrichtende – bevinding kunnen blijken.

Goed, misschien wordt het maar één keer gevonden natuurlijk. Het zou kunnen dat die wetenschappers toevallig naar de Einstein onder de poetsvissen hebben zitten kijken. Of ze hebben het gedrag van die poetvissen verkeerd geïnterpreteerd. Dan waait het wel weer over.

Maar, anders…. Ik bedoel, het zou ook zomaar zo kunnen zijn dat dit experiment herhaald wordt. En dat dan heel veel poetslipvissen het blijken te kunnen. En misschien ook nog wel andere vissen. Dat gaat veel discussie geven. Òf het experiment word afgeschreven òf we gaan accepteren dat poetsvissen echt zelfbewustzijn hebben. In beide gevallen vind er een landverschuiving plaats in ons denken. Welke van deze twee opties het wordt zegt misschien wel meer over ons dan over die schattige beestjes.

Goed, waar hebben we het over? Poetslipvisjes zijn visjes van een centimeter of vier groot. Ze zijn langwerpig, hebben gekleurde en zwarte strepen en zijn meestal in de buurt van andere vissen te vinden. Ze eten namelijk dood weefsel en parasieten van andere vissen af. Vandaar die naam. Maar weten poetslipvissen wie ze zijn? Hebben ze een ego – een ik? Kunnen ze als het ware over zichzelf nadenken, zoals wij dat de godganse dag aan het doen zijn? Dat is eigenlijk de vraag die in dit experiment centraal staat.

Dat is een moeilijke vraag. We weten bijzonder weinig van wat dieren ervaren. We zijn ons wel bewust van sommige van onze eigen ervaringen, maar we kunnen natuurlijk niet inschatten of dieren dezelfde ervaringen hebben. Het probleem met ervaringen is namelijk dat ze subjectief zijn. We kunnen eigenlijk ook niet zeker weten of andere mensen ervaringen hebben.

Hoe weet je wat anderen ervaren? Daar is geen direct bewijs voor. Wat je kan doen is het afleiden uit gedrag. Als je samen met een vriend in een achtbaan zit en hij begint heel hard te gillen terwijl je zelf de adrenaline door je aderen voelt stromen en je maag voelt draaien, is het niet zo’n grote stap om te denken dat je vriend ongeveer hetzelfde ervaart als jij. De omstandigheden zijn namelijk hetzelfde en het gedrag van je vriend is ook ongeveer hetzelfde als het jouwe, dus dan zul je wel ongeveer hetzelfde ervaren.

Bij dieren is dat lastiger natuurlijk. De verschillen in omstandigheden en gedrag zijn nu eenmaal groter. Maar wat dieren ervaren is wel een vreselijk belangrijke vraag omdat het iets zegt over hoe we ons ten opzichte van andere dieren mogen gedragen.

Veel mensen gaan er van uit dat dieren geen bewustzijn hebben, zeker niet dieren die we op willen eten. Insecten kun je zonder problemen doodslaan en ook vissen kunnen volgens sommige mensen geen pijn voelen. Varkens gillen wel als ze onverdoofd gecastreerd worden, maar dat is aanstellerij. Honden hebben weer bovennatuurlijk bewustzijn, die voelen het al aan als er iets ergs gebeurd met de baas, voordat ie het huis binnenkomt. Nou ja. Je weet wel hoe er zoal over gepraat wordt. Feitenvrij.

Dus… hoe kan je wel op een betrouwbare manier zicht krijgen op het bewustzijn van dieren. Hoe zou je kunnen bewijzen dat dieren bewustzijn hebben, bijvoorbeeld? Daar komt het spiegelexperiment om de hoek kijken. De psycholoog Gordon Gallup bedacht het in de jaren 70. Het spiegelexperiment was een manier om te onderzoeken of apen, primaten bijvoorbeeld, misschien ook zelfbewust waren, net als mensen.

De meeste dieren worden agressief als ze in de spiegel kijken, maar op een gegeven moment wennen ze er aan. Gallup liet apen wennen aan de spiegel. Vervolgens bracht hij iets op het lijf aan, zoals een vlek of een sticker, die de dieren alleen via de spiegel konden zien. Sommige apen gingen die vlek vervolgens inspecteren. De conclusie moest wel zijn dat de dieren zichzelf in de spiegel konden herkennen.

Een van de interessante dingen aan de spiegeltest is dat niet alle dieren er voor slagen. Het lijstje bestaat eigenlijk alleen uit dieren die ook ander intelligent gedrag vertonen: Bonobo’s, Dolfijnen, Orca’s, Olifanten en Eksters. Er zijn ook veel dieren die we als bijzonder intelligent beschouwen zoals honden, katten, – en ook allerlei apen – die zakken voor die test. Zelfbewustzijn is niet ieder dier gegeven.

En nu blijken poetslipvissen dus ook door te test te komen. Poetsvissen gaan vlekje van zichzelf proberen te verwijderen, nadat ze die in de spiegel gezien hebben. Dat is een tikje onverwacht en, om heel eerlijk te zijn, vrij ongemakkelijk.

De bevinding morrelt namelijk aan ons wereldbeeld. Wij zien onszelf heel graag als een uitzondering in de natuur. Dat wordt met twee dure woorden exceptionalistisch antropocentrisme genoemd. De gedachte is dat mensen zijn geen ‘gewone’ dieren zijn, maar dat ze zich op de een of andere manier onderscheiden. Ze zijn door taal, cultuur, intelligentie of technologie ver boven andere diersoorten verheven. Als zodanig hebben mensen ook andere rechten en plichten in de natuur.

De uitzonderingspositie voor de mens in de natuur zie je terug in allerlei oude teksten, zoals de bijbel – en is het nog altijd heel sterk aanwezig in ons denken. Dat is ook niet zo vreemd. Zolang andere dieren niet in steden wonen, autorijden en Netflix kijken – is het toch moeilijk om ze als volledig gelijkwaardig te zien.

Maar, het exceptionalisme, gaat wél tegen de ideeën van Charles Darwin in. Darwin was een gradualist. Hij erkende dat er verschillen waren tussen verschillende dieren, maar die waren in zijn ogen altijd klein. Soorten evolueerden stukje bij beetje naar andere soorten. Die gedachte betekende voor het bestuderen van de mens dat je beter kon kijken naar wat we allemaal gemeen hadden met andere dieren, dan naar wat die zogenaamde harde verschillen waren. Zo konden we zien waar die dingen die ons bijzonder maken vandaan kwamen en we zagen wat ooit het evolutionaire voordeel ervan was.

De spiegeltest vormt een prettige middenweg tussen het gradualisme en het exceptionalisme. De test laat zien dat andere dieren óók zelfbewustzijn hebben – en dat het dus niet iets unieks menselijks is, maar het plaatst de mens ook in een zéér select gezelschap van hoogst intelligente dieren die (blijkbaar) op de een of andere manier ‘hoger’ zijn dan andere dieren. Bonobo’s, olifanten en walvissen – enzovoorts.

De uitzonderingsbevestiging die in het spiegelexperiment omsloten zit komt op losse schroeven te staan als lagere dieren, zoals mieren en poetsvissen er voor gaan slagen. Wat moeten we met een experiment waar honden voor zakken, maar poetsvissen voor slagen?

Je kan daar verschillende kanten mee uit. De eerste weg is om het experiment zelf te bekritiseren. Dat is wat je geneigd bent te doen met experimenten die niet in je wereldbeeld passen. In dat geval hou je dus vast aan het idee van hogere en lagere dieren en van zelfbewustzijn als een eigenschap van hogere dieren – en dan probeer je te laten zien waarom het spiegelexperiment niet noodzakelijk zelfbewustzijn aantoont. Dit is een strategie die veel wetenschappers op dit moment volgen.

Iets radicaler is het om de uitkomsten van het experiment te accepteren en vragen te stellen over het hiërarchische idee dat in het spiegelexperiment omsloten zit. Je zegt dus: “het is voorlopig de vraag wie voor het spiegelexperiment slagen en wie zakken, dat zouden mieren of meelwormen kunnen zijn, of poetvissen, of struisvogels – maar alle dieren die slagen hebben zelfbewustzijn en dieren die zakken niet”.

Dit de radicale variant. Het plaatst zelfbewustzijn buiten de indicatoren van de ‘hoogte’ van een diersoort en het stelt indirect vragen over het hele idee van hogere en lagere diersoorten. Dieren zijn verschillend: niet ‘meer’ of ‘minder’. Dat werk.

Ik heb al op verschillende momenten door laten schemeren dat een keuze voor één van beide vormen uit kan maken voor wat we acceptabel menselijk gedrag vinden. Als er ‘lagere’ dieren bestaan; zonder ‘subjectieve ervaringen’ dan kunnen we die met een gerust hart op een industriële manier telen of verbouwen. Als zulke dieren veel meer op ons lijken als dat we nu toe willen geven, dan wordt het moeilijker. Zo zouden de, zichzelf herkennende, poetsvissen zomaar iets kunnen betekenen voor onze -duidelijk veel intelligentere – varkens. Het is me wat!

Meer lezen?

Ik schreef over het vraagstuk van intelligentie van anderen in Brein in een vat. Ik schreef over de evolutietheorie in Evolutiesnelheid, Memen en Cultuurdragers. Ik schreef eerder over dierexperimenten in Eksters.

Dit blogje is gebaseerd over een berichtje in het NRC over poetslipvissen. Ook de Volkskrant belichte het onderwerp.

Nog voor dat poetslipvissen door de spiegeltest kwamen lukte dat een bepaalde mierensoort. Dit is op de een of andere manier minder controversieel, omdat bij mieren het nog moeilijker is om de hypothese dat ze echt ‘zelfbewustzijn’ hebben overeind te houden dan bij poetslipvissen.

Calimero

Nu we na decennia babbelen over de klimaatverandering eindelijk in actie lijken te komen, breken gouden tijden aan voor argumentatie-antropologen. De ‘na mij de zondvloed types’ in ons land willen natuurlijk best een beetje inschikken met hun Hummers, maar niet zonder eerst nog even flink wat verbaal vuurwerk af te steken. Dus rapporteert de Telegraaf in chocoladeletters over “klimaathysterie” en “klimaatindustrie” en buitelen de drogredenen en complottheorieën op sociale media als vanouds over elkaar heen. Over het woordenspelletje dat de Telegraaf nu probeert te spelen sprak ik al eens in betekenisdrift, dus daar hoef ik nu niet zoveel aan toe te voegen, maar er zijn zeker argumenten in deze discussie die een nieuw blogje waard zijn.

Zoals bijvoorbeeld het argument waar ik me het meest over verbaasd heb: het Calimero-argument. Het gaat ongeveer als volgt. (1) Wij zijn maar een heel klein landje. (2) Dus moeten we vooral niet vooroplopen met klimaatmaatregelen. (3) Want wat wij doen helpt bijna niets én (4) misschien doen de anderen wel niet mee.

Zucht. En zij zijn groot en wij zijn klein. Het is een venijnig argument omdat het zo redelijk en lekker veilig klinkt. Eerst maar eens kijken of de grote jongens wel meedoen, dan kunnen wij onze paar centen ook wel inleggen; en tot die tijd is er toch niet veel verloren. Getekend: diverse politieke partijen, waaronder het CDA.

Het deugt natuurlijk niet hè? Het klimaatprobleem is een typisch geval van wat economen de tragedy of the commons noemen. Als er een handvol boeren zijn die hun koeien op hetzelfde gras (de commons) laten grazen zijn de individuele belangen van de boeren niet te rijmen met het gemeenschappelijke belang.

Voor elke boer afzonderlijk is het handig om een paar extra koeien op het gras te laten: dat levert meer melk op. Zolang er genoeg gras is tenminste: dus het is in het gemeenschappelijke belang om juist niet teveel koeien los te laten. Als alle boeren een extra koe nemen is het gras zo verdwenen.

De tragedie is dat er een kale vlakte ontstaat als alle boeren hun individuele belang voorop stellen en alle boeren dan failliet gaan. Slimme boeren denken dus niet alleen aan zichzelf, maar maken afspraken over hoe veel koeien ze laten grazen en houden zich er aan. Zodat alle koeien, ook die van de boer zelf, altijd genoeg gras hebben.  Ze plaatsen het gemeenschappelijke belang vóór het eigenbelang.

Zo zit het ook met het klimaat. We dragen allemaal bij aan het klimaatprobleem en hebben er allemaal baat bij dat het opgelost wordt. We hebben in Parijs afgesproken minder uit te stoten en het is in ons gemeenschappelijke belang dat ook te doen. Als Calimero alleen maar aan zichzelf denkt is het vast beter om even te wachten met die klimaatmaatregelen, maar dat najagen van het eigenbelang is juist wat het probleem veroorzaakt. Het kan dus niet de oplossing zijn. Tijd om wakker te worden. Er is nauwelijks gras meer. Iedereen, ook Calimero, moet het gemeenschappelijke belang voorop gaat stellen.

Het wijsspelletje dat hier gespeeld wordt is ook alomtegenwoordig. Het maakt helemaal niet uit hoe groot of klein je bent. Burgers wijzen naar de grote bedrijven. Kleine landen wijzen naar grote landen. Grote landen wijzen terug. Arme landen wijzen naar rijke landen. Iedereen wijst naar Amerika.

Maar het gaat niet om wie het meeste gras eet. Het is dit keer juist gèèn wedstrijd. Iedereen eet nu al meer dan haar deel. De meeste Nederlands burgers eten teveel gras. Het bedrijfsleven eet teveel gras. Andere landen, groot en klein, eten teveel gras. We moeten allemaal minder gras gaan eten en zolang we naar elkaar blijven wijzen verandert er niets. Bovendien ben je pas in een positie om iets te zeggen van wat anderen doen, als je eigen gebruik een beetje op orde hebt. Hoe groot of klein je ook bent.

Dat het moreel onjuist is om klimaatmaatregelen uit te stellen betekent natuurlijk niet dat het ook onhandig is. Misschien is afwachten gewoon goede realpolitik. Het commons-spel wordt nooit helemaal eerlijk gespeeld en wie weet kunnen we ons wel in een betere positie sjoemelen door iets later in te stappen. Daarom intrigeert het woord vooroplopen in het Calimero-argument me. Wat zou een voormalig gidsland kunnen winnen bij een beetje achterop lopen?

Ik kan wel wat dingen bedenken, maar de belangrijkste is de overloopredenering. Nederland is natuurlijk geen eiland. Als wij strenge klimaatregels gaan hanteren terwijl andere landen er met de pet naar gooien, dan gaan die vervuilende bedrijven, vliegtuigen en personen wel ergens anders heen. De wereld wordt daar niet schoner van en wij verdienen er veel minder door. Erger nog als die bedrijven eenmaal weg zijn komen ze misschien wel nooit meer terug en ondervinden wij blijvend schade aan onze economie, alleen maar omdat we zo nodig de eerste wilden zijn.

Nu lopen sommige dingen wel sneller over dan andere. Mensen die in het Oosten wonen pakken misschien net zo lief in Frankfurt het vliegtuig, maar daarmee zit Schiphol niet ineens zonder reizigers. Veel mensen vinden het sfeertje op Schiphol prettiger en voor veel mensen voelt het dichter bij. Daarom blijven ze heen gaan, ook als het wat duurder is. Zo zit het ook met bedrijven. Een bedrijf verplaatsen kost veel geld en moeite dus je gaat je geluk pas in het buitenland beproeven als je daar heel goede redenen voor hebt.

Overlopen is zo makkelijk nog niet. De kosten om je persoonlijke routine te verleggen of om de bedrijfsvoering aan te passen, worden switching costs genoemd en ze zijn vaak een reden om je geluk juist niet elders te beproeven. Tenzij je er vertrouwen in hebt dat het daar blijvend beter gaat zijn. Vaak zijn de switching costs te hoog om een overstap te rechtvaardigen. Daar komt nog bij dat de angst dat bedrijven die overstappen voorgoed weg zijn ook nog eens gebaseerd is op een asymmetrie. Een overstap naar het buitenland is zo gebeurd, maar om terug te komen zijn die switching costs ineens veel te hoog?

Eigenlijk is die overloopredenering dus ìn en ìn pessimistisch. Het doet alsof wij heel onpopulair zijn en niemand bij ons wil horen. Het drukt  ook pessimisme uit over de toekomst en hoe anderen dan met het klimaat zullen omgaan. In een wereld waar iedereen haar klimaatbeleid gaat aanscherpen, nu of in de iets verdere toekomst, heeft overlopen niet zoveel zin. En dan is het voor een klein gidslandje als Nederland ook helemaal niet zo erg om voorop te lopen in de verduurzaming.

Daarmee is het overloopargument gewoon een onderdeel van het wijsspelletje dat toch al in het Calimero-argument omsloten zit. Wij zijn bang dat anderen misschien niet meedoen en daarom doen we nog maar even niets. Waarmee we onszelf blootstellen aan de risico’s die met klimaatverandering gepaard gaan én voorkomen dat we in een positie zijn om er wat van te zeggen als anderen inderdaad niet mee blijken te doen. Dat lijkt me heel onverstandig.

Ik kan wel eens boos en verdrietig worden van hoe we op het moment aan pessimisme ten onder gaan. Als het niet zo vreselijk was, zou je de mensheid nu zien als een bedreigde diersoort die het aan zichzelf te danken heeft. Panda’s hebben bijna nooit seks en eten met hun dieet van bamboe wel heel eenzijdig. Mensen wijzen naar elkaar tot ze een ons wegen en stoken ondertussen de planeet zo warm dat die onleefbaar wordt. Natuurlijk red je het dan niet als soort. Het is tragisch, maar ook wel een beetje aandoenlijk.

Meer lezen?

In betekenisdrift ga ik in op de vraag of woordgebruik invloed heeft op de gedachten. De Telegraaf rekent daar wel op, maar geloof er niet zo in.

In in opdracht van de tijd sprak ik ook al eens over hoe verwachtingen over de toekomst ons handelen bepalen. Ik was daar vrij kritisch over het gebruik van voorspellingen over de toekomst als raadgever.

 

 

Moeras

Veel metaforen die mensen voor kennis gebruiken idealiseren het begrip wel een beetje: een boom heeft structuur en groeit, containers zijn handig om dingen netjes in op te bergen, in netwerken is alles met alles verbonden, een kennisstroom gaat ergens heen. Dat zijn natuurlijk mooie eigenschappen, maar het zijn misschien meer eigenschappen waarvan we zouden willen dat kennis ze bezit dan dat dat ook daadwerkelijk zo is. Deze metaforen schilderen kennis eigenlijk af als het mooiste meisje van de klas, waar we jammer genoeg toch nooit mee gaan trouwen. Daarom gooi ik het nu eens over een totaal andere boeg. Wat als we kennis niet vergelijken met iets moois en verhevens, maar eerder met de stinkende, natte en zompige werkelijkheid van het moeras?

Als ze het durven toegeven zullen veel onderzoekers zullen het wel een treffende vergelijking vinden denk ik. Ik voel me bijvoorbeeld vaak als een soort Baron von Munchausen die zichzelf aan de eigen haren uit het moeras trok; met dat verschil dat het hem wèl lukte. Steeds als ik iets nieuws probeer te begrijpen is het zoeken naar houvast en structuur. Het lukt je wel eens ergens een takje vast te pakken om wat houvast te hebben; of om ergens een beetje vaste grond onder je voeten te voelen, maar je hoeft maar één stap te zetten en je zakt weer helemaal weg in de modder.

Ook als je geen onderzoeker bent, kun je iets met deze metafoor. Denk eens aan de voorzichtigste eerste stapjes die je soms zet om iets te begrijpen dat helemaal nieuw voor je is. Je probeert nieuwe begrippen altijd terug te brengen tot dingen die je al kent, maar omdat dat maar ten dele lukt kun je je behoorlijk verloren voelen. Er is geen overzicht: je krijgt je hoofd er nooit helemaal omheen; je hebt geen vaste grond om op te staan. Uiteindelijk krijg je natuurlijk wel meer begrip, je leert de omgeving van het nieuwe idee beter kennen, er ontstaan olifantenpaadjes waarlangs je weet dat het begrip benaderbaar is. Zo komt het langzaam binnen bereik. Maar owee als iemand een onverwachte vraag weet te stellen, dan ben je weer helemaal verloren. Als je het idee weer langs een nieuwe weg moet bereiken is de kans op natte voeten weer levensgroot.

Als een van de weinige kennismetaforen benadrukt het idee van kennis als een moeras hoe moeilijk leren en onderzoeken werkelijk zijn; hoe lastig, onvindbaar en slecht begaanbaar de wegen naar een nieuwe kennis – in je hoofd of in de wereld – kunnen zijn. Misschien verklaart dat waarom sommigen het opgeven en liever blijven bij wat ze al weten en kunnen, dan dat ze iets nieuws leren.

Dat geldt niet alleen voor individuen. Ook wetenschappelijke disciplines hebben hier last van, waardoor ze soms naar binnen gericht kunnen zijn. De filosoof Imre Lakatos beschreef disciplines eens als dingen met een harde kern van onbetwijfelbare waarheden, met daaromheen een ontwikkelingsgebied dat groter of kleiner kan zijn afhankelijk van de ouderdom van de discipline.

Het beeld van een vestingstad in een verder vrij onbegaanbaar moerasgebied dringt zich dan op. Binnen de discipline is vaste grond: in de vesting bestaan structuren en zekerheden, maar daarbuiten –tussen disciplines in- is het terrein veel onbegaanbaarder. Als wetenschapper heb je een keuze: blijf je veilig binnen de stad om er binnen de spelregels en structuren een betere plek van te maken, of ga je buiten de poorten op ontdekkingstocht uit. Mensen die kennis zien als een gebouw of als een boom, bekijken de kennis zoals die binnen de discipline is opgebouwd. Vaak zullen het ook mensen zijn die liever binnen de stad aan het werk zijn, dan ze er op uit trekken om de drassige omgeving te verkennen.

Geef ze eens ongelijk. Het moeras is koud en nat, je kunt er verdwalen en de kans dat je er een schat vind, of een nieuwe woonplek is bijzonder klein. Maar, nodig is dit soort werk net zo goed. Echt nieuwe kennis, of een brug of begaanbare weg tussen disciplines ligt misschien niet voor het grijpen, maar het is de moeite meer dan waard. Als de buurman niets nieuws wil leren en almaar vast blijft houden aan zijn eigen ideeën dan beschouwen we dat als lui of dom, terwijl we ons niet druk maken als wetenschappers datzelfde gedrag  vertonen.

Meer lezen?

Ik schreef over de voor- en nadelen van wetenschappelijke disciplines in helpt specialiseren. Ik besprak eerder andere metaforen voor kennis zoals de kenniscontainer, kennisstroom, kennisboom, kennisnetwerken en de geheugenmachine.

Ongezond

Als de dokter een medicijn voorschrijft dan mag je hopen dat hij zich goed geïnformeerd heeft, dat de werkzaamheid van het medicijn is aangetoond en dat de bijwerkingen bescheiden zijn – en bekend. Misschien wil je ook nog dat het medicijn beter werkt, of anders toch goedkoper is, dan andere medicijnen op de markt. Om dat allemaal mogelijk te maken bestaat er een praktijk die evidence based medicin heet. Maar in de praktijk van ‘bewezen medicijnen’ gaat zoveel mis dat doctoren eigenlijk geen fatsoenlijke medische beslissingen kunnen nemen.

Dat betoogt, althans, Ben Goldacre in zijn boek “Bad Pharma”. Het is een dikke pil waarin hij de praktijk van evidence based medicin helemaal afpelt. Hij laat zien hoe het zou moeten gaan, welke waarborgen er zouden moeten zijn en op hoeveel plekken het ook mis gaat. Als je evidence based medicin een warm hart toedraagt kan je van Goldacre’s betoog behoorlijk in de put raken, maar om het systeem te kunnen repareren moet je de fouten eerst blootleggen. Of, zoals Goldacre het brengt: “daylight is often a good disinfectant”.

Wat is er mis? Om dat te begrijpen moet je iets weten van de basisprincipes achter evidence based medicin. De gedachte is dat medicijnen grondig worden getest voordat ze (mogen) worden voorgeschreven. Dat gebeurd in zogenaamde “randomised controled trials”. Het medicijn wordt aan een groep patiënten gegeven en een andere groep patiënten krijgt een nepmedicijn – een placebo -, of een concurrerend medicijn. Zo kan de werkzaamheid van het medicijn worden bewezen en kunnen doctoren het daarna met een gerust hart voorschrijven.

Het kernprobleem in deze praktijk is missing data. In essentie is het doen van een medische trial een kwestie van tellen. Hoeveel patiënten zijn gezond geworden in de groep die het medicijn kreeg? Hoeveel in de controlegroep? Is er geen verschil, dan werkt het medicijn niet; is het er wel, dan werkt het. Maar, wat nou als je niet iedereen meetelt? Stel je voor dat je, bijvoorbeeld, mensen die gezond worden van het medicijn wèl telt en mensen waarvoor het niets doet niet. Dat lijkt flauw: alleen de gezonde mensen tellen, maar het is volgens Goldacre precies wat de farmaceutische industrie vaak doet.

Missing data ontstaat grofweg op 2 manieren. Ten eerste worden er flink wat trials uitgevoerd, maar niet gerapporteerd. Neem Reboxetine, antidepresiva. Het medicijn had een positief resultaat in één trial waar 254 patienten aan meededen. Maar, toen onderzoekers gingen graven wisten ze zes, niet gepubliceerde, trials op te sporen met in totaal meer dan 2500 patiënten – zonder resultaat. Werkt Reboxitine? Waarschijnlijk niet. En in ieder geval niet zo goed als dat doctoren die alleen toegang hebben tot de gepubliceerde data denken.

Missing data kan ook in een trial ontstaan, vaak vanwege praktische ingewikkeldheden. Hoe moet je bijvoorbeeld omgaan bij mensen die uitvallen tijdens een trial. Tel je ze bij de groep voor wie het medicijn niet geholpen heeft? Dat kleurt je uitslag negatiever in dan misschien nodig. Of tel je ze helemaal niet mee en doe je alsof ze zich nooit ingeschreven hebben? Dat lijkt een neutrale keuze, maar dat is het niet. Omdat mensen die ziek worden van het medicijn of de bijwerkingen, vaker afhaken is de kans heel reëel dat het juist een positieve kleuring aan de resultaten geeft. Of wat te doen met trials die vroegtijdig gestopt worden? Niemand wil natuurlijk dat een trial langer duurt dan nodig. Mensen slikken experimentele medicijnen en noodzakelijkerwijs slikt een groep zieke mensen helemaal geen medicijn. Maar als je stopt zodra een trial een voldoende positief resultaat heeft is de kans op een positief resultaat ook groter. Bij een negatief resultaat ga je door, waardoor het nog positief kan worden, maar bij een positief resultaat niet. Ook dan tel je gezonde patiënten zwaarder mee.

Deze problemen spelen in alle trials, niet alleen die die door de farmaceutische industrie worden uitgevoerd, maar daar gaat het, misschien niet helemaal onverwacht, wel veel vaker mis. Uit onderzoek blijkt dat als een trial is uitgevoerd door de fabrikant van een medicijn, in plaats van door een onafhankelijke instantie, de kans ongeveer 4 keer zo groot is dat er een positief resultaat uit komt. Dat hoeft geen fraude te zijn: het gaat eerder om ondeugdelijk onderzoek. Fabrikanten van medicijnen kunnen niet tellen. Of eigenlijk is het erger: ze rekenen zich rijk. En ja… verreweg de meeste trials worden uitgevoerd door de industrie. Een positieve trial is immers nodig om een medicijn op de markt te krijgen.

Allebei de vormen van verkeerd tellen zijn volstrekt gangbaar, maar ze vertroebelen het beeld voor doctoren op een ontoelaatbare manier. Feitelijk hebben doctoren, door het oppoetsen van trial data door de industrie, geen basis om deugdelijke medische beslissingen op te nemen. Ze kunnen niet weten of een medicijn werkzaam is omdat de meeste informatie waarop ze zich moeten baseren ontbreekt en omdat die informatie waar ze wel beschikking over hebben alleen bestaat omdat het de fabrikant van het medicijn goed uit kwam. We praten hier niet over één medicijn of een beperkte groep maar voor veel, zo niet alle, medicijnen op de markt. En dat in een praktijk die over leven en dood gaat.

Dat is misselijkmakend natuurlijk. Dus zoekt Goldacre naar oorzaken. Hoe komt het toch dat zoveel data verloren gaat en achter gehouden wordt? Bij zo’n onderzoek komt de farmaceutische industrie er natuurlijk slecht af, maar ook de instanties die de goedkeuring voor medicijnen verlenen, academische tijdschriften, ethische commissies en de overheid laten volgens Goldacre veel te veel steken vallen. Door de bewijslast bij de industrie te leggen en door het ontbreken van waarborgen waardoor alle data ook beschikbaar zijn blijkt de praktijk van evidence based medicin wel heel schraal af te steken bij de ideeën die er aan ten grondslag liggen. En erg gezond is dat niet.

Meer lezen?

Bad Pharma is een bedachtzame aanklacht tegen misstanden in de praktijk evidence based medicin, het staat vol met feiten en inzichten waar ik in dit korte blogje natuurlijk geen recht aan kon doen. Lees het.

Dit is de eerste keer dat ik over evidence practice schrijf. Over de statistiek achter trials sprak ik (indirect) in groepsidentificaties en eerlijk vergelijken. Over de de werelbeelden die achter een diagnose schuil kunnen gaan sprak ik in verkoudheid.

Eerdere boekreviews gingen over Little Science, Big Science van Derek de Solla Price, The Meme Machine van Susan Blackmore , Laboratory Life en Science in Action, beide van Bruno Latour.