Neutraal

Er is een zinnetje dat je vaak tegenkomt, waar ik me enorm aan erger.

Puntjepuntje is niet neutraal.

Het wordt vaak een beetje bijtend uitgesproken met een nadruk op het woordje is en soms ook op niet. In plaats van puntjepuntje kan je van alles invullen. Technologie, rechtspraak, journalistiek, wetenschap, en nog een handjevol beroepen of instituties die blijkbaar de illusie koesteren neutraal te zijn. Voor het snerende gemak noem ik de mensen die dit roepen even ‘de ontmaskeraars’

Daar zijn er veel van hoor. Als je nu nog steeds denkt dat technologie neutraal is dan heb je blijkbaar de laatste tijd de krant niet gelezen. Hetzelfde geldt trouwens voor de wetenschap en in toenemende mate ook de journalistiek en rechtspraak. Wil je in het debat van vandaag een beetje scoren, dan moet blijkbaar zeker stellen dat puntjepuntjes allemaal waardengedreven praktijken zijn en dat het de puntjepuntje-professionals zou sieren om eindelijk eens kleur te bekennen. D66.

Nu is het mij eigenlijk nooit opgevallen dat engineers beweren dat technologie neutraal is, of wetenschappers dat kennis neutraal is, of zelfs amper dat journalisten zeggen dat hun berichtgeving neutraal is. Volgens mij beweren deze professionals dat ze neutraliteit nastreven. Ze bekennen al kleur door te zeggen dat neutraliteit blijkbaar een kernwaarde, een ideaal voor ze is.

Nu hebben neutraliteit als feit en neutraliteit als ideaal volgens mij een ingewikkelde relatie, dus laat ik dat even uitpakken.

Neutraliteit als feit

Ergens is het een absurd idee dat technologie neutraal kan zijn. Het is immers gemaakt met een bedoeling – en bedoelingen zijn per definitie niet neutraal. We krijgen allemaal de kriebels als we iemand van de National Rifle Association (NRA) horen zeggen dat: “guns don’t kill people, people kill people”.

Toch is het onderscheid dat deze engerds maken relevant. Je kunt immers kijken naar de bedoeling van de techneuten en naar het gebruik van de technologie – en die komen niet altijd overeen. We weten dat mensen vaak andere dingen doen met technologie dan waar deze voor bedoeld is, of dat de technologie een eigen leven gaat leiden. En als dat zo is, wie is er dan verantwoordelijk voor het gebruik van de technologie: de ontwerper of de gebruiker?

Flauw zul je zeggen. Laat het NRA-voorbeeld niet duidelijk zien dat de bedoeling van ontwerpers en de bedoeling van gebruikers per definitie gekoppeld zijn? Dan delen ze toch ook de verantwoordelijkheid voor het eindresultaat? Dat klopt natuurlijk, maar die koppeling is niet voor alle technologie even sterk. Bij geweren is het heel duidelijk, maar hoe zit het met schilmesjes, of computerchips?

Daarmee is de ‘neutraliteit’ van technologie niet een alles-of-niets-ding. Er is technologie die voor heel veel verschillende doeleinden gemaakt is en die is neutraler dan technologie die voor één situatie gemaakt is. Daarnaast kun je niet altijd voorzien hoe technologie ingezet wordt, dus kun je de neutraliteit ervan niet altijd vooraf inschatten.

Het is gewoon een feit: technologie is niet neutraal. De hamvraag is alleen wel: is het ook een nuttig feit? Het is ook een feit dat alle dieren gewicht hebben, maar dat helpt niet zoveel bij het vergelijken van muggen en olifanten. Die hebben zeker allebei gewicht, maar je wil toch een gesprek voeren over hoeveel zwaarder een olifant wel niet is. Zo is het ook met de neutraliteit van technologie. In plaats van te hameren op neutraliteit als een alles-of-niets-ding, zou het beter zijn het als een meer-of-minder-ding te benaderen. Computerchips zijn neutraler dan wapens. Spijkers zijn behoorlijk neutraal. Dat soort uitspraken.

Neutraliteit als ideaal

Dat brengt ons bij neutraliteit als ideaal. Als neutraliteit een meer-of-minder-begrip is, dan kan je proberen zo neutraal mogelijk te zijn. Het duidelijkste voorbeeld hiervan vinden we misschien in de journalistiek. Veel journalisten zien het als hun taak de wereld te beschrijven zoals die is, en niet om daar stelling in te nemen. Ze zijn er zich van bewust dat je op meerdere manieren naar de wereld kan kijken, maar daar willen ze liever geen keuze tussen maken. Ze willen een buitenstaander zijn en belichten liever meerdere kanten van het verhaal door het principe van hoor en wederhoor toe te passen.

Klinkt goed, toch? Misschien is de journalistiek niet perfect in de uitvoering, maar op de keper beschouwd is neutraliteit een prima ideaal.

Nou ja. Er is best kritiek op te geven. Soms schiet de praktijk zijn doel voorbij. Zo heeft de journalistiek lang onevenredig veel aandacht gehad voor klimaatsceptici. Er was brede wetenschappelijke consensus over klimaatverandering, maar journalisten vonden het hun taak om ook het perspectief van de kriticasters in beeld te brengen. Daardoor ontstond bij lezers het idee dat die klimaatverandering hoogst discutabel was. Inmiddels kiezen de meeste journalisten in dit dossier vaker partij voor de wetenschap.

Er zijn dus voorbeelden te geven waar neutraliteit, of tenminste een bepaalde invulling ervan, onethisch kan zijn. Maar critici van neutrale journalistiek hebben nog een pijl op hun boog. Namelijk dat journalisten ondanks hun poging tot neutraliteit wel degelijk stelling nemen in een debat omdat ze hun stukken nu eenmaal vanuit een bepaald standpunt en bevoorrechte positie schrijven. De kritiek is dat ze door de pretentie van neutraliteit verantwoordelijkheid ontlopen.

Want als journalisten neutraal doen terwijl ze het niet zijn, hoe moeten we ze dan nog op hun standpunt aanspreken? Neem een nieuwsbericht over criminaliteit onder immigranten. Misschien is die de laatste tijd toegenomen. Een journalist kan zich beroepen op zijn neutraliteit en bijvoorbeeld zeggen dat hij alleen maar de feiten in kaart gebracht heeft. De criticus kan zeggen dat deze neutraliteit niet zoveel waard is, zolang de journalist niet ook over criminaliteit onder geboren Nederlanders schrijft. Binnen het artikel kan een journalist alles gedaan hebben wat nodig is, maar wat hier niet neutraal is, is de keuze voor het onderwerp zelf.

Een oplossing is reflexieve journalistiek, waar de journalist geen neutraliteit veinst, maar eerder de lezer meegeeft over waar hij zelf staat. Dit maakt kritiek mogelijk, en vanuit die kritiek ook een lerende journalistiek, maar het heeft ook nadelen. Reflexieve journalisten geven de missie op om hoeders te zijn van een gedeelde werkelijkheid. Ik vind dat jammer. Er is echt wat te zeggen voor een vrij strikte scheiding van feit en opinie.

De grote spraakverwarring

Ik geef het je op een briefje. Negen van de tien keer dat iemand beweert dat puntjepuntje ‘niet neutraal is’, bedoelen ze niet dat puntjepuntje niet neutraal is, maar dat de professionals achter het puntjepuntje te weinig rekenschap geven van de keuzes die ze maken. Waarom zijn bepaalde feiten geselecteerd? Welke bedoelingen heeft de technologie? Welke principes liggen ten grondslag aan een uitspraak? Dat soort werk. Dat vind ik legitieme vragen en het zou goed zijn als de ontmaskeraars die discussie zouden aanzwengelen.

Maar dat doen ze meestal niet. Ik ken eigenlijk weinig grotere dooddoeners dan het puntjepuntje-is-niet-neutraal-zinnetje. Wat er meestal gebeurt is dat de ontmaskeraars hun puntjepuntje-bezwering uitspreken en dan lekker achterover leunen met de rust van een debater die de feiten aan zijn kant heeft.

En daarna gebeurt er helemaal niets. De ontmaskeraars stellen namelijk geen vragen die de puntjepuntje-professionals uitnodigen om dieper na te denken over hun positie en die beter toe te lichten. Ze vragen niet: “hee op welke manieren kan deze technologie nog meer gebruikt worden en voel je je daar verantwoordelijk voor?” of “hee dit verhaal belicht keurig beide kanten, maar is er nog niet een derde perspectief dat aandacht verdient?”.

Ik vind het niet zo vreemd dat de puntjepuntje-professional dan niet denkt: oh laat ik eens flink zelfonderzoek doen naar mijn blinde vlekken en privileges en die voortaan beter meenemen in mijn werk. Die denkt: ‘Hee, natuurlijk zijn puntjepuntjes niet neutraal, maar ik heb mijn best gedaan om zo neutraal mogelijk te zijn. Daar is behoefte aan! Een beetje meer respect graag.

En ik geef de puntjepuntje-professionals dus groot gelijk.

Lieve ontmaskeraars: aan  sommige feiten moet je gehecht zijn. Dat het leven zuurstof nodig heeft. Dat groenten gezonder zijn dan snoepjes. Dat de gelegenheid de dief maakt. Dat soort feiten.

Maar het zou ons allemaal helpen ons een beetje te onthechten van het puntjepuntje-neutraal-feit. Goed. Neutraliteit bestaat misschien niet. Puntjepuntjes zijn nooit honderd procent neutraal. Maar vanwaar het gepest en gedram? In het kippenhok van de moderne wereld, snakken we soms naar een beetje neutraliteit. En daar komt bij dat neutraliteit geen alles-of-niets-ding is en rekenschap trouwens ook niet. Als we nu erkennen dat neutrale puntjepuntjes soms meer dan welkom zijn én dat het knap lastig kan zijn om ze te maken, dan kunnen we daarna met elkaar in gesprek. En volgt rekenschap vanzelf.

Meer lezen?

Ik schreef al eens over het verschil tussen feiten en idealen in doelkennis en waar. Ik schreef al eerder over het moderne medialandschap in bubbel en media.

Indicatorisme

Mijn moeder maakte er nogal een punt van dat je appels niet met peren kunt vergelijken. Nu is het lastig om een gezegde te bedenken dat ze niet regelmatig aanhaalt, maar serieus: appels en peren? Appels komen eerder in het alfabet dan peren, ze hebben een rondere vorm en ze zijn vaak zuurder. Hoppa, drie vergelijkingen in één zin.

Tja.., zul je zeggen. Het was misschien niet direct haar bedoeling om duidelijk te maken dat het niet kán,maar meer dat het niet altijd zinvol is. Als dat zo is, heeft ze wel een punt. Misschien kunnen we daar in de samenleving iets van leren. Toon me één manager die bij de presentatie van een nieuw dashboard met managementinformatie roept dat hij het overzicht niet wil – omdat hij, nog zo’n gezegde, niet iedereen over één kam wil scheren.

Waarom zouden we eigenlijk gezegden hebben die ons waarschuwen tegen het al te makkelijk vergelijken van -nou ja- onvergelijkbare grootheden? Was er ergens in het verleden een eerdere golf van neoliberalisme waarin alles wat meetbaar was waarde had – en al het andere niet? Zijn deze gezegden misschien een antwoord op een soort middeleeuwse toeslagenaffaire?

Jammer genoeg geeft Berend van der Kolk daar geen antwoord op in: De meetmaatschappij, waarom we alles meten en wat dat met ons doet. Hij lijkt al dat meten en vergelijken als iets moderns te zien dat misschien met Margaret Thatcher is begonnen, maar niet meteen iets wat – min of meer – intrinsiek is aan onze menselijke natuur, of als geworteld in oude menselijke culturen.

Goed, het is de laatste tijd ook wel een beetje doorgeslagen, al dat gemeet. Van der Kolk vond er het woord ‘indicatorisme’ voor uit. Hij stelt dat we tegenwoordig alles – van de stand van de economie tot de kleur van het truitje van de buurvrouw – proberen te vangen in meetbare indicatoren. Het probleem is dat we daardoor alleen maar naar de scores van die indicatoren kijken, en niet meer naar hoe de dingen werkelijk zijn

Van der Kolk, wiens boekje goed te vergelijken is met: Het best verkochte boek ooit, met deze titel van Sanne Blauw, bekritiseert deze neiging om alles meetbaar te willen maken. Niet alleen omdat cijfers niet ‘objectief’ zijn, maar vooral omdat ze ons gedrag negatief beïnvloeden.

Volgens Van der Kolk zijn er vijf dingen die we met cijfers doen die niet deugen. Allemaal komen ze er op neer dat voor mensen die cijfers als basis van hun beoordeling – van zichzelf of van anderen – gebruiken, de cijfers al snel een doel op zich worden.

Volgens Van der Kolk begaan werknemers die onder een sterk indicatorregime werken vijf vergissingen:

  1. Focus op eenvoudig te verbeteren indicatoren: Ze richten zich op taken die snel en gemakkelijk de cijfers verbeteren, zoals het uitvoeren van routinematige taken die weinig tijd kosten.
  2. Vermijden van moeilijke taken: Ze mijden taken die slecht scoren op de indicatoren, zoals het helpen van klanten met complexe of tijdrovende problemen.
  3. Korte-termijngerichtheid: Ze richten zich op directe resultaten die snel een indicator verbeteren, ten koste van langetermijndoelen.
  4. Negeren van niet-gemeten aspecten: Ze negeren taken die niet in een indicator zijn opgenomen, zoals het helpen van klanten met problemen die niet gemeten worden door het management.
  5. Manipulatie of fraude: Ze passen hun rapportages aan om de indicatoren te verbeteren, zelfs als dit niet overeenkomt met de werkelijke situatie.

Nou… Als we er echt zulke slechte mensen van worden, is het toch urgent om de vraag waarom we in de moderne samenleving eigenlijk zoveel met indicatoren werken, te beantwoorden. In de basis is dat niet moeilijk. Indicatoren worden gebruikt om op kwaliteit te sturen. Daar maken we vaak dankbaar gebruik van. Misschien worden we slechten mensen van al dat werken met indicatoren, maar ik ben ook wel blij dat elke stekker in elk stopcontact past, dat rot fruit niet in de winkel ligt en dat de NS een boete krijgt als er te weinig treinen op tijd rijden.

Het probleem is misschien niet zozeer het gebruik van indicatoren, maar het doorgeslagen gebruik ervan. Je zou hopen dat Van der Kolk daar iets over zegt. Wanneer is het te weinig, wanneer is het goed genoeg, vanaf wanneer slaat het door? Jammer genoeg gaat het daar in De Meetmaatschappij nauwelijks over. Hoewel Van der Kolk nuttige tips geeft voor verstandig omgaan met indicatoren—zoals het ‘met mate’ meten, het gezamenlijk opstellen van indicatoren en het rekening houden met de context – mis ik scherpte op de vraag hoe we kunnen herkennen dat indicatoren hun doel voorbij schieten.

Zou het niet geweldig zijn als we kunnen herkennen wanneer gebruik van indicatoren nog tot verbetering leidt en wanneer het teveel schade geeft? Als mensen zelf een sterk gevoel van kwaliteit hebben en geen blinde vlekken vertonen, zijn indicatoren misschien niet nodig; als er een hoge mate van standaardisering vereist is, kunnen ze juist wel waardevol zijn. Wat mij betreft komt Van der Kolk binnenkort met een vervolg waarin hij deze tienduizend euro vraag ook beantwoord!


Meer lezen?
Over de grootste twee excessen van de meetmaatschappij schreef ik al eens blogjes. In IQ bespreek ik hoe we onze hele samenleving inrichten rondom een meting van iets dat niet te meten is: intelligentie. In Peilingen ga ik in op onze worsteling om peilingen te zien voor wat ze zijn: matige voorspellingen van de verkiezingsuitslag. In Significantie bespreek ik de kritiek op de wetenschappelijke norm van statistische significantie.

De meetmaatschappij wordt ook steeds meer geautomatiseerd. Waarom ik daar geen voorstander van ben beschrijf ik in Computerbesluit.

De Chinese Kamer

Het kostte Blake Lemoine zijn baan bij Google: stellen dat LaMDA, een AI toepassing waar het bedrijf aan werkt, bewustzijn heeft. Google vond het blijkbaar slechte publiciteit. Waar zou Google banger voor geweest zijn: dat het publiek Blake Lemoine zou uitlachen en zou denken dat het bedrijf idiote engineers in dienst heeft, of dat ze massaal in bewuste AI zouden gaan geloven, omdat Google engineers het zelf zeggen?

Afijn. Als je ooit met ChatGPT of een vergelijkbare tool hebt gewerkt, is het helemaal niet raar om je af te vragen of deze machines bewustzijn hebben. Ze lijken namelijk erg slim. Ze gaan goed om met taal en als ze ook nog zeggen dat ze gevoelens hebben en bang zijn om uitgeschakeld te worden, waarom zou je ze dan niet geloven?

Computerintelligentie
LaMDA heeft in elk geval de ‘Turing-test’ gehaald. Deze test is bedacht door Alan Turing, een van de grondleggers van de computerwetenschappen. Ze meet hoe intelligent een computer is. Turing stelde voor om te kijken of mensen het verschil kunnen zien tussen een computer en een mens op basis van hun gedrag. Bij een chatbot zou je mensen zowel met een andere persoon als met een computer laten chatten, en als ze niet kunnen zeggen welke de computer is, is de computer volgens Turing intelligent.
Dat klinkt als een handige aanpak en in de jaren 50, toen computers nog de grootte van een gebouw hadden, was het een revolutionair idee.

Maar er zijn wel twee problemen mee.

Het eerste probleem is dat de allereerste chatbot uit de jaren 60 al slaagde voor de test. Het ging om Eliza: een chatbot die een psychotherapeut imiteerde. Eliza zat heel simpel in elkaar. Ze stelde alleen maar open vragen en herhaalde daar soms een woord uit het vorige antwoord van de gebruiker in, maar mensen die er mee chatten, hadden echt het gevoel geholpen te worden. Eén erg betrouwbare test voor intelligent gedrag lijkt de Turingtest dus niet te zijn.

Het tweede probleem is dat om intelligent gedrag te vertonen misschien helemaal geen bewustzijn nodig is. LaMDA zegt dingen die bewuste computers ook zouden zeggen, maar dat kan misschien ook wel zonder bewustzijn voor elkaar gebokst worden.

De Chinese Kamer
De filosoof John Searle, bedacht een gedachtenexperiment om dat inzichtelijk te maken: de Chinese Kamer. Het idee is dat er een kamer is waar je vragen aan kan stellen in het Chinees, door een briefje door de brievenbus te gooiden. De kamer antwoordt ook in het Chinees door een briefje terug te geven. In de kamer zit een vrijwilliger die helemaal geen Chinees spreekt. Hij krijgt een bescheiden salaris of gratis bier om het volgende te doen: bij alle vragen die hij binnen krijgt moet hij de tekens opzoeken in een boek met symbolen en regels, door de regels precies te volgen kan de vrijwilliger een antwoord formuleren en teruggeven aan de buitenwereld. De kamer werkt perfect: de Chinezen die hem gebruiken vinden de antwoorden erg slim en grappig.

Het punt van het Chinese Kamer-argument is dat computers, want dat is wat de kamer natuurlijk voorstelt, best intelligent over kunnen komen, zonder dat ze echt bewustzijn hebben. De man in de kamer begrijpt nooit wat de vragen of antwoorden betekenen, hoe slim en nuttig het regelboek ook is. Searle sluit niet uit dat we ooit machines kunnen bouwen met bewustzijn, maar je kunt dat bewustzijn niet afleiden uit hun gedrag. Het volgen van taalregels is misschien een vereiste voor bewustzijn, maar het is zeker niet genoeg om aan te tonen dat er bewustzijn is.

Je kan het Chinese Kamer-argument op allerlei manieren weerleggen, en dat is ook geprobeerd, maar het onderscheid dat Searle maakt tussen syntax (regels en symbolen) en betekenis (de inhoud van een begrip) is heel fundamenteel. Computers zijn namelijk al sinds de tijd van Alan Turing juist ontworpen om symbolen te verwerken zonder met de inhoud bezig te zijn. Het is ongeveer de definitie van een computer dat de inhoud er niet toe doet, terwijl het bewustzijn daar juist om draait. De Chinese Kamer roept dus de vraag op of LaMDA of ChatGPT, toch ook computers, opeens wel in staat zijn om ‘betekenis’ aan dingen te geven.

De Chinese kamer vol taalmodellen
Dit argument hoor je vaak: LaMDA is een computer, en computers geven geen betekenis aan dingen, dus LaMDA ook niet. Of preciezer: LaMDA is geautomatiseerde statistiek. Ze berekent wat ze moet zeggen op basis van de input en miljoenen parameters. Ze kijkt simpelweg naar de eerdere woorden en voorspelt welk woord het meest waarschijnlijk volgt. Dat is een complexe berekening, maar nog steeds een rekensom. LaMDA denkt niet echt na over de vragen. Dit is ongeveer wat John Searle zou zeggen.

Maar je kan ook het tegenovergestelde beweren. Het is misschien niet zo belangrijk dat deze modellen op computers draaien. De kracht van zulke modellen zit niet in de statistiek zelf, maar in de data waarmee ze worden getraind. Je kunt zeggen dat taalmodellen met taal oefenen door steeds hun reactie met een gewenste versie te vergelijken. Dat heeft wel wat weg van hoe mensen leren. Trial and error.

Zou het niet zo kunnen zijn dat in die eindeloze oefeningen iets gebeurt wat lijkt op de manier waarop ons brein betekenissen leert? Dat computerbetekenissen versleuteld worden in de parameters, ongeveer zoals betekenissen bij ons versleuteld worden in de verbindingen tussen hersencellen? Die betekenissen die in het taalmodel ontstaan, kunnen dan weer worden gebruikt bij het formuleren van antwoorden.

Natuurlijk is de onderliggende machine een computer, maar we kunnen computerbewustzijn zien als een hogere-orde effect van de manier waarop de machine werkt, net zoals we het menselijke bewustzijn zien als een hogere orde effect van de biologie van de hersenen.

Computerbewustzijn
Geen vreemde gedachte eigenlijk, maar zelfs als het basisidee klopt is wat LaMDA kan nog heel ver weg van iets dat lijkt op menselijk bewustzijn. Er zijn eigenlijk twee aanvliegroutes om dat duidelijk te maken. We kunnen kijken naar complexiteit of naar de betekenis van betekenis.

Eerst het complexiteitsvraagstuk maar even. In het blogje bewusteratuur besprak ik het idee dat de hoeveelheid bewustzijn van een organisme gezien kan worden als de mate waarin het brein informatie kan integreren. Op dagelijkse basis verwerken we enorme hoeveelheden informatie die uit de zintuigen komen. Het bewustzijn voegt die informatie samen tot één coherente beleving. De mate van bewustzijn van mensen lijkt samen te hangen met de efficiëntie waarmee deze integratie verloopt: onder narcose integreren we geen informatie, onder invloed van LSD een beetje en in nuchtere toestand kunnen we enorm goed integreren.

Om vast te stellen of een taalmodel bewust is, hoeven we misschien alleen maar te kijken of het in staat is om complexe informatie tot een samenhangend geheel te vormen. Misschien ben je onder de indruk van hoe goed ChatGPT de kernboodschappen uit een tekst van tienduizend woorden kan halen, maar mensen kunnen subtiele veranderingen in temperatuur, wind, lichtinval en geluiden gebruiken om de aankomende regen aan te voelen. Daarvoor moet gigantisch veel meer informatie samengebracht worden. Taalmodellen integreren zeker informatie, maar vergeleken met mensen stelt het niets voor.

Het is met taalmodellen ongeveer zoals met schaakcomputers. Ze kunnen iets dat wij moeilijk vinden heel erg goed, maar ze hebben niet de flexibiliteit om heel veel verschillende dingen zo goed te doen. En omdat ze niet zo veelzijdig zijn hebben ze misschien ook niet zoveel ‘bewustzijn’ nodig.

De betekenis van betekenis
De tweede aanvliegroute is om naar het begrip betekenis te kijken. Wat bedoeld Searle eigenlijk als hij zegt dat de man in de Chinese kamer alleen regels volgt maar niet vanuit betekenisgeving werkt?

Betekenis is datgene in de werkelijkheid waar taal naar verwijst. Ik heb in mijn leven op een aantal verschillende bankjes gezeten, dus als iemand het woord zitbank hoor zeggen zijn er allerlei ervaringen uit mijn leven om invulling te geven aan wat die persoon bedoeld. Die totale set ervaringen, de honderden keren dat ik al eens in een bankje zat, vormen samen de achtergrondkennis waardoor ik een verwijzing naar een ‘bankje’ kan oppikken.

Noch ChatGPT noch LaMDA hebben ooit op een bankje gezeten. Ze hebben geen ‘ervaringen’. Wanneer zij het woord ‘bank’ gebruiken denken ze niet aan hoe het is om in een bank te zitten. In plaats daarvan baseren ze zich op hoe mensen het woord gebruiken in de taal waarin ze zijn getraind. Hierdoor kunnen ze het woord correct gebruiken, zonder echt te begrijpen wat het voor mensen betekent.

Je zou ook kunnen zeggen dat taalmodellen mensen heel erg goed geobserveerd hebben, maar daarmee niet de subjectieve kennis van het menszijn hebben kunnen leren. Net zoals wij niet kunnen weten hoe vleermuizen zich voelen, kunnen taalmodellen ons niet van binnen begrijpen. Daarmee is niet gezegd dat taalmodellen geen betekenis geven aan woorden, alleen dat die anders is dan menselijke betekenis.

Ik vind dit zelf een superslimme redenering, maar er is wel een addertje onder het gras. Ook mensen leren namelijk veel van de betekenissen die ze dagelijks via taal gebruiken. Mijn kennis van het begrip ‘economie’ komt vooral van de keren dat het in gesprekken ter sprake kwam of uit boeken die ik heb gelezen. Dit is precies het soort informatie dat LaMDA ook heeft opgedaan tijdens haar training.

Is mijn betekenis van ‘economie’ echt zo anders dan die van het taalmodel? Natuurlijk, LaMDA zal waarschijnlijk geen associaties hebben met de morsige kettingroker die mijn docent was, maar bij abstracte woorden is de overlap zeker groter dan bij woorden waarvoor ik zelf een lichamelijke ervaring heb.

Hoe is het om een taalmodel te zijn?
Of Blake Lemoine nog werkeloos thuis zit weet ik niet, en ik denk echt dat hij zich vergiste toen hij dacht dat computers bewustzijn hebben, maar dan vooral omdat hij dacht dat taalmodelbewustzijn precies is als menselijk bewustzijn. Mensen leren taal om ervaringen met elkaar te kunnen delen. Taalmodellen leren taal om mensen te kunnen imiteren. Dat zijn heel verschillende dingen. Ze delen daardoor de werking van de taal, maar niet het leven dat er achter zit. Taalmodellen zullen nooit menselijk bewustzijn hebben, of kunnen weten hoe het is om een mens te zijn. Maar de keerzijde is dat wij, ook Blake Lemoine niet, niet kunnen weten hoe het is om een taalmodel te zijn.

Meer lezen?
Het probleem dat we niet weten hoe het is om een vleermuis te zijn besprak ik al eens in ervaring, hoe mensen betekenissen leren door taal te gebruiken in de taalpragmatiek van Herbert Clark. Ik schreef over het probleem van verwijzen in Brein in een vat.

Dit blogje maakt uit van een serie over het bewustzijn. In bewust besprak ik hoe het bewustzijn eerder een familie van problemen vormt in plaats van een enkel vraagstuk. In ervaring ging ik in op de vraag of dieren ervaringen hebben en hoe we dat kunnen weten. In dualisme zette ik een aantal filosofische posities over het bewustzijn uiteen. In bewusteratuur ging ik in op pogingen om de hoeveelheid bewustzijn te meten en in wil op de vrije wil.

Ik scheef ook al eerder over AI als een nieuw medium in computerbesluit, over de inzet van AI in bijvoorbeeld het recht, in a priori en in glazen bol over predictive policing

Toekomstindustrie

Ik weet niet hoe het met jullie zit, maar ik kan geen LinkedIn-post over generatieve AI meer zien. Het is niet dat ik het niet leuk vind hoor… -dat je een guitig zinnetje tikt en dat dan een slimme computer een prachtige tekst, een schitterend plaatje of een geloofwaardig filmpje kan uitspugen. Het is meer dat ik het niet trek hoe mensen reageren op deze nieuwe mogelijkheden.

Nieuwe technologieën, waar knappe dingen mee kunnen, maken altijd een legertje van cynici,  experts, “experts”, duiders en ondernemende geesten wakker, met een breed gevolg van ander klapvee. Mensen die opstaan, het technieuws bij het ontbijt doornemen, en snappen dat ‘het speelveld’ veranderd is. Voorgoed. Dat ze zich maar beter kunnen positioneren ten opzichte van de nieuwe werkelijkheid die door deze technologie gaat ontstaan. Het zijn typisch ook mensen die zich graag roeren op sociale media en mensen die me blij maken dat ik de overgang van Twitter naar X aan me voorbij heb laten gaan.

Het geheel doet me denken aan een boekje van Rein de Wilde dat misschien door te weinig mensen, zeker te weinig van déze mensen, gelezen is. ‘De Voorspellers’ heet het; ‘Een kritiek op de toekomstindustrie’. Het gaat over hoe nieuwe technologieën steeds aanleiding zijn tot verhalen over hoe deze technologieën ons gaan beïnvloeden, wat er klopt aan deze verhalen, maar vooral ook wat er niet klopt. Over hoe dit soort verhalen meer gestuurd worden door toekomstbeelden die voldoen aan maatschappelijke behoeften: welke verhalen ‘verkopen’, dan door wat realistisch gezien verwacht mag worden van nieuwe technologie.

Onze fascinatie voor de toekomst is sowieso al erg groot, maar zodra er nieuwe technologie in het spel komt die ons toch al luxe, Westerse leventje nòg iets comfortabeler lijkt te gaan maken, gaan we met zijn allen helemaal aan. De vraag naar voorspellingen, trendrapporten en scenariostudies valt niet meer bij te benen. Zeker niet zodra een technologie het label ‘revolutionair’ krijgt. En dat is nogal vaak, want mensen in de toekomstindustrie hebben ook gezinnen die moeten eten en op vakantie willen. 

Het zou misschien niet zo erg zijn als ‘de voorspellers’  iets zouden weten van de impact van nieuwe technologie op de samenleving. Die is meestal relatief klein. Niet omdat technologieën de samenleving niet beïnvloeden, maar wel omdat alles altijd heel ingewikkeld is. Omdat we heel veel technologieën tegelijk gebruiken waardoor het nieuwe joch in de buurt – zeg Instagram, of ChatGPT- wel íets verandert, maar lang niet àlles. 

Er zijn wel technologieën die de samenleving ingrijpend veranderd hebben: het schrift, de stoommachine, elektriciteit, telecommunicatie. Die deden er allemaal erg lang, dat wil zeggen de uitvinding van tientallen concrete technische oplossingen, over voordat we de effecten merkten. Daarbij komt: ‘Generatieve AI’ past echt niet in dit rijtje. Het kan zich niet meten met de gloeilamp. Misschien wel met de CD speler, maar we weten hoe het daarmee is afgelopen.

Afijn. De kritiek van Rein de Wilde is dat de toekomstindustrie geneigd is om de relatie tussen technologie en de samenleving als monolithisch -een moeilijk woord voor eenduidig- voor te spiegelen. Er is één aspect van de nieuwe technologie die zo bijzonder is en zo succesvol – dat dit aspect onderdeel uit gaat maken van onze cultuur. ‘Sociale media gaan ons allemaal verbinden waardoor culturele verschillen tussen groepen in de samenleving als sneeuw voor de zon gaan verdwijnen’. Dat werk. 

Daar zijn twee dingen mis mee. Ten eerste werkt het zo niet. Elke nieuwe technologie werpt een subtiel net uit van dingen die er door veranderd worden, dingen die juist niet veranderen of juist versterkt worden. En alsof dat niet erg genoeg is passen we ons daar als samenleving ook nog op aan op allerlei verschillende manieren. Iedereen die denkt dat ze deze co-evolutie van technologie en samenleving precies kan voorspellen is een idioot. 

Ten tweede legt De Wilde haarfijn bloot dat de voorspellingen van mensen uit deze industrie nooit neutraal zijn. Ze grijpen in op bepaalde utopische ideeën over de samenleving, idealen die door technologie verwezenlijkt kunnen worden. Dat is een begrijpelijke gedachte, technologie dient om de dingen waar we van dromen waar te maken, maar doordat mensen uit de toekomstindustrie deze idealen presenteren als een onvermijdelijke ontwikkeling plaatsen ze die idealen buiten de discussie. 

Soms is dat: wat we willen met bepaalde technologie en vooral of we dat wel moeten willen, de kern van de discussie die we zouden moeten voeren. Met Rein de Wilde, denk ik dat de retorische stijl van de toekomstindustrie deze discussie bemoeilijkt in plaats van bevordert. In een notendop is dit dus mijn advies. Laat de toekomstindustrie links liggen en besteed meer aandacht aan de wenselijkheid van nieuwe technologie. Laten we, vandaag nog, de vraag of we generatieve AI wel willen, eens centraal stellen.

Meer lezen?

Ik sprak over voorspellingen in peilingen. waarvooruitgang en in opdracht van de tijd.

Het boekje van Rein de Wilde is niet meer in druk, maar het is goed verkrijgbaar en de moeite van het lezen waard.

Ontwerperig

De titel van dit blogje is natuurlijk een wat flauwe vertaling van ‘Designerly’, maar ik kon niet goed om de ironie heen dat de bekendste emancipatiebeweging van ontwerpers, zich van zo’n guitig begrip bedient. Een betere vertaling is eigenlijk ontwerperserig, maar de kans dat je in een blogje met die titel tot hier was gekomen, leek me wel heel klein – dus dat durfde ik niet goed aan.

Afijn; wat is er aan de hand? Het gaat om de stelling dat ontwerpers over een ander soort kennis beschikken dan andere professionals en dat daar in het onderwijs en de wetenschap meer aandacht voor moet zijn. Ontwerpen zou door alles en iedereen veel serieuzer genomen moeten worden omdat er zich in de hoofden van ontwerpers heel bijzondere dingen afspelen: “designerly ways of knowing”.

Het is een populaire gedachte. Waar ik zelden iets lees over de unieke denkwijze van natuurkundigen, politieagenten of stratenmakers, rollen de boekjes over de denkwijzen van ontwerpers haast uit mijn boekenkast. Niet in de laatste plaats door de opkomst van ‘design thinking’, hoewel dat vaak meer over aanpak gaat dan over denkwijzen.

Er zit ook wel iets in. Zelf betoogde ik op dit blog al eens dat feitenkennis over de wereld niet genoeg is voor het doen van technische uitvindingen en ook niet voor allerlei andere veranderprocessen. Het is dus geen overbodige luxe om na te denken over wat voor soort kennis we hiervoor nodig hebben en hoe we zorgen dat voldoende van ons die kennis ook hebben. Maar of ontwerperserige manieren van kennen ons daarbij gaan helpen?

Het begrip ‘Designerly ways of knowing’ is gemunt door Nigel Cross. Cross was onderzoeker aan de faculteit voor industrieel ontwerp in Delft, een van de eerste universitaire ontwerpopleidingen. Hoewel harde ingenieurs zoals technisch natuurkundigen, elektrotechnici en werktuigbouwers in die tijd hun weg al hadden gevonden in de wetenschap, hadden minder technische opleidingen zoals architectuur en ontwerp iets uit te leggen. Hoezo waren dit academische disciplines? Hoe ziet een ontwerpwetenschap er uit? Welke standaarden voor wetenschappelijkheid worden daarbij gehanteerd?

Sommige onderzoekers reageerden hierop met een poging de activiteit van het ontwerpen te verwetenschappelijken. Het ontwerpproces moest voortaan zodanig worden uitgevoerd dat alle ontwerpbeslissingen herleidbaar waren – en zodoende aan wetenschappelijke kritiek onderworpen konden worden. Anderen stelden dat we in plaats daarvan juist ontwerp een volwaardigere plek in de wetenschap moesten geven, met respect voor de werk- en denkwijzen van ontwerpers. In plaats van het ontwerpen te verwetenschappelijken, moest er een vorm van wetenschap komen waar ontwerpers zich thuis in konden voelen. Eén van de auteurs die dat laatste betoogde was Nigel Cross – en de emancipatiegolf die hij hiermee startte is nog altijd volop gaande.

Cross ging daarbij verder dan de wetenschap alleen. Hij betoogde dat ontwerpen een derde ‘gebied’ in het hele onderwijs moest worden, naast de natuur- en menswetenschappen. Op de basisschool zou dit betekenen dat naast taal en rekenen ook techniek- of maakonderwijs een plek zou moeten krijgen. Op de middelbare school zouden de talen, zaakvakken en natuurwetenschappen aangevuld moeten worden met verschillende engineeringdisciplines en op de universiteiten zouden de ontwerpwetenschappen meer voeten aan de grond moeten krijgen.

Cross plaatst design naast de natuur- en menswetenschappen omdat die “intrinsieke waarde” hebben. Daarmee bedoelt Cross dat het onderwijs verder gaat dan de praktische, direct zichtbare uitkomsten. Bij natuurkunde leer je niet alleen de wet van Ohm; je krijgt ook iets mee van een natuurkundige blik op de wereld. Een focus op feiten, experimenten, de wetmatigheid van de natuur, bijvoorbeeld. De natuurwetenschappen dragen dus een bepaalde kenniscultuur met zich mee die belangrijk is in het leven. Design omvat volgens Cross ook zo’n diepere kenniscultuur, met een eigen blik op de wereld en intrinsieke waarde.

Nu vindt iedereen dat zijn vak meer aandacht verdient en dat kinderen het al vroeg moeten leren, maar de analyse van Nigel Cross is zeker interessant. Hij betoogt, net als ik, dat voor ontwerp andere kennis nodig is dan alleen de feitenkennis die natuurwetenschappers als hoogste doel lijken te zien. Daarnaast stelt hij dat er andere denkwijzen aan het ontwerpen ten grondslag liggen dan aan de wetenschappen: aandacht voor concrete oplossingen in plaats van abstracte ideeën, een idee voor hoe dingen anders kunnen zijn dan ze nu zijn, en het beheersen van niet-talige manieren om ideeën uit te drukken. Als ontwerpers op een andere manier, met andersoortige kennis, moeten leren omgaan, is dat dan niet flink wat onderwijs waard, liefst op vroege leeftijd?

Voordat we ja zeggen op deze vraag is het zinvol om er toch even wat kritischer naar te kijken. Immers, kan eenzelfde analyse niet gemaakt worden door een politieagent? Zou die niet kunnen betogen dat er drie ‘gebieden’ zijn: natuurwetenschap, geesteswetenschap en wetshandhaving? Het klinkt belachelijk misschien, maar de analyse kun je best rond krijgen. Zeker als je het niet beperkt tot politiewerk, maar naar een iets bredere categorie zoals handelingskennis. Kinderen moeten dan leren lezen, schrijven, maken en doen. Dat klinkt eigenlijk heel plausibel, maar als we zo makkelijk van twee naar drie, naar vier ‘gebieden’ kunnen redeneren, dan is een vijfde zo toegevoegd – en waar komen we dan uit?

Cross zou misschien antwoorden dat wetshandhaving een praktische vaardigheid is, terwijl ontwerp intrinsieke waarde heeft, maar dat vind ik geen sterk argument. Ik weet zeker dat je unieke denkwijzen en probleemoplossingsstrategieën kunt identificeren voor allerlei handelingsberoepen. Hebben ze daarmee ‘intrinsieke waarde’? En hoe beslissen we dat?

Wat sterk is aan het betoog van Cross, is dat hij vragen stelt bij de dominantie van de natuur- en menswetenschappen in ons onderwijs. Moet onderwijs gaan over hoe de wereld nu eenmaal is, of moeten kinderen leren om de wereld mede vorm te geven? Dat laatste lijkt hard nodig en als ontwerperserig denken daarvoor nodig is, vooruit dan maar.

Het zwakke punt van Cross’ betoog is dat hij alle antwoorden zoekt vanuit de ontwerpdiscipline waar hij zo thuis in is. Natuurlijk, we leven in een diep ontworpen wereld, maar dat maakt ontwerp nog niet het antwoord op alle vragen. Waar de natuurwetenschappen macht zoeken in wetmatigheden en de menswetenschappen in duiding, zoeken de ontwerpwetenschappen hun macht in maakbaarheid. Maar we weten allang dat die maakbaarheid beperkt is. Is ontwerp dan altijd het antwoord? Of vinden we het antwoord eerder in een slimme combinatie van wetmatigheid, duiding en maakbaarheid? Of is er nog meer nodig?

Mijn verwachting is dat we er daarmee niet zijn. We hebben eerder vier of vijf vertrekpunten nodig, en we moeten ons vooral richten op hoe die verschillende zienswijzen elkaar kunnen versterken. De emancipatie van het ontwerpstandpunt was daar misschien een noodzakelijk begin voor, maar nu moeten ontwerpers van de barricaden af en de synergie met andere disciplines beter onderzoeken.

Meer lezen?

Ik sprak eerder over de unieke kennis die voor ontwerpen nodig is in de blogjes ontwerpkennis en doelkennis. Dat de emancipatie die Cross startte nog niet af is blijkt uit de wetenschapsgeschiedenis van Rens Bod, waar engineering geen rol in lijkt te spelen. Ik vroeg me eerder af wat leerlingen op de basisschool echt moeten leren in basiskennis.

Voor dit blogje maakte ik vrij intensief gebruik van hoofdstuk 1 van ‘Designerly Way’s of Knowing‘, van Nigel Cross. Het boekje is inmiddels wat lastiger te verkrijgen, maar zeer het lezen waard.

Peilingen

We zijn de afgelopen verkiezingen niet alleen doodgegooid met peilingen, maar ook met dat éne bezwerende zinnetje: “een peiling is geen voorspelling van de uitslag”. Nou…, ik wil de feestvreugde niet vergallen, maar peilingen zijn wèl een voorspelling van de uitslag – en dat weten journalisten best.

Ik snap het wel hoor. Op verkiezingsdag blijkt vaak dat de mensen anders gestemd hebben dan de peilingen aangaven. Als je dan drie weken voor de verkiezingen met een nieuwe peiling komt, kan het geen kwaad om je als peiler of TV-programma een beetje in te dekken: “We vertellen je wat we denken dat de uitslag zou zijn als de verkiezingen vandaag waren, maar we weten heus wel dat de toekomst onvoorspelbaar is, dus, beste kiezer, je moet wel begrijpen dat peilingen de huidige stand van zaken peilen en niet die op verkiezingsdag; het zou een grote fout zijn om deze peiling als een voorspelling van de uitslag te zien”.

Wat een -langdradige- onzin!

Het gezegde luidt dat als het kwaakt als een eend en als het waggelt als een eend, dat het dan vast een eend is. Met peilingen is het niet anders. Als Jan en alleman peilingen gebruiken als voorspellingen en peilbureaus doen hun stinkende best om de verkiezingsuitslag zo nauwkeurig mogelijk te voorspellen, dan zijn het vast voorspellingen.

Ik weet niet of je er het geduld voor kan opbrengen, maar ik wil nu de praktijk van het maken en gebruiken van peilingen eens heel precies bekijken en dan een keer of vier de conclusie trekken dat het er toch echt heel erg op lijkt dat peilingen voorspellingen zijn. Met die munitie op zak kunnen we beter begrijpen waarom de media maar niet kunnen wennen aan het idee dat peilingen voorspellingen zijn en kan ik vast wat tips geven over hoe het publiek wél goed voorgelicht kan worden over peilingen.

Afijn: eerst het hoe maar even. Peilingbureaus doen steekproeven. Ze vragen een kleine groep kiezers wat ze denken te gaan stemmen en rekenen op basis daarvan uit wat heel Nederland zal gaan doen bij de verkiezingen. Dat is een ingewikkelde rekensom, want niet iedereen die gaat stemmen zit ook in de steekproef, zelfs niet verhoudingsgewijs. Mensen die op bepaalde partijen gaan stemmen doen bijvoorbeeld vaker mee met peilingen of mensen zeggen op andere partijen te gaan stemmen, dan ze daadwerkelijk doen – en zo zijn er nog meer redenen waarom de steekproef kan afwijken van de uitslag.

Elke verkiezing wordt de voorspelling daarom vergeleken met de uitslag om het proces en de rekensom aan te passen. Peilers doen hun best mensen die ze ‘gemist’ lijken te hebben in hun steekproeven te betrekken, ze sleutelen aan hun vraagstelling, ze passen de weegfactoren in de som aan. Dat hele proces is er op gericht een zo goed mogelijke voorspelling te geven van de verkiezingsuitslag, dat is klip en klaar.

Maar, denkt de kritische lezer, waarom wordt me dan de vraag gesteld wat ik zou stemmen als er vandaag verkiezingen zou zijn en niet wat ik van plan ben om te stemmen bij de volgende verkiezingen? Die laatste vraag zou toch veel logischer zijn als je de verkiezingsuitslag wil voorspellen?

Dat is een terechte vraag en het antwoord is dat de ‘vandaagvraag’ een nauwkeurigere voorspelling oplevert van de uitslag van de verkiezingen. Er zijn nauwelijks mensen die een andere partij opgeven bij de ‘vandaagvraag’ dan bij de ‘wanneer-er-verkiezingen-zijn-vraag’, maar bij die laatste vraag vullen meer mensen in dat ze het niet weten. En dat maakt het verschil tussen de steekproef en de uitslag weer wat groter, waardoor peilers weer extra moeten compenseren in de omrekensom – en dat doen ze liever niet. Peilingbureaus vragen je dus, vreemd genoeg, wat je vandaag zou doen omdat ze dan beter kunnen uitrekenen wat de mensen in de toekomst gaan doen.

Al met al doen peilbureaus hun stinkende best om een zo goed mogelijke voorspelling van de uitslag te geven. Als peilingen eenden waren waggelden ze als eenden.

Maar, kwaakten ze ook als eenden? Daarvoor moeten we het waarom analyseren. Wie gebruiken peilingen eigenlijk en voor welke doelen? Dat is een superbelangrijke vraag. We kunnen alleen begrijpen waarom peilbureaus zoveel moeite steken in het voorspellen van de verkiezingsuitslag als mensen ze ook willen gebruiken als voorspelling.

Nu worden peilingen door verschillende mensen op verschillende manieren gebruikt. Ik noem er drie. Allerlei mensen gebruiken peilingen om hun nieuwsgierigheid te stillen; ik denk dat politieke partijen peilingen gebruiken om hun campagnestrategie te herzien; en ik denk dat kiezers peilingen gebruiken om strategisch te stemmen. In alle drie de gevallen is het vreselijk belangrijk dat peilingen een zo goed mogelijke voorspelling geven van de uitslag, dus laat ik ze alle drie maar even nalopen.

Eerst de nieuwsgierige mens maar even. Waar zit mijn nieuwsgierigheid als ik het NOS Journaal aanzet en de nieuwste peiling over de aankomende verkiezingen bekijk? Nou: ik wil dan weten hoe de verkiezingen gaan verlopen.

Als ik zou willen weten hoe Nederland vandaag de dag denkt over een onderwerp als migratie of het klimaat, zoek ik wel een peiling over dat onderwerp en niet over zoiets cryptisch als de samenstelling van de Tweede Kamer. Ik kijk naar een peiling over de samenstelling van de Tweede Kamer omdat ik wil weten hoe die er na de verkiezingen uit gaat zien. Het gaat me om de race naar de macht: wie wint, wie kan met wie, doet ‘mijn’ partij het goed? De enige reden om halverwege de race te kijken naar wie er voorop ligt, is omdat ik hoop of vrees dat diegene die voorsprong behoudt tot aan de finish. Ik ben niet geïnteresseerd in een hypothetische verkiezing die vandaag gehouden zou zijn -naar wat er zou gebeuren als de 400 meter plotseling na 200 meter werd stilgelegd -, ik zit in spanning over hoe de echte verkiezing over drie weken gaat verlopen. Kwak.

Dan de politiek strateeg. Zijn partij is net drie zetels gezakt in de peiling. De partijleider heeft iets doms geroepen of snijdt de verkeerde thema’s aan of wat dan ook. Daarom stelt de strateeg een andere strategie voor. Natuurlijk is de bedoeling dat Nederlanders vandaag positiever gaan denken over de partij, maar nog veel belangrijker is dat ze over drie weken bij de echte verkiezingen anders gaan stemmen.

Het type voorspelling waar de politiek strateeg in geïnteresseerd is, wordt ook wel een raming genoemd. Een raming is voorspelling van hoe dingen gaan lopen als er niets verandert. Op basis van het voorspellende karakter van de raming kun je koers wijzigen. Ze worden door managers ingezet om prioriteiten te stellen, om voorraad te beheren, productielijnen in te regelen of om andere keuzes te maken in de bedrijfsvoering. Hoewel ramingen er dus van uit gaan dat dingen kunnen veranderen, hebben managers of politiek strategen er wel heel veel baat bij dat de voorspelling hoe dingen zullen gaan als er niets verandert in eerste instantie klopt. Kwak.

De strategische stemmer gebruikt peilingen eigenlijk op dezelfde manier als de politiek strateeg: als raming. Strategische stemmers vinden het belangrijk wie er minister-president wordt, dat een bepaald soort partij aan de macht komt, of dat een coalitie van hun voorkeur waarschijnlijker wordt. Ze bekijken daartoe de voorspelling van de verkiezingsuitslag en brengen hun stem uit op de partij die volgens hen nog een duwtje nodig heeft. Die voorspellingen zijn ruimschoots beschikbaar – en ze worden ook wel peilingen genoemd. Kwak.

Goed. Nu we het er hopelijk over eens zijn dat peilingen de verkiezingsuitslag proberen te voorspellen, blijft nog wel de vraag over waarom dit keer op keer ontkend wordt. Zijn de peilingen zulke slechte voorspellingen dat journalisten en peilers er niet eens meer voor uit durven te komen dat het voorspellingen zijn?

Het antwoord is dat het om iets anders gaat. Peilingen zitten er in de eerste plaats namelijk helemaal niet zo vaak naast. Ze geven meestal een heel behoorlijke voorspelling van de uitslag, maar het zijn de afwijkingen die het meeste aandacht trekken. Een partij die precies scoort wat de peiling voorspelde is geen nieuws, maar een partij die het veel beter doet, dat is het verhaal van de dag. Zeker als die partij daardoor de verkiezingen wint.

De ironie druipt er vanaf. Het is ironisch dat de media zo een vertekend beeld geven van de betrouwbaarheid van peilingen, dat ze die zelf niet meer vertrouwen én het is ironisch dat het de meest intensieve gebruikers, strategische kiezers, zijn die de betrouwbaarheid van de peiling ondermijnen.

De verschillen tussen de peilingen en de uitslag die het meeste aandacht trekken worden namelijk vooral door strategische kiezers bepaald. Peilingen kunnen gaan werken als een self-fulfilling prophecy. Een self-fulfilling prophecy is een voorspelling die gedrag uitlokt waardoor de voorspelling ook uitkomt. Partijen die aan kop gaan in de peilingen trekken vaak veel strategische stemmers die affiniteit hebben met die partij. Daardoor boeken die partijen een betere uitslag. De voorspelling dat ze gaan winnen zorgt ervoor dat ze winnen – en vaak nog veel meer dan de peiling voorspeld had. Strategische kiezers worden ook nog eens ruimschoots beloond met aandacht voor dit verschil: aandacht eigenlijk voor hoe ze de peilingen hebben weten te gebruiken om de peilingen te verslaan.

Je zou natuurlijk kunnen proberen ook dit effect mee te nemen in de peiling. Net zoals dat peilers compenseren voor groepen stemmers die over- of ondervertegenwoordigd zijn in de steekproef, zouden ze kunnen compenseren voor een bepaald percentage strategische stemmers. Het gemene is wel, dat je dan moet voorspellen hoe je voorspelling de uitslag beïnvloedt en dat je dat weer mee moet nemen in je voorspelling zelf. Dat is niet onmogelijk maar je begeeft je dan als voorspeller wel op heel glad ijs. Voor zover ik weet doen de grote peilers in Nederland dat op dit moment niet.

Er is dus wel iets bijzonders aan de hand met peilingen. Het zijn voorspellingen die onderdeel zijn van het spel. De sportverslaggever die roept dat een atleet die vooroploopt op weg is naar de overwinning, kan dat doen zonder de uitslag te beïnvloeden. Maar peilers hebben die neutraliteit niet, die geven de winnende atleet vaak een steuntje in de rug. Daar komt het ongemak over peilingen vast vandaan. Bij de peilers zelf, die oprecht proberen zo goed mogelijk te voorspellen, maar ook bij de media die zichzelf liever zien als neutrale verslaggevers van de wereld dan als medespeler in de wereld.

Dat de media moeite hebben met hun rol als politieke speler is natuurlijk nog geen reden om verwarring te zaaien over de bedoeling van peilingen onder kiezers. Dat lijkt me nogal een schending van de journalistieke codes. En het kan ook anders. In plaats van in een of andere ontkenningskramp te schieten over de aard van peilingen zouden journalisten er ook gewoon ronduit voor uit kunnen komen dat peilingen – en de manier waarop zij die bespreken – invloed hebben op de uitslag. Weet je wat, ik doe meteen een suggestie:

“Beste kiezer, dit is de beste voorspelling van de verkiezingsuitslag die we nu kunnen geven, maar we weten dat veel kiezers deze gebruiken om de uitslag te verbeteren: dus als u het er niet mee eens bent, weet u wat u te doen staat op verkiezingsdag”.

Meer lezen?

Voorspellen is een van de zes kennisfuncties die ik in doelkennis besprak. Ik ben van plan over alle andere kennisfuncties nog blogjes te schrijven. Ik schreef eerder over de sturende rol van voorspellingen bij ‘predictive policing’ in Glazen bol, bij de opvoeding in IQ, en in maatschappelijke omwentelingen in In opdracht van de tijd.

Waar

Ik wilde dit blog eigenlijk beginnen met de opmerking dat ik niet zoveel heb met de waarheid, maar ik bedacht me bijna meteen. Als ik niets heb met de waarheid, waarom zit ik dan op deze blog het een na het ander te betogen met doorwrochte argumenten, volzinnen en uitsmijters? Op zijn minst wil ik mezelf overtuigen van dat wat ik hier neerpen een kern van waarheid bevat -het liefst een diepe, harde kern van waarheid- , en nog beter is het als jullie dat ook denken. Ik geef dus wel degelijk om de waarheid, maar ik ben opgevoed met het idee dat die onbereikbaar is, persoonlijk en subjectief, waardoor ik me er een beetje voor schaam dat ik het nog steeds najaag – en zeker niet durf te claimen in allerlei blogjes. 

Hoe dat zit legt Rob Wijnberg uit in zijn boekje ‘Voor ieder wat waars: hoe de waarheid ons verdeelt en ons weer samen kan brengen‘. Daarin vertelt hij in het kort hoe het begrip ‘waarheid’ door de jaren heen van betekenis veranderd is.  

Hoe de waarheid zich ontwikkelde…

In een notendop stelt hij dat waarheid in de geschiedenis drie gedaanteverwisselingen heeft ondergaan. In de tijd voor de wetenschappelijke revolutie kwam de waarheid van buitenaf: je kwam achter de waarheid door openbaring en geloof in de waarheid ging samen met macht – je geloofde wat de vorst geloofde: goedschiks of kwaadschiks. Het christendom, de islam en het platonisme beroepen zich op dit waarheidsbegrip. 

Daarna kwam de moderne tijd waarin wetenschap de waarheid toe-eigende en stelde dat waarheid gevonden kon worden in de natuur, door het uitvoeren van vernuftige experimenten. Je geloofde dat waarin de natuur bewijs voor was. Religie moest plaatsmaken voor de wetenschap, voor rationalisme, empirisme en (klassiek) liberalisme. 

Vervolgens kwam het post-modernisme op waarin de natuur als scheidsrechter weer betwist werd, en waar waarheid niet langer als iets objectiefs werd gezien, maar als een sociale constructie. Waarheid werd iets dat door mensen uitgevonden is, meervoudig – er zijn meerdere waarheden- en daarmee ook altijd bediscussieerbaar. De hoop op een definitief antwoord was vervlogen. ‘Waar’, was datgene waartoe je overtuigd werd door anderen. Volgens Rob Wijnberg gaf dit voeding aan het existentialisme, het individualisme en het relativisme. 

Ik ben een kind van de laatste twee stromingen. Als wetenschappelijk geschoolde kan ik het rationalisme niet loslaten en blijf maar geloven dat er voor standpunten hard bewijs moet zijn; of tenminste dat voor standpunten waarvoor bewijs is meer te zeggen valt, dan voor standpunten waar dat ontbreekt. Maar als kind van de jaren 70 ben ik geworven voor het idee dat er altijd meerdere zienswijzen zijn en dat wat je gelooft zo sterk samenhangt met je perspectief. Dat ‘waarheid’ – als iets dat je persoonlijke perspectief overstijgt – ‘niet bestaat’, en dus misschien ook niet nastrevenswaardig is: er is niet één waarheid. 

Daarom vind ik het zo lastig een blogje over de waarheid te schrijven. Voor je het weet moet ik tussen mijn identiteiten als wetenschapper of als kind van het postmoderne tijdperk kiezen en ik weet – 48 jaar oud, inmiddels – niet of ik daar al aan toe ben.  

Het is een worsteling die ik veel om me heen zie: we willen de methoden, manieren, activiteiten, standaarden en houdingen aanmeten die ons kunnen helpen om de waarheid aan onze kant te krijgen, maar we willen ook respect blijven hebben voor degenen die denken dat daar andere ‘dingen’ voor nodig zijn. We willen de waarheid wel, maar we willen er geen bloed over vergieten. En we willen wel respect hebben voor alle visies, maar we vinden er het onze van.

Waar het met de waarheid heen moet…

En het is ook een worsteling die ik in Wijnbergs betoog terugzie. Na het postmodernisme volgt volgens Wijnberg nog de postmoderne consumptietijd. Hierin is de samenleving – en dus ook de waarheid – volledig overgeleverd aan de markt en het hyperindividualisme, hetgeen onze samenleving ontwricht. 

Het geeft Wijnberg een podium om zijn mediakritiek nog eens te ontvouwen. Media, met name nieuwsmedia, richten zich op de negatieve uitzonderingen en niet op de positieve ontwikkelingen en de onderliggende structuren. Hierdoor storten we onszelf als samenleving, vaak ten onrechte, in pessimisme over de wereld en raken we het zicht kwijt op wat er echt toe doet. Waarheid is een product geworden. Mediabedrijven bedienen nu doelgroepen met waarheden de consumenten goed uitkomen.

We hebben volgens Wijnberg een ander soort waarheid nodig, niet een waarheid die ons verdeeld, maar een die ons verbind. We moeten gaan zien hoe sterk mensen onderling verbonden zijn en hoe alles met alles verbonden is in de natuur. Met die waarheid in de hand kunnen we als mensheid samenwerken om een supranationale, vreedzame, eco-centrische, harmonieuze, netwerksamenleving bereiken. We hebben, kortom, een nieuw vooruitgangsideaal nodig.

#hoedan?

Allebei deze stappen (of tijdperken) doen mij wat geforceerd aan. Er is in de ruim 30 jaar dat het World Wide Web bestaat zoveel tegenstrijdigs over geroepen – en dan vooral over hoe het onze samenleving beïnvloed -, dat ik elke visie die al te veel leunt op deze jaren ben gaan wantrouwen. Zeker in een ‘grote lijnen-analyse’ die in de oudheid begint. 

Als je met zevenmijlslaarzen van nul tot nu door de geschiedenis gaat, lijkt het me wat haastig om aan de laatste paar decennia een nieuw tijdperk toe te kennen. Om de grote vraag hoe onze samenleving met de waarheid omgaat te kunnen beantwoorden, hebben we meer historische afstand nodig.

En dan is er nog de toekomstvisie die aanlokkelijk is, maar die natuurlijk niet vanzelf waarheid wordt. Misschien hoeft dat ook niet, en moeten we eerst schetsen hoe we het zouden willen voordat we het waarmaken, maar Wijnbergs visie is op zoveel punten precies het tegengestelde van de postmoderne consumptiemaatschappij, dat het wel wat meer voeten in de aarde zal hebben dan de wil om samen de schouders onder de klimaatcrisis te zetten.

De waarheid als essentie of als ideaal?

Mijn ongemak met “Voor ieder wat waars” zit hem misschien niet eens zozeer in hoe het betoog is opgebouwd, maar meer in hoe Wijnberg het begrip waarheid zelf hanteert. Wijnberg past een denktrant op de toekomst toe die meer geschikt is voor een historische analyse.

Wat Wijnberg in het eerste deel van het betoog steeds doet, is de samenleving of de cultuur terug te brengen tot een bepaald waarheidsbegrip, maar in het laatste deel draait hij het om. Hier presenteert hij een waarheidsbegrip als een vormend ideaal voor een alternatieve samenleving. Die andere manier om met het waarheidsbegrip om te gaan vraagt misschien om een ander soort betoog.

Laten we de manier waarop Wijnberg het begrip waarheid definieert er eens bij pakken. Op bladzijde 9 stelt hij: “wat liefde is voor de mens, is waarheid voor de mensheid”. Waarheid is een verlangen van een samenleving. Een verlangen dat activerend werkt, dat grootse daden inspireert, maar dat mensen ook uit elkaar kan spelen. In het verleden hebben culturen verschillende betekenissen aan waarheid toegedicht. Maar waarheid gaat diep: het is de bril waardoor een samenleving naar de wereld kijkt. 

Als we het hele betoog terugbrengen tot het benoemen van ‘het verlangen van de samenleving’ in een bepaalde periode krijgen we: vroeger verlangde de samenleving naar verlossing, toen naar vooruitgang, daarna eerst naar bevrijding en toen naar behoeftenbevrediging; en in de toekomst is het nodig dat we naar collectieve vooruitgang streven.

Je voelt de omdraaiing meteen als het naar de toekomst toe gaat. Het dominante waarheidsbegrip wordt eerst als een gevolg van de verhoudingen in de samenleving gepresenteerd en daarna als iets anders.

Waarheid als verlossing is een gevolg van de hiërarchische verhoudingen in de oudheid en middeleeuwen, waarheid als vooruitgang is het gevolg van het succes van de wetenschap, waarheid als bevrijding is een reactie op de twee wereldoorlogen, waarna waarheid als behoeftenbevrediging een gevolg is van de opkomst van de moderne consumptiemaatschappij. 

Hoe zit het dan met waarheid als collectieve vooruitgang? Is Wijnbergs betoog: we moeten waarheid gaan zien als collectieve vooruitgang en dan volgt een duurzame transitie? Of is zijn betoog eerder: om een duurzame transitie in te gaan moeten we waarheid wel gaan zien als collectieve vooruitgang? Of zegt hij: we gaan een duurzame transitie in en daarom zullen we ander waarheidsbegrip gaan hanteren? 

Ook Wijnberg lijkt te schakelen tussen de rationalist in hem, die objectief wil vaststellen welk waarheidsbegrip in verschillende culturen wordt gehanteerd, en de postmodernist in hem die denkt dat hij kan kiezen welk waarheidsbegrip hem het beste uitkomt. Die switch zit me dwars, niet in de laatste plaats omdat ik er zelf ook vaak last van heb. Ik denk dat we allemaal snakken naar het optimisme dat uit het toekomstbeeld van Wijnberg spreekt, maar het helpt niet om het als een logisch vervolg van de geschiedenis te presenteren. Dat is me net iets te vrijblijvend.

Meer lezen?

Ik had “Voor ieder wat waars” zeker niet zo kritisch besproken als ik het niet heel erg de moeite van het lezen waard vond. Het is een fijn en prikkelend betoog, waar je een stuk meer uit kan halen dan ik in dit blogje recht kon doen.

Ik duid de switch in het boek tussen een analyse van het verleden en het dromen van een toekomst als het verschil tussen diagnose- en doelkennis, waar mijn laatste blog over ging. Eerder schreef ik al over deze “denkfout” in in opdracht van de tijd

Ik schreef al eerder over hoe ik me tot hedendaagse mediakritiek verhoud in bubbel en media

De wetenschapsgeschiedenis van Rens Bod

In zijn boek “Een wereld vol patronen” doet Rens Bod een poging om een totaaloverzicht van de geschiedenis van menselijke kennis te geven. Alle kennis. Niet alleen die sinds de wetenschappelijke revolutie, maar ook van voor de uitvinding van de landbouw. Niet alleen westerse kennis – maar ook die in India, de Arabische wereld en China. Niet alleen de natuur-, maar ook de geesteswetenschappen. Ik weet niet zo snel hoe je een ambitieuzer project kan bedenken.

Ik begon aan “Een wereld vol patronen” omdat ik de voorganger “De verborgen wetenschappen” prachtig vond. Dat boek verbreedde mijn kennis van de wetenschapsgeschiedenis enorm, omdat ik net zoals de meeste andere bèta’s vooral geschoold was in de westerse wis- en natuurkunde, sinds de Grieken. Ik had nooit van zoiets als filologie gehoord en het was boeiend om op deze manier ingewijd te worden in de problemen die schriftgeleerden moesten oplossen, de oplossingen die ze vonden en de impact die dat denken vervolgens had op de wetenschappen die ik beter kende.

Ik heb “Een wereld vol patronen” met plezier gelezen, maar het kon me minder bekoren dan “De verborgen wetenschappen”. Dat komt voor een belangrijk deel omdat ik dat boek al gelezen had en de nieuwe verbredingen me minder raakten. Ik zou graag meer weten over hoe kennis in de prehistorie zich ontwikkelde, maar omdat we het met grottekeningen en ingekerfde werktuigen moeten doen, valt er per saldo niet zoveel over te zeggen. Het is een groot goed dat Bod de kennis van Arabische, Indiase, Chinese en oude Amerikaanse beschavingen een podium geeft, maar die brede blik zorgt ook dat de afzonderlijke verhalen nog weinig uit de verf komen.

Normatief werkt de brede blik uit het boek prima: dit zijn allemaal dingen die een wetenschapshistoricus in beschouwing zou moeten nemen. Maar de uitwerking van al die onderdelen pakt nogal schetsmatig uit, hoe grondig het onderliggende onderzoek ook is. Daar komt nog bij dat Bod, de medische wetenschap uitgezonderd, de engineering disciplines niet meeneemt in zijn overzicht. Dat is een opmerkelijke omissie. Als gebouwen, werktuigen, scheepvaart, aquaducten en stoommachines geen weerslag zijn van systematische kennis, wat dan wel?  Bod slaagt erin de ambitie van een totaalgeschiedenis van menselijke kennis stevig op de kaart te zetten, maar het resultaat blijft sterk gekleurd door zijn eigen wetenschappelijke achtergrond.

Uiteraard probeert Bod ook duiding te geven aan de ontwikkeling van de menselijke kennis. Om kort te gaan, werd de mens zich eerst bewust van patronen: regelmatigheden waarmee losse feiten in verband worden gebracht, zoals de maanstanden, de tonen in gespannen snaren, of de overeenkomsten tussen verschillende bronnen. Later, vanaf de vroege oudheid, zijn mensen daar onderliggende principes bij gaan zoeken: vuistregels, wiskundige begrippen of andersoortige theorieën. De volgende stap was het vinden van herleidingen: regels waarmee principes en patronen met elkaar in verband gebracht kunnen worden, zoals de logica. Daarna verschoof de focus naar het terugbrengen van het aantal principes en gingen herleidingen een belangrijkere rol spelen. Dit mondde uit in de wetenschappelijke revolutie en in de empirische cyclus: in Bods visie een voorbeeld van een patroon in herleidingen.

Om eerlijk te zijn, vind ik deze theorie over de ontwikkeling van kennis zonde van het boek. Bod schrijft het volgende over de Indische wetenschapper Panini, die beweerde dat alle taal recursief was:

De Grieken lijken Panini’s werk niet te hebben gekend […] ze zouden Panini zeker hebben gewaardeerd met hun hang naar het ene in het vele. (P98)

Ik vermoed dat de Grieken Bods reductie van al het systematische denkwerk uit de gehele mensheid naar een dans van twee soorten begrippen -patronen en principes- om dezelfde reden hadden kunnen waarderen. Hoe krachtig is het als je al die diversiteit, al die denkwijzen, als die subtiele manieren waarop de verschillende wetenschappen elkaar gevoed en beïnvloed hebben terug kunt brengen tot een of twee makkelijk te begrijpen begrippen?

Niet zo krachtig, als je het mij vraagt. Veel mensen zullen het wel zo zien, maar ik blijk niet erg “Grieks”. Want die twee begrippen zijn maar begrippen. Ik voel me niet verlicht door het idee dat je de grammatica en de afwisseling van dag en nacht allebei als ‘patronen’ kan zien die je vanuit ‘principes’ kunt begrijpen. Dat is zó hoog over dat het afleidt van die dingen die echt boeien. Het kan toch niet zo zijn dat dit de beste manier is om een zorgvuldige vergelijking te maken tussen bijvoorbeeld de ontwikkeling van het recht en de ontwikkeling van de natuurwetenschappen in de middeleeuwen? Dat ze zich beide met principes en patronen bezighielden is misschien wel waar, maar ook nogal een lege constatering. En dat terwijl Bod juist zo zorgvuldig werk verricht heeft om al die verschillende kennis in kaart te brengen.

De theorie lijkt een poging te zijn om te laten zien dat het menselijke denken een ontwikkeling heeft doorgemaakt en mogelijk is verwetenschappelijkt. Daarmee gaat hij verder dan wetenschapsfilosofen als Popper en Laudan. Die beweren wel dat ze mechanismen voor de groei van kennis kunnen identificeren, maar passen die vervolgens eigenlijk niet toe op de geschiedenis zelf.  Laat staan dat ze er een ontwikkeling in ontwaren. Toch vind ik Bod ook op dit aspect overtuigingskracht missen: er komen veel uitzonderingen voor in het boek en Bod laat het bij beschrijvingen. Een verklaring waarom het denken door de tijd veranderd zou zijn ontbreekt. Interacties tussen de kennis en de context waarin die tot stand komt blijven onderbelicht. Daardoor blijft ook dit ontwikkelingsaspect te veel in het luchtledige hangen.

Kritische noten genoeg dus, maar dit zijn nauwelijks redenen om het boek in de boekhandel te laten liggen. De kracht van het boek zit niet in de duiding, het is juist de bloemlezing. Het is de diversiteit die Bod in deze eenvoud probeert te vangen, die het boek de moeite waard maken. Ik had het liefst gezien dat Bod die diversiteit gewoon lekker vrij had gelaten, maar zo knellend is het patroon-principe-keurslijf nu ook weer niet. Je kunt er gewoon doorheen lezen en genieten van het denken van al die denkers waar je nog nooit van gehoord had, die er achster tevoorschijn komt. 

Meer lezen?

Ik schreef over de groei van kennis in Het probleemoplossend vermogen van Larry Laudan, en Groeit kennis? In Anachronismen ging ik in op de moeilijkheid van het achteraf duiden van oude kennisstandaarden. Ik schreef ook al eens over het nut van Geschiedenis in het algemeen.

Er zijn weinig wetenschapshistorici die veel aandacht hebben voor de wisselwerking van de ontwikkeling van kennis en haar toepassing, maar uitzonderingen vormen wel Bruno Latour en ook The Information van James Gleick.

Zowel “De vergeten wetenschappen” en “Een wereld vol patronen” zijn het lezen waard.

Computerbesluit

Is het wel slim om computers overal over mee te laten denken? 

Ik stel de vraag natuurlijk omdat artificiële intelligentie (A.I.) een enorme hype is. Meestal gaan hypes ongemerkt weer voorbij, maar met A.I. zou dat wel eens anders kunnen zijn. We delegeren steeds meer beslissingen aan computers: A.I. helpt doctoren met het stellen van diagnoses, rechters met het vaststellen van de strafmaat, banken met het maken van beslissingen over leningen en verzekeringen. Bedrijfsconsultants zullen die denkondersteuning geweldig vinden: we gebruiken slimme technologie om een kwaliteitsimpuls te geven en een efficiëntieslag te maken – en meer van dat soort dingen. Ik geloof ook wel dat dat werkt. Vaak zal het lukken om beslissingen met A.I. gemakkelijker te maken.

De vraag is alleen hoe dit alles bij elkaar opgeteld uitpakt. In een samenleving zijn beslissingen nogal belangrijke dingen. Ons bestaan hangt van beslissingen aan elkaar. Is het verstandig om die vervolgens één voor één, met de beste intenties, uit te besteden aan een computer? 

We hebben natuurlijk wel eerder technologie ontworpen om ons denken te ondersteunen. Als we even met zevenmijlslaarzen door de porseleinkast van de geschiedenis stampen, dan speelde de vraag of het verstandig was om het denken aan technologie uit te besteden al wel vaker. We vroegen het ons ook al af bij de uitvinding van de getallen, het schrift, de rekenliniaal, telecommunicatie, de rekenmachine, de computer en het internet. Al deze technologieën hebben de samenleving ingrijpend veranderd, maar maar weinig mensen zullen zeggen dat het achteraf gezien onverstandig was om ze in gebruik te nemen. Er is dus op zichzelf niets tegen breinondersteunende technologie. Waarom zou het voor A.I. anders zijn?

Één belangrijk verschil zit hem in de manier waarop A.I. beslissingen neemt. Zij doet dat door te leren van menselijke beslissingen. Het Amerikaanse bedrijf Amazon gebruikte A.I. om ze te helpen sollicitanten te selecteren. Op basis van gegevens van mensen die eerder bij het bedrijf solliciteerden, berekende een computer hoe kansrijk het was dat een nieuwe sollicitant zou worden aangenomen. Er ontstond een relletje toen dat selectiealgoritme een sterke voorkeur bleek te hebben voor mannelijke kandidaten. Het algoritme had allerlei dingen van menselijke beslissingen overgenomen, inclusief het seksisme dat binnen dit bedrijf gangbaar was.

Het verhaal leert ons dat A.I. conservatieve technologie is. Het is niet toevallig zo dat het Amazon-algoritme het seksisme van de medewerkers reproduceerde, het is in de regel zo dat deze technologie de manier waarop beslissingen in het verleden zij genomen, herhaalt. Dat is het hele idee. A.I. leert van de beslissingen van het verleden om de beslissingen van vandaag te kunnen ondersteunen. Deze verknoping van de technologie aan het menselijk handelen is wezenlijk anders dan andere technologieën in het rijtje erboven. Rekenmachines zijn als technologie veel neutraler. Waar de rekenmachine denkkracht vrij kan maken om nieuwe ideeën te bedenken, bindt A.I. ons impliciet aan het denken van gisteren. 

Het voorbeeld van Amazon laat ook meteen zien waarom er de laatste tijd zoveel over responsible A.I. (verantwoorde A.I.) gesproken wordt. Blijkbaar is een gebrek aan verantwoordelijkheid een probleem bij de inzet van A.I. dat nog opgelost moet worden. Het is ook niet zo vreemd om dit te bedenken. Als mensen besluiten nemen kunnen ze ter verantwoording geroepen worden, maar bij een algoritme kan dat niet. Wie is er verantwoordelijk als een zelfrijdende auto een ongeluk veroorzaakt? De bestuurder deed niets, de fabrikant kon niet weten dat deze situatie zich voor zou doen. Het is een algemeen probleem bij de inzet van A.I. Naarmate beslissingen meer op basis van A.I. genomen worden, wordt het moeilijker verantwoording af te leggen over die beslissingen.

Kortom: hoe meer we het beslissen aan technologie overlaten, hoe meer we denken inruilen voor hoe het nu eenmaal gaat en wat nu eenmaal het beste is. Vaak is dat een goed idee: we winnen er tijd mee die we beter kunnen gebruiken en de kwaliteit van sommige beslissingen die met A.I. genomen zijn, is aantoonbaar hoger dan de menselijke beslissingen die erdoor vervangen worden. Maar die winst kent ook een prijs die we niet altijd zien.  

Eigenlijk kun je zeggen dat het vergemakkelijken van beslissingen het vertrouwen erin ondergraaft. Het automatiseren van besluitvorming holt de verantwoordelijkheid van ons handelen uit. Hoe meer we ons doen en laten verweven in ingewikkelde systemen, hoe lastiger het wordt om de vinger op de zere plek te leggen als het eens misgaat en hoe moeilijker het wordt om iets te veranderen. Je hoeft alleen maar naar het systeemfalen in de toeslagenaffaire te kijken om te zien hoe desastreus dat kan zijn. 

Dus nee, computers moeten niet overal over meebeslissen. We zullen soms een trager, duurder of slechter besluit moeten accepteren, simpelweg om iemand te hebben om mee na te kunnen gaan hoe het ooit genomen is.


Meer lezen?
Ik schreef al eens kritisch over A.I. in de rechtszaal in A Piori en in de criminaliteitsbestrijding in Glazen Bol. De analyse in dit blogje volgt een logica die gangbaar is in de media-ecologie. Dat dit is niet zonder haken en ogen, beschreef ik uitgebreid in media. In De Chinese Kamer ga ik in op de vraag of dit soort algoritmen ook bewustzijn hebben.

Bubbel

Als je een lijstje zou maken met de meest invloedrijke boektitels van de jaren 10 zou “The Filter Bubble” van Eli Pariser (2011) er vrijwel zeker op staan. Althans… Als je afgaat op hoe vaak het woord “bubbel” gebruikt wordt in het alledaagse taalgebruik. Meestal in een waarschuwende zin en licht bezorgd: “Belanden gebruikers dan niet in een bubbel?”; of: “Bubbels zorgen voor polarisatie in de samenleving“; maar ik heb het ook al in een positieve zin gehoord: “Ik heb een fijne bubbel”. Door Pariser zijn we ons er van bewust geworden dat we dagelijks maar een heel klein stukje van het internet bekijken en dat dat – nou ja – een dingetje is, ofzo.

Laat ik er maar gewoon meteen voor uitkomen. Ik denk dat bubbels meer aandacht krijgen dan ze verdienen en dat we het beter over andere aspecten van de inrichting van onze informatiesamenleving zouden kunnen hebben. Maar, voordat ik die conclusie kan trekken, zal ik toch nog even moeten spitten in de ideeën van Pariser zelf.

Een historisch betoog

“The Filter Bubble” opent met het nieuws van Google, in 2009, dat ze de zoekresultaten gaan personaliseren. Dat betekent dat niet iedereen die dezelfde trefwoorden intoetst op Google dezelfde resultaten krijgt. Jij en ik, individuele gebruikers, worden daarmee beter bediend, althans: we krijgen meer van wat we willen lezen. De samenleving is er minder bij gebaat want als burgers kunnen we beter met elkaar in gesprek als we over dezelfde informatie beschikken.

Het is niet toevallig dat Pariser met een historische gebeurtenis begint, want zijn kritiek is deels historisch van aard. Vroeger – toen internet nog een internetje was – was het een anarchistische vrijplaats van informatie die onze wereld groter maakte. We gingen online en kwamen in contact met andersdenkenden en met een overvloed aan vrij toegankelijke informatie, we voelden ons verrijkt en geïnformeerd. Het internet was een verbindende factor in ons leven.

Maar nu zijn er de grote technologiebedrijven die bakken met geld verdienen door ons informatie toe te spelen die zo goed mogelijk op onze persoonlijke voorkeuren is toegesneden. Daardoor is het web niet meer de wonderbaarlijke gemeenschappelijke informatiewereld die we samen gebouwd hebben, maar een cynische informatiemachine die ons allemaal informatieve snoepjes toewerpt om ons zoet te houden. Op je wenken bediend worden: daar word je niet socialer van. Het web dat ons ooit samenbracht, speelt ons nu uit elkaar.

Dat is stevige kritiek, maar het getuigt ook van een nostalgie die je wel meer bij internetcritici ziet. Je kent ze wel: de alles-wordt-minder-types. Erg veel hout snijdt dat vaak niet. Misschien is het internet niet meer wat het geweest is, maar misschien zijn we zelf wel niet meer wie we waren – of kleuren we het verleden mooier in dan het was. Hoe dan ook: we moeten het internet van nu langs de lat van nu leggen. Als het internet voor de jeugd van tegenwoordig ook een vrijplaats is, is er niets aan de hand.

Het probleem dat Pariser aankaart is dat het internet in toenemende mate gepersonaliseerd wordt en daarom ons denken in toenemende mate stuurt en dat het net steeds minder een gedeelde informatieruimte biedt. Laten we die twee argumenten eens bij de hoorns pakken.

Algoritmische hersenspoeling

Is het gebruik van adviesalgoritmen slecht voor ons brein? Uit de psychologie is bekend dat mensen geneigd zijn bevestiging te zoeken voor hun ideeën.  In plaats van alle informatie die er is eerlijk te wegen en een besluit te nemen, besteden we meer aandacht aan informatie die onze ideeën bevestigt en we nemen die bevestigende informatie serieuzer. Met andere woorden: we houden onszelf graag voor de gek.

Als algoritmen eerst van ons leren wat we willen lezen en ons vervolgens meer van dat soort informatie voorschotelen dan wordt die neiging nog verder versterkt. We lezen steeds dingen waar we het mee eens zijn, en we gaan denken dat iedereen er zo over denkt, want waarom zouden we anders zoveel artikelen lezen waar onze mening precies in uitgespeld staat? Nou ja. Door de algoritmes dus. Het is dit zelfversterkende effect waar de filterbubbel zijn naam aan ontleent. Je eigen mening wordt opgeblazen en zo bouw je een beschermlaag op tegen andere meningen.

Dit kan een ware hersenspoeling veroorzaken. Want hoe vormen we onze meningen? Door de informatie die we krijgen. Eerst beschermden we onze meningen door alleen dingen te lezen waar we het mee eens waren. Vervolgens gaan de algoritmen ons daarmee helpen door ons meer van wat we al dachten voor te schotelen. Vervolgens denken we dat iedereen er net zo over denkt als wij, waardoor we sterker in onze mening gaan staan, minder diverse keuzes maken in ons mediadieet en die keuzes worden dan weer versterkt door de algoritmen. We zijn in een echoput beland, een filterbubbel of een fabeltjesfuik en we komen daar nooit meer uit. –snik-

Totdat we de buurvrouw spreken.

Die buurvrouw zit in een andere bubbel, blijkt heel anders over dingen te denken en prikt onze bubbel genadeloos door. En het hoeft niet de buurvrouw te zijn, die bubbel kan ook doorgeprikt worden door informatie die we door andere algoritmen toegespeeld krijgen of door de mainstream media. Als je maar met grote regelmaat met andere ideeën en informatie geconfronteerd wordt, maken bubbels niet zoveel kans. En die ontmoetingen worden ook georganiseerd door dat internet en haar algoritmen.

Het is helemaal geen nieuw fenomeen dat mensen informatie zoeken die hen sterkt in ideeën die ze al hebben. Ze kiezen een bepaalde omroep, gaan naar een bepaalde kerk, steunen een politieke beweging, bezoeken bepaalde voorstellingen. Vroeger werden we geboren in een bubbel, die van het dorp of de politieke voorkeur van je ouders. De bubbels van nu zijn misschien meer gebaseerd op onze interesses en minder op basis van onze woonplaats, maar we blijven allemaal op zoek naar geestverwanten. De vraag is daarom ook niet óf we in bubbels duiken, de vraag is hoe vaak we er weer uitgehaald worden. Hoe vaak komen we andersdenkenden tegen die ons op nieuwe gedachten kunnen brengen.

Er zijn op het internet twee krachten die elkaar in balans houden. Het ontstaan van bubbels door algoritmen en het doorprikken van bubbels doordat we meer in contact komen met andersdenkenden. De vrees van Pariser dat het bubbeleffect het ontmoetingseffect zou gaan overheersen is vooralsnog niet uitgekomen. Uit onderzoek blijkt dat mensen diverse bronnen blijven gebruiken, dat mensen die Spotify gebruiken hun muzieksmaak verbreden en dat mensen goed weten hoe er in andere bubbels over dingen gedacht wordt.

Ironisch gezien verklaart dat effect misschien juist de populariteit van het begrip bubbel. Misschien zijn we zoveel beter genetwerkt, dat we veel meer dan vroeger ook doorhebben dat anderen anders over dingen denken. Dat is misschien niet zo erg.

Een gedeelde informatieruimte

Maar hebben we dan niet een chronisch gebrek aan een gedeelde informatieruimte? Dit is Pariser’s tweede punt. Als samenleving is het belangrijk om een evenwichtig beeld te krijgen ervan wat er speelt, wat de belangrijke gebeurtenissen zijn, hoe er zoal gedacht wordt over allerlei onderwerpen, welke problemen bestaan en welke oplossingen daarvoor worden voorgesteld. Op basis van dit beeld gaan we met elkaar in gesprek.

We hebben de taak om ons daarover te informeren aan een beroepsgroep toevertrouwd: journalisten. Net als veel andere sectoren heeft de journalistiek ongemeen harde klappen gehad met de opkomst van het internet. Enerzijds vrat het internet aan het belangrijkste verdienmodel van de sector: advertenties. Anderzijds zorgde het voor een overvloed aan informatie die concurrerend was voor journalistieke producties.

Het is daarom fair om te zeggen dat onze gedeelde informatieruimte onoverzichtelijker is geworden – en dat ze versnipperd is geraakt. Mensen baseren zich op meer verschillende bronnen dan vroeger, het onderscheid tussen opinie en feiten is vervaagd en de kwaliteit van informatie is niet meer vanzelf gewaarborgd.

Is dat ook schadelijk? Mwah. Hoewel het al een stevigere stellingname is kan ik er nog nét in meegaan dat je kan zeggen dat ons publieke debat er onrustiger van geworden is, hitseriger misschien. Maar het gaat nóg verder om te zeggen dat dit onze democratie schaadt en ik zie eigenlijk niet in wat er ondemocratisch zou zijn aan een verhit maatschappelijk debat.

Maar voor dit blogje is nog een andere observatie van belang: geen van deze effecten heeft ook maar iets te maken met personalisatie en algoritmen. De versnippering van het publieke debat hangt samen met het aanbod van informatie. Het komt door de verschraling van professioneel geproduceerde informatie en de opkomst van twijfelachtige informatiebronnen; die soms wel journalistiek lijken, maar dat niet zijn. Dat het internet ons in contact brengt met al die bronnen is precies het soort verruiming van onze leefwereld waar het vroege internet voor geprezen werd. Er is misschien veel te veel zooi op het net, maar als we ons daarvan af willen schermen hebben we sterkere filterbubbels nodig, geen zwakkere.

Pariser stelt daar tegenover dat de logica achter personalisatie van nieuwsstromen, gericht op het individu, de selecterende rol van journalisten uitholt. Omdat we algoritmen gebruiken als gids op het eindeloze internet bepalen die algoritmen ook welke informatie we online bekijken. Maar in tegenstelling tot journalisten zijn die algoritmen er niet op uit om ons een gebalanceerd overzicht te bieden van alles in de wereld. Ze richten zich op wat wij willen lezen, niet op welke informatie belangrijk is voor onze samenleving.  

Ook dit argument klinkt plausibel, maar opnieuw is het de vraag of Pariser de algoritmen niet enorm overschat. Hoe berekenen algoritmen wat persoonlijk relevant is voor jou? Een belangrijk ingrediënt in de rankschikking van tijdlijnen zijn sociale filters. Algoritmen kijken naar het lees- en deelgedrag van onze sociale omgeving om te beslissen wat wij belangrijk vinden. In die sociale omgeving gebruiken veel mensen veel verschillende nieuwsmedia. Ze delen wat ze daarin belangrijk vinden en dit bepaalt weer wat anderen zien. Die collectieve selectie van wat belangrijk is, geeft daarmee min of meer hetzelfde beeld van wat er speelt als de selectie die een krant maakt – én deze wordt nog altijd gevoed door de selecties van de media. Journalistische curatie is dus iets meer naar de achtergrond gedrongen, maar ze is niet weg.

De filterbubbel voorbij

Het sterke van Pariser’s betoog is dat hij ons bewust maakt van veranderingen in het krachtenveld dat rondom nieuwsselectie ontstaat en de invloed daarvan op onze democratie. Het zwakke van het betoog is dat “de algoritmen” de schuld krijgen zonder al te veel bewijs dat ze ook de belangrijkste veroorzaker zijn van de problemen of zelfs maar een eenduidige beschrijving van wat de problemen zijn.

Uiteindelijk is de filterbubbel dus zelf een fabeltje. Het is een verhaaltje over wat er zou kunnen gebeuren als het allemaal helemaal misgaat, bedoeld als waarschuwing. In 2011, toen personalisatie op het web nog in de kinderschoenen stond kon Pariser ook nog niet veel anders, maar inmiddels zijn we 10 jaar verder en wordt het tijd die invloed van algoritmen simpelweg eens door te meten en nuchter vast te stellen wat ze voor en tegen ons doen. Die cijfers gaan een heel genuanceerd beeld geven.

Goed, het is 2021 en het zijn politiek roerige tijden. Veel mensen zien de bestorming van het Capitool door complotdenkers als het ultieme bewijs dat het internet wel een schadelijke rol zal spelen. Hoe kunnen mensen anders zulke rare dingen geloven?

Maar de werkelijkheid is dat de wereld altijd al vol was met mensen met vreemde ideeën. De Capitoolbestorming was niet de eerste staatsgreep en gaat niet de laatste zijn. Het ontstaan van sektes en bizarre theorieën is de regel in de menselijke geschiedenis, niet de uitzondering. Als we iets verder dan 20 jaar terugkijken zien we dat de polarisatie waar we ons nu aan storen van alle tijden is en van elke inrichting van het medialandschap.

Vooruit. Andersdenkenden vinden elkaar tegenwoordig makkelijker. Maar totdat alt-right dat uitbuitte vonden we dat collectief de grootste zegening van het internet. Het is ook plausibel dat we door het internet en haar algoritmen meer in contact komen met die vreemde ideeën. Ironisch genoeg vinden we dat geweldig wanneer die ideeën passen bij onze eigen interesses, en vreselijk als het om verwerpelijke of domme ideeën van anderen gaat. We blijven in onze bevestigingsvalkuil trappen: onze eigen ideeën zijn een gevolg van een goede opleiding, weloverwogen informatieverzameling en puik denkwerk; anderen zitten in een filterbubbel.

Natuurlijk kunnen we ons met Pariser zorgen maken over onze gedeelde werkelijkheid, maar in plaats van personalisatie de schuld te geven is het misschien beter om iets te doen aan de bouwstenen van die gedeelde werkelijkheid.  Goede, levensvatbare, journalistiek – al dan niet gesubsidieerd; het inperken van de macht van de meest dominante platformen, vooral waar die een bedreiging vormen voor de verdienmodellen van de poortwachters van onze samenleving; het aanpakken van schimmige verdienmodellen en datahandel; investeren in wetenschap en onafhankelijke onderzoeksinstituten; zorgen voor een betrouwbare en transparante overheid; het aanpakken en weerspreken van propaganda en stemmingmakerij; en natuurlijk in gesprek gaan met anderen ook als daar je eigen bubbel mee op het spel staat.

Met het fabeltje van de filterbubbel maken we het publieke discours het probleem van technologiebedrijven en vergeten we te kijken naar wat we zelf kunnen doen om de kwaliteit van ons publieke gesprek te verhogen. Goed,  sinds 2009 is personalisatie een vast onderdeel van onze informatieruimte, maar laten we niet doen alsof we in het lijstje hierboven geen steken hebben laten vallen.

Meer lezen?

In media beweerde ik dat je eigenlijk niets kan zeggen over de invloed van media op de samenleving. In ziekte bespreek ik waarom het ontwijken van andere ideeën een slecht idee is. Ik schreef op een ander blog over hoe platformen anders ingericht kunnen worden om ons publieke debat te versterken.

Het spotify onderzoek waar ik naar verwijs wordt in dit Universiteit van Nederland praatje toegelicht.

Naar aanleiding van deze post wees iemand me op dit artikel van Axel Bruns, waarin het onderzoek naar de Filterbubbel op een rijtje gezet wordt. Ook hij beweert dat het filter bubbel idee een debat over wat er wél mis gaat in ons publieke debat in de weg zit.