Spelletjes spelen met moraliteit

Onze ingebakken morele modules werken op elkaar in. Met simpele spelletjes kun je simuleren hoe mensen in samenlevingen met elkaar omgaan. Over de omgang met macht, verdeling, wraak en vertrouwen.

Jul 29, 2023

In English: Playing games with morality

Laten wij er maar even van uitgaan dat wij onze genetisch vastgelegde moraliteit al een beetje in beeld hebben. In deze reeks over moraliteit en tolerantie ging de vorige aflevering daarover. Maar hoe zit het dan met de rest van onze moraliteit? Het is een grote stap van family first, het begrip eigendom, empathie en reciprociteit naar de huidige complexe morele stelsels die wij er tegenwoordig op nahouden.

Wij gaan het hebben over morele evolutionaire speltheorie. Ter inleiding deze korte video, waarin de speltheoreticus en filosoof Jason McKenzie Alexander het goed uitlegt.

In deze nieuwsbrief gaan wij aan de hand van speltheorie ontdekken:

hoe gemeenschappen met een gedeelde moraliteit ontstaan,
waarom coöperatieve gemeenschappen dikwijls argwanend staat ten opzichte van buitenstaanders,
hoe samenlevingen met verschillende morele stelsels naast elkaar kunnen bestaan,

en nog veel meer.

Wij gaan eerst kijken naar de traditionele speltheorie, waarin wij een aantal interessante spellen doornemen. Beschouw die spellen als een introductie, waarbij je je zult afvragen: wat zou ik doen? Wat zou de ander doen? En: wat is de rationeel beste spelstrategie?

Na die inleiding op de speltheorie wordt het nog leuker. Speltheorie bleek namelijk ook heel geschikt om inzicht te krijgen in biologische, evolutionaire processen. Na de bespreking van evolutionaire speltheorie komen wij dan toe aan de kern van dit artikel: morele evolutionaire speltheorie, in wezen een afgeleide van evolutionaire speltheorie.

Deze morele theorie staat in wezen nog in de kinderschoenen. Een handjevol filosofen zijn ermee aan het pionieren; de modellering zit vol met wiskunde; de theorie is een beetje nerdy. Hoewel de resultaten nog tamelijk primitief zijn, is het een boeiende benadering van een complex probleem. Wat kan de speltheorie ons leren over de evolutionaire ontwikkeling van morele kwesties die je in elke cultuur tegenkomt? We hebben het dan over kwesties als samenwerking, vertrouwen, schaarste, verdeling en straf.

Maar nu dus om te beginnen de traditionele speltheorie.

Speltheorie

De oorsprong van de speltheorie was wiskundig. Spellen als het schaakspel werden geanalyseerd op een hoger abstractieniveau: welke strategie zou op langere termijn het meeste voordeel opleveren. In 1944 ontdekte John von Neumann dat de beginselen van de speltheorie ook toepasbaar kunnen zijn in de economische theorie. Ook in de oorlogsvoering kwam een abstracte analyse van spelstrategieën van pas. Welke strategie is de beste als de tegenstander ook de keuze heeft uit meerdere strategieën? In de meeste gevallen kun je niet afstemmen met de andere speler. Je moet dus inschatten wat die ander gaat doen, die wat jou betreft met hetzelfde probleem zit.

In de speltheorie werd een aantal moreel getinte spellen ontwikkeld. Wij behandelen achtereenvolgens het prisoner’s dilemma, haviken en duiven, de verdeling van een brood, en tot slot het ultimatumspel, omdat die allemaal ook in de evolutionaire variant van de speltheorie gespeeld kunnen worden.

Nu eerst de basics dus: traditionele speltheorie.

Het gevangenendilemma

Het bekendste spel is het prisoner’s dilemma. Het spel gaat feitelijk over vertrouwen en samenwerking. Bij samenwerking wint iedereen. Win-win, 1+1=3. Maar wat nou als een individu de mogelijkheid heeft om een hogere individuele winst te boeken die ten koste gaat van de samenwerking? Dit probleem komen wij dagelijks tegen, in kleine en grote kwesties.

Ik vertoef veel in de Balkan, in kandidaat-lidstaten van de Europese Unie. Een grote hindernis voor toetreding is daar politieke corruptie. Stel, je bent een leider van zo’n land. Het is in het belang van het hele land dat het toetreedt, maar als leider hark je miljoenen binnen met corruptie. Nu moet je kiezen: je land treedt toe tot de EU, of je vergaart heimelijk een vermogen van 50 miljoen. Wat zou jij doen?

Het spel gaat als volgt. Er is een ernstig misdrijf gepleegd en de politie pakt twee verdachten op. We noemen ze Anna A. en Betty B. De politie verdenkt ze dat zij het misdrijf samen hebben gepleegd, maar heeft alleen bewijs voor een kleiner vergrijp. Op het lichtere vergrijp staat zeven jaar cel, op het zware misdrijf dertig jaar. Voor veroordeling voor het ernstige misdrijf heeft de politie heeft een bekentenis nodig.

Anna en Betty zitten allebei in een andere cel en zij kunnen niet met elkaar communiceren. De politie verhoort ze elk afzonderlijk. Als zij allebei hun mond houden, heeft de politie alleen bewijs voor het lichtere vergrijp, en komen ze er allebei met zeven jaar cel van af. De politie legt ze elk afzonderlijk een deal voor: als je je medeplichtige verlinkt, krijg jij maar twee jaar cel, maar je medeplichtige krijgt vijftig jaar. En dat aanbod wordt ook aan je medeverdachte gedaan. Maar let op: als jullie elkaar verlinken, draaien jullie allebei voor dertig jaar de bak in.

Let op dat de opgestelde straf van Anna en Betty samen het kleinst is als beiden hun mond houden (14 jaar) en het grootst als zij allebei ‘zingen’, zoals dat in boevenjargon schijnt te heten (60 jaar). Als er maar één zijn mond houdt, is de totale straf lager (52 jaar) dan wanneer A en B allebei doorslaan.

Als het spel eenmalig gespeeld wordt, is de ander verlinken, statistisch gesproken, de beste strategie. Dat is de ironie van het spel: dat wij een suboptimaal resultaat boeken, door de optie te kiezen met het best mogelijke resultaat ongeacht wat de ander doet.

Ik schreef in een andere reeks over Thomas Hobbes. Dit is wat hij in de kern bedoelde: om op win-win basis samen te werken, is er een mate van dwang (of op zijn minst afstemming of vertrouwen) nodig. Is die er niet, dan is het rationeel om te kiezen voor het eigen hachje. Zonder externe prikkel is het rationeel om de ander niet te vertrouwen, zeker als het een onbekende betreft.

Straks gaan wij bekijken wat dat betekent voor de verhouding tussen low trust en high trust samenlevingen.

De havik en de duif

Over samenwerking is nog een spel bedacht: de havik en de duif. Er ligt een beperkte hoeveelheid (schaarste!) voer op de grond. Er zijn twee diersoorten geïnteresseerd. De havik zal om het voer vechten totdat hij gewond raakt of de ander de strijd opgeeft. Een duif laat het voer meteen achter zodra de ander agressief gedrag vertoont.

Twee haviken zullen erom vechten tot de ander opgeeft. Twee duiven zullen het voer delen zonder gevecht. Als het spel gespeeld wordt tussen een duif en een havik, wint de havik per definitie, want de duif capituleert meteen.

In een gemeenschap van duiven zijn er geen verliezers. Het voer wordt eerlijk gedeeld en niemand raakt gewond. In een gemeenschap van haviken heb je winnaars en verliezers: de ene havik krijgt het voer en de ander niet. Bovendien raakt er bij een gevecht van havik tot havik altijd één gewond. Dat is slecht voor de havikenpopulatie: menig havik bezwijkt aan de verwondingen. Duiven hebben dat probleem niet: die delen het voer met elkaar zonder gevecht. Duiven gaan dus efficiënter met schaarste om.

Het probleem in dit spel is dat haviken dan weliswaar inefficiënt met schaarste omgaan, maar dat zij het spel toch winnen. Want in een wereld met louter duiven en haviken krijgen de haviken al het voer, en zullen de duiven verhongeren.

Agressie loont. Vreedzame, coöperatieve samenlevingen gedijen beter dan agressieve, gewelddadige samenlevingen, maar vreedzame samenlevingen hebben geen verweer tegen agressie. Of toch wel? Wij gaan het straks zien.

Het Nash verdelingsspel

Het derde spel veronderstelt een brood dat op alle mogelijke manieren verdeeld kan worden, en twee spelers. De twee spelers kunnen niet met elkaar communiceren. Zij moeten allebei aan de spelleider vertellen welk deel van het brood zij willen. Als hun wensen opgeteld het hele brood bedraagt, krijgen zij allebei het door hen gevraagde deel. Als hun opgetelde wensen samen minder dan het hele brood bedragen, krijgen zij allebei het gevraagde deel. Maar als ze opgeteld meer dan het hele brood wensen, krijgen zij allebei niets.

Het ligt voor de hand om te veronderstellen dat iedereen kiest voor 50/50. Maar waarom eigenlijk? De spelers moeten op voorhand bepalen met hoeveel ze genoegen nemen. Als een speler honger heeft en maar tien procent vraagt, dan heeft die een grotere kans op brood dan wanneer hij vijftig procent vraagt. Doet de andere speler dat voorzichtigheidshalve ook, dan hebben zij samen maar twintig procent van het brood verdeeld; de rest gaat verloren.

Anderzijds: een gelijke verdeling is de strategie waarbij iedereen het maximaal haalbare vraagt zonder een aanzienlijk risico te lopen dat er brood verloren gaat. Wie meer dan vijftig procent eist, weet bijna zeker dat zijn eis tenietgedaan wordt, tenzij hij op voorhand informatie heeft dat de ander minder dan vijftig procent zal eisen.

Interessant aan dit spel is dat elke verdeling die opgeteld honderd procent bedraagt, stabiel is. Wie eenmaal gewend is om tien, vijftig of tachtig procent te krijgen terwijl de andere speler het resterende deel van het brood eist, kan zijn strategie niet meer wijzigen zonder zichzelf in de vingers te snijden. Die situatie dat je je strategie niet meer kunt verbeteren, heet een Nash evenwicht, naar de bedenker van dit spel, de wiskundige John Nash.

Een voor de hand liggende conclusie is dat wijzigende machtsverhoudingen onvermijdelijk een poosje gepaard gaan met suboptimale uitkomsten voor de spelers gezamenlijk, totdat de spelers zich in hun nieuwe machtspositie voegen. Koren op de molen voor conservatieve denkers. En wie zich beijvert voor emancipatie moet zich hier overheen kunnen zetten.

Het ultimatumspel

Het vierde en laatste spel heet het ultimatumspel. Dat spel gaat over billijkheid, macht en wraak.

Er zijn twee spelers en een som geld. Speler A mag een voorstel doen hoe het geld te verdelen. Speler B mag daar niet over onderhandelen: de enige keuze die hij heeft, is het voorstel aanvaarden of verwerpen. Als het voorstel wordt aanvaard, krijgt elke speler overeenkomstig het voorstel van speler A. Als het voorstel door speler B wordt verworpen, krijgen zij allebei niets.

Intuïtief zou je zeggen dat speler A aanbiedt om de poet te delen: ieder de helft. Het risico dat B weigert is klein. Maar A kan zijn machtspositie uitbuiten. Stel dat hij voorstelt dat hij tachtig procent krijgt. B heeft dan twee mogelijkheden: met tegenzin de resterende twintig procent pakken, of A bestraffen voor zijn uitbuiting. Rationeel gesproken kan B beter aanvaarden dat hij minder macht heeft, en de kruimeltjes van tafel eet. Weigert hij, dan is er sprake van bestraffing van A voor zijn uitbuiting. Speler A wordt een lesje geleerd. Feitelijk is dat altruïstisch gedrag: het kost speler B misschien zijn twintig procent, maar dat heeft hij er voor over om A duidelijk te maken dat uitbuiting geen pas geeft.

Dit ultimatumspel is over de hele wereld veel gespeeld, in meer dan tien rondes achter elkaar, en in sommige experimenten kregen de spelers ook nog eens meerdere dagen bedenktijd. In het algemeen werd de buit 50/50 verdeeld. Maar dat is saai. Interessanter is het aantal keren dat A zijn machtspositie durfde uit te buiten, en het aantal keren dat hij daarvoor door B werd bestraft. Daar kwamen culturele verschillen in tot uiting. In Japan en Israël bleek de modale eis van speler A na een aantal rondes te zijn gestegen naar 55 tot 60 procent, terwijl die in Joegoslavië en de Verenigde Staten bleef hangen op 50 procent. Eist A meer dan tachtig procent, dan wordt die meestal verworpen.

Gemiddeld gesproken zijn spelers bereid om ‘onethische’ tegenspelers in het belang van de gemeenschap een lesje te leren, maar alleen als deze het heel bont maakt, en het de benadeelde partij niet te veel kost. De mate van die bereidheid, en de mate waarin de machtige partij gebruik durft te maken van zijn machtspositie, zijn onderhevig aan culturele verschillen.

Dat laatste bleek helemaal toen het spel door antropologen werd geïntroduceerd in vijftien verschillende kleinschalige, tribale gemeenschappen over de hele wereld. De uitkomsten vertoonden grote verschillen. De gemiddelde eis varieerde per gemeenschap van 42% tot 74%. In sommige gemeenschappen werd geen enkele eis van A door speler B geweigerd. Maar er waren ook gemeenschappen waar een eis werd geweigerd dat door speler B als te genereus werd ervaren. Het waren culturen waar de ontvanger van generositeit zich aan de ander verplicht voelt. In heel collectivistische culturen werd meestal 50% geboden en werden ook onbillijke biedingen doorgaans geaccepteerd.

Evolutionaire speltheorie

In de jaren ’60 ontdekten biologen dat beginselen van de speltheorie ook toepasbaar zijn in de analyse van evolutionaire processen. Inmiddels is er een gespecialiseerde versie van de speltheorie ontstaan in de evolutionaire biologie: de interactie tussen verschillende diersoorten kan er ook mee inzichtelijk worden gemaakt.

Hoe verschillende diersoorten verschillende spellen kunnen spelen, is al eerder aan bod gekomen. Hoe sommige dieren eusociaal kunnen leven, bijna als een organisme, terwijl aan de andere kant van het spectrum ook dieren volstrekt solitair kunnen overleven. Wij zagen in het spel van de havik en de duif dat ook andere spelrollen ook met elkaar in conflict kunnen komen. Dieren met een verkeerde combinatie van fysieke eigenschappen en spelrollen delven het onderspit; soorten en mutaties met een betere combinatie gedijen.

Kenmerkend voor evolutionaire speltheorie is dat het spel eindeloos vaak herhaald wordt. Er zijn meerdere spelers met verschillende spelpatronen en die interacteren allemaal met elkaar. Spelers met slechte strategieën sterven uit, zodat de beste strategieën uiteindelijk tegenover elkaar komen te staan, of naast elkaar kunnen bestaan.

Evolutionaire spellen moeten van nature spannend zijn, een dubbeltje op zijn kant. Een spel waar de ene groep zijn eigen kinderen opeet en de andere niet, is snel afgelopen. De eerste groep is snel uitgestorven. Het omgekeerde geldt ook: een spel tussen links- en rechtshandigen is niet boeiend: de ene strategie zal hoegenaamd geen evolutionair voordeel hebben boven de andere.

Waar evolutionaire speltheorie vooral naar op zoek is, zijn evolutionair stabiele strategieën: de geëvolueerde uitkomst zal dan niet veranderen als er buitenstaanders of mutanten aan het spel gaan meedoen die een andere strategie hanteren.

Kenmerkend voor evolutionaire speltheorie is ook dat ratio geen rol speelt. In de traditionele speltheorie heb je te maken met rationele spelers, die doelen hebben en kansen afwegen. In de evolutionaire speltheorie gaat het louter om botsende spelpatronen. Over menselijke rationaliteit straks meer, maar onthoud alvast dit: mensen zijn (beperkt) rationeel, zij hebben doelen die zij bewust nastreven. Dieren doen dat doorgaans niet; die hebben gedragspatronen zonder hun gedrag aan te passen aan de gevolgen op de langere termijn. Voor evolutionaire speltheorie maakt dat niet uit: die kijkt louter naar het gedrag: welke spelpatronen gaan op den duur overheersen, en welk effect heeft dat op de omvang van de populatie?

Monogamie versus polygamie bijvoorbeeld, beide patronen komen zowel onder mensen als onder dieren voor. Mensen kunnen diep nadenken over de voor- en nadelen van een monogaam huwelijk of vreemdgaan en er een bewust besluit over nemen. Maar in de praktijk komt het erop neer dat sommige mensen monogaam zijn, sommige polygaam, en veel mensen iets er tussenin of serieel monogaam. Wat de individuele afwegingen ook zijn, het algemene menselijke patroon verandert er niet door. Voor zover dat patroon wordt beïnvloed, zijn dat eerder culturele invloeden dan individuele afwegingen.

In evolutionaire speltheorie gaat het doorgaans om gedrag van dieren, en dus hoofdzakelijk om genetisch vastgelegd gedrag. Dieren, en dan met name de Economogroep van mensapen, olifanten en walvisachtigen, kunnen wel cultuur ontwikkelen, maar dat cultureel ontwikkelde gedrag speelt een minder grote rol dan bij mensen. Cultuur heeft een grote invloed op menselijk gedrag. Voordat wij het gaan hebben over evolutionaire speltheorie toegepast op menselijke moraliteit, moeten wij het daarom eerst hebben over het verschijnsel van culturele evolutie.

Culturele evolutie en moraliteit

Het verschil tussen onze genetisch vastgelegde moraliteit en wat jij en ik goed of fout vinden is samen te vatten als culturele moraliteit. Je ouders speelden daar een grote rol in, maar ook bijvoorbeeld je vrienden, je opvoeding op school en allerlei meningen die je in de maatschappij aantreft. Maar ook die opvattingen die je her en der oppikt komen natuurlijk weer ergens vandaan, en zo verder. En morele opvattingen zijn niet overal hetzelfde, en zij veranderen in de tijd.

Hoe dat proces verloopt, noemen wij culturele evolutie. Die culturele evolutie vertoont overeenkomsten met biologische evolutie, maar bijvoorbeeld ook met de manier waarop talen zich in de loop van de millennia hebben ontwikkeld, een proces van doorlopende versplintering, onderlinge beïnvloeding en hergroepering. Ter illustratie kun je in onderstaande video bekijken hoe Indo-Europese talen in de loop van de eeuwen evolueerden.

Versimpeld gezegd hebben wij tienduizenden jaren lang een hele lappendeken aan culturen gehad die met elkaar rivaliseerden. De ene groep was bijvoorbeeld strikt monogaam, terwijl de naburige groep daar veel makkelijker over deed. De meest succesvolle groepen (in de zin van omvang, welvaart, territorium, aantal nakomelingen, levensverwachting, gezondheid, etc.) beschikten kennelijk over een succesvolle combinatie van normen en gebruiken. (Genen speelden misschien ook wel een rol, maar die laten we maar even buiten beschouwing.) Succesvolle groepen groeiden, terwijl groepen met een minder succesvolle combinatie kwijnden. De meest succesvolle groepen kwamen op hun beurt weer in aanraking met andere succesvolle groepen, enzovoort. Nogmaals: ik leg het een beetje versimpeld uit, de werkelijkheid was natuurlijk veel complexer. Ook toeval, natuurlijke omstandigheden en rampen konden bijvoorbeeld een rol spelen, maar je snapt waar het in de kern om draait. Succesvolle culturen overleefden, ten koste van tekortschietende culturen. Was een cultuur bijvoorbeeld te vreedzaam, of juist het tegenovergestelde, of economisch niet veerkrachtig genoeg, dan legde het het af.

Moraliteit en evolutionaire speltheorie

Zo ongeveer met het verschijnen in 1984 van het boek The evolution of cooperation van de Amerikaanse speltheoreticus Robert Axelrod ontstond een nieuwe discipline, die technieken van evolutionaire speltheorie toepast op moraliteit. Net zoals in evolutionaire speltheorie wordt het spel eindeloos herhaald, en zijn er heel veel verschillende spelers die met elkaar interacteren, en meerdere strategieën.

Maar deze keer zijn de spelers rationeel en menselijk: zij hebben doelen, en zij stemmen hun gedrag af op hun doelen. En zij kunnen culturen vormen: hun gedrag kan worden bepaald door culturen, en die culturen kunnen botsen met andere culturen.

Anders dan dieren kunnen mensen hun spelstrategie aanpassen. Als een strategie niet werkt, kijk je naar strategieën die wel werken, en neem je die over. Dieren kunnen dat vaak niet. Daar ontstaan veranderde spelstrategieën vooral door verwantenselectie en mutatie.

Nog even over onze rationaliteit. Wij moeten die niet idealiseren. Mensen zijn maar beperkt rationeel. Het is in de werkelijkheid van alledag onmogelijk om alle gevolgen van ons gedrag te overzien. Wij zijn geen supercomputers; in het algemeen zijn wij luie denkers. Bovendien zijn er veel onzekerheden: wij kunnen niet alle gevolgen van ons gedrag voorspellen. En wij zijn van nature ook nog eens notoir slecht in kansberekening en hebben wij last van cognitieve fouten (zoals groepsdenken en confirmation bias). En zelfs als wij het rationeel beste gedrag identificeren, laten wij ons ook nog eens beïnvloeden door emotionele belemmeringen: angsten, ego’s, afkeer van risico’s, gemakzucht, een voorkeur voor resultaten op korte termijn.

Veel van ons gedrag wordt bepaald door verwachtingen, gewoonten en heuristiek. Een deel daarvan is genetisch aan ons doorgegeven. Daar ging de vorige nieuwsbrief over: onze moraliteit kent een aantal modules die bij ons zijn ingebakken. Dat wij ons eigen nageslacht altijd een voorkeursbehandeling willen geven, bijvoorbeeld, en dat wij altijd een drang hebben om onrecht te vergelden.

Een ander deel is cultureel van aard: wij hebben ons gedrag deels aangeleerd door opvoeding en door interacties met mensen om ons heen. Op basis daarvan hanteren wij vuistregels voor ons eigen gedrag, en hebben wij verwachtingen van het gedrag van anderen. Dus vormen wij een rij voor de kassa en geven wij elkaar een hand.

Dat zijn tamelijk triviale voorbeelden, maar morele evolutionaire speltheorie heeft een aantal grote morele thema’s geïdentificeerd die zich lenen voor simulaties. Samenwerking en vertrouwen, verdeling, en bestraffing, om een paar belangrijke te noemen. Macht, conflict en agressie spelen er een rol in, transactiekosten, schaarste, en de omgang met vreemdelingen die een ander moreel spel spelen. Je ziet waarom dit zo’n belangrijke theorie is voor wie zich wil verdiepen in tolerantie.

Zoals je ziet, zijn samenwerking, verdeling en bestraffing thema’s die ook voorkomen in de lijst met genetische morele modules uit de vorige nieuwsbrief. Het is lastig om te bepalen of speltheoretische inzichten iets zeggen over genetische of over culturele moraliteit. Als een spel al minstens tienduizenden jaren wordt gespeeld tussen onze voorouders, zou het kunnen dat het ons ook genetisch heeft beïnvloed. Maar culturele invloed zal groter zijn. Als een bepaalde strategie van samenwerking een distinctieve cultuur voordelen biedt, biedt dat die samenleving een grotere kans op voorspoed. In welke mate speltheorie effect heeft op genetische of culturele moraliteit, is volgens mij nog niet onderzocht. Voor de speltheoretische methode maakt dat weinig uit. Het spel wordt eindeloos herhaald tussen verschillende spelers. Of hun spelstrategie genetisch of cultureel is ingegeven, en of de spelers rationeel of instinctief spelen, maakt voor de simulatie weinig verschil. Succesvolle strategieën krijgen meer spelers, hetzij omdat meer spelers die strategie gaan spelen, of omdat die spelers grotere kans op overleven hebben.

Dat moreel spelgedrag ook genetisch verankerd kan zijn, is in de biologie goed bekend. Zo publiceerde de Duitse bioloog Manfred Milinski in 1987 over het gedrag van driedoornige stekelbaarsjes tegenover roofvissen. Een stekelbaarsje en een roofvis werden gevolgd in een aquarium voorzien van spiegels en glazen wanden. Het stekelbaarsje zag zijn spiegelbeeld, en hield dat voor een soortgenoot. “Samen” zagen zij vervolgens een roofvis zwemmen. Sommige prooivissen, als zij samen zijn, gaan in dat geval op verkenning uit, om te zien hoe gevaarlijk de roofvis is. Komen zij samen dichterbij, dan halveert de kans dat er één opgegeten wordt. Kennelijk wegen de voordelen van zo’n verkenningstocht evolutionair op tegen het risico om opgegeten te worden bij die verkenning.

Gaat een stekelbaars er in zijn eentje op uit, en blijft de ander achter, dan loopt de verkenner een veel grotere kans opgegeten te worden dan de achterblijver. Zoals in het gevangenendilemma hebben zij samen belang bij samenwerking, maar lopen zij individueel minder risico als zij achterblijven. Milinski observeerde nu dat stekelbaarsjes in dit experiment strategisch moreel gedrag vertonen. Een stekelbaars die een nieuwe metgezel treft, zal eerder handelen in vertrouwen dat de ander met hem meedoet aan de verkenning. Maar blijft die metgezel achter, dan initieert hij de volgende keer geen verkenning meer. Het is onwaarschijnlijk dat dit aangeleerde strategie is; vermoedelijk is het genetisch verankerd.

Net als in de biologische evolutionaire speltheorie zoekt de morele evolutionaire speltheorie naar evolutionair stabiele strategieën (ESS): een situatie die ook stabiel blijft als er nieuwkomers of mutanten aan het spel gaan meedoen met een andere strategie. In de meeste gevallen bestaat zo’n ESS uit een aantal strategieën die elkaar als het ware in evenwicht houden. Katten eten muizen, maar muizen sterven niet uit, omdat zij biologisch een ander spel spelen. Katten en muizen houden elkaar speltheoretisch in evenwicht.

Ook menselijke spellen houden elkaar in evenwicht, bijvoorbeeld in situaties waarin zowel coöperatief als niet-coöperatief gedrag voorkomt. In elke menselijke samenleving heb je mensen die samenwerken en heb je spelbrekers die voor hun eigen hachje kiezen. Je hebt individualistische culturen en collectivistische culturen, en binnen die culturen heb je weer mensen die meer individualistisch zijn dan gemiddeld, of juist meer collectivistisch.

Laten wij eens kijken welke inzichten de morele evolutionaire speltheorie ons biedt als wij die toepassen op de eerder behandelde vier spellen.

Het gevangenendilemma

Als elkaar verlinken in het gevangenendilemma de rationele strategie is, hoe komt het dan dat overal ter wereld mensen samenwerken en elkaar tegen de klippen op vertrouwen? Het antwoord moet gevonden worden in evolutionaire speltheorie. Stel dat je het spel eindeloos herhaalt , wat wordt dan de uitkomst?

Het listige van het spel is dat de evolutionaire stabiliteit niet die van onderling vertrouwen is. Je kunt het spel heel lang met een groep blijven spelen op basis van onderling vertrouwen, maar zodra er nieuwkomers mee gaan spelen die de tegenspeler verlinken, is het al heel snel gedaan met het vertrouwen. Het spel is alleen evolutionair stabiel als iedereen elkaar verlinkt: buitenstaanders met een nieuwe strategie kunnen de uitkomst dan niet meer verbeteren.

Maar er is ook hoop. Uit computersimulaties blijkt dat onder bijzondere omstandigheden er een betere strategie kan overleven, die van lik op stuk. Je begint met samenwerken: je verlinkt de ander niet. Word je verraden, dan verlink je de ander in het volgende spel. Werkt de ander samen, dan bescherm jij hem de volgende keer ook. Het stekelbaarsje van zonet hanteerde die strategie ook. Hoe het stekelbaarsje met die strategie evolutionair kan gedijen, blijft helaas onopgehelderd. Want onder normale omstandigheden legt lik op stuk het helaas af tegen de strategie van verlinken.

Maar menselijke samenlevingen kennen structuur: wij onthouden wie ons eerder heeft besodemieterd, of wie te vertrouwen is, we kunnen over elkaar roddelen. Wij spelen het spel zelden met een willekeurige andere aardbewoner, een van de 8 miljard. Wij hebben familie, buurtgenoten, vrienden, collega’s, vakgenoten, zakenpartners. Kennen wij iemand nog niet, dan kunnen wij navraag doen. Zou dat kunnen helpen?

Volgens computersimulaties maakt dat inderdaad uit, maar alleen als wij vrijwillig kunnen kiezen met wie wij willen spelen. Het voert te ver om alle variabelen te benoemen waaronder samenwerking evolutionair stabiel kan worden, maar het is van belang dat die samenwerking plaatsvindt in kleine netwerken. Naarmate het netwerk groter wordt, en spelers elkaar minder goed kennen, neemt de kans op een samenleving van verlinkers toe.

Low-trust samenlevingen zijn de regel, high-trust samenlevingen de fragiele uitzondering. Maar die high-trust samenlevingen doen het uiteraard beter: het gevangenendilemma wordt er gespeeld met een gunstigere uitkomst. Een open vraag is hoe succesvolle high-trust samenlevingen zich kunnen beschermen zodat zij niet aan hun eigen succes ten onder gaan. Want welvarende samenlevingen trekken onvermijdelijk buitenstaanders aan die het spel anders spelen. De fragiele samenwerking op basis van vertrouwen loopt het risico ondermijnd worden door buitenstaanders, terug naar de evolutionair stabiele strategie van onderling wantrouwen. Het onderzoek is nog gaande.

Havik en duif

Terug naar de havik en de duif. De duivenpopulatie is duidelijk beter af, want iedere duif krijgt voer, en er zijn geen verwondingen. Elk voedermoment leidt tot een verwonde havik. De havikenpopulatie kan zich bedruipen zo lang de gemiddelde schade door verwondingen niet groter is dan de opbrengst aan voer. Als de schade door verwondingen groter is dan de opbrengst aan voer, gaat de havikenpopulatie aan haar verwondingen ten onder.

Een duif die een gemeenschap haviken binnentreedt gaat omkomen van de honger: elke keer als er voer op de grond ligt, legt hij het af. Een havik die een duivengemeenschap binnenkomt, heeft de tijd van zijn leven. Hij krijgt net zoveel voer als hij wil, en hij hoeft er niet eens om te vechten. Waar dus een duivengemeenschap het meest efficiënt omgaat met schaarste, en de havikengemeenschap het minst efficiënt, nemen de haviken de macht over in elke duivengemeenschap.

In de kern is dit de uitkomst van het spel: de duivengemeenschap legt het af en sterft uit. Er zijn alleen nog maar haviken over. Maar die hebben het ook niet makkelijk: de havikengemeenschap sterft ook uit als er te weinig voer aanwezig is om de verwonde haviken mee te verzorgen.

Een onbevredigende uitkomst, vinden ook speltheoretici. Vandaar dat zij op verschillende manieren proberen om de regels van het spel te veranderen. Bijvoorbeeld door de duiven een beperkte macht te geven om zich tegen haviken te verdedigen, zoals een kudde buffels doen tegenover een leeuw. Of door duiven ook de rol van havikvoer te geven, waardoor haviken een gehalte duiven nodig hebben om te overleven. Je kunt het spel ook complexer maken door er andere diersoorten aan toe voegen, en dan te zien wat de uitkomst is. De interessantste diersoort, laten wij hem de vergelder noemen, begint met duivengedrag. Tegenover andere vergelders en tegenover duiven speelt hij de rol van duif. Maar tegenover een havik gaat hij het gevecht aan. In simulaties blijkt dat de vergelder evolutionair heel succesvol kan zijn. Hoe succesvol, dat hangt af van de waarde die aan het voer wordt toegekend in relatie tot de schade van een gevecht.

Maar wat je ook bedenkt, de conclusie is onontkoombaar: volkomen vreedzame, conflictloze samenlevingen zijn het welvarendst, maar zij hebben geen verweer tegen agressieve volken. Een mate van agressie is speltheoretisch onvermijdelijk. Zo lang de vruchten van samenwerking opwegen tegen de kosten van onderlinge strijd, is dat de enige evolutionair stabiele uitkomst.

Verdeling volgens Nash

Nu de verdeling van het brood. Je weet nog: er zijn twee spelers. Als hun wensen opgeteld maximaal het hele brood bedraagt, krijgen zij allebei het gewenste deel. Maar als ze opgeteld meer dan het hele brood eisen, krijgen zij allebei niets.

Ik memoreerde al dat in dit spel elke verdeling die opgeteld honderd procent oplevert een Nash evenwicht vormt. Individuele spelers kunnen hun strategie dan niet meer verbeteren. Maar niet alleen dat: ook elke verdeling (behalve 0 voor de ene speler en 100 voor de ander) is evolutionair stabiel: nieuwkomers die de gebruikelijke verdeling niet respecteren, worden weggespeeld tenzij zich conformeren.

Dit is een verklaring waarom het kastensysteem in India zo hardnekkig is, waarom slavernij duizenden jaren lang doodnormaal werd gevonden, en waarom discriminatie van bevolkingsgroepen zo lastig te bestrijden is. Komt een onderdrukte groep in opstand, dan kan dat maatschappelijk ontwrichtend werken.

Dat roept de vraag op of er in computersimulaties scenario’s te bedenken zijn waarin een ongelijke verdeling geleidelijk ombuigt naar een gelijke verdeling. En die blijken er te zijn. Het magische ingrediënt is correlatie: spelers worden niet meer willekeurig aan elkaar toegewezen, maar zij kunnen hun tegenspelers uitkiezen. Het ligt voor de hand dat 50%-spelers elkaar opzoeken. Wie gewend is om meer dan vijftig procent te eisen, heeft een harde dobber om een tegenspeler te vinden die op vrijwillige basis met minder genoegen neemt. Vindt hij die niet, dan zal de druk toenemen om met een gelijke verdeling genoegen te nemen.

Maar wanneer is er echt sprake van correlatie: onder welke omstandigheden ben je werkelijk vrij om je medespeler zelf uit te kiezen? Stel dat iedereen formeel vrij is om te vragen wat hij wil, maar je bent van jongsaf aan gewend om te spelen voor minder dan de helft. En tegenover je staat een enorme groep spelers die het met elkaar eens zijn dat zij stelselmatig alleen spelen voor meer dan de helft. Formeel is er dan misschien wel sprake van correlatie. Maar in de praktijk is die er niet.

Net als over de andere spellen valt er nog veel meer over te zeggen. Allerlei maatschappelijke omstandigheden kunnen worden gemodelleerd. Vind je het echt interessant, en schrik je niet terug voor wat hogere wiskunde, dan kan ik de boeken van Alexander aanbevelen.

Het ultimatumspel

Je herinnert je het ultimatumspel nog. Er ligt een som geld op tafel, er zijn twee spelers. Speler A mag bepalen hoe die som verdeeld wordt de spelers A en B. Accepteert B, dan krijgt ieder zijn deel conform A’s voorstel. Weigert B, dan krijgen zij allebei niets. Wij zagen dat de verdeling licht in het voordeel van A’s machtspositie uitpakt: gemiddeld pakt A iets meer dan 50 procent. Maar als A zo’n 80 procent of meer eist, dan maakt B vaak gebruik van zijn machtspositie, en wijst hij het voorstel af.

Nu gooien wij het spel in de computersimulatie met eindeloze herhalingen van het spel en allerhande spelers met diverse speelstrategieën. Welke strategie rolt daaruit als evolutionair stabiel?

De meest kansrijke speelstijlen zijn de volgende:

De opportunist: maakt gebruik van zijn machtspositie door als speler A altijd meer dan de helft te eisen, en aanvaardt als speler B elk bod.
De moralist: eist als speler A altijd de helft, aanvaardt als speler B altijd de helft, en weigert als speler B elke eis van meer dan de helft.
De sul: eist als speler A altijd de helft, en aanvaardt als speler B elk bod.
De gek: eist als speler A altijd meer dan de helft, accepteert als speler B elke eis van meer dan de helft maar weigert elke eis van de helft of minder.

In de simulatie waarin alle spelerstypen aanvankelijk gelijk vertegenwoordigd zijn, overleven uiteindelijk twee spelerstypen. De opportunisten winnen het spel. De moralisten worden geëlimineerd. De opportunisten maken gebruik van hun machtspositie en hebben er niets voor over om uitbuiting door anderen te bestraffen. Interessant genoeg blijft er echter een kleine minderheid aan gekken over: 13 procent om precies te zijn.

Maar de uitkomst pakt dramatisch anders uit als bij aanvang van het spel de moralisten oververtegenwoordigd zijn. In die simulatie zijn de rollen helemaal omgekeerd: de opportunisten en de gekken delven het onderspit, de moralisten winnen het spel, en er blijft ongeveer 40% sullen meespelen. Moralisten delen eerlijk en bestraffen iedereen die niet eerlijk deelt, ook al gaat dat ten koste van henzelf. Sullen hebben dezelfde spelstrategie, maar zij bestraffen onethische spelers niet. Waar die twee rollen dominant zijn, is er voor opportunisten en gekken geen plaats.

Er zijn dus twee evolutionair stabiele situaties: die waarbij de opportunisten domineren, of die waar de moralisten domineren. Volgens de lessen van dit spel kunnen er dus twee soorten stabiele samenlevingen bestaan: gemeenschappen waar het ieder voor zich is, en gemeenschappen waar egoïsme wordt bestraft. Interessant is de vraag wat er gebeurt als die twee soorten samenlevingen met elkaar in contact komen. Als ik de uitkomsten goed interpreteer, heb je genoeg aan dertig procent moralisten om de moralisten uiteindelijk te laten domineren.

Merk op dat in beide samenlevingen uiteindelijk geen geld meer verdampt doordat eisen van speler A worden afgewezen. In de opportunistische samenleving heb je altijd een kleine minderheid gekken die billijke eisen bestraffen, maar billijke eisen komen in die samenleving niet meer voor. In de moralistische samenleving eist niemand meer dan de helft van de poet, dus wordt ook niemand meer bestraft. Geld verdampt alleen als er nog zowel moralisten als opportunisten in het spel zijn.

Conclusie

Goed, tot zover de speltheorie. Wij hebben gezien dat er ook in speltheoretisch opzicht in gemeenschappen gelaveerd wordt tussen eigenbelang en samenwerken, tussen vertrouwen en wantrouwen, tussen xenofobie en de komst van vreemdelingen, tussen agressie en non-agressie, tussen opportunisme en moralisme. Ook hebben wij gezien hoe gunstig de rol van correlatie kan zijn: je kunt op basis van eerder gedrag de strategie van de tegenspeler voorspellen. De rol van roddel binnen gemeenschappen en het ontstaan van een morele cultuur kunnen heel gunstig zijn voor de speluitkomsten. En tot slot hebben wij gezien waarom gemeenschappen er belang bij kunnen hebben om zich te beschermen tegen buitenstaanders met andere spelopvattingen.

Het lastige van evolutionaire speltheorie is dat er zoveel variabelen denkbaar zijn. Hoe groot is de gemeenschap, hoe goed kent men elkaar, hoe groot zijn de sancties, hoeveel interacties zijn er, wat staat er op het spel? Et cetera. De speltheoretische methodieken zijn nog niet verfijnd genoeg om met alle variabelen rekening te houden. Toch is het een theorie om in de gaten te houden.

Voor het thema tolerantie is het goed om te onthouden dat samenwerking, harmonieuze verdeling en vertrouwen fragiel zijn. De evolutionaire stabiliteit kan makkelijk weer omslaan in een samenleving waarin niemand elkaar vertrouwt, er niet wordt samengewerkt, agressief gedrag beloond wordt en macht misbruikt. Het is een aanwijzing dat tolerantie een delicaat spel is. Fragiele samenlevingen kunnen zich minder goed veroorloven om afwijkende meningen, gedragingen en vreemdelingen de ruimte te geven.

Meer lezen?

Robert Axelrod, The evolution of cooperation (1984)
Manfred Milinski, TIT FOR TAT in sticklebacks and the evolution of cooperation, Nature (1987)
Brian Skyrms, Evolution of the social contract (1996/2014)
William Harms, Brian Skyrms, Evolution of moral norms, in Michael Ruse (red.), Oxford handbook on the philosophy of biology (2007)
Alex Mesoudi, Peter Danielson, Ethics, evolution and culture, Theory in Biosciences (2008)
Alex Mesoudi, Cultural evolution (2011)
Philip Kitcher, The ethical project (2011)
Charles C. Cowden, Game theory, Evolutionary Stable Strategies and the evolution of biological interactions, Nature (2012)
Wei Chen et al., Evolutionary dynamics of N-person Hawk-Dove games, Nature (2017)
Jason McKenzie Alexander, The structural evolution of morality (2007)
Jason McKenzie Alexander, Evolutionary game theory (2023)

Tot slot

Dit was de tweede aflevering in de reeks over moraliteit en tolerantie. De afleveringen zijn tot nu toe:

De moraliteit waar iedereen mee geboren wordt
Over de morele modules die alle mensen met elkaar gemeen hebben. Over verwantenselectie, samenwerking, empathie en nog veel meer.
Spelletjes spelen met moraliteit
Onze ingebakken morele modules werken op elkaar in. Met simpele spelletjes kun je simuleren hoe mensen in samenlevingen met elkaar omgaan. Over de omgang met macht, verdeling, wraak en vertrouwen.
De moraliteit van onze inwendige jager-verzamelaar, boer en burger
Onze moraliteit is gelaagd: elke fase in de menselijke geschiedenis heeft haar sporen nagelaten. Cultureel zitten er nog steeds laagjes jager-verzamelaar, boer en burger in onze ethiek.
Irritante vragen over goed en slecht
Bestaat er wel zoiets als morele kennis? En hoe kom je daar dan achter? Over twijfel aan je eigen bestaan, menseneters, emotionele oordelen, en het verschil tussen diefstal en groenten.
Goede mensen zijn gelukkiger. Maar hoe word je dat?
De deugdethiek van Aristoteles langs de empirische meetlat. Heb je wel een ethisch stelsel nodig als iedereen deugdzaam en gelukkig is? Positieve psychologie: hoe word je een gelukkiger en beter mens?

Tolerantie

Discussion about this post

Tolerantie

Spelletjes spelen met moraliteit

Onze ingebakken morele modules werken op elkaar in. Met simpele spelletjes kun je simuleren hoe mensen in samenlevingen met elkaar omgaan. Over de omgang met macht, verdeling, wraak en vertrouwen.

In English: Playing games with morality

Speltheorie

Het gevangenendilemma

De havik en de duif

Het Nash verdelingsspel

Het ultimatumspel

Evolutionaire speltheorie

Culturele evolutie en moraliteit

Moraliteit en evolutionaire speltheorie

Het gevangenendilemma

Havik en duif

Verdeling volgens Nash

Het ultimatumspel

Conclusie

Meer lezen?

Tot slot

Niš, 29 juli 2023

Discussion about this post