Vězňovo dilema je asi nejznámějším myšleným experimentem, na kterém se ilustrují základní principy teorie her. V dilematu vystupují dva komplicové podezřelí z několika trestných činů, řekněme krádeže a vraždy. Státní zástupce každému z nich učiní následující nabídku:
Státní zástupce: Máme dost důkazů k tomu, abychom vám oběma prokázali krádež. Za to dostanete dva roky na tvrdo. Policie chce vykázat i vraždu jako objasněnou, k jejímu prokázání ale potřebujeme vaše doznání nebo aspoň svědectví. Nepočítáme, že by se kterýkoli z vás přiznal, protože za vraždu hrozí trest smrti. Zůstává zde ovšem možnost svědčit proti svému kumpánovi a celou vinu hodit na něho.
Vězeň: A proč bych to dělal?
SZ: Nu, takové svědectví je považováno za závažnou polehčující okolnost. Když budete svědčit, místo dvou let za krádež vyváznete s podmínkou. Navíc uvažte, že zde existuje riziko, že váš komplic se pokusí hodit vinu na vás, a nemusím snad zdůrazňovat, že i jemu vylíčíme jeho situaci tak důkladně, jak ji teď vysvětluji vám. Pokud se rozhodne vás zradit, byl byste odsouzen k smrti. Jestliže ale budete i vy svědčit proti němu, soud to znovu vezme v potaz jako polehčující okolnost, a dostanete oba patnáct let. Nic moc, ale lepší než provaz.
V: Když se rozhodnu proti němu svědčit, rozzuří ho to a rozhodne se v odvetě svědčit proti mně...
SZ: Nedostane šanci. Vy i váš kumpán máte možnost sepsat svědectví předem. O tom, zda ten druhý ho zradil, se každý z vás dozví až u soudu, kde ale na případnou změnu svědectví bude pozdě — soud ji bude vnímat jako pomstu z afektu a nebude jí věřit. Se soudcem jsme tak dohodnutí a hrajeme férově.
Zbývá ještě doplnit pár idealizačních předpokladů, jako že žádnému z vězňů ani za mák nesejde na osudu toho druhého a že státní zástupce je naprosto důvěryhodný a říká pravdu, a nakonec otázku: je z hlediska vězně racionální zradit?
X nesvědčí | X svědčí | |
Y nesvědčí | X: 2 roky Y: 2 roky | X: podmínka Y: smrt |
Y svědčí | X: smrt Y: podmínka | X: 15 let Y: 15 let |
Z tabulky je názorně vidět, že nezávisle na tom, jak se rozhodne jeho kumpán, pro každého z vězňů je lepší svědčit. Když ho jeho komplic práskne, zachrání mu to život, a pokud komplic bude držet jazyk za zuby, ušetří to prvnímu vězni dva roky žaláře. Přitom není v silách ani jednoho z vězňů ovlivnit rozhodnutí toho druhého. V terminologii teorie her je svědčit dominující strategie, zatímco nesvědčit je strategie dominovaná. Je přijímaným postulátem, že při rozhodnutí mezi takovými strategiemi je vždy racionální dát přednost strategii dominující před tou dominovanou. V teorii her vzdělaný vězeň se tudíž rozhodne svého komplice prásknout.
Zajímavá vlastnost vězňova dilematu je ta, že pokud se oba vězni rozhodnou „iracionálně“ pro mlčení, dopadnou výrazně lépe, než jejich „racionální“ kolegové. V našem případě půjdou ti „iracionální“ domů o třináct let dříve. To ukazuje, že na herněteoretické racionalitě může být něco shnilého.
Název „vězňovo dilema“ není vázán na vězení a soudy, nýbrž se používá pro označení všech situací (tedy vlastně her, když už užívám příslušnou terminologii), kdy dva soupeři volí mezi „spoluprací“ a „zradou“, přičemž by raději zradili, ať už protivník zradí nebo spolupracuje, ale oba zároveň preferují oboustrannou spolupráci před oboustrannou zradou. Uvažujme třeba situaci, kdy se X a Y domluví, že v domluvený den společně postaví plot mezi svými chatami. X může uvažovat takto: „Y přijede na chatu vlakem v deset, jak jsme domluvení, a čeká, že přijedu autobusem v půl jedenácté a pak začneme stavět. Když ale řeknu, že jsem si cestou na autobus vyvrknul kotník, Y plot postaví sám, protože vlak zpět mu jede až ve sedm večer a na chatě v tuhle dobu stejně není nic jiného na práci (a Y se nerad nudí). Já tak získám k plotu i volný den navíc.“ Y může uvažovat podobně, a získáme tak tabulku typu vězňova dilematu:
X přijede | X simuluje | |
Y přijede | X: plot Y: plot | X: plot + volný den Y: plot + práce navíc |
Y simuluje | X: plot+práce navíc Y: plot+volný den | X: volný den Y: volný den |
Reálná vězňova dilemata jsou komplikována tím, že většina lidí má silnou morální averzi ke zradě [*] a není tak snadné dostat se do situace, kdy oba hráči skutečně preferují výsledky úspěšně provedené zrady před její alternativou. Simulovat v předchozí tabulce může způsobit výčitky svědomí, a ty mohou být tak nepříjemné, že X i Y můžou preferovat oboustrannou spolupráci před možností, že všechnu práci udělá ten druhý. Zrada navíc vede ke ztrátě reputace, a ta se může v důsledku pěkně prodražit. Nechme ale tyto komplikace stranou a omezme se na zjednodušený případ, kdy toto nenastává. Je tehdy zrada optimální strategie?
Intuice nemá až tak velký problém toto přijmout pro izolované vězňovo dilema, tedy pokud se jedná o jediné rozhodnutí, které se nebude opakovat. Jinak se ale díváme na opakované vězňovo dilema, ve kterém dva hráči vstupují do téže interakce mnohokrát po sobě, a mohou tak reagovat na chování soupeře. Když jeden z hráčů zradí, druhý může na oplátku zradit v následujícím kole. Občas se jako racionální v takových případech doporučuje strategie „oko za oko“: když v předchozím případě soupeř spolupracoval, odměň ho spoluprací; když zradil, potrestej ho zradou. Od racionálních hráčů by člověk očekával, že budou schopni předvídat. Sousedé, kteří se dvacetkrát za sebou domluví na tom, že společně postaví plot, a pokaždé si pak místo stavby oba „vymknou kotník“ nejen že nebudou mít plot, ale budou vypadat jako naprostí idioti.
To všechno zní sice dobře, dokonce spravedlivě, ale bohužel to nesouhlasí se závěrem teorie her: Jediná racionální strategie je vždy zrada! A logika teorie her je neúprosná. Je přeci jasné, že N, tj. počet opakování vězňova dilematu, bude „pouze“ konečný — nikdo nežije věčně. Před posledním opakováním tak budou hráči před sebou mít izolované dilema. Soupeř nebude mít šanci pomstít zradu, tudíž je jedině racionální sledovat dominující strategii a zradit. Oba hráči, jsou-li racionální dle definice užívané v teorii her, zradí. Jestliže hráči o sobě navzájem vědí, že jsou tímto způsobem racionální, vědí od samého začátku, jak N-tá hra dopadne, a v předposlední hře se tak nemusejí starat o možnost, že by se jim soupeř v poslední hře pomstil; ten zradí tak jako tak. Tudíž i v N - 1. oba „racionálně“ zradí, a není těžké to vědět již před N - 2. hrou... A tak dále, přesně ve stylu uvažování diskutovaném minule v paradoxu nečekaného věšení [1].
Zatímco tak většina lidí v opakovaném vězňově dilematu spolupracuje, herní teoretici se točí v bludném kruhu zrady, majíce svůj postup podepřený neprůstřelným argumentem.
Mám s takto pojatou racionalitou problém. Jestliže skupina A v určité hře volí strategii tak, že vykazuje systematicky horší výsledky než skupina B, a jestliže všichni členové skupiny A vědí, proč tomu tak je, a jsou schopni tyto výsledky předvídat, pak těžko tvrdit, že chyba je na straně skupiny B, a stejně tak se mi příčí tvrdit, že jednání členů skupiny A je racionální.
Nemíním tento článek jako frontální útok na teorii her. Ve většině situací je výběr dominantní strategie skutečně to nejlepší, co lze učinit. Stejně tak teorie her nabízí standardní řešení pro situace typu vězňova dilematu: vytvořit dodatečnou motivaci pro spolupráci a naopak dohodnout trest pro zrádce. Ve většině reálných situací je to optimální řešení, a lidé tak reálně postupují. Na druhou stranu, toto řešení znamená změnu pravidel hry, a nejenže tak z čistě teoretického pohledu představuje úhýbání před námitkou, ale ani není vždy proveditelné.
Mám za to, že v ideálním vězňově dilematu (ať už opakovaném nebo ne), za předpokladu, že není možné měnit „pravidla“, a za předpokladu společné znalosti (viz pozn.[1]) o racionalitě obou soupeřů, je racionálním rozhodnutím spolupráce.
Poznámky:
1. Úvaha vyžaduje tzv. společnou znalost o racionalitě obou hráčů. Tj. X ví, že Y je racionální; Y ví, že X ví, že Y je racionální; X ví, že Y ví, že X ví, že Y je racionální; atd. Podobně s prohozením X a Y.