pondělí 29. srpna 2011

Pondělní šifra XXXIII.

Následující obrázek v sobě skrývá zašifrovanou tajenku, kterou může být slovo, výraz nebo věta dávající v češtině dobrý význam (může to být i vlastní jméno nebo cizí slovo, pokud je v češtině dostatečně často používáno). Způsob šifrování není předem specifikován, ale měl by být odhalitelný na základě relativně jednoduchých pozorování. V některých případech může být k rozluštění potřeba znalost Morseovy abecedy nebo Braillova písma.



sobota 27. srpna 2011

Etymologický zpravodaj - N


Dnes si povíme o slovech námel, netopýr a namol.

Námel je zajímavý tím, že ačkoli je toxický, jeho název pochází ze slova namlít, poněvadž jsou námelová zrna větší a namele se z nich víc mouky. Ve středověku toxicita námele nebyla známa a halucinace způsobené jeho konzumací nebyly s námelem spojovány.

Další dvě slova mají původ sporný. Netopýr má dva výklady. První tvrdí, že je to zkomolenina dnes nářečních tvarů latopyř nebo letopeř (zajímalo by mě, zda někdo z čtenářů se s takovými tvary setkal), z původního lepetyr, od slovesa lepetati = „poletovat“. Druhý výklad tvrdí, že netopýr souvisí s řeckým nyktopteros, doslova noční letec. Řecké pteron = „křídlo“ dále souvisí s naším slovem pero. (I zde je mi výklad podezřelý. Dnešní řečtina má pro netopýra slovo νυχτερίδα (nychterida), nezdařilo se mi najít nezávislý zdroj mluvící o slovech nyktopteros nebo nychtopteros.)

Kromě slova namol ve staré češtině existovalo údajně v podobném významu i slovo molek označující opilce. I zde jsou další výklady dva: první odvozuje původ od slova mol (snad proto, že let mola není zrovna prototypem přímé trajektorie?), druhý výklad směřuje až k hebrejskému מלא (male), mající význam „plný“. Toto slovo se mělo dostat přes jidiš do německého argotu a tam příslušným způsobem změnit význam.

sobota 20. srpna 2011

Kritické myšlení a „kritické myšlení“


V nedávné diskusi o konspiračních teoriích řada čtenářů namítala, že analyzovat pravděpodobnost různých teorií formálně pomocí matematických vzorečků je nemístné. Nejkonkrétněji nakonec reagoval čtenář Stan s doporučením, že před vlastními úvahami o pravděpodobnostech je potřeba odfiltrovat propagandu a skrytou reklamu, která se pozná podle „zamoření daného textu logickými klamy a propagandistickými nástroji“. S tím nelze, aspoň na první pohled, než souhlasit: přítomnost logických chyb a manipulativních řečnických obratů skutečně snižuje věrohodnost textu. Samozřejmě, i tento fakt lze standardním způsobem zakomponovat do pravděpodobnostní analýzy, ale o to mi teď nejde. Chtěl bych spíš upozornit na vcelku prostý fakt, že i filtrování informací lze provádět dobře nebo špatně, a pokud se provádí špatně, stává se zbraní, se kterou se člověk snadno střelí vlastní nohy.

Koupím-li si jakékoli noviny, velmi pravděpodobně v nich najdu stránku či dvě věnované politickým komentářům. Politické komentáře nominálně analyzují politickou situaci. Reálně je v nich ale analýzy minimum. Zkuste si vzpomenout, kdy jste naposledy ve svém oblíbeném listě viděli komentář, jehož autor neosobním, technickým stylem sepsal přehledně relevantní fakta a všechny možné varianty řešení, a doprovodil to strukturovaným logickým argumentem. Já jsem něco takového neviděl v novinách nikdy. Zato jsem viděl spoustu logických chyb, manipulativních technik a pustého žvanění. Politické komentáře v novinách jsou jen z malé části analýza a z mnohem větší části propaganda.

Řeknete možná: noviny nejsou odborný žurnál. Nejsou. Jenže lidé čtou noviny, ne odborné žurnály. A noviny a jim kvalitativně rovnocenná média jsou zdroj většiny informací použitelných při posuzování politiky a souvisejících témat. Přestaňte tedy aspoň číst politické komentáře, mohlo by znít vaše doporučení. Asi by to bylo doporučení správné, ale jde mi o něco trochu jiného. Proč jsou politické komentáře tolik logicky nekorektní? Je to proto, že jejich autoři neznají pravidla logické argumentace? Odvážím se navrhnout jiné, jednodušší vysvětlení: Techniky propagandy jsou užívány, protože jejich zvládnutí je relativně snadné a přitom fungují.

Co nazýváme propagandou je obvykle souhrn manipulačních technik použitý pro šíření určitého názoru. Zvolené techniky příliš nezávisí na tom, jaký názor je třeba propagovat a tak se dá vcelku dobře naučit být dobrým propagandistou — stačí jednorázově zvládnout umění manipulace. Argumentovat korektně ve prospěch určitého názoru je mnohem těžší. Jedná-li se o názor nesprávný, je korektní argumentace téměř nemožná [*]. Ale i když je názor správný, korektní argument je pořád nutné pracně hledat, zatímco manipulativní techniky jsou přímou a osvědčenou cestou ke stejnému cíli [1,2]. Manipulaci tak nacházíme v argumentech podporujících jak tvrzení nepravdivá, tak i pravdivá. Možná, že v druhé skupině trochu méně často, leč rozdíl není nijak dramatický.

Co z toho plyne pro člověka, snažícího se posuzovat pravdivost argumentu podle přítomnosti prvků manipulace a propagandy? Především doporučení ke krajní opatrnosti. To, že autor v textu rafinovaně útočí na city čtenářů je od něho sice nefér (protože tím čtenářům ztěžuje posouzení kvality svých argumentů), ale pouze pramálo to svědčí o nepravdivosti textu samotného, respektive jeho informativní části [3]. Co platí o manipulaci, platí i o logických chybách. Lidé dělají logické chyby, a tento nešvar se nikomu zázrakem nevyhne jen proto, že zrovna má pravdu. A totéž platí o faktografických nepřesnostech.

Ideální postup při setkání se s podezřelým textem je odmyslet si klamy a manipulující obraty, přeformulovat si argumentační části text do pokud možno věcného jazyka a posoudit jejich platnost. Jsou-li v argumentech chyby logické povahy, stojí za to věnovat trochu času posouzení toho, zda a nakolik jsou chybné části konstrukce důležité pro její celkovou stabilitu. Mnoho v zásadě správných argumentů obsahuje pochybné „logické zkratky“ nebo nepodstatné chyby v detailech. Často jsou to věci padající na vrub zbrklé formulaci a dají se snadno napravit.

Ideální postupy však nebývají vždy proveditelné, a tak se nabízí postup jiný: po identifikaci chyb v argumentu argument ignorovat. A tady nastává moment, kdy ve jménu kritického myšlení začínáme takříkajíc střílet do vlastních řad. Není tak těžké naučit se litanii latinských jmen argumentačních chyb a logických klamů: ad baculum, ad populum, ad verecundiam, ignoratio elenchi... Čím víc takových nálepek známe, tím snáze v argumentech našich soupeřů najdeme místo, kam jednu z nich upevnit, a tím snáze se nám argumenty ignorují. Vytváří se prostor pro potvrzovací bias: chybné argumenty nepřítele jsou odmítány jako chybné, zatímco chybné argumenty vlastní projdou sítem bez povšimnutí, protože ve vlastních argumentech chyby nehledáme (a když, tak zdaleka ne tak pečlivě). Ze schopnosti identifikovat argumentační chyby, zamýšlené jako obrana před nepravdou a manipulací, se stane nástroj pro potvrzování předsudků. Znalost metody kritického myšlení paradoxně činí myšlení člověka méně kritickým.

Ignorovat argument proto, že byl začleněn do manipulujícího textu, je často chyba. Zdaleka to ale není tak velká chyba, jako když z přítomnosti manipulace přímo usoudíme, že nejen argument, ale celá pozice, kterou argument podopruje, je nepravdivá. K takovým úsudkům přesto dochází dnes a denně. Vzpomínáte na aféru Climategate? Zveřejnění mejlové korespondence mezi klimatology z Climatic Research Unit Norwichské univerzity vypovídající o tom, že se jmenovaní občas dopuštěli manipulace s daty, bylo široce interpretováno jako důkaz vykonstruovanosti klimatických změn. Úvaha v zásadě zněla

  1. Klimatologové z CRU se bavili o tom, jak manipulovat data.
  2. Tudíž klimatologové manipulují data.
  3. Pročež není možné věřit datům, která nám předkládají klimatologové.
  4. Není tedy možné věřit ani argumentům, které zastávají klimatologové.
  5. Klimatické změny nenastávají.

Na první pohled dává řetězec úvah smysl. Varovný signál se rozsvítí v okamžiku, kdy podobné úvahy přicházejí nejčastěji od osob, které samy manipulují s daty, často mnohem horším způsobem. Mohli bychom tak sestavit analogickou úvahu:

  1. Klimaskeptici manipulují s daty.
  2. Není možno věřit argumentům vynášeným klimaskeptiky.
  3. Klimatické změny proto nastávají.

Oba závěry očividně nemohou platit zároveň. Samozřejmě, ani jeden z argumentů není neprůstřelná logická dedukce. Z toho, že někdo manipuluje s daty deduktivně neplyne, že nemá pravdu, a tak možná není příliš překvapivé, že jsme z pravdivých premis odvodili spor. Proč jsou ale podobné argumenty přesvědčivé? Samozřejmě, je zde efekt toho, že jakékoli argumenty jsou přesvědčivé, pokud podporují předem zastávané stanovisko. To ale nevysvětluje vše: být přistižen při lži, manipulaci nebo logické chybě je vnímáno jako silný zásah zpravidla oběma stranami debaty, a zasažená strana obvykle musí následně vynaložit značné úsilí k odstranění škod (nejlépe odvetným přistižením svého protivníka při analogické lži).

(Vsuvka pro případné diskutující: Příklad Climategate jsem použil jako ilustraci chybné aplikace kritického myšlení. Z tohoto hlediska je jedna, zda lidé z CRU skutečně s daty manipulovali nebo jak často se to dělo. Stejně tak příklad funguje nezávisle na tom, zda klimatické změny nastávají či ne. Toto není článek o klimatických změnách.)

Může být, že důvodem přesvědčivosti popsaného argumentačního schématu je, že v mnoha všedních situacích funguje, a pouze selhává v určité třídě případů. Pro ilustraci uvažujme malou skupinu lidí mající spor o něčem, co nelze s jistotou ověřit — například o tom, jaké bude zítra počasí, nebo o tom, kdo ukradl v závodní jídelně zapomenutou peněženku. Ve skupině jsou lidé, kteří jsou schopni poskytnout platné informace („v televizi na zítřek předpovídali polojasno“, „Ferenc Prümspiegel dnes přijel na šichtu na novém kole a s novými hodinkami, i když normálně žije od výplaty k výplatě“), a jsou v ní osoby, které nic důležitého neznají, ale přesto ostatní zásobují konfabulacemi a irelevantními postřehy („cítím v kostech, že zítra bude pršet“, „měl jsem sen, že to udělal Řehoř Buňát; koneckonců o něm všichni víme, že je homosexuál“). Jelikož je skupina relativně malá a problém relativně jednoduchý, každý má k dispozici všechny výpovědi (jak opodstatněné, tak irelevantní) a je v principu v jeho silách je všechny posoudit. Dá se očekávat, že pro správné řešení budou korektní argumenty početně převládat; nekorektní argumenty jsou ze své podstaty mířeny náhodně, a tak je malá šance, že by se jich víc nezávislých sešlo zrovna u správné hypotézy a přečíslily argumenty správné. Pokud se přesto objeví větší množství argumentů podporujících jednu specifickou hypotézu (například, že peněženku ukradl Řehoř Buňát), a přitom se ukáže, že tyto argumenty jsou chybné a manipulativní, je to dobrý indikátor toho, že se někdo zaujatě snaží hypotézu prosadit a má k tomu pravděpodobně nějaký důvod (chce dostat Řehoře Buňáta do basy).

Problém je, že tímto stylem nemůžeme uvažovat v situaci, kdy diskusní skupina je obrovská. Když o problému diskutuje milion lidí, počet argumentů a jejich variant jde do milionů. Málokdo si dá práci s jejich zapisováním, klasifikací a počítáním, a bez toho je prakticky nemožné mít přehled o poměru počtu správných a špatných argumentů ve prospěch určité hypotézy. Když z kolektivu dvaceti kolegů pět šíří stejnou sadu drbů, je to silná známka toho, že tak činí koordinovaně a mají určitý společný zájem. Když z kolektivu několika set milionů uživatelů internetu sto šíří stejný blud, neznamená to vůbec nic.

S rostoucím rozsahem diskuse a s ním souvisejícím množstvím dostupných argumentů a faktů se pojí další problém pro kritické myšlení: přehlcení informacemi. Za prototyp sporu, jehož účastníci musí takovému přehlcení vzdorovat, je možné považovat otázku o okolnostech teroristických útoků na Světové obchodní centrum v New Yorku. Obě strany nasbíraly za dobu trvání sporu nesčetné množství argumentů a protiargumentů, a použily je k vytvoření analýz a propagačních materiálů. Na stránkách jako 911Truth.org nebo Debunking 911 lze strávit týdny pročítáním přesvědčivě znějících technických argumentů a expertních stanovisek, a stále přitom nebýt o nic moudřejší. K porozumění technickým argumentům je vybaven leckdo, ovšem schopnost posoudit jejich platnost vyžaduje úroveň kvalifikace, která je mnohem vzácnější. Posuzování expertních stanovisek vyžaduje přehled o důvěryhodnosti expertů. Pro vyhodnocování svědectví je potřeba ověřovat zdroje. Chcete-li zodpovědět otázku, zda za zřícením budov náhodou nestála řízená exploze, a domníváte-li se, že výše odkazované stránky (nebo jim podobné) jsou správným výchozím bodem, čeká vás téměř nadlidský úkol. Nestačí přečíst stovky článků vyjadřujících se k tématu, musíte také pracně ověřit každé tvrzení z nich obsažené.

(Vsuvka pro případné diskutující: Tento článek není o útocích na WTC a jeho smysl nezávisí na tom, zda agenti CIA někam implantovali výbušniny či nikoli. Je o chybných vzorcích myšlení, které zůstanou chybné, i kdyby jejich proponenti shodou okolností měli v některých svých závěrech pravdu.)

Než věnovat řadu měsíců svého života studiu argumentů, z nichž se nakonec devadesát procent ukáže chybnými nebo nepodstatnými, je jednodušší argumenty pouze absorbovat a příležitostně reprodukovat. Tak vznikají typické debaty s „komutujícími argumenty“: diskutující nereagují na to, co říká druhá strana, ale vrší předpřipravené repliky, zhusta se ani nenamáhajíce formulovat tvrzení svými slovy: odkaz na knihu, webovou stránku či video postačí. Takovou debatu poznáte snadno: kdyby někdo náhodně zamíchal pořadím příspěvků, nevypadala by o nic nepřirozeněji než ve svém výchozím stavu. A přesto si účastníci těchto debat myslí, že aplikují kritické myšlení, protože shromažďují informace a odpovídají věcnými argumenty.

Poučení? „Kritické myšlení“ je dvojsečná zbraň. Naučíme-li se některým jeho metodám nedávajíce pozor na přidružená rizika, může uškodit přesnosti našich názorů. Umění identifikovat logické chyby a manipulační techniky dává člověku do rukou snadný nástroj k zavržení nepříjemných námitek a informací. Jako bonus přichází pocit intelektuální nadřazenosti: „On, ne já, dělá logické chyby. On, ne já, manipuluje.“ Pozor na takový pocit, může snadno být falešný.

A ještě: Znalost velkého množství informací zbavuje člověka povinnosti reagovat na tvrzení protivníka — vždy je možné předhodit další, dosud nevyvrácený, nezávislý argument, a vyhrát na body. Znovu s bonusem: „Já, ne on, znám tisíc a jeden argument pro své stanovisko.“ I zde je bonus falešný. Čím víc argumentů znáte, tím méně spolehlivě doložený každý jeden z nich pravděpodobně je. V argumentaci, jako pravidlo, kvantita nikdy nevítězí nad kvalitou. Je skoro vždy lepší soustředit se na dva tři nejdůležitější fakty a ty důkladně ověřit. Jeden ověřený fakt, i když třeba ve sporné otázce nevypovídá zcela jednoznačně, vydá za tisíc sebevědomých videí na YouTube.


Poznámky:
1. Netvrdím, že lidé jsou hloupé ovce v rukou šikovných manipulátorů. Manipulace a propaganda je málokdy vedena vědomým cílem a manipulátoři sami ve většině případů věří ve správnost (morální i logickou) svých argumentů; často jsou stejnými obětmi svých přesvědčovacích technik jako jejich publikum.
2. Když jde řeč o propagandě, stojí za to připomenout jejího blízkého příbuzného, který nese méně nactiutrhačné či dokonce ctihodné jméno a za kterého se propaganda snadno může převlékat: řečnictví. Rozdíl mezi oběma disciplínami je pouze v kontextu: „řečnictví“ je slovo, které používáme pro vlastní mimoargumentační přesvědčovací techniky, jež se stanou „manipulací“ v okamžiku, kdy je použije náš nepřítel.
3. I já s vámi v tomto textu tak trochu manipuluji, už jenom tím, že to píšu formou eseje a ne formou co nejstručnějšího suchého argumentu.

čtvrtek 18. srpna 2011

Opakované vězňovo dilema: simulace


Na konci tohoto článku je výzva k účasti v soutěži (odměnou je pouhá čest, nicméně i to může být dostatečnou motivací pro vlastníky soutěživého ducha). Pokud vás tedy úvod článku zaujme, ale nezbyde vám trpělivost přečíst jej celý, podívejte se aspoň na závěrečnou sekci.

Nedávno jsem dočetl Dawkinsův Sobecký gen, kde mě zaujal popis experimentu, který provedl Robert Axelrod, a jehož cílem bylo zjistit, jak si vedou různé strategie hrající vězňovo dilema (dále jen VD). (O vězňově dilematu jsem již relativně nedávno psal, nicméně jestli si nejste jisti, v čem VD spočívá, nebo co se přesně míní strategií, dozvíte se to níže.) Nepodařilo se mi najít Axelrodův vlastní popis experimentu, a tak nabízím aspoň Dawkinsovu parafrázi [*]:

Strategie přípustné v opakovaném VD jsou zjevně omezeny pouze naší vynalézavostí. Můžeme zjistit, která je nejlepší? To byla otázka, kterou si Axelrod položil. Dostal zábavný nápad uspořádat soutěž, a vyzval experty přes teorii her, aby předložili strategie. Strategie, v příslušném smyslu, jsou naprogramovaná pravidla pro konání, a tak bylo vhodné, aby účastníci posílali své vstupy v programovacím jazyce. Bylo předloženo čtrnáct strategií. Pro jistotu Axelrod přidal patnáctou, nazvanou „Náhodná“, která prostě vybírala své tahy náhodně, a sloužila tak jako jakási základní „nestrategie“: jestli strategie neumí uhrát lepší výsledky než Náhodná, je jistě dost špatná.

Axelrod přeložil všech patnáct strategií do jednoho programovacího jazyka a nechal je běžet vzájemně proti sobě na jednom velkém počítači [*]. Každá strategie byla spárována se všemi ostatními (všetně kopie samy sebe) a sehrála opakované VD. Poněvadž bylo 15 strategií, na počítači běželo 15x15, tj. 225 jednotlivých zápasů. Poté, co každý pár prošel 200 tahy zápasu, zisky byly sečteny a vyhlášen vítěz.


Což mě vedlo k myšlence Axelrodův pokus zopakovat. Výhodou je, že si dnes vystačím s docela malým počítačem. Na druhé straně nemám snadný přístup k vedoucím expertům přes teorii her, a tak jsem se musel smířit s okruhem svých známých. Dále následuje popis a výsledky mého experimentu.

Především, VD je popsáno v mém již výše odkazovaném článku (nebo kdekoli jinde na webu). Pro účast v zamýšleném experimentu ovšem stačilo znát následující pravidla:

Základní informace: Strategií v následujícím textu myslíme program poskytnutý účastníkem soutěže nebo vytvořený podle jeho instrukcí. Strategie se utkávají navzájem v párech a hrají proti sobě standardní VD; každou takovou jednotlivou hru nazývám tahem. V každém tahu mají obě soupeřící strategie na výběr dvě možnosti, tradičně nazývané spolupráce a zrada (je dobré ignorovat konotace těchto slov). V závislosti na svém rozhodnutí získají strategie určitý počet bodů. Konkrétně:

  • Jestliže obě strategie hrají spolupráci, obě získají po 4 bodech.
  • Jestliže obě strategie hrají zradu, získají obě po 1 bodu.
  • Jestliže strategie hrají různě, pak ta, která hrála zradu, obdrží 7 bodů a ta, která hrála spolupráci, obdrží 0 bodů.


Jak bude posuzována úspěšnost: Navržené strategie se utkají proti sobě každá s každou v jednom zápase. (Na rozdíl od zmíněného Axelrodova experimentu strategie nenastupují proti kopiím sebe samých.) Každý takový zápas bude mít N tahů, kde N je pevné číslo stejné pro všechny zápasy. Například, bude-li N=10, sehrají každé dvě strategie zápas na deset tahů a v každém z nich musí zvolit jednu z možností {spolupráce, zrada}. (N je ve skutečnosti různé od 10, ale jeho přesnou hodnotu se účastníci dozvědí až po zaslání strategií.) Strategie se nakonec seřadí podle získaných bodů (dle pravidel bodování uvedených výše) ve všech tazích všech zápasů. Nerozhoduje tedy počet vyhraných zápasů. Například, strategie, která dvakrát prohraje 74:76 a 50:100 na tom bude v celkovém hodnocení lépe než strategie, která dvakrát vyhraje 60:30 a 51:50.

Jak může vypadat strategie: Nejjednodušší strategie jsou „vždy spolupracuj" a „vždy zraď“. Strategie si ale může pamatovat historii interakce se svým soupeřem v rámci jednoho zápasu, tudíž například jsou možné strategie „zraď, ale pokud v předchozím tahu soupeř zradil, spolupracuj“, nebo „pokud počet soupeřových zrad v předchozích tazích převyšuje počet jeho spoluprací, zraď, jinak spolupracuj“. Strategie může být plně nebo částečně náhodná: „zraď se 75% pravděpodobností“, nebo „spolupracuj, ale pokud soupeř v předchozím tahu zradil, zraď s 25% pravděpodobností“ jsou platné strategie. Zápasy náhodnách strategií se budou simulovat s užitím pseudonáhodného generátoru. Strategie může záviset explicitně na číslu tahu, jako např. „spolupracuj kromě 124. tahu, kdy zraď“. (Pokud N<124, podmínka se samozřejmě nikdy nerealizuje.)

Jak strategie nemůže vypadat: Strategie nemohou mít přístup k údajům z jiných zápasů: „pokud soupeř vyhrál poslední zápas, vždy zraď“ je nepřípustná strategie. Strategie nevidí dovnitř ostatních strategií, což vylučuje např. „pokud soupeřova strategie je vždy bezpodmínečně spolupracovat, zraď“. Netřeba dodávat, že strategie zná jen výsledky minulých tahů, ne toho současného, nelze tedy „zraď, pouze pokud v témže tahu soupeř také zradí“. Strategie jsou anonymní, nelze tedy „zraď, ale pokud hraješ proti strategii, kterou navrhl buddhista, spolupracuj“. Strategie nezná hodnotu N, a nemůže k němu přistupovat ani nepřímo. Nezle tedy „zraď v posledním tahu“.


Došlo mi těchto pět strategií (jmény jsem je vybavil já podle jejich nápadných vlastností, nikoli jejich autoři):

  • (Mstivá): Spolupracuj do první zrady soupeře, nebo do pátého tahu. Od šestého tahu zrazuj vždy.
  • (Benevolentní): V prvním tahu spolupracuj. Poté spolupracuj, pokud soupeř spolupracoval aspoň ve dvou třetinách předchozích tahů.
  • (Složitá): V každém třetím tahu spolupracuj s pravděpodobností 40%. Jindy spolupracuj, právě tehdy když soupeř spolupracoval v obou dvou předchozích tazích. V prvních dvou tazích spolupracuj vždy.
  • (Oko za oko): Udělej to, co soupeř dělal v minulém tahu. V prvním tahu spolupracuj.
  • (Náhodná): V prvním tahu spolupracuj. Potom spolupracuj s pravděpodobností 1/3, pokud soupeř v předchozím tahu spolupracoval, a s pravděpodobností 1/10, pokud soupeř v předchozím tahu zradil.

Číslo N jsem předem stanovil na 188. Takto vypadala tabulka pro sehrání všech zápasů:


M B S O N celkem bilance pořadí
M 221:200 337:176 209:202 292:187 1059:765 4-0-0 1,41 4
B 200:221 588:875 752:752 351:218 1891:2066 1-1-2 2,51 1
S 176:337 875:588 320:313 331:324 1702:1562 3-0-1 2,26 2
O 202:209 752:752 313:320 271:271 1538:1552 0-2-2 2,05 3
N 187:292 218:351 324:331 271:271 1000:1245 0-1-3 1,33 5



Sloupec označený ∅ shrnuje průměrný bodový zisk na jeden tah. Teoretické maximum je sedm bodů, ale aby strategie dosáhla tohoto výsledku, musely by všechny její soupeřky spolupracovat bez ohledu na její vlastní permanentní zrazování. Maximum, kterého mohou dosáhnout všechny strategie zároveň, je pět bodů. Jeden bod je maximum, které se dá zaručit bez ohledu na soupeře: strategie „vždy zraď“ si nemůže vést hůře. Dá čekat, že pokud účastníci nebudou příliš hloupí, dosáhnou průměrů někde mezi jedním a pěti body.

Axelrod dělil strategie do kategorií „nice“ a „nasty“; chtele-li, „slušné“ a „svinské“. Slušná strategie nikdy nezradí dříve než její soupeř (může ale zrazovat v odvetě). Svinská strategie naopak klidně podrazí jako první. Vzhledem k této definici jsou z pěti účastnic svinské tři: M, S a N; B a O jsou slušné. Přítomnost sviní je důležitá, protože dělá hru zajímavou: slušné strategie spolu vždy spolupracují, a pokud jsou ve hře samé slušné strategie, skončí soutěž nudnou všeobecnou remízou s průměrným ziskem čtyř bodů na tah.

Svinskost či slušnost ještě neříká nic moc o tom, jak často strategie spolupracuje nebo zrazuje. Když se spolu utkají strategie „v prvním tahu zraď a pak spolupracuj“ a „spolupracuj až do první zrady soupeře, pak zrazuj“, ta první, ač technicky svině, ve většině tahů spolupracuje, zatímco druhá, ač technicky slušná, ve většině tahů zradí. Nicméně podívejme se na výsledky experimentu.

Vede se lépe strategiím svinským, nebo slušným? Je lepší spolupracovat, nebo zrazovat? Slušné strategie obsadily první a třetí místo, což není špatné — navzdory intuici, že být svině se vyplácí. Podívejme se na příčiny úspěchu či neúspěchu jednotlivých strategií detailněji.

Vítězná Benevolentní strategie vděčí za svůj úspěch své ochotě spolupracovat. Dokázala vyhrát pouze jeden zápas, ale kromě zápasu se Mstivou strategií byly její zisky vždy tučné. Jako slušná strategie si rozdělila pěkných 752 bodů za remízu s druhou slušnou strategií Oko za oko. Její síla spočívala právě v její benevolentnosti v souboji se strategiemi S a N. Tyto strategie občas zradily bezdůvodně, ale také se mstily za zradu. Zatímco B občasnou zradu přehlédla a pokračovala ve spolupráci, O spustila řetězec odvet, na kterém obě soupeřky tratily.

Složitá strategie na první pohled nevypadá moc rozumně. Čím vysvětlit tu bizarní vášeň pro třítahové periody? Přesto, tři vítězství mluví v její prospěch. Složitá strategie dokázala efektivně parazitovat na benevolentnosti pozdější vítězky a 875 bodů z tohoto souboje bylo klíčovým elementem úspěchu.

Oko za oko je klasická stabilní strategie, která v podobných střetnutích okupuje pravidelně přední příčky. (V Axelrodově pokusu byla strategií vítěznou.) Zde nezvítězila, a hlavním důvodem byla její přílišná mstivost. Oko za oko nabízí jistotu, že všechny její zápasy dopadnou remízou nebo prohrou o sedm bodů. Aby O byla lepší, než B, musely by ve hře být svině, které dokáží efektivně parazitovat na slabosti B. V tomto případě tomu tak nebylo.

Mstivá strategie je svině nejen v technickém smyslu, ale i ve smyslu praktickém: v 188 tazích zradí přinejmenším 183 krát. To by se mohlo vyplatit, kdyby soupeři byli extrémně naivní. Jelikož nejsou, aktivuje tato strategie nejpozději od sedmého tahu sérii vzájemných zrad, odkud plyne skromný zisk jednoho bodu na tah. Mstivá strategie dokázala ve vzájemném zápase porazit všechny své protivnice, ale její nejvyšší zisk v zápase byl ubohých 337 bodů. Poučení je nasnadě: snažit se v každém obchodě oškubat svého partnera nemusí být ideální cesta ke zbohatnutí. (Neúspěch Mstivé strategie padá z velké části na vrub absurdně nízkému pořadí tahu, ve kterém začíná zrazovat, a to padá na vrub triviálnímu omylu. Autor této strategie původně zaslal „spolupracuj do první zrady soupeře, a vždy zraď v posledním tahu“. Poté, co byl upozorněn na to, že strategie nemá prostředky k poznání, že nastal poslední tah, opravil autor hranici počátku zrazování z posledního na pátý tah, zřejmě věře tomu, že počet tahů se bude pohybovat někde těsně nad pětkou. Stejná strategie, která ovšem začíná zrazovat později, je naopak velmi úspěšná, jak bude vidět níže.)

Náhodná strategie byla ze všech jednoznačně nejhorší, což lze přičíst faktu, že byla jejím autorem stvořena v časové tísni během několika málo minut. I když se nejedná o stejnou Náhodnou strategii jako v případě Axelrodova pokusu, má k ní docela blízko: citlivost na tah soupeře je velmi malá, pravděpodobnosti 1/3 a 1/10 jsou si docela blízké. Krom malé citlivosti je jejím problémem i silná tendence zrazovat.

Přirozený výběr

Uvažme, že naše strategie nejsou programy soupeřící o abstraktní body, ale živočichové soupeřící o živiny potřebné k rozmnožování. Jak si povedou jednotlivé strategie v mnohageneračním souboji o přežití? I to se již zkoušelo. Znovu cituji ze Sobeckého genu:

Axelrod vzal 63 strategií a vhodil je do počítače, čímž získal „generaci 1“ evoluční sukcese. V „generaci 1“ proto „klima“ sestávalo rovným poměrem ze všech 63 strategií. Na konci generace 1, zisky každé strategie byly vyplaceny, ne jako „peníze“ nebo „body“, ale jako potomci shodní s jejich (asexuálními) rodiči. Jak šly generace, některé strategie se stávaly vzácnějšími a nakonec vyhynuly. Jiné se staly četnějšími. Jak se měnily početní poměry, tak se v důsledku měnilo „klima“, ve kterém se odehrávaly následné tahy hry.

Jak si v takovém souboji [1] vedou naše strategie? Obrázek lepší popisu.





Barvy: černá M, červená B, zelená S, modrá O, oranžová N. Mstivá a Náhodná strategie rychle vymírají, Benevolentní strategie i zde jasně dominuje. Dokud je přítomna Mstivá, Oko za oko si vede lépe než Složitá, ovšem po vymizení M má S výhodu v podobě vyšších zisků ze soubojů s B a pomalu, ale jistě, získává navrch. Poměr zhruba 7:3 mezi B a S je nadále stabilní. V zásadě tak získáváme stejné pořadí jako v jednorázovém souboji.

Přirozený výběr s mutacemi

Napsal jsem, že Mstivá strategie by si vedla lépe, kdyby začala zrazovat později, než v pátém tahu. Což tedy hnout s hodnotami parametrů u zadaných strategií? Strategie obsahují tyto parametry:

  • (Mstivá): jeden parametr, číslo tahu, ve kterém začíná zrazovat (původně 5).
  • (Benevolentní): jeden parametr, relativní četnost soupeřovy spolupráce nutná pro spolupráci (původně 2/3).
  • (Složitá): jeden parametr, pravděpodobnost zrady v každém třetím tahu (původně 3/5).
  • (Oko za oko): žádný volný parametr.
  • (Náhodná): dva volné parametry, pravděpodobnost spolupráce po soupeřově spolupráci a zradě (původně 1/3 a 1/10).

V další simulaci stály na začátku znovu proti sobě populace našich pěti strategií, ale tentokrát nebyli všichni jedinci stejní: každý měl náhodně vybranou hodnotu svých parametrů [2]. Nyní vidíme odlišné výsledky.





Barvy: černá M, červená B, zelená S, modrá O, oranžová N. Na rozdíl od předchozího se nedaří Složité strategii, která doprovodí Náhodnou rychle do propadliště dějin. Benevolentní strategii se daří v jejich společnosti (vzpomeňme na vysoké skóre 588:875 z jejich prvního vzájemného zápasu), ale jakmile populace S vymizí, začne ji B velmi pomalu následovat, jsouc vykořisťována Mstivou strategií. Té se daří ze všech úplně nejvíc. Oko za oko si drží stabilní pozici.





Zajímavý je populační vývoj v rámci Mstivé strategie; na obrázku 1. a 10. generace. (Vodorovná osa: hodnota parametru, svislá osa: četnost.) Zcela svinské varianty, které zrazují od samého začátku (a kam patřila původní strategie s parametrem rovným pěti), rychle mizí. Dokud existují naivní strategie C a E, začátek zrazování kolem 50. tahu je zatím výhodný, což je vidět na prosperující populaci s touto hodnotou parametru na obrázku vpravo.





V pozdějším vývoji, vlivem vymizení naivních strategií, následuje posun v začátku zrazování k cca. 90. tahu. (Mutace mohou posunout řídící parametr i přes stovku; takové strategie se chovají stejně, jako kdyby byl řídící parametr roven 100). Na obrázcích 30. a 99. generace.





Populační vývoj v rámci Benevolentní strategie: 1. a 10. generace. (Vodorovná osa: hodnota parametru v procentech, svislá osa: četnost.) Žádný selekční tlak není patrný, všechny hodnoty parametru zdánlivě prosperují stejně.





Totéž, 50. a 99. generace. Množina se rozpadla na několik podpopulací, pravděpodobně z čistě náhodných příčin (srovnejte s podobným obrázkem pro strategii O, kde žádné selekční tlaky být nemohou).





Populační vývoj v rámci Složité strategie: 1. a 10. generace. (Vodorovná osa: hodnota parametru v procentech, svislá osa: četnost.) Rozhozením parametrů strategie utrpěla a rychle vymírá.





Populace prošla úzkým hrdlem v 17. generaci (vlevo), kdy přežívalo pouhých 10 jedinců. Poté následovalo období relativní prosperity, kdy populace vzrostla na maximum 58 jedinců v 52. generaci, poté následovalo rychlé vyhynutí. Zajímavé je, že nejdéle přežila podpopulace kolem nuly (tj. taková, co v každém třetím tahu vždy spolupracuje) a izolovaná populace v okolí šedesátiprocentní pravděpodobnosti, což je shodou okolností hodnota zadaná autorem. Měl autor šťastnou ruku, nebo je za tím složitá analýza?





Populační vývoj v rámci strategie Oko za oko: 1. a 99. generace. I tato strategie byla rozdělena na podpopulace s různými hodnotami parametru, ten se ale zde nijak neprojevuje. Obrázek vpravo tak představuje typický projev rozdělení parametru v případě plné absence selekčních tlaků. (Vlevo je první tah - hodnoty parametru jsou generovány rovnoměrným rozdělením na intervalu 0-100. Kdyby nebylo mutací, bylo by na místě čekat, že některé hodnoty rychle vyhynou a již nikdy se neobjeví; pravý obrázek by tak měl méně teček umístěných výš. Mutacemi vznikají shluky okupující několik vzájemně blízkých hodnot parametru.)





Rychle vymírající Náhodná strategie: 1. a 13. generace. Svisle první parametr v procentech (nahoře 0, dole 100), vodorovně druhý (vlevo 0, vpravo 100). Vymření proběhlo tak rychle, že je těžko usuzovat na to, které hodnoty parametru jsou optimální.

Jiné počáteční podmínky

Co když počáteční hodnoty parametrů nebudou rozhozeny náhodně? Níže vidíme tři různé nenáhodné počáteční situace.





Situace při „přátelských“ počátečních podmínkách: tentokráte měly všechny strategie v první generaci ty hodnoty parametrů, které nejvíc favorizují spolupráci a odpouštění. Veškerá variabilita parametrů je pouze a jen důsledkem mutací. Barvy: černá M, červená B, zelená S, modrá O, oranžová N. Vývoj je plný zvratů, nejúspěšnější jsou M a B.





Situace při „agresivních“ počátečních podmínkách — počáteční hodnoty parametrů favorizují zradu a mstivost. Zde je vývoj mnohem jednoznačnější, M, S a N velmi rychle vyhynou, v populaci zůstanou pouze B a O. Populace všech strategií dohromady by se ve skutečnosti držela mnohem níže než v předchozím případě (na zradu doplácejí všichni). Tomu jsem zabránil změnou populaci regulujícího parametru; příliš malé populace jsou příliš citlivé na náhodné fluktuace.





Poslední situace zachycuje „ideální“ počáteční podmínky, tj. hodnoty parametrů, které byly nejúspěšnější v předchozích simulacích. Mstivé strategii se dařilo nejlépe, když začínala zrazovat v 90. tahu, a tak má počáteční hodnotu parametru rovnou 90. Benevolentní si vedla dobře ve své původní podobě, a tak začíná s hodnotou 67. Složitá nejlépe přežívala, pokud se zcela vyvarovala nevyprovokovaných zrad, a tak začíná s nulou. Nejsem schopen říct, jaké hodnoty parametrů byly nejlepší pro Náhodnou strategii, ale pokud je stanovíme na 100 a 0, bude tato strategie identická se strategií Oko za oko, která si vedla vždy lépe než jakákoli verze Náhodné. (Na začátku tak budeme mít dvakrát víc jedinců typu Oko za oko, jen polovina z nich však může mutovat).

Znovu vidíme komplikovaný obrázek, ve kterém je těžko poznat, která strategie je lepší. Favorit předchozích střetnutí, Benevolentní strategie, je trochu překvapivě první a jedinou, které se „podaří“ vyhynout během tří set generací. Moc se nevede ani Náhodné strategii: mutace měnící ideání Oko za Oko na podobnou, leč částečně náhodnou strategii, nejsou výhodné, a O je tak oproti N zvýhodněná svou stabilitou vůči mutaci. Paradoxně se daří Složité strategii, která je zbavena své náhodné složky a funguje teď téměř jako dle zásady „dvě oči za oko“.

Další opakování

Chcete si také zkusit vymyslet strategii? Máte možnost. Pokud mi v reakci na tento článek mejlem dojde dostatečné množství strategií, provedu s nimi simulaci. Toto jsou pravidla pro účast:


  • Každý člověk smí nasadit do hry pouze jednu strategii.
  • Strategie může být popsána normálním jazykem, ale musí být popsána tak, aby bylo možné ji jednoznačně algoritmizovat.
  • Strategie zasílejte mejlem na koroptew zavináč seznam tečka cz, nepište je do komentářů (ostatní účastníci nesmějí znát, co proti nim soupeři chystají). Do předmětu uveďte „Strategie“.
  • Dojde-li stejná strategie od dvou nebo více lidí, bude i tak nasazena pouze jednou.
  • Autor strategie může rozhodnout, chce-li soutěžit anonymně, nebo chce-li naopak uvést své jméno.
  • Můžete poslat i strategii, která je popsána v tomto článku. Originalita se nevyžaduje.
  • Autoři zde uvedených strategií se pochopitelně mohou účastnit znovu.
  • Soutěže se automaticky účastní Plně náhodná strategie, tedy strategie, která v každém tahu zradí nebo spolupracuje s 50% pravděpodobností.
  • Strategie se utkají nejprve každá s každou podle schématu popsaného v první části článku, a poté v evolučním souboji podle pravidel popsaných v poznámce [1] (velikosti populací mohou být jiné, v závislosti na počtu podaných strategií). Platí všechna pravidla popsaná v tomto článku, s těmito změnami:

    • Zisk při oboustranné spolupráci je 5 bodů, nikoli 4 body.
    • Počet tahů v zápase je známý a roven 100.
    • Počet generací v evolučním souboji je 100, vítězem je strategie s největší populací ve sté generaci.

  • Soutěž proběhne poté, co se sejde aspoň osm strategií, ne ale dříve, než na začátku září. Již se sešlo dostatečné množství strategií, probíhá jejich závěrečné testování. Do konce srpna ještě lze posílat další strategie, poté bude soutěž uzavřena.

Pamatujte: úspěch strategie závisí na tom, kdo jsou její soupeři. Pokud se strategii dařilo v tomto článku, neznamená to, že se jí bude dařit i v opakovaném pokusu.



Poznámky:
1. Přesnější popis simulace: Na počátku bylo 200 kusů od každé strategie, celkem tedy 1 000 kusů. Ty byly náhodně spárovány do dvojic a každá dvojice absolvovala stotahový zápas. Po skončení všech zápasů se u každé ze strategií sečetly body, které získaly všechny její kopie v zápasech. Druhou generaci tvořilo znovu tisíc strategií (až na zaokrouhlovací chybu), ovšem tentokráte s četnostmi odpovídajícími poměru bodových zisků z první generace. Analogicky v dalších generacích.
2. Přesnější popis simulace: Na počátku bylo 200 kusů od každé strategie. Každému jednotlivému kusu byly náhodně nagenerovány dva parametry s hodnotami rozloženými rovnoměrně od 0 do 100 (u strategií, kde parametr má interpretaci pravděpodobnosti nebo poměru, určuje generované číslo jejich hodnotu v procentech; u strategie M určuje, v kolikátém tahu nejpozději zradí). Druhý parametr využívala prakticky pouze strategie N, strategie O ignorovala hodnotu obou parametrů. V každé generaci byly existující strategie náhodně spárovány do dvojic a každá dvojice absolvovala stotahový zápas. Poté bylo vytvořeno tolik identických kopií strategie, kolik ta získala bodů. Poté prošla každá kopie filtrem, ve kterém mohla být s určitou pravděpodobností zničena; tato pravděpodobnost byla pro všechny kopie stejná a závisela nepřímo úměrně na velikosti celkové populace. (Celková populace tedy nebyla vázána na hodnotě 1 000 jako v předchozí simulaci). Přeživší kusy byly předány do další generace s určitým rizikem mutace: s dvacetiprocentní pravděpodobností se pohnula hodnota každého z obou jeho jeho parametrů o 1 náhodným směrem.

středa 17. srpna 2011

Změna barev

Původní barevné schéma se vyznačovalo nízkým kontrastem, který mohl snižovat čitelnost. Pro zvýšení čitelnosti jsem rovněž přešel k patkovému písmu. Zpětná vazba je vítána; vyšší než malé množství čtenářů preferujících starý vzhled (a vyjadřivší tuto preferenci formou komentáře) může změnu zvrátit.

úterý 16. srpna 2011

Gödelovo číslování a formální aritmetika


Toto je šestý díl seriálu o logice, který volně sleduje myšlenky D.Hofstadtera sepsané v jeho knize Gödel, Escher, Bach. Navigace: úvodní článek - předchozí díl - příští díl.

Z předchozích pěti dílů tohoto seriálu již známe prakticky všechny ingredience potřebné k porozumění tomu, proč není možné stvořit formální systém, který by byl schopen dokázat všechna pravdivá tvrzení matematiky. Bylo již řečeno, jak formální systémy fungují, a v minulém díle jsem nakousl, jak do řeči formálních systémů převést paradox lháře: Očíslujeme-li si jistým jednoznačným způsobem všechny výrazy, stane se dokazatelnost výroku tvrzením o přirozených číslech. Jestliže systém umožňuje formulovat výroky o přirozených číslech, automaticky nabízí i možnost formulovat i výroky o dokazatelnosti svých vlastních výrazů. Pak stačí zformulovat výraz, který tvrdí sám o sobě (prostřednictvím Gödelova číslování), že je nedokazatelný. Takový výrok je buď nedokazatelný a tudíž pravdivý nebo dokazatelný a zároveň nepravdivý. Idea je tedy jasná, ovšem podání bylo doposud poněkud vágní. Zbývá dořešit několik technických detailů a dovést tak konstrukci formální verze lhářova paradoxu do (téměř) explicitní podoby. Co je tedy ještě nutné prodiskutovat? Čeká nás

  1. ilustrace Gödelova číslování na jednoduchém systému (kterou potřebujeme, aby vynikla souvislost mezi tvrzeními o dokazatelnosti výroků s tvrzeními o přirozených číslech)
  2. naznačení toho, jak vypadá formální aritmetika aneb teorie čísel (se vším všudy jsem zatím popsal pouze výrokovou logiku, k dokazování aritmetických pravd je potřeba větší systém)
  3. diskuse toho, jaká fakta o přirozených číslech musí formální aritmetika být schopna odvodit, nebo aspoň vyjádřit (což potřebujeme, protože konstrukce lhářova paradoxu nebude zcela explicitní — výrazy mluvící o dokazatelnosti výroků jsou příliš složité na to, aby zde byly vypsány; budeme se muset obejít s vírou v jejich existenci, a tato víra vyžaduje odůvodnění)
  4. konstrukce autoreference pomocí „quinování“ (potřebujeme techniku, jak vtěsnat do výroku jeho vlastní Gödelovo číslo).

V tomto díle se dostanu k prvním dvěma bodům.

K prvnímu bodu si vypůjčím primitivní systém MIU zavedený již v prvním dílu. Pro osvěžení: abecedu systému tvořily tři písmena M, I a U. K tomu byl k dispozici axiom MI a tři odvozovací pravidla:

  1. Končí-li teorém na I, můžeme na konec přidat U a získáme nový teorém. Tedy je-li XI teorém, pak XIU je teorém. (Například, z UII odvodíme UIIU.)
  2. Máme-li teorém začínající na M, můžeme to, co následuje, zdvojit. Tedy je-li MX teorém, MXX je teorém. (Například, z MMUUI odvodíme MMUUIMUUI.)
  3. Když v libovolném teorému nahradíme podřetězec III symbolem U, získáme nový teorém. Tedy je-li XIIIY teorém, je i XUY teorém. (Například, z UMUIIIU odvodíme UMUUU.)


Jak zavést Gödelovo číslování? Odpověď je, že prakticky jakkoli. Můžeme to provést například tak, že je nejprve rozdělíme do skupin podle délky; v každé takové skupině bude zjevně pouze konečný počet dobře formovaných výrazů. Ty pak seřadíme abecedně. Získáme tak jednoznačné řazení všech dobře formovaných výrazů a každému můžeme přiřadit číslo odpovídající jeho pořadí. Jiný způsob očíslování výroků je ještě jednodušší na provedení: každému znaku formální abecedy přiřadíme nějaké číslo, a číslo celého výrazu získáme slepením desítkového zápisu čísel znaků, ze kterých sestává. Jak konkrétně Gödelovo číslování provedeme je zcela jedno; záleží pouze na tom, aby každému dobře formovanému výrazu odpovídalo právě jedno přirozené číslo, a aby každému přirozenému číslu odpovídal nejvýše jeden výraz našeho formálního systému [*].

Musíme zvolit jedno konkrétní Gödelovo číslování, a učiňme to například takto: M nahradíme číslicí 3, I číslicí 1 a U číslicí 5. Gödelovo číslo (dále jen G.č.) výrazu UMUIIIU tak je prostě 5351115, jediný axiom MI má číslo 31 atd.

Odvozovací pravidla byla formulována tak, aby se s výrazy pohodlně manipulovalo jako s řetězci znaků. Samozřejmě můžeme pravidla „přeložit“ z jazyka řetězců do jazyka Gödelových čísel, maje tak

  1. končí-li G.č. teorému na 1, můžeme na konec přidat 5 a získáme G.č. nového teorému.

Spíš než o překlad se jedná o otrockou transliteraci — místo se symboly M, I a U tu šíbujeme se symboly 1, 3 a 5. Cílem ale není nahrazovat symboly, nýbrž přejít od symbolických manipulací s textovými řetězci k aritmetickým operacím s čísly. Dostáváme se tak ke skutečnému překladu do jazyka aritmetiky.

  1. Je-li g G.č. teorému a je-li zbytek po dělení g deseti roven jedné, potom i g' = 10g + 5 je G.č. teorému.
  2. Je-li g G.č. teorému a existuje-li přirozené číslo n takové, že 3.10n < g < 4.10n, potom g' = 3.102n + 10n g + g je G.č. teorému.
  3. Je-li g G.č. teorému a existují-li přirozená čísla k, m a n takové, že m < 10n a zároveň g = 10n+3 k + 111.10n + m, potom g' = 10n+1 k + 5.10n + m je G.č. teorému.

V těchto řádcích lze s trochou námahy poznat výše sepsaná pravidla systému MIU, tentokráte však převlečená do hávu aritmetických operací. Pravidla nevypadají zrovna jednoduše, ale na tom příliš nezáleží.

Prozatím máme pravidla pro manipulaci s přirozenými čísly; podívejme se ale na některé výroky o číslech. Vezměme kupříkladu tuto trivialitu: „315 = 10.31 + 5 a zároveň zbytek po dělení 31/10 je 1“. Jedná se o konjunkci dvou prostých tvrzení týkající se čísel 5, 10, 31 a 315 — za ní se ovšem, ve světle Gödelova číslování, skrývá tvrzení o systému MIU. Konkrétně, MIU je korektně odvozeno aplikací I. pravidla z MI. Můžeme postoupit ještě o krok dále, když nahradíme konkrétní čísla volnými proměnnými. Výrok „n = 10.31“ vlastně znamená „n je G.č. teorému systému MIU odvozeného pomocí I. pravidla z axiomu MI.

Můžeme analogicky, jako tvrzení o přirozených číslech, vyjádřit výrok „X je teorémem systému MIU“? (Pokud se nám podaří aritmetickým jazykem mluvit o systému MIU, dle stejného návodu budeme moct mluvit i o jiných systémech.) Jistě, jakmile nahradíme výrazy jakéhokoli systému jejich Gödelovými čísly, tvrzení o výrazech se stávají tvrzeními o přirozených číslech. Přísně vzato ale potřebujeme víc: nestačí nám tvrzení o přirozených číslech, potřebujeme tvrzení, které se dá formulovat v rámci formální aritmetiky. Zatím jsem se vyhýbal přesnému popisu toho, jak má tato formální aritmetika vypadat, a tak tu zůstává určitá volnost ve výběru toho, jak aritmetiku formalizujeme. Jistě se nespokojíme s něčím tak primitivním, jako byl systém PR popsaný v druhém díle této série. Systém PR byl schopen vyjádřit pouze výroky o sčítání, zatímco naše ambice je najít systém, který bude formalizovanou verzí běžné aritmetiky. Aby této ambici dostál, musí zvolený systém být schopen vyjádřit a dokázat všechny pravdy o přirozených číslech, ke kterým jsme schopni dojít neformálním myšlením. Musí tedy být schopen vyjádřit například

  • 17 je liché číslo
  • pokud je n mocnina dvou, potom n není mocnina tří
  • existuje nekonečné množství prvočísel
  • neexistují kladná a, b, c a n > 2 takové, že an + bn = cn

a tak dále.

Asi nejběžnější formalizace aritmetiky vychází z axiomů, které poprvé zformuloval italský matematik Giuseppe Peano. Nebudu zde ovšem diskutovat Peanovy axiomy a příslušná gramatická a odvozovací pravidla [*], poněvadž jejich konkrétní tvar není extrémně důležitý. Pro utvoření hrubé představy pouze řeknu, s jakými symboly se můžeme setkat a uvedu formální verze některých jednoduchých tvrzení.

Nejdříve symboly. Formální aritmetika bude především obsahovat vše, co obsahovala výroková logika, ovšem kromě symbolů A, B, C atd., označujících abstraktní výroky. Důvod je samozřejmě ten, že aritmetiku nezajímají neurčené abstraktní výroky, nýbrž zcela konkrétní výroky o číslech. Musíme tedy přidat symboly pro čísla a relace mezi nimi. Obejdeme se se symboly 0, S, +, ., =, , a nakonec symboly pro proměnné: a, b, c atd.

Symboly 0, +, . a = mají přesně ty významy, které od nich každý očekává; tedy označují nulu [*], sčítání, násobení a rovnost. Kvantifikátory a jsou taktéž známé. Symboly proměnných slouží, nepříliš překvapivě, k zápisu proměnných. Jediný nestandardní symbol je S. Napíšeme-li S před jiný číselný výraz, získáme tak číslo o jedna vyšší (písmeno S je z latinského successor = „následník“). Symbolu S užíváme především k zápisu všech čísel kromě nuly: S0 je jednička, SS0 dvojka a tak dále. Lze jej ale psát i před jiné výrazy, například můžeme mít Sa, S(S0+b) nebo SS(a.Sb).

Abeceda formální aritmetiky umožňuje zapsat řadu výroků o přirozených číslech relativně přímo. Výrok „jedna plus jedna se rovná dvěma“ má formální protějšek ((S0+S0)=SS0) [*], výrok „číslo a je rovno pěti“ přejde na (a=SSSSS0). Takhle snadné je to vždy, když výrok obsahuje pouze „primitivní“ operace a vztahy, jako sčítání nebo rovnost. Primitivními operacemi přitom myslíme ty, které mají ve formální abecedě své vyhrazené symboly. Ne všechny operace a vztahy ale mohou být primitivní. Kdybychom chtěli mít speciální symbol pro každý matematický koncept, potřebovali bychom obludně velkou abecedu. I v neformálním přístupu k matematice běžně definujeme složitější pojmy pomocí jednodušších, a situace není nijak odlišná zde. Třeba pro zápis výroku „pět je větší než dva“ nám chybí symbol pro „je větší“ a musíme jej nahradit nepřímo. Řešením je přeformulovat výrok s užitím pouze primitivních konceptů. Jedna přípustná náhrada zní: „neexistuje číslo n takové, že n není nula a zároveň n + 5 = 3“, symbolicky ¬∃n:(¬(n=0)∧((n+SSSSS0)=SSS0)) [*]. Formulaci lze ještě vylepšit: v řetězci ¬∃n:((Sn+SSSSS0)=SSS0)) jsme se elegantně zbavili konjunkce díky tomu, že Sn zde stojí jako symbol pro libovolné nenulové přirozené číslo (nula není následníkem žádného jiného přirozeného čísla).

Uvedený příklad ilustruje, že překlad neformálních výroků do řetězců formálního systému není vždy přímočarý. Formalizace složitějších výroků dá zpravidla velkou práci a vyžaduje i jistou praxi. Jako relativně jednoduché cvičení si můžete například zkusit zformalizovat „n je mocnina dvou“ (řešení viz [1]). Nabízí se tedy otázka: je skutečně pomocí uvedených symbolů zaručeně možné formalizovat jakýkoli výrok o přirozených číslech? Odpověď je, ne zcela. Existuje ovšem široká třída funkcí, které formalizovat lze, a existence formalizovaných verzí těchto funkcí je pro naše účely dostačující. Jedná se o primitivně rekurzivní funkce, kterým se bude věnovat příští díl.


Poznámky:
1. Formální verze výroku „n je mocnina dvou“ může být např. ¬∃a:(∃b:((SSSa.b)=n)∧¬∃c:∃d:(a=(SSc.SSd))). Tedy doslova: „neexistuje a, pro které existuje b takové, že (a + 3)b = n, a zároveň pro které není pravda, že existují c a d takové, že (c + 2)(d + 2) = a“. Méně doslovně a srozumitelněji (označme e = a + 3): „neexistuje e > 2, které je dělitelem n, a které zároveň nemá dělitele většího než 2“. Ještě více polopaticky: „Neexistuje prvočíselný dělitel n vyšší než dvojka“.