pondělí 26. prosince 2011

Nepřímá autoreference


Toto je osmý a poslední díl seriálu o logice, který volně sleduje myšlenky D.Hofstadtera sepsané v jeho knize Gödel, Escher, Bach. Navigace: úvodní článek - předchozí díl.

V předchozích dílech tohoto seriálu jsme si ukázali výraz ∃m:P(m,n), jež má interpretaci „existuje číslo m, které je Gödelovým číslem korektního odvození výrazu, jehož G.č. je n“, neboli výraz s G.č. n je teorém formální aritmetiky“. P(m,n) je v tomto případě zkratka za nepředstavitelně dlouhý řetězec znaků z abecedy formální aritmetiky, vyjadřující primitivně rekurzivní fakt, že sekvence výrazů reprezentovaná číslem m (přes Gödelovo číslování) je důkazem výrazu reprezentovaného číslem n. Toto je předposlední krok v naší snaze reprezentovat lhářův paradox formálně, či ještě spíše ukázat, že vždy, aspoň tedy v jakémkoli formálním systému který je schopen vyjádřit primitivně rekurzivní predikáty, je možné tento paradox formulovat. Stačilo by nějak zařídit, aby ve výraz ¬∃m:P(m,n) měl Gödelovo číslo zrovna n. Můžeme samozřejmě zkoušet různá n, a dokonce různá schémata Gödelova číslování, přesto ale nemáme zaručeno, že se kýženou podmínku podaří splnit. Můžeme ale vytáhnout ještě jeden mazaný trik, který Hofstadter nazval quinování, inspirovav se jménem filosofa a logika W.Quina, jenž s trikem jako první přišel [*], a pomocí něho zkonstruovat kýžený autoreferenční výrok, přičemž autoreference dosáhneme nepřímo.

Předmětem quinování jsou výroky, a quinování jako takové je vcelku jednoduchý proces: vezmeme výrok a vložíme do něj jeho citaci (tj. kopii v uvozovkách). Momentálně se mi hodí nadefinovat si quinování tak, že citaci budu vkládat mezi druhé a třetí slovo výroku [*]. Kupříkladu, kdyby se mi zachtělo quinovat výrok „prase je savec“, výsledek bude „prase je „prase je savec“ savec“. Zvolený příklad nedělá quinování příliš velkou čest: nejenže není jasné, k čemu by se dalo použít, ale výsledek ani není gramaticky korektní výrok. Věc se začne jevit o trochu zajímavější, když povolíme quinování fragmentů výroků. Abych dlouho nechodil kolem horké kaše, předhodím ctěnému čtenářstvu quinovací verzi lhářova paradoxu:

L: quinování výrazu „quinování výrazu je nepravdivé“ je nepravdivé

Této bizarní větě je třeba rozumět následujícím způsobem: podmětem věty je zjevně výraz „quinování výrazu „quinování výrazu je nepravdivé““. Ovšem quinování výrazu „quinování výrazu je nepravdivé“ je samotný výraz L! L tedy mluví sám o sobě (a popírá svou pravdivost), aniž by používal explicitního odkazu „tento výrok“. Jistě, cenou za to je pofidérní operace quinování, kterou je nutno nadefinovat, a přítomnost uvozovek uvnitř výrazu. Našim cílem ale není mít lhářův paradox sepsán tak, aby mu bylo snadno rozumět, nýbrž tak, aby jej bylo lze snadno formalizovat. A tomuto požadavku quinovací verze paradoxu vyhovuje.

Nejdřív si ale definujeme formální aritmetickou verzi quinování. Jejím objektem tentokráte nejsou normální výroky, ale výrazy formální aritmetiky. Aritmetické quinování bude fungovat trochu odlišně od výše popsané procedury: zaprvé, do výrazu budeme doplňovat ne jeho citaci, ale jeho Gödelovo číslo zapsané standardním způsobem (tedy jako SSSS...S0). Dále, abychom se vyhnuli nepříjemnému problému spojeného s tím, kam přesně do výrazu číslo zapsat, quinovatelné výrazy musí obsahovat alespoň jednu instanci volné (tj. nekvantifikované) proměnné. Quinování nahradí všechny volné proměnné Gödelovým číslem původní formule. Samozřejmě si neodpustím příklad. Nechť původní výraz A zní (x=0). Použijeme-li Gödelovo číslování ve verzi zavedené v minulém díle, doplněné pravidlem, že znaku x odpovídá číslice 9, je Gödelovo číslo výrazu A rovno 19 542. Quinování A je pak výraz B = (SSSS...S0=0), kde v řetězci za sebou stojí přesně 19 542 písmen S [*].

Výraz B má taktéž své Gödelovo číslo, jak také jinak. To nabízí v dalším kroku zadefinovat predikátovou funkci Q(g,h) takto: pokud h je Gödelovo číslo výrazu, který vznikne quinováním výrazu, jehož Gödelovo číslo je g, je Q(g,h) rovno pravdě, a v jiných případech je rovno nepravdě. Stále užívajíce náš výběr Gödelova číslování, můžeme snadno nahlédnout, že Q(19 542 , 13 333...334 542) nabývá hodnoty pravda, je-li v druhém argumentu přesně 19 542 trojek.

Čtenář asi již očekává, že důležitou roli bude hrát primitivní rekurzivita funkce Q (která je stejně evidentní, jako u posledně definované funkce P: i vyhodnocení Q je čistě mechanická záležitost, jejíž trvání je úměrné délce výroků odpovídajících jejím parametrům). Stejně jako funkci P(m,n), i funkci Q(g,h) bude možné zakódovat do nějakého obludně komplikovaného řetězce Q(g,h). Kdybychom se hodně snažili a měli opravdu mnoho času, mohli bychom přesnou podobu tohoto řetězce v principu objevit; nic takového ale dělat nepotřebujeme, stačí nám vědomí jeho existence.

Můžeme tedy začít překládat lhářův paradox, konkrétněji výraz L, do formální podoby. Nejtěžší je část v uvozovkách (označme ji třeba U), její detaily tak ponechme nakonec. Budeme ale potřebovat její Gödelovo číslo u. Chceme říct, že quinování výrazu s G.č. u není teorém. Označím-li toto quinování jako výrok K, znamená to, že neexistuje číslo d, které by bylo G.č. odvození výroku K. K má své vlastní G.č., pochopitelně, označme jej k. Teď celou věc dáme dokupy, a dostaneme výrok

G: ¬∃d:∃k:(P(d,k)Q(u,k))

Pro jistotu ještě jednou přečteme: není pravda, že existuje výrok, který je quinováním výroku U a který je zároveň teorém. Pokud U zvolíme tak, že bude obsahovat aspoň jednu volnou proměnnou, bude existovat jeho quinování, a tudíž G říká, že toto quinování není teorém. Zbývá zvolit U tak, aby jeho quinováním vznikl výrok G. Což takhle zkusit tohle:

U: ¬∃d:∃k:(P(d,k)Q(x,k))

U a G vypadají úplně stejně, kromě toho, že U obsahuje volnou proměnnou (konrétně x), zatímco G má na jejím místě konkrétní, byť prozatím nevyčíslenou, hodnotu u. Quinováním U nahradíme volnou proměnnou x Gödelovým číslem U, to jest u, čímž dostaneme výrok G. Výrok G tak skutečně popírá svou vlastní pravdivost!

(Doporučuji čtenáři před dalším čtením věnovat pět minut promyšlení celé věci a kontrole, zda jsem se nedopustil závažného podvodu. Konkrétně by si měl být jist, že U je dobře formulovaný výrok, že není žádný problém v definici jeho Gödelova čísla u, že G je dobře definovaný výrok a že jeho interpretace je taková, jakou jsem napsal. Výroky U a G nejsou z nejprůhlednějších, a jelikož je G vlastně vyvrcholením série osmi článků, stojí za tu trochu pozornosti.)

Co jsme si vlastně ukázali, a co nikoliv
Člověk se občas setká s fatalistickými interpretacemi Gödelovy věty: Pravda neexistuje. Poznání je nemožné. Logika je nespolehlivá. Silná slova na jedné straně přispívají k nárůstu zájmu o Gödelovské problémy a logiku obecně, na druhé straně ale vytvářejí značně nadsazené představy o důležitosti podobných paradoxů. Pečlivější pohled nabádá zůstat při zemi, neb situace není tak dramatická, jak by se mohla jevit.

Především, ukázali jsme si (poněkud nepořádně — rigorózní matematik by nebyl spokojen, ale tento blog nepíšu pro přísné matematiky) formální verzi paradoxu lháře. Pokud vás nijak neznepokojuje tradiční lhářův paradox, není důvod, abyste byli znepokojeni jeho formalizovanou verzí. Jestliže gramaticky správná věta „tento výrok není pravdivý“ nezasadí smrtelnou ránu vašemu přesvědčení o možnosti poznání či platnosti logiky, proč by toto přesvědčení mělo kapitulovat před reformulovanou verzí téhož, nota bene slabší: Výrok G o sobě netvrdí, že je nepravdivý, pouze že je nedokazatelný. Pouze pokud je (byla) vaše důvěra v logiku založena na víře, že existuje formální systém, v rámci kterého lze dokázat každý pravdivý výrok o přirozených číslech a žádný nepravdivý výrok o přirozených číslech, je pro vás Gödelův objev důvodem ke znepokojení. Mám ovšem pocit, že postmoderní filosofové hledící na Gödela jako na jednoho z proroků neexistence objektivní pravdy, se pramálo zajímají o přirozená čísla.

Existují různé cesty, jak se vyrovnat s Gödelovou větou. Nejortodoxnější je připustit, že G je pravdivý výrok. Jelikož jeho pravdivost implikuje jeho nedokazatelnost, musíme pak uznat, že náš formální systém má díry a nedokáže odvodit všechny pravdy — a v širším důsledku pak i to, že žádný formální systém není schopen dokázat všechny pravdy o přirozených číslech. Existují tedy výroky, které jsou pravdivé, ale přesto formálně nedokazatelné. Jsou to zpravidla výroky tvrdící, že všechna přirozená čísla mají určitou vlastnost (kterou jsme schopni ověřit pro každé přirozené číslo zvlášť), nebo že existuje číslo mající určitou vlastnost. Je nedokazatelnost některých takových výroků znepokojující? Asi do jisté míry ano, vzhledem k tomu, že prakticky všichni matematikové a logikové přelomu devatenáctého a dvacátého století věřili v opak, ale určitě to není natolik znepokojující, aby bylo nutno váhat nad samotnou možností poznání či existencí pravdy (ať už obě fráze přesně znamenají cokoli).

Nebo můžeme uvěřit tomu, že G je ve skutečnosti nepravdivý (a tudíž je dokazatelný). K takové věci bychom byli dokonce nuceni, kdyby se podařilo opravdu G dokázat. Tato možnost už znepokojuje poněkud více, neboť ohrožuje naši důvěru v matematicky dokázané pravdy. Pokud formálně dokázaná věta není pravdivá, jak pak vůbec můžeme věřit matematice? Kdyby se v rámci Peanovy aritmetiky objevil důkaz G, měli by matematikové zřejmě tendenci axiomy Peanovy aritmetiky zavrhnout nebo aspoň revidovat. Nicméně pořád by to nic neměnilo na tom, že Peanova aritmetika je užitečným formálním systémem pro odvození obrovské spousty výroků, pomocí kterých se dá popisovat celá řada jevů existujících v přírodě i lidské společnosti. Byla by existence dokazatelných nepravdivých výroků typu „tento výrok je nepravdivý“ tak velkým problémem?

Nebo můžeme zaujmout vágnější pragmatické stanovisko a příliš se nestarat o ideály pravdivosti u výroků, jejichž předmětem jsou abstraktní objekty, případně výroky samotné. Většina lidí koneckonců nemá problém akceptovat, že tradiční lhářův paradox nemá pravdivostní hodnotu. Když ho zabalíme do hávu, ve kterém vypadá jako výrok o přirozených číslech, zdá se, že najednou jsou jeho předmětem reálné věci. Absence pravdivostní hodnoty výroku o přirozených číslech se zdá stejně absurdní, jako absence pravdivostní hodnoty výroku „včera v Klatovech pršelo“. Ale není to pouze iluze? Přirozená čísla jsou abstrakce stejného řádu jako výroky; nevadí-li, že výrok mluvící sám o sobě postrádá pravdivostní hodnotu, proč by to mělo vadit u výroku o přirozených číslech?

Pokud autoreferenční paradoxy něčím skutečně otřásají, pak jsou to představy o absolutnosti apriorních pravd odvoditelných na základě přísné logiky a nemajících jakýkoli empirický obsah. Pro mnoho filosofů byly tyto apriorní pravdy tím nejdůležitějším, čeho lidské poznání může dosáhnout. Když se ukazuje, že některé tyto pravdy se vzpírají poznatelnosti, neznamená to ovšem, že jejich pravdivost není odrazem existujícího řádu v reálném světě, ale spíš problémů ve struktuře lidského jazyka a myšlení? V reálném světě nejsou paradoxy — v Klatovech nemůže pršet a nepršet naráz.

sobota 17. prosince 2011

Monino


Monino je malé město severovýchodně od Moskvy. Samotné město je nezajímavé panélákové sídliště, na jeho okraji ale leží unikátní muzeum vojenského letectví. Sovětská konstruktérská škola se v žádném případě nedržela ve vyjetých kolejích, a v Moninu lze snadno najít důkazy v podobě skutečně bizarních létajících strojů. Bohužel, ačkoli sovětský vojenský letecký průmysl nedostatkem zdrojů netrpěl a bylo ho možné počítat ke světové špičce, o sovětském a ruském muzejnictví se totéž říct nedá. Nedostatek peněz na údržbu exponátů a vybavení muzea je místy patrný.

Pokud do Monina chcete dojet, podívejte se předem důkladně na mapu, protože od nádraží není cesta k muzeu příliš dobře značena, a můžete omylem zabloudit do areálu vojenské základy. Pokladna se nachází v zadním traktu polorozpadlé budovy. Doporučuji při koupi vstupenky pouze říct nějakou krátkou frázi, například один билет, tak, aby pokladní nepoznala, že nejste Rusové. Důvod je ten, že zatímco domácí platí nějakých 70 nebo 100 rublů, pro cizince je cena 350.

A teď už k letadlům:




Tupolev Tu-4, strategický bombardér prakticky okopírovaný podle vzoru amerického B-29.



Mil V-12, největší v historii vyrobený vrtulník. Existovaly pouze dva prototypy, od sériové výroby bylo upuštěno. Video zachycující stroj v letu.



Tu-22, první sovětský nadzvukový bombardér, vyráběný od roku 1959.



Mjasiščev M-50, jiný strategický bombardér z konce padesátých let. Na rozdíl od předchozího typu se M-50 nikdy nedostal do sériové výroby.



Suchoj T-4, prototyp strategického bombardéru schopného dosáhnout rychlosti 3200 km/h. Trup je z velké části vyroben z titanu. Projekt byl opuštěn pro vysokou cenu.



Diskoplan-1, experimentální konstrukce M.V.Suchanova z roku 1950 s kruhovým křídlem.



Ilja Muromec, nejstarší těžký bombardér na světě z roku 1913, konstrukce I.Sikorského. Maximální rychlost jen o málo přesahovala 100 km/h.



Tupolev SB (скоростной бомбардировщик - rychlý bombardér) z poloviny třicátých let. Dosahoval rychlosti 450 km/h.



Ne všechny technologické podivnosti pocházejí z rýsovacích prken sovětských konstruktérů. PZL M-15 polské výroby byl jediným práškovacím letounem s proudovým motorem a jediným proudovým dvojplošníkem, nepočítáme-li experimentální stroj Henriho Coandy z roku 1910 (u kterého je sporné, zda jeho motor lze považovat za proudový, a u kterého se navíc neví, zda vůbec létal).



Vrtulník s tandemovými rotory Jakovlev Jak-24 z počátku padesátých let.



Uprostřed těžký transportní vrtulník Mil Mi-6, vpravo pak americký vrtulník s tandemovými rotory Piasecki H-21. Vrtulník vlevo neidentifikován je Kamov Ka-26.



Jakovlev Jak-36 z první poloviny šedesátých let byl první sovětský letoun s vertikálním vzletem a přistáním. Falický útvar vpředu neslouží k taranování jiných letadel, nýbrž v sobě má trysku užívanou k udržování stability právě při kolmém vzletu.



Letouny z konstrukční kanceláře Mikojana a Gureviče. Odpředu MiG-9, MiG-15, MiG-17, MiG-21, MiG-25.



Antonov An-12.



Produkce Berievovy konstrukční kanceláře patří k tomu bizarnějšímu. Zde hydroplán Be-12...



... a zde bohužel silně poškozený prototyp hydroplánu Beriev-Bartini VVA-14. Video zachycující stroj v původní podobě, včetně letových záběrů.



Antonov An-24 a za ním těžký transportní An-22 Antej.



Tupolev Tu-144, jeden z mála civilních letounů v muzeu.



„Létající bota“ MiG-105, experimentální letoun, který byl vyvinut v rámci sovětského kosmického programu Spiral, jehož konečným cílem měl být orbitální letoun / raketoplán.



Podzvukový strategický bombardér Mjasiščev M-4.



Strategický bombardér Tu-95. Tento typ (v novějších modifikacích) je stále ve výzbroji ruského letectva.



Celkový pohled na střední část venkovní expozice s vystavenými bombardéry.

neděle 11. prosince 2011

Tachyony a kauzalita


Naměření nadsvětelných rychlostí neutrin v experimentu OPERA je s pravděpodobně způsobeno nějakou systematickou chybou [1]. Jeden komplikovaný experiment, jakkoli pečlivě provedený, nemůže svrhnout mnohokrát úspěšně testované teoretické představy o povaze světa. K tomu by bylo potřeba nezávisle výsledek replikovat na jiném experimentálním zařízení a jinou metodou; pak teprve by pravděpodobnosti toho, že se jedná o experimentální chybu, poklesly natolik, aby bylo možné rozumně uvažovat o objevu nového fyzikálního jevu. (Nebudu se protentokráte zaobírat tím, jaké tyto pravděpodobnosti jsou.) Přestože nevěřím, že k tomu dojde, musím se přiznat, že bych za to byl rád. Částicové experimenty posledních desetiletí zpravidla potvrzovaly teoretické modely a vedly ke stanovení hodnot fundamentálních konstant. Ačkoli tyto výsledky hrají ve fyzice nezastupitelnou roli, pro rozvoj jakékoli vědy jsou vždy nejpřínosnější výsledky překvapivé, které otevírají nové cesty k budoucímu zkoumání. A co se týká překvapivosti, potvrdí-li se správnost diskutovaných dat, těžko k nim najít na poli částicové fyziky srovnatelné zjištění.

Ať už vězí příčina publikovaných výsledků v čemkoli, neuškodí se podívat na to, co by vlastně existence částic rychlejších než světlo (tedy tachyonů) znamenala, a jaké problémy taková věc přináší. Především, co vlastně říká speciální teorie relativity o nadsvětelných rychlostech? Pro čtenářovo pohodlí nejprve rychle zopakuji některé části formalismu speciální relativity. Čtenář obeznámený s problematikou může tuto sekci přeskočit a pokračovat od druhé části.

Formalismus
Velmi se hodí pojem čtyřvektoru [*]. Čtyřvektor má jednu „časovou“ a tři „prostorové“ složky. Příkladem čtyřvektoru je polohový vektor události (událost je jen jiné slovo pro bod v prostoročase, toto slovo se používá, i když se v daném bodě nic neudálo). Jeho složky můžeme označit písmeny (t,x,y,z), celý vektor pak X. Dalším používaným čtyřvektorem je čtyřhybnost P, se složkami (E,px,py,pz). Výhoda užití čtyřvektorů je jejich snadná manipulace při přechodu mezi souřadnými soustavami spojenými s různými pozorovateli: tyto transformace uskutečňujeme pomocí násobení čtyřvektoru maticí, která je vždy stejná pro všechny čtyřvektory. Například, jsou-li pozorovatelé A a B navzájem pootočeni o úhel α kolem osy z, pro libovolný čtyřvektor U platí UA = Λ.UB, kde UA a UB jsou vyjádření vektoru U v souřadnicích pozorovatelů A a B a



Podobně, pohybuje-li se B vůči A rychlostí v proti směru osy x, platí totéž s jinou Λ, konkrétně



kde β = v/c.

Jak je vidět, třetí a čtvrtá složka se nemění (pohybují-li se pozorovatelé vzájemně ve směru první osy). Poněvadž pro ilustraci tachyonových paradoxů nepotřebujeme ani pohyby ve směru zbývajících os, ani prostorové rotace, je neustálé vypisování třetí a čtvrté složky čtyřvektorů zvytečnou námahou. Vystačíme si s prvními dvěma složkami čtyřvektorů a budu psát zkráceně X = (t,x) a P = (E,p). Taktéž je nepohodlné stále myslet na rychlost světla c: můžeme měřit vzdálenosti ve světelných sekundách, což znamená c = 1. Transformační matice mezi pozorovateli pohybujícími se vzájemně rychlostí v bude [2]



Jakákoli transformace zachovává normu čtyřvektoru definovanou jako rozdíl kvadrátů jeho časové a prostorové složky [*]. Normu čtyřvektoru U značíme U2. Její zachování v transformacích znamená, že ať ji vyčíslíme v jakékoli souřadné soustavě, vyjde stejně. Pro některé čtyřvektory má tato norma své speciální jméno. Například je-li ΔX rozdíl polohových vektorů dvou událostí, jeho norma je Δs2 = Δt2 - Δx2 a odmocnina z ní, Δs, se nazývá prostoročasový interval mezi těmito dvěma událostmi.

Transformační matice obsahuje odmocninu z 1 - v2. Pro v > 1 by tato odmocnina byla imaginární číslo a transformované vektory by měly imaginární složky. Naštěstí tento problém nemusíme řešit: Vzájemná rychlost pozorovatelů v musí vždy být nižší než 1 (což je, v našich jednotkách, rychlost světla). To platí, i pokud tachyony existují — pozorovatelé se neskládají z tachyonů. Aby bylo jasné, že pozorovatelé nemohou nikdy dosáhnout rychlosti světla, musíme se podívat blíže na kinematiku částic.

Zásadní roli hraje čtyřhybnost P. Její složky E a p mají interpretaci energie a hybnosti částice popisované vektorem P. Rychlost takové částice je rovna p/E. (Tyto skutečnosti je možno „odvodit“, věnuje-li se tomu dostatek času. Zde je uvádím jako fakta.) Je-li P konstantní, platí pro částici x = pt/E + x0, což definuje přímku v prostoročase (přímkám a jiným křivkám vytnutým pohybujícími se částicemi v prostoročase se říká světočáry).

Částice stojící v klidu má čtyřhybnost P = (m,0). Kladná konstanta m je její tzv. klidová hmotnost. Kvadrát klidové hmotnosti je vždy roven P2, což fixuje vztah mezi hybností a energií (nazývaný často disperzní relací): E2 = p2 + m2. Zkusme uvážit, co by se stalo, kdybychom částici chtěli urychlit na rychlost světla a případně vyšší. Především, kvadrát rychlosti částice by byl roven p2/E2 = p2 / (p2 + m2) = 1 a tato rovnice nemá řešení pro konečné hodnoty p. Zrychlení na rychlost světla tak znamená dodat částici nekonečně velký impuls a nekonečně velkou energii. Jiný způsob, jak nahlédnout nemožnost dosažení rychlosti světla je uvědomit si, že z hlediska částice samotné se světlo pohybuje vždy stejně rychle; jakkoli částici zrychlujeme, z jejího pohledu je rychlost světla pořád stejně daleko. Pokud je lokální zrychlení částice z pohledu inerciální soustavy, vůči níž je tato částice v klidu [*], omezené, zrychlení měřené statickým pozorovatelem se bude asymtoticky blížit k nule, jak se rychlost bude blížit k světelné hranici. Naopak, jakákoli trajektorie, která z pohledu statického pozorovatele překročí rychlost světla, implikuje nekonečné lokální zrychlení.

Čtyřhybnost má svůj význam i pro dynamiku, vtělený do zákona zachování čtyřhybnosti, sjednocujícího zachování energie a hybnosti. Srazí-li se například dvě částice, součet jejich čtyřhybností před srážkou musí být roven součtu čtyřhybností po srážce. Taktéž pokud se částice rozpadá, musí součet čtyřhybností rozpadových produktů být roven původní čtyřhybnosti. Těchto faktů využijeme při analýze tachyonových paradoxů.

Druhy částic
Lze-li částici dostat do klidového stavu, tedy P = (m,0) s nějakou hodnotou m, disperzní relace zajišťuje, že z pohledu jakéhokoli pozorovatele je energie větší než absolutní hodnota hybnosti. Mohou ale existovat částice popsané čtyřhybností, které do podobného stavu dostat nelze? Základní principy teorie relativity existenci takových částic nevylučují; pouze implikují, že tyto částice nelze dostat do klidového stavu. Z pohledu relativistické kinematiky lze možné částice rozdělit do šesti navzájem disjunktních kategorií podle vztahu mezi hybností a energií.

  1. |p|<|E|, E>0. Toto jsou částice, pro které vždy existuje souřadná soustava, vůči níž jsou v klidu, a v níž má čtyřhybnost tvar P = (m,0). Spadá sem většina známých částic. V kontextu debat o tachyonech se jim říká bradyony (řec. βραδύς = „pomalý“ vs. ταχύς „rychlý“).
  2. |p|<|E|, E<0. I zde existuje soustava, vůči které je daná částice v klidu, ale její energie je záporná (a zůstává záporná v každé souřadné soustavě). Částice tohoto typu v přírodě nejsou pozorovány. [3]
  3. |p|=|E|, E>0. Částice se stejnou velikostí hybnosti a energie se pohybují rychlostí světla a jejich klidová hmotnost, odmocnina z P2, je nulová; proto se těmto částicím říká nehmotné. Jedinou známou nehmotnou částicí je foton [*]. Nehmotné částice nelze uvést do klidu, pohybují se rychlostí světla vůči jakémukoli pozorovateli.
  4. |p|=|E|, E<0. Vztah této kategorie k předchozí je stejný jako u kategorií 1 a 2. Nepozorováno.
  5. |p|>|E|. Tachyony, popis podrobněji níže.
  6. P=(0,0). Pro úplnost uvádím i nulovou čtyřhybnost, která je kategorií sama pro sebe. „Částice“ s nulovou čtyřhybností by měla tuto čtyřhybnost vzhledem k jakémukoli pozorovateli, při srážkách s jinými objekty by jim pak předala nulový impuls, což by se na jejich drahách nijak neprojevilo. Díky tomu je taková „částice“ naprosto nedetekovatelná. Zpravidla se P=(0,0) přiřazuje absenci jakýchkoli částic, tedy vakuu.



Vlastnosti tachyonů
Tachyony mají řadu vlastností, které se vzpírají intuici. Mnohdy se tyto vlastnosti uvádějí jako argumenty proti existenci tachyonů, ale jak se mnohokrát v historii fyziky ukázalo, konflikt s intuicí není příliš silný argument proti existenci přírodního jevu. Navzdory svým podivným vlastnostem existence tachyonů není v logickém sporu se speciální relativitou. Podívejme se na některé podivné vlastnosti tachyonů blíže.

Často se uvádí, že tachyony mají imaginární klidovou hmotnost. Definujeme-li klidovou hmotnost jako odmocninu z P2, pak je tomu tak, poněvadž pro tachyon je P2 záporné. Ačkoli to vypadá divně (je problematické si vůbec představit, co znamená, že částice má imaginární hmotnost), není na tomto faktu vůbec nic paradoxního. Podstatné samozřejmě je, že tachyony nikdy nejsou v klidu; „klidová hmotnost tachyonu“ je pouze poněkud nevhodné rozšíření pojmu původně smysluplně definovaného pro hmotné částice (tj. ze skupin 1 a 2 výše uvedené klasifikace). P2 má samozřejmě i u tachyonů stejnou hodnotu pro všechny pozorovatele, díky čemuž tuto veličinu lze užít pro klasifikaci tachyonů (je-li jich více druhů). Pokud nám to vyhovuje, můžeme získané záporné číslo odmocnit, říkat mu „klidová hmotnost“ a připisovat k jeho tabulkové hodnotě imaginární jednotu. To však nemění nic na tom, že žádná měřitelná veličina související s tachyony není imaginární.

Stejně tak jako normální částice nemohou být urychleny přes rychlost světla, jenžto by to vyžadovalo nekonečné zrychlení, z podobných důvodů nemohou ani tachyony být zpomaleny pod rychlost světla. Velmi podivná je věc z pohledu energie: absolutní hodnota energie roste s tím, jak se rychlost tachyonu přibližuje světelné hranici. Tato energie ale může být kladná i záporná. To na první pohled představuje problém pro stabilitu systémů obsahujících tachyony. U hmotných částic ta nejlehčí musí nutně být stabilní z kinematických důvodů; součet klidových hmotností rozpadových produktů musí být menší než klidová hmotnost rozpadlé částice, aby bylo možno vůbec splnit zachování čtyřhybnosti. Toto omezení ale funguje pouze díky tomu, že jsme omezeni na kladné energie; jelikož to u tachyonů není pravda, částice by se mohly rozpadat částečně na tachyony se zápornou energií a tak se „zadarmo“ bez ustání urychlovat. Jako ilustraci uvažme situaci, kdy máme bradyon X s hmotností 1 a tachyon Y s P2 = -2. Co se kinematiky týče, X se může beztrestně rozpadnout na X a Y (rozpadovým produktem je tedy stejný druh částice, jako je ta, co se rozpadá!), třeba takto: počáteční PX = (1,0), koncové PX = (2,√3) a PT = (-1,-√3). Koncové X se ale může znovu rozpadnout na X a T, tentokrát s PX = (7,4√3) a PT = (-5,-3√3). Samozřejmě i poté může výsledné X nadále emitovat tachyon a dále si zyšovat svou energii. To sice není nic proti zákonům logiky, ale až příliš to připomíná perpetuum mobile. Energie je sice zachovávána, ale za cenu vytváření dalších a dalších záporně energentických tachyonů.

Abychom pochopili blíže oč se jedná, musíme si uvědomit další podivnost interakce tachyonů s bradyony: vyzáření a pohlcení tachyonu jsou fundamentálně nerozlišitelné jevy. Jako modelový případ uvažujme pro změnu existenci tří typů částic: bradyonů R a S a tachyonu T. R a S mají klidové hmotnosti 1 a 0,45, T má P2 = -0,2975. Nechť se R v klidu (tj. ze stavu PR = (1,0)) rozpadne na T a S. Dostaneme

  • PS = (0,75 , -0,6), pohybuje se rychlostí vS = -0,8
  • PT = (0,25 , 0,6), vT = 2,4

Vidíme tedy částici R, která se náhle rozpadne na dvě částice, vlevo odletí lehce podsvětelnou rychlostí S, doprava pak vyletí nadsvětelnou rychlostí T.



(Na diagramu je tlustě vykreslena světočára částice R, plně S a přerušovaně tachyon T.)

Přejděme ovšem do soustavy jiného pozorovatele, který se pohybuje ve směru letu tachyonu rychlostí 0,8. Transformační matice je



a výsledné čtyřhybnosti vyjdou

  • PR = (1,666 , -1,333), vT = -0,8
  • PS = (2,05 , -2), vT = -0,976
  • PT = (-0,38333 , 0,666), vT = -1,739

Znaménko hybnosti tachyonu je v tuto chvíli opačné oproti znaménku rychlosti. To je sice divné, ale v principu to ničemu nevadí [4]. Ovšem pokud si vykreslíme prostoročasový diagram procesu, vidíme oproti prvnímu pozorovateli odlišný proces:



Namísto rozpadu vidíme zprava přilétající dvojici částic R a T. V určitém momentu tachyon dožene pomalejší R a pohltí se v něm, a dále pokračuje S.

Obě dvě situace — rozpad s vylétajícím tachyonem na jedné straně a pohlcení tachyonu na druhé — musí přitom být pouze různé pohledy na jeden a tentýž proces. Jestliže se nějaká částice může rozpadat se vznikem tachyonu, musí též být schopna stejný druh tachyonu pohltit, neboť rozlišení mezi rozpadem a pohlcením není absolutní. To vrhá nové světlo na první diskutovaný modelový příklad, kdy se částice neomezeně zrychlovala vyzařováním tachyonů: je zřejmé, že z polohy jiného pozorovatele toto zrychlování probíhalo pohlcováním přilétávajících tachyonů spíše než jejich vyzařováním. Naše představy o vyzařování a pohlcování částic se ovšem zásadně liší. Pokud se částice může rozpadat, rozpadá se s určitou rychlostí (charakterizovanou třeba poločasem rozpadu) nezávisle na stavu okolního světa [*]. Naopak, aby mohla nějaká částice být pohlcena, musí předem existovat někde v okolí a obě částice do sebe musí „narazit“. Pravděpodobnost pohlcení částice tak závisí velmi silně na vlastnostech okolního prostředí, zejména na množství přilétávajících pohltitelných částic. U procesů s tachyony jsou ale pohlcování a vyzařování totéž, což zavání paradoxem. Dostáváme se tak k principu kauzality.

Princip kauzality
Princip kauzality říká, že události mají příčinu ve své minulosti. Když přijde na upřesnění, mohou se tím myslet vcelku různé věci. Proto, spíš než abych se snažil zformulovat jednoznačný a přesně definovaný princip, uvedu několik kritérií, které intuitivně pojatá kauzalita splňuje (bez nároku na úplnost).

  1. Pokud jsou jevy systematicky korelovány, znamená to, že první je příčinou druhého, druhý prvního, nebo oba jsou důsledkem společné příčiny.
  2. Příčina jevu vždy leží v jeho minulosti.
  3. Je-li jev A příčina jevu B, pak pro pravděpodobnosti platí p(B|A) > p(B|¬A)
  4. Pokud A a B jsou opakovatelné jevy, předchází-li A v čase B, a platí-li, že p(B|A) > p(B|¬A) za jakýchkoli okolností, pak A je příčina B.
  5. Je-li A příčina C, při dostatečně přesném pohledu lze vždy najít jev B takový, že A je příčinou B a B je příčinou C.
  6. Nastane-li jev C v čase tC, pak pro jakýkoli čas tB < tC lze najít množinu jevů Bi nastavších v čase tB takovou, že tvoří úplný soubor příčin jevu C; to znamená, že pro jakýkoli jev A nastavší c čase tA < tB platí p(C|Bi) = p(C|Bi∧A).
  7. Kauzalita je absolutní, nezávisí na tom, z jakého pohledu se na ni díváme.

[5].

Před objevem teorie relativity nebyl vážný důvod zpochybňovat jakoukoli z těchto vlastností kauzality. Po jejím objevu vznikl problém: pokud je prostorová vzdálenost událostí větší, než jejich časová vzdálenost (říkáme, že interval mezi událostmi je prostorupodobný), pak jejich časové pořadí není absolutní, ale liší se z pohledu různých pozorovatelů. Pokud by dvě takové události byly korelovány za všech okolností, nemáme možnost zároveň splnit body (1), (2), (4) a (7). Podle bodů (1) a (4) je jasné, že první událost je příčinou té druhé nebo naopak, podle (2) je ta dřívější příčinou, ale protože se různí pozorovatelé neshodnou na časovém pořadí událostí, neshodnou se ani tom, co je příčina a co je důsledek, a to je ve sporu s bodem (7). Proto se standardně teorie relativity dovybavuje postulátem, že nemohou existovat fyzikální procesy, které by systematicky korelovaly prostorupodobné události. Jelikož tachyony jsou takové procesy (jednotlivé body na trajektorii jejich letu jsou navzájem prostorupodobně vzdálené), nemohou tachyony existovat.

Všechny požadavky na kauzalitu zní sice intuitivně správně, ale prokáže-li se, že tachyony přesto existují, bude nutné buď zahodit teorii relativity, nebo zahodit některý z požadavků. Teorie relativity je velmi dobře experimentálně testovaná. Výše uvedené požadavky se naopak jeví jen jako soubor omezení pro definici významu slov „kauzalita“, „příčina“ a „důsledek“. Pokud existují tachyony, nelze tato slova konsistentně definovat tak, aby všechny požadavky byly splněny. Chce se říct: No a co? Co se stane, když upustíme od požadavku (7) a budeme mít na paměti, že v některých případech může být rozlišení příčiny a následku relativní, nebo od požadavku (2) a budeme mluvit o příčinách ležících v budoucnosti svých následků, nebo (1) a připustíme systematické korelace mezi jevy, mezi nimiž nebude žádná kauzální souvislost? Slova si můžeme definovat jak chceme a naše neschopnost konsistentně sladit intuitivní požadavky na definici určitého pojmu s pozorovanými zákonitostmi přírody neznamená, že ve vesmíru dochází k paradoxům. Abychom mohli argumentovat, že princip kauzality je ve sporu s existencí tachyonů, musí princip kauzality být něčím víc, než pouze definicí několika slov. Musí být představou o tom, jak skutečně funguje příroda, formulovatelnou s užitím pojmů zavedených bez odkazu na tento princip. Existuje taková představa? Mám za to, že ano: jedná se o několik předpokladů, které jsou implicitně obsaženy v idealizovaném pojetí fyzikálních pokusů (a samozřejmě i v širším pojetí fungování světa; zformuluji tyto předpoklady fyzikálním jazykem, protože je to tak jednodušší, a protože se to hodí do kontextu debaty o tachyonech, nikoli protože by to nešlo obecněji):

  1. Každý fundamentální fyzikální zákon lze zkoumat na izolovaném systému. Izolovanost znamená, že systém po dobu pokusu nepřijímá informace z okolí, tj. výsledky měření nezávisí na stavu objektů ležících mimo systém.
  2. Izolovaný systém lze připravit do libovolného logicky přípustného stavu.
  3. Experiment spočívá v přípravě fyzikálního systému do určitého počátečního stavu a následného měření.
  4. Počáteční stav je úplným souborem příčin všech pozdějších výsledků měření (až do dalšího zásahu experimentátora).
  5. Zásahy experimentátora ovlivňují budoucnost, nikoli ale minulost.
  6. Cílem experimentu je zjistit, jak výsledky měření závisí na počátečním stavu.

Vyslovivše tyto předpoklady, nemáme příliš velkou obtíž nahlédnout, jak konkrétně jsou v rozporu s existencí tachyonů: popsaný ideální experiment je co do svého pojetí velmi nesymetrický vzhledem ke směru běhu času. Kritické jsou zejména body (II) a (V). Předpoklad (II) neznamená nutně, že experimentátor-pozorovatel má plnou kontrolu nad systémem (při popisu kvantových jevů má příprava experimentu povahu měření, jehož výsledek experimentátor nemůže plně zaručit). Znamená ale pořád existenci určitého druhu kontroly — i u kvantového experimentu se pozorovatel může rozhodnout, zda bude měřit nebo nikoli. Toto rozhodnutí, dle předpokladu (V), ovlivňuje události v budoucnu, ale nemůže retroaktivně ovlivnit minulost. Připravíme-li počáteční stav obsahující tachyony — nebo částice, které se mohou tachyony vyzařovat či se na ně rozpadat — ovlivníme tím pravděpodobnost jistých událostí v minulosti.

Aby bylo zřejmé, že paradoxnost nelze vyřešit pouhým vypuštěním bodu (V), uvažme klasický myšlenkový experiment, tachyonový antitelefon. V tomto experimentu si dva pozorovatelé, A a B, navzájem posílají signály pomocí tachyonů. Na počátku se oba dohodnou, že A se v náhodný moment rozhodne, že vyšle tachyon směrem k B. Jakmile B detekuje tachyonový signál, vyšle na oplátku tachyon směrem k A. Z diskuse provedené výše vyplynulo, že je-li možné vyslat tachyon, musí být možné ho vyslat do minulosti. Pokud A vyšle tachyon do minulosti a stejně učiní B po obdržení signálu, přijde odpověď k A dříve, než vyslal otázku. Aby byl paradox evidentnější, představme si, že na začátku experimentu se A rozhodne vyslat signál směrem k B v určený čas právě tehdy když předtím sám žádný signál neobdrží, a B slíbí odpovědět jakmile k němu signál dojde. To ale znamená, že pokud A žádný signál nevyšle, B žádný neobdrží a nepřepošle zpět, tudíž A signál vyšle. Naopak, pokud A signál ve sjednaný čas vyšle, B jej přepošle, což znamená, že A před sjednaným časem signál obdržel a žádný nevyšle.

Pokud si myslíte, že situaci lze vyřešit zákazem vysílat tachyony cestující zpět v čase, uvažte situaci, kdy se A a B od sebe vzdalují dostatečnou rychlostí, například v = 0,8 od počátku souřadnic [*], každý opačným směrem. Každý nechť má u sebe zářič emitující tachyony o rychlosti 2,4 směrem do budoucnosti. Tato rychlost je samozřejmě měřena vždy v soustavě pozorovatele držícího zářič emitující tachyony. Z pohledu počátku souřadnic se v takovém případě budou oba tachyony pohybovat do minulosti (výpočet pro tyto rychlosti již máme připravený výše) a A proto dostane odpověď dříve, než odešle otázku.

Jediné řešení tohoto paradoxu, které je v souladu s teorií relativity, je zavrhnout schopnost experimentátorů v libovolný moment, dle svého rozhodnutí, vyslat tachyonový signál. Máme docela dobře otestované, že experimentátoři mají vcelku dobrou schopnost dle svého rozhodnutí manipulovat s bradyonovou hmotou. Uvažujeme-li však detailněji o technickém provedení antitelefonu, ukazuje se, že schopnost operovat s bradyony k jeho konstrukci nemusí postačovat:

Nejjednodušší nápad, jak prakticky realizovat antitelefon, je vzít zářič sestávající z částic rozpadajících se na tachyony, a zavřít ho do obalu, který tachyonové záření pohlcuje. V okamžiku, kdybychom chtěli vyslat signál, otevřeme dvířka a uvolníme cestu záření. Komplikace je v tom, že hmota, která pohlcuje tachyony, zároveň musí tachyony i vyzařovat. Obal zachycující tachyony bude tedy sám vyzařovat tachyony, což činí jejich kontrolované vysílání problematickým. Podobné obtíže nás čekají při konstrukci detektoru: má-li být detektor schopen tachyony pohlcovat, bude je nutně i vyzařovat [6].

Nebudeme-li trvat na schopnosti experimentátorů s tachyony libovolně manipulovat, jejich existence (tachyonů, nikoli pozorovatelů) nakonec nemusí být vůbec paradoxní.

Závěr
Uvedené argumenty samozřejmě nepokrývají všechny problémy s tachyony. Ignoroval jsem jak otázku termodynamiky a energetické stability systémů obsahujících čstice se zápornou energií, tak i fakt, že pokud platí velmi základní předpoklady o povaze kvantové teorie elementárních částic, musí tachyon být částice skalární, to jest s nulovým spinem (což by nevadilo samo o sobě, ale vylučuje to jednoduché prohlášení neutrin za tachyony, poněvadž neutrina mají spin roven 1/2). Všechny popsané scénáře byly založeny na předpokladu, že tachyony existují a zároveň platí speciální relativita. I když bych osobně vsadil víc na relativitu než na princip kauzality, nelze vyloučit, že Lorentzova symetrie prostoročasu je narušena a tachyonové paradoxy tak lze vyřešit bez rozporování představ o kauzalitě. Zcela jsem potom ignoroval fakta svědčící o podsvětelné rychlosti neutrin, specielně detekce kosmických neutrin pocházejících z explozí supernov. Ale, jak již bylo řečeno na začátku, hovořit o existenci tachyonů lze dnes pouze na úrovni spekulací. Až kdyby další měření potvrdila nadsvětelnou anomálii, mělo by cenu se tachyony zabývat hlouběji.


Poznámky:
1. Je třeba každopádně podpořit rozhodnutí výsledek publikovat navzdory podezření, že je pouze odrazem experimentální chyby. Selektivní publikování pouze snadno obhajitelných výsledků, vede k tzv. publikačnímu biasu. Většinou se projevuje tím, že nejsou publikována negativní zjištění, protože nejsou zajímavá; zde spíše hrozilo, že k publikování nedojde, protože je zjištění příliš neuvěřitelné. V obou případech jde ale o užití rozdílných kritérií pro posuzování různých publikací, což zkresluje jejich výpovědní hodnotu.
2. Transformace mezi pozorovateli vzájemně se pohybujícími nenulovou rychlostí se nazývají vlastní Lorentzovy transformace nebo také (z angličtiny) boosty. Chceme-li zdůraznit analogii mezi boosty a prostorovými rotacemi, pomůže zavedení parametru u = arctanh v zvaného rapidita. S užitím rapidity vypadá matice boostu takto



Podobnost maticí rotace v rovině



je zjevná.
3. Specielně v kontextu teorie pole se někdy o antičásticích mluví jako o částicích se zápornou energií pohybujících se proti směru času. Tato interpretace vzniká z toho, že polní rovnice pohybu je de facto přepsaná disperzní relace E2 = p2 + m2, která má řešení jak pro kladné, tak pro záporné hodnoty E. Poté se zpravidla provádí reinterpretace, ve které se nikoli E, ale -E bere za energii. Díváme-li se na jakýkoli druh částic izolovaně, je volba znaménka nulté složky jejich čtyřhybnosti čistě věcí konvence; uvažujeme-li interakci různého druhu části, experimentální data vynucují stejné znaménko u všech druhů částic, chceme-li, aby se čtyřhybnost zachovávala. (Zapojíme-li termodynamické úvahy, objeví se i požadavek na existenci nejnižší dosažitelné energie z důvodu stability systému, z hlediska mechaniky je to irelevantní.)
4. Tachyon se z hlediska jednoho z dvou vyšetřovaných pozorovatelů „pohybuje proti směru času“, a to v následujícím smyslu: Pokud není tachyon elementární částice a probíhají v něm nějaké fyzikální procesy, pomocí kterých lze měřit čas (tachyon má vnitřní hodiny), pak první a druhý pozorovatel uvidí tyto vnitřní procesy v navzájem opačném smyslu; jeden z nich uvidí tachyonické hodiny jít pozpátku. Který z pozorovatelů to bude je čistě záležitost toho, jak si nadefinujeme kladný směr tachyonových hodin.
5. Stručný komentář ke kritériím: (1) říká, že každá systematická korelace opakovaných jevů implikuje kauzální souvislost mezi těmito jevy. Kdybychom upustili od tohoto požadavku, nebyli bychom schopni kauzalitu vůbec rozpoznat, respektive odlišit od nekauzálních korelací. (2) a (3) jsou intuitivně jasné pořadavky. (4) říká, jak odlišit přímou kauzální souvislost od korelace způsobené společnou příčinou: je-li korelace mezi A a B výhradně důsledkem společné příčiny C, pak existují okolnosti (tehdy, kdy C nenastává), ve kterých korelace vymizí. (5) konstatuje časovou lokalitu kauzálních souvislostí: časově vzdálené příčiny nepůsobí přímo, nýbrž prostřednictvím mezidůsledků. (6) je přesnější a silnější (a případně filosoficky spornější, ačkoli ve fyzice automaticky přijímané) vyjádření téhož: jelikož jevy v čase tA zapřičiňují C pouze prostřednictvím svých pozdějších důsledků, dostatečně podrobná znalost světa v čase tB je schopna plně nahradit informaci o tom, že nastal jev A. Za povšimnutí stojí, že ani jedno z kritérií nevyžaduje determinismus.
6. Argument proti možnosti vyrobit navržený antitelefon není domyšlen do detailů. Není mi v tuto chvíli zcela zřejmé například to, zda energetické a směrové rozdělení tachyonů vyzařovaných obalem zářiče bude nutně stejné, jako rozdělení tachyonů pocházejících od zářiče.

sobota 26. listopadu 2011

Hledání tisícikorun v zásuvkách


Toto je spíš nabobtnalý diskusní příspěvek k předchozímu článku než plnohodnotný článek; do formátu diskuse by to ale bylo moc dlouhé a navíc v rámci článku je snažší psát přehledně vzorce. V debatě o pravděpodobnostech čtenář předložil zajímavý problém:

Máme [osoby] A a B a stůl s deseti zásuvkami. A schová tisícovku [do jedné zásuvky] a B označí [ne nutně stejnou] zásuvku, při shodě vyhraješ tisícovku. [Hra má] sto kol, v každém kole [se] můžeš účastnit, když zaplatíš částku xi, ale výsledky jednotlivých kol se dozvíš až na úplném konci. Máš zaručeno, že A použije ve všech kolech stejné rozdělení, stejně tak B, ale A může mít jiné rozdělení než B (ale [...] o těchto rozděleních nic nevíš a A i B nejsou navzájem domluveni). Dále máš zaručeno, že všechny volby jsou navzájem i dohromady nezávislé (tedy jak volba A proti volbě B, tak volba A v jednom kole proti volbě A v jiném, stejně tak všechny další).

Otázky jsou:

  1. Kolik je tvé xi [nejvyšší, jež jsi ochoten zaplatit] v jednotlivých kolech? Je stejné pro různá i? Pokud ne, proč?
  2. Pokud by namísto výplaty za každou shodu A i B byla jedna sázka (s někým uplně jiným, stejně neinformovaným/nedomluveným) taková, že vyhraješ tisícovku pouze v případě, když celkový počet shod v těch kolech bude 9,10 nebo 11, kolik by bylo tvé x pro účast v takové sázce? (FYI, pokud bych předpokládal rovnoměrné rozdělení u A i B, tak by tohle mělo být v cca 38 % případů.)



V původním komentáři je ještě třetí otázka, které ale zcela nerozumím a tak ji budu ignorovat. Druhá otázka skýtá závažný technický problém: postup, který zastávám, vede v tomto případě k výpočtu, který nejsem schopen přesně provést; najde-li se mezi čtenáři někdo s nápadem na řešení, budu mu povděčen. Aby čtenáři nebyli ochuzeni o plné řešení analogického problému, paralelně vyřeším „soft verzi“: počet zásuvek je tři namísto deseti, počet opakování je 9 namísto 100, alternativní sázka je na to, že v rámci devíti opakování dojde přesně ke třem shodám. Tato verze je analogická původní ve všech podstatných rysech a vede k výpočtům řešitelným v konečném čase.

Takže, jak na to? K řešení je třeba blíže se podívat na mechanismus hry. Máme dva „krupiéry“ A a B, kteří nezávisle na sobě volí z deseti / tří zásuvek. Bylo řečeno, že krupiéři vybírají zásuvky náhodně s nějakým rozdělením. Tato rozdělení určují relativní četnosti (frekventistické pravděpodobnosti) jednotlivých zásuvek. Rozdělení, jež užívá krupiér A, je charakterizováno deseti čísly ai (podobně bi pro krupiéra B). Dohromady budu pro stručnost zápisu mluvit o desetirozměrných vektorech a a b.

Jaké jsou tyto vektory? Úloha jasně říká, že o nich nic nevím, což lze přirozeně interpretovat tak, že žádný z vektorů nemám důvod preferovat. Bez této specifikace bych mohl spekulovat například o psychologii krupiérů, nicméně naprostá nevědomost pro mně znamená naprostou symetrii, což se projeví tím, že každé možnosti přiřadím stejnou pravděpodobnost. Ve skutečnosti samozřejmě o a a b přecijen něco vím: relativní četnosti ai musejí být kladné a jejich součet musí být roven jedné:



(obdobně pro bi). Rovnoměrné rozdělení tedy přiřadím jen těm vektorům, které splňují dané podmínky. Rozdělení bude vypadat takto:



(δ je Diracova δ-funkce, (n-1)! je normovací faktor; n je rovno 10, resp. 3). Pochopitelně stejné je to pro b.

Všimněte si, že nepředpokládám automaticky, že krupiéři užívají rovnoměrné rozdělení, nedosazuji tedy natvrdo (v původní verzi) ai = 1/10. Rovnoměrné rozdělení (či obecně rozdělení s maximální Shannonovou entropií) přiřazuji svým subjektivním pravděpodobnostem, nejsou-li k dispozici informace preferující některé z možností před jinými. Čísla ai a bi jsou ovšem pro mne externí objektivně měřitelné parametry, které indexují navzájem se vylučující hypotézy o chování krupiérů. Každé z těchto hypotéz je přiřazena pravděpodobnost p(a,b); vzájemná nezávislost krupiérů implikuje



p(a) a p(b) jsou definované výše.

Samozřejmě, čísla ai mají blízký vztah k subjektivním pravděpodobnostem: věřím-li, že platí hypotéza a, musím též věřit, že v každé iteraci hry je pravděpodobnost nalezení tisícovky v i-tém šupleti rovna ai; tedy p(ši|a) = ai. Cokoli jiného by bylo nekonsistentní. K získání nepodmíněné pravděpodobnosti nalezení tisícovky v příslušném šupleti musím podmíněnou pravděpodobnost zintegrovat přes všechna a s vahou danou p(a). Tedy



Po dosazení vyjde p(ši) = 1/n, tedy převrácená hodnota počtu zásuvek.

K řešení první otázky potřebujeme ale zjistit jinou pravděpodobnost: tu, že se oba krupiéři shodnou. Pravděpodobnost shody na i-té zásuvce je aibi, musíme dále posčítat přes všechny zásuvky a zintegrovat přes všechna rozdělení. Tedy



Vyjde 1/n, tj. 1/10 pro původní verzi a 1/3 pro „soft“ verzi. Určit nejvyšší částku, za kterou není nevýhodné koupit právo na účast v popsané hře, je už snadné: 100, respektive 333 Kč.

Mohlo by se zdát, že jdu s kanónem na vrabce: až doposud dostávám totéž, jako kdybych přímo postuloval, že A a B sami používají rovnoměrné rozdělení. Mohl bych si ušetřit pracné integrování přes dvacetirozměrný prostor parametrů ai, bi. Při řešení druhé otázky ale postupy přestanou být ekvivalentní a postulováním ai = bi = 1/n bych nedostal hledaný výsledek. Zde potřebujeme znát, nakolik je pravděpodobné, že v sérii N her nastane shoda K krát. Pokud pravděpodobnost shody v rámci jednoho opakování hry je s, hledáme číslo



kde s = Σai bi. Tuto věc musíme přeintegrovat znovu přese všechna rozdělení, takže dostaneme



Integruje se, stejně jako ve všech předchozích případech, pouze přes kladné hodnoty ai a bi. V původní verzi navíc musíme sečíst tři členy tohoto tvaru, s K = 9, 10, 11.

Bohužel, vyčíslit výše uvedený integrál není snadné ani s použitím počítače. V zásadě by se dalo postupovat otrocky, neboť se jedná o primitivní integrál z polynomu, ovšem jeho velikost rychle narůstá s rostoucími N a n. Proto původní verzi nejsem schopen dopočítat do konce. Má někdo z čtenářů nápad na elegantní řešení, případně rozumnou aproximaci?

V lehké verzi s N = 9, K = 3, n = 3 vyjde hledaná pravděpodobnost rovna zhruba 0,054; rozumná cena za sázku na přesně tři shody tedy nepřesáhne 54 Kč. Pro srovnání, pokud bychom měli jistotu, že oba krupiéři používají rovnoměrné rozdělení, byla by pravděpodobnost výhry rovna 0,273, více než pětkrát vyšší.

A teď slibuji, že si s pravděpodobnostmi dám na nějakou dobu pokoj.

pátek 18. listopadu 2011

Pravděpodobnost pravděpodobnosti


Pod článkem, ve kterém jsem se věnoval odhadování pravděpodobnosti toho, že jistí Američané odsouzení v Íránu za špionáž sedí v base právem, říká jeden z čtenářských komentářů:

Nějakou dobu jsem přemýšlel nad touto metodou určování pravděpodobnosti závěrů a myslím, že je skutečně funkčním způsobem, jak se dobrat k správnému odhadu pravděpodobnosti. Co mi na ní ale chybí je odhad spolehlivosti. Myslím, že by bylo lépe ji rozšířit od výpočet dolního a horního odhadu. Ty bych definoval přes subjektivní odhad, že s pravděpodobností p bude hodnota uvažované pravděpodobnosti vyšší/nižší než dané číslo a horní, resp. dolní odhady bych sčítal stejným způsobem, jako teď sčítáte střední hodnoty. Myslím, že zrovna u diskutované hypotézy by musel vyjít docela slušný rozptyl (odhaduji 1:20 až 20:1).

Úvaha, která na první pohled dává smysl. Ne všechny pravděpodobnosti jsou si rovny. Na jedné straně stojí takové, jako je pravděpodobnost padnutí dvojky na férové kostce: jistá, objektivní jedna šestina. Na druhé straně stojí pofidérní odhady typu pravděpodobnosti, že jakýsi neznámý člověk je špion. Jak můžeme s objektivní jistotou odhadnout něco takového?

A co říká druhý pohled?

Pojmy se nezavádějí a přesvědčení se nepřijímají pro ozdobu. Pravděpodobnosti nejsou výjimkou. K čemu je vlastně potřebujeme? Především, k rozhodování. Přikládám-li vítězství Bohemky nad Slavií pravděpodobnost 0,4, znamená to pro mě, že bych neměl vsadit na Bohemku tisícikorunu proti tisícikoruně, protože takový čin znamená očekávanou ztrátu 200 Kč. Očekávanou ztrátu dostanu tak, že přenásobím pravděpodobnost vítězství Bohemky ziskem z této události (v takovém případě vyhraji 1 000 Kč, po přenásobení zbydou čtyři stovky) a odečtu ztrátu z alternativní možnost, tj. nevýhry [*] Bohemky (zde 0,6 x 1 000 = 600). Sázet na Bohemku za těchto okolností je hloupé.

Abych mohl výpočet provést, musí pravděpodobnosti být konkrétní čísla. Věta „myslím, že Bohemka vyhraje s pravděpodobností 0,4, ale stejně dobře je možné, že vyhraje s pravděpodobností 0,8“ je možná gramaticky korektní, ale očekávaný zisk z nabízené sázky z ní neodvodím.

Pravděpodobnost vyjadřuje míru jistoty. Pravděpodobnosti rovná 1 a 0 jsou absolutní jistotou; na událost s pravděpodobností 1 jsem ochoten vsadit cokoli pod jakýmkoli kursem, protože nemám sebemenší stín obav, že by k ní nedošlo. Absence sebemenšího stínu obav z omylu je vlastností fanatiků a sebevrahů; k rozumnému rozhodování nepatří. Meze platnosti skepticismu vůči absolutní jistotě nelze ovšem natahovat přespříliš. Začneme-li pochybovat i o svých mentálních stavech, musíme přířadit pravděpodobnosti svým subjektivním pravděpodobnostem (horní a dolní odhad, který požaduje citovaný komentátor, jsou jen alternativním popisem téhož) — musíme tak zacházet s výrazy p(p(X)=a)=b, kde X je nějaký výrok a p(X) je jeho pravděpodobnost. Možná si lze představit napohled smysluplnou interpretaci výroku „pravděpodobnost, že pravděpodobnost existence mimozemšťanů je 30%, je 68%“. Věta je to nepěkná, ale při troše snahy ji rozklíčujeme. Pokud ovšem výroky o pravděpodobnostech jsou samy o sobě subjektem pravděpodobností, pokud tedy přiznáváme smysl větě p(p(X)=a)=b není žádný důvod stejný smysl nepřiznat výroku p(p(p(X)=a)=b)=c nebo p(p(p(p(X)=a)=b)=c)=d; vypisovat jejich slovní podobu by ovšem bylo hříchem proti stručnosti. Ač není problém takové výroky vyslovit, je problém přiřadit jim rozumný smysl. I když odhlédneme od absence dobrého a elegantního algoritmu rozhodování, který bere v úvahu i pravděpodobnosti pravděpodobností, samotná nutnost mít nekonečnou regresi pravděpodobnostních rozdělení pro charakterizování každého jednotlivého subjektivního přesvědčení je absurdně neelegantní a nepraktická. Je tedy potřeba řadu někde utnout, a nejpřirozenější je utnout ji hned na začátku: pravděpodobnosti jsou pevné a jisté, p(p(X)=a) nemá smysl.

(Je to pragmatismus, co vynucuje tento přístup. Snadno se zapomíná, že matematika — do které pravděpodobnostní počet spadá — není ani tak moc objektivně existující řád reality, jako spíš konstruovaná idealizace popisující určité procesy, v našem případě poznávání a rozhodování. Nic člověku v principu nebrání pravděpodobnostní počet konstruovat jinak, třeba i s nekonečnou regresí pravděpodobností, je-li tedy schopen si poradit s příslušnými technickými těžkostmi, které takový přístup přináší; síla ovšem zpravidla leží v jednoduchosti.)

Jistě, co člověk, to názor. Pravděpodobnosti tak nemohou být najednou jisté a objektivní. Chceme zachovat jistotu, musíme zahodit objektivitu. Což se občas vzpírá intuici. V tomto článku se píše o psychologickém experimentu týkajícím se pravděpodobností [*]:

Máte stůl s osmi zásuvkami. Je šance 80%, že stůl skrývá důležitý dopis. Předpokládejte, že prohledáte čtyři zásuvky a nenajdete nic. Jaká je potom šance, že stůl skrývá dopis? Jaká je šance, že ho najdete v páté zásuvce?
...
[M]noho lidí uvažovalo tak, jako kdyby „80% šance dopisu“ bylo základní vlastností nábytku, spolu s vlastnostmi jako váha, hmotnost a hustota. Mnozí mysleli, že šance, že stůl obsahuje dopis, zůstává 80% v průběhu bezúspěšného hledání. Tudíž, uvažovali, bude stále 80%, i když prohledají sedm zásuvek a nenajdou dopis žádný.

Pravděpodobnost, že stůl obsahuje dopis, ovšem není vlastností stolu; jeho vlastností je nanejvýš fakt, že dopis obsahuje (nebo nikoli). Pravděpodobnost je vlastností člověka, jenž má o stole pouze částečné informace. (Jaká je tedy pravděpodobnost, že po neúspěšném prohledání sedmi zásuvek najdete dopis v té osmé? Jestli jste neklikli na poslední odkaz, máte možnost si problém vyřešit sami.)

Jsou-li všechny pravděpodobnosti subjektivní a jisté, znamená to tedy, že není zásadního rozdílu mezi pravděpodobností, že padne na férové kostce dvojka, a pravděpodobností, že existují mimozemšťané?

V jistém smyslu ano a jistém smyslu ne. Abychom pokročili dále, je třeba rozlišit mezi dvěma druhy „pravděpodobností“.

První třída pravděpodobností jsou subjektivní pravděpodobnosti, o kterých jsem psal až doposud. Jsou to pravděpodobnosti, které určují míru víry v pravdivost daného výroku. Tyto pravděpodobnosti vstupují do výpočtu očekávaných zisků a ztrát (samozřejmě v jednotkách užitku spíše než v penězích) a určují tak rozhodnutí svých nositelů. Subjektivní pravděpodobnosti by měly být navzájem konsistentní (což vylučuje takové stavy, jako např. p(vyhraje Bohemka)=80% a p(vyhraje Slavie)=75% současně) a měly by se měnit pouze předepsaným způsobem při relevantních pozorováních. U lidí to tak pochopitelně moc dobře nefunguje, ale znovu: snažíme se najít idealizaci schopnou překonat evidentní nedokonalosti lidského uvažování, spíš než popis komplikovaných vrozených heuristik. Každopádně, jsou-li vůbec jednoznačná pravidla pro racionální určování pravděpodobností, tato pravidla berou v úvahu nikoli samotný jev, jehož se pravděpodobnosti týkají, ale pouze informace, jež o tomto jevu jsou k dispozici.

Druhá třída „pravděpodobností“ jsou relativní četnosti v rámci dlouhých (limitně nekonečných) sérií opakovaných událostí. Například procento dvojek při házení kostkou, podíl rozpadlých jader uranu za sekundu, počet lidí, kteří zemřou při autonehodě v poměru k celkové populaci... Tyto četnosti jsou objektivními vlastnostmi zkoumaných jevů (házení kostkou, rozpadu jader uranu, silničního provozu) naprosto nezávisle od dostupných informací: ať už o tom vím nebo ne, určité množství kostek se zastaví s dvojkou navrchu, určité procento jader se rozpadne, určité množství lidí nepřežije cestu vozem.

Proč vůbec dochází ke zmatení pojmů mezi oběma typy pravděpodobností? Hlavním důvodem je zřejmě fakt, že četnosti a subjektivní pravděpodobnosti jsou těsně svázané. Vezměme onu zprofanovanou kostku: relativní četnost hodů, při kterých padne dvojka, je nějaké číslo f(2); u ideální kostky házené ideálním hráčem je f(2)=1/6 a ani v reálných situacích se od této hodnoty příliš neodchyluje. Hodnota f(2) je objektivní, empiricky zjistitelné číslo, a racionální agent jistě dojde k přesvědčení, že s vysokou jistotou je rovna přibližně 1/6 — formálněji, jeho pravděpodobnostní rozdělení p(f(2)=x) bude funkce nezanedbatelně vysoká pouze v nejbližším okolí bodu x=1/6. V okamžiku, kdy takový agent dostane za úkol stanovit pravděpodobnost, že v následujícím tahu padne dvojka, bude uvažovat třeba tak:

  1. Hod nezávisí poznatelným způsobem na minulých hodech ani na dalších okolnostech.
  2. Nejlepší model kostky je tak náhodný generátor, který vrátí číslo n (od jedné do šesti) s pravděpodobností p(n,k) v k-tém hodu. Máme-li naprostou jistotu, že toto je správný model, pak p(n,k) je jedinou složkou subjektivní pravděpodobnosti toho, že v k-tém hodu padne n, a je této pravděpodobnosti přímo rovno.
  3. Nemáme důvod předpokládat, že p(n,k) závisí na k, píšeme tedy pouze p(n).
  4. Aby takový model reprodukoval dlouhodobé chování kostky, musí být p(n)=f(n).
  5. Tudíž, pravděpodobnost, že padne dvojka, je rovna dlouhodobé frekvenci padání dvojky.

Platnost závěru pochopitelně závisí na všech premisách. Kdyby například náš racionální agent získal přístup k počítačovému systému, který je schopen vyhodnotit jemné nuance pohybů kostky i toho, kdo ji hází, a dostatečně přesně spočítat, že opravdu tentokráte padne dvojka, pak by agent byl hlupák, kdyby stále počítal s p(2)=1/6. Chce-li si agent zachovat v takové situaci přízvisko „racionální“, musí svou původní šestinu nahradit pravděpodobností, že jeho počítačový systém se v tomto případě mýlí.

V reálném světě nemáme při házení kostkou k dispozici přesné detektory ani počítačové modely. V reálném světě taktéž explicitně nedělíme své úvahy do několika triviálních bodů; všech pět podúvah se mnohem spíš shrne do jediného „rozum dá, že p(n)=f(n)“. Tato úvaha je jádrem takzvaného frekventismu. Frekventismus je ovšem silnější přesvědčení, než pouhé „často je racionální pravděpodobnosti stavět rovné četnostem (tj. frekvencím)“. Frekventisté přímo pravděpodobnosti definují pomocí četností; cokoli, co není definovatelné pomocí četnosti, není pravděpodobnost. „Výhodou“ frekventismu je, že pravděpodobnost je objektivní; někteří lidé zřejmě pociťují odpor k myšlence, že by matematika mohla zkoumat něco subjektivního, a frekventismus je toho ušetří i v teorii pravděpodobnosti. Samozřejmě, i frekventisté musejí mít nástroje k měření subjektivní nejistoty, ty se zpravidla vkrádají do hry bokem pod rouškou intervalů spolehlivosti a p-hodnot. Ale o tom jsem již psal.

Každopádně, frekventismus je to, co se dnes ve školách učí (aspoň to tak bylo, když jsem do školy chodil já, a pochybuji, že by se změnilo zrovna tohle). Nese to s sebou politováníhodné zmatení: objektivní frekventistická definice pravděpodobnosti je v konfliktu s běžným užitím tohoto slova. „Jaká je pravděpodobnost, že Bohemka vyhraje“ je pro frekventistu věta postrádající smysl, nicméně pro bookmakera v Tipsportu velmi praktická a smysluplná otázka.

Intuitivní cítění, že některé pravděpodobnosti (třeba ty u hodu kostkou) jsou jistější než jiné (třeba ty v případu domnělých špionů), je svázáno s dichotomií mezi dvěma typy pravděpodobností. Když řeknu, že pravděpodobnost pádu dvojky je 1/6, může to znamenat, že jsem na dvojku ochoten vsadit v kursu 5:1, ale může to znamenat i to, že věřím, že relativní četnost dvojek v sérii tisíce hodů bude hodně blízká 1/6 (a na to budu ochoten vsadit v mnohem nevýhodnějším kursu, v závislosti na tom, jaká blízkost 1/6 zaručí výhru). Když ale řeknu, že pravděpodobnost, že zadržení Američané jsou špioni, je 1/6, přirozeně připadá v úvahu pouze první interpretace. A i kdybych měl na mysli nějaké smysluplné četnostní čtení onoho výroku, například „1/6 všech Američanů odsouzených v Íránu za špionáž jsou skutečně špioni“, bylo by hloupé v tomto případě přikládat vysokou pravděpodobnost zrovna na 1/6, nebo jakékoli jiné konkrétní číslo, aspoň tedy v absenci jednoznačných statistických dat.

pondělí 14. listopadu 2011

Pondělní šifra XXXIV.

Následující obrázek v sobě skrývá zašifrovanou tajenku, kterou může být slovo, výraz nebo věta dávající v češtině dobrý význam (může to být i vlastní jméno nebo cizí slovo, pokud je v češtině dostatečně často používáno). Způsob šifrování není předem specifikován, ale měl by být odhalitelný na základě relativně jednoduchých pozorování. V některých případech může být k rozluštění potřeba znalost Morseovy abecedy nebo Braillova písma.




Počínaje touto šifrou zveřejňuji zároveň i řešení.

Zobraz řešení

středa 9. listopadu 2011

Pascalova sázka


Jméno Blaise Pascala je dnes veřejnosti známé především jako označení jednotky tlaku, části veřejnosti pak i jako název programovacího jazyka. Je ovšem otázkou, zda by s tímto druhem slávy byl Pascal sám spokojen. Stejně jako jeho slavnější kolega Isaac Newton, i Pascal byl zaníceným křesťanem, a v posledních letech svého života, poté, co prožil náboženskou vizi, považoval teologické otázky za důležitější než světské problémy matematiky a fyziky. Mluvíme-li u Pascala o posledních letech života, netřeba si představovat senilního starce: když v roce 1669 umíral, bylo mu pouhých třicet devět let.

Dá-li se génius Pascalova střihu na teologii, nedá se čekat, že bude plně ortodoxním pokračovatelem tradic. A skutečně, Pascal sympatizoval se sektou jansenistů, kteří se sice považovali za dobré katolíky, ale přesto se nevyhnuli oficiálnímu papežskému zatracení. Pascalovy výlety do říše teologie ale nejsou pouze odrazem sporů mezi jansenisty a Vatikánem (kterýžto spor se týkal zejména schopnosti člověka ovlivnit svoji spásu) — Pascal má na svém štítě přinejmenším i jeden netradiční fundamentální argument; fundamentální proto, že se týká samotného opodstatnění víry. Jsa nespokojen s neprůhlednými scholastickými sofismaty dokazujícími existenci boha pomocí principů kauzality nebo hierarchie hodnot, sestavil Pascal prostou úvahu:

„Můžete ztratit dvě věci: pravdu a dobro, a dvě věci musíte vsadit: svůj rozum a vůli, své znalosti a své štěstí; a vaše přirozenost se straní dvou věcí: chyby a bídy. Váš rozum není více raněn volbou jednoho než volbou druhého, poněvadž je třeba volit. Toť prázdný úhel pohledu. Ale co vaše štěstí? Važme zisky a ztráty, v sázce na to, že Bůh je. Uvažme obě možnosti: pokud vyhrajete, získáte všechno, pokud prohrajete, neztratíte nic. Vsaďte tedy na to, že je, bez váhání.“ (citace z Pascalových Myšlenek (Pensées), převzato z Wikipedie, vlastní překlad)

Ziskem všeho Pascal myslí fakt, že pokud bůh existuje a člověk v něho věří, přijde do nebe. Pokud ovšem bůh neexistuje, víra nemá žádné negativní následky (Pascal zastával názor, že má následky pozitivní, protože se člověk chová morálněji, ale na účinnost argumentu nemá platnost tohoto názoru zásadnější vliv). Naopak, pokud člověk vsadí na neexistenci a zmýlí se, bude se na věčnost smažit v pekle, což není zrovna příjemná vyhlídka.

Moderní strukturovaná forma argumentu může vypadat třeba takto

  1. Člověk musí rozhodnou, zda bude v boha věřit nebo nikoli. (předpoklad, agnosticismus je z hlediska argumentu považován za nevíru)
  2. Víra v boha znamená místo v nebi na dobu neurčitou jestliže bůh existuje, plus nějaké dále nespecifikované výhody nebo nevýhody víry v pozemském životě (označme X) bez ohledu na to, zda bůh existuje. (předpoklad, zjevné)
  3. Nevíra znamená místo v pekle na dobu neurčitou jestliže bůh existuje, plus další výhody nebo nevýhody nevíry ve světském životě (Y) bez ohledu na existenci boha. (předpoklad, zjevné)
  4. Nechť pravděpodobnost existence boha je p a užitek z různých variant označme písmenem u. Očekávaný užitek z víry je u(X) + p.u(nebe), užitek z nevíry je u(Y) + p.u(peklo). (definice symbolů)
  5. Užitek z pobytu v určitém místě je přímo úměrný době strávené v onom místě. Jelikož je pobyt v nebi či pekle dle předpokladů 2 a 3 na věčnost a protože jakkýkoli konečně dlouhý pobyt v nebi je příjemný (kladný užitek) zatímco pobyt v pekle je nepříjemný (záporný užitek), je u(nebe) = ∞ a u(peklo) = -∞. (předpoklad, zní docela rozumně)
  6. Užitek z X a Y je konečný. (předpoklad, také zní věrohodně)
  7. Tudíž, užitek z víry je roven +∞ a užitek z nevíry roven -∞. (plyne z 5 a 6)
  8. Měli bychom proto věřit. (plyne z 7 a běžně uznávaných zásad rozhodování)


Když jsem Pascalův argument slyšel poprvé, nevěda o autorově silném náboženském přesvědčení, domníval jsem se, že je to parodie argumentu, beroucí si na paškál praktické fungování náboženství ve své době. Argument, že bychom něčemu měli věřit, ne protože je to pravda, ale protože se to vyplatí, by člověk dnes z úst věřícího nečekal. Sázet si na existenci boha, to zní jako kupčení se svátostí, morálně stojící někde na úrovni prodeje odpustků. Náboženství, které striktně odsuzuje hazard, že by zakládalo svou důvěryhodnost na úvaze hodné gamblera? Jistě, prakticky to možné je (stejně jako byly prakticky možné odpustky), bývalo ale zvykem aspoň předstírat vyšší míru idealismu.

Na druhou stranu, když se přeneseme přes „morální šok“ plynoucí z asociace boha a sázek, přízemnost Pascalova argumentu z něj činí jeden z nejracionálnějších „důkazů“ boží existence, co byly kdy vynalezeny (znamená-li „důkaz“ jakoukoli myšlenkovou konstrukci, která člověka přiměje věřit v danou věc). Vzhledem k pokleslé úrovni celého žánru apologetiky to není příliš silný kompliment — a určitě tím nechci říct, že je Pascalův argument správně. Je ovšem alespoň natolik zajímavý, že šťourání se v důvodech jeho nesprávnosti může být inspirativní. Ačkoli totiž zdravý rozum jasně říká, že sázet na existenci boha kvůli Pascalovu zdůvodnění je hloupost, není tak snadné říct, proč je to hloupost. Protiargumentů je řada, každý útočí na jinou slabinu Pascalovy sázky přinášeje s sebou své vlastní slabiny. Podívejme se na některé z nich.

Prvním protiargument může znít: Víra není vědomé rozhodnutí. Když mi šílený sponzor nabídne sto tisíc korun za to, že uvěřím v červenou barvu Neptuna, jistě by se mi vyplatilo uvěřit. Je velmi nepravděpodobné, že kdy ztratím větší částku kvůli nesprávnému přesvědčení o barvě Neptuna, a škoda na osobní pověsti plynoucí z věřejně proneseného výroku „Neptun má sytě rudou barvu čínské vlajky“ není nijak nenapravitelná. Přesto, i když by to bylo v mém zájmu, nemohu uvěřit, že Neptun je červený. O takové věci mě může přesvědčit červená fotografie Neptuna spolu se sakra dobrým vysvětlením toho, proč všechny dříve viděné obrázky planety měly barvu modrou, ale nemůže mě o téže věci přesvědčit sto tisíc korun. Samozřejmě, mohu předstírat, že Neptun je červený, stejně dobře jako mohu předstírat, že věřím v boha; zatímco ale šílený sponzor je o mé víře informován pouze skrze má slova, vždy jsem měl za to, že bůh dle předpokladu vidí do duší svých oveček a cení si upřímnosti. Ale možná se mýlím a jansenistický bůh přetvářku neprohlédne, nebo je zarytým behavioristou a při rozhodování mezi nebem a peklem ho zajímá jenom projevené chování, a už ne vnitřní duševní stavy.

Kupodivu, na uvedený argument se moc často nenarazí. Zřejmě to souvisí s tradicí existující v rámci většiny odnoží velkých monoteismů, že víra je aktem vědomého rozhodnutí. Vždy mě udivuje, když lidé mluví o „rozhodnutí“ nebo „snaze uvěřit“ — jsou to zřejmě akty vyžadující autosugesci na úrovni, které nejsem schopen. Pascalovu sázku lze odmítnout jako běžné argumentum ad consequentiam; tím bychom ovšem ponechali specifika Pascalova argumentu stranou, a to by byla škoda.

Abych se s klidným svědomím přenesl přes právě sepsaný protiargument aniž bych musel článek v tomto bodě ukončit, budu nadále předpokládat, že bůh je skutečně behaviorista a stačí mu, když jednou týdně zajdeme na mši a nebereme jeho jméno nadarmo, a nezajímá ho, jak na to nahlížíme v soukromí svých myšlenek. Otázka tedy zní: měli bychom předstírat víru? Chceme-li zápornou odpověď, je třeba sáhnout po nějakém dalším argumentu. Dost populární je následující: Pascalův argument nespecifikuje náboženství, kterému máme věřit. Existují navzájem nekompatibilní náboženství, která si navzájem posílají věřící do pekla: když uvěříme v Hospodina a správné náboženství je přitom islám, budeme se smažit, protože jsme trávili čas ve zpovědnici a ne na modlitebním koberečku. (Tento protiargument je oslaben moderními ekumenickými tendencemi, ale moderní pojetí víry vůbec kazí radost z rozboru teologických argumentů dob minulých.)

Problém tohoto protiargumentu není, že by nefungoval. Jeho problém je, že závisí na historické náhodě, přesněji na existenci jiných náboženství slibujících věčné zatracení pro nevěřící, respektive pro věřící chybného náboženství. Považovat existenci islámu za hlavní argument proti Pascalově gambitu znamená, že kdyby islám (spolu s ostatními náboženstvími odsuzujícími nevěřící do pekla) neexistoval, museli bychom skutečně na Pascalovu radu dát. A dále, i když ostatní náboženství existují, závěr z užití popsané protiargumentace není stát se ateistou. Závěr je: přijmout to náboženství, které nabízí největší rozdíl komfortu mezi svými verzemi nebe a pekla. Islám by jistě měl šanci.

Věc můžeme trochu spravit. Pokud Pascalův argument aspiruje na obecnost, neměl by být ovlivněn tím, jaká náboženství ve světě existují a jsou vyznávána; pokud člověk skutečně věří, že rozumově nelze o existenci boha rozhodnout (což zřejmě bylo Pascalovo přesvědčení) a důvod k víře v boha spočívá ve výši očekávaného zisku, pak není důvod předpokládat, že lidé historicky dospěli ke správným faktům o povaze boha. Bylo by tak správné brát nejen existující náboženské tradice, ale i všechny další představitelné nauky o povaze boha nebo bohů. A jistě si lze představit škodolibého boha, který posílá do pekla právě a jen ty, kdo v něho věří. Agresivněji orientovaní ateističtí aktivisté by pak mohli argumentovat ve smyslu toho, že takový bůh by byl ve skutečnosti spravedlivější, než jeho tradiční protějšek.

Ačkoli je výše parafrázovaný argument standardní součástí protipascalovských filipik ateistů, stále trpí zásadními nedostatky. Podobně jako v předchozím odstavci: závěr není stát se ateistou nebo agnostikem, ale vybrat náboženství s největším rozdílem mezi „životní úrovní“ v pekle a ráji; pouze tentokrát nevybíráme pouze z náboženství už vymyšlených, nýbrž máme možnost vymýšlet si svá vlastní. Je vcelku jasné, kam takový způsob uvažování vede.

Nemyslím, že je na světě mnoho ateistů, kteří odmítají Pascalův argument kvůli obavám z výběru špatného boha. Pokud kalkulace užitků a ztrát plynoucích ze zastávání různých světonázorů hrají v odmítání víry nějakou roli, pak tu, že pokud bůh neexistuje, víra v jeho existenci má negativní důsledky. Negativní důsledky jsou sice zanedbatelně nepříjemné v porovnání s peklem, ale pravděpodobnost existence boha je tak malá, že tento rozdíl překoná. Takové uvažování může fungovat pouze tehdy, je-li rozdíl užitku mezi nebem a peklem konečný. To je v rozporu s 5. bodem Pascalova argumentu, ale možná tento bod neplatí. Třeba si člověk po nějakém čase stráveném v pekle zvykne a nebude mu to připadat tak mizerné jako na začátku...

V jednom ze starších článků jsem popsal zásadu, jak přiřazovat hypotézám apriorní pravděpodobnosti: vezmeme složitost hypotézy s(H) definovanou jako délka nejkratšího programu, který je schopný hypotézu vypsat, a hypotéze přiřadím pravděpodobnost řádu exp(-αs(H)) (konstantu α volíme tak, aby všechny navzájem se vylučující hypotézy dohromady měly pravděpodobnost 1; podstatné je, že α je stejná pro všechna H). Pascalův trik ovšem staví tuto zásadu v ohrožení, a to následujícím způsobem:

Vezměme hypotézu H(u): „pokud dnes nespláchnu stovku do záchoda, záchodové božstvo mi připraví po smrti utrpení, jehož hodnota vyjádřena pomocí užitkové funkce má hodnotu -u“ (bereme u kladné). Mám spláchnout stovku do záchoda? Racionální postup rozhodování je vzít rozdělení pravděpodobností p(H(u)) a porovnat očekávanou hodnotu škod takto vzniklých, tedy -∫ u p(H(u)) du, se škodou vzniklou vhozením stovky do záchoda. Volím pak menší zlo.

Pravděpodobnost, že H(u) je pravdivá pro jakékoli u je pochopitelně mizivá, přinejmenším tak mizivá, jak mizivá je pravděpodobnost existence záchodového božstva. Hypotéza dostává další úder pro většinu vysokých hodnot u: čím vyšší číslo, tím vyšší je jeho složitost, a tím nižší (exponenciálně) je pravděpodobnost přidružené hypotézy. Jenže — a to je hlavní problém — ne všechna obludně velká čísla jsou algoritmicky složitá. Třeba takové Grahamovo číslo G, v porovnání s kterým jsou standardní „astronomická“ čísla (jako 10100) téměř přesné nuly. Program v principu schopný vypsat Grahamovo číslo přitom zabírá pár řádek.

Pravděpodobnost existence záchodového božstva, jakkoli malá by měla být, je určitě vyšší než 1/G. (A když ne, máme k dispozici čísla, která jsou ještě mnohem vyšší než G, a přitom se srovnatelně jednoduchou definicí.) Máme tedy problém: pokud budeme hypotézám, pro které není žádných důkazů, přiřazovat apriorní pravděpodobnost závislou pouze a jen na složitosti hypotézy, staneme se obětí vyděračských hypotéz analogických H(G). Hypotéz, jejichž titěrná pravděpodobnost je vyvážena nepředstavitelně velkým (ať už kladným nebo záporným) užitkem z chování implicitně v hypotéze předepsaným. Je ovšem absurdní házet stovku do záchoda kvůli hypotetické existenci záchodového božstva, stejně jako je iracionální chodit každou neděli na mši pouze kvůli strachu z hypotetického pekla. Jak to ovšem zakomponovat do formálního rozhodování, aniž bychom zbourali základy mikroekonomie či subjektivistické teorie pravděpodobnosti, o tom příště.

úterý 18. října 2011

Doporučení pro komentátory

V znovuoživené diskusi pod tímto článkem došlo opakovaně k tomu, že filtr označil regulérní komentář za spam a přesunul ho do spamové složky. Není to první případ, a proto považuji za vhodné na toto riziko komentátory upozornit a přidat několik (nepříliš spolehlivých) rad, jak se mu vyhnout.

Pokud je komentář vyhodnocen jako spam, přesune se do složky Spam, odkud ho mohu manuálně přesunout zpět mezi regulérní komentáře. Je zde ale několik problémů:


  1. Pokud je komentář vyhodnocen jako spam okamžitě, nedostanu žádné upozornění, že k tomu došlo. Může se tak stát, že se o něm dozvím až po dlouhé době, když se podívám na obsah spamové složky. Ta je ale většinou prázdná, takže se do ní pravidelně nedívám, a po nějaké době se její obsah automaticky maže. Komentář tak může zaniknout bez povšimnutí.
  2. Může se dokonce stát, že filtr komentář smaže zcela, aniž by jej dal do spamové složky.
  3. Někdy se komentář zobrazí, ale filtr ho po určité době dodatečně vyhodnotí jako nevhodný a smaže. Za těchto okolností si autor komentáře nemusí povšimnout, že komentář zmizel. (Pokud komentář zmizí, je to vždy následkem činnosti filtru. Pokud někdy dojde k tomu, že nějaké komentáře smažu já manuálně, oznámím to v příslušné diskusi s uvedením důvodů. Zatím k něčemu takovému nikdy nedošlo.)


Spamový filtr nelze vypnout a ani pravděpodobně nastavit. Přístup Googlu jakožto provozovatele systému k této otázce je patrný zde. V zásadě je to: „skutečně si myslíme, že filtr vypínat nepotřebujete, kdyby to šlo, spameři by to zneužili, a vůbec, filtr funguje dobře, místo stížností nám radši pomožte filtr natrénovat tak, aby fungoval ještě líp“. Problém je, že na tomto blogu filtr dobře nefunguje: nepamatuji jediný případ, kdy by ve spamové složce skončil skutečný spam, a nesprávně zakázané komentáře tvoří odhadem 2% všech komentářů. (Protože ne všechny spamy končí ve spamové složce, je možné, že spousta případů prošla naprosto bez povšimnutí.) Jestli problémy tohoto rázu budou přetrvávat, uvážím převést blog jinam, což ovšem má své problémy.

Protože filtr je postaven tak, aby se mohl sám učit, je obtížné říct, jaká kritéria užívá při posouzení komentářů. Možná to nikdo pořádně neví. Přesto několik doporučení:

  • Odkazy jsou podezřelé. Jestliže vám neprojde komentář obsahující odkazy, snižte množství odkazů v poměru k množství textu.
  • Cizí jazyky jsou podezřelé. (Na Seznamu mejlový filtr žádá mně, jako odesílatele, zadávat ověřovací kód při posílání mejlů v angličtině a zcela znemožňuje poslat delší mejl ve francouzštině. Našel jsem stížnost, že Google označil jeden z finskojazyčných blogů za semeniště spamu. Předpokládám, že filtr na komentáře bude fungovat podobně.) Nemám naprosto žádné výhrady proti cizojazyčným komentářům zde, ovšem může se stát, že filtr takové výhrady mít bude.
  • Pokud vám komentář zmizí (a není to proto, že by vám mezitím spadl prohlížeč nebo jste se odhlásili z účtu nebo něco podobného), neposílejte tutéž verzi komentáře opakovaně. Filtr je konsistentní a co jednou zadržel, napodruhé také nepustí. Navíc je možné, že opakované zasílání téhož bere jako příznak spamerství. Navíc, sedm kopií jednoho komentáře ve spamové složce znamená, že buď jednu povolím a šest smažu (a šest smazaných instancí přibyde do databáze, podle které filtr rozpoznává spam), nebo musím povolit všech sedm a šest smazat manuálně v dalším kroku, což je pro mně nepohodlné. Místo opakovaného zasílání zamítnutého komentáře zkuste jinou, upravenou verzi, nebo napište zkrátka „komentář zmizel“; tím mě upozorníte na to, že mám zkontrolovat spamovou složku.
  • Krátké komentáře mají obecně větší šanci projít než dlouhé. Pro čitelnost a strukturu debaty je lepší, pokud komentátor všechny námitky shrne do jednoho delšího příspěvku, filtr ale někdy může vynucovat opak.
  • Filtr kontroluje nejen obsah komentáře, ale i odkud byl komentář odeslán. Posíláte-li komentář jako majitel účtu na Googlu, jedno filtrování proběhne už na vaší straně, a já se o ničem nemusím dozvědět. Jestli vám komentáře mizí bez zjevného důvodu, může se stát, že je váš účet považován za podezřelý (možné důvody pro podezření: dřívější komentáře vyhodnocené jako spam, podezřelé jméno účtu, prázdný vlastní blog, ...) V takovém případě může být vhodnější komentovat anonymně.