úterý 23. listopadu 2010

Testování hypotéz I.


Poslední článek, ve kterém jsem vymezil dvě interpretace pravděpodobnosti – bayesovskou a frekvenční – neobsahoval příliš informací o tom, jak se oba přístupy liší prakticky. Tento dluh částečně splatím dnes. Původně jsem chtěl nejdřív poodhalit roušku frekventistické rutiny, ale diskuse pod minulým článkem mě vedla k přehození pořadí.

Budu mluvit o statistickém testování hypotéz. Porovnávání hypotéz a teorií s pozorováním patří k základům vědecké praxe. V ideálním případě položíme vedle sebe výsledek experimentu a předpověď teorie; shodují-li se, je teorie, aspoň v příslušné části, dobře, liší-li se, můžeme teorii zahodit. Reálné teorie ale obsahují prostor pro vliv náhody, ať už následkem chyb stanovení vstupních dat (typické pro všechny vědy, kde je nutné něco měřit), nebo nedostatečných znalostí o měřeném vzorku (třeba v lékařských pokusech), či je-li náhoda přímou součástí teorie (kvantová fyzika). V takových případech ale žádný výsledek jednoznačně neurčí, zda teorie je dobře nebo špatně. Odchylka může být způsobena právě vlivem náhody. Kdybychom se ale spokojili s takovýmto tvrzením, nikdy bychom nebyli schopni říct, zda předložená teorie je dobře nebo špatně. Míra shody zjištěných faktů s teoretickou předpovědí přitom musí nějak ovlivňovat náš postoj k testované teorii.

Bayesovský přístup se vyznačuje tím, že každé teorii je přiřazena pravděpodobnost její platnosti. Porovnání experimentu s teorií pak níže popsaným postupem ovlivňuje tuto pravděpodobnost. Dobře otestované teorie mají pravděpodobnost blízkou 1, teorie vzpírající se pozorování ji mají blízkou 0. V rámci frekvenční interpretace pravděpodobnosti toto nelze činit, protože pravděpodobnost teorií nelze smysluplně interpretovat v jazyce četností. Proto jsou s frekventismem asociovány jiné metody testování (více v příštím článku), které porovnávají statistické soubory získané experimentem s teoretickou předpovědí, a teorii prohlásí za vyvrácenou, pokud odlišnost přesahuje určitou stanovenou velikost. Bayesiáni samozřejmě také mohou hovořit o vyvrácených nebo potvrzených teoriích, tato slova ale nemají striktně technický smysl, a jsou pouze zkratkou za velmi velkou, respektive velmi malou pravděpodobnost.

Osudí s kuličkami
Je dobrým zvykem různé aspekty pravděpodobnostní analýzy ilustrovat na příkladu házení kostkou nebo micní. K házení mincí se dostanu na konci dnešního článku; z jistých důvodů považuji pro začátek za vhodnější jiný příklad, a to pytel s kuličkami. Mějme pytel, ve kterém je určité množství kuliček, které jsou buď černé nebo bílé. Z důvodu jednoduchosti výpočtů je v rámci této ilustrace příjemné držet počet kuliček nízký, nechť jsou tedy kuličky třeba tři (zobecnění na libovolný počet kuliček je prosté). Máme za úkol zjistit, jaký je poměr počtu černých a bílých. Můžeme z pytle po jedné tahat kuličky (poslepu, předpokládá se, že po hmatu nelze barvu poznat, takže výběr je skutečně, na rozdíl od karlovarské praxe, náhodný). Po každém tahu ale musíme kuličku vrátit zpět do osudí (dá-li se pytel nazvat osudím) a zamíchat.

Takže, kolik kuliček je černých?

Je jasné, že popsaným způsobem se to s absolutní jistotou nikdy nedozvíme. Na druhé straně, pokud kuličku táhnu milionkrát a vytáhnu černou v 665 934 případech, je velmi pravděpodobné, že poměr černých k bílým je 2:1. Zbývá říct, jak přesně je to pravděpodobné.

Otázku na počet černých kuliček můžu dostat hned na počátku, dříve než vytáhnu první kuličku z osudí. Jedna z určujících vlastností bayesovského přístupu je to, že musím být připraven na tuto otázku odpovědět. Nemusím si samozřejmě být jist, ale musím každé v úvahu připadající odpovědi přiřadit pravděpodobnost. Frekventista v takové situaci může různě kličkovat: může například tvrdit, že dokud není k dispozici statistický soubor dat, není nic, z čeho by šlo pravděpodobnost spočítat, a otázka tak nemá smysl. Bayesián musí odněkud vytáhnout pravděpodobnosti. Tyto pravděpodobnosti se nazývají apriorní.

Odkud se berou apriorní pravděpodobnosti? Odpověď je, že odkudkoli. Z předsudků, obecných úvah, odhadů. Cynická odpověď je, že apriorní pravděpodobnosti si bayesián prostě vycucá z prstu.

Existuje samozřejmě pár osvědčených a konsensuálních způsobů, jak apriorní pravděpodobnosti z prstu konkrétně cucat. Nejpřirozenější se často jeví každé logicky přípustné hypotéze dát stejnou pravděpodobnost, nebo obecněji, v případě nekonečného množství přípustných hypotéz, užít principu maximální entropie. Jsou ovšem situace, kdy tento rovnostářský přístup selhává. Bylo by například zvláštní, kdyby porota na začátku soudního jednání apriorně přiřadila stejnou pravděpodobnost hypotézám A) otisk obžalovaného se na místo činu dostal proto, že obžalovaný na místě byl a B) otisk se tam dostal tak, že skutečný pachatel podplatil sekretářku obžalovaného, ta mu dala do kávy rohypnol, ve spánku mu pak sejmula otisk a předala jej pachateli, který ho potom za pomocí pokročilých technologií přenesl na místo činu. V podobných případech bývá zvykem aplikovat něco na způsob Occamovy břitvy, tj. dávat vyšší apriorní pravděpodobnost jednodušším hypotézám.

V našem modelovém případě připadá v úvahu pouze konečné množství srovnatelně složitých hypotéz, a to, že poměr černé:bílé je A) 3:0, B) 2:1, C) 1:2 a D) 0:3. Přiřadíme tedy každé z možností apriorní pravděpodobnost 0,25. Radši ještě jednou zdůrazním, že toto nejsou jediné správné hodnoty apriorních pravděpodobností. Můžu třeba volit

P(A) = P(D) = 0,125,
P(B) = P(C) = 0,375,

[1] nebo jakkoli jinak. Nakonec, když mi důvěryhodná osoba předem poví, že viděla, jak se do osudí kuličky dávají, a že jsou tam dvě černé, byla by blbost přikládat možnosti B stejnou pravděpodobnost jako zbylým třem [2].

Subjektivita apriorní pravděpodobnosti může na první pohled připomínat postmoderní relativismus, který si libuje v množství subjektivních "pravd" a jakýchkoli pevných pravidel se štítí jako čert kříže. První pohled je ale v tomto případě zavádějící. Jakkoli jsou totiž apriorní pravděpodobnosti libovolné, získaná statistická data na ně mají jednoznačný vliv.

Ať už jsou apriorní pravděpodobnosti jakékoli, naším úkolem je říct, jak svůj pohled na věc upravíme poté, co z osudí vytáhneme několik kuliček. Kupříkladu v okamžiku, kdy vytáhneme poprvé černou kuličku, padne hypotéza D, která tvrdí, že v osudí jsou pouze bílé kuličky. I ostatní pravděpodobnosti se změní. Každá další vytažená černá kulička zvyšuje (respektive nesnižuje [3]) pravděpodobnost možností A a B, zatímco bílé kuličky vypovídají pro konkurenční teorie C a D. S každým pozorováním - to znamená s každou kuličkou - jsme povinni aktualizovat sadu pravděpodobností.

A takhle to vypadá konkrétně:

Před prvním tahem:
Na počátku máme stav

P0(A) = P0(B) = P0(C) = P0(D) = 1/4.

(index 0 značí počet provedených tahů jejichž výsledek je v pravděpodobnosti zahrnut - to je v tuto chvíli žádný). Řekněme, že první vytažená kulička je černá. Víme, jaká je pravděpodobnost vytažení černé kuličky v případě, kdy platí jednotlivé hypotézy:

P(č|A) = 1
P(č|B) = 2/3
P(č|C) = 1/3
P(č|D) = 0

Co potřebujeme udělat, je obrátit tyto podmíněné pravděpodobnosti. Tedy ze znalosti pravděpodobnosti vytažení černé kuličky, platí-li hypotéza A, chceme získat pravděpodobnost, že platí A, když jsme vytáhli černou kuličku. Pochopitelně, použijeme Bayesův vzorec

P1(A) = P(A|č) = P(č|A)P0(A) / P0(č).

Pravděpodobnost P0(č) je celková nepodmíněná pravděpodobnost, že vytáhneme černou kuličku. Spočteme ji z podmíněných pravděpodobností

P0(č) = P(č|A)P0(A) + P(č|B)P0(B) + P(č|C)P0(C) + P(č|D)P0(D) = 1/2.


Po prvním tahu a druhý tah
Se zahrnutím všech potřebných dat vypadají aposteriorní pravděpodobnosti po vytažení jedné černé kuličky takto:

P1(A) = 1/2
P1(B) = 1/3
P1(C) = 1/6
P1(D) = 0


Je vidět, že jediný pokus pohnul s pravděpodobnostmi vcelku znatelně, ale odepsat zatím můžeme pouze hypotézu D. Takže kuličku vrátíme a táhneme znovu. Řekněme, že vyjde černá. Musíme tedy opakovat celý postup znovu, ovšem s tou změnou, že aposteriorní pravděpodobnosti z předchozího kroku budou hrát roli apriorních pravděpodobností. Odpovídajícím způsobem se také změní P(č), již je nutno přepočítat s užitím nových apriorních pravděpodobností, místo 1/2 odpovídající čistě symetrickému rozložení pravděpodobnosti mezi čenými a bílými máme v tuto chvíli P1(č) = 7/9. Po provedení celé mašinérie jsou aposteriorní pravděpodobnosti

P2(A) = 9/14
P2(B) = 4/14
P2(C) = 1/14
P2(D) = 0


Třetí tah a dál...
Nechť pro změnu ve třetím tahu vytáhneme bílou kuličku. Aktualizace pravděpodobností je tentýž rutinní proces jako předtím. Tento rutinní proces je ale schopen způsobit v hierarchii pravděpodobností malou revoluci: doposavad nejpravděpodobnější hypotéza A je eliminována, a dostaneme

P2(A) = P2(D) = 0
P2(B) = 2/3
P2(C) = 1/3

A tak pořád dál.

Čtenář si může snadno ověřit, že ke stejným pravděpodobnostem by bylo možno dospět i kdyby byly kuličky taženy v jiném pořadí; vytáhnu-li dvakrát černou a jednou bílou, je dvoutřetinová pravděpodobnost, že v osudí jsou dvě čené a jedna bílá, nezávisle na pořadí, v jakém jsem táhnul (tyto konkrétní hodnoty pochopitelně za předpokladu, že začínám s rovnoměrným apriorním rozdělením, nezávislost na pořadí ale platí obecně).

Co je ale důležitější, výslednou pravděpodobnost po třech tazích není nutné počítat pomocí aktualizace po každém tahu zvlášť. Ke stejnému výsledku dojdeme přímo:

P2(B) = P(ččb|B)P(B) / P(ččb)

Zde pravděpodobnost sekvence ččb za předpokladu hypotézy B (tj. dvě černé v osudí) je 4/27 a celková (apriorní) pravděpodobnost ččb, která vystupuje ve jmenovateli, je 1/18. Výsledek je podle očekávání 2/3.

Možnost aktualizovat pravděpodobnosti až za celý statistický soubor najednou se hodí v situacích typu "spočítej pravděpodobnost, že v osudí jsou dvě černé, když z tisíce tahů byla černá tažena právě 712krát". Dělat tisíc aktualizací by byla odporná činnost.

Předchozí má ale možná ještě důležitější aspekt: jakmile aktualizuji své pravděpodobnosti, můžu zapomenou na data, která jsem k tomu použil. Když pak získám nová data, nemusím je připojit ke starým a udělat statistickou analýzy s celým sjednoceným souborem. Stačí použít pouze nová data s tím, že aposteriorní pravděpodobnosti starých dat užiji jako apriorní pravděpodobnosti nové analýzy. Pochopitelně ale nesmím žádná data užít dvakrát.

Mince
K ilustraci procesu aktualizace bayesovských pravděpodobností jsem použil osudí s kuličkami místo možná přirozenějšího házení mincí nebo kostkou. Vedl mě k tomu prostý fakt, že zatímco u osudí je počet rozumných hypotéz konečný, přirozená analogie s házení kostkou vede ke složitější situaci, kde je nutno uvažovat spojitá rozdělení pravděpodobnosti. Přestože je postup pro hod mincí pouze přímočarým zobecněním toho, co se dělalo s kuličkami, stručně jej popíšu (zobecnění na kostku již přenechám čtenářům). Mimo jiné i proto, že se jedná o model, který je velmi podobný reálným statistickým problémům, jako je testování léků nebo měření fyzikálních konstant.

Pokud házíme mincí, obvykle nás zajímá pravděpodobnost, že padne hlava nebo orel (mince v myšlených experimentech na sobě mají vždy hlavu a orla, zřejmě aby byl jasný rozdíl od reálných mincí). Když neuvažujeme detaily provedení hodu, závisí tato pravděpodobnost na fyzikálních vlastnostech mince, jako je její vyvážení, tvarování okraje a podobně. Pokud mince padá stejně často orlem navrch i hlavou navrch, říkám, že je férová. Není-li tomu tak, budu mluvit o cinknuté minci ve prospěch buď hlavy, nebo orla [4].

Míru cinknutosti mince nechť parametrizuje číslo h, a to přirozeným způsobem: h je relativní frekvence hodů, kdy padne hlava. Číslo h je fyzikální parametr charakterizující minci, z bayesovského hlediska to tedy není pravděpodobnost (i když, "shodou okolností", jeho správná hodnota je rovna pravděpodobnosti hypotézy, že při hodu padne hlava). Naopak, budeme se ptát po rozdělení pravděpodobnosti čísla h. (Kdybychom přeci jen o h mluvili jako o pravděpodobnosti, pak bychom byli nuceni mluvit o "pravděpodobnosti pravděpodobnosti", a možná i k jiným nepěknostem. Z hlediska přehlednosti je skutečně lepší považovat h primárně za fyzikální konstantu definující konkrétní hypotézu; různé relevantní pravděpodobnosti se z ní dají spočítat, a jedna z nich, konkrétně P(hlava|h), je přímo rovna hodnotě konstanty.)

Na počátku musíme, jako obvykle, určit apriorní rozdělení hustoty pravděpodobnosti P(h). Nechť je naše absolutní neznalost vyjádřena rovnoměrným rozdělením na intervalu (0,1) [5], tedy P(h) = 1. Nechť v prvním hodu padne hlava. Aposteriorní rozdělení je znovu dáno Bayesovým vzorcem, který v tuto chvíli vypadá takto:

P(h|hlava) = P(hlava|h) P(h) / P(hlava).

Jak již bylo uvedeno, je P(hlava|h) = h a P(h) = 1. Zbývá určit P(hlava), což je, jako obvykle, přesčítaná pravděpodobnost P(hlava|h) přes všechny možná h. Jediný rozdíl oproti kuličkovému modelu je, že hypotézy tvoří kontinuum, a tak sčítání nahradí integrace:

P(hlava) = ∫ P(hlava|h)P(h) dh = ∫ 1 dh = 1/2.

(Integruje se od nuly do jedné, nevím ale, jak v html vysázet meze integrace, aby to vypadalo aspoň trochu normálně.) Ve výsledku máme aposteriorní rozdělení pravděpodobnosti po hození jedné hlavy rovno

P(h|hlava) = 2h.

Další postup je zřejmý...

Námitky, protiargumenty, podivnosti
Bayesiánství sice představuje konsistentní model pro práci se statistikou, ale má i své nevýhody, ať už skutečné, nebo zdánlivé. Jako překážka se může jevit třeba to, že potřebujeme několik konkurenčních hypotéz, abychom mohli smysluplně pravděpodobnosti aktualizovat. Když se tedy ptáme "nakolik pravděpodobná je hypotéza X", pak musíme jasně říct, jaké jsou alternativy. Alespoň tak jasně, abychom byli schopni spočítat pravděpodobnost získaných statistických dat za předpokladu, že X neplatí. To je docela nepříjemné omezení. Dost často totiž alternativní teorie nejsou k dispozici. Vezmeme-li za bernou minci historickou zkušenost, pak naše současné teorie ve fyzice budou téměř jistě jednoho dne překonány nějakou lepší teorií. Jenže dokud nevíme, jaká tato lepší teorie je, nemůžeme ji zahrnout do statistické analýzy. Ve výsledku toho jako alternativa kvantové mechaniky může stát newtonovská mechanika a třeba aristotelská mechanika (je-li něco takového vůbec jednoznačně formulováno), a z příslušného porovnání této sady teorií s daty vychází, že kvantová mechanika je téměř stoprocentně jistá. Problém je, že by to vycházelo i v situaci, kdyby kvantová mechanika nebyla příliš v souladu s daty - stačilo by, aby konkurenční teorie byly s daty v ještě mnohem větším rozporu.

Uvedený problém se dá částečně obejít postulováním nějaké velmi obecné hypotézy typu "výsledky měření jsou naprosto náhodné". Ve statistickém žargonu se tomu říká nulová hypotéza a hraje roli i ve frekventistickém testování hypotéz. Jelikož nulová hypotéza je k dispozici vždy, máme prakticky vždy s čím porovnávat, a hypotézy má smysl testovat i tehdy, nemají-li zrovna konkurenční alternativy.

S předchozí námitkou souvisí nejasnost v tom, jaké všechny hypotézy je třeba brát v potaz. V obou případech, které jsem zde popisoval, jsem předpokládal, že jednotlivá "měření" - ať už tažení z osudí nebo hody mincí - nejsou korelovaná. U mince ale třeba přichází v úvahu možnost, že se hodnoty pravidelně střídají, takže po hození hlavy je pravděpodobnější, že padne orel, a naopak. Takováto ztělesnění hráčského bludu jsem neuvažoval, protože jejich platnost by vyžadovala, aby v minci byl zabudován jakýsi mechanismus s pamětí, ale přísně vzato by do analýzy měly být zahrnuty. Je rozumné podobným překomplikovaným teoriím přiřadit od začátku nízké apriorní pravděpodobnosti. Protože si ale člověk může vymyslet podobných teorií miliardy, prakticky není možné počítat se všemi. Reálná bayesovská aktualizace tak vždy bere v úvahu jen malou podskupinu a priori nejpravděpodobnějších hypotéz.

Subjektivita apriorních pravděpodobností byla již zmíněna. Je to asi nejnápadnější potenciálně problematický rys pravděpodobnostního subjektivismu. Naráží na silné přesvědčení, že ve vědě má být vše objektivní a jednoznačné. Ačkoli je absence objektivity asi nejčastěji zmiňovaným nedostatkem bayesiánství, osobně považuji tuto výtku za lichou. Jisté úrovně subjektivity se totiž nelze zbavit. Frekventismus ve svých praktických vtěleních není roven bayesiánství bez subjektivity, spíš je ekvivalentní bayesiánství s přidanými pevnými pravidly o konsensuální volbě apriorních pravděpodobností. Existence takových pravidel je v praktické rovině přínosná, protože umožňuje eliminovat předpojatost a další neřesti přítomné v každém subjektivním hodnocení. To ale neznamená, že je praktický frekventismus blíže reálnému popisu procesu poznávání [6].

Ať už je bayesovský přístup jakkoli subjetivní ve věci apriorní pravděpodobnosti, je velmi objektivní ve vztahu k datům. Pozorování vždy tlačí pravděpodobnosti jedním směrem, nezávisle na apriorním stavu. V ideální limitě, po posouzení nekonečného množství dat, se pak všichni pozorovatelé musí shodnout na výsledku (s výjimkou těch, kteří správné hypotéze přisuzovali na začátku přesně nulovou pravděpodobnost; před přesně nulovými (a přesně jednotkovými) pravděpodobnostmi je třeba varovat.

Důležitá praktická poznámka: Apriorní pravděpodobnosti jsou apriorní od toho, že se stanovují předem. Potenciálně lákavou praxí by bylo vsadit apriorní pravděpodobnost P0 naší oblíbené teorie do analýzy jako proměnnou, spočítat, jak na ní závisí výsledná pravděpodobnost aposteriorní P, a potom příslušně naštelovat hodnotu P0 tak, aby P vyšlo dostatečně vysoké a my mohli oblíbené teorii pořád věřit. Tak takhle ne!

Nakonec a pro úplnost, může se objevit námitka, že popsaný způsob uvažování může člověka vést k mylným závěrům. Když hodím tisíckrát za sebou orla, nabydu zákonitě přesvědčení, že mince je téměř jistě cinknutá ve prospěch orla. Přitom, i s férovou mincí se může stát, že těch tisíc orlů padne (koneckonců, tisíc orlů není o nic méně pravděpodobný výsledek než jakákoli jiná konkrétní posloupnost tisíci hodů). V takové situaci pak zákonitě dojdu k chybnému výsledku. Podle mého soudu je to ale klad, nikoli nevýhoda, zvoleného přístupu. Jestliže má nějaký postup vést k odhalení pravdy, musí být citlivý ke vstupním datům. A tato citlivost souvisí s tím, že jsou-li díky náhodným vlivům data matoucí, je z nich odvozený závěr nesprávný. Žádná testovací procedura nemůže být vůči podobnému zmatení imunní.


Poznámky:
1. Toto rozdělení apriorních pravděpodobností můžeme podložit například následující úvahou: Pokud ten, kdo osudí připravil, losoval barvu pro každou kuličku zvlášť, tak mohl vylosovat osm sekvencí: ččč, ččb, čbč, čbb, bčč, bčb, bbč, bbb. Z nich po jedné odpovídá hypotézám A a D a po třech hypotézám B a C. Odtud uvedené pravděpodobnosti. "Správnost" takto zvolených apriorních pravděpodobností samozřejmě závisí na tom, zda skutečně autor osudí losoval každou kuličku zvlášť, nebo naopak nejdřív vylosovat číslo od nuly do tří a podle něho pak vybral počet kuliček.
2. Apriorní pravděpodobnost nemusí být úplně vycucaná z prstu, naopak, je rozumné ji zakládat na všech známých relevantních informacích. Apriornost je relativní: výsledná pravděpodobnost podložená rozsáhlou statistikou může sloužit jako apriorní pravděpodobnost třeba pro další ještě detailnější zkoumání.
3. Pravděpodobnosti A a D mohou kdykoli spadnout na nulu; pokud se tak stane, tak už je samozřejmě žádné další pozorování neresuscituje.
4. Není asi příliš těžké cinknout kostku, ale relativně těžko si představuji, jak udělat totéž s mincí. Přesto jsem volil příklad s mincí, protože její cinknutí lze parametrizovat jedním číslem, zatímco u kostky jich musíme mít přinejmenším pět.
5. V souladu s poznámkou [4] je nutno přiznat, že rovnoměrné rozdělení je dost hloupou apriorní pravděpodobností, už jen proto, že udělat minci tak, že při házení na ní padne vždycky hlava a nikdy orel je zjevně nemožné (tedy když vyloučíme podvodnickou minci s hlavou na obou stranách). Příklad ale uvádím jako ilustraci bayesovské aktualizace, ne jako ilustraci chytré volby apriorní pravděpodobnosti.
6. Současný "prakticky frekventistický" standard v posuzování vědeckých teorií bych přirovnal k zásadám soudního jednání. Jsou situace, kdy je třeba obžalovaného osvobodit, přestože jeho vina je nade vší pochybnost zřejmá. Stává se tak v situacích, kdy důkazy svědčící o jeho vině mluví jasně, ale jedná se o typ důkazů, který zákon nepřipouští, zpravidla proto, že v době přijetí zákona si podobnou konfiguraci důkazů nikdo nebyl schopen představit. I když tedy o vině obžalovaného není pochyb, je přesto dána přednost zákonné normě, protože přijetí nezákonných důkazů v jednom případě by otřáslo zásadou zákonnosti a vedlo by k právní nejistotě. V důsledku by sice jeden rozsudek byl spravedlivější, ale rozvolnění norem by hrozilo otevřít cestu zaujatosti a nespravedlnosti v případech, které nejsou tak jasné.

9 komentářů:

  1. Moc zajímavé. Mám dvě poznámky.
    K Důležité poznámce: narážíte na Swinburnův pravděpodobnostní úkaz Boží existence, nebo na Plantingu?

    Ke konci textu: asi by bylo dobré mluvit o pravděpodobnosti nejen přesvědčení, že je cinknutá mince, ale i o cinknutosti (nenáhodnosti) celého stavu světa při těch hodech - řekněme něčem jako jungovské synchronicitě. Teprve v rámci takové celkové cinknutosti (nenáhodnosti) můžete pak podle mě mluvit o tom, že většinu toho prostoru pravděpodobnosti v tom rámci zabírá teorie cinknutosti mince. Tedy jednoduššeji: pokud je to nenáhodné, tak je to na 99,9 % - třeba - cinknutostí kostky, a ne záměrným výběrem všech ostatních podmínek hodu.
    Myslím tím třeba případ, kdy po hodu té tisícovky hlav minci podrobím nějakému výzkumu a nebudu žádným způsobem schopen přijít na to, zda a jak je cinknutá. Podle toho vašeho popisu se mi totiž zdá, že bych měl bayesovsky v takovém případě volbu jen mezi tím, přece jen věřit v cinknutost kostky (přes všechna měření), nebo se přiklonit k náhodnosti.

    OdpovědětVymazat
  2. pardon, dvakrát se mi tam dostala kostka, myslel jsem samozřejmě minci :-)

    OdpovědětVymazat
  3. Nenarážím ani na jednoho. O Plantingovi vím akorát to, že měl velmi divný argument ontologického charakteru zatemněný zmínkami o "možných světech", a to se mi nezdá příliš relevantní pro tohle téma (možná máte na mysli jiný argument). O Swinburnovi nevím nic, jaký je jeho argument? Narážím pouze na obecnou náchylnost lidí upravovat si data tak, aby vyhovovala jejich předsudkům.

    Pokud minci důkladně prozkoumám a cinknutost nezjistím, tak je to samozřejmě "bayesovská evidence" ve prospěch toho, že mince cinknutá není (akorát se tenhle typ pozorování hůř zapojuje do aktualizace pravděpodobností, protože musíte nějak určit pravděpodobnost, že jste existující cinknutí přehlédl, což asi rozumně lze jenom hrubým odhadem). Čili pokud minci prozkoumáte a nezjistíte nic divného, tak je tisíc hlav za sebou velmi pravděpodobně důsledkem "cinknutosti světa", ať už se tím myslí cokoli. Statistická data z výsledků hodů samozřejmě nejsou schopna rozlišit, zda příčina je v minci nebo v jejím okolí.

    (To, že jsem mluvil jenom o vlastnostech mince - hlavně z důvodu stručnosti - jsem se snažil ospravedlnit předpokladem "když neuvažujeme detaily provedení hodu", ale vidím, že to bylo nejasné. Měl jsem spíš napsat "pokud máme absolutní jistotu, že okolnosti hodu jsou standardní", nebo ještě spíš se vykašlat na stručnost a mluvit o parametru h jako vlastnosti ne pouze mince, ale celého házecího systému.)

    Samozřejmě potom, co bych prozkoumal celý házecí systém, a nenašel cinknutost, a pořád by padaly jenom hlavy, pak musím vzít v úvahu hypotézy typu "můj fyzikální model hodu mincí je špatně" nebo dokonce "šálí mě smysly". Takové věci jsou hodně a priori nepravděpodobné, ale když experiment začne vycházet divně, je třeba s nimi začít počítat.

    OdpovědětVymazat
  4. No, Swinburne přišel s pravděpodobnostním důkazem Boží existence, který zdá se mi pracuje s tou bayesovskou pravděpodobností, a připadlo mi zároveň, že tam kumuluje ty pravděpodobnosti (apriorní-aposteriorní) způsobem, na které jste v Důležité poznámce upozornil jako na chybu. Kdyžtak se na to někde koukněte, anglicky je toho na webu spousta, slovensky stručně třeba na www.jezuiti.sk (překliknout na Prečo je rozumné veriť, že Boh je, a pak znovu překliknout na nový web www.rojka.sk).

    OdpovědětVymazat
  5. Anglicky jsem toho překvapivě moc nenašel, ale nehledal jsem nějak usilovně. Z toho slovenského článku se zdá, že bych Swinburnovi spíš vytknul jiné věci, než nevhodně vysokou volbu apriorních pravděpodobností (i když tenhle aspekt tam je taky). Hlavním prohřeškem je jeho (nevyslovený) předpoklad, že Bůh je jednoduchý pojem, přinejmenším v porovnání s Vesmírem. Potom mu logicky vychází, že přijmeme-li zásadu úměry mezi jednoduchostí hypotézy a její apriorní pravděpodobností, tak existence Boha vyjde jako pravděpodobná. Samozřejmě je to podvod. Popsat Boha tak detailně, že se z takového popisu dají odvodit všechny detailní informace o Vesmíru, který stvořil, je přinejmenším tak složité, jako na stejné úrovni detailnosti popsat samotný Vesmír.

    OdpovědětVymazat
  6. Ten výše zmíněný podvod je samozřejmě součástí všech kosmologických argumentů již od časů svatého Augustina, nebo kdo s tím přišel jako první. Podstata zůstává, mění se pouze verbální kamufláž.

    OdpovědětVymazat
  7. Dobrý den,

    moc děkuji za pěkný článek. Ještě chvilku a začnu si snad říkat, že překonám svůj odpor ke statistice :-)

    Abych se trochu odsloužil, nabízím k vyzkoušení možnost, jak vkládat vzorce do webové stránky. Pokud umíte TeX (přesněji LaTeX), můžete použít
    codecogs.com a vložit do stránky dynamický gif vytvořený z LaTeXového kódu.

    Bohužel přes komentářový engine bloggeru to nevložím, ale zkuste vyzkoušet, jak by vypadalo tohle: <img src="http://latex.codecogs.com/gif.latex?\int^1_0&space;P(h|\text{hlava})P(h)/P(\text{hlava})dh">

    Třeba se vám to bude hodit. (Okoukal jsem to na pinus.bloguje.com)

    Elvis

    OdpovědětVymazat
  8. @Elvis: Vynikající. Sice se budu muset smířit s tím, že podstatná součást textu bude odkaz, který zanedlouho nemusí fungovat, ale vypadá to hezky. Přinejmenším už vím, jak Pinus dělá vzorce. Díky.

    OdpovědětVymazat
  9. I am extremely inspired along with your writing skills and also with
    the layout on your blog. Is this a paid topic or
    did you modify it yourself? Anyway keep up the excellent
    quality writing, it's uncommon to peer a great blog like this one these days..

    Feel free to visit my homepage: gittelson

    OdpovědětVymazat