pátek 18. listopadu 2011

Pravděpodobnost pravděpodobnosti


Pod článkem, ve kterém jsem se věnoval odhadování pravděpodobnosti toho, že jistí Američané odsouzení v Íránu za špionáž sedí v base právem, říká jeden z čtenářských komentářů:

Nějakou dobu jsem přemýšlel nad touto metodou určování pravděpodobnosti závěrů a myslím, že je skutečně funkčním způsobem, jak se dobrat k správnému odhadu pravděpodobnosti. Co mi na ní ale chybí je odhad spolehlivosti. Myslím, že by bylo lépe ji rozšířit od výpočet dolního a horního odhadu. Ty bych definoval přes subjektivní odhad, že s pravděpodobností p bude hodnota uvažované pravděpodobnosti vyšší/nižší než dané číslo a horní, resp. dolní odhady bych sčítal stejným způsobem, jako teď sčítáte střední hodnoty. Myslím, že zrovna u diskutované hypotézy by musel vyjít docela slušný rozptyl (odhaduji 1:20 až 20:1).

Úvaha, která na první pohled dává smysl. Ne všechny pravděpodobnosti jsou si rovny. Na jedné straně stojí takové, jako je pravděpodobnost padnutí dvojky na férové kostce: jistá, objektivní jedna šestina. Na druhé straně stojí pofidérní odhady typu pravděpodobnosti, že jakýsi neznámý člověk je špion. Jak můžeme s objektivní jistotou odhadnout něco takového?

A co říká druhý pohled?

Pojmy se nezavádějí a přesvědčení se nepřijímají pro ozdobu. Pravděpodobnosti nejsou výjimkou. K čemu je vlastně potřebujeme? Především, k rozhodování. Přikládám-li vítězství Bohemky nad Slavií pravděpodobnost 0,4, znamená to pro mě, že bych neměl vsadit na Bohemku tisícikorunu proti tisícikoruně, protože takový čin znamená očekávanou ztrátu 200 Kč. Očekávanou ztrátu dostanu tak, že přenásobím pravděpodobnost vítězství Bohemky ziskem z této události (v takovém případě vyhraji 1 000 Kč, po přenásobení zbydou čtyři stovky) a odečtu ztrátu z alternativní možnost, tj. nevýhry [*] Bohemky (zde 0,6 x 1 000 = 600). Sázet na Bohemku za těchto okolností je hloupé.

Abych mohl výpočet provést, musí pravděpodobnosti být konkrétní čísla. Věta „myslím, že Bohemka vyhraje s pravděpodobností 0,4, ale stejně dobře je možné, že vyhraje s pravděpodobností 0,8“ je možná gramaticky korektní, ale očekávaný zisk z nabízené sázky z ní neodvodím.

Pravděpodobnost vyjadřuje míru jistoty. Pravděpodobnosti rovná 1 a 0 jsou absolutní jistotou; na událost s pravděpodobností 1 jsem ochoten vsadit cokoli pod jakýmkoli kursem, protože nemám sebemenší stín obav, že by k ní nedošlo. Absence sebemenšího stínu obav z omylu je vlastností fanatiků a sebevrahů; k rozumnému rozhodování nepatří. Meze platnosti skepticismu vůči absolutní jistotě nelze ovšem natahovat přespříliš. Začneme-li pochybovat i o svých mentálních stavech, musíme přířadit pravděpodobnosti svým subjektivním pravděpodobnostem (horní a dolní odhad, který požaduje citovaný komentátor, jsou jen alternativním popisem téhož) — musíme tak zacházet s výrazy p(p(X)=a)=b, kde X je nějaký výrok a p(X) je jeho pravděpodobnost. Možná si lze představit napohled smysluplnou interpretaci výroku „pravděpodobnost, že pravděpodobnost existence mimozemšťanů je 30%, je 68%“. Věta je to nepěkná, ale při troše snahy ji rozklíčujeme. Pokud ovšem výroky o pravděpodobnostech jsou samy o sobě subjektem pravděpodobností, pokud tedy přiznáváme smysl větě p(p(X)=a)=b není žádný důvod stejný smysl nepřiznat výroku p(p(p(X)=a)=b)=c nebo p(p(p(p(X)=a)=b)=c)=d; vypisovat jejich slovní podobu by ovšem bylo hříchem proti stručnosti. Ač není problém takové výroky vyslovit, je problém přiřadit jim rozumný smysl. I když odhlédneme od absence dobrého a elegantního algoritmu rozhodování, který bere v úvahu i pravděpodobnosti pravděpodobností, samotná nutnost mít nekonečnou regresi pravděpodobnostních rozdělení pro charakterizování každého jednotlivého subjektivního přesvědčení je absurdně neelegantní a nepraktická. Je tedy potřeba řadu někde utnout, a nejpřirozenější je utnout ji hned na začátku: pravděpodobnosti jsou pevné a jisté, p(p(X)=a) nemá smysl.

(Je to pragmatismus, co vynucuje tento přístup. Snadno se zapomíná, že matematika — do které pravděpodobnostní počet spadá — není ani tak moc objektivně existující řád reality, jako spíš konstruovaná idealizace popisující určité procesy, v našem případě poznávání a rozhodování. Nic člověku v principu nebrání pravděpodobnostní počet konstruovat jinak, třeba i s nekonečnou regresí pravděpodobností, je-li tedy schopen si poradit s příslušnými technickými těžkostmi, které takový přístup přináší; síla ovšem zpravidla leží v jednoduchosti.)

Jistě, co člověk, to názor. Pravděpodobnosti tak nemohou být najednou jisté a objektivní. Chceme zachovat jistotu, musíme zahodit objektivitu. Což se občas vzpírá intuici. V tomto článku se píše o psychologickém experimentu týkajícím se pravděpodobností [*]:

Máte stůl s osmi zásuvkami. Je šance 80%, že stůl skrývá důležitý dopis. Předpokládejte, že prohledáte čtyři zásuvky a nenajdete nic. Jaká je potom šance, že stůl skrývá dopis? Jaká je šance, že ho najdete v páté zásuvce?
...
[M]noho lidí uvažovalo tak, jako kdyby „80% šance dopisu“ bylo základní vlastností nábytku, spolu s vlastnostmi jako váha, hmotnost a hustota. Mnozí mysleli, že šance, že stůl obsahuje dopis, zůstává 80% v průběhu bezúspěšného hledání. Tudíž, uvažovali, bude stále 80%, i když prohledají sedm zásuvek a nenajdou dopis žádný.

Pravděpodobnost, že stůl obsahuje dopis, ovšem není vlastností stolu; jeho vlastností je nanejvýš fakt, že dopis obsahuje (nebo nikoli). Pravděpodobnost je vlastností člověka, jenž má o stole pouze částečné informace. (Jaká je tedy pravděpodobnost, že po neúspěšném prohledání sedmi zásuvek najdete dopis v té osmé? Jestli jste neklikli na poslední odkaz, máte možnost si problém vyřešit sami.)

Jsou-li všechny pravděpodobnosti subjektivní a jisté, znamená to tedy, že není zásadního rozdílu mezi pravděpodobností, že padne na férové kostce dvojka, a pravděpodobností, že existují mimozemšťané?

V jistém smyslu ano a jistém smyslu ne. Abychom pokročili dále, je třeba rozlišit mezi dvěma druhy „pravděpodobností“.

První třída pravděpodobností jsou subjektivní pravděpodobnosti, o kterých jsem psal až doposud. Jsou to pravděpodobnosti, které určují míru víry v pravdivost daného výroku. Tyto pravděpodobnosti vstupují do výpočtu očekávaných zisků a ztrát (samozřejmě v jednotkách užitku spíše než v penězích) a určují tak rozhodnutí svých nositelů. Subjektivní pravděpodobnosti by měly být navzájem konsistentní (což vylučuje takové stavy, jako např. p(vyhraje Bohemka)=80% a p(vyhraje Slavie)=75% současně) a měly by se měnit pouze předepsaným způsobem při relevantních pozorováních. U lidí to tak pochopitelně moc dobře nefunguje, ale znovu: snažíme se najít idealizaci schopnou překonat evidentní nedokonalosti lidského uvažování, spíš než popis komplikovaných vrozených heuristik. Každopádně, jsou-li vůbec jednoznačná pravidla pro racionální určování pravděpodobností, tato pravidla berou v úvahu nikoli samotný jev, jehož se pravděpodobnosti týkají, ale pouze informace, jež o tomto jevu jsou k dispozici.

Druhá třída „pravděpodobností“ jsou relativní četnosti v rámci dlouhých (limitně nekonečných) sérií opakovaných událostí. Například procento dvojek při házení kostkou, podíl rozpadlých jader uranu za sekundu, počet lidí, kteří zemřou při autonehodě v poměru k celkové populaci... Tyto četnosti jsou objektivními vlastnostmi zkoumaných jevů (házení kostkou, rozpadu jader uranu, silničního provozu) naprosto nezávisle od dostupných informací: ať už o tom vím nebo ne, určité množství kostek se zastaví s dvojkou navrchu, určité procento jader se rozpadne, určité množství lidí nepřežije cestu vozem.

Proč vůbec dochází ke zmatení pojmů mezi oběma typy pravděpodobností? Hlavním důvodem je zřejmě fakt, že četnosti a subjektivní pravděpodobnosti jsou těsně svázané. Vezměme onu zprofanovanou kostku: relativní četnost hodů, při kterých padne dvojka, je nějaké číslo f(2); u ideální kostky házené ideálním hráčem je f(2)=1/6 a ani v reálných situacích se od této hodnoty příliš neodchyluje. Hodnota f(2) je objektivní, empiricky zjistitelné číslo, a racionální agent jistě dojde k přesvědčení, že s vysokou jistotou je rovna přibližně 1/6 — formálněji, jeho pravděpodobnostní rozdělení p(f(2)=x) bude funkce nezanedbatelně vysoká pouze v nejbližším okolí bodu x=1/6. V okamžiku, kdy takový agent dostane za úkol stanovit pravděpodobnost, že v následujícím tahu padne dvojka, bude uvažovat třeba tak:

  1. Hod nezávisí poznatelným způsobem na minulých hodech ani na dalších okolnostech.
  2. Nejlepší model kostky je tak náhodný generátor, který vrátí číslo n (od jedné do šesti) s pravděpodobností p(n,k) v k-tém hodu. Máme-li naprostou jistotu, že toto je správný model, pak p(n,k) je jedinou složkou subjektivní pravděpodobnosti toho, že v k-tém hodu padne n, a je této pravděpodobnosti přímo rovno.
  3. Nemáme důvod předpokládat, že p(n,k) závisí na k, píšeme tedy pouze p(n).
  4. Aby takový model reprodukoval dlouhodobé chování kostky, musí být p(n)=f(n).
  5. Tudíž, pravděpodobnost, že padne dvojka, je rovna dlouhodobé frekvenci padání dvojky.

Platnost závěru pochopitelně závisí na všech premisách. Kdyby například náš racionální agent získal přístup k počítačovému systému, který je schopen vyhodnotit jemné nuance pohybů kostky i toho, kdo ji hází, a dostatečně přesně spočítat, že opravdu tentokráte padne dvojka, pak by agent byl hlupák, kdyby stále počítal s p(2)=1/6. Chce-li si agent zachovat v takové situaci přízvisko „racionální“, musí svou původní šestinu nahradit pravděpodobností, že jeho počítačový systém se v tomto případě mýlí.

V reálném světě nemáme při házení kostkou k dispozici přesné detektory ani počítačové modely. V reálném světě taktéž explicitně nedělíme své úvahy do několika triviálních bodů; všech pět podúvah se mnohem spíš shrne do jediného „rozum dá, že p(n)=f(n)“. Tato úvaha je jádrem takzvaného frekventismu. Frekventismus je ovšem silnější přesvědčení, než pouhé „často je racionální pravděpodobnosti stavět rovné četnostem (tj. frekvencím)“. Frekventisté přímo pravděpodobnosti definují pomocí četností; cokoli, co není definovatelné pomocí četnosti, není pravděpodobnost. „Výhodou“ frekventismu je, že pravděpodobnost je objektivní; někteří lidé zřejmě pociťují odpor k myšlence, že by matematika mohla zkoumat něco subjektivního, a frekventismus je toho ušetří i v teorii pravděpodobnosti. Samozřejmě, i frekventisté musejí mít nástroje k měření subjektivní nejistoty, ty se zpravidla vkrádají do hry bokem pod rouškou intervalů spolehlivosti a p-hodnot. Ale o tom jsem již psal.

Každopádně, frekventismus je to, co se dnes ve školách učí (aspoň to tak bylo, když jsem do školy chodil já, a pochybuji, že by se změnilo zrovna tohle). Nese to s sebou politováníhodné zmatení: objektivní frekventistická definice pravděpodobnosti je v konfliktu s běžným užitím tohoto slova. „Jaká je pravděpodobnost, že Bohemka vyhraje“ je pro frekventistu věta postrádající smysl, nicméně pro bookmakera v Tipsportu velmi praktická a smysluplná otázka.

Intuitivní cítění, že některé pravděpodobnosti (třeba ty u hodu kostkou) jsou jistější než jiné (třeba ty v případu domnělých špionů), je svázáno s dichotomií mezi dvěma typy pravděpodobností. Když řeknu, že pravděpodobnost pádu dvojky je 1/6, může to znamenat, že jsem na dvojku ochoten vsadit v kursu 5:1, ale může to znamenat i to, že věřím, že relativní četnost dvojek v sérii tisíce hodů bude hodně blízká 1/6 (a na to budu ochoten vsadit v mnohem nevýhodnějším kursu, v závislosti na tom, jaká blízkost 1/6 zaručí výhru). Když ale řeknu, že pravděpodobnost, že zadržení Američané jsou špioni, je 1/6, přirozeně připadá v úvahu pouze první interpretace. A i kdybych měl na mysli nějaké smysluplné četnostní čtení onoho výroku, například „1/6 všech Američanů odsouzených v Íránu za špionáž jsou skutečně špioni“, bylo by hloupé v tomto případě přikládat vysokou pravděpodobnost zrovna na 1/6, nebo jakékoli jiné konkrétní číslo, aspoň tedy v absenci jednoznačných statistických dat.

24 komentářů:

  1. > (Jaká je tedy pravděpodobnost, že po neúspěšném prohledání sedmi zásuvek najdete dopis v té osmé? Jestli jste neklikli na poslední odkaz, máte možnost si problém vyřešit sami.)

    Jedina spravna odpoved je ta, ze nelze odpovedet na zaklade vstupnich informaci, nebot nezname pravdepodobnosi s jakymi bude dopis v jednotlivych zasuvkach dano fakt ze dopis je ve stole. Vysledek muze vyjit cokoliv od 0 do 0.8.

    Pokud tam nekdo automaticky dosadi rovnomerne rozlozeni a spocita to s tim, tak to je dost elementarni chyba.

    Zadani lze samozrejme osetrit tim, ze se rekne, ze zasuvky pro prohledani byly vybirane nahodne rovnomerne.


    > Každopádně, frekventismus je to, co se dnes ve školách učí

    No, nam teda na skole nic o frekventismu ci bayesovske interpretaci pravdepodobnosti nerikali, ale pravdepodobnost ucili klasicky pomoci pravdepodobnostni miry nad mnozinama udalosti v pravdepodobnostnim prostoru, jak to kdysi definoval Kolmogorov.


    V prve rade o pravdepodobnosti ma smysl mluvit asi jen v pripade, kdy mame nejaky skryty stav a zaroven vime, nebo alespon mame dobry dovod se domnivat [*], ze nejake 'samplovani' toho skryteho stavu ma nejake 'stabilni' pravdepodobnostni rozdeleni.

    [*] at uz na zaklade intuitivnich uvah o symetrii (jako treba u te kostky), dedukce vychazejici ze znalosti struktury vnitrniho stavu a zakonu pravdepodobnosti (napr. centralni limitni veta) nebo proste zempiricky overovanych vedeckych teorii.


    Pokud napr. najdu zahadny pristroj, ktery po stisku tlacitka rozsviti jednu z deseti zarovek, tak bez dalsich vedomosti a poznani o tom pristroji nema smysl hovorit o pravdepodobnosti jednotlivych zarovek.

    Pokud z danym pristrojem provedu sadu experimentu a dukladnou statistickou analyzu, a vyjde mne, ze distribuce rozsviceni zarovek je rovnomerna (resp. takovou hypotezu jsem zvolil, testoval a nezamitl z experimentalnich dat), tak muzu usuzovat, ze pravdepodobnosti jednotlivych zarovek jsou 0.1. Toto neni frekventisticka interpretace - tem zarovkam prisuzujeme tu pravdepodobnost nikoliv proto, ze zhruba tak vysly ty cetnosti, ale proto, ze lepsi teorii nemame a tato je konzistentni s daty. Dalsi experimenty mohou ukazat, ze to je jinak (napr. ze tam existuji korelace mezi vysledky jednotlivych stisku tlacitek).

    Samozrejme, k obdobnym poznatkum muzu taky prijit tak, ze ten pristroj proskoumam a rozeberu. Tak budu treba schopen sestavit lepsi teorie.


    Tedy jinymi slovy, souhlasim s tim, ze pravdepodobnost neni ani tak vlastnost objektu realneho sveta, jako spis nastroj, pomoci ktereho tridime poznatky o realnem svete a vytvarime teorie umoznujici predikce (resp. umoznuje nam ty teorie formulovat).

    Na druhou stranu asi nelze zamenovat pravdepodobnost za nejistotu, ci neznalost. Abychom mohli pravdepodobnost pouzit v teoriich, meli bychom byt dostatecne presvedceni o tom, ze predpoklady jsou splnene, tedy ze onen realny jev ma smysl vubec modelovat nejakym pravdepodobnostnim modelem. To je onen problem u tech Americanu v Iranu a nebo s automatickym predpokladanim rovnomerneho rozdeleni.


    > Nese to s sebou politováníhodné zmatení: objektivní frekventistická definice pravděpodobnosti je v konfliktu s běžným užitím tohoto slova.

    To ovsem neni nic neobvykleho. Je spousta slov, ktere se pouzivaji v jasne definovanem vyznamu v nejakem oboru a pak mnohem volneji v beznem hovoru. V elementarni fyzice by se jich urcite nasla spousta. Stejne tak treba vir v biologii a vir v IT je neco jineho. Jenom je treba si dat pozor a ty vyznamy nemichat.

    OdpovědětVymazat
  2. pravdepodobnost ucili klasicky pomoci pravdepodobnostni miry nad mnozinama udalosti v pravdepodobnostnim prostoru, jak to kdysi definoval Kolmogorov

    Skutečně? Na střední škole? A nic ve smyslu, že pravděpodobnost je limita četnosti jevu v opakované sérii pokusů? Kam jste chodil do školy?

    (Samozřejmě definice pravděpodobnosti jako míry na pravděpodobnostním prostoru je kompatibilní jak s Bayesem, tak s frekventismem.)

    "V prve rade o pravdepodobnosti ma smysl mluvit asi jen v pripade, kdy mame nejaky skryty stav a zaroven vime, nebo alespon mame dobry dovod se domnivat [*], ze nejake 'samplovani' toho skryteho stavu ma nejake 'stabilni' pravdepodobnostni rozdeleni."

    Co znamená "'stabilní' pravděpodobnostní rozdělení"?

    "at uz na zaklade intuitivnich uvah o symetrii (jako treba u te kostky)"

    Není zde nekompatibilita s tím, co tvrdíte o zásuvkovém experimentu, tj. "pokud tam nekdo automaticky dosadi rovnomerne rozlozeni a spocita to s tim, tak to je dost elementarni chyba"? Mezi zásuvkami je také symetrie - jsou všechny stejné (měl jsem to uvést explicitně, ale zdálo se mi, že to je nejpřirozenější interpretace v daném kontextu).

    Mimochodem, když se vám nelíbí automatické rovnoměrné rozdělení, princip maximální entropie také neuznáváte?

    "Pokud z danym pristrojem provedu sadu experimentu a dukladnou statistickou analyzu, a vyjde mne, ze distribuce rozsviceni zarovek je rovnomerna (resp. takovou hypotezu jsem zvolil, testoval a nezamitl z experimentalnich dat), tak muzu usuzovat, ze pravdepodobnosti jednotlivych zarovek jsou 0.1. Toto neni frekventisticka interpretace - tem zarovkam prisuzujeme tu pravdepodobnost nikoliv proto, ze zhruba tak vysly ty cetnosti, ale proto, ze lepsi teorii nemame a tato je konzistentni s daty."

    Nerozumím. Čím je tato teorie lepší než teorie "pravděpodobnost první žárovky je 0,46 a každé zbývající 0,06", když ne tím, jak vyšly měřené četnosti?

    "Je spousta slov, ktere se pouzivaji v jasne definovanem vyznamu v nejakem oboru a pak mnohem volneji v beznem hovoru. V elementarni fyzice by se jich urcite nasla spousta. Stejne tak treba vir v biologii a vir v IT je neco jineho."

    Jistě. Že to tak je ovšem neznamená, že je to tak v pořádku. (Zdá se mi, že implikujete, že to tak je v pořádku.) Onen virus není ovšem zrovna ideální příklad podobného problému, u viru žádné nedorozumění nehrozí.

    OdpovědětVymazat
  3. > Skutečně? Na střední škole?

    Na vysoke :-), Zda (a jak) se pravdepodobnost ucila na me stredni skole si opravdu nevzpominam.

    > Co znamená "'stabilní' pravděpodobnostní rozdělení"?

    V prve rade asi to, ze nezavisi na parametrech mimo model. Nevim, zda je to dostatecne jasne, asi bych si to musel lepe rozmyslet.

    > Není zde nekompatibilita s tím, co tvrdíte o zásuvkovém experimentu, tj. "pokud tam nekdo automaticky dosadi rovnomerne rozlozeni a spocita to s tim, tak to je dost elementarni chyba"? Mezi zásuvkami je také symetrie

    Asi jsem se nevyjadril dostatecne jasne - to, ze u kostky si dovolim odhadnout pravdepodobnostni rozdeleni, nevychazi jen ze symetrie te kostky, ale z toho, ze mam nejakou elemenarni predstavu o fyzice a o fyzikalni podstate nahodneho jevu hodu kostkou. To plus fyzikalni symetrie kostky (zanedbam-li vliv popisku, nebo pripad, ze ta kostka je nesymetricka - nevyvazena) me dava celkem dobre duvody k tomu hadat rovnomerne rozdeleni.

    Oproti tomu u zasuvkoveho experimentu netusim vubec nic o podstate toho nahodneho jevu - proc se v tom stole ty dopisy objevovaly, kdo je tam daval, zda se ridil nejakym svym postupem. Pokud napr. uzivatel daneho stolu (i kdyz jsou vsechny perfektne symetricky stejne) mel ve zvyku je davat vzdy do prvni, pak to rozdeleni vychyli. Proto je vhodnejsi explicitne uvest nikoliv to, ze zasuvky jsou identicke, ale to, ze volba (tech 7 predchozich) prozkoumanych zasuvek byla rovnomerna.

    Tedy u te kostky to neni automaticke rovnomerne rozdeleni, ale dedukce ze znalosti (narozdil treba od toho prikladu s tajemnym strojem a zarovkama, kde ty znalosti nemam)

    > Mimochodem, když se vám nelíbí automatické rovnoměrné rozdělení, princip maximální entropie také neuznáváte?

    Asi bych se s tim musel bliz seznamit, abych se k tomu odvazil vyjadrit.


    To automaticke zavadeni rovnomerneho rozdeleni me prijde dost absurdni - v logice je jasna hranice mezi dokazatelnymi tvrzenimi, vyvratitelnymi tvrzenimi a nezavislymi tvrzenimi (o kterych teorie nic nerika - nedokazuje ani nevyvraci). V empirickych vedach je to vsechno slozitejsi a ve stupnich sedi, ale asi by melo platit, ze pokud mam nejaky neznamy system, o jehoz chovani nemam zadne empiricke (nebo dedukovatelne) informace, tak bych se mel zdrzet predikci a priznat, ze o nem nic nevim, nez o nem tvrdit nejaka tvrzeni 'by default'.

    > Nerozumím. Čím je tato teorie lepší než teorie "pravděpodobnost první žárovky je 0,46 a každé zbývající 0,06", když ne tím, jak vyšly měřené četnosti?

    Jedna teorie vytvarela predikce konzistentni s realitou, druha ne. Je asi vcelku jedno, zda ty predikce formuluji v podobe ocekavanych cetnosti, nebo ocekavaneho zisku sazek.

    > Jistě. Že to tak je ovšem neznamená, že je to tak v pořádku. (Zdá se mi, že implikujete, že to tak je v pořádku.)

    No, muj postoj k takovym pripadum obecne je spis ten, ze to je nemile, ale moc se tim delat neda (a snahy s tim neco delat obvykle vedou k jeste horsi situaci) a zavisi na konkretnich okolnostech, co s tim. Zrovna u slova 'pravdepodobnost' me neprijde, ze by se nejak pouzivalo v beznem hovoru, lide spis mluvi o 'sanci', 'nejistote' ci 'nahode'.

    OdpovědětVymazat
  4. "Na vysoke :-), Zda (a jak) se pravdepodobnost ucila na me stredni skole si opravdu nevzpominam."

    Aha, tím se to vysvětluje. Když říkám "ve škole", myslím tím normálně střední a základní školu (vysokoškolskou statistiku tak jako tak absolvuje menšina lidí, a k tomu se obsah bude dost lišit škola od školy a vyučující od vyučujícího; náš kurs začínal slovy "kaligrafické A je borelovská sigma-algebra", což mělo za následek signifikantní pokles účasti na dalších přednáškách...).

    "to, ze u kostky si dovolim odhadnout pravdepodobnostni rozdeleni, nevychazi jen ze symetrie te kostky, ale z toho, ze mam nejakou elemenarni predstavu o fyzice a o fyzikalni podstate nahodneho jevu hodu kostkou."

    Kdybyste neznal Newtonovy zákony, rovnoměrné rozdělení byste si nedovolil předpokládat? Pokud ano, tak jaká konkrétní znalost o fyzice je zde podstatná?

    "v logice je jasna hranice mezi dokazatelnymi tvrzenimi, vyvratitelnymi tvrzenimi a nezavislymi tvrzenimi (o kterych teorie nic nerika - nedokazuje ani nevyvraci). V empirickych vedach je to vsechno slozitejsi ..."

    Nejsem si jist, zda rozumím. Tyhle věci kolem dokazatelnosti mohou být docela nuanciózní, což pravděpodobně nebude podstatné pro to, co chcete říct. Můžete uvést příklad dokazatelného a nezávislého tvrzení, která obě spadají do logiky a přitom nikoli do
    empirických věd?

    "... a ve stupnich sedi ..."

    Bayesovská pravděpodobnost není nic jiného než kvantifikace těch stupňů šedi.

    "Jedna teorie vytvarela predikce konzistentni s realitou, druha ne. Je asi vcelku jedno, zda ty predikce formuluji v podobe ocekavanych cetnosti, nebo ocekavaneho zisku sazek."

    Poukazoval jsem na pravděpodobný spor mezi vašimi tvrzeními (parafrázuji) A:"rovnoměrné rozdělení není vybráno proto, že zhruba tak vyšly četnosti" a B:"je vybráno proto, že tato teorie je konsistentní s realitou". Konsistence s realitou je ale ověřována podle četností.

    "Zrovna u slova 'pravdepodobnost' me neprijde, ze by se nejak pouzivalo v beznem hovoru"

    Nikoli jako substantivum, ale příslovce "pravděpodobně" je časté.

    OdpovědětVymazat
  5. Pořád mi leží v hlavě ta frekventistická objektivita. Odkud vlastně vím, že pravděpodobnost pádu dvojky na kostce je 1:6? Zdá se mi, že v tomhle má pravdu spíš Ondra, že to opravdu závisí na nějakých našich (zejména) fyzikálních znalostech. V zásadě je ta úvaha založena na myšlence, že kromě počtu stran kostky jsou všechny ostatní vlivy zanedbatelné - a že jsou tak zanedbatelné proto, že nejsou ve vztahu specificky s nějakou stranou té kostky, a že v tomto vztahu není žádný z těch vlivů. Kdybych ale opravdu dokázal zjistit, co na kostce padne při kterém hodu, neměl bych důvod preferovat ten poměr 1:5. Kdyby byl třeba při hodně velkém počtu případů
    1:4,9999999999999999, měl bych důvod přestat věřit ve spolehlivost toho fyzikálního modelu, který mě vedl k formulaci toho poměru 1:5? A jak moc by se ten skutečně změřený poměr musel od toho teoretického lišit, abych měl důvod uvažovat o změně svého fyzikálního modelu? Ten teoretický model jako by naznačoval, že v sériích se zvětšujícím se množstvím hodů bude výsledná frekvence pořád bližší 1:5. To je ale zase zřejmě jen pravděpodobností jev, vsadit se na to nedá (když nám vyjde u milionu pokusů mírně vzdálenější frekvence než u deseti tisíc, asi kvůli tomu svůj fyzikální model nezměníme). Možná se dá říci, že u nekonečného počtu hodů bude rozložení frekvence přesně a s jistotou 1:5 - zde je ale problém, zda v té představě nekonečného počtu pokusů není něco absurdního - a i kdyby nebylo: nekonečný počet hodů kostkou přece pořád znamená nějakou řadu konkrétních pokusů s konkrétními vlivy. A každý ten hod nějak mění výslednou pravděpodobnost, počítanou z předchozích hodů. Čím je zaručeno, že u nekonečné řady bude ta frekvance přesně 1:6? Co brán í tomu, aby byla třeba ta výše uvedená nebo třeba i ještě trochu odlišnější?

    OdpovědětVymazat
  6. "Kdyby byl třeba při hodně velkém počtu případů
    1:4,9999999999999999, měl bych důvod přestat věřit ve spolehlivost toho fyzikálního modelu, který mě vedl k formulaci toho poměru 1:5?"


    No tak samozřejmě, když vám to nevychází 1:5, je asi kostka lehce cinknutá. (Samozřejmě, ten váš festival devítek to ztěžuje, musel byste házet opravdu hodně dlouho, abyste naměřil četnost na 17 platných číslic.) Když vám ale řečený poměr po tisíci hodech vyjde 1:3,12, model symetrické kostky zahoďte.

    "A jak moc by se ten skutečně změřený poměr musel od toho teoretického lišit, abych měl důvod uvažovat o změně svého fyzikálního modelu?"

    To se mění plynule. Máte řadu modelů které spolu soupeří, v určitých situacích může několik modelů být srovnatelně pravděpodobných. Jak to probíhá na trochu jiném procesu se čtyřmi hypotézami popisuji zde.

    "zda v té představě nekonečného počtu pokusů není něco absurdního"

    Nekonečný počet pokusů je abstrakce; vše lze definovat pomocí konečných čísel, viz konvergence náhodných veličin.

    "Čím je zaručeno, že u nekonečné řady bude ta frekvance přesně 1:6? Co brání tomu, aby byla třeba ta výše uvedená nebo třeba i ještě trochu odlišnější?"

    Samozřejmě to ničím zaručeno nemáte. Když vyjde 1/6, vyjde 1/6, když vyjde 0,14435, vyjde 0,14435. V prvním případě můžete říct, že kostka se chová plně symetricky, v druhém nikoli.

    Vadí vám možnost, že na kostce nebudete schopen najít žádnou viditelnou nesymetrii, a přesto poměr nevyjde 1/6? Pak jste špatně hledal, nebo je nesymetrie skryta ve způsobu házení. Nenajdete-li nesymetrii ani tam, objevil jste zřejmě nový přírodní zákon ovlivňující házení kostkou. Nebo jste zase špatně hledal...

    Přijde mi, že se příliš snažíte mít věci zaručené nějakým naprosto nezvratným principem. Jenže každý princip můžete verbálně zpochybnit otázkou "čím je on zaručen".

    Relativní četnosti v náhodných procesech konvergují k určitým hodnotám, nazývá se to "zákon velkých čísel", a můžete to brát jako empirický fakt o světě. Když si to zkusíte s kostkou, mincí nebo náhodným generátorem, uvidíte, že to funguje; tohle vidění je lepší důkaz než jakýkoli abstraktní metafyzický princip.

    OdpovědětVymazat
  7. Doufám, že mě teď žádný jazykopurista neseřve za slovo "nesymetrie"...

    OdpovědětVymazat
  8. Musím uznat, že jsem článek nedočetl do konce, takže tenhle komentář možná není relevantní a možná se vlamuju do otevřených dveří. Pochopil jsem správně, že autor odmítá výše zmíněný komentář na základě toho, že bychom museli rekurzivně počítat pravděpodobnosti pravděpodobností?

    Z mého pohledu to, co bylo v původním článku použito byly """odhady""" pravděpodobností. To, že s nimi autor zacházel jako s pravděpodobnostmi je na pováženou. Zkusím vysvětlit proč.

    Představme si, že fyzik by jednou změřil danou veličinu a prohlásil by, že naměřená hodnota je skutečnou hodnotou. Stejně tak autor si tipl jednu hodnotu pravděpodobnosti a tvrdí, že je to skutečná pravděpodobnost. To je z mého pohledu špatně.

    Stejně jako ve fyzice se měří opakovaně a stanovuje se jak střední hodnota tak rozptyl, tak i při myšlenkových experimentech při odhadování pravděpodobnosti by měl brát v úvahu rozptyl odhadů pravděpodobností, který by dal spolehlivost (odhad spolehlivosti) dané pravděpodobnosti.

    A konečně stejně jako ve fyzice se rozptyly v průběhu výpočtu propagují a projeví se v nejistotě výsledku, tak i zde by bylo záhodno učinit to samé. Koneckonců v teorii pravděpodobnosti na to jsou vybudované nástroje.

    Co tím získáme? Lze předpokládat, že získání a (vážené) zprůměrování nám může dát lepší odhad skutečné parciální pravděpodobnosti. Druhak, rozptyl výsledné pravděpodobnosti nám může napovědět, nakolik jsou názory na jednotlivé pravděpodobnosti blízké.

    Samozřejmě pokud budu považovat své odhady za ty nejlepší a nejbližší pravdě, můžu na nějaké odhadování chyb bez výčitek rezignovat.

    A ještě jedna poznámka k rekurzivnímu odhadování pravděpodobností pravděpodobností. V praxi se většinou zastavíme po několika iteracích. Vezměme si odhady volebních preferencí. Z dotazníkového šetření se spočítá průměr a směrodatná odchylka (či odhad konfidenčního intervalu). Průměr je ale jen odhadem střední hodnoty a směrodatná odchylka jen odhadem rozptylu. Odhadem nepřesnosti odhadu rozptylu se už nikdo nezabývá.

    OdpovědětVymazat
  9. No jo, vlamujete se...

    Měřená fyzikální veličina (volební preference) je (jsou) objektivní vlastností zkoumaného systému (populace). Je-li měření zatíženo náhodnými chybami (jakože vždycky je), je jasné, že jeho výsledek je pouze odhadem skutečné hodnoty.

    Není nic jako "skutečná hodnota pravděpodobnosti".

    Pravděpodobnosti (v subjektivistické interpretaci) jsou charakteristiky míry důvěry v danou teorii. Když měříte veličinu, výsledkem je pravděpodobnostní rozdělení jejích hodnot. Je to ve skutečnosti úplnější charakteristika než jen odhad hodnoty a odhad chyby (což jsou pouze dva momenty tohoto rozdělení). Dalším měřením se samozřejmě rozdělení mění a zpravidla zužuje; věta "pokud budu považovat své odhady za ty nejlepší a nejbližší pravdě, můžu na nějaké odhadování chyb bez výčitek rezignovat" zde vytváří absurdně zkreslující obraz celé procedury, jakoby člověk jen tak něco odhadl a dál by s ním nepohnul ani pár traktorů.

    Naprosto není sporu o tom, že průměr dotazníkového šetření není roven správné hodnotě. Je to pochopitelně náhodná veličina, stejně jako výsledky jednotlivých měření. Pouze její pravděpodobnostní rozdělení je užší.

    OdpovědětVymazat
  10. "Pravděpodobnosti (v subjektivistické interpretaci) jsou charakteristiky míry důvěry v danou teorii."

    Souhlasím, můj příspěvek mířil na to, jestli je dobré jako "míru důvěry" používat jen odhad jednoho člověka či jestli nebude užitečnější udělat si širší obrázek (víc hlav víc ví) a ve výsledku to patřičně zohlednit.

    OdpovědětVymazat
  11. Já jsem přece nikde nepsal, že existuje jedna jediná správná "míra důvěry" a to ta moje. Ovšem jaká ta moje míra je, to nejlíp vím sám a nemusím to "odhadovat" (ponechme stranou problémy spojené se spolehlivostí introspekce). Stejně tak i vy znáte své pravděpodobnosti. Několikrát jsem už explicitně napsal, že subjektivistická pravděpodobnost je, světe div se, subjektivní, a záleží přinejmenším na dostupných informacích.

    Pokud se pravděpodobnostní rozdělení různých lidí liší, říká se tomu nesouhlas, a správně by tak měla následovat diskuse. V ideálním případě se v diskusi vymění relevantní informace, zmizí tak asymetrie a pohledy se sblíží a zpravidla zpřesní (více informace obvykle zvyšuje přesnost úsudku).

    OdpovědětVymazat
  12. > Kdybyste neznal Newtonovy zákony, rovnoměrné rozdělení byste si nedovolil předpokládat? Pokud ano, tak jaká konkrétní znalost o fyzice je zde podstatná?

    Presna znalost Newtonovych zakonu ani neni treba, staci intuitivni znalost fyziky primarne na to, aby clovek mohl usoudit, jake faktory jsou pro vysledek relevantni a jake ne. Tedy napr. ze vysledek ovlivnuje (a to dost chaoticky) sila a smer hodu, povrch a hmotnost kostky a dalsi podobne faktory, ale uz ne prani osoby stojici opodal ci samotna hodnota cisla napsaneoh na stene kostky (tedy sam vesmir nema apriorni bias pro treba jednicku). Pokud je videt, ze relevantni faktory nemaji systemovy bias pro nekterou z voleb, pak asi jde udelat 'kvalifikovany odhad' ze vysledek bude mit rovnomerne rozdeleni (samozrejme, pokud budu chtit vetsi uroven jistoty, pak by to bylo dobre snazit empiricky 'potvrdit'). Zrovna u te kostky mohou byt faktory, ktere maji bias (napr. puvodni drzeni kostky) a hlubsi fyzikalni analyza je asi dost slozita a je tedy mozne, ze ten odhad zanedbal neco, co nemel.

    Narozdil treba od toho stolu z clanku nebo pristroje se zarovkami z meho puvodniho komentare, kde clovek neni schopen ani odhadnout faktory, ktere na vysledek pusobi, a nema tedy zadnou sanci udelat smysluplny odhad pravdepodobnosti.

    Kazdopadne je rozdil, kdyz rikam ze muj odhad pravdepodobnosti je X (a tedy ten odhad se muze mylit a ve skutecnosti by mela byt jina hodnota) a kdyz rikam moje 'subjektivni pravdepodobnost' je X.

    > Můžete uvést příklad dokazatelného a nezávislého tvrzení, která obě spadají do logiky a přitom nikoli do empirických věd?

    Treba v Robinsonove axiomatizaci prirozenych cisel (Robinsonove aritmetice) je mozne dokazat napr. tvrzeni 'existuje x, ze x*x=x+x', ale uz v ni nelze dokazat napr. 'pro kazde x,y plati x+y=y+x' (a nelze ho ani vyvratit, resp. dokazat negaci, je tedy nezavisle). Druhe tvrzeni lze dokazat v silnejsi Peanove aritmetice (ta je obohacena o matematickou indukci), v ni uz lze dokazat mnoho beznych beznych vet aritmetiky. Tvrzeni nezavisle v Peanove aritmetice je treba Goodsteinova veta, viz http://en.wikipedia.org/wiki/Goodstein%27s_theorem .

    (tedy striktne vzato to nejsou priklady z logiky, ale z deduktivnich teorii zalozenych na logice)

    > Bayesovská pravděpodobnost není nic jiného než kvantifikace těch stupňů šedi.

    Ono je otazka, jestli pak konkretni hodnota takoveho cisla ma nejaky realny smysl. Napr. p-hodnoty v statistickych testech maji vcelky jasny smysl, zatimco davat tomu nejakou subjektivni pravdepodobnost bez jasneho modelu uz moc smysl mit nemusi.

    BTW, u toho prikladu se stolem je jeste jedna (asi) dezinterpretace - to, ze podminene pravdepodobnosti jsou neintuitivni a ze se mohou menit s kazdou dalsi dodanou informaci je nijak nedela 'subjektivni'. Jsou stejne 'objektivni' jako ty ne-podminene - kdyby ten priklad byl presne zadany, tak k presne stejnemu vysledku dojde jak Franta, tak Pepa (za predpokladu, ze oba dobre rozumeji pravdepodobnosti).

    > nazývá se to "zákon velkých čísel", a můžete to brát jako empirický fakt o světě

    BTW, zakon velkych cisel (stejne jako jeste zajimavejsi centralni limitni veta) jsou deduktivne dokazana tvrzeni teorie pravdepodobnosti, ne empiricke fakty.

    OdpovědětVymazat
  13. "Napr. p-hodnoty v statistickych testech maji vcelky jasny smysl, zatimco davat tomu nejakou subjektivni pravdepodobnost bez jasneho modelu uz moc smysl mit nemusi."

    Smysl p-hodnoty (pravděpodobnost získání stejného nebo výraznějšího výsledku za předpokladu platnosti nulové hypotézy) závisí jednak na výběru nulové hypotézy a především pak na interpretaci pojmu "stejný nebo výraznější výsledek". Standardní příklad: testuji férovost mince (nulové hypotéza) a hodím šestkrát, padne mi pětkrát líc a potom rub. Je to statisticky významný důkaz pro to, že mince má bias na líc, řekněme na úrovni 0.05? Záleží na tom, zda extrémnější výsledek znamená "v rámci šesti hodů alespoň pět líců", nebo třeba "alespoň šest hodů potřebných k tomu, aby padl rub". V prvním případě p=0.109, v druhém p=0.031.

    Krom toho, bayesovským ekvivalentem p-hodnot jsou věrohodnostní poměry, nikoli samotné pravděpodobnosti.

    "Jsou stejne 'objektivni' jako ty ne-podminene - kdyby ten priklad byl presne zadany, tak k presne stejnemu vysledku dojde jak Franta, tak Pepa (za predpokladu, ze oba dobre rozumeji pravdepodobnosti)."

    Subjektivita se skrývá v apriorních pravděpodobnostech. V daném příkladu je tato zadána, což subjektivitu eliminuje.

    "BTW, zakon velkych cisel (stejne jako jeste zajimavejsi centralni limitni veta) jsou deduktivne dokazana tvrzeni teorie pravdepodobnosti, ne empiricke fakty."

    Máte pravdu. Měl jsem přesněji napsat, že aplikovatelnost zákona velkých čísel (respektive axiomů, na kterých stojí teorie pravděpodobnosti) pro popis široké třídy jevů lze považovat za empirický fakt.

    OdpovědětVymazat
  14. "Pokud je videt, ze relevantni faktory nemaji systemovy bias pro nekterou z voleb, pak asi jde udelat 'kvalifikovany odhad' ze vysledek bude mit rovnomerne rozdeleni"

    Neznamená zde absence systémového biasu totéž, co postulované rovnoměrné rozdělení? Tj., neříkáte vlastně něco jako "pokud je vidět, že lze očekávat rovnoměrné rozdělení, pak lze očekávat rovnoměrné rozdělení"?

    "Narozdil treba od toho stolu z clanku nebo pristroje se zarovkami z meho puvodniho komentare, kde clovek neni schopen ani odhadnout faktory, ktere na vysledek pusobi, a nema tedy zadnou sanci udelat smysluplny odhad pravdepodobnosti."

    Postavím před vás onen stůl, akorát s tím, že vám zaručím 100% pravděpodobnost, že v jedné zásuvce z osmi je tisícikoruna. Faktory, které mě vedly k výběru této zásuvky, stejně jako můj systémový bias, jsou vám samozřejmě neznámy. Když mi zaplatíte částku x, dostanete možnost otevřít dle vlastního výběru právě jednu zásuvku a odnést si její obsah. Jaká je nejvýšší hodnota x, pro kterou na obchod přistoupíte?

    OdpovědětVymazat
  15. > Neznamená zde absence systémového biasu totéž, co postulované rovnoměrné rozdělení? Tj., neříkáte vlastně něco jako "pokud je vidět, že lze očekávat rovnoměrné rozdělení, pak lze očekávat rovnoměrné rozdělení"?

    Je tam implikace, ne ekvivalence. Napr. pulka faktoru muze mit systemovy bias na jednu stranu a druha pulka na druhou a budou tak dobre vyvazene, ze ve vysledku vyjde rovnomerne rozdeleni. Nebo mezi temi faktory mohou byt slozite vztahy. Rozdeleni je proste zaver.

    > Postavím před vás onen stůl, akorát s tím, že vám zaručím 100% pravděpodobnost, že v jedné zásuvce z osmi je tisícikoruna. Faktory, které mě vedly k výběru této zásuvky, stejně jako můj systémový bias, jsou vám samozřejmě neznámy. Když mi zaplatíte částku x, dostanete možnost otevřít dle vlastního výběru právě jednu zásuvku a odnést si její obsah. Jaká je nejvýšší hodnota x, pro kterou na obchod přistoupíte?

    No, v takto formulovane uloze se zcela vyhnu nutnosti odhadovat pravdepodobnosti jednotlivych zasuvek tim, ze zasuvku zvolim rovnomerne nahodne (napr. hodem kostkou). Tim budu mit zaruceno, ze pravdepodobnost, ze jsme oba vybrali stejnou, bude prave 1/8, a, zanedbam-li risk aversion a namahu s tim spojenou, x je 125.

    OdpovědětVymazat
  16. No, v takto formulovane uloze se zcela vyhnu nutnosti odhadovat pravdepodobnosti jednotlivych zasuvek tim, ze zasuvku zvolim rovnomerne nahodne (napr. hodem kostkou). Tim budu mit zaruceno, ze pravdepodobnost, ze jsme oba vybrali stejnou, bude prave 1/8, a, zanedbam-li risk aversion a namahu s tim spojenou, x je 125.

    Dobrý úhybný manévr :)

    Zkusme to jinak: Osoba A schová tisícovku do některé ze zásuvek. Osoba B potom jednu ze zásuvek označí fixou. A a B spolu nijak nekomunikují a nejsou si vědomy účelu celé akce (prostě dostaly instrukci schovat tisícovku, resp. namalovat značku). Když zaplatíte částku x, máte možnost otevřít označenou zásuvku a odnést si obsah. Kolik je nejvyšší x tentokráte?

    OdpovědětVymazat
  17. > Dobrý úhybný manévr :)

    To je standardni postup v randomizovane analyze algoritmu - o distribuci moznych vstupu se typicky neda cokoliv predpokladat (takze se obvykle bere nejhorsi mozny pripad), zato je mozne vybavit algoritmus vlastnim (pseudo)nahodnym generatorem se znamym rozdelenim a pocitat stredni hodnoty napr. casove slozitosti vuci nemu.

    > máte možnost otevřít označenou zásuvku a odnést si obsah. Kolik je nejvyšší x tentokráte?

    Tezko rict, takove hre uz moc nerozumim (nejsem schopen odhadnout pravdepodobnosti). I kdyz samotne tvzeni "nejsou si vědomy účelu celé akce (prostě dostaly instrukci schovat tisícovku, resp. namalovat značku)." uz dava mnohem vic informaci (a spis bych z nej hadal rovnomerne), nez puvodni formulace bez toho.

    Zkusil bych formulovat jinou hru.

    Mame A a B a stul s deseti (!) zasuvkama. Opet A schova tisicovku a B oznaci zasuvku, pri shode vyhrajes tisicovku. Oproti minule uloze ma hra sto kol, v kazdem kole muzes ucastnit, kdyz zaplatis castku x_i, ale vysledky jednotlivych kol se dozvis az na uplnem konci. Mas zaruceno, ze A pouzije ve vsech kolech stejne rozdeleni, stejne tak B, ale A muze mit jine rozdeleni nez B (ale, stejne jako v predchozim priklade, o techto rozdelenich nic nevis a A i B nejsou navzajem domluveni). Dale ma zaruceno, ze vsechny volby jsou navzajem i dohromady nezavisle (tedy jak volba A proti volbe B, tak volba A v jednom kole proti volbe A v jinem, stejne tak vsechny dalsi).

    Otazky jsou:

    1) kolik je tve x_i v jednotlivych kolech? Je stejne pro ruzna i? Pokud ne, proc?

    2) pokud by namisto vyplaty za kazdou shodu A i B byla jedna sazka (s nekym uplne jinym, stejne neinformovanym/nedomluvenym) takova, ze vyhrajes tisickovku pouze v pripade, kdyz celkovy pocet shod v tech kolech bude 9,10 nebo 11. kolik by bylo tve x pro ucast v takove sazce? (FYI, pokud bych predpokladal rovnomerne rozdeleni u A i B, tak by tohle melo byt v cca 38 % pripadu)

    3) pokud bys v 1) odpovedel podle predpokladu o rovnomernem rozdeleni u A ci B, zatimco v 2) jinak, neni potom problem v tom, ze takto pojate subjektivni pravdepodobnosti nejsou jen interpretaci matematicke pravdepodobnosti, ale chovaji se nekonzistente s matematickymi pravidly pro pravdepodobnost? (tato otazka je chytak)

    OdpovědětVymazat
  18. Tezko rict, takove hre uz moc nerozumim (nejsem schopen odhadnout pravdepodobnosti).

    Musí-li se člověk rozhodnout, "těžko říct" nepomůže.

    Co se týká zbytku komentáře, 2) si musím spočítat, a odpověď bude jistě delší, asi na nový článek. (Sakra, chtěl jsem teď psát o tachyonech...)

    OdpovědětVymazat
  19. Hm, abych mohl odpovědět na 2), musel bych být schopen vyčíslit ne zcela pěkný integrál z polynomů stého řádu v dvacetirozměrném prostoru. Nešlo by snížit počet zásuvek na dvě nebo tři a počet opakování hry ze sta na nějakých deset?

    OdpovědětVymazat
  20. Kašlete už na pravděpodobnost, napište o těch tachyonech, jsem na váš postoj zvědav :-) (hlavně v souvislosti s kauzalitou)

    OdpovědětVymazat
  21. Díky za zajímavý článek a za reakci na můj komentář! Článek jsem četl téměř hned po vydání, ale musel jsem si chvíli tříbit názory, abych vůbec věděl, co chci napsat. Bayesovské pojetí pravděpodobnosti nemám příliš načtené, takže se snadno může stát, že budu mimo, ale asi souhlasím, že pokud pravděpodobnosti určují nejlepší odhad učiněný agentem, pak pravděpodobnosti pravděpodobností jsou skutečně totožné s pochybnosti o mentálním stavu agenta a tedy se vyplatí je zahodit. Já jsem ale ve svém komentáři nechtěl nutně pravděpodobnosti pravděpodobností hájit, spíš se mi nepozdával rozhodovací algoritmus jen na základě Bayesova vzorce, protože postrádá odhad spolehlivosti.

    Má otázka by tedy spíše měla být: Jak racionální agent zahrne odhad spolehlivosti v rámci Bayesovy teorie? Příklad: mám se rozhodnout, zda chci začít sázet na zápasy Sparty proti Slávii. O sportu moc nevím a jména obou týmů jsou mi známá a nemám důvod žádný z nich preferovat, takže můj odhad kurzu bude 1:1. Pak přijdu do sázkové kanceláře a na konkrétní zápas bude kurz 1:2,3 na výhru Slávie. Jak odhadnu "sílu" mnou stanoveného kurzu, tedy pravděpodobnost, že můj odhad bude lepší než odhad sázkové kanceláře? Tady ještě mám představu. Budu sestavovat hypotézu sestávající z jednotlivých tvrzení, která ohodnotím pravděpodobností. Budou to tvrzení typu "Jaký je rozptyl her ve fotbale? Jak přesných odhadů jsou lidé schopni? Jaké je procento lidí, kteří jsou schopni nad sázkovou kanceláří udržovat dlouhodobě kladnou střední hodnotu?", apod. Nakonec dojdu k odpovědi na otázku: "Jaká je pravděpodobnost, že se svým kurzem vyhraji proti sázkové kanceláři?" (Je zřejmé, že při zjišťování schopností sázkové kanceláře také posunu svůj odhad kurzu blíže ke 1:2,3 čistě jen proto, že budu věřit v autoritu bookmakerů. Úloha by tedy spíše dávala smysl formulovaná tak, že se na kurz vypsaný sázkovou kanceláří nemohu podívat, než sázku uzavřu.)

    Analogický problém mám i s odhadem u příspěvku o amerických špiónech. Akorát tam svoji hypotézu neporovnávám s odhadem žádného odborníka, takže nemohu sestavit svůj odhad z pravděpodobností, že jsem schopen odhadovat lépe, než on. Musím hodnotit sílu hypotézy nezávisle na odhadech jiných. Máte nějaký nápad, jak sestavit obdobný odhad spolehlivosti, pokud pravděpodobnosti pravděpodobností nejsou schůdnou cestou?

    Díky.

    OdpovědětVymazat
  22. Jak odhadnu "sílu" mnou stanoveného kurzu, tedy pravděpodobnost, že můj odhad bude lepší než odhad sázkové kanceláře?

    Co přesně znamená "lepší odhad"? Pokud to znamená "odhad založený na lepších informacích", pak musíte posoudit, nakolik je pravděpodobné, že jste vzal v úvahu (správným způsobem) nějakou informaci, kterou bookmaker ignoroval (plus samozřejmě máte k dispozici bookmakerův odhad, který můžete vzít v úvahu). Otázka ovšem je, k čemu je vám tato pravděpodobnost dobrá. Představte si, že víte, že bookmaker je idiot a určuje kursy pomocí náhodného generátoru. Pak je váš odhad v popsaném smyslu zcela jistě lepší (nebo aspoň ne horší) než jeho, ale pořád vám to neříká, jestli máte vsadit na Spartu nebo Slavii. K tomu potřebujete pravděpodobnost, že Sparta vyhraje, resp. prohraje.

    Pokud "lepší odhad" znamená něco jiného, napište co.

    "Jaká je pravděpodobnost, že se svým kurzem vyhraji proti sázkové kanceláři?"

    Co znamená "se svým kurzem"? Hrajete podle bookmakerova kurzu (aspoň tak se to normálně dělá). Pravděpodobnost, že vyhrajete, je totožná s pravděpodobností, že si vsadíte na správnou variantu. K tomu vám zase stačí znát pravděpodobnosti výhry jednotlivých mančaftů.

    "Úloha by tedy spíše dávala smysl formulovaná tak, že se na kurz vypsaný sázkovou kanceláří nemohu podívat, než sázku uzavřu."

    To je jiná úloha; tady byste si musel vymyslet pravděpodobnostní rozdělení přes jednotlivé bookmakerovské kursy, abyste vůbec spočítal svůj střední zisk (výhra závisí pochopitelně na kursu). Tato úloha je složitější, ale sázkaři před ní zpravidla nestojí. Je hloupost ignorovat informaci, kterou při sázení máte vždy k dispozici.

    Přijde mi, že vycházíte z tohoto modelu:
    1. racionální agent si nejdřív určí pravděpodobnost výhry Slavie
    2. pak vleze do sázkové kanceláře, kde se koukne, jaký je vypsaný kurs na výhru Slavie
    3. z něho si spočte, jakou pravděpodobnost kancelář přikládá výhře Slavie
    4. nějak si odhadne pravděpodobnost, že jeho vlastní pravděpodobnost výhry Slavie je lepší, než stanovisko kanceláře
    5. pokud je tato pravděpodobnost dostatečně vysoká (tj. věří si proti kanceláři), spočte si se svou vlastní pravděpodobností a vypsanými kursy střední zisk ze sázky na Slavii
    6. vyjde-li kladný, vsadí na Slavii

    Ve skutečnosti je to jednodušší:
    1. agent vleze do sázkové kanceláře, kde se koukne, jaký je vypsaný kurs na výhru Slavie
    2. z něho si spočte, jakou pravděpodobnost kancelář přikládá výhře Slavie
    3. bera to v úvahu, určí si svou pravděpodobnost výhry Slavie
    4. spočte si se svou vlastní pravděpodobností a vypsanými kursy střední zisk ze sázky na Slavii
    5. vyjde-li kladný, vsadí na Slavii

    Pokud je agent přesvědčen, že kancelář je výrazně kvalifikovanějším expertem než on sám, pak v bodě 3 získá pravděpodobnost, která bude hodně blízká odhadu kanceláře, a protože kancelář vždy vypisuje kursy lehce nevýhodně pro sázející, vsadit si, souhlasím-li s odhadem kanceláře, se nevyplatí.

    (Ve věci špionů podobné expertní stanovisko nebylo známo, proto jsem se k němu nemohl přiklonit.)

    Co se týká kvantifikace bodu 3, tj. jak konkrétně započítat expertní stanovisko sázkové kanceláře, činí se to zase pomocí Bayesova vzorce (jak jinak):

    p(výhra Slavie) = p0(výhra Slavie) p(kurs na výhru Slavie je 1:2,3 | výhra Slavie) / (čitatel + p0(nevýhra Slavie) p(kurs na výhru Slavie je 1:2,3 | nevýhra Slavie))

    Podmíněné pravděpodobnosti plynou z agentova modelu fungování sázkových kanceláří, v absenci přesnějšího modelu je docela rozumné je vytáhnout z dlouhodobých četností (tj. p(kurs na výhru Slavie je 1:2,3 | výhra Slavie) získám z podílu počtu případů, kdy Slavie vyhrála a byl na ni vypsán kurs 1:2,3 k celkovému počtu případů, kdy na ni byl vypsán tento kurs. Samozřejmě, pokud nemám důvod podezřívat bookmakera z nějakého slávistického biasu, můžu místo toho vzít, jak často libovolný tým vyhraje, když je na něj kurs 1:2,3; tím mám k dispozici větší statistiku.

    OdpovědětVymazat
  23. p0 v komentáři výše jsou apriorní pravděpodobnosti, tj. před započítáním informace skryté v kanceláří vypsaném kursu.

    OdpovědětVymazat
  24. oprava: v posledním odstavci místo "k celkovému počtu případů, kdy na ni byl vypsán tento kurs" má být "k celkovému počtu zápasů, které vyhrála (a byl na ni vypsán jakýkoli kurs)"

    OdpovědětVymazat