pátek 25. února 2011

O tom, jak formulace problému určuje jeho řešení


Řekněme, že v obci s 600 obyvateli vypukne závažná epidemie smrtelné nemoci, a nabízejí se dvě strategie, jak proti ní bojovat.

  • Strategie A zachrání 200 životů.
  • Strategie B může zachránit všech 600 životů, ale existuje dvoutřetinová pravděpodobnost, že plán totálně selže a nebude zachráněn nikdo.

Jakou strategii je správné vybrat? Vyberte správné řešení a pak teprve čtěte dál.

Ve studii, kterou prováděli Kahneman a Tversky, dostalo 152 respondentů tuto otázku, a 72% volilo strategii A.

Samozřejmě, co do středního počtu zachráněných životů jsou obě strategie rovnocenné. Proč byla strategie A o tolik populárnější? Možná je to proto, že respondenti byli ve své většině přesvědčeni, že „s lidskými životy se prostě nehazarduje“, a nemáme právo riskovat jistou záchranu 200 lidí kvůli záchraně dalších 400. Možná, podle některých respondentů, se i na lidské životy vztahuje zákon klesajícího mezního užitku, a proto dvě stě životů má vyšší hodnotu, než je třetina hodnoty šesti set životů. Možná měli jiné racionální důvody...

Jiná skupina 155 respondentů ale dostala alternativní výběr:

  • Strategie C povede k tomu, že 400 lidí zemře.
  • Strategie D nabízí třetinovou šanci, že nikdo nezemře, nicméně s dvoutřetinovou pravděpodobností povede ke smrti všech 600 lidí.

V této skupině volilo strategii C 22% respondentů a zbylá většina byla pro D. Není přitom tak těžké uvidět, že první i druhá volba popisují stejnou situaci, přičemž A přesně odpovídá C a B přesně odpovídá D. Jakýkoli aspoň částečně rozumný argument, který vede k preferenci A před B, musí také vést k preferenci C před D. Protože A a B se od C a D liší pouze svou formulací, z výsledků průzkumů tak plyne, že přinejmenším polovina lidí se rozhoduje v podobných situacích iracionálně. Závislost rozhodnutí na způsobu formulace se nazývá efekt rámování.

Konkrétní výsledky popsaných výzkumů jsou standardně vysvětlovány pomocí různého postoje k riziku v případě potenciálního zisku a ztráty. Raději akceptujeme jistotu nízkého zisku, než abychom riskovali pro šanci na vyšší zisk („lepší vrabec v hrsti, než holub na střeše“). Hrozí-li ale ztráta, jsme náchylnější k řešením ve stylu „všechno, nebo nic“. Formulace A a B byly voleny tak, aby vzbuzovaly dojem zisku: životy, které jsou prakticky ztracené, mohou být zachráněny. Formulace C a D naopak akcentovaly ztrátu: lidé mohou zemřít. V obou případech respondenti velmi silně reagovali na jistotu. V tom prvním šlo o jistotu zachráněných životů, což je něco, čeho se znažíme přirozeně dosáhnout, a v druhém o jistou smrt, jíž se přirozeně snažíme zabránit.

Jeden z problémů tohoto druhu uvažování dlí v tom, že kdejaký demagog může ovlivnit naše odpovědi pouhou volbou formulace své otázky. A nemusí přitom ani lhát, ani nic zamlčovat.

Mimochodem, ony „racionální“ důvody, jako že „s životy se nehazarduje“, samy o sobě nejsou příliš racionální. Pokud nevěříte, zkuste celou situaci zarámovat ještě trochu jinak. Totiž, zvolíme-li řešení A (respektive C), musíme nějak vybrat těch 200 zachráněných, a jako vcelku férový způsob se nabízí losování. Pro každého z šesti set ohrožených tak obě dvě strategie představují, z ryze individuálního hlediska, třetinovou šanci na přežití. Jediný rozdíl je, že v případě strategie B/D mám jistotu, že pokud přežiji, přežijí i všichni ostatní, zatímco v případě A/C vím, že i když budu mít štěstí, bude můj život pokračovat ve zdecimované komunitě. Zde předpokládám, že tváří v tvář této volbě by většina lidí dala přednost variantě B/D, ať už akcentujeme možnost záchany, či naopak možnost smrti. Ale mohu se mýlit.

Krásnou ilustrací problému je další průzkum z dílny Kahnemana a Tverského, ve kterém tentokráte jedna skupina subjektů měla rozhodnout ve dvou dilematech:

1. Vyberte z následujících možností:

  • E. Jistý zisk 240 USD.
  • F. 25% šance na zisk 1000 USD.

2. Vyberte z následujících možností:

  • G. Jistá ztráta 750 USD.
  • H. 75% riziko ztráty 1000 USD.


Jak asi očekáváte, v otázce I většina (84%) volila možnost E a v otázce II většina (87%) volila možnost H. Obě otázky byly prezentovány naráz, takže krom toho, že tady nelze nabízet vysvětlení opírající se o různé složení testovaných skupin, nelze se ani vymlouvat na to, že si respondenti neuvědomili možnost alternativní formulace. A pokud to stále nevypadá dostatečně iracionálně, pak vězte, že 73% respondentů volilo kombinaci EH, zatímco pouhá 3% volila FG. Problém je v tom, co tyto volby znamenají v kombinaci.

  • E+H = 25% na výhru 240 USD a 75% na ztrátu 760 USD.
  • F+G = 25% na výhru 250 USD a 75% na ztrátu 750 USD.


Jak pofidérním cílem je dosažení jistoty lze vidět i na příkladě jiného jevu, kterému se říká Allaisův paradox. V tomto případě byl dotazovaným předložen výběr mezi dvěma loteriemi:

  • V „loterii“ I účastník s jistotou vyhraje deset milionů. (Je diskutabilní, zda slovo „loterie“ je zde adekvátní, ale pro přehlednost nebudu vymýšlet jiný název.)
  • V loterii J účastník vyhraje s 89% šancí deset milionů, s 10% šancí 50 milionů a zbylé jedno procento pokrývá riziko odchodu s prázdnou.

Obě loterie jsou velmi výhodné - za předpokladu, že hráč nemusí nic vložit - ale která je výhodnější? Většina lidí volí loterii I. Střední výhra v I je 10 milionů, v J pak plných 13,9 milionu. To ještě neznamená, že populární volba je iracionální; pořád ještě může zasáhnout klesající mezní užitek. Možná, že prvních deset milionů má pro mnoho lidí mnohem vyšší cenu, než dalších čtyřicet. Z prvního desetimilionu zplatíme dluhy, koupíme si auto a byt a ještě uspoříme na důchod. Za čtyřicet dalších nakoupíme pouze relativně nepotřebné luxusní zboží.

Pak ale přijde jiná nabídka; nabídka volit mezi těmito dvěma loteriemi:

  • V loterii K je 11% šance na výhru deseti milionů a 89% šance odejít s prázdnou.
  • V loterii L je 10% šance vyhrát padesát milionů a 90% šance odejít s prázdnou.

Tady naprostá většina volí možnost L. Koneckonců, střední výhra z L je 5 milionů, zatímco střední výhra v K je „pouhých“ 1 milion 100 tisíc. Dávat přednost I před J a zároveň L před K je ale nekonsistentní.

Nekonsistence je lépe patrná, když uvážíme losování pomocí dvou pytlů s kuličkami. V prvním je 89 černých a 10 bílých. V druhém 10 zelených a 1 červená kulička. Dojde-li k losování z druhého pytle, tažení zelené kuličky zajistí výhru 50 milionů, tažení červené znamená nulu. Výsledek losování z prvního pytle pak závisí na zvoleném schématu:

  • I: černá = 10 milionů, bílá = 10 milionů.
  • J: černá = 10 milionů, bílá = losování z druhého pytle
  • K: černá = nic, bílá = 10 milionů
  • L: černá = nic, bílá = losování z druhého pytle

Snadno ověříme, že skutečně toto schéma reprodukuje rozdělení pravděpodobností uvedené výše.

Možnosti I a J se vzájemně liší pouze hodnotou bílé kuličky, stejně tak jako možnosti K a L. Když se rozhodujeme mezi I a J, otázka je, zda losování z druhého pytle má vyšší hodnotu než deset milionů. Tatáž otázka ale figuruje v rozhodování mezi K a L. Jak je možné, že v prvním případě je odpověď většiny lidí kladná a v druhém záporná?

A nakonec obligátně: jak se podobným psychologickým efektům bránit? Především, vyplatí se pamatovat na to, že na většinu situací s potenciálním ziskem se dá nahlížet jako na situace s potenciální ztrátou, a naopak. A že pokud jsme ochotni riskovat u ztrát a naopak platit za jistotu u zisků, můžeme díky tomu přicházet o peníze, třeba tak, že dáme přednost volbě E+H před jasně výhodnější F+G z našeho příkladu. A co se týká Allaisova paradoxu: 1% šance na výhru částky X nemusí mít cenu přesně X/100, ale musí mít stejnou cenu, ať už je ono jedno procento rozdílem mezi 10% a 11% šancí, nebo mezi 99% a jistotou.

Pro další čtení odkazuji na články, kterými jsem byl inspirován.
Circular Altruism
The Allais Paradox

úterý 22. února 2011

Lluniau o dde Cymru, y rhan gyntaf


Při procházení starých adresářů mě překvapilo, že tři roky stará složka s fotografiemi pořízenými během zhruba týdne stráveného v Cardiffu je velikostí srovnatelná se složkou s fotografiemi vzniklými za zhruba rok pobytu v Rusku. Buď mě od té doby fotografování omrzelo, nebo jsou britské ostrovy fotogeničtější. Pravděpodobně oboje.

Umístěním myši nad fotografii se objeví popisek.






Cardiff (velšsky Caerdydd) je zhruba třísettisícové město a centrum širší, původně hornické a průmyslové, aglomerace s přibližně jedním milionem obyvatel, což jsou parametry srovnatelné například s Ostravou. Od jeho vzniku v roce 1998 je sídlem velšského parlamentu a vlády. Město působí typicky britským dojmem. Předměstí jsou tvořena ulicemi řadových domků s miniaturními předzahrádkami a centrum je plné viktoriálnské architektury, s občasnou bombardováním vzniklou prolukou vyplněnou brutalistním betonovým monstrem.






Oblasti Cardiffského zálivu (Cardiff Bay / Bae Caerdydd) byla nejvýrazněji poškozenou částí města bombardováním za války. Průmyslovému charakteru čtvrti zasadil ránu z milosti úpadek těžby uhlí v jižním Walesu v sedmdesátých a osmdesátých letech. Jižní část města tak byla po roce 1990 přestavěna a dnes je centrem moderní architektury.




Cardiffem protéká řeka Taff (River Taff / Avon Taf). Řeka byla v 19. století odkloněna a část dnešního centra, včetně nádraží a stadionu Millennium, stojí na místě původního toku. V okolí řeky se rozkládá řada parků. V počátcích průmyslové revoluce bylo zboží přepravováno po řece a paralelně vybudovaných kanálech. Kanály přestaly být využívány s příchodem železnice, některé jejich úseky jsou ale patrné dodnes.






Jižní Wales byl jedním z míst, kde se železniční doprava zrodila, a i po zrušení mnohých tratí v rámci Beechingovy reformy má Cardiff hustou síť příměstských železnic. Tratě se sbíhají na Ústředním nádraží (Cardiff Central / Caerdydd Canolog), které svou velikostí, tvarem a stísněným umístěním v centru města připomíná hlavní nádraží v Brně. Frekvence dopravy je ale v Cardiffu ještě o polovinu vyšší (srov. tabulku odjezdů pro Brno a Cardiff. Nutno přiznat, že v Cardiffu to mají výrazně snažší díky výhradnímu použití ucelených jednotek, především motoráků řad 142 (Pacer) a 150 (Sprinter). Cardiffský uzel není elektrifikován.






| druhá část >>


Poznámky k výslovnosti velšských jmen; souhlásky:
c čteme jako české k (vždy!).
ch čteme jako české ch.
dd čteme jako anglické znělé th, foneticky [ð].
f čteme jako české v.
ff čteme jako české f.
ll je neznělá třená varianta l, foneticky [ɬ]; asi nejobtížnější velšská hláska.
ng je zadopatrové [ŋ], tj. nevyslovujeme g.
ph čteme jako české f.
rh je neznělá varianta r.
si před samohláskami čteme jako české š.
th čteme jako anglické neznělé th, foneticky [θ].

Samohlásky:
u čteme jako české i.
y v poslední slabice slova čteme jako české i, jinak [ə].
w je samohláska, čteme jako české u.
Samohlásky mohou být dlouhé nebo krátké, přičemž existují pravidla určující délku. V místech, kde tato pravidla nefungují, se užívá vokáň â, ê, î, ô, û, ŵ, ŷ pro označení délky, a řidčeji zpětná čárka à, è, ì, ò, ù, ỳ, ẁ naopak pro označení krátkosti samohlásky.
Přízvuk je pohyblivý, a někdy (zřídka) je vyznačen čárkou á, é, í, ó, ú, ẃ, ý.

středa 16. února 2011

Směr času III.


V minulém díle vyvstala otázka po příčině toho, že Vesmír na svém počátku měl nízkou entropii. Slíbil jsem, že se k otázce vrátím, a činím tak dnes.

Především, otázky tohoto typu jsou těžké. Ani ne tak moc protože by vyžadovaly neobvyklé či rozsáhlé znalosti; spíš protože zavádějí do říše spekulativního dumání o prvotních příčinách. Svým způsobem by se mohlo zdát legitimní tuto otázku zahrnout do stejné skupiny s teologickým „jaká je příčina vesmíru“ či metlou filosofie „proč vůbec něco existuje“. Ve všech těchto případech se ptáme na jedinečnou událost, a je prakticky vyloučené, že by se navržené řešení problému dalo přímo experimentálně ověřit.

Když jsem před rokem psal proti antropickému principu, pokoušel jsem se vymezit, co vlastně je možno považovat za platné vysvětlení určitého faktu. Můj názor tehdy byl - a stále je - že vysvětlení musí přinášet novou informaci. K tomu, aby X bylo dobré vysvětlení Y nestačí, že X → Y: výrok Y → Y je pravdivý pro všechna představitelná Y, přeto bylo by absurdní říkat „entropie roste, protože entropie roste“. Aby X bylo vysvětlením Y, musí

  1. buď X být jednodušší (úsporněji, či elegantněji formulované), než Y,
  2. nebo být obecnější než Y, tj. mít i jiné důsledky, které z Y samotného neplynou.

Podmínka X → Y přitom není nutná; stačí, když X zvyšuje pravděpodobnost Y, tedy P(Y|X) > P(Y). Vysvětlení evoluce pomocí teorie přirozeného výběru je příklad převážně prvního typu: přirozený výběr je relativně jednoduchý princip který výrazně omezuje způsob, jakým se organismy vyvíjejí (byť směr vývoje neurčuje jednoznačně). Vysvětlení padání jablek pomocí gravitačního zákona spadá spíše do druhé škatulky, protože gravitační zákon neimplikuje pouze fakt, že jablka padají k zemi, ale i konkrétní zrychlení při pádu, padání ostatních předmětů, pohyby planet a další jevy [*].

Mám trochu potíž představit si vysvětlení nízké počáteční entropie vyhovující prvnímu uvedenému kritériu, protože „Vesmír měl nízkou počáteční entropii“ je relativně jednoduché tvrzení [*]. U druhého kritéria se mi jeví šance přijatelněji, je docela dobře možné, že vypozorujeme nějakou obecně platnou zákonitost, z které by nízká entropie počátečního stavu Vesmíru vyplývala. Určitě jsou vyhlídky na nalezení smysluplné odpovědi lepší, než u otázky „proč vůbec něco existuje“.

Považuji tedy otázku po příčinách nízké počáteční entropie za v zásadě smysluplnou. Přesto, není mi známa žádná odpověď, jež by se kvalifikovala jako vysvětlení prvního či druhého popsaného typu. Naštěstí ale existuje ještě jeden typ „vysvětlení“:

  1. X je platnou odpovědí na otázku po vysvětlení Y, pokud z X plyne, že Y nevyžaduje vysvětlení.

Tento druh „vysvětlení“, který Angličané označují frází explain away, jež pravděpodobně nemá elegantní český ekvivalent, způsobuje to, že namísto odpovědi na kladenou otázku získáme náhled, že tato otázka nemá smysl. Pátrá-li někdo seriózně po tom, jak funguje astrologie, dobere se pravděpodobně podobného „negativního vysvětlení“: astrologie nefunguje. Ne vždycky je možná podobobě lakonická formulace. Složitější negativní vysvětlení zpravidla vyžadují pečlivou demonstraci důvodů, proč neplatí některé intuice, proč daný problém vyžaduje jiný přístup, jakých chyb v úsudku bránících pochopení se obvykle dopouštíme atd.

Pro specifickou orientaci (nebo, chcete-li, šipku) času se přinejmenším jedno negativní vysvětlení nabízí: šipka času je definována směrem růstu entropie. Toto vysvětlení je velmi prosté a má svou logiku: pokud jediný způsob, jak odlišit dopředný směr času od opačného je pozorováním termodynamických systémů, pak není důvod, proč očekávat, že v přírodě existuje nezávislá asymetrie, která shodou okolností bude privilegovat stejný směr. Největším problémem pro toto vysvětlení je naše intuitivní vnímání času jako něčeho absolutního a nezávislého na hmotě. Máme proto sklon si myslet: I kdyby směr růstu entropie byl ve směru do minulosti, naše vnímání času by bylo stále stejné jako dnes - tedy pamatovali bychom si minulost, nikoli budoucnost. Taková úvaha je ale neplatná, protože naše vnímání času existuje pouze v rámci mozku, který podléhá stejným termodynamickým zákonitostem, jako veškerá hmota kolem. Pokud by entropie světa rostla směrem do „minulosti“, pak by i entropie našeho mozku rostla směrem do „minulosti“, a pamatovali bychom si „budoucnost“ (slova „minulost“ a „budoucnost“ píšu do uvozovek, protože v popsaném hypotetickém případě by měly přesně opačné významy - ve skutečnosti by se svět jevil úplně stejný, jako je dnes).

Tím jsme ale nevyřešili otázku, proč entropie vůbec v nějakém směru roste, a proč byla tedy nízká na počátku existence Vesmíru. I zde ale existuje určitá volnost pro negativní vysvětlení, spočívající v manipulaci s časem, kterou se pokusím nastínit.

Od nejstarších dob byl čas vnímán jako něco naprosto nezávislého od materiálního světa. Čas plyne všude stejně rychle, bez ohledu na chování předmětů. Když Newton formuloval své pohybové zákony, považoval čas za absolutní veličinu, která univerzálně parametrizuje pohyb všech objektů. Celá mechanika je o zodpovídání otázek o časovém vývoji:

  • A. „v čase t0 je Jupiter v bodě x0, v jakém bodě bude Jupiter v čase t1?“

Samozřejmě se můžeme ptát i opačně,

  • B. „v jakém okamžiku dojde Jupiter do bodu x1?“

tato otázka ale není moc přirozená; koneckonců se může docela dobře stát, že Jupiter při svém putování prostorem nikdy do bodu x1 nedorazí, nebo jím naopak projde opakovaně; zatímco otázka na polohu ve specifickém čase má garantovanou jednoznačnou odpověď. V tomto systému je pozice x vlastností Jupitera, zatímco čas t je jakýsi vnější parametr, který s Jupiterem nemá nic moc společného. Ve fundamentálních rovnicích mechaniky je neznámou funkce x(t); roli závislé proměnné může nahradit jiná dynamická veličina - energie, hybnost, síla... - ale nezávislou proměnnou je vždy čas.

Specifická role času ve fyzikálním formalismu začala způsobovat potíže s objevením se teorie relativity a kvantové mechaniky. V prvním případě z toho důvodu, že čas ztratil svůj absolutní charakter. Ukázalo se například, že pojem časového intervalu uplynuvšího mezi dvěma událostmi není možné smysluplně jednoznačně definovat: různí pozorovatelé naměří různé časy, byť pro ně platí stejné fyzikální zákony. V druhém případě problém vznikl tím, že v kvantovém formalismu dynamické proměnné již nejsou reprezentovány čísly, ale lineárními operátory, zatímco čas zůstal ve své staré podobě číselného parametru. Běžně užívaný kvantový formalismus je díky tomu velmi dobře uzpůsoben pro otázky typu A, zatímco odpovídat na otázky typu B (a obecně cokoli co se týká měření času) je očistec. No a když přijde řeč na kombinaci kvantové mechaniky a teorie relativity, objeví se různé nepříjemné paradoxy.

Část problémů vymizí, přejde-li se od mechaniky k teorii pole, kde prostorové souřadnice hrají stejnou roli jako čas. Přesto, je téměř bezesporné, že žádná prostoročasová souřadnice (tedy ani x, ani t) nemá absolutní fyzikální význam. Víme to především kvůli platnosti obecné teorie relativity. Obecná relativita se vyznačuje symetrií, která se nazývá obecná kovariance, a říká, že nezávisle na tom, jaké vybereme souřadnice pro popis časoprostoru, rovnice mají pořád stejný tvar. V newtonovské fyzice máme svobodu mnohem omezenější: můžeme otáčet a posouvat prostorovými osami a měnit jednotky délky, a můžeme zvlášť posouvat časovou osu a měnit jednotky času. Když ale začneme mixovat časové a prostorové proměnné, jako například při přechodu do rotující souřadné soustavy, což de facto není nic jiného, než změna souřadnic v časoprostoru



změna nás nutí zavést korekci do Newtonových zákonů v podobě odstředivé a Coriolisovy síly. Natož kdybychom provedli nějaké větší zvěrstvo, například nahradili x a t novými proměnnými a, b podle



Původní rovnice pohybu, v nepřítomnosti síly triviální d2x/dt2 = 0, by se pak změnila k nepoznání na [*]



Formalismus obecné relativity je ale zkonstruován tak, že ani jedna z těchto změn souřadnic, ani jakákoli jiná změna, tvar fyzikálních zákonů nemění. Od proměnných x, y, z, t můžeme tak přejít k jiným proměnným, třeba a, b, c, d, a všechny fundamentální fyzikální zákony zůstanou, jak byly. V Newtonovské fyzice máme možnost rozlišit mezi oběma sadami souřadnic, a můžeme jednoznačně určit, která z nich hraje roli času, právě požadavkem na určitý tvar pohybových zákonů. Mimo jiné to znamená, že v čtyřrozměrném newtonovském prostoročasu každá událost (tj. bod v prostoročasu) jednoznačně určuje třírozměrný podprostor s ní současných událostí. V relativistickém prostoročase současnost jednoznačně definována není.

Vraťme se teď na moment k popisu makrostavů ve statistické fyzice. V minulých dílech jsem vycházel ze zjednodušené představy, že makrostav je množina mikrostavů - čím více mikrostavů se uvnitř makrostavu nachází, tím méně přesně je makrostav určen a tím vyšší má entropii. Ve skutečnosti se ale vyplatí uvažovat o něco obecnější definici makrostavu, ve které má každý mikrostav s navíc přiřazenou váhu ρ(s). Tu můžeme chápat jako pravděpodobnost, že systém v daném makrostavu se ve skutečnosti nachází ve stavu s. Entropie je pak definována formulí



Makrostav je tak zřetelně definován funkcí ρ. Dříve užitá definice makrostavu je pouze speciálním případem s konstantním ρ na nějaké podmnožině fázového prostoru, a nulovým na zbytku.

Extrémně oblíbeným (tj. důležitým) druhem makrostavu je tzv. kanonický soubor. Kanonický soubor je makrostav, který má nejvyšší entropii mezi všemi makrostavy se zvolenou střední energií. Energii na mikrostavech měří Hamiltonova funkce H(s) (zkráceně Hamiltonián), a kanonický soubor má



Číslo Z je prozatím nezajímavá konstanta zaručující, že integrál z ρ je roven jedné a T má význam teploty daného makrostavu [*]. Podstatnější ale je Hamiltonián H. Pomocí něho, s užitím Hamiltonových rovnic, lze spočítat časový vývoj systému. A to jednoznačně, bez jakýchkoli pochyb o tom, jaká proměnná hraje roli času.

Hamiltonovský formalismus totiž narušuje relativistické symetrie. Pokud jej používáme pro popis relativistického systému, vybereme nejdřív, jakou proměnnou budeme považovat za čas, a potom zkonstruujeme Hamiltonián (výsledek bude záviset na volbě času). Pak můžeme nadefinovat rozdělovací funkci ρ kanonického souboru (výsledek opět závisí na tom, jak jsme zvolili čas). Vtip je v tom, že to lze i obráceně - z ρ spočítat H, a odtud určit, jaká proměnná hraje roli času.

Postulát statistické mechaniky říkající, že každý systém, necháme-li jej svému osudu, se vyvine do stavu s maximální entropií - což zpravidla znamená do kanonického souboru - se tak začíná jevit mnohem prázdnějším, než by se mohlo zdát na první pohled. Ať už se totiž systém vyvine do jakéhokoli makrostavu, z jeho rozdělovací funkce vždy můžeme spočítat Hamiltonián a určit časovou proměnnou tak, aby tento makrostav byl kanonickým souborem. Entropie tak vlastně roste vždy a za jakýchkoli okolností jenom díky tomu, že to, co je subjektivně vnímáno jako čas, je určeno termodynamickými vlastnostmi světa. Toto je v zásadě Rovelliho hypotéza termálního času.

Hypotéza termálního času není asi úplně neprůstřelná ani definitivní. (Napadá mě řada námitek, ale jednak je nemám moc promyšlené, a dnešní článek jest už dost dlouhý i tak, takže je sem nebudu psát.) Přesto nabízí zajímavou perspektivu pro pohled na otázku směru času.



<< předcházející část |


Poznámky:
Dnes tu nic není!

sobota 12. února 2011

Etymologický zpravodaj - K

Pod písmenem K rozebereme dnes původ tří slov. První je králík. Pochází z latinského cuninculus, odkud vzniklo středoněmecké küniclin (a z toho dnešní Kaninchen). Toto slovo bylo dezinterpretováno jako zdrobnělina ke kuninc (dnes König) = král. Odktu překladem vznikla česká podoba.

Druhým slovem je kalkulačka. Latinské calculus původně znamenalo „vápenný kamínek“, od calx = vápno. Římská počítadla se dělala z vápence.

Třetí v pořadí je sloveso koupat se. Existuje teorie, že toto slovo pochází ze slova konopí, poněvadž konopí se sušilo v parní lázni[*], případně se konopná semena v parní lázni sypala na kamna pro vyvolání omamných účinků.

úterý 8. února 2011

Zločin a statistika



Smrt jednoho je tragédie. Smrt milionu je statistika. (údajně J.V.Stalin)

Věřím jen té statistice, kterou si sám zfalšuji. (údajně W.S.Churchill) [1]


Statistika má špatnou pověst. Kromě toho, že je považována za nudnou, nevzbuzuje ani příliš mnoho důvěry. Svým způsobem je to paradox: statistické metody by měly sloužit k snažší extrakci pravdy z dat, ve kterých není možné se vyznat na první pohled. Přesto, statistiku je možné (vědomě i nevědomě) použít k transformaci pravdivých údajů v naprostou lež. V tomto článku se podíváme na dva způsoby, jakými je možno spáchat takový statistický „zločin“.

Simpsonův paradox
V letech 1972-1994 byla v Británii provedena studie zkoumající vliv kouření na dlouhodobé přežití u žen. Z dotazovaných kuřaček bylo po dvaceti letech mrtvých 24%, zatímco z nekuřaček plných 31%. Tento výsledek jakoby napovídal, že varování „kouření zabíjí“ na krabičkách cigaret nemusí být zcela pravdivé.

Obhájci kouření se mohou odvolat i na jinou statistiku: mezi dětmi narozenými s nízkou porodní vahou je kojenecká úmrtnost nižší, pokud je matka kuřačka. Nízká porodní váha bývá doprovázena zdravotními komplikacemi a zvýšenou kojeneckou úmrtností obecně, a platí to bez ohledu na kouření matky, ale když už má kojenec nízkou porodní váhu, je jeho šance na přežití větší, jestliže jeho matka během těhotenství kouřila [zdroj].

V roce 1973 byla universita v Berkeley obviněna z diskriminace žen při přijímacím řízení. Ovinění bylo založeno na statistice: z 8442 mužů hlásících se na universitu bylo přijato 44%, zatímco z 4321 žen pouze 35%. Rozdíl byl natolik výrazný, že jej lze těžko označit za náhodu.

Není asi vyloučeno, že by na Berkeley v sedmdesátých letech minulého století upřednostňovali muže, ale první dva příklady vypadají jako propaganda z dílny tabákové lobby. Ve skutečnosti mají všechny tři příklady společného jmenovatele: pravdivé informace v nich obsažené zdánlivě implikují závěr, který je napravdivý. Jedná se o příklad Simpsonova paradoxu.

Paradoxnost Simpsonova paradoxu vynikne při pohledu na informace o počtu přijatých uchazečů o studium na Berkeley rozepsané pro jednotlivé studijní obory zvlášť (data pro šest největších oborů ze sto jednoho):




obor muži ženy
zájemců přijatých úspěšnost zájemkyň přijatých úspěšnost
A 825 512 62% 108 89 82%
B 560 313 56% 25 17 68%
C 325 120 37% 593 202 34%
D 417 138 33% 375 131 35%
E 191 53 28% 393 94 24%
F 373 22 6% 341 24 7%
A-F 2691 1158 43% 1835 557 30%



Z tabulky je patrné, že na většině oborů jsou úspěšnější ženy. Muži jsou na tom lépe pouze v oborech C a E, a i tam je jejich převaha relativně malá (37:34 a 27:24). Přesto, v úhrnném výsledku, muži vítězí jasně 43:30. Aby paradox vyniknul ještě lépe, zkusme uměle snížit počet úspěšných mužů v oborech C a E na 100 a 40; jejich relativní úspěšnost by pak byla 30% a 21%. V tomto hypotetickém případě by na jednom každém oboru z šesti sledovaných byly ženy úspěšnější než muži, a přesto, v celkovém součtu, by úspěšnost mužů byla stále téměř 42% - tedy výrazně více, než 30% u žen!

Při bližším pohledu na data je patrné i vysvětlení paradoxu. Obory C a E, kde byla šance na přijetí nízká, byly velmi populární mezi uchazečkami, zatímco jejich mužští kolegové se ve velkém hlásili na obor A, kam se dostat bylo relativně snažší. I když si tedy v rámci jednotlivých oborů ženy vedly zpravidla o něco málo lépe, jejich celková úspěšnost odrážela především výsledky z těžkých přijímaček na C a E, zatímco mužská celková úspěšnost byla silně ovlivněna lehkým oborem A.

Podobně se dají vysvětlit i oba kuřácké případy. V prvním z nich hraje roli věk. V době konání průzkumu bylo kouření populární mezi mladými Britkami, zatímco ve starší generaci ženy příliš nekouřily. Množina kuřaček tak byla v průměru mladší, než množina nekuřaček, a z tohoto prostého důvodu byl počet úmrtí během dvaceti let v první skupině nižší. V případě porodní váhy je vysvětlení toto: Kouření matky ve skutečnosti zvyšuje riziko nízké porodní váhy, a tím pádem i riziko úmrtí kojence. Na druhé straně nízká porodní váha nemusí být sama o sobě příčinou úmrtí, může být i doprovodným příznakem jiných zdravotních problémů. Tyto problémy pak mívají v průměru větší šanci kojence zabít, než pouhá nízká váha. Když vybereme pouze kojence s nízkou vahou, pak ve skupině dětí nekuřaček je vyšší procento těch, které mají nízkou váhu v důsledku závažných zdravotních komplikací, prostě proto, že druhá skupina je nafouknuta dětmi, které mají nízkou váhu pouze následkem kouření jejich matky.

Simpsonův paradox může nastat, kdykoli zapomeneme zohlednit tzv. matoucí proměnné. Matoucí proměnnou je vlastnost, která ovlivňuje výsledky analýzy, a její hodnota je rozložena různě v obou porovnávaných skupinách, aniž by to bylo na první pohled vidět. V případu Berkeleyské pohlavní diskriminace byla takovou proměnnou ochota hlásit se na těžké obory, v případě britských kuřaček to byl věk, a v případě nízké porodní váhy to byla četnost nezávislých zdravotních komplikací. Pro vyvození správných závěrů ze statistické analýzy je klíčové, aby porovnávané skupiny byly kontrolovány na výskyt potenciálně matoucích proměnných. V lékařských výzkumech to bývá mnohdy problém.

Lineární regrese

Idea lineární regrese je jednoduchá: máme dvě proměnné x a y, které na sobě závisí (například x je množství vitamínů, které člověk přijme ve formě doplňků (tedy navíc k běžné dávce v potravě) každý den, a y je střední délka života), a chceme zjistit, jak x ovlivňuje y. Závislost by měla být hladká, a nejjednodušší hladká závislost je lineární. Data, která lze získat, jsou nutně zatížena šumem, takže pokud si nakreslíme do grafu množinu bodů, z nichž každý odpovídá jednomu evidovanému člověku (na vodorovné ose jeho průměrná denní dávka vitamínů, na svislé dožitý věk), nic moc z toho nevidíme [*]:





Právě proto se hodí regrese, která dokáže odfiltrovat šum, a ukáže pravou závislost y na x. Ukazuje se, že s rostoucím dávkou vitamínových doplňků délka dožití pomalu klesá. Dá se tedy usoudit, že doplňky škodí a je vhodné se jich vyvarovat.





Takové rozhodnutí je ale ukvapené. Je totiž dost dobře možné, že skutečná závislost není lineární, a užití lineární regrese je tak neoprávněné. Lepší než dlouhé žvanění je třetí graf, ve kterém jsem eliminoval šum:





Teď je očividné, že lineární regrese nejenže odfiltrovala šum, ale odfiltrovala i značnou část podstatné informace o závislosti. Doplňky ve velkém množství skutečně výrazně škodí, ale v malém množství jsou naopak prospěšné, lineární regrese ale tyto efekty zprůměruje do mírné škodlivosti.

(Tento příklad je inspirován kritikou Bjelakovićovy analýzy účinků některých atioxidantů [odkaz] uveřejněné v roce 2007. Osobně jsem nekontroloval věcnou správnost této kritiky, nicméně i pokud v tomto případě byla kritizovaná studie v pořádku, obecné varování před zbrklým užitím lineární regrese platí.)

Zločinů proti statistice je pochopitelně více, neboť lidé jsou tvořiví, nicméně moje ochota psát se pro dnešek vyčerpala. Do budoucna ale nevylučuji další pokračování na téma tohoto článku.


Poznámky:
1. Oba citáty jsou svým údajným autorům připisovány neprávem. Původ prvního citátu o smrti a statistice není jasný, ale neexistuje doklad toho, že by výrok pocházel skutečně od Stalina (viz též Stalinovu stránku na Wikicitátech a tam uvedené odkazy). Slova o falšování statistiky vložil Churchillovi do úst Josef Goebbels v rámci válečné propagandy.