pondělí 20. září 2010

Konjunkční blud II.

Je nesporné, že pravděpodobnost výroku ve tvaru logické konjunkce, tedy A a zároveň B, je nižší, než pravděpodobnost každého z výroků A, B. Prokázaná tendence lidí ve svých odhadech toto pravidlo porušovat, o niž jsem psal ve včerejším příspěvku, je tedy jednoznačně chybou úsudku. Existuje ale důvod, proč k tak zřetelné chybě dochází?

Výskyt diskutované chyby jsem ilustroval na klasickém pokusu Kahnemana a Tverského, ve kterém byli subjekti seznámeni se stručným fiktivním životopisem ženy, záměrně sestaveným tak, aby vyhovoval představě intelektuálně zaměřené levicové aktivistky. Úkolem bylo pak odhadnout, nakolik jsou pravděpodobná dodatečně nabízená tvrzení o této ženě; jejich seznam obsahoval mimo jiné údaj o tom, že je aktivní feministka, o tom, že pracuje jako pokladní v bance, a nakonec konjunkci těchto dvou faktů, tj. že pracuje v bance jako pokladní, a zároveň je aktivní ve feministickém hnutí. Možnost pokladní byla hodnocena jako méně pravděpodobná než pokladní a feministka devíti subjekty z deseti.

Je možné, že účastníci experimentu špatně pochopili otázku? Jedno z nabízejících se vysvětlení je toto: Stojí-li vedle sebe možnosti X je pokladní a X je pokladní a feministka, je vcelku přirozené tu první interpretovat jako X je pokladní a není feministkou. Sice to není doslovné chápání textu, ale těžko to automaticky odsoudit jako nerozumné. V běžné komunikaci jsme tak jako tak nuceni domýšlet si u přijímaných tvrzení spoustu nevyslovených předpokladů. Trvat na doslovném chápání každého sdělení je možno u soudu, jinde bychom s takovým přístupem byli za idioty. Při popsaném chápání chyba zmizí: je klidně možné, a i pravděpodobné, že mezi pokladními vyhovujícími danému profilu tvoří aktivní feministky většinu.

Byla tedy chyba způsobena nedoslovnou, a přesto rozumnou interpretací nabízených možností? Experimentální data naznačují, že u velké části subjektů nikoliv. V alternativním testu byla první možnost formulována explicitně:
Linda je pokladní v bance, ať už je aktivní ve feministickém hnutí, či ne.
I v tomto případě tři čtvrtiny dotázaných hodnotily toto tvrzení jako méně pravděpodobné, než konjunkci pokladní a feministka. Kahneman a Tversky dokonce provedli další pokus, kde svým subjektům předložili problém v křišťálově průzračné podobě. Namísto původních variant měli dotazovaní zvážit, který z následujících argumentů je přesvědčivější:
  1. Je pravděpodobnější, že Linda je pokladní v bance, než že je feministickou pokladní v bance, protože každá feministická pokladní je také pokladní, ale některé pokladní nejsou feministky, a Linda může být jednou z nich.
  2. Je pravděpodobnější, že Linda je feministickou pokladní, než že je pokladní, protože více připomíná aktivní feministku, než pripomíná pokladní.
Dostavše logickou strukturu problému naservírovanou na stříbrném podnose, stále 65% (!) respondentů dalo přednost chybnému argumentu č.2. Toto číslo se podařilo srazit o dalších 9% poté, co místo "jaká možnost je pravděpodonější" byla zvolena otázka "na jakou možnost byste si spíše vsadili". I když tedy nedoslovnost chápání může hrát svou roli, i při pečlivé formulaci nadpoloviční většina lidí soudí chybně.

Alternativní vysvětlení může vypadat následovně: Při setkání se s novou informací posuzujeme nejen informaci jako takovou, ale i důvěryhodnost zdroje. Člověk, od kterého informace pochází, samozřejmě může lhát, většina nepravdivých tvrzení ale padá na vrub tomu, že rádi mluvíme o věcech, o kterých nic nevíme. A jak poznat, že člověk o tématu něco ví? Podle toho, že je schopen o něm dlouho hovořit. Zasvěcený komentář oplývá detaily, zatímco vágních výroků je schopen i ignorant. Tíhneme proto vkládat v detailní tvrzení větší důvěru než v obecná, a s každou připadnou podrobností se vyprávění stává důvěryhodnějším. Když někdo přijde s neuvěřitelně znějící historkou, zpravidla chceme slyšet podrobnosti.

Víme-li, že Linda vystudovala filosofii a zajímala se o sociální spravedlnost, zdá se nepříliš pravděpodobným, že by si vybrala práci pokladní v bance. Přijde-li někdo s takovou informací, je dost dobře možné, že to má z třetí ruky, či že to sám spletl. Dodá-li ale onen člověk další detail, tj. že Linda je aktivní feministkou, situace se mění. Detailnější informace naznačuje, že mluvčí ví, o čem mluví; možná Lindu sám zná, a i pokud je informace převzatá, sám si jistě všimnul, že pokladní je pro feministickou intelektuálku nestandardní povolání, a pravdivost údaje si ověřil. Je proto možné, že dotazovaní podvědomě posuzovali jiné pravděpodobnosti. Ne pravděpodobnost výroku P = "Linda je pokladní", ale pravděpodobnost výroku "Y mluví pravdu, když říká P". Na první pohled vypadají oba výroky ekvivalentně, ale zatímco všech pokladních nemůže být méně než feministických pokladních, opravdu pronesené věty typu "X je pokladní" mohou klidně být častěji nepravdivé než opravdu pronesené věty typu "X je pokladní a aktivní feministka".

Mohou předcházející odstavce aspoň zčásti vysvětlit výsledky popsaného experimentu? Těžko říct. Stěží ale podobným způsobem vysvětlit výsledky pokusu s posloupnostmi hodů na kostce popsaného v úvodu včerejšího příspěvku. Výsledky všech pokusů lze ale interpretovat standardním způsobem: odvoláním se na tzv. heuristiku reprezentativnosti [1].

Heuristika reprezentativnosti je intuitivní postup, při kterém přiřazujeme pravděpodobnost hypotéze na základě toho, nakolik je podobná známým faktům. Otázku "jak je pravděpodobná hypotéza H, máme-li k dispozici fakta F" automaticky reformulujeme jako "jak se fakta F podobají hypotéze H", či dokonce "jak pravděpodobná jsou fakta F, platí-li H". Sekvence ZČZČČČ je typičtějším výstupem posloupnosti hodů kostkou, která má čtyři zelené a pouze dvě červené stěny, než ČZČČČ. Pokladní je nepravděpodobná profese pro bývalou studentskou aktivistku a absolventku filosofie. Popis feministická pokladní je oproti tomu reprezentativnější, protože aspoň v něčem připomíná fakta známá z životopisu. Používání této heuristiky je přirozené a děje se automaticky, a stejně tak v řadě případů vede k přijetí špatných závěrů. Aspekty heuristiky reprezentativnosti nesouvisející s konjunkční chybou si ponechám na některý z příštích příspěvků.

No a nakonec, jak postupovat, chceme-li se konjunkční chyby vyvarovat? Předpokládám, že po přečtení dnešního příspěvku čtenář již nepadne za oběť experimentálním psychologům a odhalí zradu, budou-li před ním ležet výroky A a A & B. V mnoha situacích ale stojíme před úlohou posoudit věrohodnost pouze A & B, a takové případy mohou být zrádné. V zásadě lze doporučit dvě věci:

Za prvé, být na pozoru před detailními sděleními. Je pravda, že většina lidí nemá odvahu si bohapustě vymýšlet detaily, ale kdo ji má, může toho velmi snadno zneužít. Pamatujte, že každý detail navíc je nezávislé tvrzení, které může být nepravdivé. Z ryze pravděpodobnostního hlediska činí přidání dalšího detailu celou věc méně pravděpodobnou, ne naopak. Stojí-li to za námahu, je dobré si uvědomit logickou strukturu složeného tvrzení, a snažit se posuzovat každou část zvlášť.

Za druhé, o pravděpodobnostech přemýšlet jako o četnostech výskytu, a otázky příslušně přeformulovat. Zaručeně to pomáhá v mnoha pravděpodobnostních úlohách, a možná to léčí i konjunkční blud, viz zde [2].

Poznámky:
1. V odkazovaném článku je zmíněn i další podobný experiment. Respondenti dostali za úkol odhadnout, kolik z cca. dvou tisíc slov obsažených na čtyřech stránkách anglického textu vyhovuje formě _ _ _ _ i n g. Jelikož koncovka -ing je v angličtině častá, odhady byly relativně vysoké. Střední hodnota byla výrazně vyšší (zhruba třikrát), než u jiné skupiny, která dostala stejně položenou otázku, kde ovšem předložená forma byla _ _ _ _ _ n _. Schéma chyby sice vypadá stejně jako v jiných případech, mám ale podezření, že zde může výraznou roli hrát jiný mechanismus. První šablona je sice specifičtější než druhá, je ale také návodná. Při odpovídání na zadanou otázku se člověk přirozeně snaží vzpomenout na vyhovující slova, a to jde o dost snadněji, když si uvědomí, že zadání se dá "ošulit" užitím frekventované přípony. Trochu mi to připomíná, jak jsem sám výrazně upravil (směrem nahoru) svůj odhad frekvence výskytu digramu v českých textech poté, co jsem byl upozorněn na tvar "žirafě".
2. Je-li otázka formulována "kolik ze sta lidí vyhovujících popisu je 1) pokladní, 2) pokladní a feministka", druhá možnost je hodnocena jako četnější jen menšinou dotazovaných. Debata pod odkazovaným článkem vedla jeho autora k tomu, že plně opustil svou původní interpretaci tohoto efektu, nicméně poučení, že myšlení v řeči relativních výskytů v podobných pravděpodobnostních úlohách pomáhá najít správné řešení, zůstává relativně nekontroverzní.

Žádné komentáře:

Okomentovat