pondělí 20. září 2010

Konjunkční blud I.

Máte hrací kostku se dvěma červenými a čtyřmi zelenými stěnami. Kostka není nijak upravena, takže se dá předpokládat, že zelená bude padat dvakrát častěji než červená. Za úkol máte si vsadit, že určitá konkrétní sekvence nastane v sérii dvaceti hodů touto kostkou (v případě úspěchu je vyplacena výhra). Můžete vsadit na tyto posloupnosti:
  1. ČZČČČ
  2. ZČZČČČ
  3. ZČČČČČ
Na jakou vsadíte? Vyberte si, a potom čtěte dál.

Posloupnosti dané k dispozici nejsou zvoleny příliš příznivě pro sázejícího, jelikož ve všech dominuje červená, která má oproti zelené poloviční pravděpodobnost. Typická posloupnost bude obsahovat přibližně dvakrát tolik Z než Č, bude tedy vypadat nějak jako ZČZZZČ. Tomu se nejvíc blíží z nabízených sekvencí číslo 2, kde je podíl zelené největší. Nabízí se tedy vsadit na druhou posloupnost, a většina lidí to skutečně tak učiní. Ve studii Kahnemana a Tverského [PDF] se stejně rozhodlo ve dvou skupinách 62 a 65 procent subjektů.

Až na to, že se rozhodli iracionáně. Pravděpodobnost úspěchu při sázce na druhou posloupnost je zhruba 8%, zatímco první posloupnost má asi 13% šanci [1] se objevit v záznamu dvaceti hodů. Samozřejmě, kdyby si účastníci spočítali pravděpodobnosti (mělo to být v jejich silách; popsaný pokus byl proveden na vysokoškolských studentech), chyby by se vyvarovali. Více zarážející je však skutečnost, že většina lidí tuto chybu učinila navzdory tomu, že posloupnost č.1 je podmnožinou posloupnosti č.2. To znamená, že kdykoli série hodů obsahuje druhou posloupnost, nutně obsahuje i tu první;  říct "nastane sekvence 2" je stejné, jako říct "nastane sekvence 1, a navíc při předchozím hodu padne Z". Že je první posloupnost pravděpodobnější je tedy vidět i bez toho, aby člověk pravděpodobnosti přesně spočítal.

Tverského a Kahnemanův článek obsahuje řadu dalších příkladů, kdy lidé konsistentně přiřazují výroku X menší pravděpodobnost, než výroku X a zároveň Y. Nejčastěji citovaným příkladem je tento:
Linda je stará 31 let, svobodná, otevřená a velmi inteligentní. Vystudovala filosofii. Jako studentka se vážně zajímala o problematiku diskriminace a sociální spravedlnosti, a také se účastnila protijaderných demonstrací. [Seřaďte následující výroky od nejpravědpodobnějšího k nejméně pravděpodobnému:]
  1. Linda je učitelka na základní škole.
  2. Linda pracuje v knihkupectví a navštěvuje kursy jógy.
  3. Linda je aktivní ve feministickém hnutí.
  4. Linda je sociální pracovnice v oboru psychiatrie.
  5. Linda je členem Ligy žen - voliček.
  6. Linda je pokladní v bance.
  7. Linda je pojišťovací agent.
  8. Linda je pokladní v bance a je aktivní ve feministickém hnutí.
Ze studentů řadících nabízené alternativy podle pravděpodobnosti téměř 90% hodnotilo možnost č.8 jako pravděpodobnější, než možnost č.6, navzdory tomu, že výrok č.8 je konjunkce výroků č.6 a č.3. Počet pokladních nikdy nemůže být nižší, než počet pokladních, jež jsou zároveň aktivními feministkami. p(P) ≥ p(F & P), ať se děje co se děje.

Na rozdíl od příkladu s hrací kostkou je zde obtížné argumentovat přehlédnutím - výrok č.8 je explicitně formulovaný jako konjunkce dvou prvků, které jsou taktéž oba v seznamu uvedeny. Ani nelze selhání svádět na nevzdělanost. Subjektové byli rozděleni do třech skupin podle počtu kursů statistiky a teorie pravděpodobnosti, jež absolvovali; mezi výsledky jednotlivých skupin nebyl viditelný rozdíl.

Lidé tedy systematicky selhávají v pravděpodobnostních odhadech. Nabízejí se dvě otázky: jak toto selhávání vysvětlit, a jak mu předejít. Odpověď na první z nich do značné míry determinuje odpověď na tu druhou. Spekulovat nad těmito otázkami budu v zítřejším příspěvku.

Poznámky:
1. Nepříliš překvapivě jsem na první pokus spočítal pravděpodobnost špatně: vzal jsem, že posloupnost pěti hodů kostkou je ČZČČČ s pravděpodobností 2:243 (to je ještě pravda), a pak jsem to pouze vynásobil šestnácti (je šestnáct různých pozic, kde se může pětičlenná podposloupnost nacházet v rámci dvacetičlenné posloupnosti), s výsledkem 0,1317 (to už je blbě). Jsem líný popisovat správný postup, ale výsledek je mírně odlišný, a to 435 639 656:3 486 784 401 = 0,1249. Pravděpodobnost výskytu té delší posloupnosti se mi už počítat nechce, už jen proto, že správný výsledek bude stále přibližně roven chybným způsobem získaným 8%.

1 komentář:

  1. Hezky jsem si tady okolo početl, poučil se i pobavil, díky!

    p. s.
    Kolikpak lidí asi zaškrtlo, že je Linda učitelka?

    OdpovědětVymazat