čtvrtek 31. prosince 2009

Etymologický zpravodaj - F

Pro dnešní den máme slovo fena. Pochází od latin. femina = žena, od lat. předpony fe-, která prý odpovídá ie. předponě dhe-, značící mimo jiné kojení, a od toho jsou údajně i čes. výrazy dojit a děti.
Dalším zajímavým slovem je fízl. Pochází z něm. argotu, Fiesel = chlap, penis, zrádce, od středověké němčiny, kde visel = penis (zda souvisí s "viset" jsem nezjistil).

Konečně, slovo fofr. Ve starší češtině také v podobě fochr, z německého Focher (dnešní podoba Fächer) = fukar (na rozfoukání ohně), z latinského focus = ohniště (odtud fr. feu, it. fuoco, šp. fuego, rum. foc, vše ve významu oheň, i angl. focus = ohnisko). Slovo nahradilo starší lat. ignis, které má stejný původ jko české oheň.

pondělí 28. prosince 2009

Pondělní šifra X.

Je čas na tradiční šifru.




ŘEŠENÍ.

O zázracích

Skončily Vánoce, a tak je čas na vánoční téma. Dle křesťanské tradice jsou Vánoce oslavou zázraku Božího narození, a tak nikdo nemůže říct, že téma zázraků není pro tuto příležitost vhodné. Zároveň tak naváži na téma fyzikálních zákonů, které jsem rozpitvával v předchozích příspěvcích. Vždyť zázrak mnozí definují jako porušení přírodních zákonů, kterým Bůh dává najevo svou existenci, nebo dosahuje jiných cílů.

Co je na zázraku [1] vlastně zvláštního? Především to, že jej není možné vůbec jakkoli rozumně definovat. Což by člověka nemělo přehnaně překvapovat, takových nedefinovatelných věcí je teologie plná. Jenže věřící (ne všichni, samozřejmě) se zhusta domnívají, že k zázrakům občas dochází, a jednotlivé události považované za zázraky rádi uvádějí jako doklady oprávněnosti své víry, zatímco nevěřící (ne všichni, samozřejmě) se rádi věnují vyvracení zázračné povahy těchto událostí, snažíce se prokázat, že na nich vlastně není nic divného. Málokdy se kdo vůbec zamyslí nad tím, zda je vůbec možné zázraky považovat za doklad čehokoli.

Takže, co vlastně je zázrak? Vyjděme z představy, že zázrak je porušení přírodních zákonů. Co ale znamená porušit přírodní zákony? Přírodní zákony nemají povahu příkazů, které je možno poslechnout nebo porušit, když na to máme odvahu. Přírodní zákony jsou pravidla, o kterých jsme vypozorovali, že v přírodě platí. Občas se stane, že pozorujeme něco, co těmto pravidlům nevyhovuje. V takové situaci máme v zásadě dvě možnosti:
  1. Prohlásit pozorování za zázrak.
  2. Uznat, že naše představy o přírodních zákonech přinejmenším nebyly přesné.
Je asi zbytečné zdůrazňovat, jakým z těchto způsobů lidé postupovali, kdykoli byl objeven jev, který systematicky porušoval dosavadní zákony. Nikdo dnes nepovažuje elektřinu za zázrak.

Může být vznesena námitka, že za zázrak se považuje pouze porušení absolutních zákonů, jakéhosi ideálu, který sice neznáme (a kterému jsou dnes užívané zákony pouhým přiblížením), ale který přesto existuje. Nejsem příznivcem podobných platónských konstrukcí a ve výše odkazovaných příspěvcích jsem se proti tomuto pojetí přírodních zákonů snažil argumentovat. To, co nazýváme přírodními zákony, jsou vypozorované pravidelnosti, které jsou tím absolutnější, za čím širších okolností platí. Pokud bychom nalezli zákon platící vždy a bez výjimek, neprotestoval bych proti přízvisku "absolutní". Ale "bez výjimek" znamená i "bez zázraků". Pokud tento zákon bude platit skoro vždy, kromě několika málo situací, spíš než tyto situace prohlásit za zázraky se zdá přirozenější netrvat na přízvisku "absolutní" u daného zákona. [2] V každém případě je ale kritérium odvolávající se na "absolutní" či "ideální" zákon nevhodné čistě prakticky: jelikož absolutní zákon neznáme, musíme k identifikaci zázraku stejně použít v současnosti známé přiblížení, s rizikem, že ze zázraku se stane jenom další nově objevený přírodní jev.

Je asi jasné, že definice zázraku jako porušení přírodních zákonů je neudržitelná, a bude ji třeba modifikovat. Možná spočívá problém ve slově "systematicky". Děje, ke kterým dochází systematicky, nejsou typickým prototypem zázraku. [3] Pro zázrak nestačí, že není v souladu s tím, co momentálně považujeme za fyzikální zákony. Navíc se musí jednat o něco neobvyklého, co se neděje každý den, a co nelze jen tak snadno vyvolat. Zázrak musí porušovat pravidelnost přírody, ale ne natolik, aby ji úplně zničil, či nahradil svou vlastní "zázračnou" pravidelností. Ideálnímu zázraku je svědkem pár lidí [4] a zpravidla se neopakuje. Je tak velmi těžké jej studovat. Co je ale horší, komplikuje se tak nejen studium detailů zázraku, ale ověření jeho samotné existence. Jak již z polovině 18. století psal David Hume:
Když mi někdo řekne, že viděl mrtvého vzkřísit k životu, okamžitě beru v potaz, zda je pravděpodobnější, že tento člověk buď lže či je obelhán, nebo že skutečnost, kterou mi zprostředkovává, se opravdu stala. Vážím první zázrak oproti druhému, a podle váhy, kterou shledám, vyslovím své rozhodnutí, a vždy odmítnu větší zázrak. Pokud by nepravdivost jeho svědectví byla zázračnější, než událost, o které vypráví, potom, a ne dříve, může usilovat o změnu mé víry a mého názoru. (můj překlad z originálu zde)
Je lidem vrozeno věřit více svědectvím konkrétních lidí, než anonymním faktům vypozorovaným z neméně anonymních experimentů. Dobře znám až téměř fyzickou nechuť přijmout, že člověk, kterého potkám náhodou na ulici, jednoduše a prostě lže, když mi sdělí, že viděl v lese mamuta. Většina lidí začne vymýšlet teorie snažící se nějak dát do souladu jejich znalosti o mamutech a českých lesích s uvedeným svědectvím, pokud možno za předpokladu, že svědek nelže. Něco jiného je, pokud má tento člověk pověst lháře, pak analogie neplatí; pokud je ale pověst onoho člověka dobrá, nebo i tehdy, nevíme-li o něm nic, je důvěra základním postojem. A zdá-li se vám zvolený příklad příliš extrémní, nahraďte české lesy skotskými jezery a mamuta plesiosaurem; nemyslím, že rozdíl je až tak propastný.

Bohužel, skutečnost je taková, že spolehlivost "přírodních zákonů" typu "v lesích se v roce 2009 nepromenují mamuti" nebo "mrtví nevstávají z hrobů" je mnohem větší, než spolehlivost svědectví i těch nejdůvěryhodnějších jedinců. Hume ve svém eseji Of Miracles [5] dává rozumné kritérium při posuzování pravdivosti svědectví: odvrhněme větší zázrak, přijměme nejpravděpodobnější vysvětlení. Pokud je zázrak přímo definován svou extrémní nepravděpodobností, pak jakékoli svědectví o zázraku se stává bezcenným: to, že se lidé mýlí či že lidé lžou není přece žádným zázrakem, a nepravdivost svědectví o zázraku v důsledku musí být z definice pravděpodobnější, než jeho pravdivost.

Výše uvedenou argumentaci je podle mého soudu možné použít i v případě, že zázrak známe z osobní zkušenosti. I když zde padá možnost lži, pořád je zde nijak zázračná možnost, že zázrak je důsledkem šálení smyslů, halucinace, nespolehlivosti paměti.

Ještě zbývá možnost definovat zázrak jako něco, co se vzpírá lidskému chápání. Problém je, že prakticky všechno, co dnes chápeme, se kdysi v minulosti chápání našich předků vzpíralo. Teologie identifikující zázraky takto je teologie "Boha mezer". Je to velmi nevděčná disciplína, protože její pole působnosti se s každým novým objevem zmenšuje.

Asi jediná definice zázraku, která mi dává smysl, je pojetí zázraku jako přímého poselství od Boha. Pokud by se na obloze rozzářilo arabské slovo الله (Alláh), vyvedené zřetelně nejlepší kaligrafií, a doprovázené krátkým, leč dobře čitelným komentářem vysvětlujícím detaily víry, a zůstalo tam tak dlouho, že by jej uviděli všichni, okamžitě by se ze mně stal muslim [6]. Dokud ale bude Bůh sesílat zprávy typu neočekávaného uzdravení, slzících soch či překvapivého vítězství mudžáhidů nad lépe vyzbrojeným protivníkem, pořád se budu držet základní hypotézy: žádný zázrak.

Poznámky [0]:
0. Poznámka ke změně formátování: ode dneška již nebudou poznámky psány mrňavými těžko čitelnými hnidami, ale normálním písmem.
1. Většina argumentace proti zázrakům platí i na všechny nadpřirozené jevy obecně; pro většinu praktických účelů vnímám pojmy nadpřirozena a zázraku jako synonymní. 
2. Což neznamená, že by takovéto situace nezasluhovaly detailní pozornost, bude-li ale jejich četnost příliš nízká, nabývají platnost výhrady popsané v druhé polovině článku.
3. Což ovšem neznamená, že by nebylo dost těch, kteří věří v systematické zázraky. Oficiální seznam [PDF] církví uznaných zázračných uzdravení v Lurdech má 67 položek. To není málo, vezmeme-li v úvahu, že Katolická církev je při oficiálním uznávání zázraků tradičně opatrná. Běžný návštěvník Lurd věří, že uzdravení během pouti je v podstatě zákonitá věc.
4. I zde existují výjimky. Ve Fátimě vidělo zázrak v jednu chvíli shromáždění 70 tisíc věřících.
5. Esej tvoří 10. kapitolu knihy An Enquiry concerning Human Understanding. Pochází z něho výše uvedená citace, a jeho název jsem vědomě ukradl pro název tohoto příspěvku.
6. Čitelnost a zřetelně nenáhodná povaha zprávy je zásadní. Nemusím snad zdůrazňovat, že mně ke konverzi nepřimějí Alláhové pochybné typografické kvality v rozříznutých bramborách, srsti telat či polární záři, jako například zde (využívám pochybné příležitosti odkazovat na stránku v malajštině; sám nevím, co se tam píše, důležité jsou obrázky).

neděle 20. prosince 2009

Braessův paradox

V pátek jsem projížděl tramvají přes staveniště tunelu Blanka na Letné, a pohled na rodící se obří víceúrovňovou křižovatku prakticky v centru města ve mně nevyvolal příjemné pocity. Jako obyvatel Prahy mám, a myslím, že oprávněně, v zásadě odmítavý názor na automobilovou dopravu v centru, a jsem přesvědčen, že moderní města mají automobilismus vytlačovat ze svých středů mimo jiné investicemi do veřejné dopravy; z této perspektivy se jeví strategie pražského magistrátu poněkud zastarale. Investice do nákupu nových tramvají na příští rok budou téměř jistě výrazně pod očekáváním [1], výstavba pro jižní části města klíčové linky metra D je v nedohlednu, a stavba nejdelšího městského silničního tunelu v Evropě mi za těchto okolností připadá jako příliš velký luxus.

Dnes ale nechci psát politický pamflet. V tuto chvíli se mi zdají zajímavější paradoxy, které s výstavbou nových silnic přímo souvisejí. Až tolik zajímavý není Downsův-Thomsonův paradox. Ten říká, že investice do rozšíření silnic na úkor investic do veřejné dopravy může vést k tomu, že průjezdnost silnic bude horší, než byla před jejich rozšířením. Logika za tím není nijak překvapivá - zhoršení kvality na dotacích zkrácené veřejné dopravy vyžene víc lidí do aut, a zvýšení automobilového provozu může být výraznější, než bylo zvýšení kapacity komunikací. Skoro bych řekl, že tohoto efektu se můžeme v Praze obávat v souvislosti s výstavbou vnitřního okruhu.

Co je ale mnohem zajímavější, průjezdnost silniční sítě se může po výstavbě nových silnic zhoršit, aniž by došlo k nějakým změnám ve financování veřejné dopravy, či aniž by vůbec v oblasti nějaká veřejná doprava existovala. A aniž by se zvýšil celkový objem přepravy. Prostě je určité množství lidí, kteří se potřebují dostat z A do B, a všichni jedou autem. Postavíte novou silnici (staré silnice zůstanou použitelné), a těmto lidem bude cesta trvat déle. Nevěříte? To je Braessův paradox.

Paradox hned předvedu v celé jeho kráse, ale předtím musím zmínit jeho předpoklady. Za prvé, předpokládám, že každá silnice [2] umožňuje určitou maximální rychlost vmax, a že všechny vozy po této silnici cestují touto rychlostí. Pokud ovšem počet vozů na této silnici překročí určitou mez, začne se jejich rychlost snižovat, a bude tím nižší, čím více vozů na silnici je. Pro jednoduchost budeme uvažovat, že existuje pro každou silnici konstanta Nmax udávající, kolik vozidel za hodinu může nejvýše po této silnici jet, aniž by jejich rychlost klesla pod vmax. Pokud je intenzita provozu N, tj. počet vozidel, které projedou za hodinu libovolným bodem silnice, větší než Nmax, pak jízdní doba roste lineárně s intenzitou provozu, což znamená, že

v = vmax / (N - Nmax).

Že realističnost paradoxu nezávisí na konkrétní podobě této funkce, ale pouze na empiricky potvrzeném faktu, že s rostoucím provozem klesá rychlost, bude doufám na konci jasné.

Druhý předpoklad je, že každý řidič chce dojet do cíle v nejkratším možném čase, a chová se podle toho.

K ilustraci nám stačí velmi jednoduchá síť, sestávající ze čtyř úseků a jedné spojky. Na začátku jsou místa A a B spojena dvěma silnicemi, z nichž každá se dělí na dva úseky. Severní silnice má úseky označené I a II, jižní úseky nesou označení III a IV. Úseky II a III jsou široké silnice, kde může jet až 1000 aut za hodinu plnou rychlostí, přičemž projetí každého z úseků II a III trvá 80 minut. Úseky I a IV jsou kratší, a plnou rychlostí je možné je projet za 50 minut. Jsou ale také užší, takže pokud provoz přesáhne 500 aut za hodinu, jízdní doba se prodlužuje o minutu za každých dvacet aut v hodině.




Jak severní, tak i jižní trasa procházejí městem X, kde jsou také hranice mezi úseky I a II na severu a III a IV na jihu; větve jsou v X odděleny řekou, a jejich spojení je možno jen přívozem, jehož jízdní doba je 35 minut (na obr. vyznačen zeleně).

Předpokládejme, že každou hodinu chce tisíc řidičů přejet z A do B. Pokud by severní trasou jezdilo 600 řidičů, bude jim průjezd úsekem I trvat 55 minut, a celkem by strávili na cestě 135 minut, jižní trasou by jelo 400 řidičů s jízdní dobou 130 minut. Dá se proto očekávat, že v takové situaci se řidiči ze severu začnou postupně přesouvat na rychlejší jižní trasu, až dojde k vyrovnání na poměr 500/500, přičemž oběma skupinám bude ujetí vzdálenosti trvat 130 minut. Toto je Nashova rovnováha: pokud kterýkoli řidič změní silnici, bude na tom tratit.

Ředitelství silnic a dálnic nyní rozhodne, že přívoz v X brzdí rozvoj místní ekonomiky, a nechá v X postavit most. Místo třiceti pěti minut na přívozu stačí teď pár sekund na přejetí mostu [3], a člověk se dostane z úseku III na úsek II, či z I na IV.

Řidič, který dosud jezdil I-II, má před sebou možnost přejet v X na úsek IV, kde byla dosud jízdní doba 50 minut. Tím, že přejede na úsek IV sice mírně sníží jeho rychlost, ale toto snížení je zanedbatelné - celou cestu projede za za 100 minut a tři vteřiny! Ovšem stejně tak řidič dosud jezdivší III-IV může stále jezdit čtvrtým úsekem, ale třetí nahradit prvním, s naprosto stejnou logikou. Je zřejmé, kam to vede. Původní rovnováha se zhroutí, a vytvoří se nová, kdy všichni řidiči budou jezdit úseky I a IV. Díky hustšímu provozu je ale jízdní doba každým z těchto úseků 75 minut, a celkově tak trvá cesta z A do B o dvacet minut více, než před otevřením mostu. Nová situace je znovu v Nashově rovnováze, protože každému jednotlivému řidiči nepomůže, pokud místo I užije III nebo místo IV užije II: v takovém případě by jen ztratil dalších 5 minut.

Na Braessově paradoxu není samozřejmě nic logicky sporného, ale přesto se příčí intuici. Spolu s vězňovým dilematem to je jeden z příkladů situace, kdy nekoordinované racionální chování jednotlivců nevede k optimálnímu výsledku. Kdyby se řidiči mohli domluvit, mohli by i v situaci s mostem jezdit tak, jak jezdili předtím - tj. 500 severní větví, 500 jižní. Ale uspořádání by bylo nestabilní. Každý z řidičů by si mohl cestu výrazně zkrátit jejím porušením, za cenu mírného prodloužení cesty všem ostatním. Že to každý řidič udělá, pokud se mu naskytne příležitost, o tom netřeba pochybovat.

Poznámky:
1. Viz např. zde. Jsem zvědav, jak si při snížení rozpočtu dopadne nákup vozů Škoda 15T, které si DP nasmlouval. Objevují se i pesimistické spekulace.
2. Má-li silnice v různých úsecích různé vlastnosti, pak každý z úseků považujeme za samostatnou silnici.
3. Pro jednoduchos budeme dobu přejetí mostu považovat za nulovou.

středa 16. prosince 2009

Etymologický zpravodaj - E

Písmeno E nepatří mezi nejčastější počáteční písmena v češtině. Důvody pro to je třeba hledat v historickém vývoji - před samohláskami a, e a i stojícími na počáku slova vzniklo během vývoje češtiny tzv. protetické j (výjimku tvoří spojka a a slova z ní odvozená). Srovnejme např. následující příbuzná slova:
  • lat. ego - staroslov. az - čes.
  • lat. est - čes. jest
  • slov. iný - čes. jiný
Podobnému osudu uniklo těsně počáteční o, kterému v některých dialektech obecné češtiny předchází protetické v, spisovný standard se však protézám v tomto případě ubránil:
  • spis. oko - obec. voko
(Výjimkou opačného typu je vosa, kde protetické v proniklo i do spisovného jazyka. Polsky je to stále osa.) Je ale vidět, že tendence bránit se samohláskám na počátcích slov je v češtině silná. V důsledku čehož bude obsah dnešního zpravodaje vesměs přejatý.

Nejdříve přijde chemie, a s ní etylén. Pochází od slova éter a přípony -yl. Éter je z lat. aether, řec. αιθερ = horní část atmosféry, obloha, od slovesa αιθω = hořím (protože si řekové mysleli, že horní část atmosféry je světlá a jakoby hořící). Pravděpodobně nesouvisí s aer = vzduch ani s aeternalis = věčný (z toho je naopak název střešní krytiny Eternit). Přípona -yl pochází z analogie s methyl, což je z methy (μεθυ) = medovina (etymologie stejná jako čes. med) a hylé (υλη) = dřevo, poněvadž metanol získáme kvašením dřeva (představa kvašení kořalky ze dřeva je přinejmenším zvláštní). Přípony -an, -en jako ve slovech metan a etylén jsou zřejmě konstruktem chemiků.

Další slovo je éra. Pův. lat. aera znamenalo období, kdy je třeba platit daně, od aes = peníze (původně měď). Příbuzné slovo jest erár (aerarium = vybrané daně).

Posledním slovem pro dnešek je eso, pocházející z latinského as, označující měděnou minci nízké hodnoty. Ve středověku pak označovalo jedničku na hrací kostce - v té době byl přenesený význam opačný oproti dnešku, jelikož hodit "eso" bylo projevem smůly. Význam se zřejmě odvíjel od paralely mezi mizerným hodem a téměř bezcennou mincí. Po rozšíření karetních her se výraz začal užívat pro kartu o hodnotě 1 (v kartách francouzského typu je stále na esu jediný symbol, ačkoli pro naprostou většinu her má tato karta nejvyšší hodnou, spíše než nejnižší).

pondělí 14. prosince 2009

Pondělní šifra IX.

Po delší přestávce přichází znovu pondělní šifra.




ŘEŠENÍ.

neděle 13. prosince 2009

OSA zla?

Neplánuji často psát na tomto blogu o politických tématech. Přesto asi čas od času neodolám a nechám se vyprovokovat; takový moment nastal před několika dny po shlédnutí jisté reportáže v televizi - kdy přesně a na jakém kanále se mi už podařilo zapomenout. Reportáž se týkala postupu firem chránících autorská práva, takzvaných kolektivních správců autorských práv. V reportáži se konkrétně jednalo o INTERGRAM. Námět byl jednoduchý: správci vysílají své zástupce zjišťovat, kde všude hraje veřejně rozhlas nebo televize, a vymáhat z těchto provozoven poplatky za veřejnou produkci. Celkovým vyzněním reportáže bylo, že inspektoři INTERGRAMu se chovají necitlivě, dávajíce podnikatelům podepsat smlouvy, kterým podnikatelé nerozumí, a vyžadujíce poplatky i v tak absurdních případech, jako když si zaměstnanci v autoservisu pouštějí rádio v místech, kam může přijít zákazník.

Je mi jasné, že vyvozovat dalekosáhlé závěry z jedné reportáže není zrovna odznak moudrosti, nato je důvěryhodnost českých (pravděpodobně i jakýchkoli jiných) médií nedostačující. Jde mi ale o celkový přístup k autorským právům, který se zdá být v dnešní době absurdní.

Co se týká kolektivních správců: asi nejznáměším zástupcem těchto společností je Ochranný svaz autorský (OSA) [1]. Kromě nich mají statut kolektivního správce ještě DILIA, OOA-S, GESTOR a zmíněný INTERGRAM [2]. Práva těchto organizací jsou stanovena autorským zákonem. Patří k nim vybírání odměny pro autory, pod což spadají nejen poplatky za veřejnou produkci, ale i třeba poplatky, které platí výrobci, dovozci či provozovatelé kopírek a poplatky z prodeje prázdných datových nosičů.

Jedna strana problému je chování kolektivních správců, na které se pravidelně objevují stížnosti. Hlavním důvodem pobouření bývá to, že kolektivní správci prosazují svoje práva bez ohledu na zdravý rozum. Poplatek za "veřejnou produkci" v situaci, kdy mám na veřejně přístupném pracovišti puštěné rádio, patří do této kategorie. Nemyslím, že má ale v takovém případě cenu si stěžovat na nedostatek soucitu lidí z OSA či jiné agentury. Kolektivní správci se chovají naprosto logicky - snaží se prosazovat svá práva, přičemž etika je nezajímá. Nejsme na tom až tak špatně; z našich zeměpisných délek se aspoň zatím neobjevují zprávy o případech jako je tento (britský občan žalován americkou společností RIAA o 4,5 milionu dolarů za sdílení nahrávek na internetu). Problém vnímám v tom, že zákon dává soukromé společnosti pravomoci, které by měly náležet jen státním orgánům. Typickým příkladem je poplatek za prodej kopírky. Zde zákon dokonce určuje výši poplatku [3]:

u výkonnostní kapacity  4 až 12 rozmnoženin za minutu        650 Kč
u výkonnostní kapacity 13 až 35 rozmnoženin za minutu      1 300 Kč
u výkonnostní kapacity 36 až 70 rozmnoženin za minutu      1 600 Kč
u výkonnostní kapacity více než 70 rozmnoženin za minutu  12 000 Kč

Za povšimnutí stojí, že tyto poplatky nemají nic výslovně společného s autorskými právy. Je nutno je zaplatit, i když bude nadále kopírka užívána výhradně pro kopírování rodinných fotografií, úředních faxů či kompromitujících dopisů. Tento poplatek tak více než co jiného připomíná daň z kopírky. Nemám a priori nic proti daním z kopírky, jen by je neměla vybírat soukromá právnická osoba.


Jiným příkladem je odstavec šestý stého paragrafu:
Provozovatel živé veřejné hudební produkce je povinen vždy oznámit příslušnému kolektivnímu správci program produkce s uvedením jmen autorů a názvů děl, která mají být provozována, a to nejpozději 10 dnů před konáním produkce. Pokud provozovatel takové oznámení neučiní, má se za to, že na produkci budou provozována pouze díla autorů, pro které kolektivní správce právo na živé provozování hudebních děl spravuje.
 Zde je uložena provozovatelům povinnost informovat soukromou společnost o svých záměrech, přičemž pokud tak neučiní a uspořádá produkci, předpokládá se, že nastává povinnost platit. Takto pojaté právo být informován obvykle náleží jen státním orgánům, jako je například policie. Často se říká, že autorský zákon je založen na presumpci viny. Já bych spíš řekl, že tento zákon je založen na privatizaci výkonu veřejné moci, a pranic se mi to nelíbí. Státní orgán je sice také schopen šikanovat občany, ale dovolání se spravedlnosti bývá obvykle snažší, už jen proto, že stát nemá zásadní důvod stranit jedné straně sporu. OSA a spol. naopak reprezentují pouze a jen zájmy autorů. Že privatizace veřejné moci není úplně dobrá myšlenka je vidět i na potížích s exekutory.

Aby toho nebylo dost, možnosti státního dozoru nad kolektivními správci jsou víceméně formální. Z celého autorského zákona vymezuje kontrolní pravomoci ministerstva § 103 obsahující pouhý jeden odstavec, mimo jiné omezující výši pokuty udílené kolektivnímu správci na docela směšných 50 tisíc korun.

Ať už jsou konkrétní detaily ustanovení autorského zákona jakékoli, připadá mi celková úroveň ochrany autorských práv přemrštěná. Je skutečně nutné a přínosné, aby autoři inkasovali odměnu za každou pořízenou kopii jejich díla? Obhájci současného stavu argumentují, že ano, že jinak by autoři ztratili motivaci tvořit a že tyto poplatky jsou spravedlivou odměnou za vykonanou práci. Mně se to nezdá. Umělecká tvorba neskomírala v 19. století na úbytě přesto, že odměny autorů byly na dnešní poměry více než skromné. Existence svobodného softwaru ukazuje, že ani v oblasti programů není finanční odměna podmínkou pro vznik kvalitních děl.

Co se týče spravedlivosti odměn, stojí za to srovnat poměry panující v distribuci uměleckých děl se situací ve vědeckém výzkum. Představte si, že každý, kdo použije teorii relativity, by musel zaplatit poplatek dědicům Einsteinových autorských práv. Kdybyste si koupili třeba GPS, část ceny by tvořil poplatek pro Ochranné sdružení výzkumných pracovníků, které by odvádělo příslušným držitelům práv bakšiš (od Einsteinovy smrti ještě neuplynulo 70 let, autorská práva jsou stále v platnosti). Kdokoli by vytvořil nějakou další teorii s využitím teorie relativity, musel by při publikaci svého článku zaplatit. A platilo by se nejen za teorii relativity, ale za všechny objevy. Při léčbě penicilinem byste platili Flemingovým dědicům (Fleming zemřel ve stejném roce jako Einstein), při koupi mobilu by se asi seznam objevitelů čekajících na svůj podíl nevešel na papír A4. Připadá vám takový svět absurdní? Stejně absurdní by pravděpodobně připadal Einsteinovi i Flemingovi, jakožto i všem výzkumníkům přesvědčeným o tom, že jejich objevy mají sloužit lidstvu.

 Nevidím přílišnou logiku v tom, že v jednom případě se autorovi za jeho myšlenku či kopírovatelný výtvor musí platit a ve druhém je totéž zdarma. Je mi sympatický přístup, kdy autor tvoří s tím, že odměnou mu bude čest a sláva, pokud jeho výtvor za to bude stát. Považuji za samozřejmé, že pokud matematik dokáže Velkou Fermatovu větu, svůj objev zveřejní v časopise a jako finanční profit mu bude stačit možnost vybrat si dobře placené místo na některé z mnoha universit, které se o něj budou poté ucházet. Považoval bych za zvrhlé, kdyby za každou kopii jakékoli knihy, kde je jeho důkaz popsán, požadoval odměnu ve smyslu autorského zákona.

Nemyslím, že by píseň Karla Gotta [4] měla větší hodnotu než důkaz Velké Fermatovy věty nebo třeba objev penicilinu. Je krajně nepravděpodobné, že by to připustili autoři sdružení v INTERGRAMu, byl bych ale aspoň rád, kdyby se nad tím zamyslili naši i evropští zákonodárci.

Poznámky:
1. Nepříliš seriózně se člověk může zabývat myšlenkou, zda by nebylo možné Ochranný svaz autorský žalovat za propagaci nacismu. Sousloví "ochranný svaz" připomínající německé Schutzstaffel v názvu by asi nestačilo, soudě podle legálního přežívání Dělnické strany (Arbeiterpartei), nicméně v kombinaci se zkratkou OSA se zdá být název této organizace již docela podezřelým.
2. Zvyk psát i relativně dlouhá a zkratky netvořící jména těchto organizací velkými písmeny jsem převzal odtud, jakožto i z vlastních webů zmíněných organizací.
3. Za pozornost stojí cenový skok u kapacity 70 kopií za minutu. Takto uměle utvořené hranice jsou krajně nevhodné, protože vytvářejí motivaci pro obcházení zákona, a navíc působí absurdním dojmem (proč je poplatek za kopírku s kapacitou 71 výtisků za minutu 7,5 krát vyšší, než u kopírky s výkonem o dva výtisky za minutu menším?).
4. Či kohokoli jiného, Gotta jsem vybral pouze jako příklad úspěšného umělce. Ke Gottovi či jeho písním necítím žádný odpor.

pondělí 7. prosince 2009

Proti antropickému principu: zdánlivá vysvětlení a prázdné odpovědi

Populárním požadavkem v částicové fyzice je tzv. přirozenost. Teorie se považuje za přirozenou, pokud všechny (bezrozměrné) parametry jsou řádu 1. To znamená, že teorie docela dobře vyhovuje požadavku přirozenosti, pokud v ní vystupují konstanty jako 3,44 nebo 0,67, zatímco teorie s konstantami 182000 či 0,0000034 se považuje za nevyhovující.

Fyzika elementárních částic je docela nepřirozená. Typickým příkladem jsou leptony. Nejlehčím elektricky nabitým leptonem je elektron. Jeho příbuzný, mion, je zhruba 200 krát těžší. Nejtěžší známý lepton je tauon, který je asi sedmnáctkrát těžší než mion, a cca. 3400 krát těžší než elektron. Hmotnosti neutrin nejsou dosud známé, ale existují horní meze, přičemž hmotnost nejlehčího z neutrin dosahuje nanejvýš jedné dvousettisíciny hmotnosti elektronu. Hmotnosti samotné nejsou sice bezrozměrné veličiny, ale jejich poměry ano, a jak vidíme, nejsou řádu 1. Podle Standardního modelu elementárních částic jsou hmotnosti leptonů přímo úměrné jistým vazbovým konstantám, které jsou volnými parametry teorie. Takže věříme-li na přirozenost, máme problém. Proč jsou mezi hmotnostmi leptonů takové rozdíly?

Přirozenosti je možno považovat za do značné míry estetické kritérium, a na fyzikálních teoriích ji nepožadovat. Nicméně otázka z konce předchozího odstavce zůstává. Pro potřeby tohoto článku se spokojím s její obměněnou [1] podobou: Proč jsou mezi hmotnostmi leptonů vůbec nějaké rozdíly?

Mohli bychom si říct: "A proč ne?" Vždyť kdyby všechny leptony vážily stejně, stejně tak by bylo lze ptát se na důvod, proč jsou stejně těžké. Avšak faktem je, že máme-li skupinu podobných částic, považuje se za přirozenější, když si budou podobné všechny jejich charakteristiky, včetně hmotnosti. Pravidelnost se považuje za normu; lidé jsou méně náchylní se ptát po příčinách symetrie, než po důvodech její absence.

Kdyby byly všechny leptony stejně těžké, spokojila by se většina lidí s vysvětlením, že mezi nimi existuje symetrie, která je příčinou rovnosti hmotností. (Příkladem existující (přiblížné) symetrie tohoto typu je isospinová symetrie mezi protonem a neutronem.) Přínos takového vysvětlení je diskutabilní; odvolání se na symetrii není v zásadě ničím víc než přeformulováním tvrzení o shodě hmotností jinými slovy [2]. Tím ale v žádném případě nechci hlásat, že preference symetrických teorií není užitečná - právě naopak. Symetrická teorie je totiž jednodušší a stručnější, obsahuje méně uvedených parametrů a umožňuje tak informace o přírodě stlačit do menšího objemu. Pokud se snažím zde proti něčemu argumentovat, tak je to způsob, jakým je, dle mého názoru dost často [3], pojímána potřeba "vysvětlení" pro pozorovaná fakta.

Je docela těžké zbavit se "zlozvyku" z dětství, touhy klást nic nekončící řetězec otázek začínajících slovem proč. Proč padá jablko ze stromu? Protože všechny předměty padají na zem. A proč padají předměty na zem? Protože to říká gravitační zákon. A proč platí gravitační zákon? Protože lagranžián časoprostoru je skalární křivost a platí princip nejmenší akce. A proč platí princip nejmenší akce?...

Každá následná odpověď uhasí touhu ptát se jen na chvíli. Délka této chvíle ale dost závisí na způsobu formulace oné odpovědi. Některé odpovědi mají až magickou schopnost zastavovat další otázky. "Bůh to tak chtěl" je jednou z těch univerzálních, které lze aplikovat prakticky na každou otázku o přírodě. Jelikož se o Bohu "ví", že stojí mimo lidské chápání, jakákoli odpověď obsahující slovo Bůh je pro mnoho lidí dostatečná k tomu být považována za odpověď definitivní. Každé další dotazování je zbytečné.

Ve vědě existuje nepsané moratorium na použití Boha v odpovědích na otázky o okolním světě. Pokud chce vědec utnout řetězec neustálých otázek, musí použít jinou metodiku. Existují různé způsoby, jak toho s větším či menším úspěchem dosáhnout. Pokud chcete o těchto věcech přemýšlet, měli byste si toho být vědomi. Především je dobré pamatovat, proč "Bůh to tak chce" je sakra špatné vysvětlení čehokoli. Není to kvůli použití slova Bůh. Je to proto, že toto "vysvětlení" nám vůbec nic nového o světě neříká. Pro všechny praktické účely existuje ekvivalence mezi výroky "platí X, protože Bůh to tak chce" a "platí X, a basta, dál se neptej" [4].

Aby X bylo platným vysvětlením Y, nestačí, že z X logicky plyne Y, tj. X→Y. Přísně vzato pro každé Y platí Y→Y, a přesto považujeme za značně nemoudré říkat "váza se rozbila, protože se rozbila". Vysvětlení není totéž, co premisa implikace (ačkoli existence implikace je nutnou podmínkou pro vysvětlení); vysvětlení musí mít jisté vlastnosti, a pokud se bavíme o fyzikálních teoriích, musí být buď obecnější, nebo úspornější. Obecnější je tehdy, pokud z X plynou i další (ověřitelně pravdivé) výroky než Y, úspornější je tehdy, zabírá-li X méně informací [5] než Y.

Jak to všechno souvisí s antropickým principem? Důvod, proč tohle všechno píšu, krom zvrácené touhy být označen za grafomana, je právě rozšířená ochota přijímat vysvětlení, která žádnými vysvětleními nejsou. Jedním z příkladů je pravděpodobnostní verze antropického principu (dále jen PVAP), tj. ta, která říká, že hodnoty fundamentálních konstant přírody jsou náhodné, a není divu, že pozorujeme ty, které pozorujeme, protože jiné neumožňují existenci kohokoli, kdo by je pozoroval. Bez ohledu na platnost druhé části PVAP, té o možnosti existence pozorovatelů, je problém v oné náhodnosti. Náhoda je slovo, které používáme, když nejsme schopni nějaké věci předvídat. Vysvětlení naopak znamená schopnost něco předvídat. Pojmem náhody parametrizujeme svou neznalost, zatímco vysvětlení přináší vždy nové znalosti. Náhoda je naprostou antitezí vysvětlení. Aby bylo jasno, co chci sdělit, dovolte ilustraci.

K příkladům z reálného světa se vždy pojí různé nepříjemné nuance, které komplikují výstavbu ilustrativních analogií, a tak si vypomůžu ještě jedním umělým příkladem. Představte si, že dostanete za úkol analyzovat fungování počítačového programu, který vždy po stisknutí klávesy vypíše číslici od 0 do 9. Uděláte zřejmě jedinou možnou věc - začnete stiskávat klávesy. Učiníte to desetkrát, načež se ilustrace dělí do dvou větví:
  1. Na výstupu čtete 3, 3, 3, 3, 3, 3, 3, 3, 3, 3 (výstup označíme V1).
  2. Na výstupu čtete 9, 2, 6, 5, 3, 5, 8, 9, 7, 9 (výstup označíme V2).
V první situaci se dá očekávat, že výsledek analýzy bude teorie (označme ji T1), že program vypisuje systematicky číslici 3. Nemusí to tak nutně být, ale tato teorie je nejjednodušší teorií konsistentní s daty, a víra v její správnost bude narůstat s každou další trojkou. Taková teorie vysvětluje uvedený výstup: Plyne z ní, že pokud desetkrát stiskneme klávesu, získáme právě tento výstup a žádný jiný, a existuje tudíž implikace T1→V1. Navíc je T1 obecnější než V1 (předpovídá například i jinak dlouhé výstupy) a pro dostatečnou délku výstupu je i úspornější. Vysvětlení máme, protože jsme odhalili ve výstupu V1 systém. Jsme díky tomu schopni předvídat hodnotu další číslice: bude to trojka. V tomto případě to nebylo nijak těžké.

Ve druhé situaci na první pohled žádný systém není vidět. Je tu ale úkol výstup zanalyzovat. Co s tím? Je až příliš lákavé podlehnout svodům a vyhlásit teorii T2: výstup V2 je obecná, generická, libovolná, prostě náhodná posloupnost. A dost lidí má tendenci to přijmout za vysvětlení. Ale ve skutečnosti nedá až zas tolik práce uvidět, že to žádné vysvětlení není. Chybí zde podstatná vlastnost: z T2 neplyne V2. Z hlediska teorie T2 je výstup V2 úplně stejně dobrý jako výstup V1, nebo jako jakýkoli jiný výstup. Teorie nám nic neříká o další číslici na výstupu, neříká nám vůbec nic. Říct, že program generuje na výstupu náhodná čísla je jen elegantní způsob, jak říct, že o fungování programu vůbec nic nevíme, že jsme ve výstupu systém neodhalili.

To, že systém neznáme, neznamená, že systém neexistuje. Záměrně jsem V2 zvolil tak, že jste si mohli systému všimout a navrhnout teorii T2': na výstup jdou po sobě číslice z desetinného rozvoje čísla π počínaje pátým místem za desetinnou čárkou. Teorie T2' by již byla platným vysvětlením a předpovídala by, že další číslicí na výstupu bude trojka.

Souvislost s PVAP je zřejmá. Pokud PVAP zbavíme té části, která hovoří o náhodnosti, získáme "silnou" verzi antropického principu, o které jsem psal minule. Pokud řeči o náhodě v argumentu ponecháme, platí argumenty uvedené výše. Když potřebujeme skutečně vysvětlit, odkud se bere třicet čísel vystupujících v roli volných parametrů dnes užívané teorie, nepomůžeme si nijak tím, že tato čísla prohlásíme za náhodná. Ani si nepomůžeme tím, že postulujeme N dalších nepozorovatelných vesmírů, ve kterých tato čísla nabývají všech možných hodnot. Podobné úvahy nás neposunou ani o píď k odhalení zákonitostí přírody, a pouze slouží k udušení zvědavosti a navození falešného pocitu zodpovězené otázky. Jak je možné něco takového vůbec považovat za vysvětlení?

Poznámky:
1. Původně jsem chtěl napsat slabší místo obměněná, ale pak jsem si uvědomil, že se nejsem schopen rozhodnout, zda nová verze otázky nemá naopak nárok na označení silnější.
2. Postulování symetrie v rámci nějaké kategorie částic má i jiné důsledky, než pouhou shodu jejich hmotností. Důsledkem je i podobné chování při srážkách a rozpadech, ze kterého se dají odvodit hodnoty různých kvantových čísel. Často to ovšem bývá tak, že tyto podobnosti jsou užity při samotném vymezení uvažované kategorie (leptony, baryony...), a hmotnosti jsou nakonec jediným dosud volným parametrem, který symetrie může fixovat.
3. Moje názory na to, jak lidé obvykle interpretují význam slova "vysvětlení" ve fyzice, vycházejí pouze z osobních zkušeností z rozhovorů o těchto věcech, a samozřejmě i z toho, jak jsem sám na fyzikální teorie nahlížel v minulosti. Nejsem si vědom existence seriózního sociologického průzkumu na toto téma.
4. Pro tento typ "vysvětlení" se mi líbí označení sémantická stopka, zavedené zde.

5. Pro jednoduchost si můžeme představit, že úspornější teorie je ta, která se vejde do tenčí knížky. Techničtěji je možné se dívat na fyzikální teorie jako na algoritmy umožňující odvozovat výroky a porovnávat délku těchto algoritmů zapsaných v nějakém přirozeném programovacím jazyce. Otázkou zde zůstává, co je tím přirozeným jazykem, takže se pro význam složitosti či úspornosti teorií v poslední instanci dovolávám intuitivního chápání těchto slov.

pondělí 30. listopadu 2009

Proti antropickému principu: obecné námitky

V návaznosti na nedávno napsaný úvod mám teď v úmyslu zahájit vlastní argumentaci proti antropickému principu (dále jen AP). V tomto článku se soustředím na ty formulace AP, které nepočítají s existencí více vesmírů.

Abychom mohli posoudit, jestli otázky, na které AP odpovídá, jsou vůbec regulérní, je na místě rozebrat význam příslovce proč. Otázky uváděné tímto příslovcem lze rozdělit přinejmenším do tří skupin. Srovnejte tyto dvojice otázek a odpovědí:
  1. Proč jsi ho okradl? - Protože jsem chtěl ty peníze.
  2. Proč došlo k nehodě? - Protože selhaly brzdy.
  3. Proč planety obíhají kolem Slunce? - Protože platí gravitační zákon.
V prvním případě se ptáme na úmysl nějaké osoby. Ve schématu proč X? - protože Y je na místě Y nějaký zamýšlený cíl. Jev X (okradení oběti) je zde příčina (nebo aspoň je činitelem - v našem případě zlodějem - považováno za příčinu) jevu Y (zloděj má peníze). Jev Y je účel jevu X. Y následuje časově po X. V druhém případě se naopak ptáme po příčině. X (nehoda) je zde následek Y (selhání brzd). Y předchází X v čase. Ve třetím případě se ptáme po obecnější zákonitosti Y, ze které vyplývá specifičtější X, nebo která aspoň zvyšuje pravděpodobnost platnosti X. X ani Y tu nemusí být nijak časově určeny či omezeny, Y bývá zákonitost, která je platná vždy, nebo alespoň po celou dobu, kdy zároveň platí X.

Jednotící pohled by mohl být ten, že budeme uznávat otázku proč X? a odpověď protože Y jako legitimní kdykoli, když Y bude možno vzít jako svědectví ve prospěch X. Tím myslím následující: pokud bychom nevěděli, zda platí X, znalost Y by zvýšila pravděpodobnost přiřazenou jevu X. Takovéto široké definici odpovídají všechny tři popsané významy slova proč: vím-li, že zloděj chce peníze, mám důvod předpokládat, že někdo bude okraden. Vědomí o selhání brzd je důvod, proč se obávat nehody. Z gravitačního zákona vyplývý, že dvojice těles kolem sebe obíhají po elipsách. Rozdělení významu na tři různé kategorie je přesto užitečné. Hlavním důvodem, proč na různé varianty významu upozorňuji, je mezi lidmi velmi rozšířená tendence očekávat odpovědi prvního typu (tj. účelové) na otázky týkající se jevů, ve kterých nevystupují žádné osoby. Je to zřejmě proto, že účelový (teleologický) význam slova proč vnímáme jako základní. Je to vidět v situacích, kdy otázka připouští různé typy odpovědí. Zeptáme-li se "proč jste jeli do Brna?", očekáváme, že nám dotázaní sdělí účel svojí návštěvy Brna, a naopak bychom asi nebyli úplně spokojení s odpovědí "protože jsme nastoupili do vlaku", případně "protože jsme se tak rozhodli". Tyto odpovědi jsou bezproblémové odpovědi druhého typu, ale jsou neuspokojivé, protože tazatel očekává odpověď prvního typu, pokud je možná.

Obzvlášť u otázek typu "proč je Země od Slunce vzdálená 150 miliónů kilometrů?", je dobré vědět, že formulace otázky se slovem proč v úvodu může být zavádějící, a že odpovědi prvního typu - což jsou v prvním přiblížení všechny začínající slovem aby - jsou nepřípustné. [1] Druhý typ interpretace AP, tj. existence člověka jako příčina charakteru světa, je taktéž vyloučena. Zbývá poslední varianta: AP dělá čest svému jménu a je to skutečně logický princip, něco jako například princip maximální entropie, či princip nejmenší akce, nebo Huygensův princip. Takovým způsobem asi AP většinově chápou kosmologové, alespoň tedy ti, kteří nevyznávají pravděpodobnostní variantu AP s mnoha vesmíry.

Zásadní otázka je: je AP srovnatelným principem s výše vyjmenovanými principy? Soudím, že není, a to hned ze tří důvodů. Prvním z nich je nejasná definovanost takového principu, druhým pak je jeho omezená aplikovatelnost, poslední pak zamaskovaný nepříznivý kompresní poměr.

Princip maximální entropie nám říká, že na třídě přípustných pravděpodobnostních rozdělení pro vyšetřovaný problém máme vzít to s největší entropií. Je to jedoznačně daný předpis, obecně aplikovatelný, a šetří místo: namísto nekonečného seznamu pravděpodobnostních rozdělení užívaných v každém myslitelném případě máme jeden vzorec a k němu krátkou a jednoznačnou interpretaci. Huygensův princip nám říká jak konstruovat vnější obálku šířícího se vlnového balíku; je to jednoduchý a jednoznačný algoritmus, jak mimo jiné dovozovat pravdivost či nepravdivost výroků o vlnách, opět v obecné konfiguraci vln a prostředí, v němž se šíří. Princip nejmenší akce funguje podobně - umožňuje jednoznačně spočítat trajektorii tělesa při zadaných počátečních podmínkách, pro případ libovolných počátečních podmínek.

Lze podobně popsat i AP? Jistěže ne. AP má vybrat jednu variantu vesmíru, a to tu naši, z velkého množství možných variant. Předpokládejme, že máme jednoznačně řečeno, co všechno je považováno za možné varianty. Typicky uvažujeme hypotetické vesmíry řídící se stejnými zákony jako ten pozorovaný, ale s různými hodnotami volných parametrů, jako je třeba rychlost světla či gravitační konstanta. Jedna z verzí AP říká, že konstanty musí být takové, že v daném vesmíru musí být podmínky pro vznik inteligentního života. Kromě nejasností v definici inteligentního života, o čemž se doufám zmíním v dalších příspěvcích, tkví problém v následujícím: Vesmír je jenom jeden. Tudíž výstup AP je sada hodnot konstant, které jsou dnes považovány za nezávislé, a to hodnot takových, aby umožňovaly existenci života [2]. Vezmeme-li dnes užívanou sadu přírodních zákonů, je výstupem AP maximálně okolo třiceti čísel. Přirozená otázka je, zda je kratší udat explicitně hodnotu těchto třiceti čísel, nebo konstatovat antropický princip. Ač to na první pohled nemusí být úplně zjevné, je AP určitě informačně složitější. Totiž podat s rozumnou výstižností definici života zabere jistě víc místa, než napsat třicet čísel s přesností, které je AP schopen, i za předpokladu opravdu jemného ladění a tudíž vysoké přesnosti AP. AP tedy nesplňuje jeden ze základních požadavků na fyzikální teorie: je větší, než množina jevů, které má vysvětlovat.

Ještě jedna úvaha může ilustrovat marnost, se kterou se tu potýkáme. AP nám totiž téměř z definice dává odpovědi pouze na otázky, které již máme zodpovězeny. Představme si, že neznáme hodnotu některé z 30 přírodních konstant. Ve skutečnosti to tak dokonce je - ze 27 parametrů Standardního modelu je zhruba polovina naprosto neznámých. Jsou neznámé proto, že výsledek žádného dosud provedeného pokusu na jejich hodnotě nezáleží. Proto ale také nemůžeme použít antropický princip pro určení těchto hodnot. Neznáme-li jediný jev, který závisí na těchto hodnotách, nemůže ani existence života známým způsobem na nich záviset. Všechna antropická zdůvodnění vypadají zhruba takto:  
  1. Musí existovat život (AP, premisa
  2. Musí být k dispozici prvek s dostatečným potenciálem tvorby složitých sloučenin (plyne z definice života
  3. Podmínky musí být vhodné pro zvnik uhlíku (důsledek 1 a 2)
  4. Proto existuje značné množství uhlíku (důsledek 3)
  5. Konstanta X musí ležet v intervalu I (důsledek 4 za použití nějaké konkrétní teorie).
Vypustíme-li bod 1 a prohlásíme-li bod 2 premisou argumentu, neztratí argument nic na své platnosti. Nebo lze jít ještě dál. Posuďte, oč jasněji a střízlivěji působí tento argument:
  1. Existuje značné množství uhlíku (z pozorování, premisa)
  2. Konstanta X musí ležet v intervalu I (důsledek 1 za použití nějaké konkrétní teorie).
Dá se říct, že každé zdůvodnění, které slouží k odvození hodnot přírodních konstant z AP sestává ze dvou částí. Nejdřív se z AP odvodí nějaký mezidůsledek (v našem případě existence uhlíku), který je přímo pozorovatelný, a z něho pak vyplynou přípustné hodnoty konstant. Vždy je ovšem možné argument zkrátit a mezidůsledek považovat za premisu argumentu, za primitivní pozorování, z kterého plynou naše závěry. První část, která tento mezidůsledek odvozuje z AP, je zbytečná, až bizarní. Skutečně považujeme existenci uhlíku za logický důsledek existence života?
Příště se podíváme na pravděpodobnostně formulovaný antropický princip.

Poznámky:
1. Pro věřící ve stvořitele je odpověď "aby mohl na Zemi vzniknout život" regulérní. Tuto možnost ponechávám stranou kdyby pro nic jiného, tak proto, že existuje široce uznávaný konsensus o tom, že náboženské otázky se nepovažují za součást vědy. Antropický princip není v principu náboženský argument a je široce zmiňován i ateisty. Nenáboženské teleologické interpretace AP neberu v úvahu; hledání účelu u procesů, kde chybí myslící agent, který by tento účel mohl pociťovat, je dle mého názoru viditelně absurdní.
2. Těžko si věc představit jinak, než že AP tyto hodnoty neurčí přesně, ale pouze jako nějaké (úzké?) intervaly. To je samozřejmě další neelegance oproti ostatním zmíněným principům, jejichž výsledky jsou naprosto přesné - aspoň za předpokladu naprosté přesnosti vstupních dat.

Pondělní šífra VIII.

Dnes něco jednoduchého.



ŘEŠENÍ.

úterý 24. listopadu 2009

Etymologický zpravodaj - D

Prvním slovem pro dnešní den je ďábel. Pochází z řec. διαβολος / diabolos = pomlouvač, od slovesa balló = házím, střílím (viz balistika). Předpona dia- odpovídá české předponě roz- (významem, ne původem), tj. diagram = rozpis, diagnóza = rozhodnutí, dialýza = rozklad, diametr = rozměr, dialog = rozhovor (častý omyl je považovat slovo dialog za ekvivalent monologu s náhradou číslovky mono za di, odtud jsou konstruovány obskurní výrazy typu trialog apod.). Diabolos je překladem hebr. satan (שטן). Slova ďábel a satan jsou v některých versích Bible užívána zároveň (Bible by se správně měla psát s y, neb název je od fénického města Byblos). Oproti tomu slovo čert nemá jasný původ. Ještě je vhodno zmínit se o slovu démon, z řec. δαιμων / daimón = zlý duch, prý souvisí se slovem dělit.

Abychom nezůstali pouze u teologické terminologie, zmíním ještě slovo dělo. Toto slovo bylo původně variantou slova dílo. Vývoj významu byl dílo → stroj → obléhací stroj → kanón. V tomto významu existuje jen v západoslovanských jazycích (slov. delo, pol. działo).

Nakonec, jako bonus, slovo darebák: základním tvarem je tu přídavné jméno darebný, původně daremný, v původním významu bezcenný. Slovo je odvozeno od slova dar, na základě logiky, že věci obdržené darem obvykle nemívají velkou cenu. (Když už jsem u toho, nedá mi to upozornit na fakt, že české slovo bezcenný může být pro ostatní Slovany dost matoucí. Polské bezcenny i ruské бесценный znamenají pravý opak, tj. neocenitelný, drahocenný.)

neděle 22. listopadu 2009

Úvod do antropického principu

V úplně prvním příspěvku na tomto blogu, který jsem psal někdy koncem letošního srpna, jsem vyjádřil svůj úmysl napsat kritiku antropického principu. Nuže, ta chvíle nastala teď. Předem říkám, že se neřadím k vyznavačům tohoto principu a následný text bude proto dosti kritický.

Asi je vhodné nejdřív říct, co je antropický princip (dále občas AP). Jak už to bývá, existují různé verze AP. Všechny tyto verze se nabízejí jako odpověď na otázky o povaze světa ve kterém žijeme. Jsou to otázky jako
  • Proč je poměr hmotnosti protonu a elektronu přibližně 1800:1?
  • Proč je Země zrovna 150 miliónů km od Slunce?
  • Proč je vesmír starý právě cca. 14 miliard let? 
Jedná se zpravidla o otázky typu "proč je svět takový, jaký je?" Odpovědi nabízené antropickým principem mají vždy něco společného s existencí člověka (odtud název - z řeckého ανθροπος = člověk). V následujícím budu rozlišovat následující typy či formulace AP:
  1. Vesmír musí vypadat tak jak vypadá proto, aby umožňoval existenci člověka.
  2. Vesmír musí vypadat tak jak vypadá proto, aby umožňoval existenci inteligentního života.
  3. Existuje více logicky přípustných variant vesmíru. Kdyby ale neumožňoval vznik inteligentního života, neměl by si kdo klást tyto otázky. Z toho, že si je klademe, vyplývá, že musíme žít ve ve velmi specifickém vesmíru.
  4. Reálně existuje mnoho různých vesmírů s různými zákonitostmi a hodnotami fyzikálních konstant. Inteligentní život ale může existovat jen v tom našem, a tak není divu, že se nacházíme zrovna tam.
První dvě formulace říkají, že existuje princip, který říká, že ve vesmíru musí existovat inteligentní život, z čehož se dá odvodit jisté omezení na to, jak mohou vypadat přírodní zákony. Interpretace takového principu může být různá. Lze jej považovat za běžný přírodní zákon, který komprimuje informace o povaze přírodních konstant do krátké věty "hodnoty musejí umožňovat inteligentní život", nebo lze tento princip zahrnovat do různých teologických spekulací.

Formulace 3 a 4 jsou pravděpodobnostní: netvrdí, že vesmír musí nějak konkrétně vypadat, ale pozorovaný fakt, že jako lidstvo existujeme, nám z mnoha možností vybírá pouze některé. Než zdlouhavý popis, lépe pomůže trochu nedokonalá analogie: Představte si, že vyhrajete ve sportce první pořadí, tipnuvše si čísla 6, 12, 34, 38, 41 a 42. Nemálo lidí si v takové situaci položí otázku: Jak je to možné, že padla zrovna tato čísla? V analogii s předchozím připadají v úvahu, kromě jiných, odpovědi
  • Existuje princip, který říká, že zrovna já musím vyhrát první pořadí. Tipnul jsem si 6, 12, 34, 38, 41 a 42, a proto tato čísla padla. Jiná by mi nezajišťovala výhru. (Odpovídá přibližně AP dle 1. a 2. formulace.)
  • Mohla padnout jakákoli čísla. Kdyby ale padla jiná, tuto otázku bych si nekladl. (Odpovídá přibližně třetí formulaci.)
  • Byla taženo spousta tahů, ale pouze tehdy, když někdo vyhraje první pořadí, tak si klade tuto otázku. (Přibližná analogie čtvrté formulace.)
Přepsán takto vypadá antropický princip nepříliš vznešeně a jeho první dvě formulace, přijmeme-li srovnání s loterií, se zdají být megalomanským přeludem. Nechci ale útok proti AP vést pomocí analogie, poněvadž analogie je velice zrádná metoda argumentace. Konkrétně srovnání s loterií je do značné míry zavádějící například proto, že existují sázející, kteří nevyhráli, a kteří si také mohou klást otázky, ovšem tentokráte namířené opačným směrem - proč jsem nevyhrál? - v situaci, kde je aplikován standardní AP by tomu odpovídali lidé žijící ve vesmírech neumožňujících život, což je absurdní. Přesto mám za to, že pocit absurdity navozený uvedenou analogií je částečně na místě.

V dalších příspěvcích na téma AP chci blíže rozebrat následující otázky:
  1. Je AP vůbec logicky správná odpověď na dobře definovanou otázku?
  2. Je AP fakticky správnou odpovědí? Neopírá se o nepotvrzené či nepravdivé zamlčené předpoklady?
  3. Je formulace AP v jakékoli podobě jednoznačná a přesná? Neopírá se o intuici víc, než je pro fyzikální princip vhodné?
  4. Je AP testovatelný?
Jsem připraven argumentovat, že ani na jednu z položených otázek není možné dát jednoznaně odpověď ano.


Poznámka na závěr: Občas se rozlišuje slabý a silný AP. Chápání tohoto rozlišení se ale může různit. V původní formulaci slabý AP odpovídá na otázku našeho především časového umístění uvnitř současného vesmíru (nemohli bychom žít těsně po velkém třesku, kdy byl vesmír příliš horký, ani výrazně později než dnes, kdy zaniknou hvězdy a nebude dost dostupné energie). Silný AP pak vypovídá přímo o hodnotách fyzikálních konstant. Tudíž, podle slabého AP není náhoda, že vesmír je starý 13 miliard let, podle silného AP není náhoda, že konstanta jemné struktury je přibližně 1/137. Někdy se ale silný AP rozumí jako synonymum pro 1. a 2. formulaci z tohoto článku, zatímco slabý AP je synonymem pro 3. a 4. formulaci. Abych snížil riziko vzniku nedorozumění, budu se snažit použití adjektiv silný a slabý vyhnout.

pondělí 16. listopadu 2009

Pondělní šifra VII.


Po delší době opět vychází šifra:



ŘEŠENÍ.

Neaktuální fotoreportáž z Bologne



 Procházeje svůj archív fotek s úmyslem najít něco do cestovní rubriky blogu, zastavil jsem se u složky týkající se italské Bologne. Pobýval jsem tam pár dní na konferenci v roce 2006 [1]. Vzpomínky nejsou nejčerstvější, na druhé straně bude díky tomu příspěvek stručnější, což může být i výhodou pro netrpělivé čtenáře. Namísto dlouhého psaní jsem stvořil něco jako ilustrovanou reportáž.

Svým způsobem příznačný je snímek nahoře: nemůžu si totiž zaboha vzpomnout, kde přesně jsem jej pořídil [2]. Protože jsem se ho nechtěl zříct, vyřešil jsem to jeho umístěním v záhlaví. U následujících fotografií se budu snažit vždy poskytnout nějaký komentář. Bohužel, paměť je prevít, a i věci, které se zdají zapamatovatelné navěky, se ztrácejí z paměti překvapivě snadno. Ale zpět k tématu.



Cestu po Bologni začneme u symbolu města, dvou věží, co stojí na konci ulice Rizzoli. Existují ještě další torri di Bologna, ale tyto dvě jsou nejvýraznější. Vyšší z nich se jmenuje Asinelli (věže byly pojmenovávány po rodinách, které je vystavěly v průběhu 12. století) a měří 97 metrů. Mírně se naklání, ale zdaleka ne tolik, jako ta menší, zvaná Garisenda, vysoká 48 metrů.



Věže jsou vděčným tématem fotografií. Do věže Asinelliů je možno vstoupit a po nesčetných schodech vystoupat až na vyhlídkovou plošinu.

 

Výhled seshora je exkluzivní. Na obrázku je pohled na západoseverozápad a nejnápadnějším objektem je katedrála sv. Petra. Před ní stojí svě věže, po Asinelli nejvyšší dochované ve městě. Ta vlevo je Torre degli Azzoguidi, zvaná též Altabella (tedy vysoká kráska), vpravo pak se tyčí Torre Prendiparte. Obě mají cca. 60 metrů.



Šikmost Garisendy je vidět i na pohledu shora. Asinelli a Garisenda jsou zvláštní i tím, že vyrůstají izolovaně, ostatní věže jsou alespoň z jedné strany včleněny do další zástavby.



Těch pár věží, co lze vidět dnes, je ovšem pouhé torzo původní středověké Bologne. Obrázek výše je ofotografovaný snímek visící uvnitř věže Asinelliů, zobrazující Bolognu jak vypadala ai tempi di Dante, tedy ve třináctém století. Podobný pohled na desítky věží dnes již nespatříme. Jisté přiblížení může představovat město San Gimignano, které je relativně známé svými věžemi. San Gimignano ale je, a vždycky bylo, oproti Bologni malým městečkem.

 

Z věží je možno domorodcům koukat přímo do zahrady. Ve vnitřním městě je velmi málo zeleně, a tak se není příliš proč divit pěstování stromů na střechách.



Tento snímek je pořízen pod patami dvou věží, na křížení Via Castiglione a Via Caprarie, a ilustruje další typický prvek Bologne: podloubí.



Podloubí je prakticky všude. Každá ulice v historikém centru má zakrytý chodník aspoň na jedné straně. Spíš než jako ochranu chodců před deštěm či sluncem je ale podloubí třeba chápat jako úsporu drahocenného místa. Ulice jsou v historické části Bologne velmi úzké a na chodník nebylo dost místa, a tak chodník vede domem. Nebo můžeme říkat, že domy jsou postaveny nad chodníkem, jak je komu libo. Mimochodem, chodníky často nejsou nijak výškově odděleny od silnice a hranici vymezují právě jen sloupy podloubí - dokonalá bezbariérovost ve středověkém podání.



Toto podloubí je ale speciální. Je to součást několik kilometrů dlouhé zastřešené cesty od bývalých hradeb u brány Porta Saragozza k poutní svatyni s oficiálním názvem Santuario della Madonna di San Luca ležící na kopci za městem.



Trasa vede nejdřív jako podloubí podél ulice Saragozza, ale pak se odděluje, ulici překříží mimoúrovňově (obr. výše pořízen z tohoto křížení) a dále pokračuje jako samostatně stojící zastřešené schodiště. Celá cesta má údajně 666 oblouků, což se zdá lehce zvláštní u křesťanské stavby.



Když už jsem zmiňoval šířku ulic: nějak se s tím musí vypořádat i hromadná doprava. Často lze vidět autobusy projíždějící úzkými uličkami jako na obrázku.



Dost ulic v roce 2006 bylo zatrolejováno pro provoz trolejbusů (italsky filobus) - vidět na levém obrázku (před kostelem Santa Maria dei Servi na Strada Maggiore), ale provoz nebyl žádný. Původně jsem si myslel, že trolejbusový provoz prochází likvidací, ale po krátkém hledání na webu se zdá, že byl zachován, a v době mé přítomnosti pouze panovala výluka. Hlavním dopravním prostředkem jsou ale skútry, jako všude v Itálii (obr. vpravo).



Zajímavým jevem jsou různé napohled vysloužilé bicykly pevně připoutané k místu svého určení. Potvrzují zásadu, že vždy je nejpevněji zajištěno to, co by stejně nikdo nekradl.



Druhý obrázek slouží jako důkaz, že předchozí snímek nebyla ojedinělá anomálie.



Když už jsme u dopravy, nebyl bych to já, kdybych si aspoň jednou nevyfotil nádraží. Toto je Boloňské hlavní a můžeme zde vidět mimo jiné jednotku ETR500 používanou na vysokorychlostních tratích.



Příjemnou atmosféru mají boloňská náměstí. Většinou nejsou velká, jak je vidět na příkladu Cavourova náměstí na snímku.



Náměstí San Stefano je vlastně rozšířená křižovatka ulic San Stefano a Via Santa. Pozoruhodná je zde bazilika Svatého Štěpána, založená již v pátém století. Je to vlastně komplex několika kostelů - snad až sedmi soudě dle místního názvu Sette Chiese, a protože antických památek v Bologni mnoho nenajdete, jedná se o jednu z nejstarších staveb ve městě.

 

Vlastně jediným větším náměstím je, už podle názvu, Piazza Maggiore. Je to přirozené centrum města, nejen díky poloze přímo ve středu historického centra, ale i díky konání kulturních akcí [3].



Na náměstí stojí za pozornost Neptunova kašna (vpravo unkční detail téhož). Uprostřed náměstí pak stojí Pallazo del Podestà, sídlo městské vlády (podestà byl titul nejvyššího úředníka a správce italských měst, obvykle dosazovaného papežem). Následující snímek nezobrazuje přímo tento palác, ale s ním sousedící Pallazo Re Enzo z poloviny 13. století. Ačkoli je palác podestů starší, byl přestavěn v renesančním stylu, zatímco palác krále Enza si zachoval svou gotickou podobu.




Poznámky:
1. Konferenci pořádala Boloňská universita, která je považována za nejstarší v Evropě (založena 1088).
2. Pozná-li někdo z čtenářů ono místo, ať mi prosím v komentáři osvěží paměť, budu vděčný.
3. Během čtyř dnů jsem na tomto náměstí byl svědkem promítání nějakého norského němého filmu z počátku dvacátého století (originální titulky v norštině, pod tím italský překlad) a následně promítání přímého přenosu semifinále MS ve fotbale Itálie proti Německu. Návštěvnost byla v obou případech hojná, v případě druhé akce ale diváci reagovali o poznání hlučněji.

středa 4. listopadu 2009

Entropie dvou obálek

O paradoxu dvou obálek jsem již psal. Pro připomenutí, nacházíte se v situaci, kterou jsem ve zmíněném příspěvku popsal jako televizní soutěž, kde:

Moderátor před vás položí dvě obálky, a sdělí vám, že uvnitř jsou šeky na výherní částku. Také vám sdělí, že z těchto dvou částek je ta vyšší dvojnásobkem té nižší. Nesdělí vám ale už, o jak vysoké částky se jedná.

Podle pravidel si teď musíte vybrat právě jednu z obálek. Poté ji máte právo otevřít a podívat se, o jakou částku se jedná. Nebude-li se vám částka líbit, můžete obálku vrátit a vzít tu druhou, ovšem tato volba je již definitivní.
Zdánlivý paradox spočívá v tom, že na jednu stranu je celkem očividně jedno, jestli vezmu první nebo druhou obálku. Před otevřením jsou obě obálky rovnocenné, a otevřením jedné z obálek se nic nedozvím o tom, jestli je to ta s více penězi nebo ta s méně penězi. Na druhé straně ovšem, najdu-li v obálce částku X, očekávaná střední hodnota v druhé obálce je 5X/4, což by znamenalo, že je lepší brát druhou obálku.

Napsal jsem, že paradoxnost vymizí, pokud blíže určíme, co znamená, že částky v obálkách jsou náhodné. Když řekneme, že nějaké číslo je náhodné, intuitivně automaticky předpokládáme, že její rozdělení je rovnoměrné na oboru přípustných hodnot, tj. že každá přípustná hodnota má stejnou pravděpodobnost. Ovšem na intervalu (0, ∞) rovnoměrné rozdělení neexistuje. U jakéhokoli jiného rozdělení ale neplatí, že otevřením jedné z obálek se nic nedozvím. Což jsem ilustroval na dvou příkladech.

Mohl jsem se tvářit, že problém je vyřešen, ale svět bohužel (nebo naštěstí) není tak jednoduchý. Není totiž od věci trvat na původním zadání: máte dvě obálky, o nichž vám moderátor sdělí právě jenom to, že v jedné je X, v druhé 2X, a X je náhodné. Vašim úkolem je zvolit strategii postupu.

Namítat, že pojem náhodnosti není jednoznačný, nepomůže. Ne vždy člověk dostává přesné a jednoznačné informace. Náhodnost X nemusí být výsledkem stisknutí tlačítka RND na kalkulačce či sledováním rozpadu uranu 235 či čehokoli jiného, co vnímáme jako z podstaty náhodný děj. Klidně to může být tak, že X si moderátor vycucal z prstu, nebo je pevně určeno v pravidlech soutěže, která vy bohužel neznáte. Pravděpodobnost nakonec není nějaká mysteriózní síla, která řídí určitou uzavřenou třídu jevů. Pravděpodobnost nežije v obálkách ani v náhodných generátorech; naopak, žije v našich hlavách, kde popisuje míru naší (ne)znalosti faktů. A v tomto případě je to tak, že o hodnotě X nevíme vůbec nic, a jsme nuceni si vymyslet její rozdělení pravděpodobnosti.

Pokud bychom věděli, že X může nabývat jen omezeného intervalu hodnot, automaticky volíme rozdělení rovnoměrné. Zdá se to naprosto přirozené, ačkoli není vůbec jednoduché odpovědět na otázku, proč. Není žádný pevný logický princip, který by nás k tomu nutil. Můžeme mávat rukama a říkat, že nemáme žádný důvod předpokládat, že pravděpodobnost, že při hodu mincí padne líc je větší nebo menší než pravděpodobnost, že padne rub - a proto předpokládáme, že tyto pravděpodobnosti jsou stejné. Na druhé straně, není-li důvod předpokládat různost těchto pravděpodobností, není ani důvod předpokládat jejich stejnost [1]. Pokud je nějaký fakt těžko odůvodnitelný, obvykle se to řeší tak, že jej prohlásíme za princip či axiom. S takovým "řešením" se tady můžeme klidně spokojit, a prohlásit, že při absenci jakýchkoli informací o hodnotě X kromě znalosti intervalu přípustných hodnot, z principu přiřazujeme X rovnoměrnou pravděpodobnost na onom intervalu.

Existuje nějaký podobný princip, který funguje i na nekonečných intervalech? Ukazuje se, že ano: za určitých podmínek poslouží princip maximální entropie [2].

Entropie pravděpodobnostního rozdělení je definována jako

S = -Σi pi log pi ,

přičemž pro spojité rozdělení je suma nahrazena integrálem. Číslo pi je pravděpodobnost i-té hodnoty. Základ logaritmu může být jakýkoli, nehraje to žádnou zásadní roli. (Omezuji se zde pouze na praktický popis principu, nikoli na argumenty, kterými je podpořen. Speciálně by stálo za to rozebrat, proč je entropie definována zrovna tak, jak je definována; snad se k tomu někdy v budoucnu dostanu.)

Princip maximální entropie říká (dále jen PME), že člověk by měl neznámé veličině přiřadit takové rozdělení, které má ze všech přípustných rozdělení nejvyšší entropii. Ukazuje se, že pro omezené intervaly dává PME rovnoměrné rozdělení, takže PME je zobecněním jednoduššího "principu rovnoměrné pravděpodobnosti", či jak tomu chceme říkat. Pro ilustraci vezměme hod mincí. Pravděpodobnost, že padne líc, označmě p, pravděpodobnost pádu rubu je bezpochyby 1-p. PME říká, že
- p ln p - (1-p) ln(1-p)
má být maximální, což je pro p = 1/2. [3]

Síla PME samozřejmě nespočívá ve schopnosti dojít k rovnoměrnému rozdělení neznámé veličiny v případě, že nevíme nic než obor jejích přípustných hodnot. To bychom mohli postulovat rovnou. Pomocí PME ale jsme schopni najít "správné" rozdělení i v případě, kdy máme o veličině dodatečné informace. Typickým případem je, když máme důvod se domnívat, že známe její střední hodnotu. Potom nám PME dá exponenciální rozdělení [4], jak můžeme vidět na třech příkladech na obrázku níže:




Uvažujeme-li interval (0, ∞), rozdělení s maximální entropií bez dodatečné podmínky na něm neexistuje. Čímž by se mohlo zdát, že nám PME nijak nepomohl. Ale ve skutečnosti jsme na tom docela dobře. Stačí totiž, specifikujeme-li střední hodnotu neznámé veličiny, a PME nám nadiktuje
rozdělení (bude to, stejně jako u konečného intervalu, exponenciála). (Kdybychom hledali rozdělení na intervalu (-∞, ∞), museli bychom zadat ještě jednu podmínku - mohl by to být třeba rozptyl a v takovém případě by rozdělení s nejvyšší entropií byla Gaussova křivka.)

Díky PME se tedy naše situace zjednodušuje. Místo celého rozdělení nám stačí nějak odhadnout jeho střední hodnotu. Na otázku jak bohužel žádná standardní odpověď neexistuje. Můžeme například odhadnout, kolik zhruba peněz si pořadatel soutěže může dovolit věnovat na výhru. Je celkem těžké si představit situaci, kdy není k dispozici žádná vědomost, která by mohla být použita k odhadu střední hodnoty. A i kdyby nebyla, střední hodnotu prostě odhadneme náhodně, ať už to znamená cokoli - nebude to pořád o nic horší, než kdybychom neměli žádnou strategii.

Princip maximální entropie se tak nejeví jako moc velká výhra. Což se není čemu divit, pokud máme málo informací, naše rozhodování podle toho bude vypadat, i když bude podrobeno matematickému formalismu. Pokud ale jsme schopni aspoň nějakou informaci získat, pak PME nabývá na síle. Představme si, že jsme dvojobálkové loterii podrobeni opakovaně. Pak můžeme evidovat výsledky z předchozích opakování a z nich spočítat odhady střední hodnoty, rozptylu a dalších momentů, ty pak zadat jako dodatečné podmínky pro hledané rozdělení a najít to s největší entropií. Tato strategie by měla být velmi efektivní.

Není samozřejmě pravda, že takový postup bude vždy optimální strategií. Házím-li cinknutou kostkou, na které padne vždycky šestka, také není optimální předpokládat rovnoměrné rozdělení. Optimální je předpokládat, že padne vždy šestka. Pokud ovšem vím, že je kostka cinknutá, ale nevím jak konkrétně, zase mi nezbyde než předpokládat rovnoměrné rozdělení. Předpoklad, že padne vždy šestka je sice optimální na kostce, která je tak upravena, ale je naprosto nevhodný na drtivé většině ostatních kostek. Naopak zásada rovnoměrného rozdělení padajících hodnot je univerzální. Stejně tak univerzální, ale obecnější, je princip maximální entropie. Obecnější proto, že umožňuje vzít v úvahu částečně známé informace. A dává odpověď na otázku: Jaké je přirozené rozdělení náhodné veličiny na nekonečném intervalu?

Poznámky:
1. Hod mincí není moc dobrý příklad, protože s ním máme dlouhodobé zkušenosti. Asi každý si za život pár set krát hodil mincí a ví proto, že rub a líc padají přibližně stejně často. Pokud ale narazíme na jev, se kterým žádnou zkušenost nemáme, je nastalá situace prekérnější.
2. Souvislost s termodynamikou je zde velmi volná. Ačkoli se člověk běžně s pojmem entropie setkává v souvislostech fyzikálních, pojem entropie přirozeně patří do teorie pravděpodobnosti a jeho fyzikální interpretace je jen jeho velmi specifickým uplatněním. Fyzikové ovšem objevili entropii nejdříve, již v
devatenáctém století. Princip maximální entropie pro pravděpodobnostní rozdělení byl formulován až v polovině století dvacátého.

3. Derivováním podle p získáme ln p - 1 + ln(1-p) + 1 = ln(1-p)/p, což je rovno nule právě když p = 1 - p.
4. Odvození je triviální úloha na variační počet.

středa 28. října 2009

Etymologický zpravodaj - C

Původní text mejlového zpravodaje k písmenu C byl docela dlouhý. Jednak konstatoval, že chemický prvek Cer se jmenuje po planetce Ceres, a pokračoval takto:

Slovo pro tento den jest CIZÍ. Praslovanská obdoba byla ťuďь, což pochází z protoindoevropského tauta nebo teuta, znamenající lid nebo národ. Stejného původu jsou slova Teuton a Deutschland. Vývoj významu se vysvětluje dvěma způsoby. Buď 1) slovo znamenalo původně "lidový", "národní" a postupně přešlo k dnešnímu významu dle zásady "co je státní, to není moje". Podobný vývoj má polské slovo obcy = cizí, původně obecní. Nebo 2) znamenalo původně germánský (a bylo přejato od Germánů, kteří se tak nazývali) a pak postupně začalo znamenat cizí. Podobný vývoj zažilo germánské slovo walh, které původně označovalo nějaký keltský kmen co se tak nazýval sám, potom všechny Kelty a nakonec prakticky všechny cizince. Odtud jsou názvy Wales, Valonsko, Wallis (kanton ve švýc.) a česká slovo Vlach a Valach (Valaši přišli na Moravu z Rumunska).

Když už jsme se dostali k původu slova Deutsch, můžeme se podívat i na další kmenové názvy. To, že angl. Dutch souvisí s Deutsch je asi zřejmé. Podobně triviální je původ fr. Allemand, pův. název jednoho z germ. kmenů. Vznikl zřejmě složením "alle" a "mann", tj. všichni muži. -d na konci fr. slova vzniklo podobným způsobem, jako -m- v it. slově sambato = sobota (pův. sabbato) nebo -d- v českém lidovém výraze bizardní. Samotný název Germán pochází od Keltů, a značil buď "soused" nebo "hlučný" (příbuzné je zřejmě irské slovo gáir = řev). Pikantní je srovnání se slovanským názvem Němec (jak může být někdo zároveň němý a hlučný?). Sami Keltové také nemají přiliš lichotivý název, keltos v řečtině znamenalo něco jako barbarský (v dnešním významu, starořecké barbaros znamenalo prostě doplněk k množině všech Řeků). Mimochodem od slova barbar pochází it. bravo a angl. brave, ale to už se dostáváme daleko od tématu.

Jelikož jsem v řazení původních Zpravodajů ignoroval diakritiku, pokusím se to napravit dodatkem týkajícím se slov začínajících na Č. Prvním je pozdrav čau, o kterém je všeobecně znám jeho italský původ. Co se ví méně, je, že italské ciao je zkomolená nářeční varianta slova schiavo, tj. otrok. To pochází z pozdně latinského sclavus téhož významu. Ještě dříve bylo ale sclavus latinské označení pro Slovany, kteří se v době stěhování národů často dostávali do římského otroctví. Že čau a Slovan mají stejný původ může dnes působit poněkud překvapivě, ale je to tak.

Slovo čolek nijak zvlášť zajímavou historii nemá. Pochází z polštiny, odkud bylo importováno v době obrození. Czołg znamenalo ve starší polštině had a czołgać się bylo plazit se. Co je ovšem zajímavější je dnešní použití slova v polštině: znamená totiž tank. Čolek se pak polsky řekne traszka. Kliknete-li na odkaz, nedivte se, že Poláci čolka řadí mezi płazy. Polští płazy jsou totiž naši obojživelníci. Naši plazi jsou polsky gady. Naši hadi jsou polsky węże (počáteční wę- odpovídá českému u-, slovo je tedy zjevně příbuzné s naší užovkou). Takže při cestě na sever pozor na záměnu užovek s hady, hadů s plazy, plazů s obojživelníky a čolků s bojovou technikou.

pondělí 26. října 2009

Pondělní šifra VI.

Dnešní zadání (doporučuji na to kliknout pro zvětšení):



ŘEŠENÍ.

sobota 24. října 2009

Vyvraťme dogma vyvratitelnosti!

Asi nejdůležitějším rozdílem, který charakterizuje vědu oproti ostatním učením typu náboženství, okultismu, mysticismu, astrologie či mnoha filosofických směrů - seznam nevědeckých učení by mohl vydat na celý článek sám o sobě - je úzkostlivé porovnávání teoretických tvrzení s pozorovanou skutečností. Obvykle říkáme, že vědecké hypotézy jsou experimentálně testovány. Při nepříliš pečlivých debatách na toto téma se často říká, že věda poskytuje důkazy svých teorií, a tak třeba principy kvantové teorie jsou dokázány, na rozdíl od například základních principů spiritismu. Při podrobnějším rozboru se ale pojem důkazu v této souvislosti stává neudržitelným. Zkušenost říká, že většina teorií, včetně těch, o kterých nelze rozumně říct, že jsou nevědecké, byla v průběhu času nahrazena novými. Ptolemaiův model kosmu, v němž planety (do nichž patřily i Slunce a Měsíc) obíhají po kružnicích, které samy obíhají po větších kružnicích, je asi nejlepším příkladem. Tento starý geocentrický model byl v souladu se všemi pozorováními, která byla učiněna v průběhu dlouhých staletí; byl tak podle všech rozumných standardů "dokázán", alespoň ve smyslu, v jakém se v běžné řeči toto slovo užívá i dnes. Přesto byl tento model opuštěn a dnes mu nikdo nevěří, snad kromě pár výstředních podivínů. Podobný osud jako geocentrický model měla i Newtonova mechanika, i když dopadla o poznání lépe: stále je používána jako základní rámec popisu značného množství jevů. Je to dáno tím, že oproti Ptolemaiovu modelu je Newtonova mechanika výrazně obecnější, ale tento rozdíl je pramálo podstatný pro naši debatu; podstatné je, že jak Ptolemaiův model, tak i klasická mechanika sdílejí osud teorie, o které se dříve soudilo, že je dokázaná, a přesto byla později překonána.

Když si lidé uvědomili, že věda přes veškeré své přednosti neposkytuje nezvratné důkazy, hledali jinou charakteristickou vlastnost, která odlišuje vědu od nevědeckých disciplin. V současnosti je mezi zainteresovanou veřejností (ať už to znamená cokoli) velmi populární kritérium vyvratitelnosti vědeckých teorií, zavedené filosofem Karlem Popperem. V zásadě je věc formulována následovně: Hypotéza či teorie jsou vědecké, právě tehdy když je možno učinit nějaký experiment, jehož výsledek dosud neznáme, a mezi jehož možnými výsledky jsou takové, které jsou ve sporu s předpověďmi dané teorie. V takovém případě je teorie principiálně vyvratitelná, a úkolem experimentálních vědců je provádět právě takové experimenty, které mají šanci teorii vyvrátit. Čím víc takových experimentů teorie ustojí, tím větší vážnosti nabývá, jediný experiment ji ale může pohřbít navždy, pokud dopadne jinak, než teorie předpokládá. Žádný jednotlivý experiment, ani konečná sada experimentů, ale teorii nepotvrdí nade vší pochybnost.

Kritérium vyvratitelnosti dobře funguje pro mnoho praktických příkladů, a je relativně jednoduché na použití. Ku příkladu hypotéza "všechna jablka padají k zemi" je vědecká, protože můžeme pouštět různá jablka z různých míst v různých časech. Pokud se jednou jedinkrát stane, že jablko vzletí vzhůru, bude hypotéza vyvrácena. Naproti tomu, hypotéza, že všichni fanoušci Baníku Ostrava přijdou po smrti do pekla, je nevědecká, a zůstane takovou tak dloho, než někdo předloží návrh, jakými experimenty by přítomnost mrtvých Baníkovců v pekle bylo možno případně vyvrátit.

Problém je, že, jak už to v podobných případech bývá, jednoduché kritérium vyvratitelnosti nevymezuje kategorii vědeckosti zcela tak, jak bychom si pravděpodobně přáli. Tvrzení, že vědecké teorie jsou vždy vyvratitelné a nikdy ověřitelné, se opírá o jistou abstrakci toho, jak tyto teorie obvykle fungují. Abstrakce je zhruba tato: Každá teorie je logický systém, z kterého je možno odvodit nekonečné množství specifických výroků (z teorie "všechna jablka padají k zemi" odvodíme např. "pokud pustím dnes v 22:16 v kuchyni toto jablko, tak spadne na zem"), z nichž aspoň některé můžeme s jistotou ověřit. Platnost teorie jako celku je ekvivalentní platnosti všech tvrzení z ní vyplývajících. Jelikož je jich nekonečně mnoho, není je možno ověřit všechna, a tak ověření teorie je mimo lidské síly. Pro vyvrácení celé teorie ale stačí prokázat nepravdivost jediného z těchto tvrzení, což je bezpochyby proveditelné.

Ačkoli ve většině případů funguje kritérium vyvratitelnosti dobře, jeho rigidní užívání v sobě nese nebezpečí vylučování dobrých a přínosných teorií. Chci teď poukázat na to, že a) ne každá vyvratitelná teorie je dobrá vědecká teorie, b) ne každá vědecká teorie je vyvratitelná, a konečně c) existují dobré teorie, které je přirozenější potvrzovat, než vyvracet.

Jako ilustraci bodu a) můžeme uvažovat jednoduchý příklad - teorii, která je sjednocením dobré vědecké teorie a špatné, netestovatelné teorie. Pro (absurdní) příklad teorie "platí Newtonovy zákony a zároveň všichni Baníkovci skončí po smrti v pekle" je jistě vyvratitelná, protože můžeme testovat platnost Newtonových zákonů, ale dobrá teorie to zjevně není. Uvědomte si, že tento typ teorií nemůžeme a priori "zabít" požadavkem, aby nejen celá teorie, ale každý jednotlivý výrok byl vyvratitelný pomocí pozorování. Většina zjevně dobrých teorií totiž implikuje nějaké množství netestovatelných výroků. Součástí různých fyzikálních teorií jsou předpoklady o univerzální platnosti jejich zákonů, včetně těch částí prostoru a času, ve kterých neexistuje či neexistoval nikdo, kdo by mohl provádět jakýkoli experiment. Jak exaktně ověřit, že předměty padaly k zemi i v Grónsku během poslední doby ledové?

Co se bodu b) týče, každá teorie, která v sobě zahrnuje pravděpodobnost, je dobrým příkladem. Kvantová mechanika pak příkladem ideálním. Dává-li teorie pouze pravděpodobnostní přepovědi, může se stát, že každý experimentální výsledek s ní bude nějak slučitelný. Budou existovat experimentální data, která teorii učiní velmi nepravděpodobnou, ale žádná data ji s jistotou nezničí. Mám-li teorii, že hrací kostka není cinknutá, a pak s ní desetkrát hodím a pokaždé padne trojka, teorie se pravděpodobně vzdám, ale nemůžu prohlásit, že jsem ji vyvrátil. I na férové kostce může padnout deset trojek za sebou. Vzhledem k tomu, že všechna pozorování mají v sobě potenciál pro systematické a náhodné chyby, které nemůžeme s jistotou vyloučit, je absolutní vyvracení teorií neuskutečnitelnou chimérou.

V bodě c) mám na mysli především teorie, ze kterých plyne jen konečné množsví nezávislých [1] tvrzení. Tak se chová většina teorií v matematice, ale o matematice se obvykle v souvislosti s vyvratitelností nehovoří (zjevně proto, že matematika obvykle nebývá porovnávána s experimentem). Jako mimomatematický příklad můžeme vzít třebas Koperníkovu heliocentrickou teorii. Ta říká, že planety obíhají po kružnicích kolem Slunce. Představme si skromného Koperníka tvrdícího pouze to, že jeho teorie platila pouze po určitou dobu (třeba během Koperníkova života) a co se týká budoucnosti, bůh ví co se stane. V takovém případě bychom se dostali do prekérní situace. Koperníkova teorie by byla ověřitelná (za předpokladu, že máme k dispozici záznamy pozorování pohybů nebeských těles z dané doby a vynecháme hnidopišské námitky proti omezené přesnosti každého pozorování), a pokud by tato data seděla - tj. pokud by planety skutečně běhaly po kružnicích, a ne elipsách - pak by nebyla vyvratitelná, prostě proto, že už by nebylo možno učinit žádné další pozorování.

Preferuji pohled, že mezi vyvracením a potvrzováním není až zas takový zásadní rozdíl. Reálné teorie nebývají absolutně vyvráceny ani úplně potvrzeny. Místo toho jednotlivá pozorování přírody zvyšují či snižují věrohodnost té které teorie, a když věrohodnost klesne pod určitou mez, teorie je opuštěna.




Poznámky:
1. Nezávislými tvrzeními myslím ta, která spolu logicky nesouvisí za použití vztahů, jejichž platnost je zajištěna vně testované teorie. Kdybychom brali v úvahu i vztahy předepsané testovanou teorií, pak by všechna z ní plynoucí tvrzení byla triviálně navzájem závislá.