středa 6. dubna 2011

Gödel, Escher, Bach a výuka matematiky


Nikdy jsem neměl rád učebnice matematiky. Mluvím teď hlavně o učebnicích vysokoškolských, protože ty středoškolské si už moc jasně nevybavuji a základoškolské vypadly z paměti téměř dokonale. Nepamatuji si ale ani na to, že bych v té době byl jejich obsahem nějak nadšen, takže moje úvodní tvrzení pravděpodobně platí obecně.

Matematika je exaktní disciplína. Síla matematiky spočívá z poloviny ve formálním a přesném dokazování a z poloviny v úsporné symbolice. Výrok o matematických objektech je buď pravdivý nebo nepravdivý; ať už platí první nebo druhé, fakt je to absolutní a pevný jako papežova víra a (na rozdíl od papežovy víry) se k němu dá dojít sekvencí dobře definovaných kroků, které často můžeme reprezentovat manipulacemi s přesně definovanými symboly. Řekneme třeba, že „v separabilním prostoru je každá kompaktní množina omezená a uzavřená“. Pokud je to pravda, pak existuje postup, jak z definic klíčových pojmů (např. „separabilní prostor“, „kompaktní množina“) a sady axiomů či předem dokázaných tvrzení jednoznačně ukázat, že tomu tak je. Jestliže to tak není, můžeme zpravidla najít stejně jednoznačný protipříklad.

Tato síla matematiky jakoby určovala strukturu matematických textů. Běžná učebnice matematiky je strukturována stylem definice — věta — důkaz. Monotónní sekvence vět a důkazů jsou občas přerušeny příkladem, krátkým komentářem nebo odkazem na další literaturu; některé jednodušší důkazy jsou „ponechány jako cvičení pro čtenáře“ (jak já tohle nenávidím). Postupně se tak z několika málo prvotních axiomů deduktivně odvodí celá rozsáhlá teorie. Má se za to, že struktura matematiky mluví sama za sebe, a delší sekvence textu, vysvětlování či ilustrace jsou nehodné matematikova času. Jak říkal jeden z přednášejících na MFF: „Nejlepší obrázek je rovnice“.

Přesná a úsporná dedukce je jistě hlavní předností matematiky — ba možná její jedinou předností. Je jistě fascinující, jak z devíti jednoduchých axiomů Peanovy aritmetiky lze odvodit každý fakt o přirozených číslech, a z pěti Euklidových axiomů plyne každá, byť sebesložitější, věta v planimetrii. Problém je, že ve většině případů je deduktivní výstavba matematické teorie dost mizerným způsobem, jak matematiku učit.

Vezměme třeba Fourierovu analýzu. Když budu chtít celou teorii popsat v co nejkratším čase, pravděpodobně začnu s definicí Fourierovy transformace [*]



a poté začnu odvozovat, jaké vlastnosti tato operace má. Zbyde-li po dokázání třiceti vět a sedmnácti lemmat nějaký čas, zmíním praktické aplikace.

Prakticky každému, kdo se s takovým postupem setká poprvé, vytane na mysli otázka: proč? Proč je Fourierova transformace definována zrovna tak? Na což přednášející zpravidla odpoví „protože se to časem ukáže užitečným“ a autor knihy neodpoví nijak, poněvadž knize nelze zadávat dotazy... Koneckonců definice nemůže být nepravdivá a nelze ji tudíž dokázat ani vyvrátit. S čímž je tuto otázku možné zapudit z mysli. Potíž je, že s otázkou je obvykle zapuzena i značná část zájmu o příslušnou matematickou teorii [1].

Neříkám ani tak moc to, že výklad má začít defilé praktických aplikací. Výklad má spíš probíhat tak, aby každý další krok se zdál být přirozeným; aby při nové definici člověk neprožíval pocit naprostého překvapení. Praktické aplikace nebývají zdaleka tak efektivní, jako koncepčně jednoduchý abstraktní důvod. „Je potřeba umět odmocňovat záporná čísla“ mi na střední škole připadalo být mnohem přesvědčivější motivací pro zavedení komplexních čísel než „elektroinženýři je používají pro počítání se střídavým proudem“. Definici Fourierovy transformace tak má předcházet výklad diferenciálních rovnic a lineární algebry, analogie s rozkladem vektoru do bází a podobně. Netvrdím pochopitelně, že učebnice Fourierovy analýzy tyto aspekty vždy ignorují. Přesto jsem při čtení matematických textů zpravidla míval pocit, že intuitivním argumentům a skutečnému vysvětlování je věnováno příliš málo prostoru, že poměr textu a vzorců v matematických textech je příliš silně vychýlen ve prospěch vzorců. Může to být proto, že psát dlouhé vysvětlení znamená práci navíc pro autora a papír navíc pro vydavatele; lze se na to dívat tak, že dlouhé pasáže textu nepřidávají novou informaci a dokonce negují výhody stručné matematické notace. Nebo je to proto, že mnoho intuitivně přesvědčivých argumentů není přísně vzato pravdivých (respektive jsou nepřesné, a jejich zpřesnění by šlo na úkor intuitivní přesvědčivosti) a matematik má zábrany takové argumenty použít.

Uvědomuji si samozřejmě, že moje preference pro zdlouhavá vysvětlování nemusí být zcela univerzální, a že pravděpodobně existují lidé, kteří preferují matematické knihy, v nichž nejdelší sekvence psané přirozeným jazykem jsou „z čehož plyne“ a „což jsme měli dokázat“. Dokonce předpokládám, že mé představy o ideálním stylu výkladu jsou anomální, usuzuje z toho, že již píši osmý odstavec, aniž bych se stále dostal k hlavnímu tématu článku, který má být recenzí na knihu.

Gödel, Escher, Bach je kniha o matematice a její autor, Douglas Hofstadter, je matematik. Přesto nemá prakticky nic společného s učebnicemi matematiky tak, jak je známe. Vlastně nemá moc společného s jakoukoli jinou knihou, kterou jsem kdy měl možnost vidět (pravda, nemluvím zde z pozice příliš sečtělého člověka). Je obtížné GEB, jak se název zpravidla zkracuje, klasifikovat do ustálených škatulek literárních žánrů — jak jsem již napsal, není to učebnice, nejsme-li ochotni totálně změnit vnímání významu toho slova, není to beletrie, nezapadá ale ani do kategorie literatury faktu, kam by se dala zařadit většina populárně vědeckých publikací. Snad se dá říct, že GEB je próza, i když si umím představit argument i proti této klasifikaci. Aby toho nebylo málo, Hofstadter popírá, že GEB je primárně o matematice...

Ze tří osob jmenovaných v názvu je nejdůležitějším protagonistou Kurt Gödel, či lépe řečeno jeho nejznámější idea o nedokazatelnosti určitých výroků obsahujících autoreferenci. (Čtenář si dosytosti užije i paradoxních grafik M.C.Eschera a debat o Bachově hudbě; to poslední jsem já, jako muzikálně naivní čtenář, nebyl schopen plně ocenit.) První zhruba polovina GEBu postupně vysvětluje obsah slavné první Gödelovy věty o neúplnosti, a to způsobem, který nepředpokládá žádné předběžné matematické znalosti (možná se hodí umět sčítat přirozená čísla). Zbytek se pak věnuje tak různým věcem, jako jsou genetika a fungování DNA, původ vědomí, rekurzivní algoritmy nebo interpretace jazyka. Přes tak značnou šíři záběru nepůsobí kupodivu GEB ani trochu dojmem neuspořádané hromady vzájemně nesouvisejících ideí.

Ačkoli spekulace o podstatě vědomí jsou nepochybně zajímavé, píšu tuto recenzi především s ohledem na část vysvětlující Gödelovu větu. V tomto ohledu představuje GEB z mého úhlu pohledu jistý ideál — ideál prezentace matematických myšlenek. Hofstadter dokázal skloubit několik napohled protichůdných požadavků: zejména čitelnost, přesnost, přístupnost a provokativnost. (Poslední vlastností zde samozřejmě myslím schopnost provokovat nové nápady, spíš než rozhořčení a násilné reakce.) Autor každý svůj krok vysvětluje na příkladech a analogiích. Dokáže se ovšem vyhnout typické zhoubě populárně vědeckých publikací, která často bývá spojena s použitím analogií, speciálně v diskusích o obtížných tématech: vágnímu jazyku. V podstatných momentech je Hofstadter přesný a interpretace jeho textu je jednoznačná. Přesnosti přitom dosahuje bez toho, aby svůj text degradoval na soupis podmínek, definic, výjimek a formálních důkazů, zkrátka bez nahrazení přirozeného jazyka technickým žargonem, jaký bývá zpravidla k nalezení v matematických (a právnických) textech, kde na přesnosti záleží. Neznamená to, že GEB je plně prostá definic, důkazů a technického žargonu; pouze tolik, že tyto věci jsou užity v míře nutné tam, kde přispívají ke srozumitelnosti. Srozumitelnost, nikoli přesnost, je hlavním cílem.

Vše má samozřejmě svou cenu, a cenou za čtivost a srozumitelnost textu je zde jeho délka. GEB má několik set stran (a několik zde neznamená dvě nebo tři) a někdy byl text i na mě příliš zdlouhavý. To se týká speciálně alegorických dialogů stavěných podle vzoru eseje Co řekla želva Achillovi Lewise Carrolla, které se nacházejí mezi každými dvěma kapitolami. Gödelovu větu je jistě možné vysvětlit na desetině místa, které k tomu potřeboval Hofstadter, navíc s přidanou matematickou rigorózností. Podstatnější, než počet stran, je ale doba strávená nad knihou, a jak znám své tempo čtení hustě psaných matematických textů (doprovázeného často frustrací nad hodinu trvající neschopností posunout se o odstavec dál), nejsem si jistý, zda autorova ochota vést čtenáře pomalu a důkladně přes všechny podstatné kroky ve skutečnosti čas ve skutečnosti nešetří.

GEB jistě není kniha pro každého. Těm, kdo nenávidí cokoli související s matematikou a logikou z celé své duše, asi mnoho zábavy nenabídne. Pro obzvlášť matematicky nadané čtenáře možná může být naopak přespříliš zdlouhavá. Bohužel, není zatím ani pro čtenáře, kteří čtou pouze česky, protože český překlad dosud neexistuje. Zabýval jsem se nějakou dobu ideou knihu přeložit, ale kromě standardní lenosti tomu překáží i způsob, jakým je GEB psán. Kniha je plná slovních hříček a zašifrovaných sdělení, z nichž mnohé jsou nepřeložitelné. Přítomnost těchto věcí sice není pro obsah knihy klíčová, přesto ale mám pocit, že každý překlad GEBu je tak nějak neúplný. Jestli nějakou knihu je dobré číst v originále, pak tuto. [*]

I když se mi tedy nechce překládat, mám alternativní, skromnější plán. V sérii několika následujících [*] příspěvků se pokusím reprodukovat podstatné části Hofstadterova vysvětlení Gödelovy věty a vyrobit tak návod pro ty, kteří by chtěli pochopit, co vlastně znamená neúplnost logických systémů, ale zároveň nemají dost motivace k serióznímu studiu logiky.


Poznámky:
1. Že lidský mozek není stavěn jako procesor na matematickou logiku platí univerzálně, i pro matematiky. Příkladem par excellence byl geniální Ind Srínivása Rámánudžan, který vymýšlel podivuhodně složité identity, aniž by je v tu chvíli uměl formálně dokázat (a proto se čas od času, i když zřídkakdy, zmýlil).

10 komentářů:

  1. Na reprodukci se těše,
    podobám se přitom bleše.

    OdpovědětVymazat
  2. Nedřív trocha povinného píchání hnid:

    "z devíti jednoduchých axiomů Peanovy aritmetiky lze odvodit každý fakt o přirozených číslech"

    Nelze, jak koneckonců praví Gödelova věta. Příkladem budiž Goodsteinova věta, která je v rámci Peanovy axiomatisace nedokazatelná. (Dokazatelná je, byť se týká čistě jen vlastností přirosených čísel, paradoxně až užitím arimetiky ordinálních čísel, např. v rámci ZF axiomatisace teorie množin.)

    "Kurt Gödel, či lépe řečeno jeho nejznámější idea o nedokazatelnosti určitých výroků obsahujících autoreferenci"

    Tady si nejsem moc jistej, ale je nutné, aby ty výroky obsahovaly autoreferenci? Zrovna ta výše zmiňovaná Goodsteinova věta je čistě číselně teoretické tvrsení, prosté jakýchkoliv autoreferencí.

    Jinak na GEB se taky už delší dobu chystám. Zatím jsem si o Gödelových větách přečetl útlou knížku Gödel's Proof od Ernesta Nagela a mimochodem s předmluvou jejího editora Douglase Hofstadter. Je to sice populárně-vědecká kniha, ale natolik stará (50. léta), že se v té době ještě mohly do takových knih dávat rovnice. Rozhodně doporučuju. Mám ji česky a jelikož už myslím není k sehnání, mohu zapůjčit.

    OdpovědětVymazat
  3. Hm, měl jsem zůstat radši jen u toho Euklida. Euklidovská planimetrie je snad úplná. Nebo ne?

    Nejsem si v tomhle případě jist, ale je existence zrovna Goodsteinovy věty důsledkem Gödelovy věty? Na Goodsteinovu větu jsem poprvé náhodou narazil na Wikipedii při psaní tohohle pamfletu, takže o ní moc nevím.

    I systém neobsahující PA a nesplňující předpoklady Gödelovy věty může být neúplný. Duch GV je, že pokud systém obsahuje PA, pak je v jeho rámci možné vyrobit autoreferenci, a proto musí být neúplný nebo nekonsistentní. Systémy mohou být neúplné i z triviálnějších důvodů, ale aby se dokázalo, že každý (PA obsahující) systém musí takový být, je tam ta autoreference (byť třeba maskovaná za aritmetické operace s Gödelovým číslem) nutná.

    OdpovědětVymazat
  4. "Euklidovská planimetrie je snad úplná. Nebo ne?"

    Myslím, že taky ne, ačkoliv, pokud vím, žádný příklad konkrétního nedokasatelného výroku není zatím znám. Podle Gödelovy věty je neúplný každý formální systém, obsahující aritmetiku [1]. Což Euklidovská planimetrie je, neboť se dá formulovat jazykem analytické geometrie, která samozřejmě aritmetiku obsahuje.

    "Nejsem si v tomhle případě jist, ale je existence zrovna Goodsteinovy věty důsledkem Gödelovy věty?"

    Proč by neměla být? Teda ne že bych si byl až tak úplně jist, ale vždy jsem měl za to, že Gödelova věta je obecné tvrsení o existenci nedokazatelných výroků v určitých formálních systémech. Netvrdí nic konkrétním tvaru těchto výroků. Specielně, čímž se dostávám k té další poznámce, tyto výroky samy nemusí nutně obsahovat žádnou autoreferenci, ačkoliv autoreference je vyžita v důkazu jejich existence (v důkaze Gödelovy věty se pomocí Gödelova číslování přímo konstruuje konkrétní nedokazatelný výrok, obsahující autoreferenci.)

    Jinými slovy, pokud to chápu správně, formální systém musí umožňovat vytváření utoreferenčních výroků (proto ta aritmetika), nicméně nedokazatelné výroky nemusí samy o sobě autoreferenci obsahovat.

    Ale až takový odborník na logiku nejsem, takže mé výroky je třeba brát s reservou, zcela jist si jimi nejsem. Zejména mám pocit, že by možná by stálo za to pořádně definovat, co to ta autoreference vlastně je...


    _____________
    [1] Ať už axiomatisovaonou PA, nebo jinak. Jaké jsou mimochodem vlastně požadavky na aritmetiku (tj. axiomatisaci přirozených čísel), aby platila Gödelova věta?

    OdpovědětVymazat
  5. Jazykem aritmetiky se dá formulovat leccos. Aby EG nutně obsahovala PA, musela by naopak PA být formulovatelná jazykem EG.

    Těmi přesnými požadavky si nejsem momentálně jist, ale ten systém musí být schopen formulovat všechny rozumné výroky (ať už to znamená cokoli) o přirozených číslech, aby se dal aplikovat trik s očíslováním výroků. Samozřejmě, až budu psát relevantní pamflet, tak si to osvěžím.

    GV je sice obecné tvrzení o existenci nerozhodnutelných tvrzení, ale dokazuje se konstruktivně tím, že se vyrobí autoreferenční nerozhodnutelný výrok (respektive se ukáže, že takový výrok musí existovat). Z "existují nerozhodnutelné autoreferenční výroky" samozřejmě plyne "existují nerozhodnutelné výroky", takže existence libovolného nerozhodnutelného výroku je v tomto smyslu důsledkem GV, nicméně... Tím, že nerozhodnutelnost výroku není důsledkem GV myslím to, že tato nerozhodnutelnost není zjistitelná technikami používanými při důkazu GV. Podotýkám, že nevím, jestli to je případ Goodsteina.

    OdpovědětVymazat
  6. Já jsem toho názoru, že vadou prakticky všech matematických učebnic je skutečnost, ve vykládají matematiku "odprostřed", tj. používají se jakési (možná exaktní) definice, ovšem pojmy, na nichž tyto definice stojí, nikde vysvětleny nejsou. Tím pádem je z toho jen schizoidní blábol, který se většina žáků / studentů prostě učí mechanicky nazpaměť, bez možnosti tomu porozumět.
    Nakonec pro vypočtení příkladů jsou důležitější řešené príklady (pokud jsou), protože z nich se dá reverzním inženýringem (byť to žáci / studenti takto nenazývají a pracují spíš intuitivně) zjistit algoritmus postupu (většinou jsou ty definice natolik bláboloidní, že tohle, nejdůležitější, se z nich vyvěštit nedá).
    Proto také matematika patří mezi nejnenáviděnější předměty na školách.

    OdpovědětVymazat
  7. Česky z toho vyšla velká recenze s dost rozsáhlými ukázkami myslím kdysi ve Světové literatuře.

    OdpovědětVymazat
  8. @Peter: 1993 - to asi nebude někde digitálně?

    @Rebamus: "používají se jakési (možná exaktní) definice, ovšem pojmy, na nichž tyto definice stojí, nikde vysvětleny nejsou"
    Měl jsem za to, že pojmy bývají zavedeny právě v definicích.

    OdpovědětVymazat
  9. To Hynek Bíla:
    Problém nastává v momentě. kdy jedna z těch definic odkazuje na druhou, ta na třetí atd. až ta poslední na tu první (jak to důvěrně známe třeba z nápovědy u windows). Potom se to celé hroutí.
    V té školské praxi pochopitelně stačí i to, když učebnice třeba z 2. ročníku gymnázia odkazuje na cosi z učebnice 8. třídy ZŠ (už proto, že ty jsou pro starší žáky/studenty nedostupné).
    Prostě každé slovo v těch definicích by mělo být vysvětleno (dohledatelně) zejména pokud znamená něco jiného než v obecném jazyce (což je další nešvar matematiků - brát slova z obecného jazyka a dávat jim zcela odlišný, často zavádějící, význam)

    OdpovědětVymazat