Partner webuRoger logo
Předplatit časopis Finmag

Našli jsme vám nádor, ale nejspíš vám nic není aneb úvod do předpovídání

Michal Kašpárek
Michal Kašpárek
25. 10. 2012
 9 167

Baseballový statistik a politolog Nate Silver radí, jak přemýšlet o budoucnosti. Jeden tip za všechny? Nedržte se jak klíště své Velké Pravdy a hodnoťte informace spravedlivě.

Našli jsme vám nádor, ale nejspíš vám nic není aneb úvod do předpovídání

Ekonom Nate Silver má teprve třicet čtyři let, a už si vysloužil nálepky „Kurt Cobain statistiky“ a „guru, který předpověděl výsledky posledních voleb“. V baseballové komunitě se proslavil hned po škole svým systémem pro předpovídání výkonnosti jednotlivých hráčů, širší publikum si našel politicko-věšteckým blogem FiveThirtyEight. Před pár týdny vydal knihu The Signal and the Noise: Why So Many Predictions Fail – But Some Don’t (Signál a šum: Proč se tolik předpovědí nevyplní, ale některé ano). Ta má čtenáře naučit dívat se do budoucnosti střízlivě, s pomocí tvrdých dat a bez zbožných přání.

Ve svém mohutném tematickém záběru Signál a šum zaujme bohužel spíš studenty statistiky než laické čtenáře. Pokud si ale rádi představujete, „co bude“, ba dokonce svými věštbami oblažujete ostatní třeba jen na sociálních sítích, nahlédnout byste do ní měli.

Dobrého věštce vedou nové informace k novým předpovědím. Špatného utvrzují v jeho pravdě

To podstatné se dozvíte hned na začátku. Silver se přes práci „historika myšlenek“ Isaiaha Berlina dostává až k řeckému básníku Archilochovi z Paru, který v 7. století před naším letopočtem napsal: „Liška ví mnoho rozličných věcí, ježek jednu velkou.“

Metaforu z bajky Silver nadšeně rozvíjí: „Ježci […] věří Velkým myšlenkám – principům, kterými se svět řídí podobně jako přírodními zákony, a které se skrývají pod každou mezilidskou interakci. Vzpomeňme si na Karla Marxe a jeho třídní boj, Sigmunda Freuda a nevědomí nebo Malcolma Gladwella a bod zlomu. Lišky jsou naopak roztěkaná zvířata, která nosí v hlavě plejádu malých myšlenek a dokážou se na problémy dívat různými způsoby.“

Ježci jsou oblíbenými hosty Událostí, komentářů: vědí, co se stane, a ještě to podají jako strhující příběh o Dobru a Zlu. Eurozóna nevydrží do masopustu! – Ne, eurozóna bude tisíciletou zárukou míru! Pohříchu, předpovědi lépe vycházejí liškám. Tady se Silver zase odkazuje na psychologa Philipa E. Tetlocka a jeho odhalení, že to byly právě lišky, kdo na konci 80. let správně předpověděl zánik Sovětského svazu. Pro reaganistické „ježky“ to byla Říše zla a ty jen tak nepadají, pro příliš zapálenou levici pak relativně úspěšný marxistický experiment. Jen lišky si bez klapek na očích mohly všimnout, že jde v podstatě o nefunkční stát.

Víc se o dvou přístupech k odhadování budoucnosti dozvíte z přehledné srovnávací tabulky. Lišky tolerují komplexitu: „Vnímají svět jako komplikované místo, v němž jsou některé základní otázky nezodpověditelné a některé jevy nepředvídatelné.“ Ježci se naopak snaží za vším najít řád. Pro lišky je důležitější pozorování než teorie, zatímco ježci vnímají všední jevy jako projevy nějaké „vyšší myšlenky nebo zápasu“.

Jak poznáte, že jste liška? Vaše předpovědi se zlepšují – a tedy i zásadně mění! – když získáte přístup k novým informacím. „Ježci, kteří mají k dispozici kvanta informací, fabulují příběhy; učesanější a přehlednější, než je skutečný svět. S hrdiny a zloduchy, vítězi a poraženými, vrcholy a rozřešeními a obvykle též šťastným koncem pro domácí tým.“

Našli jsme vám nádor – ale rakovinu pravděpodobně nemáte!

Praktickou část Silver staví na práci Thomase Bayese. Už čtvrt milénia mrtvý, a přece stále plně nedoceněný statistik kázal, že pravděpodobnost jevů lze vyčíslit na základě pravděpodobnosti jevů opačně podmíněných. Srozumitelný příklad z nemocnice: Rakovina prsu se objeví u zhruba 1,4 procenta čtyřicátnic. „Mamograf zahlásí falešný poplach jen u zhruba deseti procent pacientek, které nádor nemají. Pokud však žena rakovinou trpí, přístroj ji odhalí s 75% pravděpodobností. Když vidíte tyhle statistiky, pozitivní výsledek z mamografu vypadá jako hodně špatná zpráva. Přes Bayesovu větu se ale doberete k odlišnému závěru: pravděpodobnost, že má čtyřicátnice s pozitivním nálezem opravdu rakovinu je pouze deset procent.“ Pomyslnou váhou totiž nehýbe jen omylnost přístroje, ale i nízká výchozí pravděpodobnost rakoviny: ta byla před testy jen 1,4 procenta a toto číslo žádná diagnóza nevygumuje, na jeho základě se proto musí kalkulovat dál.

„Podstata Bayesovy myšlenky se ale neskrývá v tom, že svůj odhad pravděpodobnosti přepočítáme pouze jedenkrát. Musíme tak totiž učinit vždy, když se setkáme s nějakým novým důkazem,“ správně nabádá Silver. Lišky jsou tedy otevřené změnám svých předpovědí podle toho, jak přicházejí nová data. Není to farizejství, protože přece nikdy o ničem netvrdí, že se to rozhodně nestane, ani že se něco jiného stane určitě. Spíš se rezervovaně přiklánějí k té nebo oné variantě, nesázejí na svoje předpovědi všechno, a pokud mají možnost, namísto tipování experimentují. Za vzor dává Silver firmu Google, která design svých produktů nestaví na ježčích bouchnutích do stolu „Lidi budou tuhle funkci milovat!“, ale na lišáckém „A/B testování“: „Půlce lidí tuhle funkci zapneme, půlce ne, a uvidíme, která varianta si povede líp.“

Big data? Big problem

Užitečné rady jsou bohužel rozředěny do třinácti dlouhých kapitol, pokrývajících různá témata: Silverovu srdcovku baseball, globální oteplování, zemětřesení, šachy, finanční krizi nebo terorismus. Jen tahle pasáž byla opravdu objevná – nikdy jsem nikde nečetl tak střízlivý rozbor jednotlivých rizik, která západním zemím hrozí. (Spojler: často zmiňovaná atomovka v rukou al Káidy vás moc trápit nemusí, protože teroristům nejde v první řadě o počet obětí, ale o šíření strachu. A ten se jim daří zasít logisticky jednoduššími způsoby.) Ne že by ve zbytku Silver plácal nesmysly: jeho argumentům nezvládnu vytknout nic a tleskám tomu, že poznámkový aparát s odkazy na zdroje tvrzení tvoří třetinu knihy. Jen jsem měl pocit, že by do poznámek měl přesunout ještě jednu třetinu: píšu-li o souboji Garryho Kasparova s Deep Blue, několikastránkový víceméně encyklopedický úvod o mechanickém Turkovi je tam prostě navíc.

Signál a šum je po Too Big to Know letos už bohužel druhá kniha, která ukázala, jak těžké je psát o ­„big data“. „Redaktor časopisu Wired Chris Anderson v roce 2008 napsal, že kvůli obřímu množství dat bude jednou zbytečná jakákoliv teorie a dokonce samotná vědecká metoda,“ píše Silver v úvodu a slibuje, že vyloží, jak se to s těmi daty má. Nejblíže se tomu dostává v kapitole o globálním oteplování – což je klasický případ jevu, který lze těžko zkoumat postaru experimentálně, zato však mají vědci k dispozici kupy čísel. Svůj cíl ale autor míjí. Hezky vysvětluje, jak těžké je očesat signál od šumu. Připomíná, že i když víme, že obžerství ústí v otylost, mezi průměrným kalorickým příjmem v jednotlivých zemích a mírou obezity v jejich populaci nelze skoro najít úměru. Do moderní meteorologie, politických debat o změnách klimatu ani do problematiky velkých dat obecně ale moc světla Silver nevnáší: jen tak krouží úzkým kuželem baterky po jednotlivých výzkumech a problémech. Velká škoda.

Sliby z obálky a úvodu plní Nate Silver jen dílem; baseballový statistik zakopl někde poblíž třetí mety. Do knihovny střízlivého skeptika ale Signál a šum přesto patří: pomůže mu pamatovat na to, jak je důležité zůstat liškou, když jsou média i hospody plné ježků.

PS: Čtečka zpráv mi po dopsání článku nabídla ještě dva dobré argumenty pro přestup k liškám. Šest italských vědců a úředníků dostalo šest let za to, že nevarovali obyvatele L’Aquily před ničivým zemětřesením tři roky nazpátek. Jeden z nich místním poradil, aby místo paniky „relaxovali se sklenkou vína“; šest dnů na to zemřelo v sutinách 308 lidí. A Ronald Bailey na blogu Reason.com v recenzi knihy Half of the Facts You Know Are Probably Wrong ukazuje, že i fakta mají svůj poločas rozpadu a mnoho z toho, co dnes víte, se později ukáže být nesmyslem. Někdy to trvá jen šest dnů.


Nate Silver: The Signal and the Noise: Why So Many Predictions Fail-but Some Don't. Vydalo nakladatelství Penguin Press HC v září 2012. 544 stran, 16,40 dolarů.

Daňové přiznání online

Ohodnoťte článek

-
1
+

Sdílejte

Diskutujte (7)

Vstoupit do diskuze
Michal Kašpárek

Michal Kašpárek

Po studiu žurnalistiky a filmové vědy na Masarykově univerzitě prošel MF DNES a redakcemi Computer Pressu. Mezi lety 2009 a 2016 byl na volné noze, od roku 2017 do jara 2021 vedl Finmag.cz a editoval tištěný... Více

Související témata

big dataIsaiah BerlinježciklimatologieliškyMalcolm GladwellmeteorologieNate SilvernejistotapravděpodobnostpředpovídáníRonald BaileysignálšumterorismusThomas Bayes
Daňové přiznání online

Aktuální číslo časopisu

Předplatné časopisu Finmag

Věda je byznys –⁠ byznys je věda

Koupit nejnovější číslo