Používáte nástroj pro blokování reklamy. Pokud nám chcete pomoci, vypněte si blokování reklamy na našem webu. Zde najdete jednoduchý návod. Děkujeme.

Na PornHubu jak u zpovědi

Vyhledávacím políčkům lidé svěří víc než svým blízkým. Zpovědní tajemství porušuje datový analytik Seth Stephens-Davidowitz v zábavné, ale povrchní knize.

Když do vyhledávacího pole napíšete „je normální chtít…“, Google na základě dotazů ostatních uživatelů doplní: „zabít“. A když dopíšete „zabít“, Google pokračuje: „svoji rodinu“. Nebo zkuste: „proč jsou Židé…“ – a můžete si vybrat ze „zlí“, „rasističtí“, „oškliví“, „lakomí“ a „chamtiví“. Zatímco ve statusech na sociálních sítích za frází „můj manžel je“ nejčastěji následuje „nejlepší“ nebo „můj nejlepší kamarád“, na Googlu za ní stojí „gay“ a „trouba“.

Seth Stephens-Davidowitz: Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are – vyšlo v nakladatelství Dey Street Books v květnu 2017. 352 stran, 17 dolarů (verze pro Kindle).

„Dotazy položené Googlu jsou historicky nejcennějším datasetem popisujícím lidskou psýchu,“ konstatuje profesí analytik a vzděláním filozof a ekonom Seth Stephens-Davidowitz. Co z toho datasetu vyvodil, to prozrazuje už samotný titul jeho knihy: Everybody LiesVšichni lžou.

Google – interrupční klinika i linka bezpečí

S našeptávačem dotazů si asi někdy hrála většina z nás. Na podobných příkladech by proto těžko šlo postavit 356stránkovou knihu, kterou by čtenář nechtěl už ve třetině někoho frustrací utlouct. (Třeba svoji rodinu.) Stephens-Davidowitz předchází nudě třemi způsoby:

Za prvé, položené dotazy z Googlu nedoluje jen přes našeptávač, ale i pokročilejší analytické nástroje. Zjistil s nimi, že podpora Donalda Trumpa byla nejsilnější tam, kde se nejčastěji hledalo slovo „negr“. Nebo že se návody na domácí přerušení těhotenství z celých USA nejvíc hledají v Mississippi, státu se třemi miliony obyvatel a jedinou interrupční klinikou. Zájem o pilulky a ramínka nicméně začal plošně stoupat se začátkem krize v roce 2008 – stejně jako tehdy své zoufalé dotazy začalo do Googlu ťukat stále víc týraných dětí.

Další čtení

V krátké, ale obsažné knížce Jak lhát se statistikou Darrell Huff už v roce 1954 odhalil nejčastější způsoby, jak si novináři, marketéři a politici vycucávají zrovna taková čísla, která se jim hodí. Teď můžete Huffův ironický návod číst i česky.

O tajné souvislosti mezi platy farářů a cenou rumu

Za druhé se Stephens-Davidowitz neomezuje na Google. Noří se do statistik vyhledávání na PornHubu: v reálu se vám málokdo přizná, že ho bere incest, přitom jeho různé formy popisuje šestnáct ze sta nejhledanějších frází u mužů a devět u žen. Na nerovné šance napříč Státy autor upozorňuje prostřednictvím dat z Wikipedie: na vlastní životopisné heslo na ni dosáhl jeden z 1209 příslušníků generace baby boomers narozených v Kalifornii, ale jen jeden z 4496 narozených v Západní Virginii (slavní kriminálníci se v to nepočítají). Z Facebooku si Stephens-Davidowitz stáhl informace o fanoušcích baseballového klubu New York Mets: nápadnému množství z nich bylo v době zisku prvního nebo druhého titulu (1969, 1986) okolo osmi let. (Což vlastně vysvětluje, proč pořád fandím stájím McLaren a Williams.)

A nakonec si odnesete i tipy na nástroje, se kterými se do objevování nečekaných souvislostí můžete pustit sami i bez technických schopností – jako je průzkumník četnosti slov v historické literatuře Ngram Viewer (Erez Aiden a Jean-Baptiste Michel o něm napsali celou knihu), známá služba Google Trends či méně známá Google Correlate.

PornHub by přece nelhal

Všichni lžou vám podobně jako Padesát vynálezů, které stvořily moderní ekonomiku naláduje před vánočními večírky plný zásobník konverzační munice. Snad ještě jednu perličku: Stephens-Davidowitz s pomocí skriptu simulujícího nejčastější překlepy zjistil, že freudovská upsání typu „security“ → „sexurity“ dělají lidé stejně často jako zcela asexuální počítač. „Freudova teorie, že podobné chyby odhalují naše podvědomé touhy je falzifikovatelná – a podle mé analýzy chybná. Data říkají, že banán je prostě jen banán.“ (Já bych ale Freuda tak rychle nezatracoval: ostatně sám autor ukazuje, jak překvapivě často muži sní o styku s matkou a vraždě otce.)

Ke kafi Kašpárkův výběr

Chytré čtení na víkend

Dobré čtení má oproti sebelepší buchtě jednu výhodu. Nevadí, že se do něj před vámi zakousl někdo jiný. Každý týden šéfredaktor Finmag.cz Michal Kašpárek ochutná metráky textů. A každý pátek vám e-mailem pošle přehled těch nejlepších. Pokud tedy budete chtít a přihlásíte se k odběru našeho pravidelného newsletteru. 

Čtení na víkend

Kniha je to tedy zábavná. Je ale dobrá? Na to, aby si zasloužila pochvalu, je bohužel bolestivě povrchní. To se týká jednak velké části analýz, někdy by šlo psát i o „analýzách“ v uvozovkách. Například: v zimních měsících se v havajském Honolulu prý hledá o 40 % méně dotazů souvisejících s depresemi než v Chicagu. „Pokud bychom soudili podle těchto čísel, přesun z Chicaga do Honolulu by byl na zimní chmury alespoň dvakrát efektivnější než léky.“ Jak vychází porovnání milionů dalších kombinací chladných a teplých míst? Nevíme. Jaký je vlastně poměr v teplých měsících? Nevíme. Nemůže nákladná rekreační oblast přitahovat aktivní lidi lačné po životě, kteří po nocích negooglují Zoloft, ale Viagru? Nevíme. Je vůbec deprese to samé co zimní chmury? Víme: není.

Odpovědi z našeptávače prý odhalují kulturní rozdíly – například ve Spojených státech se nastávající otcové nejčastěji Googlu ptají „moje žena je těhotná, co teď“, zatímco v Mexiku hledají „básně pro těhotné ženy“. Můžete si říct: wow, rozdíl! Jenže pak by vám to mělo začít vrtat hlavou. Jak vypadá zbytek hledání? Není možné, že má španělština víc frází vyjadřujících zmatek, takže spadnou dolů? Američani jsou zase bohatší než Mexičani, co když díky tomu spíš než laciné básničky hledají pro svoje maminy masáže a wellness pobyty? A tak dále.

Stephens-Davidowitz je obecně skoupý na to dělit se o čísla a metodologii, což z většiny jeho odhalení dělá trochu podezřelá, i když třeba ne vyloženě neuvěřitelná tvrzení.  Při většině svých her s čísly z PornHubu a Googlu dokoce ani neuvádí, zda jsou data globální, nebo omezená na Spojené státy.

A přestože je zdravě podezřívavý k lidem a snaží se přesvědčit, že lžou, kudy chodí, jakmile jde o data, kritické myšlení obvykle vypíná. „Data z pornowebů a Googlu nejsou jenom nová, jsou upřímná,“ tvrdí. Na PR oddělení PornHubu ale pracují zas jen lidé – a neměli bychom být překvapení, pokud by se rozhodli zveřejňované statistiky přikrášlit tak, aby se o nich víc psalo.

Všichni lžou patří do stejné poličky jako knihy Malcolma Gladwella. Tedy mezi čtivo, které vám v jistých kruzích (klíčová slova: kreativita, inovace, osobní rozvoj) pomůže přesvědčit ostatní, že jste smart a deep. Jen tomu, prosím, neuvěřte sami.

Michal Kašpárek

Michal Kašpárek

* 1984. Absolvent bakalářského studia žurnalistiky a filmové vědy na Masarykově univerzitě. V letech 2006 až 2009 novinář v MF DNES, Metropolisu a Computer Pressu. Od roku 2010 publicista na volné noze. Pravidelně píše pro... Více o autorovi.

Komentáře

Celkem 0 komentářů v diskuzi

Při poskytování služeb nám pomáhají soubory cookie. Používáním našich služeb nám k tomu udělujete souhlas. Další informace.

OK