Partner webuRoger logo
Předplatit časopis Finmag

Němci nejezdí v bavorácích proto, že jsou chytřejší. Zpohodlněli jsme!

Ondřej Tůma
Ondřej Tůma
3. 8. 2013
 5 083

Muž, který učil počítač porozumět tomu, co člověk říká. Skoro dvě desítky let dohlížel na vývoj software pro rozpoznávání přirozených jazyků v IBM a Google. Vrátil se do Česka na „svou“ univerzitu a učí české studenty porozumět tomu, jak funguje svět úspěšných. „Lidé tu často nemají touhu se zlepšovat. Chtějí mít pohodičku, grilovačku na zahradě a k tomu pivo,“ říká Jan Šedivý. Na druhou stranu neváhá vyzdvihnout úspěšné projekty svých studentů a poněkud tak toto tvrzení zrelativizovat.

Němci nejezdí v bavorácích proto, že jsou chytřejší. Zpohodlněli jsme!

S Janem Šedivým jsem se sešel v jeho kanceláři na Karlově náměstí na elektrotechnické fakultě Českého vysokého učení technického v Praze. Sem se nedávno vrátil po osmnácti letech práce ve velkých nadnárodních korporacích, kde pracoval na významných projektech a vedl přední týmy vývojářů. „Říkal jsem si, že už je na čase, abych se vrátil na svou alma mater a začal své zkušenosti předávat studentům. To je pro mě smysluplná činnost,“ vysvětluje svůj návrat na akademickou půdu. Kromě jiného se na ČVUT věnuje projektu eClub, který pomáhá studentům s podnikatelskými začátky. Pokud ve svém autě máte navigaci s hlasovým zadáváním, tak je dost možné, že využíváte jeden z patentů, které má na svědomí právě Jan Šedivý. Ten totiž patří k hlavním postavám, které se zasloužily o komerční využití rozpoznávání řeči počítačem.

Co vás na začátku devadesátých let přivedlo do IBM?

Během mého dvouletého pobytu v Japonsku, kde jsem pracoval na rozpoznávání ručně psaného písma počítačem, jsem se seznámil s Frederickem Jelinkem. To byl hrozně zajímavý a chytrý člověk, který je dnes považován za otce rozpoznávání řeči. V sedmdesátých letech přešel z akademické sféry do IBM, kde ve Watsonově výzkumném centru v Yorktownu přes dvacet let vedl výzkumnou skupinu, která pracovala na tom, aby počítače dokázaly co nejlépe rozpoznávat a zpracovávat mluvenou řeč. Koncem roku 1991 se mi ozval s tím, že když prý už žijeme ve svobodné zemi, tak bych mohl začít pracovat pro IBM. Zavolal mi týden před Štědrým dnem a chtěl, abych nastoupil hned 2. ledna. Říkal jsem mu, že takhle rychle to nepůjde, ale 12. února 1992 jsem se už hlásil v Yorktownu.

Dalo by se tedy říct, že jste stál na počátku komerčního využití rozpoznávání řeči počítačem. Jak tehdy probíhal váš výzkum a kde všude nalezly vaše patenty uplatnění?

Když se teď zpětně dívám na to, jakým způsobem se oblast rozpoznávání řeči rozvinula, tak z toho mám vážně radost. Na začátku jsme se zabývali algoritmy, které by uměly rozpoznávání řeči na počítačích 486, které měly strašně malou výpočetní kapacitu. S tehdejšími PC jsme nedokázali rozpoznávat spojitou řeč, uměli jsme jen izolovaná slova, takže jsme museli mezi slovy dělat výrazné odmlky. Brzy na to jsme už ale zvládli i plynulou řeč. Od osmadevadesátého jsem začal pracovat na softwaru, který pomáhal rozpoznávat řeč v drobných zařízeních s malými procesory. Tenhle software zvládal jednoduché příkazy, třeba vytočit telefonní číslo člověka, jehož jméno řeknete. Pak jsme vytvářeli program ViaVoice, který dodnes slouží v navigacích v autech pro zadávání cílové destinace hlasem. Oblast rozpoznávání řeči šla vpřed mílovými kroky, stačí se podívat na to, jak dnes fungují technologie Applu a Googlu. V současných mobilních aplikacích je konverze zvuku do textu jen prvním krokem, následuje sémantická interpretace, která je nutná, aby program zjistil, co vlastně chceme. Ani to ale nestačí pro jednoduchou interakci, brzy s námi budou tato zařízení komunikovat v dialogu. Budou nám dávat dotazy, aby zjistila, co přesně chceme, aby mohla precizně odpovědět. Nebudeme jim muset všechno říkat, protože se sama zeptají.

Jaký jazyk je pro programátora z hlediska rozpoznávání řeči nejobtížnější?

Hodně složitá je čínština. Ta se od ostatních jazyků odlišuje, protože jde o takzvaný tonální jazyk. Například hláska A má v čínštině několik poloh, které jí dávají význam, což je pro program, který rozpoznává řeč, obtížné. Proto jsme museli doplnit detektor, který určoval výšku hlásky, aby ji bylo možné přesně určit.

Kvůli čemu jste se po šestnácti letech rozhodl opustit IBM a odejít do Googlu? Dostal jste nabídku, která nešla odmítnout, nebo jste chtěl zkrátka změnu?

Samozřejmě jsem cítil, že by to po takové době chtělo nějakou změnu. Svůj podíl na tom ale měl spíš fakt, že se IBM začínala orientovat jiným směrem. Rozpoznávání řeči pro ni nebyla strategická technologie, takže nějaké patenty prodala konkurenci. Nechci říct, že to byl jediný důvod mého odchodu, ale významnou měrou to přispělo k tomu, že jsem hledal něco jiného.

Jak se od sebe odlišují firmy IBM a Google?

IBM je obří firma s dlouhou historií. Ve své době ovládala svět počítačové techniky. Za roky své existence se ovšem vysoce strukturalizovala a hierarchizovala, takže je dnes samozřejmě mnohem konzervativnější než Google. Ten zatím funguje v plošší struktuře a veškeré procesy v něm tedy mohou probíhat rychleji. Je neuvěřitelné, co všechno se jim podařilo za poměrně krátkou dobu vytvořit.

V Googlu jste ale nakonec strávil jen něco přes dva roky. Proč?

Původní záměr byl trochu jiný, než jak se to nakonec vyvrbilo. Do Googlu jsem nastupoval s tím, že budu dělat ředitele vývojového centra v Praze. Firma si tuhle lokalitu ale nakonec rozmyslela. Působil jsem jako šéf vývojářů pro střední Evropu a Skandinávii, ale sídlili jsme v Polsku a později ve Švýcarsku. Zabývali jsme se především vylepšováním lokálních aplikací. Už jsem ale nebyl tolik v kontaktu s vývojáři, kteří skutečně sedí celý den za počítačem a vymýšlejí nejlepší kód pro váš projekt. Nemůžu říct, že by mě ta práce nebavila, na druhou stranu ale nebyla ani tak fantastická, aby mi to stálo za to, že nevidím svoji rodinu. Ročně jsem měl přes 70 letů, pořád jsem si musel hlídat, abych byl včas na letišti, takže jsem si nakonec zvolil něco klidnějšího.

Proč jste se rozhodl pro návrat na univerzitu? Nelákalo vás to zkusit ještě v nějaké jiné prestižní firmě, třeba právě v Česku?

Říkal jsem si, že bude nejlepší, když se vrátím mezi své kolegy, se kterými jsem studoval a kteří univerzitu nikdy neopustili a dnes z nich jsou už profesoři. Rád bych své zkušenosti předával studentům, pomáhal jim v jejich projektech, motivoval je k větší snaze. Přijde mi to jako smysluplná práce.

Na ČVUT se kromě jiného věnujete také projektu eClub. Jak byste ho našim čtenářům představil?

eClub je nezávislá platforma, která má pomoci studentům, aby rozjeli své vlastní podnikání. Součástí eClubu jsou výukové přednášky, kde radíme, jak správně prezentovat projekty nebo jak jednat s firmami. Pak tam máme také motivační přednášky, na kterých se s návštěvníky dělí úspěšní lidé z byznysu o svoje zkušenosti a poznatky. Zároveň pravidelně pořádáme soutěž, které se se svými projekty můžou účastnit studenti všech fakult z celé republiky. Vítězové pak dostanou stipendia, aby mohli své projekty realizovat. Zároveň jim přidělíme mentora, který jim pomáhá a na všechno dohlíží.

Jaké zajímavé projekty vám v poslední době v eClubu prošly rukama?

Poslední cyklus vyhrál projekt Apeman Boards, jehož tvůrci se pustili do výroby longboardů z karbonových vláken. Další oceněný projekt se jmenuje BlindShell a je to mobilní rozhraní pro nevidomé a zrakově postižené. Uspěli také studenti, kteří v rámci projektu Maxturam nabízejí svým klientům výrobu vitaminových pilulek přesně na míru. V předchozích ročnících uspěly například aplikace pro diabetiky nebo pro studenty technických oborů.

Často upozorňujete na to, že se dnes Češi se svým byznysem zbytečně soustředí jen na domácí trh. Proč myslíte, že tomu tak je?

Je to tak. A je to velká škoda. Samozřejmě, že pokud má někdo pekárnu, tak bude cílit jen na své okolí. Když ale někdo dělá například aplikaci pro Android, tak je škoda, aby ji nenabídl i jinde. Žijeme v globální době, s angličtinou oslovíte zákazníky po celém světě. Pokud jde o technologické věci, tak je zbytečné se v tomto ohledu držet při zemi.

Jak se liší čeští studenti od těch, kteří studují na univerzitách na Západě?

Rozhodně se nedá říct, že bychom byli hloupější. To vůbec ne. Studenti tu ale nejsou komunikativní, neptají se, když něčemu nerozumí. Můžu jim jen doporučit, aby vyjeli do zahraničí a rozšířili si obzory. Tím samozřejmě nemyslím, aby se jeli koupat do Itálie. Měli by v zahraničí studovat, pracovat, získávat nové zkušenosti, přátele a kontakty. A také poznávat, jak to funguje na jiných trzích. I to se totiž hodí.

Souhlasíte s tím, že na našich vysokých školách je příliš mnoho studentů? Že z vysokého školství přestává být elitní záležitost, kterou by studenti brali prestižně?

Rozhodně s vámi souhlasím. Na spoustu oborů by člověk vysokoškolské studium vůbec nepotřeboval, ale protože to po něm systém vyžaduje, tak jde zkrátka na vejšku. Ve skutečnosti tím ale ztrácí čas, teoretické věci ho nebaví, většina probírané látky se mu k práci nehodí a ke škole nemá žádný vztah.

Říká se, že studium na českých vysokých školách je příliš teoretické. Studenti se tu na rozdíl od Ameriky během školy takřka nezapojují do praxe ve firmách.

Přijde mi, že se tady studentům v tomhle ohledu moc nepomáhá. Oni by si přitom měli zkoušet své znalosti v praxi a hledat, po čem je na trhu vlastně poptávka. Školy je k tomu ale vůbec nemotivují. Často pak studium sklouzne k tomu, že student je ve škole jen kvůli tomu, aby si tam odseděl povinné přednášky, zvládnul zkoušky a dostal papír, který mu zajišťuje titul. Chybí mi tady studentský komunitní život. Větší zapojení studentů do dění na univerzitách. 

V jednom z rozhovorů jste říkal, že jsou Češi příliš velcí „zápecníci“ a že to je brzdí v dalším rozvoji. Čím to je?

Nemáme se tu vůbec špatně a nějak jsme z toho zpohodlněli. Žijeme si tak trochu jako ve zlaté klícce, i když to zlato už dost zrezavělo. V Americe je například mnoho přistěhovalců, kteří mají často mnohem horší podmínky, ale chtějí se v konkurenci prosadit, chtějí něco dokázat, tak taky víc makají. A když se podíváme do Německa, tak tam všichni nejezdí v bavorácích a mercedesech kvůli tomu, že jsou chytřejší než my. Jen dokážou své dovednosti lépe využít. Mají schopné lidi, kteří umějí práci lépe organizovat, umí lidi řídit a motivovat. Tohle u nás chybí. Lidé tu často nemají touhu se zlepšovat. Chtějí mít pohodičku, grilovačku na zahradě a k tomu pivo. Nějaká větší angažovanost je jim cizí. Bez toho se ale tahle společnost nikam neposune.

Jak to ale změnit?

Nepodlehnout uspokojení. Mít stále nové vize. Věřím, že se to bude časem zlepšovat. Máme tu dost skvělých příkladů mladých lidí, kteří prorazili v zahraničí. Když ostatní uvidí, že mají možnost vybudovat vlastní byznys a získat s ním celosvětový úspěch, tak je to bude motivovat. To je ten správný motor, to bychom měli podporovat.

Úvodní foto: isifa/Lidové noviny/PAVEL WELLNER


Jan Šedivý

Vystudoval Elektrotechnickou fakultu na ČVUT v Praze. Po dokončení studií působil jako asistent na ČVUT. V letech 1992 až 2000 pracoval ve výzkumném centru společnosti IBM T. J. Watson Research Center v New Yorku. Poté až do roku 2008 působil jako manažer pro výzkum a vývoj hlasových technologií v IBM v Praze. V letech 2008 až 2010 byl šéfem vývojářů Googlu v Curychu. V roce 2010 se vrátil na ČVUT jako manažer pro transfer technologií, přednáší mimo jiné vývoj internetových aplikací a vede projekt pro začínající podnikatele z řad studentů eClub. Je ženatý a má tři dcery.

Daňové přiznání online

Ohodnoťte článek

-
0
+

Sdílejte

Diskutujte (3)

Vstoupit do diskuze
Ondřej Tůma

Ondřej Tůma

Vystudoval žurnalistiku na Fakultě sociálních věd Univerzity Karlovy. Studoval také na Fakultě humanitních studií v Praze a na Goethe-Universität ve Frankfurtu nad Mohanem. Má za sebou stáže v Českém rozhlase... Více

Související témata

Apeman BoardsBlindShellčvuteClubgoogleibmjan šedivýMaxturammobilní aplikacerozpoznávání řečistart-upuniverzityvysoké školyvzdělání
Daňové přiznání online

Aktuální číslo časopisu

Předplatné časopisu Finmag

Věda je byznys –⁠ byznys je věda

Koupit nejnovější číslo