Seznam jde znovu proti globálním gigantům. Staví hlasového asistenta, který umí česky a chce předčít Alexu i Siri
Adam Raška, senior produktový manažer v Seznam.cz
Hlasoví asistenti jsou rychle rostoucím fenoménem. Svým telefonům či reproduktorům diktuje příkazy stále více lidí, a to i v Česku. Háčkem však je, že žádný z asistentů největších technologických firem na světě neumí česky. A proto do hry vstupuje Seznam, který se chce velkým americkým hráčům v čele s Amazonem, Googlem a Applem postavit. Ostatně má s tím své zkušenosti. „Sezname, co je tvůj asistent vlastně zač?“
Vytvořit kvalitního hlasového asistenta, který by perfektně rozuměl řeči svých uživatelů a plnil bez problémů jejich rozkazy, není jen tak. V popředí globální bitvy o hlasové ovládání je Amazon, který boduje se svou asistentkou Alexou. Apple má vlastní Siri, Google zase Assistanta, ale nikdo z nich neumí česky. A tak ve smíchovských kancelářích české internetové jedničky vycítili příležitost a chtějí ovládnout tuzemský trh vlastním hlasovým asistentem.
„Máme nyní unikátní příležitost. Jsme jediní na trhu s asistentem, na kterého lze mluvit česky,“ říká pro CzechCrunch Adam Raška, seniorní produktový manažer v Seznam.cz, který má na starosti mimo jiné také vývoj hlasového pomocníka. Jmenuje se prostě Seznam a troufá si postavit se do souboje s Alexou a dalšími anglicky mluvícími asistenty, protože ty v Česku využívá jen omezená skupina lidí. Masově by je rád oslovil právě Seznam.
Zejména americký trh totiž ukazuje, že v hlasovém ovládání je budoucnost. Například třetina Američanů dnes již běžně na telefon nebo třeba chytrý reproduktor promlouvá, když potřebuje něco vyhledat, a potenciál hlasových příkazů je mnohem větší, než když jen něco nevíte a potřebujete se zeptat třeba Googlu. V Česku stále mnoho uživatelů vyhledává na Seznamu a nyní budou moci využít také hlas.
Čeština znovu rozdá karty
Česká internetová jednička si s hlasovým asistentem hraje zhruba od roku 2019. Tehdy do ní nastoupil také zmíněný Adam Raška, bývalý šéf rezervačního systému Bileto. Jako nadšeného příznivce Alexy ho zaujalo, že se již s takovou myšlenkou ve firmě pracovalo, a dal dohromady malý tým, který se vývojem asistenta začal intenzivně zabývat. Dnes jsou venku první betaverze a Seznam má s hlasovým ovládáním velké plány.
„Být první na našem trhu s asistentem, který umí česky, je podle mě klíčové. Zahraniční konkurence je sice velmi silná, ale věřím, že se u nás díky češtině karty rozdají znovu,“ je přesvědčen Raška. Podobně to bylo i ve Spojených státech, kde jako první přišla Alexa od Amazonu, a byť ji Google s vlastním řešením dohání, dlouho si držela výsadní postavení. Seznam teď chce získat podobný náskok v Česku.
Aplikaci Seznam.cz, v níž se nachází vyhledávač a další seznamácké služby, využívá každý den takřka 800 tisíc aktivních uživatelů. Měsíčně to je více než dvakrát tolik. Pokud by z těchto uživatelů měla výhledově podobně jako v USA využívat hlasové vyhledávání třetina, bavíme se zhruba o půl milionu lidí.
Potenciál je tedy velký, a proto právě do své hlavní mobilní aplikace nyní Seznam vkládá hlasového asistenta. Loni začal na Androidu a nyní dokončuje práce na operačním systému iOS. Zároveň mu s tímto krokem vtiskává vizuální identitu a rozvíjí jej směrem k dialogu s uživatelem.
„Zatím nám často lidé říkají: ‚To mám mluvit na telefon, když chci něco najít? Že nebudu psát?‘ Pokud to funguje dobře, lidé se to ale rychle naučí. Naší ambicí je jít rychle dopředu a zdokonalovat našeho asistenta, aby díky němu mohli jednoduše ovládat naše služby i mnoho dalšího, co běžně na telefonech dělají,“ popisuje plány Seznamu Adam Raška.
Hlasového asistenta si stačí aktivovat v nastavení telefonu, když máte staženou aplikaci Seznam.cz, a v Androidu se následně usadí nad všemi aplikacemi tak, že je vždy připraven přijímat povely. Stačí zvolat „Sezname“ a dodat, co od něj potřebujete. Tedy stejně, jako to již mnozí znají od Alexy, Googlu nebo Siri. Jen s tím rozdílem, že tady už jde všechno česky.
Naučit hlasového asistenta rozumět naší mateřštině není nic jednoduchého. Zatímco pro angličtinu (a několik dalších největších světových jazyků) existuje obrovské množství dat, na nichž jde stroje trénovat, a zároveň na tom pracují ty největší mozky světa s takřka neomezenými rozpočty, čeština zůstává stranou. „Logicky narážíme na to, že jsme málo používaný jazyk. Vyvinout hlasového asistenta s angličtinou už dnes není tak těžké,“ přiznává Raška.
Nastartujte svou kariéru
Více na CzechCrunch JobsV Seznamu proto delší dobu experimentovali s tím, jak vlastně svého asistenta naučit česky. Začínali s různými otevřenými řešeními a anglickými jazykovými modely, které překládali a ohýbali do češtiny. „Dali jsme dohromady kvalitní tým vývojářů, kteří mají background například v sémantice či fonetice, a dokázali jsme anglický model slušně vyladit,“ přitakává Raška. Oříškem je třeba i to, že zatímco v angličtině se mnohdy používá jedna fráze, v češtině je hned několik různých variant, jak o danou věc požádat.
Adam Raška popisuje, že kvalitní jazykový model by měl mít alespoň stovky hodin promluv, aby se z něj mohl hlasový asistent dobře učit a porozuměl co největšímu množství scénářů. Postupně tak zkoušeli několik přístupů, jak takový model zlepšit, až se jako nejefektivnější ukázalo vytěžit velké množství videí, která má Seznam na svých serverech uložená. Z tisíců hodin záznamů vývojáři vybírají ty správné, aby se asistent rychle a správně učil.
„Ukázalo se, že jedním z dobrých zdrojů dat pro tyto účely jsou reklamy. Mají jasný scénář, mluvčího, který má obvykle velmi dobrou výslovnost a který přesně v daném čase odříká, co je ve scénáři napsané. Na těchto krátkých promluvách teď náš model trénujeme a vylepšujeme,“ vysvětluje Raška. Na hlasové příkazy uživatelů dnes asistent Seznamu odpovídá především textem, ale do budoucna by měl s lidmi konverzovat, opět jako třeba Alexa.
Popovídat si s telefonem
Dialogy jsou ale ještě složitější disciplína, na které v Seznamu pracují s ČVUT a také s firmou PromethistAI vědce Jana Šedivého, který se problematice konverzační umělé inteligence věnuje celý život zde i v cizině. Konverzační bot Alquist z dílny jeho studentů byl již třikrát oceněn v prestižní celosvětové soutěži Alexa Prize, v níž Amazon hledá nejlepší nápady, které by mohly jeho asistentku rovněž posouvat.
Hlavní přidanou hodnotou technologické platformy Flowstorm vyvinuté startupem PromethistAI je právě pokročilejší zvládání konverzační stránky dialogu a s ní spojené obohacení běžných úkolově orientovaných interakcí stroje a člověka. Adam Raška si od spolupráce s týmem kolem Jana Šedivého slibuje, že brzy naučí plynule konverzovat i seznamáckého asistenta.
„Začali jsme s kalkulačkou a pokračujeme s počasím. Je to dobře definovatelná oblast z hlediska příkazů a odpovědí,“ říká Raška. Uživatel by zkrátka dotazem na počasí neměl asistenta překvapit. Pokud vše bude fungovat, půjdou vývojáři dál. Dnes je již možné přes asistenta Seznamu pustit písničku ve Spotify, pustit si pořad v aplikaci Stream, nastavit budík nebo časovač a nově také ovládat prvky chytré domácnosti standardem MQTT.
„Začít tímto standardem jsme se rozhodli zejména s ohledem na tělesně handicapované. S další českou firmou Inovura pracujeme na řešení, jak jim zjednodušit běžné činnosti, jako je otevírání oken, zapnutí televize nebo světel v místnosti. I zde již existují cesty, jak tyto prvky ovládat skrze Google nebo Apple, ale jazyková bariéra je i zde pro mnoho lidí nepřekonatelná,“ dodává Raška.
Již brzy by mělo být možné spustit hlasového asistenta od Seznamu také na iOS, oproti verzi pro Android ale dozná určitých změn. Mobilní operační systém od Applu, který běží na iPhonech, je totiž pro vývojáře třetích stran mnohem více omezený než Android. V iOS například nejde nahradit výchozí hlasovou asistentku Siri, a tak nebude jen stačit zvolat „Sezname“. Bude ho třeba vyvolat manuálně.
„Je to bohužel omezení, se kterým v iOS musíme pracovat. Pozitivní je, že Apple umožňuje od iOS 14 přidat na plochu widgety, takže uživateli bude stačit kliknout na widget a pak už může mluvit,“ popisuje překážky Raška. I tak věří, že věrné uživatele Seznamu, kteří chtějí na telefon mluvit česky, to neodradí. „Když bude asistent fungovat dobře, lidé si rychle zvyknou, protože je díky tomu mnoho úkonů rychlejších,“ říká produktový manažer.
V následujících měsících chtějí v Seznamu co nejvíce vyladit aplikace pro Android i iOS a pustit je do ostřejšího provozu. Z dosavadní betaverze, do níž se zapojily tisíce uživatelů, má tým velmi dobré ohlasy. Jelikož čeština pro Alexu, Google Assistant či Siri je zatím v nedohlednu, má Seznam dobrou příležitost, jak v Česku alespoň na čas ukázat americkým obrům záda.