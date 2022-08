Má příjemný hlas, plynulý přednes, nezalekne se cizích slov ani těch, která v životě neslyšela. Tahle umělá inteligence umí číst tak, že jen těžko poznáte, že vám text nepřeříkává skutečný člověk. Ten úkol není tak jednoduchý, jak by se mohlo zdát. Když mluvíme, spojujeme nejen zvuky písmenek do nějakého celku. Mnoho z nich může znít pokaždé jinak a v jedné větě často vyjadřujeme mnoho dalších informací i škálu pocitů.

Umělou inteligenci ve společnosti The Mama AI vyvíjeli rok a půl. Programovali ji a pak trénovali tím, že sama desítky hodin poslouchala mluvit člověka, aby odpozorovala, jak se to má správně dělat.

Poslechněte si, jak to zvládla – pusťte si tento článek v audiopodobě.

Spojovat hlásky tak, aby jim člověk rozuměl, vědět, kdy s hlasem klesat nebo stoupat, a umět si tak trochu domýšlet, jak se jednotlivá slova a symboly čtou, je proces, kterým v češtině ještě žádný jiný stroj neprošel. Jistě ne tak, aby si člověk při poslouchání výsledku pomyslel, že mu právě předčítá opravdová osoba.

Pravda, asi to nebude po celou dobu. Napadne vás to nejspíš jen v určitých momentech strojového přednesu. Tedy, někteří lidé celou dobu nepoznají, že poslouchají hlas počítače, vysvětluje Josef Vopička, jeden ze spoluzakladatelů a zdejších šéfů. Po čase vás ale pravděpodobně při poslechu napadne, že by to chtělo víc emocí. Je to něco, co svou umělou inteligenci musí ještě naučit.

Slovní zásobu má asi jako průměrně vzdělaný dospělý. To ale není tak důležité. Umí se totiž učit a počet slov, která ovládá, se tak zvětšuje. Hlavně však umí vyslovit pojmy, které nejsou v jejím slovníku, kombinace písmen, s nimiž se nesetkala.

Havel ex machina

Nemyslete si, že jde o umělou inteligenci, s níž si zároveň „inteligentně“ popovídáte. Na to má The Mama AI zase jiné produkty. V tomto případě jde skutečně jen o schopnost číst a přednášet. Umí zrychlit i zpomalit, zvládne i křičet: to by se mohlo hodit ve chvílích, kdy by například personální pracovník chtěl trénovat krizovou komunikaci ve vypjatých situacích.

„Zaujmout řečí je velké umění výborných moderátorů. Vědí, jak s hlasem pracovat. Systémy to ještě nevědí, protože nemají tolik dat, z nichž by se to naučily. Dohánějí to technikami, kdy člověka napodobují, učí se od něj. Pracujeme na tom,“ říká Vopička. „Něco vám pustím,“ říká pak Jan Kleindienst, další ze spoluzakladatelů a zároveň ředitelů. A z jeho počítače se brzy ozve nezaměnitelný hlas Václava Havla. „Vážený pane Jančo, zdravím vás, rád bych s vámi něco podivuhodného probral, děkuji,“ slyším.

Podivuhodně na tom nezní vůbec nic – jen to, že něco takového Václav Havel nikdy neřekl. „Toto hlasové digitální dvojče umíme udělat s libovolným hlasem, samozřejmě při respektování osobnostních práv. Václava Havla jsme si natrénovali interně pro radost po shlédnutí hologramu k 17. listopadu,“ pochlubí se Kleindienst.

Jak si zdigitalizovat herce

Chytrá jazyková syntéza může mít řadu využití. Už teď má firma zákazníky z dabingu či takzvaného voiceoveru, tedy případu, kdy televize ze zákona musejí pro zrakově postižené nechat namluvit děj filmu nebo seriálu. Zájem mají producenti audioknih i počítačových her. Strojové hlasy namlouvají návody a firemní postupy.

Foto: Anna Kassahunová Krchák, Kleindienst, Macek, Cuřín, Vopička a Čmejrek spolu pracovali v IBM

Celkem po různých firmách „běhá“ pět různých hlasů ze zdejší dílny. Mohly by se uplatnit pro instruktážní videa, podcasty, armádní složky i pro běžné firmy. „Myslíme, že třeba banky a velké firmy, které budou zavádět svoje technologie, budou chtít mít svoje vlastní hlasy. Pokud se teď používají, tak jen stále dokola ty samé. Je to jako kdyby měla každá firma v Česku stejný web,“ říká Kleindienst.

Svým specifickým hlasem se prezentuje mezi jinými třeba Alza, ale i další velké společnosti. „Jenže takový člověk, který texty načítá, nemusí být najednou dostupný,“ vysvětluje Vopička. „Ale když si nechají herce zdigitalizovat, samozřejmě za zachování práv, takovému hlasovému talentu i firmě se otevře nový prostor,“ dodává.

Hledat ne slova, ale významy

The Mama AI je velmi specifický startup. Vede jej rovnou šest zakladatelů, kteří se na té nejvyšší pozici střídají, stejně jako v předních pozicích v mnoha jednotlivých sekcích, kterými se zabývají. Kromě Kleindiensta a Vopičky to tu řídí Jan Cuřín, Jan Macek, Jakub Krchák a Martin Čmejrek.

Mezi nejnovější projekty, ve kterých vidí velkou možnost uplatnění na trhu, patří kromě syntézy hlasu také sémantické vyhledávání. To nehledá konkrétní slova, ale jejich významy, nachází podobnosti uvnitř textu. To se hodí například právnickým firmám, které tak rychle zjistí, jestli se případ podobný jejich aktuálnímu stal už někdy v minulosti.

The Mama AI má desítky zákazníků od Česka po Spojené státy. Oslovily je právě produkty založené na umělé inteligenci, které textu rozumějí či se v něm orientují, umějí hledat, popisovat nebo všechno dohromady. „Snažíme se všechny tyto systémy dávat dohromady, aby nebyly izolované, ale navzájem se podporovaly,“ vysvětluje Kleindienst. Obrat firmy se dostal na desítky milionů korun. Rozrostla se na 60 zaměstnanců z deseti různých zemí. Ještě loni pro firmu pracovalo 20 lidí.

Už se to blíží

Je zřejmě jen otázkou času, než bude nejen hlas, ale i způsob vyjadřování umělé inteligence natolik přesný, že nikdo nepozná, že jde o text čtený strojem. Tedy nikoli reálným člověkem. Jenže když může už teď počítač přečíst hlasem a intonací Václava Havla větu, kterou nikdy neřekl, je jasné, že takové záznamy budou v podstatě deepfake. Tedy totéž, co jsou dnes třeba videa slavných osobností, u kterých nepoznáme, že před kamerou vlastně neseděly ony.

„Už se to blíží. A my cítíme, že je to silné téma. Už jsme řešili, že k hlasům budeme dávat watermarky, ochranné prvky, aby bylo jasné, že jsou z naší dílny. Je nutné vědět, kdo je původcem hlasu,“ popisuje Kleindienst.

Ovšem v „Mamě“ přemýšlejí i jinak: hlas stroje může pomáhat s meditací, mít terapeutický účinek a být třeba společníkem starších lidí. Nebo by mohl vyprávět vtipy. „To ale bude ještě dlouhá cesta,“ vysvětluje Vopička. Jednou ale může být hlas počítače nadějí pro ty, kteří si chtějí ještě jednou poslechnout své zemřelé blízké. Pokud bude stroj mít dost zvukových záznamů, nebude to problém.

„Taková poptávka už teď je. Zatím tedy jen ze zahraničí. My něco takového spíš zkoušíme. A to jen na drobných příkladech. Všichni ale cítíme, že možnosti využití hlasových digitálních dvojčat jsou nesmírné,“ uzavírá Vopička.

A tak se zatím můžete s umělou inteligencí porovnat vy. Schválně, kdo líp řekne: Šel pštros s pštrosicí a s pštrosáčaty na pštrosiště. Jeden z nich byl nejkulaťoulinkatější. A dostali se na nejneobhospodařovávatelnější pole.