Umělá inteligence čte hlasem Karla Gotta jeho autobiografii. Gott navždy, hlásá nový projekt v Česku
Český rozhlas nechal text načíst umělou inteligencí tak, aby zněla právě jako Karel Gott. Běhá nám mráz po zádech, říkají jeho známí.
Lze si jen těžko představit, že by někdo jeho hlas v Česku neznal. A tak stačí první slovo, možná dvě, aby ho posluchači přiřadili k aktérovi. Slova, která mají teď lidé možnost slyšet a myslet u toho na jejich tvůrce Karla Gotta, přesto právě on nepřečetl. Udělala to za něj umělá inteligence, kterou k jeho nedožitým narozeninám vypustil do světa Český rozhlas spolu s odborníky na syntézu řeči ze Západočeské univerzity.
K dispozici měli dvě stě hodin nahrávek Gottova hlasu. To díky skutečnosti, že zpěvák v předchozích letech moderoval v rozhlasu vlastní pořad. Po prostříhání ovšem zbylo zhruba dvacet hodin záznamu bez šumu, slov v cizím jazyce nebo písní v podkresu.
Právě ty se staly základem, z něhož umělá inteligence dotvořila celý čtený projev, jenž vyvolává dojem, že autobiografickou knihu Karla Gotta Má cesta za štěstím z roku 2021 načetl právě on. Podle blízkých a spolupracovníků včetně intonace nebo pauz mezi slovy. Někteří se vyjadřovali v tom smyslu, že jim běhá mráz po zádech.
První ukázku Český rozhlas představil v předvečer zpěvákových nedožitých 84. narozenin. Aktuálně je projekt, obsahující čtyřiadvacet dílů, k dispozici na webu pod názvem Gott Navždy.
„Byla jsem velmi opatrná a navíc ovlivněná oblíbenou větou Karla: ,Co by tomu řekli lidi.’ Zvažovala jsem to ze všech stran,“ popisuje Ivana Gottová, která udělila souhlas k projektu. Podle ní je dílo památkou na umělce.
Nastartujte svou kariéru
Více na CzechCrunch JobsNa rekonstrukci hlasu pracoval šestičlenný tým, který použil nahrávky a odpovídající přepisy. Hlas nakonec vznikl v šesti verzích, z nichž mohl ČRo vybírat. Zvuk prošel náročnou postprodukcí, říkají tvůrci.
„Řečové technologie nejsou žádná novinka, jsou tu s námi už třicet nebo čtyřicet roků a na katedře s nimi pracujeme od devadesátých let,“ říká Jindřich Matoušek, který vede tým syntézy řeči na univerzitě.
„Když děláte syntézu hlasu, který všichni moc dobře znají, je to něco úplně jiného, výsledek bude každý kriticky hodnotit. Velmi důležitá je samozřejmě etická stránka věci, neboť bez souhlasu rodiny Karla Gotta by takový projekt vzniknout nemohl. Ale když už svolení máte, je to velká příležitost oslovit širokou veřejnost, předvést jí technologii syntézy řeči i možnosti umělé inteligence, a ukázat, že se jí nemusí bát,“ dodává.
K instituci se rozhlas dostal prostřednictvím společnosti SpeechTech, spin-offu vzešlého právě ze školy. Oba subjekty spolupracují i na dalších projektech, dříve například navrhly proces, který má „ponechat“ hlas nemocným, kterým hrozí, že o něj přijdou.
„S 1. Lékařskou fakultou UK a softwarovými firmami SpeechTech a CertiCon jsme navrhli proces, kterým si lidé doma nahrají svůj hlas, dokud ještě mohou hovořit, a my z nahrávek vytvoříme jeho kopii, jíž pak promlouvají z různých přístrojů,“ říká Matoušek. Zkušenosti z něj posloužily i při vytváření Gottova hlasu.
Podle odborníka syntéza hlasu učinila v posledním desetiletí obrovský pokrok a v běžných úlohách, jako je čtení textu, má fungovat výborně. „Neznamená to, že je zcela vyřešena. Aby byl počítačový hlas plnohodnotným partnerem člověka v hlasovém dialogu, nestačí jen přečíst daný text. Syntéza musí také dokonale porozumět tématu konverzace, umět vyjádřit postoj mluvčího, náladu, emoce, mít paměť… Takové úlohy na svá řešení teprve čekají,“ myslí si.
Knihu čte umělá inteligence hlasem Karla Gotta v některých pasážích, další čte herec Igor Bareš. Četbu na pokračování Má cesta za štěstím odvysílá ČRo Dvojka během prázdnin, bude mít čtyřicet devět dílů. Celkem je však dílů sedmdesát tři a v nezkrácené podobě vyjdou v audioknize na podzim.