Když si koncem března v pracovní den naladíte zprávy na některém z rádií Seznamu, bude na vás mluvit umělá inteligence, i když to čistě z hlasu možná ani nepoznáte. Na stanicích Expres FM a Classic Praha tou dobou začnou „pracovat“ noví, syntetičtí moderátoři trénovaní umělou inteligencí podle hlasové předlohy opravdových lidských novinářů.
Umělé hlasy, které si můžete poslechnout v ukázce níže, pomůžou zejména s regionálním zpravodajstvím. Syntetičtí moderátoři budou hlásit zvlášť připravované zprávy pro posluchače v Praze, Plzeňském kraji, Karlových Varech, Ústí nad Labem, Jihlavě, Brně a Zlínu.
Od konce března relace poběží každou celou hodinu ve všední dny od ranní 7. hodiny do 18. večerní. Jejich délka včetně počasí a jinglů má být do pěti minut. Na rozdíl od zpráv bude hudba pro všechny mutace vysílání stejná, upřesňuje Pierre Beneš, manažer rozvoje rádií Seznamu.
Ukázková zpravodajská relace umělé inteligence ve službách rádia Expres FM
Hlasů vytvořených s pomocí AI má Seznam zatím pět. Od loňska má mluvené slovo během noční relace rádia Expres FM na starosti Hacsiko (s výslovností Hačiko), založená na hlase moderátorky Báry Hacsi, která uvádí Ranní klub. Technologie ve vysílání komentuje aktuální dění i odehrané písně. Nově k ní přibydou další čtyři syntetičtí kolegové, kterým hlasy propůjčili novináři a novinářky Jaroslav Gavenda, Magdaléna Korcová, Silvie Friedmannová a Pavel Vondra.
O vysílání syntetických hlasů se podle Seznamu stará člověk a stroj společně. Dramaturg rádia při tvorbě relace využívá i textový generátor ChatGPT od americké firmy OpenAI. S jeho pomocí napíše text „na papíře“, zkontroluje výslednou audio verzi a zařadí ji do vysílání. Konkrétní moderátorské vstupy hlasu Hacsiko jsou také definovány sadou příkazů, mezi které patří například cílová skupina, zájmy posluchačů, délka vstupu či jazykový styl.
Seznam na umělých moderátorech spolupracuje se startupem Mama AI. Aby hlasy zněly přesvědčivě, je potřeba zhruba pět hodin nahrávky, vysvětluje pro CzechCrunch Jan Kleindienst, spoluzakladatel Mama AI. „Hlas sice namodelujeme i z minutové nahrávky, ale nebude moc přesvědčivý. Aby umělí moderátoři zněli kvalitně, je potřeba delší úsek,“ říká.
Rovnice „čím delší nahrávka, tím lepší výsledek“ ale podle něj neplatí úplně: „Do těch pěti hodin se výsledek zlepšuje. Ale kdybychom měli hodin nahraných třeba sto, už by to kvalitě nepomohlo,“ dodává Kleindienst, jehož firma kromě Seznamu spolupracuje třeba s televizí Prima, kde její systém namlouvá popis televizních scén pro nevidomé diváky v seriálu Doktor z hor.
Podle Jakuba Ungera, ředitele zpravodajství a rádií Seznamu, bude vše vyrobené umělou inteligencí ve vysílání označené tak, že posluchač bude o použití technologie vědět. V dohledné době také Seznam představí další syntetické hlasy. O podobné použití se firma zajímá i pro svou televizní stanici.
Od okamžiku, kdy OpenAI představilo textový generátor ChatGPT, uběhl zhruba rok a půl. Od té doby generativní umělá inteligence (AI) stále více prostupuje do běžného každodenního života. Vysoké tempo rychle rostoucí technologie vnímá i Seznam.cz a Diana Hlaváčová, která stojí v čele snahy české internetové jedničky vyvinout vlastní velké jazykové modely, na kterých programy typu ChatGPT fungují. Pro CzechCrunch popisuje, co ji při její práci nejvíce překvapuje a jak rychle při vývoji generativní AI plyne čas. A samozřejmě co má v této oblasti v plánu samotný Seznam.
Česká internetová jednička si uvědomuje, že si nemůže nechat boom umělé inteligence ujít. Do vývoje už investovala desítky milionů korun a další pravděpodobně přidá. Chce těžit ze svého výsadního postavení na českém trhu a hrát u nás prim také v oblasti generativní umělé inteligence. Podobně jako velké technologické společnosti Microsoft nebo Google globálně.
Ve většině zemí by se to mohlo zdát nemožné, ale Česko je v tomto ohledu specifickým trhem, bez negativních konotací. Jen na několika málo trzích, mezi nimiž je Rusko, Čína nebo Severní Korea, nemá Google suverénní a dominantní pozici. V Česku už sice dokázal svým vyhledávačem překonat ten od Seznamu, ale přesto si česká firma drží na trhu vedle globálního hegemona výraznou pozici.
Dlouhodobě se Seznamu daří držet s Googlem krok i díky tomu, že svou službu staví na míru českému zákazníkovi. Ví, co ho zajímá a jak funguje. A proto si také v Seznamu při vývoji umělé inteligence dávají záležet na tom, aby jejich jazykové modely byly zdatnými češtináři. Ty od globálních technologických firem jsou totiž tradičně nejjistější v angličtině.
Co je to velký jazykový model
Algoritmus, který předpovídá, jaké slovo nebo věta bude nejpravděpodobněji následovat po zadané sekvenci slov. Je trénován na velkém množství dat a poté může být použit pro generování textu, překlad nebo rozpoznávání řeči.
Třeba GPT-4 od OpenAI nebo Gemini od Googlu a další nástroje fungují na základě velkého objemu dat z internetu, tedy většinově anglofonního prostředí. Diana Hlaváčová říká, že výuka českého jazyka se Seznamu daří a některé jeho modely už jsou v řeči schopnější než GPT-3.5, starší sourozenec GPT-4.
„Neformálně jsme jeden z modelů nechali dělat přijímací řízení na osmileté gymnázium z českého jazyka,“ říká Hlaváčová a s úsměvem dodává: „Jeden z našich systémů by se na školu úspěšně dostal.“
Velké jazykové modely už teď na webu Seznamu pohání třeba na první pohled docela nenápadnou funkci. „Když si teď otevřete Seznam.cz, pod řádkem vyhledávání jsou hesla, která lidé v posledních hodinách nejvíce hledají. Po rozkliknutí se objeví sumář k tématu, který už generujeme právě pomocí velkého jazykového modelu,“ uvádí Hlaváčová. Další služby říznuté umělou inteligencí chce Seznam veřejnosti začít představovat letos.
Je to paradox: jsem s AI ve styku každý den v práci, mimo ji ale moc nepoužívám.
A cíl? Takzvaný foundation model. Tak se v anglické hantýrce umělé inteligence označuje model, který je výchozím bodem, jejž lze po natrénování upravovat ke konkrétnímu použití, třeba pro překlad nebo konverzaci. V Seznamu zatím vlastní takové systémy vyvíjejí a testují interně. Experimentují při tom s různými otevřenými jazykovými modely, které jsou dostupné veřejně a může si je tvarovat podle potřeby.
Tým kolem Diany Hlaváčové spoléhá třeba na model společnosti Meta Marka Zuckerberga zvaný Llama 2 nebo na systém francouzského startupu Mistral AI, do kterého nedávno ve velkém investoval Microsoft. Takové modely následně právě doučují na velkém množství dat v češtině. „Pracujeme s modely o velikosti od sedmi do sedmdesáti miliard parametrů,“ říká Hlaváčová.
Parametry jsou zjednodušeně řečeno různá nastavení, která modely používají ke zlepšování schopnosti porozumět a tvořit text. Více parametrů obvykle znamená přesnější a relevantnější odpovědi. Pro srovnání: několikrát zmíněný GPT-4 jich má podle Hlaváčové zhruba 175 miliard. Větší číslo ale nutně lepší výkon neznamená. Trend je aktuálně opačný a jazykové modely se spíše zmenšují.
„Ukazuje se, že výkon se i přes to zlepšuje. To mě překvapilo. Když jsme začínali, šlo se naopak cestou co největších velikostí,“ vysvětluje Hlaváčová. Kromě objemu textových dat je totiž při trénování velkých jazykových modelů klíčová i jejich kvalita, které mají v Seznamu i díky své různorodé činnosti v digitálním prostředí dostatek.
„Jsme i mediální dům, máme reklamní systémy a další zdroje textových dat,“ vyjmenovává výhody Seznamu při vývoji umělé inteligence jeho manažerka. Aby ale jazykové modely mohly opravdu dobře fungovat, je třeba také kvalitní „železo“, tedy hardware. V datových centrech Seznamu tak je zapojený zlatý standard oblasti umělé inteligence: grafické karty H100 od Nvidie, jejichž kusová cena se pohybuje v desítkách tisících dolarů.
Americká Nvidie díky boomu generativní umělé inteligence zažívá velmi příjemné období. V příjmech vloni dosáhla v přepočtu na 1,4 bilionu korun a vykázala čistý zisk přes 700 miliard korun. Přesný počet karet v Seznamu Hlaváčová uvést nechtěla. Podle deníku e15 nakoupil Seznam k vývoji vlastní AI od Nvidie řádově stovky čipů.
Rychlost nástupu umělé inteligence, kterou šéf OpenAI Sam Altman označil za nejrychlejší průmyslovou revoluci vůbec, pro tým Hlaváčové znamená neustálé třídění a vstřebávání nových informací. Na otázku, jak jí uběhlo sedm měsíců, po které v Seznamu vývoj velkých jazykových modelů vede, rodačka ze Slovenska odpovídá: „Byly to ty nejrychlejší měsíce v životě.“
Množství nových poznatků ale nevnímá negativně. „Spíš vás to nakopne, otevře nové dveře. Každý den víme něco nového,“ dodává Hlaváčová. Kolik lidí spolu s ní na vývoji umělé inteligence pracuje, prozradit nechce. Je to pro ni každopádně srdcová záležitost. V Seznamu působí dva roky a než se dostala do čela vývoje velkých jazykových modelů, pracovala na algoritmu, který při internetovém vyhledávání řadí výsledky podle jejich relevance.
„Když vyšel ChatGPT, zkoušela jsem tvořit prototypy a snažila jsem se u nás dělat osvětu, na co všechno to jde využít,“ říká Hlaváčová. Umělá inteligence ji pořád dokáže nadchnout a v Seznamu jí žije. Jak ji ale využívá mimo pracovní dobu? „Přiznávám, že je to paradox: jsem s AI ve styku každý den v práci, mimo ji ale moc nepoužívám,“ uzavírá Hlaváčová.
Pomocí cookies ukládáme vaše nastavení a preferencí, analýze návštěvnosti našich stránek, zprostředkování funkcí sociálních médií a k personalizaci obsahu … Číst dále
Pomocí cookies ukládáme vaše nastavení a preferencí, analýze návštěvnosti našich stránek, zprostředkování funkcí sociálních médií a k personalizaci obsahu. Informace o užívání našich stránek také dále sdílíme s našimi obchodními partnery z oblasti sociálních médií, reklamy a analytiky. Za tyto webové stránky a soubory cookies odpovídá CzechCrunch s.r.o. Více informací naleznete na následujícím odkazu.
Nastavit preferované cookies
Vždy, když navštěvujete jakoukoliv webovou stránku, stránka může ukládat nebo získávat informace z vašeho prohlížeče, zejména formou souborů cookies. Tyto informace se mohou týkat vás, vašich preferencí nebo vašeho zařízení a jsou užívány převážně k zajištění vámi očekávaného chodu stránek. Takto získané informace vás obvykle přímo neidentifikují, ale mohou vám zprostředkovat personalizovanější zkušenost při užívání našich stránek. Protože respektujeme vaše právo na soukromí, můžete zakázat některé druhy cookies, které nejsou k využívání našich stránek nezbytné. Pokud se však rozhodnete některé cookies zakázat, může mít tento krok vliv na vaši uživatelskou zkušenost stránek a námi nabízené služby. Aktivací níže uvedených souborů cookies vyjadřujete souhlas s tím, že vaše osobní údaje mohou být převedeny do třetích zemí. Více informací naleznete na následujícím odkazu.
Možnosti předvolby jednotlivých cookies
Naprosto nezbytné cookies
Nezbytné cookies zajišťují klíčové funkce webových stránek jako jsou zabezpečení, správa sítě, přístupnost a základní statistiky o návštěvnících, takže není možné je vypnout. Prohlížeč můžete nastavit tak, aby blokoval soubory cookie nebo o nich posílal upozornění (tato skutečnost však může mít vliv na fungování stránek).
Pokročilé analytické funkce
Nástroje třetích stran, které nám umožňují zlepšovat fungování webových stránek pomocí zasílání zpráv o tom, jaký způsobem stránky užíváte. Tyto cookies však shromažďují údaje způsobem, který nikoho přímo neidentifikuje. Pokud tyto cookies nepovolíte, nebudeme vědět, kdy jste navštívili naši stránku.
Funkce a preference
Funkční a preferenční cookies umožňují použití pokročilého webového obsahu a pokročilých funkcí a zároveň nám také umožňují ukládat vaše nastavení a preference.
Cílené soubory cookies
Díky těmto cookies vám můžeme zobrazovat personalizované nabídky, obsah, jakož i reklamní obsah, na základě vašich zájmů na našich webových stránkách, na stránkách třetích stran a na sociálních médiích. Neukládají ale vaše osobní informace přímo, nýbrž přes jedinečné identifikátory prohlížeče a internetového zařízení. Pokud je nepovolíte, bude se vám zobrazovat na stránkách méně cílená reklama.