Seznam vstupuje do hry s vlastní umělou inteligencí. Je šitá na míru Čechům, a proto umí porazit ChatGPT
Společnost Seznam nedávno spustila beta verzi Seznam Asistenta. Nový konverzační nástroj se chce stát českou odpovědí na globální vlnu AI.
Česká internetová jednička se letos pustila do náročného závodu na poli digitálních asistentů. Neaspiruje přitom na přímý souboj s globálními giganty jako Google nebo OpenAI, ale chce si vybudovat pevné místo na domácím trhu. A sází při tom na speciální kombinaci: hlubokou znalost českého prostředí, vlastní technologické zázemí a důraz na bezpečnost dat v rámci Evropské unie.
„Seznam má celou řadu služeb, které lidé běžně používají k vyřizování svých každodenních potřeb. Cílem je, aby systém fungoval jako jejich propojující prvek, jedno místo, odkud má uživatel přístup ke všem datům. Řadu věcí bude možné vyřešit přímo v chatu, případně systém uživatele navede správným směrem nebo mu odpoví na základě dat, která má k dispozici,“ přibližuje základní myšlenku vedoucí produktového týmu Seznamu Radoslav Mikeš.
Hlavní výhodou novinky je její „české DNA“. Seznam Asistent je od počátku trénovaný a laděný přímo pro tuzemské prostředí a specifika českých uživatelů. Lokální přístup se zatím podle Mikeše nejvíce projevuje v porozumění nuancím jazyka, se kterými mají globální modely často problém, ve kvalitě dat a zdrojování a v bezpečné infrastruktuře.
Zajímavostí je, že zvládá i slang. Pokud například uživatel napíše, že si chce koupit „lupeny“ na koncert, Seznam Asistent pochopí, že jde o lístky, zatímco světová konkurence by mohla v podobném případě chybovat. „Stejně tak to funguje, když uživatel hledá pronájem chaty. Asistent pochopí, že jde skutečně o chatu, a ne třeba luxusní vilu. A pokud by měl zájem o koupi ‚bejváku‘, jednoduše ho přesměruje na server s realitními nabídkami,“ popisuje Mikeš.
Systém v současnosti běží částečně na zabezpečené infrastruktuře Azure od Microsoftu a částečně na vlastním jazykovém modelu SeLLMa. Ten vychází z architektury Llama 3.1, původně vyvinuté Metou, byl však výrazně přetrénován na českém jazykovém korpusu složeném jak z akademických dat, tak z obsahu vlastních webů Seznamu.
Hlavní motivací pro náročnější vývoj byla technologická nezávislost. „Kdybychom si nepostavili vlastní AI, hrozilo by, že jakmile naši aplikaci vyladíme a dojde ke změně u dodavatele, může se celá služba rozbít. Zásadnější ale je, že nechceme, aby data uživatelů odcházela kamkoli mimo naši firmu. Důležité je i to, že chceme získat v Česku unikátní know-how v této oblasti,“ doplňuje Mikeš.
Boj s digitálními přeludy
Jedním z nejcitlivějších témat současné AI je vztah vůči tvůrcům obsahu, ze kterého umělá inteligence čerpá. Seznam Asistent k tomu přistupuje tak, že má sice přístup k internetu i aktuálnímu zpravodajství, ale striktně respektuje pravidla webmasterů a nečerpá z webů, které sdílení dat s nástroji umělé inteligence blokují.
Navíc je nastaven tak, aby původní články nekopíroval. Odpovídá velmi stručně a vždy uvádí zdroje s možností prokliku přímo na web autora. Tím se firma podle svých slov snaží zabránit tomu, aby AI parazitovala na práci novinářů, kterým chce prý naopak přivádět čtenáře.
A jak si asistent poradí s halucinacemi, tedy situacemi, kdy si umělá inteligence sebevědomě vymýšlí nepravdivé informace? „Neustále s tím bojujeme, mimo jiné proto, že halucinace je velmi těžké spolehlivě měřit. Základem je dávat jazykovému modelu co nejčistší a nejrelevantnější data a vyhnout se dokumentům, které si protiřečí. Existují i architektonická řešení, například nastavení, kdy se chatbot před odpovědí ‚zamýšlí‘ a výstup dodatečně kontroluje. To ale zpomaluje reakce a zvyšuje nároky na výpočetní výkon, takže jde vždy o hledání rovnováhy mezi rychlostí, kvalitou a spolehlivostí odpovědí,“ líčí Mikeš dál.
Model ve stávající testovací verzi stále občas chybuje, i když se poměrně rychle zlepšuje. Při redakčním testování v polovině ledna jsme se asistenta například zeptali, zda ví, kdo založil server CzechCrunch. Asistent sebevědomě, leč chybně odpověděl, že zakladatelem je zástupce šéfredaktora Luboš Kreč. O týden později už však na stejný dotaz reagoval výrazně opatrněji a přiznal, že se mu jméno zakladatele nepodařilo dohledat. Například ale nástroj Googlu Gemini na otázku odpověděl správně.
Základem je dávat jazykovému modelu co nejčistší a nejrelevantnější data a vyhnout se dokumentům, které si protiřečí.
Seznam do svého chatbota zároveň implementoval speciální ochrannou vrstvu pro citlivá témata, například v otázkách zdraví. V takových případech se uživatelům zobrazují výrazná barevná upozornění s tím, že chatbot nenahrazuje lékaře a že je například při dávkování léků nutná zvýšená opatrnost. Právě tyto bezpečnostní pojistky a také údajně snaha o maximální objektivitu v boji s dezinformacemi patřily k důvodům, proč byl start projektu oproti původním plánům mírně odložen.
Zpravodajství jako konkurenční výhoda
V čem Seznam Asistent reálně předčí ostatní AI asistenty, je rychlost práce s informacemi z domácího trhu. Díky napojení na vlastní infrastrukturu se do něj čerstvé zprávy z českého internetu dostávají nejpozději do patnácti minut od svého vzniku, což je u služeb typu ChatGPT zatím nepředstavitelné.
Uživatelé sice v současnosti narážejí na určité limity, například omezení na deset dotazů v rámci jedné konverzace (což je dané velikostí kontextové paměti modelu), na rozšíření se ale momentálně pracuje. Existují také týdenní kvóty, které jsou pro předplatitele služby Seznam bez reklam nastaveny výrazně velkoryseji. Zatímco běžný uživatel si může vyměnit s chatbotem 100 zpráv, ten s předplatným jich může poslat 400.
Dlouhodobým cílem společnosti je proměnit Seznam Asistenta v inteligentní vrstvu propojující celý ekosystém. V plánu je hlubší integrace do vertikál, jako jsou Firmy.cz nebo Sbazar.cz, i postupné zapojení nákupních aplikací.
Seznam věří, že se mu podaří dostat produkt z betaverze do konce roku, kdy by měl asistent plně využívat veškerá interní data. Už teď si ale jeho nový nástroj může bezplatně vyzkoušet kdokoli. A nemusí být zaregistrovaný na jeho stránkách, přihlásit se do aplikace lze i přes účet na Googlu, Microsoftu nebo třeba Applu.










