Firma z Karlína používá AI z průzkumu Marsu pro testování her. Ušetříme miliardy dolarů, hlásí

„Nevíme o lepším řešení,“ říká Filip Dvořák, zakladatel startupu Filuta AI. Ten se z Česka chystá bez nadsázky na revoluci v herním vývoji.

Michal MančařMichal Mančař

filuta-filip-dvorak-boxedRozhovor

Foto: Tomáš Rubín, MFF UK

Pracoval na projektech DARPA i pro Microsoft, teď Filip Dvořák chystá radikální změnu v tom, jak se dělají hry

0Zobrazit komentáře

Používají technologii, kterou se řídí i vozítko Perseverance na Marsu. Jejich tým je plný expertů s doktoráty z umělé inteligence. Vede je vědec a vývojář, který spolupracoval na projektech americké agentury DARPA – té, která stála u zrodu internetu nebo GPS a dodnes provádí pokročilý výzkum nejen pro vojenské užití. A teď se Filip Dvořák a jeho startup Filuta AI pouští do herního průmyslu. „Za testování videoher se ročně utratí přes 370 miliard korun. My ty náklady stáhneme na pětinu,“ říká pro CzechCrunch.

Odebírejte newsletter Good Game

Zajímá vás herní průmysl v Česku i ve světě? Přihlaste se k odběru.

Newsletter Good Game | Poslední vydání

Když je navštívíte ve stále dost startupových kancelářích v pražském Karlíně, možná by vás ani nenapadlo, jaký miliardový nápad se tu rodí. A přece umělá inteligence od firmy Filuta AI už proniká do lukrativního herního byznysu. „Definujeme nový přístup k testování. Trh je po něm extrémně hladový. A z hlediska technologie a vhodnosti pro herní vývoj nevidíme konkurenci,“ říká v rozhovoru zakladatel Filip Dvořák, muž se zkušenostmi z Microsoftu, z projektů výzkumné agentury amerického ministerstva obrany DARPA a držitel dvou doktorátů z matfyzu.

Vždyť které herní studio by nechtělo ušetřit 80 procent nákladů na testování a získat nástroj, který může v jednu chvíli nahrazovat třeba jen pět lidských testerů – ale během chvilky se promění na ekvivalent tisícovky pracovníků? Filuta AI toho dosahuje využitím takzvaných AI agentů a symbolické umělé inteligence. Co to znamená? Zjednodušeně si to představte jako virtuální hráče, kteří hru pochopí, testují a hrají podle zadání, vše zaznamenávají a předávají k vyhodnocení.

„Symbolická AI, kterou používáme, má pro obor testování her výraznou přidanou hodnotu ve své škálovatelnosti, ceně a nulové údržbě. Nevíme o lepším řešení,“ popisuje Dvořák. Proč to nedělají i jiní? Jsou v něčem stále lepší lidé? Proč ve Filutovi zvolili zrovna videohry, když zvažovali třeba i vesmírný průmysl? A která česká hra už filutovskou AI používá? I to se dozvíte.

Jak chce startup z Karlína ušetřit miliardy dolarů videoherním firmám?
Trh je neuvěřitelně velký. Ročně se za herní testování utratí přes 16 miliard dolarů (přes 370 miliard korun – pozn. red.). A my nabízíme řešení, které by mělo náklady stáhnout na pětinu a zrychlit vývojový cyklus. Používáme takzvanou symbolickou umělou inteligenci, zjednodušeně řečeno AI agenty, kterým zadáte testovací cíl a oni ho splní v libovolném prostředí, protože se neustále adaptují, a navíc vše zaznamenávají. Co se analytiky týče, jsou lepší než lidé. Představte si to tak, že by kažý tester měl poznámkový blok a při hraní hry zapisoval každý svůj krok, každé pozorování herního světa a každý úkon, který se v herním enginu odehraje. Všechna tato data sbíráme, agregujeme a detekujeme anomálie nebo jiné informace, které si klient přeje najít.

Testování pomocí AI nicméně není úplná novinka. Včetně herního testingu.
Vidíme na trhu zhruba dvanáct podobně zaměřených firem. Ty se však testování snaží otáčet přes jazykové modely, přes machine learning nebo testovací skripty. Symbolická AI, již používáme, má pro obor testování neboli quality assurance (QA) výraznou přidanou hodnotu ve své škálovatelnosti, ceně a nulové údržbě. Prakticky nemá konkurenci a nevíme o lepším řešení. Ostatně i rover Perseverance na Marsu staví na symbolické AI a autonomních plánovacích agentech.

Že je to příliš velká revoluce? Pokud jste studiu schopni ušetřit 80 procent nákladů na testování, překlene to hodně mostů.

To nutně vyvolává otázku – proč to jiní nedělají?
Expertíza v oboru je natolik řídká, že nevíme o nikom, kdo by celou smyčku – definování testů, převzetí AI agenty, kteří autonomně hru odehrají, a vytvoření záznamu i zpětné vazby – ve videoherním průmyslu udělal. V současnosti je na světě zhruba pět tisíc lidí, kteří v oboru symbolické AI zaměřené na plánování a rozhodovací podmínky mají vyšší míru odbornosti a působí v akademické sféře a průmyslu. Je to opravdu hodně úzká oblast a myslím, že ve Filuta AI v ní máme velkou expertízu. Já sám v ní pracuji 16 let, ještě víc pak profesor Roman Barták, který ji 30 let učí. K tomu máme ve firmě dalších sedm lidí s doktoráty zaměřenými na tuto disciplínu. To není nějaké PR, my o AI publikujeme, patentujeme naše technologie, prezentujeme na špičkových konferencích o průmyslu a umělé inteligenci.

Takže tady v Česku vzniká nový standard, který za pár let budou všichni v herním průmyslu používat nebo chtít kopírovat?
Jsme „first mover“ a definujeme nový přístup ke QA. Trh je po něm extrémně hladový, pouští se do něj mnohem větší firmy než my, jako jsou Modl.ai nebo Agentic.ai založený bývalými pracovníky Googlu. Ale jejich přístupy neumí uvažovat dál než v horizontu pár herních akcí, zatímco naši agenti umí plánovat a odehrát hodiny hry a tisíce akcí. Jiné firmy píšou dlouhé testovací scénáře nebo rozhodovací stromy, které můžou mít desítky tisíc prvků a nejsou technologicky udržitelné při aktivním vývoji hry. Z hlediska technologie a vhodnosti pro herní vývoj nevidíme konkurenci.

Jak na Filutu reaguje trh? Vím, že jednáte se zahraničními studii i s českými herními projekty, byli jste na nedávné videoherní konferenci Gamescom…
Primární zaměření herních studií je tvorba zábavných her, zároveň ale nejsou typickými průkopníky v software engineering procesech, jako jsou Google nebo Microsoft. Stejně tak mají herní studia málokdy velká výzkumná oddělení, která by se zaměřovala na adaptaci state-of-the-art výstupů akademického výzkumu pro herní průmysl. V tomto kontextu do herního vývoje vstupujeme jako vysoce technický produkt, který spojuje nejnovější výsledky v symbolické AI a standardy velkých softwarových společností. Interní herní testing bývá kapacitně náročný a drahý, externí testing je náročný na kvalitu a onboarding, vývoj vlastní technologie pro automatizaci testů se nevyplatí. My nabízíme řešení.

V takovém případě bych se naopak obával, že se jim do takhle revolucí zavánějícího kroku nebude chtít.
Nemyslím si, že existuje něco jako příliš velká revoluce, pokud jste studiu schopni ušetřit přes osmdesát procent nákladů na testování. To překlene hodně mostů. (smích) Zároveň produkt neustále vyvíjíme. Chceme například automaticky ukázat v kódu hry, kde je pravděpodobně chyba, nebo z proběhlého testu během pěti sekund umožnit developerovi konkrétní chybu odehrát.

Mění AI agenti i něco jiného než samotnou realitu lidí sedících a klikajících za počítačem?
Velkou devizou je komprimace testů a elasticita našich agentů. Například v situaci klienta ze Severní Ameriky, který má dvacet tisíc testů, jsme schopni automaticky nalézt kombinaci, která vyzkouší vše v zadání, ale zkrátí celkovou dobu testování čtyřikrát. V případě potřeby, například těsně před vydáním hry, lze naše řešení naškálovat třeba na tisíc agentů. Lidští testeři podobnou škálovatelnost typicky nenabídnou. Zároveň stále zkracujeme onboarding nové hry, chceme se dostat na jediný den. Filuta bude výhledově příští rok dostupný jako plugin pro herní enginy Unity nebo Unreal s přímočarou integrací do hry.

Zmiňujete, že AI je lepší než člověk. Jsou v něčem stále lepší živí testeři?
Samozřejmě v řešení nějakého emocionálního zážitku ze hry a zábavnosti samotného hraní. Jsme velmi dobří v technické analýze průběhu hraní hry agentem, zkušený tester sedící vedle developerů přímo ve studiu může být lepší v zachycování některých situací, kdy je třeba rozlišit, co je bug a co je feature. Například pokud hra umožňuje, aby kůň lezl po žebříku, náš agent toho radostně využije.

Vaše AI se nicméně jako živý tester chová. Tedy že hru prakticky hraje, neřeší nějaké abstraktní výpočty.
My v podstatě krok za krokem nahrazujeme úplně všechno. Člověk našim AI agentům zadá: Testujte ideální průchod hrou. Testujte, že je možné projít všemi dialogy. Splnit všechny questy. Hru kompletně dohrát. A náš agent jde a otestuje to. Stejně tak ale zvládne vyzkoušet herní mapu. Vezměte si třeba 120 kilometrů čtverečních velkou mapu ve vojenském simulátoru. Naši agenti ji skutečně proběhnou a můžou tam hledat například to, jestli tam chybně nelevitují nějaké objekty. Součástí testování je totiž kromě logování veškerých činností i video výstup. Když agent vizuálně detekuje, že někde létá kůň, spojí to s daty z logu a oznámí to. Případně lze naše agenty využít na rozbití hry. Aktivně hledají nechtěné zkratky nebo způsoby, jak hru rozbít. Když se jim to povede, tak se developerovi hned ukáže, hele, tady je problém.

Je vaše AI uplatnitelná univerzálně? Nebo jsou hry, na které je vhodnější?
Není to binární volba „hodíme se, nehodíme se“. S tituly jako Baldur’s Gate nebo Pathfinder: Kingmaker, tedy s hrami na hrdiny, které jsou kompletně diskretizované, se pracuje skvěle. To zjednodušeně řečeno znamená, že obsahují pevně dané, omezené prvky a možnosti. Velice dobrý je náš systém na otestování různých kauzálních systémů, jako jsou inventáře, dialogy, questy, karetní hry… Pak to jsou realtimové strategie, tam také umíme prakticky všechno dobře otestovat. Postav nějakou kombinaci jednotek a zjisti, co se stane, když je jedna na kopci. Zde můžu jmenovat jednoho klienta, což je kombinace střílečky a strategie Silica, která vzniká v inkubátoru českého studia Bohemia Interactive.

První rok jsme vyrostli o 700 procent. Teď jsme našli první velké zákazníky a očekáváme otočení do profitability.

Na co naopak nestačí?
To záleží na tom, jak moc je hlavní herní náplň definovaná spojitými nebo nespojitými funkcemi. Ty první jsou typicky různé fyzikální enginy, pohyb v prostoru, smykování autem, vystřelená kulka. To jsou soustavy diferenciálních rovnic, které my při testování abstrahujeme. Neřešíme přímo do hloubky jejich fungování. Řešit střelbu do asteroidů ve 3D vesmíru pro nás ideální není. Ale řešit třeba taktický pohyb jednotky vojáků, u kterých zjednodušeným způsobem víme, jak míří a na co střílí, na to už se hodíme.

Je něco, co nezvládá vůbec?
Ve hrách jako Angry Birds a Flappy Bird nemají naši agenti velkou přidanou hodnotu.

Proč zrovna tyhle tituly?
Tam není žádná logika, kterou by se naši AI agenti mohli naučit. Je to jen fyzikální simulace. Ale zmíním naopak jednu věc, kde má Filuta přidanou hodnotu nad rámec odhalování chyb.

A to?
Balancování hratelnosti. Díky tomu, že naši agenti odehrají desítky tisíc testů, dávají vývojářům pohled na fungování pravidel a mechanismů hry. Tím, že snímají stav herního světa a neustále ho ukládají, provádějí zevrubnou analytiku hry. Takže před vydáním můžeme studiu nabídnout i pohled na to, jak se hraje a jestli je vyvážená. Zároveň jsme schopni na základě modelu herního světa například najít dominantní strategie a kombinace v karetní hře, bez toho, že by agenti hru hráli.

Každopádně k testování her Filuta dorazil skrz různá další potenciální uplatnění.
Hry pro nás byly vždycky zajímavé, jsou to v podstatě takové zástupné simulace pro velké množství problémů z reálného světa. Můžete je brát jako zjednodušený model průmyslu, vesmíru… A zároveň jsme měli konexe s herním světem. Když jsem studoval na matfyzu, vedle mě byla skupina Cyrila Broma, který vedl skupinu doktorandů zaměřených na AI ve hrách. Znal jsem se s nimi, občas jsme šli na pivo. Včetně třeba Tomáše Plcha, který pracoval na Kingdom Come: Deliverance, působil v CD Projektu Red a Activision Blizzardu. Takže nějakou znalost a zkušenost s herním průmyslem jsme měli, ale vertikál, které jsme zvažovali, bylo 85. Z nich jsme postupně vyselektovali videohry coby trh, který je opravdu žhavý po chytrých autonomních agentech.

Není to až příliš omezující, pokud by se Filuta dal uplatnit i jinde?
My si už na začátku pozvali na pomoc byznysové analytiky a výsledkem opravdu tvrdé práce byla 300stránková studie, která zevrubně popisovala, jakým způsobem by se naše technologie mohla v těch pětaosmdesáti případech uplatnit. Byly tam různé obory od manufacturingu přes aerospace a compliance až právě po videohry. A ty se v tento okamžik jeví jako nejsilnější.

Zmínil jste vesmírný průmysl, což mi připomíná, že Filuta AI prezentujete jako technologii s kořeny v kosmu.
Ano, já se 16 let věnoval výzkumu umělé inteligence zaměřené na autonomní systémy, které musí dlouhodobě, klidně desetiletí, fungovat v prostředí bez možnosti zásahu člověka. Jsou to roboti v mořích, rover na Marsu, satelity… Právě v nich se používají takzvané autonomní plánovače. Ty mají nějaké cíle a hledají možnosti, jak jich dosáhnout, a když selžou, tak hledají nové a tak stále dokola. Je to smyčka, která je extrémně efektivní, ale současně jeden z nejtěžších úkolů pro vývoj. A to je jádro technologie, které jsem nasazoval do různých prostředí – včetně Filuty.

Z vesmíru zpátky k vaší AI. Nyní se tedy soustředíte čistě na herní využití, expanze do oněch zmiňovaných oborů není v plánu?
Chceme dobře vyřešit gaming, posílit tým a technologii odladit. A až budeme skvěle naintegrovaní do herních enginů, tak se posuneme dál. Což je ale právě všude tam, kde se tyhle enginy používají. V armádách pro vojenské simulace, automotive, ve zdravotnictví pro simulace operací… Jak jsem mluvil o tom, že hry jsou do jisté míry napodobování reálného světa a že my máme agenty, kteří jsou do herního prostředí schopní naběhnout, osahat si ho a pochopit, tak takový princip je aplikovatelný na další lidské obory. A stále s tou výhodou, že systém je zcela auditovatelný a vysvětlitelný.

Návrh bez názvu – 1

Přečtěte si takéGood Game: Marek Rosa a AI People spouští herní revoluciKlasické hry vám budou připadat hloupé a omezené. Spouštíme AI revoluci, říká šéf pražského studia

Takže Filuta by v budoucnu pomáhal i lékařům?
Oproti jazykovým modelům nebo neuronovým sítím je naše technologie kompletně auditovatelná a vysvětlitelná a lze ji nasadit do situací, kde jde o život. Ve zdravotnictví doktorovi nemůžete dát neuronovou síť, která by měla rozhodovat o tom, kam se pohne skalpelem. U symbolické umělé inteligence oproti tomu lze každé rozhodnutí dobře vysvětlit.

Každopádně prozatím bude pomáhat jen videoherním vývojářům. Zmiňoval jste velké americké studio, kdy ale Filutu využije parta nezávislých tvůrců z Česka?
Začátkem příštího roku.

To je brzy.
To je. Ale pracujeme na tom na maximum. Každý rok je nabitější. Ten první jsme vyrostli o 700 procent. Tento jsme si upevnili videoherní vertikálu a našli první velké zákazníky. Během několika měsíců očekáváme otočení do profitability. Příští rok chceme ze současné zhruba třicítky lidí narůst dvakrát až třikrát. Mimochodem, krásné na herním průmyslu je to, jak je rychlý. Ve výrobním odvětví trvá podpis smlouvy na produkt, který má prokazatelně přidanou hodnotu, klidně dva roky. V game devu? Měsíc a podepisujeme. I to ukazuje zájem o řešení, jako je Filuta.

Mimochodem, proč vlastně „Filuta“?
Ten název je taková kulminace mého snažení v umělé inteligenci. Když jsem AI začal studovat, tak jsem své první systémy takhle pojmenoval. Možná ještě někde běží. A když vznikl Filuta AI, tak to byla návaznost právě na moje začátky.