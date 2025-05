Uložit 0

V roce 2019 s premiérou seriálu Mandalorian do Hollywoodu oficiálně vstoupila revoluční technologie – velké LED obrazovky, které začaly nahrazovat zelená plátna. Teď ale přichází nový nástroj s mnohem dalekosáhlejšími důsledky – pro některé scény nebude třeba plátna, LED stěny, ba ani kamery, postačí počítač a scénář. Umělá inteligence od Googlu už zvládne generovat celé scény i s dialogy a nabízí editor zaměřený přímo na filmaře. Režisér Darren Aronofsky, stojící za Rekviem za sen, Černou labutí nebo Fontánou, proto založil studio se specializací na AI tvorbu. Už má i první film.

Jmenuje se Ancestra, režírovala ho Eliza McNitt a příští měsíc bude mít světovou premiéru na Tribeca Festival v New Yorku. Jak je zřejmé z první zveřejněné ukázky, snímek kombinuje živou akci s abstraktnějšími výjevy, pravděpodobně vytvořenými pomocí umělé inteligence. Zatím jde jen o krátkometrážní projekt, je ale jen otázkou času, než vzniknou další, větší.

V čele vývoje chce být studio Primordial Soup založené Darrenem Aronofskym, který navázal strategické partnerství s Googlem. Ten před pár dny představil nové nástroje pro generování videa Veo 3 a Flow – první je určený čistě pro tvorbu na základě textových nebo vizuálních pokynů, druhý nabízí detailnějším ovládání a možnosti práce s vytvořenými klipy. Cílem Primordial Soup je využívat umělou inteligenci tam, kde by omezení tradičnějších technik byla příliš svazující.

„Filmovou tvorbu vždy poháněly technologie. Po převratném vynálezu bratří Lumiérů a Edisona filmaři objevili skrytou schopnost kamer vyprávět příběhy,“ uvedl Aronofsky v oficiálním prohlášení. „Pozdější technologické průlomy – zvuk, barva, speciální efekty – nám umožnily vyprávět příběhy způsoby, jakými to dříve nešlo. Dnes je to stejné. Teď nastal čas prozkoumat tyto nové nástroje a utvářet je pro budoucnost vyprávění příběhů.

Ještě před několika dny byl nejpokročilejší generátor videa Sora od OpenAI, Google teď ale zvedl laťku o poznání výše. Jeho model Veo 3 vytváří přesvědčivější klipy s méně chybami v kontinuitě, fyzice, permanenci objektů a podobně, což jsou některé z hlavních výzev pro umělou inteligenci. Nejdiskutovanější novinkou je ale schopnost generovat ozvučená videa.

Zvuky mohou zahrnovat ruchy prostředí, odpovídající zvuky objektů v obrazu, ale také dialogy. Internet už obletělo například vygenerované video ve stylu rozhovoru s kolemjdoucímí, která jsou populární na YouTube. Přestože to, co postavy v klipu říkají, nakonec nedává smysl, většinu lidí by na první pohled nenapadlo hledat za tím nedokonalost umělé inteligence. Další video zase ukazuje celou sérii krátkých scének, kde lidé mluví s různými přízvuky a dokonce zpívají.

Flow je pak prostředí, které kombinuje schopnosti chatbota Gemini, generátoru obrázků Imagen a Veo. Nástroj, prý vyvinutý přímo ve spolupráci s filmaři, jim má poskytnout jak nástroje, na které jsou ve své profesi zvyklí, tak nové způsoby práce s obrazem a vyprávěním. Flow tak nabízí například detailní ovládání kamery jako vedení pohybů a perspektivy, střih a přechody mezi scénami nebo přehlednou správu prvků videa a pokynů pro generátory.

Důležitou součástí je také Flow TV, tedy knihovna uživatelských filmů vytvořených ve Flow. Prohlédnout si zde jde jednak samotná videa, jednak všechny pokyny, které u nich tvůrci použili. Díky tomu má být snazší najít inspiraci a naučit se s Flow lépe pracovat. Nejzajímavější je zde trojice krátkých filmů, které poměrně dobře ukazují schopnosti i limity nejnovější nástrojů Googlu.

Ve filmu s názvem Freelancers, který vznikl právě za pomoci nástroje Flow, je na jedné straně dobře vidět zachovaná kontinuita postav, prostředí nebo estetiky mezi záběry a scénkami, na druhé si rychle všimneme „plovoucích“ charakteristik tváří protagonistů nebo nesmyslných prostorových souvislostí – na stejný problém jsem narazil i při experimentování se Sorou. Uvěřitelná dynamická akční scéna u OpenAI ani Googlu jen tak nevznikne. Postavy navíc často přecházejí mezi přesvědčivým fotorealismem a podivně animovaným vzhledem jako z videohry.

Veo 3 a Flow jsou momentálně dostupné pouze ve Spojených státech pro předplatitele Google AI Pro za 549 korun měsíčně (první měsíc je zdarma) a Google AI Ultra za 6 890 korun měsíčně (3 450 korun po dobu prvních tří měsíců). V Česku si můžeme nyní bezplatně vyzkoušet méně pokročilý model Veo 2, který podle textových pokynů nebo nahraných obrázků generuje maximálně osmivteřinové němé klipy. Je pak třeba si jen dát pozor na datum přechodu na předplatné.

Ačkoliv i nejnovější nástroje mají celou řadu omezení a v blízké době je nebude možné využít pro seriózní filmařinu (vyjma specifických projektů jako film Ancestra), vývoj probíhá rychle a je nejspíš jen otázkou času, kdy to nebude platit. Odbory sdružující hollywoodské tvůrce proto mají ve smlouvách se studii AI podchycené. Například Aronofsky podle serveru Variety nechce nahrazovat tradiční filmovou produkci, ale využívat nové nástroje pro větší tvůrčí volnost a širší možnosti.

Podobným způsobem o AI v Hollywoodu nedávno mluvil režisér Avataru James Cameron, který se zapojil do správní rady Stability AI stojící za obrazovým generátorem Stable Diffusion. „Pokud chceme víc takových filmů, jaké miluju a na jaké se rád dívám – Duna, Duna: Část druhá, moje filmy nebo filmy s velkým objemem CGI efektů –, musíme přijít na to, jak o polovinu snížit náklady,“ řekl filmař.

Neznamená to pro něj, že by tvůrci vizuálních efektů měli přijít o práci, ale budou schopni pracovat efektivněji. Automatizace některých procesů jim také má umožnit více se zaměřit na kreativní stránku. Tu podle Camerona umělá inteligence v dohledné době nenahradí.