Začíná nová éra videotvorby? OpenAI veřejnosti zpřístupnilo Soru, v EU ale zatím k dispozici není
Pokročilý nástroj pro generování fotorealistických klipů od OpenAI teď mohou využívat lidé v desítkách zemí. Evropská unie mezi nimi zatím není.
Včerejší den tak trochu započal novou éru videa, diváctví a možná i informací obecně. Společnost OpenAI, stojící za pokročilým chatbotem ChatGPT a generátorem obrázků DALL-E, totiž široké veřejnosti zpřístupnila generátor videa Sora. Ten na základě krátkého textového popisu dokáže za pár desítek vteřin vytvořit video, které je často k nerozeznání od záběru ze skutečné kamery nebo od animátora. Budoucnost, v níž si nebudeme moci být jistí, zda sledujeme realitu, nebo halucinaci počítače, je ale daleko.
OpenAI Soru světu poprvé představilo letos v únoru, kdy ukázalo sérii krátkých videí s animací i fotorealistickými záběry. Přestože nešlo o první nástroj tohoto typu, Sora si získala mnoho pozornosti kvalitou výsledných klipů. V Hollywoodu se už loni v létě konaly velké stávky kvůli obavám z nahrazování lidské práce umělou inteligencí – a OpenAI v zásadě nabídlo první přesvědčivé ukázky, jak by to mohlo vypadat v praxi.
O měsíc později pak nástroj dostali do rukou filmoví režiséři, kteří popustili uzdu fantazii a představili krátké filmy – například o muži s balónkem místo hlavy, s fantasmagorickými průlety nemožnou krajinou nebo fiktivní portfolio reklamní společnosti. Natočit je ve skutečnosti by vyžadovalo týdny práce a nemalý rozpočet, vznikly ale v kanceláři za několik desítek minut.
Teď si taková videa mohou generovat miliony lidí po světě. Sora je dostupná ve více než 150 zemích všem s placenými tarify ChatGPT, na seznamu ovšem zatím nejsou země Evropské unie nebo Spojené království. Předplatné ChatGPT Plus (20 dolarů, respektive 475 korun měsíčně) uživatelům zajistí tisíc kreditů měsíčně, což lze převést na asi padesát klipů o délce pěti vteřin a rozlišení 720p. Nedávno uvedený tarif Pro s cenovkou 200 dolarů za měsíc (4 754 korun) pak dostane deset tisíc kreditů, což má znamenat „neomezený“ počet klipů v délce do 20 vteřin a rozlišení 1080p.
Uživatelské prostředí Sory nabídne knihovnu klipů vygenerovaných ostatními uživateli rozdělenou do kategorií, přičemž u každého si lze prohlédnout i zadání. Pro vytvoření vlastního videa stačí zvolit poměr stran, rozlišení a délku a napsat krátký popis toho, co chceme vidět. Podobně jako u obrázků či textu ale také zde může být popis velice detailní a obsahovat krátký scénář s několika akcemi za sebou.
Nastartujte svou kariéru
Více na CzechCrunch JobsOpenAI pak umožňuje pracovat i s už existujícím obsahem jako nahranými videi a fotografiemi. Sora přitom materiál vždy nejdříve analyzuje, zda neobsahuje něco chráněného autorskými právy. Pokud ano, umělá inteligence odmítne dále pracovat. Vlastní klipy a obrázky lze ale podle libosti doplňovat o nové prvky nebo je v několika úrovních „remixovat“, tedy nechat vygenerovat variaci podle dané předlohy.
Detail s autorskými právy zdůrazňuje téma, které se kolem umělé inteligence řeší už dlouho. OpenAI tvrdí, že svoje nástroje, které se učí pracovat s videem na už existující tvorbě, trénuje jen na „veřejně dostupném“ nebo licencovaném obsahu. Zejména první kategorie ale nechává poměrně dost prostoru pro interpretaci a otázky po etice strojového učení.
Filmaři, lidé z televize nebo youtubeři se nicméně zatím nemusí obávat, že by je Sora v dohledné době nějak významněji nahradila. A totéž platí třeba pro práci s informacemi a jejich ověřování. Každý vygenerovaný klip je jednak opatřený vodoznakem s logem OpenAI a informací v metadatech, jednak lze při bližším pohledu většinou poznat, že se nejedná o skutečné video.
Například youtuber Marques Brownlee, který si mohl novinku s předstihem vyzkoušet, vyjmenovává hned několik problémů, s nimiž se Sora nedokáže zdaleka spolehlivě vypořádat. Nejvíce chyb se pochopitelně objevuje u fotorealistických záběrů. Lidé i zvířata se na nich mnohdy pohybují podivně nepřirozeně a jejich končetiny někdy splývají, jindy zase přecházejí jedna do druhé a naopak. Sora tak jednoduše ještě úplně nerozumí stálosti objektů ani fyzice.
Některou práci i v profesionálním kontextu Hollywoodu by nicméně mohla zastat už brzy. Herec, filmař a majitel studia Tyler Perry už dříve zmínil, že umělá inteligence by mohla například odstranit potřebu stavět ve studiu kulisy – proto také sám odložil velký projekt rozšíření svého studia za 800 milionů dolarů (asi 18,5 miliardy korun). Zkrátka došel k závěru, že možná nebude potřeba.
Zajímavější než nahrazování práce lidí nicméně bude sledovat, jak budou umělci umělou inteligenci využívat kreativně k vytváření záběrů, které by jinak mohly být příliš složité, nebezpečné nebo drahé. Prozatím Sora představuje především zajímavou hříčku, den ode dne se ale její schopnosti posouvají dále.