Začíná nová éra videotvorby? OpenAI veřejnosti zpřístupnilo Soru, v EU ale zatím k dispozici není

Pokročilý nástroj pro generování fotorealistických klipů od OpenAI teď mohou využívat lidé v desítkách zemí. Evropská unie mezi nimi zatím není.

Tomáš ChlebekTomáš Chlebek

Screenshot

Reprofoto: OpenAI/YouTube

Záběr z videa vygenerovaného umělkyní Caroline Rocha

0Zobrazit komentáře

Včerejší den tak trochu započal novou éru videa, diváctví a možná i informací obecně. Společnost OpenAI, stojící za pokročilým chatbotem ChatGPT a generátorem obrázků DALL-E, totiž široké veřejnosti zpřístupnila generátor videa Sora. Ten na základě krátkého textového popisu dokáže za pár desítek vteřin vytvořit video, které je často k nerozeznání od záběru ze skutečné kamery nebo od animátora. Budoucnost, v níž si nebudeme moci být jistí, zda sledujeme realitu, nebo halucinaci počítače, je ale daleko.

OpenAI Soru světu poprvé představilo letos v únoru, kdy ukázalo sérii krátkých videí s animací i fotorealistickými záběry. Přestože nešlo o první nástroj tohoto typu, Sora si získala mnoho pozornosti kvalitou výsledných klipů. V Hollywoodu se už loni v létě konaly velké stávky kvůli obavám z nahrazování lidské práce umělou inteligencí – a OpenAI v zásadě nabídlo první přesvědčivé ukázky, jak by to mohlo vypadat v praxi.

O měsíc později pak nástroj dostali do rukou filmoví režiséři, kteří popustili uzdu fantazii a představili krátké filmy – například o muži s balónkem místo hlavy, s fantasmagorickými průlety nemožnou krajinou nebo fiktivní portfolio reklamní společnosti. Natočit je ve skutečnosti by vyžadovalo týdny práce a nemalý rozpočet, vznikly ale v kanceláři za několik desítek minut.

Teď si taková videa mohou generovat miliony lidí po světě. Sora je dostupná ve více než 150 zemích všem s placenými tarify ChatGPT, na seznamu ovšem zatím nejsou země Evropské unie nebo Spojené království. Předplatné ChatGPT Plus (20 dolarů, respektive 475 korun měsíčně) uživatelům zajistí tisíc kreditů měsíčně, což lze převést na asi padesát klipů o délce pěti vteřin a rozlišení 720p. Nedávno uvedený tarif Pro s cenovkou 200 dolarů za měsíc (4 754 korun) pak dostane deset tisíc kreditů, což má znamenat „neomezený“ počet klipů v délce do 20 vteřin a rozlišení 1080p.

Uživatelské prostředí Sory nabídne knihovnu klipů vygenerovaných ostatními uživateli rozdělenou do kategorií, přičemž u každého si lze prohlédnout i zadání. Pro vytvoření vlastního videa stačí zvolit poměr stran, rozlišení a délku a napsat krátký popis toho, co chceme vidět. Podobně jako u obrázků či textu ale také zde může být popis velice detailní a obsahovat krátký scénář s několika akcemi za sebou.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

OpenAI pak umožňuje pracovat i s už existujícím obsahem jako nahranými videi a fotografiemi. Sora přitom materiál vždy nejdříve analyzuje, zda neobsahuje něco chráněného autorskými právy. Pokud ano, umělá inteligence odmítne dále pracovat. Vlastní klipy a obrázky lze ale podle libosti doplňovat o nové prvky nebo je v několika úrovních „remixovat“, tedy nechat vygenerovat variaci podle dané předlohy.

Detail s autorskými právy zdůrazňuje téma, které se kolem umělé inteligence řeší už dlouho. OpenAI tvrdí, že svoje nástroje, které se učí pracovat s videem na už existující tvorbě, trénuje jen na „veřejně dostupném“ nebo licencovaném obsahu. Zejména první kategorie ale nechává poměrně dost prostoru pro interpretaci a otázky po etice strojového učení.

Filmaři, lidé z televize nebo youtubeři se nicméně zatím nemusí obávat, že by je Sora v dohledné době nějak významněji nahradila. A totéž platí třeba pro práci s informacemi a jejich ověřování. Každý vygenerovaný klip je jednak opatřený vodoznakem s logem OpenAI a informací v metadatech, jednak lze při bližším pohledu většinou poznat, že se nejedná o skutečné video.

Například youtuber Marques Brownlee, který si mohl novinku s předstihem vyzkoušet, vyjmenovává hned několik problémů, s nimiž se Sora nedokáže zdaleka spolehlivě vypořádat. Nejvíce chyb se pochopitelně objevuje u fotorealistických záběrů. Lidé i zvířata se na nich mnohdy pohybují podivně nepřirozeně a jejich končetiny někdy splývají, jindy zase přecházejí jedna do druhé a naopak. Sora tak jednoduše ještě úplně nerozumí stálosti objektů ani fyzice.

Některou práci i v profesionálním kontextu Hollywoodu by nicméně mohla zastat už brzy. Herec, filmař a majitel studia Tyler Perry už dříve zmínil, že umělá inteligence by mohla například odstranit potřebu stavět ve studiu kulisy – proto také sám odložil velký projekt rozšíření svého studia za 800 milionů dolarů (asi 18,5 miliardy korun). Zkrátka došel k závěru, že možná nebude potřeba.

Zajímavější než nahrazování práce lidí nicméně bude sledovat, jak budou umělci umělou inteligenci využívat kreativně k vytváření záběrů, které by jinak mohly být příliš složité, nebezpečné nebo drahé. Prozatím Sora představuje především zajímavou hříčku, den ode dne se ale její schopnosti posouvají dále.

CzechCrunch Jobs

CzechCrunch Weekly

V newsletteru Weekly vám každou neděli naservírujeme porci těch nejdůležitějších zpráv, které by vám neměly uniknout.

Napíše zprávu mámě i zadání pro vývojáře. Aneb jak #HolkyzMarketingu zkoušely AI od Samsungu

Nicole Karráová a Lam Nguyen z platformy #HolkyzMarketingu vyzkoušely umělou inteligenci Galaxy AI. A to při své práci i v soukromí.

Michal MančařMichal Mančař

samsung-holky-z-marketingu

Foto: #HolkyzMarketingu / Samsung

Jak na umělou inteligenci v telefonu?

Platforma #HolkyzMarketingu v tomhle oboru funguje už deset let. Marketéry – muže i ženy – propojuje, vzdělává a pomáhá jim. Ale jaké nástroje pomáhají Holkám samotným? Třeba umělá inteligence v telefonech od Samsungu. Lam Nguyen a Nicole Karráová na chvíli odložily iPhony, aby si Galaxy AI vyzkoušely v práci i v soukromí – a takhle to dopadlo.

„Sotva jsme telefony dostaly, zamířily jsme na technologickou konferenci Web Summit v Lisabonu. Takže jsme je mohly vyzkoušet v terénu,“ říká Nicole Karráová, marketingová šéfka firmy #HolkyzMarketingu, která měla k vyzkoušení Galaxy Z Fold6, tedy větší, skládací model. Hlavní produkťačka Lam Nguyen zase testovala samsungovskou AI na modelu Galaxy Z Flip5. „Z toho jsem měla totální radost, protože před mnoha lety jsem sama ‚véčko‘ měla,“ přidává se smíchem.

Schopnosti svých telefonů využily i k zábavnějším účelům, ale především je testovaly v pracovním nasazení. Příležitostí k tomu Web Summit nabídl dostatek. „Při tom obyčejnějším používání někde cestou v autobuse to pro mě takový benefit nebyl, ale když jsem potřebovala udělat něco s grafikou ve Figmě nebo cokoliv naplánovat v Asaně, na obří obrazovce to na rozdíl od menšího iPhonu nebyl problém,“ popisuje Karráová.

Obě markeťačky ale chtěly vyzkoušet hlavně umělou inteligenci Samsung Galaxy AI. „Vygenerování textu podle zadání bylo OK. Ale největší přínos pro mě byla schopnost shrnutí obsahu, třeba poznámek ze schůzky nebo možnost ze záznamu vytáhnout ty nejdůležitější body,“ přidává Nguyen. Sama přitom připomíná, že různých nástrojů, které podobné funkce zvládají, je vícero. „Jenže to není komfortní. Musíš si je nainstalovat, něco zaplatit, zkombinovat… není to pohodlné. Tady to máte všechno v mobilu,“ dodává.

„To je za mě ta největší výhoda. Že AI funkce jsou na jednom místě v malém zařízení. Nemusí být revoluční, spoustu jsem jich v nějaké podobě používala v jiném formátu, ale tady to máte v ruce. Nemusím jít na jinou stránku, nemusím spouštět jinou aplikaci,“ přitakává Karráová.

Tu kromě toho zaujaly i možnosti AI spojené s fotoaparátem. Třeba ta nechat do fotografie přikreslit či lépe řečeno vygenerovat obsah. I v tomhle hravějším testování se nicméně našlo pracovnější uplatnění. „Třeba díky možnosti zkopírovat text z fotky prezentace nebo z namířeného foťáku,“ říká.

Právě kolem fotoaparátu se podle marketingové šéfky #HolkyzMarketingu nicméně točí i další možné uplatnění generativních schopností umělé inteligence. Účast na konferenci totiž připomněla organizování vlastních akcí – a občas náročné řešení toho, jak by takové eventy měly vypadat.

„Standardně něco vyfotím, to si hodím do počítače, tam si ve Figmě zkouším navrhnout výzdobu, stánky, instrukce pro grafika,“ popisuje Karráová. „Ale teď si dovedu představit, že vezmu telefon, vyfotím prostor a hned si tam vygeneruju třeba stůl nebo stánek, abychom já i designér okamžitě dostali tu správnou představu. Pro markeťáka, co řeší i offline věci, je to super,“ dodává. „Šetří to strašně moc času.“

Její parťačka si spíš než s fotkami pohrála s písmenky. Právě na ty totiž spousta funkcí Samsung Galaxy AI míří, a to od souhrnu článků či internetových stránek až po funkci Spisovatel, která generuje text podle zadání. Po vzoru třeba Gemini od Googlu, ale s integrací přímo do aplikací telefonu od poznámek po prohlížeč.

„Přes AI jsem si třeba nechala vygenerovat pozvánky na naše kurzy. Na podobné ‚quick fixes‘ je to opravdu užitečné, něco rychle zformulovat to umí velice hezky,“ popisuje Nguyen. Která zároveň přiznává, že větší, kreativnější nebo prostě náročnější texty by ale umělé inteligenci nesvěřila.

samsung

Přečtěte si takéJak CTO českého startupu týden používal Samsung Galaxy AI?Týden jsem komunikoval pomocí AI od Samsungu, říká technický šéf českého startupu Aireen. Jak to dopadlo?

Tedy prozatím. Dovede si představit větší důvěru v AI třeba za pár let? „A to dokonce i za kratší dobu! Jestli AI dáme přístup k relevantním informacím, že bude vědět, co mám ve Slacku, co řeším v Asaně, jestli se prostě líp propojí, tak jí svěřím i vážný text, u kterého jen upřesním pár detailů,“ prorokuje Nguyen.

Už teď ale oceňuje uplatnění nástrojů, jako je Galaxy AI, napříč obory. Tedy nejen ve svém marketingu. „Ať už jsi marketér, nebo třeba inženýr, pořád je to práce s mobilem, práce s textem. Umělé inteligenci prostě řekneš, jestli něco potřebuješ poslat svojí mámě, jestli děláš post na Instagram nebo jestli je to zadání pro vývojáře, a ona to udělá. V tom je univerzální,“ říká.

Podobně pozitivní výhled přidává i její kolegyně Karráová. „Já trochu s nadsázkou řeknu, že chci, aby za mě AI částečně myslela. Když musím přemýšlet nad vším, nepomůže mi. Chci se zaměřit na kreativitu, na vymýšlení strategií – ne na to, že musím vzít nějaký seznam, zkopírovat ho, naklikat pro celý tým termíny… Vím, že je to hloupost, ale těch je za den několik a nasčítají se,“ popisuje až příliš mnoha lidem dobře známé pracovní procesy.

Právě v jejich odstranění vidí největší benefit umělé inteligence „Nepotřebuju, aby za mě dělala kreativní činnost. Ale aby mě zbavila těch hloupých,“ uzavírá Nicole Karráová z #HolkyzMarketingu.

CC Native

Partnerem článku je Samsung