OpenAI představilo svůj nejodvážnější produkt od dob ChatuGPT. Nový „TikTok“ plný deepfake videí

Tvůrci nejpopulárnějšího chatbotu vytvořili zcela novou sociální síť, na níž má být všechen obsah vytvořený pomocí umělé inteligence.

altman
Foto: Filip Houska/CzechCrunch / OpenAI
Sam Altman, zakladatel OpenAI
0Zobrazit komentáře

Na přelomu září a října představila společnost OpenAI svůj dosud nejambicióznější produkt od vydání ChatGPT, generátor videí Sora 2. Ten dokáže nejen vytvářet vysoce realistická videa z textového zadání, ale nově umožňuje vložit do výsledného záběru i samotného uživatele, a to včetně jeho hlasu. Výsledkem jsou scény s překvapivou mírou věrohodnosti, které posouvají hranice dosavadní tvorby pomocí umělé inteligence.

Zatímco konkurence z Googlu či Mety představuje jen postupná vylepšení svých stávajících video-modelů, OpenAI se pouští do velkého experimentu. Ve svém nejnovějším projektu totiž spojuje generování obsahu s úplně novou sociální sítí. Mobilní aplikace Sora na první pohled připomíná TikTok. Stejně jako čínská platforma nabízí vertikální rozhraní, jednoduché přecházení na další videa přejetím prstu i chytrý doporučovací algoritmus. Zásadní rozdíl je ale v tom, že každý klip na nové síti z dílny vývojářů pracujících pod taktovkou Sama Altmana je od začátku do konce vytvořený umělou inteligencí.

První ukázky od uživatelů jsou venku a je jasné, že Sora působí úplně jinak než dosavadní generátory. Videa vypadají tak realisticky, že hranice mezi skutečností a umělou inteligencí se prakticky stírá.

Navíc Sora přináší takzvaný „cameo“ režim – stačí jednorázově nahrát krátké video, ověřit svou identitu a od té chvíle můžete sebe či své přátele zasazovat do libovolné AI scény. Chcete se proletět na rogalu? Vyrazit na snowboard a zakončit jízdu saltem vzad? Stačí zadat prompt a Sora 2 vás vykreslí s dechberoucí věrností a to včetně vašeho hlasu.

Klíčovým rozdílem oproti konkurenci je to, že Sora 2 působí, jako by skutečně rozuměla fyzikálním zákonům. Pokud například hráč basketu mine koš, míč se přirozeně odrazí od desky a dopadne na zem, přesně tak, jak by to proběhlo ve skutečnosti. Starší modely by ho jednoduše „přemístily“ do obroučky, jen aby splnily zadání. Sora 2 ale dokáže věrně simulovat i chybu nebo neúspěch, a právě to je zásadní krok k tomu, aby se stala skutečně věrným odrazem reality.

OpenAI si údajně dobře uvědomuje rizika, která jsou s dnešními sociálními sítěmi spojená, od nekonečného „doomscrollingu“ přes vznik závislosti až po pocit izolace. I proto vývojáři do nové Sory údajně zavedli několik odlišných principů. Zdůrazňují, že nechtějí uživatelům jen pasivně servírovat obsah, ale dát jim nad ním skutečnou kontrolu.

Sora 2 tak představuje novou generaci doporučovacích algoritmů postavených na velkých jazykových modelech, do nichž stačí jednoduše napsat, co chcete – třeba více cestovatelských videí nebo méně akčních scén – a systém vám vyhoví. Jeho součástí jsou navíc i zabudované mechanismy, které pravidelně zjišťují, jak se uživatelé cítí, a proaktivně jim nabízejí možnost feed kdykoli upravit.

Je mnohem méně divné sledovat feed plný memů o sobě samém, než jsem si myslel.

Aplikace totiž podle tvrzení OpenAI není navržená tak, aby maximalizovala čas strávený bezduchým prohlížením, ale aby spíše inspirovala k vlastní tvorbě. Proto prý upřednostňuje videa od lidí, které uživatelé sledují, a také obsah, jenž vás může motivovat k rozvoji kreativity.

Zvláštní důraz má OpenAI klást na bezpečnost mladších uživatelů. Teenageři budou mít nastavené limity na počet videí, která mohou denně zhlédnout, a přísnější pravidla pro generování obsahu s jejich obličeji. Rodiče navíc získají možnost kontrolovat nastavení jejich aplikace přímo přes ChatGPT.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

Pokud jde o práci s tváří uživatele, vývojáři zdůrazňují, že kontrola zůstane vždy v rukou samotných lidí. Každý bude moci rozhodnout, kdo smí jeho digitální podobu použít, a kdykoli může přístup odvolat nebo smazat jakékoli video, ve kterém se objeví. Uživatelé rovněž uvidí i rozpracované návrhy videí, kde jejich podoba figuruje. Otázkou ale zůstává, jak přesně bude probíhat ověřování identity – zda systém dokáže spolehlivě zabránit tomu, aby se někdo cizí vydával za někoho jiného.

Tvrzení však působí poněkud idealisticky, zejména s ohledem na první videa, která začala kolovat krátce po spuštění aplikace. Jeden uživatel například zveřejnil falešné záběry z bezpečnostní kamery v hypermarketu Target, kde se falešná kopie Sama Altmana neúspěšně pokouší o krádež. Další video zachycuje šéfa technologického giganta v nelichotivé situaci, s hlavou v toaletě, po vzoru trendu internetového memu Skibidi Toilet z youtubového kanálu DaFuq.

„Je mnohem méně divné sledovat feed plný memů o sobě samém, než jsem si myslel. Nevím, co si o tom mám myslet,“ reagoval Sam Altman na poprask kolem nové aplikace prostřednictvím sociální sítě X.

Podle amerického webu Wired zatím OpenAI nemá jasno v tom, jak bude na Soře vydělávat. Jediným aktuálním plánem je možnost nabídnout uživatelům extra limity na vytváření obsahu v případě, že by poptávka výrazně převýšila dostupný výpočetní výkon. „Hodně problémů jiných aplikací pramení z monetizačních modelů, které nutí dělat rozhodnutí proti zájmům uživatelů,“ vysvětluje rozhodnutí tým.

Aplikace Sora je od konce září zatím dostupná jen v USA a Kanadě pro majitele zařízení s iOS, přičemž brzy se plánuje rozšíření do dalších regionů. Je zdarma a nabízí údajně „velkorysé limity“, které se však mohou změnit, pokud zájem uživatelů výrazně vzroste a kapacita výpočetního výkonu se stane omezením.

Pro uživatele služby ChatGPT Pro tvůrci připravili i speciální přístup k experimentálnímu modelu Sora 2 Pro, který údajně přinese ještě kvalitnější výstupy.