O obrazových generátorech poháněných umělou inteligencí se toho už napsalo hodně. A není divu, jejich schopnosti se stále zlepšují. Zadáte text, pár vteřin počkáte a program vám vyrobí jakýkoliv obrázek, který byste často těžko rozeznali od reálné fotky. Podobně, jako se v dovednostech předhánějí jednotlivé generátory snímků, závodí i tvůrci umělé inteligence, která textové zadání přetvoří rovnou ve video. Takový program teď představil technologický gigant Meta Marka Zuckerberga.

Systém se jmenuje Make-A-Video a funguje stejně jako obrazové generátory, o kterých jsme v CzechCrunchi v poslední době psali. Na základě textového pokynu umělá inteligence ale vygeneruje video. „Opět tím posouváme možnosti kreativity,“ uvedla Meta při představení.

Je však nutné podotknout, že generovaná videa jsou dlouhá maximálně jen pět sekund a jejich obrazová kvalita zatím také neuchvátí. Podle Zuckerberga má sice program stále mouchy, je to podle něj ale přece jen další krůček vpřed v oblasti umělé inteligence. „Je o dost těžší generovat video než snímky, protože kromě toho, že musí systém správně vytvořit každý jednotlivý pixel, musí i správně předpovědět, jak se budou proměňovat v průběhu času,“ vysvětluje Zuckerberg.

Ve studii inženýrů Mety vědci fungování modelu popisují detailněji. Make-A-Video se učí na základě databáze obrázků s popisky, stejně jako obrazové generátory. Navíc má ale k dispozici i videa, ze kterých je systém schopný učit se bez nutnosti popisků obsahu. „Idea je naučit program, jak vypadá svět a jak se popisuje slovy, k tomu slouží snímky s popisky. Videa umožňují naučit systém, jak se ten svět pohybuje,“ vysvětlují vědci. Dohromady má tak umělá inteligence k dispozici miliony videí z internetu či fotobank.

We’re pleased to introduce Make-A-Video, our latest in #GenerativeAI research! With just a few words, this state-of-the-art AI system generates high-quality videos from text prompts.

Have an idea you want to see? Reply w/ your prompt using #MetaAI and we’ll share more results. pic.twitter.com/q8zjiwLBjb

— Meta AI (@MetaAI) September 29, 2022