ChatGPT nově vygeneruje tváře slavných lidí, libovolně upraví vaše fotky a umístí do nich text
DALL-E je mrtev, ať žije obrazový generátor ChatGPT-4o. OpenAI zásadně vylepšilo, jaké snímky si v jeho nástroji lze vytvořit. A koho na nich mít.
Společnost OpenAI, která je jinak lídrem ve vývoji umělé inteligence, byla dosud v jednom směru pozadu – v tvorbě obrázků. V této disciplíně její nástroj DALL-E vesměs zaostával za tím, co dokázaly konkurenční systémy typu Midjourney nebo Grok, jenž je napojený na sociální síť X, či Gemini od Googlu. Jenže Sam Altman a spol. i tuhle (jednu z mála) mezer dokázali nyní vyplnit s novým generátorem obrázků poháněným jazykovým modelem s označením 4o.
DALL-E patřil sice k průkopníkům tvoření obrázků s pomocí umělé inteligence, ovšem hodil se spíš pro přípravu ilustračních výtvorů. Když šlo o realistické fotografie, respektive jejich variace nebo o zpodobnění veřejně známých osob, bylo vždy lepší sáhnout po Midjourney nebo po Groku. Speciálně umělá inteligence z dílny X, tedy od Elona Muska, si s vykreslováním kdekoho v kdejaké situaci nedělala žádné servítky.
Nyní už ale i OpenAI nabízí možnost vygenerovat portréty lidí, s nimiž byste u ní ještě před pár dny nepochodili. Redakce CzechCrunchce nechala v prostředí ChatGPT, kde je už nástupce DALL-E v placených tarifech zakomponovaný, vytvořit portréty Donalda Trumpa či Václava Klause. A v obou případech byl výsledek velmi dobrý, jak se můžete přesvědčit níže.
U Donalda Trumpa poskytlo solidní výsledky i Midjourney a Grok, ale snímek z pera nástroje od OpenAI měl nejblíže k reálnému portrétu. Naopak se zadáním na realistickou fotografii Alberta Einsteina, za nímž bude jednak tabule s rovnicí teorie relativity, jednak okno s jaderným hřibem v dálce, si už ChatGPT tak snadno neporadil a výsledek působil hodně malovaným dojmem.
Zároveň ale to, co OpenAI nově hodně dobře umí a s čím jiné nástroje pořád ještě mají problém, je umisťování textu do obrázků. Nejde jen o E=mc2, ale snadno dokáže do obrázků vkládat složité a dlouhé a přesné formulace. V tom OpenAI konkurenci uteklo.
Přímo do ChatGPT si nově také můžete vložit vlastní fotku nebo nějakou skicu a nechat ji systém upravit podle vašeho zadání. To je funkce, která skýtá velký potenciál. Redakce to vyzkoušela tak, že do chatu nahrála profi fotografii Mercedesu G a požádala o změnu barvy vozu a o jiný design obrysových světel. Výsledek můžete posoudit sami.
Obrázkový nástroj se v ChatGPT stal ihned velmi populárním, což následně glosoval i Sam Altman, zakladatel OpenAI. „Je to mnohem úspěšnější, než jsme čekali. A to jsme měli očekávání dost vysoká,“ napsal na X. Zároveň ale dodal, že ještě nějakou dobu to potrvá, než budou tento generátor moci používat i ti, kdo si ChatGPT nepředplácí. Pod jeho příspěvkem se pak mimochodem strhla mela komických obrázků včetně parodie na Trumpa, jak provádí ranní rituál s vodou Saratoga.