Veterán umělé inteligence nechce ChatGPT nechat náskok. Midjourney spustilo vylepšené generování obrázků

Midjourney uvedlo na trh svůj nejnovější model V7. Nacítí styl uživatele a slibuje realističtější obrázky.

David ZlomekDavid Zlomek

midjourney-1

Foto: Midjourney / CzechCrunch

Midjourney spustilo vylepšené generování obrázků

0Zobrazit komentáře

Když OpenAI nedávno přidala do ChatGPT možnost generovat obrázky, zaujala tím i ty, kteří se o umělou inteligenci nikdy moc nezajímali. Sociální sítě zaplavily stylizované výtvory ve stylu anime nebo Ghibli a zdálo se, že největší hvězdou generativního obrazu je najednou ChatGPT. Ale co na to Midjourney – projekt, který tohle všechno odstartoval?

Dlouhé měsíce byl relativně potichu, ale teď se vrací s novinkou. Midjourney spustilo na začátku dubna model s označením V7 a podle všeho jde o největší posun od vzniku platformy. Nejde totiž jen o drobné úpravy, ale o kompletní přestavbu. CEO společnosti David Holz to na síti X označil za „zcela novou architekturu“ a na Discordu doplnil: „V7 je mnohem chytřejší při práci s textovými prompty, obrázkové prompty vypadají fantasticky, kvalita je viditelně vyšší – s krásnými texturami a podstatně lepší koherencí těl, rukou a objektů všech typů.“

Hlavní změnou je tedy to, že nový model si lépe poradí s tím, co po něm chcete. Pochopí složitější zadání a výsledné obrázky jsou realističtější, čitelnější a bez dřívějších chyb, jako byly deformované ruce či podivné textury. Pokud jste někdy zkoušeli starší verze, rozdíl poznáte na první pohled.

altman-sam

Přečtěte si takéChatGPT i díky obrázkům prudce roste, uživatelů má 500 milionůOpenAI i díky obrázkům exponenciálně roste: hodnota je 300 miliard dolarů, uživatelů má 500 milionů

Model Midjourney V7 je dostupný pro všechny, kteří mají předplatné (od 10 dolarů měsíčně). Zatím v něm chybí některé funkce ze starších verzí – třeba upscaling (zvětšení obrázku) nebo retexturování – ale ty se mají v nejbližších týdnech vrátit. Do budoucna vývojáři slibují i nové nástroje: například tvorbu scén s více postavami nebo moodboardy.

Velkou novinkou je personalizace. Midjourney se naučí, co se vám líbí – ale potřebuje s tím pomoct. Nejdřív musíte ohodnotit přibližně 200 obrázků, a tím mu dáte představu o vašem vkusu. Model pak začne generovat výstupy, které „sedí vám“ – ne jen obecně. Je to trochu pracné, ale výsledek pak působí překvapivě přesně.

Midjourney vs. ChatGPT

Midjourney

Počet uživatelů: Přes 16 milionů

Investice: Bez investice

Cena pro uživatele: od 10 USD/měsíc

Spuštění: Červenec 2022

Způsob přístupu: Discord (textové prompty přes boty)


ChatGPT

Počet uživatelů: Přes 180 milionů měsíčně

Investice: Microsoft, Thrive Capital, fond SoftBank a další

Cena pro uživatele: Od 20 USD/měsíc (neomezené užívání v rámci ChatGPT-4)

Spuštění: Listopad 2022

Způsob přístupu: Webové rozhraní

Součástí updatu je také Draft Mode – tedy náhledový režim, který umí rychle vygenerovat náčrt obrázku. Jakmile jste spokojení, můžete finální výstup vygenerovat v plné kvalitě. Šetří to čas i nervy – a tvůrci říkají, že právě tohle bude nový standard práce s Midjourney.

Na první pohled to může vypadat, že ChatGPT s novou funkcí „obrázky na přání“ předehnal konkurenci. Ale v reálu jsou tyhle dva nástroje dost rozdílné. ChatGPT umí všechno trochu – obrázky, texty, kód – a sází na univerzálnost. Midjourney se zaměřuje čistě na obraz a styl, v čemž má ambici být nejlepší.

Nemělo by se ale zapomínat ani na Metu, která představila nové jazykové modely Llama 4. Ty sice negenerují obrázky, ale mají být dalším krokem ve vývoji AI, která lépe rozumí lidskému jazyku, přemýšlí a odpovídá s větší přesností. Meta nabízí čtyři verze – od menších, které rozběhnete i na slabším počítači, po „Behemotha“, obří model s víc než dvěma biliony parametrů.

Co to znamená v praxi? Přesnější odpovědi, rychlejší odezvu a možnost, že tyhle nástroje časem využijí i jiné aplikace – včetně těch, které generují obrázky. Meta zároveň tvrdí, že její modely fungují efektivněji než konkurenční – i když zatím jde hlavně o výsledky jejich vlastního testování.

OpenAI i díky obrázkům exponenciálně roste: hodnota je 300 miliard dolarů, uživatelů má 500 milionů

Na apríla oznámil Sam Altman, že nový obrazový generátor, který způsobil v ChatGPT mánii, bude dostupný pro všechny uživatele i bez předplatného.

Luboš KrečLuboš Kreč

altman-sam

Foto: CzechCrunch

Sam Altman v meditaci podle ChatGPT

0Zobrazit komentáře

Mohli byste prosím zpomalit s tím generováním obrázků? Náš tým se potřebuje vyspat! Touhle zprávou se zakladatel OpenAI Sam Altman rozloučil se svými sledujícími na X v neděli večer. Den poté oznámil, že nástroj na tvorbu obrázků bude dostupný úplně pro všechny. A že jeho firma získává historickou, absurdně vysokou investici.

Když v říjnu oznamovalo OpenAI, že nabralo peníze od investorů a že jeho hodnota vystoupala ke 160 miliardám dolarů, objevovala se u toho mediální provolání jako ohromující, obří či rekordní. Firma tehdy během půl roku zdvojnásobila svou hodnotu a všichni jsme byli svědky investorského FOMO efektu.

A to podle všeho pokračuje. Včetně svébytné variace na Moorovo pravidlo o exponenciálním růstu výpočetního výkonu – akorát v tom smyslu, že každý půlrok se hodnota OpenAI zdvojnásobí.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

„Oznamujeme nové investice ve výši 40 miliard dolarů při celkové valuaci 300 miliard dolarů, které nám umožní jít ještě dál ve výzkumu AI, dovolí nám rozšířit naše výpočetní kapacity a díky tomu dodáme neobyčejné silné nástroje pro všech těch 500 milionů lidí, kteří každý týden ChatGPT používají,“ uvedla společnost na svém webu.

Mezi investory, kteří poslali Altmanovi a spol. peníze, jsou kromě starých známých jako Microsoft nebo Thrive Capital, také nováčci v čele s fondem SoftBank. Právě s jeho zakladatelem Masajoši Sonem se Altman před časem ukázal v Bílém domě, kde po boku Donalda Trumpa oznamovali ambiciózní projekt Stargate.

A právě na něj by měla jít téměř polovina prostředků, kteří investoři do OpenAI poslali. Cílem Stargate je vybudovat robustní síť datacenter po celých USA, a to za 500 miliard dolarů v průběhu několika let. Ty pak mají sloužit tomu, aby si Amerika udržela náskok ve využití umělé inteligence.

OpenAI svou enormní valuací ovšem jen dohání náskok čínského majitele TikToku, splečnosti ByteDance. Ta počátkem března oznámila, že při sekundárním prodeji akcií se její hodnota vyšplhala na 315 miliard dolarů. A vesmírná firma SpaceX Elona Muska při přeprodeji svých akcií počátkem roku 2025 dokonce dosáhla na 350 miliard dolarů.

openai

Foto: OpenAI

Sam Altman a Satya Nadella, šéf Microsoftu

Právě Elon Musk je největším oponentem Sama Altmana. Ačkoli spolu OpenAI v roce 2015 zakládali, postupně se jejich cesty rozešli a Musk, momentálně asi nejvlivnější člověk světa díky svému napojení na Trumpa, firmu kritizuje.

Počátkem roku dokonce Musk nabídl, že firmu za 100 miliard dolarů koupí, chtěl tím zabránit její transformaci na komerční podnik. Dosud je totiž OpenAI formálně neziskovka.

Ovšem extrémně úspěšná neziskovka. Kromě toho, že nyní zveřejnila, že ji týdně používá 500 milionů lidí, se přes víkend Altman pochlubil, že za jedinou hodinu jim přibylo přes milion předplatitelů. Silný nárůst zákazníků společnost registruje právě v posledních dnech, kdy vypustila nástupce svého obrazového generátoru DALL-E, který je mimořádně účinný a který dovoluje pracovat i s tvářemi známých osobností.

Ten navíc společnost nyní uvolnila pro všechny uživatele, takže v něm malovat komiksy, generovat realistické fotografie nebo si nechávat upravovat své snímky nyní můžou všichni bez nutnosti mít ChatGPT předplacený.