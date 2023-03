Může to znít jako maličkost, že počítačový program konečně dokáže přesvědčivěji zobrazit lidskou ruku. Tato schopnost však poměrně dlouho obrazovým generátorům, jako je Midjourney, unikala, a většina snímků vytvořených s jejich pomocí tak poskytovala jednoduché vodítko k rozpoznání, jestli je to opravdová fotografie, nebo obraz od umělé inteligence. Stačilo se podívat na ruce, kde tu prst chyběl, tu zase přebýval, jak je ostatně patrné i z našeho obrázku výše. Nejnovější verze generátoru Midjourney to však, zdá se, umí daleko lépe a zlepšila se i v dalších oblastech.

Pátá verze obrazového generátoru Midjourney je sice dostupná zdarma, ale zatím jen platícím uživatelům na komunikační platformě Discord, kde jsou k dispozici i ostatní verze. Pro přístup je potřeba mít na platformě účet. Jak si ho můžete založit a jak lze obrazový generátor spustit, její tvůrci přehledně píší v návodu na svém webu.

Pátou verzi v Midjourney trénovali zhruba pět měsíců. Podle vývojářů i uživatelů, kteří se svými výtvory chlubí na sociálních sítích, má opět o poznání lepší schopnosti. Textové zadání dokáže přeměnit v ještě realističtější obrazy, než jaké uměly vytvořit předchozí varianty.

Jestli v souvislosti s obrazovými generátory byl dlouhodobě znatelný nějaký nedostatek, byla to jejich (ne)schopnost věrohodně zachytit lidské ruce. „Tyto generátory nemají žádnou představu o trojrozměrné geometrii něčeho, jako je ruka. Mají o ní obecnou představu – má dlaň, prsty a nehty, ale žádný z těchto modelů ve skutečnosti nechápe, co je celek,“ upozornil pro BBC Science Focus odborník na výpočetní techniku Peter Bentley z University College London.

Některé obrazy od páté verze Midjourney lze jen stěží rozeznat od opravdové fotografie. Podle umělkyně Julie Wieland jsou zlepšení patrná v realističtějších texturách pleti, rysech obličeje, realističtějším osvětlení nebo lepších světelných odrazech, odlescích a stínech, uvedla pro server Ars Technica. Chcete třeba snímek Elona Muska, jak ve smokingu prochází na veřejné události kolem kamer? Žádný problém.

Midjourney v5 has pushed into photorealism, a goal which has eluded the computer graphics industry for decades (!) 🤯

Insane progression, and all that by 11 people with a shared dream.

🧵 Let’s explore what these breakthrough in Generative AI mean for 3D & VFX as we know it… pic.twitter.com/GlycHcPQqA

— Bilawal Sidhu (@bilawalsidhu) March 25, 2023