Konec podivným rukám. Nová verze obrazového generátoru Midjourney ohromí svými schopnostmi

Obrazové generátory na bázi umělé inteligence si dlouho neuměly poradit se zobrazením rukou. Nová verze MIdjourney nabízí zlepšení nejen v tom.

Jiří BlatnýJiří Blatný

ruce_midjourney

Foto: Midjourney/CzechCrunch

Nepovedené detaily rukou obrazového generátoru Midjourney jsou už prý minulostí

Může to znít jako maličkost, že počítačový program konečně dokáže přesvědčivěji zobrazit lidskou ruku. Tato schopnost však poměrně dlouho obrazovým generátorům, jako je Midjourney, unikala, a většina snímků vytvořených s jejich pomocí tak poskytovala jednoduché vodítko k rozpoznání, jestli je to opravdová fotografie, nebo obraz od umělé inteligence. Stačilo se podívat na ruce, kde tu prst chyběl, tu zase přebýval, jak je ostatně patrné i z našeho obrázku výše. Nejnovější verze generátoru Midjourney to však, zdá se, umí daleko lépe a zlepšila se i v dalších oblastech.

Pátá verze obrazového generátoru Midjourney je sice dostupná zdarma, ale zatím jen platícím uživatelům na komunikační platformě Discord, kde jsou k dispozici i ostatní verze. Pro přístup je potřeba mít na platformě účet. Jak si ho můžete založit a jak lze obrazový generátor spustit, její tvůrci přehledně píší v návodu na svém webu.

Pátou verzi v Midjourney trénovali zhruba pět měsíců. Podle vývojářů i uživatelů, kteří se svými výtvory chlubí na sociálních sítích, má opět o poznání lepší schopnosti. Textové zadání dokáže přeměnit v ještě realističtější obrazy, než jaké uměly vytvořit předchozí varianty.

Jestli v souvislosti s obrazovými generátory byl dlouhodobě znatelný nějaký nedostatek, byla to jejich (ne)schopnost věrohodně zachytit lidské ruce. „Tyto generátory nemají žádnou představu o trojrozměrné geometrii něčeho, jako je ruka. Mají o ní obecnou představu – má dlaň, prsty a nehty, ale žádný z těchto modelů ve skutečnosti nechápe, co je celek,“ upozornil pro BBC Science Focus odborník na výpočetní techniku Peter Bentley z University College London.

Některé obrazy od páté verze Midjourney lze jen stěží rozeznat od opravdové fotografie. Podle umělkyně Julie Wieland jsou zlepšení patrná v realističtějších texturách pleti, rysech obličeje, realističtějším osvětlení nebo lepších světelných odrazech, odlescích a stínech, uvedla pro server Ars Technica. Chcete třeba snímek Elona Muska, jak ve smokingu prochází na veřejné události kolem kamer? Žádný problém.

„Umělá inteligence od Midjourney si už poradí s rukama,“ napsal na Twitteru také vývojář známého herního studia Naughty Dog Del Walker. Lidé by tak podle něj měli být ještě obezřetnější, pokud na internetu narazí na fotografii s politickým obsahem.

Walker připouští, že se na falešné obrázky nenachytá každý, zejména pokud se na daný snímek zadívá na delší dobu. Většinou totiž nakonec najde nějakou nesrovnalost, která prozradí, že je od umělé inteligence. Spoléhat se na to je ale podle něj špatně. „Názor, že člověk pozná, že je to od umělé inteligence díky tomu, jak na fotce vypadá kus látky, se opravdu míjí účinkem. Vaši rodiče se na to podívají jen na okamžik a uvěří tomu,“ vysvětlil Walker.

Služba Midjourney v současnosti kromě zkušební verze zdarma nabízí tři zpoplatněné plány, které mimo jiné zpřístupňují právě nejnovější pátou generaci – základní předplatné stojí 10 dolarů měsíčně (asi 220 korun), standardní 30 dolarů (zhruba 660 korun) a profesionální vyjde na 60 dolarů (1 320 korun). Při představení páté verze zástupci Midjourney zpřístupnění programu jen pro odběratele odůvodnili tím, že nedokáží zajistit dostatečný výpočetní výkon, aby mohli novou verzi uvolnit všem zájemcům.

Pokud ovšem placenou verzi máte, můžete si Midjouney na Discordu vyzkoušet. Pátou verzi je třeba nejdříve spustit v nastavení generátoru, do kterého se v Discordu dostanete, když do řádku pro novou zprávu napíšete /settings. Poté se zobrazí nastavení Midjourney. Zde je třeba kliknout na tlačítko s nápisem „MJ version 5“ v prvním řádku vpravo. Druhou variantou je psát na konec každého jednotlivého zadání při tvorbě obrazu pokyn „–v 5“, který vždy zajistí, že se o generování postará právě nejnovější verze.