Konec nešťastným ořezům. Midjourney nově dokreslí okraje obrázku, upraví i poměr stran

Není tak problém kočce na titulním snímku dodělat nešikovně oříznutý hrnek. Rozšířený obsah navíc člověk může kontrolovat textovým zadáním.

Jiří BlatnýJiří Blatný

kockamidjourney1

Foto: Midjourney/CzechCrunch

Kočka v kavárně podle Midjourney

0Zobrazit komentáře

Jestli jste někdy zkoušeli generátory jako DALL·E 2, Stable Diffusion nebo Midjourney, možná se vám stalo, že program sice vytvořil hezký obrázek, ale oříznul ho tak, že hlavní postavě chybělo čelo, špička boty nebo – jako kočce na obrázku – kus hrnku. Konkrétně Midjourney s tím ale už dokáže pomoct. Minulý týden totiž populární nástroj na bázi umělé inteligence přišel s novou verzí, která umí dokreslit okraje.

Midjourney 5.2 oproti předchozí verzi 5.1 sice ke svému názvu přidává jen desetinu, otevírá ale řadu nových možností, jak ke generování vizuálního materiálu přistupovat. Funkce dokreslení okrajů, která se v Midjourney jmenuje Zoom Out, člověku umožní třeba vygenerovat detailní záběr a postupně ho rozšiřovat stisknutím tlačítka, které původní obraz automaticky rozšíří. Dnes to dokáže až dvojnásobně.

Zoom Out tak vyřeší poměrně častý neduh obrazových generátorů, které občas sice vytvoří použitelný snímek, ale postavě se do něj kvůli neobratné kompozici například nevejde část hlavy nebo ruky. V našem případě se ke kočce v kavárně z titulního obrázku nevešel celý hrníček v pravém dolním rohu.

V minulosti by se člověk s výsledkem buď musel spokojit, nebo začít generovat znovu. Dnes už ale může jednoduše obraz rozšířit. Stačí jednu ze čtyř klasicky vygenerovaných variant zvětšit a objeví se nová tlačítka – Zoom Out a Custom Zoom.

První variantu jsme popsali výše. Program obraz rozšíří, člověk ale nemá kontrolu nad tím, co přesně na okrajích snímku přibyde. Zajímavější je tak druhá funkce zvaná Custom Zoom, pomocí které lze před rozšířením upravit textové zadání.

Uživatel tak má pod kontrolou nejen obsah, který program dodělá, ale také poměr stran finálního výtvoru. Naší kočce tak nepřibyde jen celý hrnek, ale i další milovníci kávy, jak můžete vidět na obrázku níže.

Celý proces lze navíc v podstatě donekonečna opakovat, což umožňuje tvořit celé scenérie. Není tak divu, že se jich na sociálních sítích začalo objevovat nepřeberné množství. Funkci dokreslování okrajů podle textového zadání už nějakou dobu umí i obrazový generátor DALL·E 2 od OpenAI.

midjourney

Foto: CzechCrunch

Snímek obrazovky z Midjourney během generování obrázku