Podívejte se na fascinující obrazy od umělé inteligence. Napodobí Picassa, ale pozor na dezinformace

„Skutečný muž, který vypadá přesně jako Super Mario.“ I s takovým zadáním si programy poradí. Nastupující technologie ale vyvolává etické otázky.

Jiří BlatnýJiří Blatný

picasso1o

Foto: Midjourney/CzechCrunch

Umělá inteligence dokáže věrně napodobit mistry. Toto není obraz od Picassa.

0Zobrazit komentáře

Kdyby vám někdo před pár lety řekl, že si brzy budete moci nechat vygenerovat obraz jen zadáním několika málo slov podobně jako ve vyhledávači Google, asi byste si klepali na čelo. Pokrok v oblasti umělé inteligence a strojového učení však postupuje závratnou rychlostí. Jsme v druhé polovině roku 2022 a projektů, které se tímto segmentem zabývají, ať už privátních, nebo veřejných, existuje hned několik.

Službu dnes nabízí firma OpenAI Elona Muska se svým programem DALL·E 2, společnost Midjourney a firma Stability AI se svým Stable Diffusion. Redakce CzechCrunche si při psaní tohoto textu vyzkoušela práci s Midjourney, která je částečně dostupná zdarma každému, kdo používá komunikační službu Discord. Všechny tři nástroje jsou zatím ve fázi beta testování.

V praxi si program otevřete a zadáte anglický pokyn stejně, jako kdybyste hledali fotografie nebo obrázek na Googlu. Když jste milovník psů a přírody, zadáte třeba „roztomilý psík“ nebo „realistická a nádherná scéna zasněžených hor při západu slunce s oceánem v popředí a s letícími ptáky v dálce.“

Midjourney si ale poradí i s ještě komplexnějším zadáním. Slavný americký spisovatel Cormac McCarthy, autor děl jako Cesta nebo Tahle země není pro starý, je známý mimo jiné pro svá květnatá souvětí. V knize Krvavý poledník ukazuje řádění gangu na mexicko-texaských hranicích v polovině devatenáctého století. Popis jedné scény například tvoří souvětí o 241 slovech. Jak si s pokyny poradí Midjourney, to můžete sami posoudit níže.

Klíčové pro pochopení, jak tyto programy fungují, je anglické slovo diffusion, neboli česky rozptyl. Na principu rozptylu jsou totiž dnes založené všechny tři zmíněné aplikace. Spočívá v jejich schopnosti rozpoznávat význam mezi obrazem a textem, který snímky popisuje.

Program začne u vzorce náhodných teček a postupně z nich vytváří zadané dílo. Neuronová síť umělé inteligence to dokáže díky tomu, že se cvičila na ohromné databázi obrázků, které doprovázel textový popis. Ten podrobně vysvětloval, co je na vizuálním podkladu zachycené.

midjourney

Foto: Midjourney/CzechCrunch

Program Midjourney vytvoří i roztomilé obrázky

Databáze jsou opravdu masivní. Například program DALL·E 2 pracuje se čtyřmi sty miliony snímků, Midjourney s desítkami milionů a Stable Diffusion dokonce se dvěma miliardami obrazů. DALL·E 2 navíc uživatelům umožňuje výsledný obrázek všemožně upravovat.

Všechny tři generátory mají své plusy a minusy. Je pravděpodobné, že stejně jako jde člověk najisto do určitého obchodu pro triko nebo pro kabát určité velikosti, protože ví, že mu sedne, budou si amatéři i profesionálové za pár let moci najisto otevřít jeden z generátorů, když budou potřebovat zobrazit realisticky znázorněnou smějící se osobu. Ale s jiným budou pracovat ve chvíli, kdy budou chtít vygenerovat romantické zátiší.

Ve srovnání všech tří aplikací například Midjourney vyčnívá, pokud jde o detailní zobrazení textury nebo generování obrazů různých přístrojů, myslí si umělec Fabian Stelzer. Ten se podílí na přípravě údajně prvního filmu zcela vytvořeného umělou inteligencí. Výtvory Midjourney obecně připomínají spíše malby, zatímco DALL·E 2 a Stable Diffusion jsou lépe schopné přiblížit se fotografickému zobrazení.

Obrázků, které je vám umělá inteligence schopna vytvořit, je v podstatě nekonečno. Něco vám ale přeci jen neukáže. Generátory v sobě mají zabudovaný autocenzurní prvek, který jim nedovolí zobrazit násilí nebo nahotu. Protože jsou ale založené na hledání klíčových slov, lze ho vcelku jednoduše obejít. Stačí trocha jazykové obratnosti.

Dalším velkým otazníkem je v umění otázka nanejvýš stěžejní – autorské právo. Když totiž zadáte „portrét muže ve stylu Picassa,“ vygeneruje vám program obraz přesně v jeho typicky kubistickém stylu. Stejně tak to lze provést i s díly kohokoliv jiného. A otázka za zlatého bludišťáka pak je, jestli má na výsledný snímek nějaká práva onen malíř, kterým jste se inspirovali a jehož vliv je na obrazu jasně patrný, nebo jste oním umělcem vy. Přece jen jste pokyn dali vy.

Podle expertů na umělou inteligenci a strojové učení žaloby a soudní spory založené právě na podobných scénářích dřív nebo později přijdou. Protože je to však stále v podstatě neprobádané území, není přesně jasné, na co všechno budou mít generátory obrazu vliv.

„Situace, kdy vygenerujeme obraz a chceme ho vystavit a prodat, pro nás může být důležitým upozorněním. Na to jak náchylný je náš svět (umění) k nepochopení technologií, touze po efektu, komercializaci i podřízení,“ uvedl pro CzechCrunch vysokoškolský pedagog a kurátor Václav Janoščík.

pristaninamesici

Foto: Fabian Stelzer

Je libo důkaz o konspirační teorii? Žádný problém, programy zvládnou i to.

Jednoduchá dostupnost a nekonečné množství vizuálního obsahu podle inženýra pro strojové učení z firmy Adobe Ryana Murdocka může dále znamenat i rychlý konec fotobank a podobných služeb. A bohužel jednoduše lze generátor zneužít také k dezinformacím, jak upozornil Fabian Stelzer. Nechal si vygenerovat falešné fotografie, jak se v šedesátých letech v americkém Hollywoodu natáčelo fingované přistání na měsíci. Pohrál si tak s jednou z četných konspiračních terorií, které se mezi lidmi šíří už desítky let.

Jsme stále na začátku podobných technologií, a tak až budoucnost ukáže, jaký vliv na naše životy budou mít. Strojové učení a umělá inteligence nicméně v poslední době začínají být čím dál více přístupné a jejich použitelnost je různá. Nedávno se například přihlásil o pozornost chatovací bot založený na strojovém učení společnosti Meta. Program českého startupu The Mama AI zase přečte text tak, že stěží poznáte, že ho čte stroj.