Tech – 23. 8. 2022 – 4 min čtení

Podívejte se na fascinující obrazy od umělé inteligence. Napodobí Picassa, ale pozor na dezinformace

„Skutečný muž, který vypadá přesně jako Super Mario.“ I s takovým zadáním si programy poradí. Nastupující technologie ale vyvolává etické otázky.

Jiří Blatný

Foto: Midjourney/CzechCrunch

Umělá inteligence dokáže věrně napodobit mistry. Toto není obraz od Picassa.

0Zobrazit komentáře

Kdyby vám někdo před pár lety řekl, že si brzy budete moci nechat vygenerovat obraz jen zadáním několika málo slov podobně jako ve vyhledávači Google, asi byste si klepali na čelo. Pokrok v oblasti umělé inteligence a strojového učení však postupuje závratnou rychlostí. Jsme v druhé polovině roku 2022 a projektů, které se tímto segmentem zabývají, ať už privátních, nebo veřejných, existuje hned několik.

Službu dnes nabízí firma OpenAI Elona Muska se svým programem DALL·E 2, společnost Midjourney a firma Stability AI se svým Stable Diffusion. Redakce CzechCrunche si při psaní tohoto textu vyzkoušela práci s Midjourney, která je částečně dostupná zdarma každému, kdo používá komunikační službu Discord. Všechny tři nástroje jsou zatím ve fázi beta testování.

V praxi si program otevřete a zadáte anglický pokyn stejně, jako kdybyste hledali fotografie nebo obrázek na Googlu. Když jste milovník psů a přírody, zadáte třeba „roztomilý psík“ nebo „realistická a nádherná scéna zasněžených hor při západu slunce s oceánem v popředí a s letícími ptáky v dálce.“

Midjourney si ale poradí i s ještě komplexnějším zadáním. Slavný americký spisovatel Cormac McCarthy, autor děl jako Cesta nebo Tahle země není pro starý, je známý mimo jiné pro svá květnatá souvětí. V knize Krvavý poledník ukazuje řádění gangu na mexicko-texaských hranicích v polovině devatenáctého století. Popis jedné scény například tvoří souvětí o 241 slovech. Jak si s pokyny poradí Midjourney, to můžete sami posoudit níže.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

Klíčové pro pochopení, jak tyto programy fungují, je anglické slovo diffusion, neboli česky rozptyl. Na principu rozptylu jsou totiž dnes založené všechny tři zmíněné aplikace. Spočívá v jejich schopnosti rozpoznávat význam mezi obrazem a textem, který snímky popisuje.

Program začne u vzorce náhodných teček a postupně z nich vytváří zadané dílo. Neuronová síť umělé inteligence to dokáže díky tomu, že se cvičila na ohromné databázi obrázků, které doprovázel textový popis. Ten podrobně vysvětloval, co je na vizuálním podkladu zachycené.

Foto: Midjourney/CzechCrunch

Program Midjourney vytvoří i roztomilé obrázky

Databáze jsou opravdu masivní. Například program DALL·E 2 pracuje se čtyřmi sty miliony snímků, Midjourney s desítkami milionů a Stable Diffusion dokonce se dvěma miliardami obrazů. DALL·E 2 navíc uživatelům umožňuje výsledný obrázek všemožně upravovat.

Všechny tři generátory mají své plusy a minusy. Je pravděpodobné, že stejně jako jde člověk najisto do určitého obchodu pro triko nebo pro kabát určité velikosti, protože ví, že mu sedne, budou si amatéři i profesionálové za pár let moci najisto otevřít jeden z generátorů, když budou potřebovat zobrazit realisticky znázorněnou smějící se osobu. Ale s jiným budou pracovat ve chvíli, kdy budou chtít vygenerovat romantické zátiší.

Ve srovnání všech tří aplikací například Midjourney vyčnívá, pokud jde o detailní zobrazení textury nebo generování obrazů různých přístrojů, myslí si umělec Fabian Stelzer. Ten se podílí na přípravě údajně prvního filmu zcela vytvořeného umělou inteligencí. Výtvory Midjourney obecně připomínají spíše malby, zatímco DALL·E 2 a Stable Diffusion jsou lépe schopné přiblížit se fotografickému zobrazení.

„portrait of a man who looks exactly like super mario, ⁰photography, portrait photograph“

all of these can do amazing portraits, with DALL-E and SD being better at photos, while MJ does more refined facial textures in a painting context pic.twitter.com/bSRjbj88r0

— fabians.eth (@fabianstelzer) August 20, 2022

Obrázků, které je vám umělá inteligence schopna vytvořit, je v podstatě nekonečno. Něco vám ale přeci jen neukáže. Generátory v sobě mají zabudovaný autocenzurní prvek, který jim nedovolí zobrazit násilí nebo nahotu. Protože jsou ale založené na hledání klíčových slov, lze ho vcelku jednoduše obejít. Stačí trocha jazykové obratnosti.

Dalším velkým otazníkem je v umění otázka nanejvýš stěžejní – autorské právo. Když totiž zadáte „portrét muže ve stylu Picassa,“ vygeneruje vám program obraz přesně v jeho typicky kubistickém stylu. Stejně tak to lze provést i s díly kohokoliv jiného. A otázka za zlatého bludišťáka pak je, jestli má na výsledný snímek nějaká práva onen malíř, kterým jste se inspirovali a jehož vliv je na obrazu jasně patrný, nebo jste oním umělcem vy. Přece jen jste pokyn dali vy.

Podle expertů na umělou inteligenci a strojové učení žaloby a soudní spory založené právě na podobných scénářích dřív nebo později přijdou. Protože je to však stále v podstatě neprobádané území, není přesně jasné, na co všechno budou mít generátory obrazu vliv.

„Situace, kdy vygenerujeme obraz a chceme ho vystavit a prodat, pro nás může být důležitým upozorněním. Na to jak náchylný je náš svět (umění) k nepochopení technologií, touze po efektu, komercializaci i podřízení,“ uvedl pro CzechCrunch vysokoškolský pedagog a kurátor Václav Janoščík.

Foto: Fabian Stelzer

Je libo důkaz o konspirační teorii? Žádný problém, programy zvládnou i to.

Jednoduchá dostupnost a nekonečné množství vizuálního obsahu podle inženýra pro strojové učení z firmy Adobe Ryana Murdocka může dále znamenat i rychlý konec fotobank a podobných služeb. A bohužel jednoduše lze generátor zneužít také k dezinformacím, jak upozornil Fabian Stelzer. Nechal si vygenerovat falešné fotografie, jak se v šedesátých letech v americkém Hollywoodu natáčelo fingované přistání na měsíci. Pohrál si tak s jednou z četných konspiračních terorií, které se mezi lidmi šíří už desítky let.

Jsme stále na začátku podobných technologií, a tak až budoucnost ukáže, jaký vliv na naše životy budou mít. Strojové učení a umělá inteligence nicméně v poslední době začínají být čím dál více přístupné a jejich použitelnost je různá. Nedávno se například přihlásil o pozornost chatovací bot založený na strojovém učení společnosti Meta. Program českého startupu The Mama AI zase přečte text tak, že stěží poznáte, že ho čte stroj.

Přejít do diskuze

Podívejte se na fascinující obrazy od umělé inteligence. Napodobí Picassa, ale pozor na dezinformace

Nastartujte svou kariéru

Nejčtenější články

Šéfovat tátovi nejde. E-shop Grizly byl rodinná firma, už není – z rodičů a syna jsou teď konkurenti

Český vynález, který se vyrábí už 60 let. V Kopřivnici chystají i remosky s designem od Pininfariny

Americké filmy aneb Jak dvě slova omylem ovládla českou síť X. Špatně jsem zadal reklamu, říká autor

Mikýř vyhrál Survivor a za miliony natočil show v O2 areně: Trochu jsme přestřelili, ale kdy jindy?

Kavárnice z autobusové zastávky pobláznila LinkedIn. Za jejími dorty jezdí do Pasohlávek stovky lidí

Slíbili si, že nikdy nebudou zaměstnaní. Teď mají manželé ze Zlína stomilionový obchod s přírodní módou

Sledujte nás

Live

Vyhledávání

Podívejte se na fascinující obrazy od umělé inteligence. Napodobí Picassa, ale pozor na dezinformace

Nastartujte svou kariéru

Vybrali jsme pro vás:

Nejčtenější články

Šéfovat tátovi nejde. E-shop Grizly byl rodinná firma, už není – z rodičů a syna jsou teď konkurenti

Český vynález, který se vyrábí už 60 let. V Kopřivnici chystají i remosky s designem od Pininfariny

Americké filmy aneb Jak dvě slova omylem ovládla českou síť X. Špatně jsem zadal reklamu, říká autor

Mikýř vyhrál Survivor a za miliony natočil show v O2 areně: Trochu jsme přestřelili, ale kdy jindy?

Kavárnice z autobusové zastávky pobláznila LinkedIn. Za jejími dorty jezdí do Pasohlávek stovky lidí

Slíbili si, že nikdy nebudou zaměstnaní. Teď mají manželé ze Zlína stomilionový obchod s přírodní módou

Sledujte nás

Live

Vyhledávání

Nahlásit komentář

Vyplňte své jméno