Podívejte se na fascinující obrazy od umělé inteligence. Napodobí Picassa, ale pozor na dezinformace
„Skutečný muž, který vypadá přesně jako Super Mario.“ I s takovým zadáním si programy poradí. Nastupující technologie ale vyvolává etické otázky.
Kdyby vám někdo před pár lety řekl, že si brzy budete moci nechat vygenerovat obraz jen zadáním několika málo slov podobně jako ve vyhledávači Google, asi byste si klepali na čelo. Pokrok v oblasti umělé inteligence a strojového učení však postupuje závratnou rychlostí. Jsme v druhé polovině roku 2022 a projektů, které se tímto segmentem zabývají, ať už privátních, nebo veřejných, existuje hned několik.
Službu dnes nabízí firma OpenAI Elona Muska se svým programem DALL·E 2, společnost Midjourney a firma Stability AI se svým Stable Diffusion. Redakce CzechCrunche si při psaní tohoto textu vyzkoušela práci s Midjourney, která je částečně dostupná zdarma každému, kdo používá komunikační službu Discord. Všechny tři nástroje jsou zatím ve fázi beta testování.
V praxi si program otevřete a zadáte anglický pokyn stejně, jako kdybyste hledali fotografie nebo obrázek na Googlu. Když jste milovník psů a přírody, zadáte třeba „roztomilý psík“ nebo „realistická a nádherná scéna zasněžených hor při západu slunce s oceánem v popředí a s letícími ptáky v dálce.“
Midjourney si ale poradí i s ještě komplexnějším zadáním. Slavný americký spisovatel Cormac McCarthy, autor děl jako Cesta nebo Tahle země není pro starý, je známý mimo jiné pro svá květnatá souvětí. V knize Krvavý poledník ukazuje řádění gangu na mexicko-texaských hranicích v polovině devatenáctého století. Popis jedné scény například tvoří souvětí o 241 slovech. Jak si s pokyny poradí Midjourney, to můžete sami posoudit níže.
Nastartujte svou kariéru
Více na CzechCrunch Jobs-
Klíčové pro pochopení, jak tyto programy fungují, je anglické slovo diffusion, neboli česky rozptyl. Na principu rozptylu jsou totiž dnes založené všechny tři zmíněné aplikace. Spočívá v jejich schopnosti rozpoznávat význam mezi obrazem a textem, který snímky popisuje.
Program začne u vzorce náhodných teček a postupně z nich vytváří zadané dílo. Neuronová síť umělé inteligence to dokáže díky tomu, že se cvičila na ohromné databázi obrázků, které doprovázel textový popis. Ten podrobně vysvětloval, co je na vizuálním podkladu zachycené.
Databáze jsou opravdu masivní. Například program DALL·E 2 pracuje se čtyřmi sty miliony snímků, Midjourney s desítkami milionů a Stable Diffusion dokonce se dvěma miliardami obrazů. DALL·E 2 navíc uživatelům umožňuje výsledný obrázek všemožně upravovat.
Všechny tři generátory mají své plusy a minusy. Je pravděpodobné, že stejně jako jde člověk najisto do určitého obchodu pro triko nebo pro kabát určité velikosti, protože ví, že mu sedne, budou si amatéři i profesionálové za pár let moci najisto otevřít jeden z generátorů, když budou potřebovat zobrazit realisticky znázorněnou smějící se osobu. Ale s jiným budou pracovat ve chvíli, kdy budou chtít vygenerovat romantické zátiší.
Ve srovnání všech tří aplikací například Midjourney vyčnívá, pokud jde o detailní zobrazení textury nebo generování obrazů různých přístrojů, myslí si umělec Fabian Stelzer. Ten se podílí na přípravě údajně prvního filmu zcela vytvořeného umělou inteligencí. Výtvory Midjourney obecně připomínají spíše malby, zatímco DALL·E 2 a Stable Diffusion jsou lépe schopné přiblížit se fotografickému zobrazení.
„portrait of a man who looks exactly like super mario, ⁰photography, portrait photograph“
all of these can do amazing portraits, with DALL-E and SD being better at photos, while MJ does more refined facial textures in a painting context pic.twitter.com/bSRjbj88r0
— fabians.eth (@fabianstelzer) August 20, 2022
Obrázků, které je vám umělá inteligence schopna vytvořit, je v podstatě nekonečno. Něco vám ale přeci jen neukáže. Generátory v sobě mají zabudovaný autocenzurní prvek, který jim nedovolí zobrazit násilí nebo nahotu. Protože jsou ale založené na hledání klíčových slov, lze ho vcelku jednoduše obejít. Stačí trocha jazykové obratnosti.
Dalším velkým otazníkem je v umění otázka nanejvýš stěžejní – autorské právo. Když totiž zadáte „portrét muže ve stylu Picassa,“ vygeneruje vám program obraz přesně v jeho typicky kubistickém stylu. Stejně tak to lze provést i s díly kohokoliv jiného. A otázka za zlatého bludišťáka pak je, jestli má na výsledný snímek nějaká práva onen malíř, kterým jste se inspirovali a jehož vliv je na obrazu jasně patrný, nebo jste oním umělcem vy. Přece jen jste pokyn dali vy.
Podle expertů na umělou inteligenci a strojové učení žaloby a soudní spory založené právě na podobných scénářích dřív nebo později přijdou. Protože je to však stále v podstatě neprobádané území, není přesně jasné, na co všechno budou mít generátory obrazu vliv.
„Situace, kdy vygenerujeme obraz a chceme ho vystavit a prodat, pro nás může být důležitým upozorněním. Na to jak náchylný je náš svět (umění) k nepochopení technologií, touze po efektu, komercializaci i podřízení,“ uvedl pro CzechCrunch vysokoškolský pedagog a kurátor Václav Janoščík.
Jednoduchá dostupnost a nekonečné množství vizuálního obsahu podle inženýra pro strojové učení z firmy Adobe Ryana Murdocka může dále znamenat i rychlý konec fotobank a podobných služeb. A bohužel jednoduše lze generátor zneužít také k dezinformacím, jak upozornil Fabian Stelzer. Nechal si vygenerovat falešné fotografie, jak se v šedesátých letech v americkém Hollywoodu natáčelo fingované přistání na měsíci. Pohrál si tak s jednou z četných konspiračních terorií, které se mezi lidmi šíří už desítky let.
Jsme stále na začátku podobných technologií, a tak až budoucnost ukáže, jaký vliv na naše životy budou mít. Strojové učení a umělá inteligence nicméně v poslední době začínají být čím dál více přístupné a jejich použitelnost je různá. Nedávno se například přihlásil o pozornost chatovací bot založený na strojovém učení společnosti Meta. Program českého startupu The Mama AI zase přečte text tak, že stěží poznáte, že ho čte stroj.
Přejít do diskuze
Nahlásit komentář
Zdá se vám, že komentář je urážlivý, nebo sprostý? Dejte nám vědět.
Pokud chcete tento komentář nahlásit, přihlaste se.
Přihlásit seVyplňte své jméno
Chceme diskuze pod články otevřené a respektující, komentovat lze pouze pod jménem, ne anonymně.
Pokud chcete změnit vaše jméno a příjmení, přihlaste se.
Přihlásit se
Cookies
Pomocí cookies ukládáme vaše nastavení a preferencí, analýze návštěvnosti našich stránek, zprostředkování funkcí sociálních médií a k personalizaci obsahu … Číst dále
Pomocí cookies ukládáme vaše nastavení a preferencí, analýze návštěvnosti našich stránek, zprostředkování funkcí sociálních médií a k personalizaci obsahu. Informace o užívání našich stránek také dále sdílíme s našimi obchodními partnery z oblasti sociálních médií, reklamy a analytiky. Za tyto webové stránky a soubory cookies odpovídá CzechCrunch s.r.o. Více informací naleznete na následujícím odkazu.
Nastavit preferované cookies
Vždy, když navštěvujete jakoukoliv webovou stránku, stránka může ukládat nebo získávat informace z vašeho prohlížeče, zejména formou souborů cookies. Tyto informace se mohou týkat vás, vašich preferencí nebo vašeho zařízení a jsou užívány převážně k zajištění vámi očekávaného chodu stránek. Takto získané informace vás obvykle přímo neidentifikují, ale mohou vám zprostředkovat personalizovanější zkušenost při užívání našich stránek. Protože respektujeme vaše právo na soukromí, můžete zakázat některé druhy cookies, které nejsou k využívání našich stránek nezbytné. Pokud se však rozhodnete některé cookies zakázat, může mít tento krok vliv na vaši uživatelskou zkušenost stránek a námi nabízené služby. Aktivací níže uvedených souborů cookies vyjadřujete souhlas s tím, že vaše osobní údaje mohou být převedeny do třetích zemí. Více informací naleznete na následujícím odkazu.
Možnosti předvolby jednotlivých cookies
Nezbytné cookies zajišťují klíčové funkce webových stránek jako jsou zabezpečení, správa sítě, přístupnost a základní statistiky o návštěvnících, takže není možné je vypnout. Prohlížeč můžete nastavit tak, aby blokoval soubory cookie nebo o nich posílal upozornění (tato skutečnost však může mít vliv na fungování stránek).
Nástroje třetích stran, které nám umožňují zlepšovat fungování webových stránek pomocí zasílání zpráv o tom, jaký způsobem stránky užíváte. Tyto cookies však shromažďují údaje způsobem, který nikoho přímo neidentifikuje. Pokud tyto cookies nepovolíte, nebudeme vědět, kdy jste navštívili naši stránku.
Funkční a preferenční cookies umožňují použití pokročilého webového obsahu a pokročilých funkcí a zároveň nám také umožňují ukládat vaše nastavení a preference.
Díky těmto cookies vám můžeme zobrazovat personalizované nabídky, obsah, jakož i reklamní obsah, na základě vašich zájmů na našich webových stránkách, na stránkách třetích stran a na sociálních médiích. Neukládají ale vaše osobní informace přímo, nýbrž přes jedinečné identifikátory prohlížeče a internetového zařízení. Pokud je nepovolíte, bude se vám zobrazovat na stránkách méně cílená reklama.