Celebrity to mají se soukromím složité. Neustále jsou pod drobnohledem a zvuk závěrky fotoaparátů už je pro spoustu z nich jen šum. Objektivy je sledují téměř všude. Snímky, o kterých pojednává tento text, však nikdo nevyfotil. Obrázky herečky Emmy Watson a herce Chrise Evanse jsme si nechali vytvořit obrazovým generátorem Midjourney.

Co to vlastně obrazové generátory jsou? Klíčové pro pochopení jejich fungování je anglické slovo diffusion – česky rozptyl. Jejich princip totiž spočívá ve schopnosti rozpoznat význam spojení mezi obrazem a textem, který snímky popisuje. Neuronová síť umělé inteligence to dokáže díky tomu, že se učila na velmi široké databázi obrázků, jež doprovázel textový popis. Ten podrobně vysvětloval, co je na vizuálním podkladu zachycené.

Tuto službu dnes nabízejí firmy OpenAI Elona Muska s programem DALL·E 2, společnost Midjourney a firma Stability AI s projektem Stable Diffusion. CzechCrunch ke generování snímků v tomto článku využil Midjourney, která je částečně dostupná zdarma každému, kdo používá komunikační službu Discord. Všechny tři nástroje jsou zatím ve fázi beta testování.

Obrazové databáze, na základě kterých se zmíněné programy učí, jsou opravdu masivní. DALL·E 2 pracuje se čtyřmi sty miliony snímků, Midjourney s desítkami milionů a Stable Diffusion dokonce se dvěma miliardami obrazů. Výsledkem pak může být třeba realistický snímek Emmy Watson alias Hermiony Granger z filmů o Harrym Potterovi nebo Chrise Evanse aka Kapitána Ameriky z marvelovských Avengers.

Foto: Midjourney/CzechCrunch Hyperrealistická fotografie Emmy Watson v podání programu Midjourney.

Program začne u vzorce náhodných teček a postupně z nich vytváří zadané dílo. Představte si sochaře, který chce vytvořit sochu člověka. Opracovává kamenný kvádr, který tak získává stále jasnější obrysy, až se dílo opravdu lidské postavě podobá.

V případě obrazových generátorů může být výsledkem téměř cokoliv. Program spustíte tím, že anglicky napíšete, co chcete, aby vytvořil. V případě herečky Watson jsme zadali: „Hyperrealistická fotografie Emmy Watson pózující v přirozeném světle se šťastným výrazem se středovou kompozicí ve 4K rozlišení.“ Do pár desítek sekund bylo hotovo. Výsledek posuďte sami.

Midjourney navíc můžete nechat vyrobit z již vytvořeného obrazu novou verzi, která se tou starou inspiruje. DALL·E 2 pak uživatelům umožňuje výsledný snímek všelijak upravovat. Možností je tedy v podstatě nekonečno.

Emma Watson na snímku vyrobeném umělou inteligencí od Midjourney

Všechny tři zmíněné programy se nicméně v určitých funkcích liší. DALL·E 2 ani Midjourney vám nedovolí nechat si vygenerovat nahotu nebo násilí. Stable Diffusion je v porovnání s nimi benevolentnější, byť jeho tvůrci uživatele mimo jiné nabádají k tomu, aby si nechávali generovat jen takové obrázky, které „by se nestyděli ukázat vlastní matce.“ DALL·E 2 vám dále nevygeneruje obrázek konkrétní osobnosti, Midjourney a Stable Diffusion ano.

Nová technologie a možnost generovat obrazový obsah s téměř naprostou svobodou každopádně dnes v této oblasti vytváří prostředí, kde si zatím každý může dělat, co chce. Není to ale tak, že by o rychlém nástupu strojového učení a umělé inteligence nevěděly úřady a nepřipravovaly se na něj.

Evropská unie v roce 2020 vydala rozsáhlou zprávu nazvanou Umělá inteligence v audiovizuálním sektoru, ve které odborníci upozorňují na potenciální problémy spojené s nástupem umělé inteligence od svobody projevu po právo na ochranu osobnosti. A tím se oklikou dostáváme zpět k celebritám.

Pokud použijete správný generátor, můžete si totiž nechat vyobrazit v podstatě jakýkoliv záběr kohokoliv na světě. Je libo Elon Musk v raketě mířící na Mars? Není problém. Nebo snímek politika, jak si podává ruku s představitelem nepřátelského státu? Hned to bude. A co naprosto vymyšlená scéna, na níž je známá osobnost v ponižující situaci? I to je možné.

S tím vyvstává řada otázek – má na výsledný snímek práva ona osoba na něm, tvůrci programu nebo vy? Pokyn jste přeci jen zadali právě vy.

Odbornice na právo v souvislosti s médii a technologiemi Kelsey Farish ve zmiňované zprávě EU píše, že z právního pohledu připomíná situace okolo umělé inteligence „spoře osvětlený noční klub, ve kterém práva na duševní vlastnictví, ochranné známky, reklamu, svobodu projevu nebo ochranu spotřebitele společně tančí, ale nejsou nutně v harmonii.“

Farish nicméně dodává, že jakýkoliv případ týkající se publicity, soukromí a důstojnosti jednotlivce musí být posuzován zvlášť a vždy bude zahrnovat vyvažování různých zákonů vůči sobě. Právo přitom není jediným odvětvím, ve kterém se v souvislosti s umělou inteligencí objevují nové problémy a otázky. Dalším je například umění.

Jako v případě každé nastupující technologie jsou lidé plní emocí. Žasneme a bojíme se. Jsme nadšení a zlobíme se. Generátory obrazu na bázi umělé inteligence – ale i další programy spoléhající na strojové učení – však nikam nezmizí. Naopak se budou jen zlepšovat a až v budoucnu uvidíme, jak se s nimi dokážeme sžít.