Přeměňte v realitu téměř jakoukoliv fantazii. Obrazový generátor DALL·E 2 se otevírá všem
Umělá inteligence a generování obrazů nepřestávají fascinovat. Popustit uzdu fantazii v programu od OpenAI teď můžete i bez čekání ve frontě.
Malují obrazy jako od Pabla Picassa nebo jiných malířských mistrů, vyfotí kohokoliv a nepotřebují foťák, navrch toho všeho už stihly vyhrát cenu v umělecké soutěži. A umí toho ještě víc. Řeč je o obrazových generátorech, které pomocí umělé inteligence a strojového učení na povel dokáží dát téměř jakýmkoliv představám reálné kontury. Jeden z nich, DALL·E 2, teď jeho tvůrci nově zpřístupnili všem zájemcům.
Pokud si chtěl člověk doteď práci s DALL·E 2 zkusit, musel se zapsat na čekací listinu a obrnit se trpělivostí. Řada na něj totiž mohla přijít až po několika měsících. Teď si stačí vytvořit účet na webových stránkách a hned můžete experimentovat. Od spuštění veřejné beta verze na konci července má aktuálně program přes milion a půl pravidelných uživatelů a denně podle firmy OpenAI, která za ním stojí, generují přes dva miliony snímků.
Programy jako DALL·E 2 fungují na principu rozptylu, kdy po zadání textového pokynu umělá inteligence začíná od jednotlivých obrazových bodů a postupně je zpřesňuje, až se dostaví výsledek. Pro lepší představu to lze zjednodušeně přirovnat k práci sochaře, který obrábí hrubý kus kamene a výsledkem je socha.
Přestože je generování obrazu díky umělé inteligenci stále ještě v plenkách, existuje v současnosti takových programů hned několik. Kromě DALL·E 2 jsou ve veřejné beta verzi i další oblíbené – například Midjourney nebo Stable Diffusion. Vyzkoušet si dnes člověk může všechny tři, ovšem v různě omezených podobách.
Samotné generování dnes už není jedinou funkcí, kterou tato technologie nabízí. Umožňuje také například domalovat už hotové snímky. Když program pobídnete, aby vyrobil „realistický a profesionální portrét ženy, která stojí na Times Square v New Yorku, s krásnou hloubkou ostrosti“, ukáže se vám snímek níže.
Nejenže můžete DALL·E 2 nechat, ať vám připraví další snímky, podobné tomuto, můžete i celý obrázek upravit. Funkce nazvaná outpainting, tedy česky něco jako domalování, umožňuje rozšířit jakýkoliv obraz o téměř cokoliv, co chcete. Opět záleží jen na vaší fantazii a na textovém zadání. V redakci jsme DALL·E dali za úkol rozšířit rozmazané pozadí portrétu. Výsledek posuďte sami výše.
Jak OpenAI, tak Midjourney nabízejí uživatelům jen omezený počet pokynů za měsíc, které je možné po vyplýtvání dokoupit. Midjourney je dostupné uživatelům komunikační služby Discord v podobě bota, kterému člověk zadává textové pokyny. Návod na zprovoznění je od tvůrců k dispozici zde.
Autoři programu Stable Diffusion zvolili jiný přístup. Po srpnovém vydání své beta verze zdarma zpřístupnili zdrojový kód a další jeho klíčové části komukoliv na platformě pro spolupráci programátorů GitHub. Teoreticky si tak může nástroj přímo na svém počítači zprovoznit kdokoliv, chce to však už trochu počítačové gramotnosti.
Nastartujte svou kariéru
Více na CzechCrunch JobsOdlišně se tvůrci obrazových generátorů – přímo, nebo nepřímo – staví i k různým právním a etickým otázkám, které s nimi souvisejí. Nástup obrazových generátorů sice znamená spoustu možností, ale vyvolává i mnoho otázek.
Zatímco DALL·E 2 a Midjourney vám například nevytvoří obsah, který by zobrazoval násilí nebo nahotu, Stable Diffusion takové mantinely nemá. Jeho tvůrci apelují na osobní integritu jednotlivých uživatelů. Mimo jiné na Twitteru doporučují, aby si nechávali generovat jen takové obrázky, které „by se nestyděli ukázat vlastní matce“.
Podle některých expertů by kvůli nim mohla zvonit hrana fotobankám a některé z nich na tuto hrozbu už reagovaly zákazem nahrávat na svou službu snímky vytvořené umělou inteligencí. Takový krok podnikla například služba Getty Images, celosvětově jedna z největších fotobank. Její ředitel Craig Peters rozhodnutí vysvětlil obavami o zákonnost obsahu generovaného umělou inteligencí a snahou chránit zákazníky.