V USA se objevila nová malířka. Jmenuje se Frida a jde o robotickou ruku poháněnou umělou inteligencí
Na stole leží plátno, po kterém hbitými pohyby kmitá štětec. Na první pohled nic zvláštního. Až na to, že štětec třímá robotická ruka schopná malby.
Vědci z Institutu robotiky na univerzitě Carnegie Mellon v americkém Pittsburghu sestavili robotickou ruku, jejíž hlavní poslání je jasné na první pohled. Je totiž zakončena malířským štětcem a jmenuje se Frida. Umělá inteligence, která ji řídí, je navržena tak, aby podle zadání člověka namalovala obraz na plátno. Tým vědců chce s její pomocí překlenout mezeru mezi digitálním světem, ve kterém aktuálně bují tvořivé programy jako Midjourney a Stable Diffusion, a světem fyzickým. O vynálezu informoval deník The New York Times.
Jméno robotické ruky má dvojí význam. Jednak odkazuje na známou malířku Fridu Kahlo, jednak jde o zkratku pro spojení „Framework and Robotics Initiative for Developing Arts“, tedy iniciativa aplikačního rámce a robotiky pro rozvoj umění. Stojí za ní trojice z univerzity Carnegie Mellon. Jean Ohová, která je vedoucí skupiny zaměřené na robotickou inteligenci, inženýr Jim McCann a Peter Schaldenbrand, doktorand robotického institutu.
„Frida je robotický systém navržený pro malování, ale nejde o umělce. Negeneruje nápady, aby komunikovala, jde o systém, s nímž může umělec spolupracovat. Může jí zadat velmi náročné úkoly, které Frida dokáže splnit,“ vysvětluje Peter Schaldenbrand. Vědci se zaměřili právě na malování, protože jde o jeden z procesů, který je velmi složité zautomatizovat. Vyžaduje totiž velkou rafinovanost a kontrolu motoriky.
Robotická ruka využívá modely umělé inteligence podobné těm, které pohánějí dnes již dobře známé nástroje jako ChatGPT a DALL-E 2 od společnosti OpenAI – ty dokáží generovat obrázek nebo text na základě promptu, tedy textového zadání od uživatele. Vědcům se ale podařilo posunout se ze světa textových příkazů a digitálních pixelů ke hmatatelným tahům štětce.
„Můžete Fridě popsat slovy, jaký obraz chcete vytvořit, ukázat jí obrázek, jehož styl se vám líbí, případně jí ukázat přímo fotografii daného obrazu. Zadání může být také kombinací všech zmíněných kroků. Systém vám pak řekne, jaké barvy namíchat – to je stále práce člověka. Ukáže vám obrázky barev, vy je nachystáte a předáte Fridě k tvoření,“ přibližuje Schaldenbrand.
V průběhu tvůrčího procesu se Frida několikrát napojuje na umělou inteligenci, která ji pohání. Nejprve se asi hodinu učí, jak správně pracovat se štětcem. Zkoumá, jak tahy vypadají na plátně, a na základě toho je schopna odhadnout, jak budou vypadat postupem času. Pak začne používat velké vizuálně-jazykové modely, trénované na ohromných sadách dat, která párují texty a obrázky z internetu – díky tomu je schopna porozumět zadání.
Nastartujte svou kariéru
Více na CzechCrunch JobsPodobně pracují i nástroje DALL-E 2 či Midjourney, ale Frida jde o krok dál. Po zpracování zadání využívá strojové učení k tomu, aby obraz namalovala na plátno před sebou pomocí robotické ruky. Pro vědce šlo přitom o velkou výzvu, protože výsledek existuje ve fyzickém světě. Robotickou ruku tak bylo potřeba natrénovat tak, aby byla schopna kopírovat reálné tahy štětcem.
Podle deníku The New York Times tým vědců ve vývojářské laboratoři umístil velký papír, na který načrtli asi 130 typů tahů, které lze štětcem vytvořit. A ty následně nahráli do Fridina modelu strojového učení. Poté, co robotická ruka udělá několik prvních tahů, od obrazu si poodstoupí a použije kameru k tomu, aby zachytila jeho podobu. Díky tomu dokáže hodnotit svůj postup a zdokonalovat výsledný počin, stejně tak, jako to dělají umělci z masa a kostí. Celý proces trvá hodiny.
„Lidé se nás ptají, jestli Frida nahradí práci umělců. Ale naším hlavním cílem je pravý opak. Chceme jejím prostřednictvím podpořit lidskou kreativitu. Já sama jsem chtěla být umělkyně a teď mohu spolupracovat s Fridou, protože mi pomůže moje nápady přenést na papír,“ vysvětluje Jean Ohová.
Otázkou samozřejmě zůstává, jestli lze tvorbu Fridy považovat za umělecký projev. Pracuje s ohromným množstvím dat, získaných z obrovských zdrojů obrázků a slov. Stále jde tak o svět jedniček a nul, v němž není pro umělecký projev prostor. „Můžeme se na to ale podívat jinak. Co ve skutečnosti dělá umělec? Vychází z ducha doby, z toho, co lidé kolem něj říkají a dělají a přetváří to do svého uměleckého rukopisu. Dalo by se říct, že přesně to dělá i Frida,“ říká Jim McCann.
Svět robotiky v minulosti přivítal také robotku Aidu, kterou sestrojil oxfordský vývojář a specialista na současné umění Aidan Meller společně s mezinárodním týmem expertů z různých oborů. I její umělá mysl byla načrnuta tak, aby simulovala kreativní mysl. Namalovala například portrét britské královny Alžběty II.