Vývojáři Samsungu vynalezli umělou inteligenci, která rozpohybovala obraz Mony Lisy
Umělá inteligence ušla v posledních letech velký kus cesty a technologičtí nadšenci z celého světa se předhánějí v tom, kdo právě tuto technologii využije k zajímavějšímu účelu. Trendem posledních měsíců jsou takzvaná deep fake videa, schopná produkovat realistické videomontáže žijících i již nežijících lidí.
Díky deep fake technologii se tak například provozovatelům muzea Salvadora Dalího ve městě St. Petersburg na Floridě podařilo přivést tohoto populárního umělce znovu částečně k životu a jeho virtuální repliku použít pro svoji nejnovější expozici. David Beckham zase díky technologiím dokázal v kampani proti malárii hovořit několika jazyky.
S ještě pokročilejším řešením nyní přišli inženýři korejského giganta Samsung, kteří ve svém moskevském centru umělé inteligence vytvořili vlastní algoritmus pro práci s deep fake technologií.
Na rozdíl od standardních deep fake videí, která známe a která fungují na principu analyzování obličeje konkrétního člověka, jehož se následně umělá inteligence snaží zreplikovat, je novinka od Samsungu schopna pracovat i se statickými obrázky a fotkami. Ty jsou následně pomocí kombinace algoritmu, který předtím zanalyzoval stovky videí mluvících lidí, a rozpoznávací technologie GAN od výrobce grafických čipů Nvidia rozpohybovány.
Zatímco pro funkčnost klasického deep fake videa je ideálně potřeba, aby byl k replikované osobě k dispozici nějaký video záznam, s novinkou od Samsungu lze tímto způsobem rozpohybovat i osobnosti, které žily v období, kdy video ještě k dispozici nebylo. Samsung pak názornou demonstraci předvedl na známém obrazu Mony Lisy, kterému se inženýrům poměrně věrohodně podařilo vdechnout život.
Oproti technologie muzea Salvadora Dalího na Floridě má novinka od Samsungu samozřejmě jeden menší háček. Zatímco první zmíněná technologie díky dostupnosti videozáznamů zvládá velmi přesně napodobit mimiku a styl mluvy replikované osoby a vytvořit tak v podstatě jeho virtuální kopii, řešení od Samsungu vychází z analýzy velkého množství náhodně mluvících lidí, jejichž pohyby a mimika jsou následně do obrazu aplikovány.
Díky neexistenci videozáznamů tak v tomto případě nikdo nemůže vědět, jak moc je mluvící virtuální kopie přesná. Na videu níže, kteří inženýři Samsungu zveřejnili v rámci své práce, se nicméně můžete podívat, jak dokázali rozpohybovat vedle Mony Lisy i třeba Fjodora Michajloviče Dostojevského, Alberta Einsteina či Marylin Monroe.