Google okouzlil svou umělou inteligencí. Teď ale přiznal, že ukázkové demo bylo nereálné
Umělá inteligence Gemini uměla podle videa velice rychle předpovídat a třeba identifikovat kresby v reálném čase. Záběry ale byly sestříhané.
Technologický gigant Google ve středu představil svou verzi generativní umělé inteligence Gemini a chlubil se, že v testech dokáže porazit konkurenční řešení ChatGPT od společnosti OpenAI. Rovnou navíc zveřejnil video, ve kterém ukazoval, jak člověk dokáže se systémem mluvit a zadávat příkazy v kombinaci s rozpoznáváním obrazu. Zatímco se tyto záběry s modrou kachničkou začaly rychle šířit médii i sociálními sítěmi, později se ukázalo, že Gemini ve skutečnosti funguje jinak.
V šestiminutovém videu Google ukazuje schopnosti umělé inteligence Gemini, která tu dokáže rychle rozpoznávat obrázky a na příkazy reaguje v řádu sekund. Na první pohled se vše zdá být impozantní, například když sleduje papírovou kuličku schovanou pod plastovým kelímkem, tedy klasickou hru skořápky, nebo když rozezná obrázek z teček předtím, než je reálně nakreslený. To by znamenalo, že Gemini umí i předpovídat, a to poměrně rychle.
Google ale přiznal, že video je sestříhané – v popisku videa sdělil, že pro účely ukázky byla snížena latence a výstupy Gemini byly pro stručnost zkráceny. To znamená, že reakční doba umělé inteligence je ve skutečnosti delší. Dál společnost pro agenturu Bloomberg přiznala, že video bylo vytvořeno pomocí statických obrázků ze záznamu a výzev prostřednictvím textu. Tedy ne z videí a mluveného slova.
Ukázka přitom naznačuje, že člověk by mohl s Gemini vést plynulou konverzaci, zatímco umělá inteligence by v reálném čase sledovala a reagovala na okolní svět. Takové schopnosti ale ve skutečnosti nemá. Když se magazín The Verge zeptal na další podrobnosti ohledně validity videa, Google ho odkázal na příspěvek Oriola Vinyalse na sociální síti X (dříve Twitter). Viceprezident pro výzkum a vedoucí oddělení hlubokého učení v DeepMindu, patřícím pod Google, v něm vysvětluje, jak tým video vytvořil.
„Všechny uživatelské výzvy a výstupy ve videu jsou skutečné, zkrácené pro stručnost. Video ilustruje, jak by mohly vypadat vícerežimové uživatelské zkušenosti vyrobené pomocí Gemini. Vytvořili jsme (video), abychom inspirovali vývojáře,“ píše Vinyals, na což další z uživatelů sociální sítě reagoval dotazem: „Pokud chcete inspirovat vývojáře, proč nezveřejníte skutečný obsah?“ A dodal, že video je zavádějící.