Google okouzlil svou umělou inteligencí. Teď ale přiznal, že ukázkové demo bylo nereálné
Umělá inteligence Gemini uměla podle videa velice rychle předpovídat a třeba identifikovat kresby v reálném čase. Záběry ale byly sestříhané.
Technologický gigant Google ve středu představil svou verzi generativní umělé inteligence Gemini a chlubil se, že v testech dokáže porazit konkurenční řešení ChatGPT od společnosti OpenAI. Rovnou navíc zveřejnil video, ve kterém ukazoval, jak člověk dokáže se systémem mluvit a zadávat příkazy v kombinaci s rozpoznáváním obrazu. Zatímco se tyto záběry s modrou kachničkou začaly rychle šířit médii i sociálními sítěmi, později se ukázalo, že Gemini ve skutečnosti funguje jinak.
V šestiminutovém videu Google ukazuje schopnosti umělé inteligence Gemini, která tu dokáže rychle rozpoznávat obrázky a na příkazy reaguje v řádu sekund. Na první pohled se vše zdá být impozantní, například když sleduje papírovou kuličku schovanou pod plastovým kelímkem, tedy klasickou hru skořápky, nebo když rozezná obrázek z teček předtím, než je reálně nakreslený. To by znamenalo, že Gemini umí i předpovídat, a to poměrně rychle.
Google ale přiznal, že video je sestříhané – v popisku videa sdělil, že pro účely ukázky byla snížena latence a výstupy Gemini byly pro stručnost zkráceny. To znamená, že reakční doba umělé inteligence je ve skutečnosti delší. Dál společnost pro agenturu Bloomberg přiznala, že video bylo vytvořeno pomocí statických obrázků ze záznamu a výzev prostřednictvím textu. Tedy ne z videí a mluveného slova.
Ukázka přitom naznačuje, že člověk by mohl s Gemini vést plynulou konverzaci, zatímco umělá inteligence by v reálném čase sledovala a reagovala na okolní svět. Takové schopnosti ale ve skutečnosti nemá. Když se magazín The Verge zeptal na další podrobnosti ohledně validity videa, Google ho odkázal na příspěvek Oriola Vinyalse na sociální síti X (dříve Twitter). Viceprezident pro výzkum a vedoucí oddělení hlubokého učení v DeepMindu, patřícím pod Google, v něm vysvětluje, jak tým video vytvořil.
„Všechny uživatelské výzvy a výstupy ve videu jsou skutečné, zkrácené pro stručnost. Video ilustruje, jak by mohly vypadat vícerežimové uživatelské zkušenosti vyrobené pomocí Gemini. Vytvořili jsme (video), abychom inspirovali vývojáře,“ píše Vinyals, na což další z uživatelů sociální sítě reagoval dotazem: „Pokud chcete inspirovat vývojáře, proč nezveřejníte skutečný obsah?“ A dodal, že video je zavádějící.
Nastartujte svou kariéru
Více na CzechCrunch JobsBloomberg pak v názorovém komentáři popisuje, jak moc Google se svou umělou inteligencí za ChatGPT de facto zaostává. Jeho tvůrce OpenAI před rokem vzal všem vítr z plachet, když chatovacího robota otevřel veřejnosti. Systém si rychle oblíbili i přední čeští byznysmeni a byznysmenky. Google sice kontroval představením vlastní konverzační umělé inteligence s názvem Bard a v létě ji zpřístupnil také v Česku, ale její schopnosti zatím za ChatGPT zaostávaly.
Teď Google ukázal, že Gemini dokáže porazit ChatGPT ve verzi 4 ve většině standardizovaných testů včetně středoškolské fyziky nebo práva. Jak ale píše Bloomberg: „Ve většině benchmarků však Gemini Ultra porazil model GPT-4 jen o několik procentních bodů. Jinými slovy, špičkový model umělé inteligence od Googlu jen těsně vylepšil něco, co v OpenAI dokončili nejméně před rokem.“
„Pokud bude Gemini vydán začátkem ledna, jak Google naznačil, Gemini Ultra nemusí zůstat top modelem moc dlouho. Během doby, co Google doháněl OpenAI, měl ten svižnější hráč téměř rok na to, aby pracoval na svém dalším modelu, GPT-5,“ doplňuje Bloomberg.
Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0
We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP
— Oriol Vinyals (@OriolVinyalsML) December 7, 2023