Google vydal Gemini 3. Nový model v testech výrazně drtí konkurenci, zvládne lépe uvažovat a je přesnější

Nový AI model Gemini 3 Pro vám podle Googlu odpoví v grafikách i animacích a naplánuje výlet. V testech překonává ostatní, praxe je trochu jiná.

Tomáš ChlebekTomáš Chlebek

gemini-3-pro
Foto: Filip Houska/CzechCrunch
Gemini 3 Pro
0Zobrazit komentáře

Přestože Google patří mezi pár největších technologických firem na světě, jeho umělá inteligence Gemini nemá zdaleka tak zvučné jméno jako ChatGPT od OpenAI. S vydáním nové vlajkové lodi Gemini 3 Pro by se to nicméně mohlo změnit, podle popisu a výsledků testů totiž přeskočila konkurenci prakticky ve všech kategoriích o velký kus. Nový model slibuje pokročilou schopnost uvažování, porozumění nuancím a fakticky přesné odpovědi, ale také komplexní plánování.

Takové oznámení je pro Google zvlášť významné v roce, kdy se GPT-5 od OpenAI setkal s kritikou za příliš suchý akademický přednes a zároveň triviální chyby nebo povrchní odpovědi, které někdy uživatelům předkládal. Nejnovější GPT-5.1 na problémy reagoval vylepšeným adaptivním uvažováním nebo novými osobnostními režimy, v praxi ale podle ohlasů některé problémy, hlavně s hlubším myšlením u složitějších úloh, zůstávají.

Gemini 3 má ve všech těchto oblastech představovat významný pokrok vpřed a technologický gigant má tak šanci konečně více vystoupit ze stínu svého konkurenta. Google na svém blogu cituje celou sérii benchmarků. Například v testu Humanity’s Last Exam, který zkoumá schopnosti uvažování, dosahuje Gemini 3 Pro přesnosti 37,5 procenta, zatímco GPT 5.1 jen 26,5 procenta. Claude Sonnet pak pouze 13,7 procenta.

Umělá inteligence Googlu technicky konkurenci nechává daleko za sebou také v úlohách testujících vizuální uvažování – v testu ARC-AGI-2 získala 31,1 procenta, zatímco GPT-5.1 dosáhl jen na 17,6 procenta. Výrazně lepší je dále například v získávání znalostí z videí, kdy Gemini 3 Pro v testu Video-MMMU získalo 87,6 procenta, kdežto GPT-5.1 se dostal na 80,4 procenta.

Největší předností modelu od Googlu má být multimodalita, tedy schopnost komplexně pracovat s kombinacemi textu, obrázků, videa i zvuku. To je do určité míry vlastní i ChatGPT, který se na kombinacích různých typů dat trénoval od začátku, novinka od Googlu ale slibuje porozumění vstupům na hlubší úrovni a zároveň má být schopna generovat mnohem kreativnější odpovědi. Například má zvládnout přepsat obrázky receptů a vytvořit kuchařku. Nebo vytvořit interaktivní karty vycházející ze série videozáznamů přednášek.

„Za dva roky se umělá inteligence posunula od prostého čtení textu a obrázků ke schopnosti dokonale ‚přečíst situaci‘,“ uvádí Google na svém blogu. Zatímco GPT-5.1 odpovídá primárně v textové formě, Gemini 3 Pro má častěji nabízet různé vizuální pomůcky jako tabulky, grafy, krátká videa s animací a podobně. Firma také testuje tzv. „Dynamic View“, který dokáže výsledky prezentovat ve formě samostatně naprogramované webové stránky s interaktivními prvky, obrázky a tak dále.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

Podobně se má nový model chovat přímo ve vyhledávání přepnutém do AI módu – také zde máme očekávat vizuální prvky jako obrázky, tabulky, přehledy a simulace. Zároveň zvládá dotazy rozdělit na menší smyslupné kousky, a při tom lépe pochopit záměr dotazu a pochytit významy, jaké by mu v minulosti unikly.

Na rozsáhlejší praktické testy bude třeba ještě počkat, ale první zkušenosti naznačují trochu jiné výsledky než čísla benchmarků. Respektive z nich vyplývá, že posun není tolik radikální – testy totiž měří specifické dovednosti, ne reálné chování při běžném používání. V odpovědích se tak například objevuje více vizuálních pomůcek než u ChatGPT, ale oba modely jsou v závěru v zásadě srovnatelné.

Podobné závěry zatím naznačují zkušenosti s uvažováním Gemini 3 Pro. Zatímco nejvyšší mód Deep Think, dostupný pouze předplatitelům Google AI Ultra, v praxi skutečně zvládá multimodální úlohy a práci s vizuálními daty lépe, standardní režim Thinking dělá chyby a vymýšlí si.

Přestože Google slibuje méně lichocení a snahu se podbízet, v praxi jeho tvrzení tak docela neodpovídají realitě nebo se objevují jiné nedostatky. Gemini 3 Pro například někdy odpovídá zbytečně rozsáhle, chybí mu lepší dedukce při psychologických dotazech nebo používá klišé i když je explicitně vyzván, aby se jim vyhnul. Třeba u velmi náročných matematických úloh ale podává výrazně lepší výsledky než ChatGPT nebo jiné modely.

Obecně zatím podle všeho platí, že mód Deep Thinking skutečně překonává konkurenci u velmi náročných úloh, většina uživatelů ale při každodenním používání příliš výrazný posun nezaznamená nebo se objeví trochu jiné problémy než jinde. Klíčovým slovem je přitom konzistence, kterou odhalí až dlouhodobější zkušenosti.

Google poprvé zveřejňuje rovnou Gemini 3 Pro, a to na webu, v aplikaci i při vyhledávání v AI módu. U všech uživatel nový model aktivuje, když systém při zadávání dotazu manuálně přepne z „Rychlého“ (který stále pracuje s Gemini 2.5) na „Thinking“. Ten pak automaticky zvolí nejefektivnější prostředek a formu odpovědi. Gemini 3 Pro se přitom hodí na složitá témata, která mohou vyžadovat porozumění nuancím, kreativitu nebo hluboké logické uvažování a dedukci.

Poslední velkou funkcí, která je zatím v experimentálním režimu pod názvem Gemini Agent a do budoucna by mohla skutečně změnit poměry na trhu umělé inteligence, je komplexní plánování. Nový model má zvládat zpracovat složitý pokyn – třeba najít italskou restauraci v centru města s volným stolem v přesném termínu – a rovnou podle něj jednat. To znamená, že sám rezervuje stůl, vyřeší vše podstatné kolem a nabídne rovnou hotový plán. Tím se Google snaží posouvat blíže k vizi univerzálního AI asistenta.

Gemini 3 Pro je dostupný všem i v bezplatné verzi, ale jen ve velmi omezeném režimu. Využijí ho tak spíš předplatitelé Google AI Plus (220 korun měsíčně), Pro (549 korun měsíčně) a Ultra (6 890 korun měsíčně), u nichž se limity postupně navyšují. Zmíněný mód Deep Think, která má disponovat abstraktním myšlením a uvažováním na úrovni lidí s doktorátem, je dostupný pouze u tarifu Ultra.