Přišla tiše a v prestižním testu AI má rekordní skóre. Novinka od Googlu je přitom dostupná všem
Google uvedl nový model Gemini 3.1 Pro, který překonává své předchozí verze a v lecčems i konkurenční systémy. Vyzkoušeli jsme ho v praxi.
Ještě nedávno by uvedení takové novinky provázela velkolepá tiskovka plná reflektorů a nadšených vývojářů na pódiu. Dnes je ale tempo vývoje umělé inteligence tak zběsilé, že na okázalé prezentace zkrátka nezbývá čas. Google vypustil svůj dosud nejpokročilejší model Gemini 3.1 Pro do světa naprosto bez fanfár, a to pouhé tři měsíce po vydání předchozí verze.
Zdánlivě nenápadný krok je zjevně rychlou reakcí na dravou konkurenci, konkrétně na nedávno vydaný model Claude Sonnet 4.6 od společnosti Anthropic, který si u mnoha uživatelů začal vydobývat pověst nového lídra. Ten se svými vychytávkami mířil na vývojáře, analytiky i produktové manažery a představil například týmy autonomních agentů, kteří si mezi sebou dokážou rozdělit práci.
Zato nejzásadnější změnu, kterou u nového Gemini jako uživatel pocítíte, lze podle Googlu popsat jednoduše. Gemini 3.1 Pro přemýšlí déle, ale o to lépe. Model je nyní údajně silnější v logickém uvažování, razantně omezil své halucinace a přináší řadu nových dovedností od detailní analýzy fotografií přes schopnost skládat hudbu až po pokročilé psaní kódu. Jeho hlavním tahákem má být inovativní třístupňový systém uvažování.
Umělá inteligence si nyní podle autorů sama volí, jak moc se nad vaším dotazem „zamyslí“, čímž by měla šetřit váš čas a svou kapacitu. V praxi tedy jednoduché otázky odbaví bleskově, kdežto u těch komplexních si nechá na výpočet klidně i několik minut.
Uživatelé po celém světě začali novinku okamžitě testovat a internet tak už od poloviny týdne plní nejrůznější ukázky. Z jediného textového pokynu dokáže Gemini 3.1 Pro vygenerovat například plně funkční napodobeninu operačního systému Windows 11, která běží přímo v prohlížeči a nechybí jí pracovní plocha, průzkumník souborů, kalendář či nastavení jasu. Přestože podobné kousky zvládaly i starší modely, posun schopností u toho nového je znatelný.
Schopnost bleskově vytvářet webové aplikace a animace jsme v redakci otestovali i my. Zadání, které chatbot obdržel, nebylo vyloženě obsáhlé. „Vytvoř interaktivní aplikaci zobrazující jednotlivé fáze života prasete od narození po dospělost. U každé fáze uveď, jak dlouho trvá a na co by si chovatelé měli dávat pozor.“ Během dvou minut jsme před sebou měli vkusnou a interaktivní webovku, ve které se dalo elegantně proklikávat jednotlivými stádii. Jako výuková pomůcka třeba pro studenty zemědělských oborů naprosto ideální.
A jak si nový Gemini stojí ve srovnání s konkurencí? V prestižním benchmarku ARC-AGI-2, který neměří jen znalosti chatbota uložené v jeho systému, ale skutečnou schopnost řešit zcela nové logické problémy, dosáhl model skóre 77,1 %. Pro srovnání: předchozí verze Gemini uvízla na 31,1 %. Konkurenční Claude Opus 4.6 pak v tomto testu končí na 68,8 % a populární GPT-5.2 od OpenAI se s výsledkem 52,9 % dívá lídrovi na záda z poměrně velké dálky.
Model exceluje také v testu vědeckého uvažování GPQA Diamond (tedy ve vědomostech na úrovni doktorandů), kde se Gemini 3.1 Pro přiblížilo magické hranici 95% úspěšnosti bez použití jakýchkoliv externích nástrojů.
Přesto Google nevyhrává úplně ve všem. V oblasti takzvaného agentního kódování, kdy AI zcela samostatně píše, testuje a opravuje softwarové programy, si prvenství stále drží Opus 4.6 od Anthropicu. Ten poráží ostatní i při zpracovávání obřích objemů dat do tabulek.
Z těchto výsledků tak jasně vyplývá jedna věc. Ultimátní AI nástroj, který by bezkonkurenčně dominoval ve všech myslitelných disciplínách, pořád neexistuje. Modely se neustále dotahují a každý z nich má svá specifická silná místa. Při výběru předplatného proto záleží především na tom, co každý od nástroje očekává. Zda potřebuje hlubokou analytiku a komplexní kódování od Googlu, nebo dává přednost specializovaným schopnostem konkurence.
Dobrou zprávou je, že kvality nového modelu si může vyzkoušet prakticky kdokoliv. Gemini 3.1 Pro je dostupný široké veřejnosti a neplatící uživatelé jej najdou přímo v základní aplikaci Gemini. Předplatitelé tarifů Google AI Pro a AI Ultra získají vyšší limity i pokročilejší funkce, včetně integrace do oblíbeného nástroje NotebookLM. Firmám a vývojářům je zase model k dispozici prostřednictvím platforem Google AI Studio, Vertex AI a Android Studio.