Gemini 3 vám ukáže, jak přemýšlí. A pak vám naprogramuje web a vyrobí videohru či aplikaci na míru

Nová AI od Googlu funguje jako asistent, programátor, grafik i průvodce na výlety v jednom. A poprvé vám dá nahlédnout do svého „uvažování“.

gemini-3-pro
Foto: Filip Houska/CzechCrunch
Gemini 3 Pro
0Zobrazit komentáře

Videohry jsem vždy milovala, ale příroda mi talent na čísla rozhodně nenadělila. Hodiny matematiky a mnohdy i informatiky pro mě byly čistým utrpením a představa, že bych někdy dokázala sama naprogramovat vlastní hru, patřila spíš do říše sci-fi. Tedy až do minulého týdne.

Čistě ze zvědavosti jsem zadala nové verzi umělé inteligence od Googlu netradiční úkol: požádala jsem ji, aby mi pomohla vytvořit hru inspirovanou legendární vánoční reklamou na Kofolu, v níž otec s dcerou prchají před divočákem. Výsledek mě zaskočil.

Během pár okamžiků vznikl první, sice jednoduchý, ale plně funkční prototyp. Model Gemini 3 vygeneroval kompletní kód pro drobnou 2D hru, která místo grafiky využívala emoji a k jejímu spuštění stačil obyčejný Poznámkový blok a webový prohlížeč. Nic světoborného, ale jako odrazový můstek to zafungovalo skvěle.

Gemini se totiž pružně přizpůsoboval mojí rostoucí chuti experimentovat. Když jsem chtěla propracovanější verzi, okamžitě připravil základní 3D variantu z jednoduchých tvarů, která stále běžela v prohlížeči. A když jsem zatoužila po profesionálnějším dojmu, začal mě krok za krokem provádět složitějším herním enginem Unity. Kdykoliv jsem se ztratila, stačilo poslat screenshot obrazovky a AI mi přesně ukázala, kam kliknout.

Právě tak vypadá čím dál populárnější „vibe coding“ v praxi: já popíšu atmosféru a vizi, umělá inteligence ji přivede k životu. A tak začal můj několikahodinový ponor do nového nástroje, který Google prezentuje jako svou hlavní odpověď na konkurenční ChatGPT. A výsledek? Rozhodně nejde o drobnou aktualizaci, kterou byste měli jen tak přejít. Gemini 3 má potenciál reálně pomoci uživatelům nejen v osobním životě, ale i v tom profesním.

Od nápadu k fungující aplikaci v řádu minut

Největší inovací je bezesporu zmíněný „vibe coding,“ tvorba webů či jednoduchých aplikací a prezentací pouhým popisem pocitu či vize. Gemini 3 dramaticky snižuje bariéru mezi myšlenkou a funkčním výsledkem, ať už jste programátor, designér, nebo jen člověk s nápadem.

V jednom z testů jsem zkoušela, zda si Gemini poradí s rychlou tvorbou vzdělávací aplikace. Zadání znělo: hravě a vtipně představit nejpodivnější vánoční jídla z celého světa dětem na druhém stupni. Pro chatbota to nebyla žádná věda. Během pár vteřin vyrobil malou hru, která místo nudného seznamu servíruje stylové kartičky se zábavně podanými fakty.

Stejně užitečný nástroj dokázal připravit i pro firemní prostředí. Cílem bylo vytvořit aplikaci, která zaměstnancům gamifikovanou formou vysvětlí, jak využívat AI v práci. Zhruba za dvě minuty mi Gemini vygeneroval vtipný tréninkový simulátor, který by hravě strčil do kapsy nudné onboardingové prezentace.

Uživatel se v něm ocitl v roli vyčerpaného zaměstnance, který čelí klasickým kancelářským krizím, od zahlcené schránky po urgentní e-maily od šéfa. Úkolem bylo vybrat správnou „AI Prompt Card“, tedy krátký popis toho, jak přesně AI v dané krizové situaci použít, a situaci vyřešit.

bezos-ai

Přečtěte si takéBezos se vrací a začíná od nuly. Jeho projekt už získal miliardyAmazon už neřídí, teď jeho zakladatel Jeff Bezos začíná od nuly. Do své nové umělé inteligence lije miliardy

Schopnost převádět i vágní představy do funkčních prototypů přitom zdaleka neplatí jen pro hry. Když jsem modelu poslala ošklivý, téměř dětský obrázek z Malování s vlastní představou, jak by měl vypadat nový internetový web, během chvíle ho proměnil v čistý a realistický náhled layoutu online média. Nezůstalo přitom jen u vizuálu. Přidal i konkrétní doporučení, jak návrh vylepšit, a nabídl hotové ukázky kódu, které by web skutečně rozhýbaly.

Ne vyhledávač, ale partner s kontextem

Síla Gemini 3 se neukazuje jen u kreativních zadání. Díky pokročilejšímu uvažování přestává být „vyhledávačem na steroidech“ a stává se skutečným asistentem.

Zadala jsem mu zdánlivě jednoduchý úkol: naplánovat výlet na Křivoklát. Podmínky byly specifické, chci ujít asi 25 kilometrů, vyrážím z pražského Karlína a cestou hledám hospodu s opravdu dobrým pivem. Místo strohého seznamu odkazů jsem dostala kompletní itinerář.

Gemini navrhl cestu vlakem do Berouna pro dosažení ideální délky trasy, popsal cestu na nádraží a naplánoval pochod po červeně značené stezce přes Hudlice. Po vlastní rešerši pak vybral restauraci U Jelena, ne náhodně, ale proto, že tam točí pivo Bernard, které vybral jako lépe hodnocené než běžná „europiva,“ a specializují se na zvěřinu, což by výletu na hrad mohlo přidat na atmosféře.

I když se u zvěřiny i přívětivé lokality trefil, u piva se mýlil. Informace o tom, že podnik čepuje bernard, totiž pocházela z roku 2018 a už nebyla aktuální. Přesto ale ukázal, že nejde jen o mechanické plnění úkolů, ale že Gemini 3 dokáže pracovat s kontextem, což ostatně potvrdil i další test: „Zarezervuj večeři pro dva v italské restauraci v Praze na pátek večer s venkovním sezením.“

Nastartujte svou kariéru

Více na CzechCrunch Jobs

Tady se naplno ukázal rozdíl nové generace AI. Gemini si ve svém myšlenkovém pochodu“, do nějž může uživatel nově kdykoli nahlédnout, uvědomil, že v Praze je v danou dobu zima, a proto automaticky hledal jen podniky s vyhřívanou zahrádkou. A přestože sám rezervovat místa v podnicích zatím neumí, připravil kompletní podklady, od seznamu vhodných restaurací přes telefonní čísla až po doporučený způsob rezervace. A jako třešničku na dortu přidal i infografiku s receptem na domácí pizzu pro případ, že by rezervace nakonec nevyšla.

Pohled do „hlavy“ stroje

Právě možnost nahlédnout do samotného procesu uvažování modelu je další ze zajímavých novinek. U složitějších úkolů si Gemini nejprve tiše rozloží problém na menší logické kroky a teprve poté začne pracovat. Uživatel tak může v reálném čase sledovat, jak si AI plánuje postup.

Tento proces se liší podle náročnosti. Zatímco základní režim Thinking funguje jako pomocník pro běžné úkoly, pro extrémně komplexní problémy existuje varianta Deep Think. Google ji popisuje jako úroveň uvažování srovnatelnou s člověkem, který má v daném oboru hlubokou odbornost a akademické zázemí.

Google představil Gemini 3 Pro jako svou novou vlajkovou loď, která má za cíl konečně vystoupit ze stínu ChatGPT. A papírově se mu to daří. Podle zveřejněných testů drtí konkurenci v klíčových disciplínách, jako je logické uvažování, pokročilá matematika a kódování. Například v testu Humanity’s Last Exam dosáhl Gemini 3 Pro přesnosti 37,5 procenta, zatímco GPT-5.1 jen 26,5 procenta a Claude Sonnet dokonce pouhých 13,7 procenta.

Klíčem je multimodalita, schopnost chápat text, obraz, video i zvuk v hlubokých souvislostech. Testy výkonu ale vyprávějí jen polovinu příběhu. Skutečná síla této AI spočívá v její schopnosti proměnit jednoduchý nápad v hotový koncept během minut.

notebooklm-1

Přečtěte si takéVyniká, i tak ho mnozí přehlíží. Jak funguje NotebookLM?V moři AI nástrojů vyniká, i tak ho mnozí přehlíží. Přitom je zdarma a dokáže šetřit hodiny času

I tak má ale Gemini 3 pořád své slabší momenty. Standardní režim se stále dokáže plést a odpovědi, které mnohdy začínají směšným vychválením uživatele za jeho geniální dotaz, bývají občas rozvláčné a plné klišé. Nenahrazuje tak stále lidské myšlení, ale otevírá dveře nápadům, na jejichž vizualizaci byste jinak zřejmě potřebovali experta.

Gemini 3 Pro je už od úterý dostupný všem i v bezplatné verzi, ale jen ve velmi omezeném režimu. Využijí ho tak spíš předplatitelé Google AI Plus (220 korun měsíčně), Pro (549 korun měsíčně) a Ultra (6 890 korun měsíčně), u nichž se limity postupně navyšují. Zmíněný mód Deep Think, který má však podle Googlu disponovat abstraktním myšlením a uvažováním na úrovni lidí s doktorátem, je však zatím dostupný pouze u tarifu Ultra.