Nový Claude je venku a míří nejen na vývojáře. Dostal AI agenty, kteří mají spolupracovat jako tým

Firma Anthropic šlape na paty OpenAI. Představila novou verzi Clauda, který se pyšní takzvanými agent teams a přesunem k „vibe workingu“.

David ZlomekDavid Zlomek

Návrh bez názvu – 1
Foto: Filip Houska/CzechCrunch / Anthropic
Claude od Anthropicu
0Zobrazit komentáře

Ještě před pár lety ke štěstí stačilo, když chatbot odpověděl na otázku nebo dal dohromady e-mail. Dnes už se karta obrací a od umělé inteligence čím dál častěji chceme, aby za nás ty projekty rovnou odpracovala celé, a to od plánování přes realizaci až po finální kontrolu. Přesně do této éry se teď posouvá americký Anthropic se svou novou verzí modelu Clauda Opus 4.6. Že jde o špičku v oboru, dokládá i fakt, že prakticky v tentýž okamžik musela kontrovat konkurenční OpenAI se svým novým modelem GPT-5.3-Codex.

Anthropic ví, pro koho staví svůj produkt. Generální ředitel Dario Amodei už dříve potvrdil, že asi 80 procent byznysu jeho společnosti pokrývají firemní klienti a pouze 20 procent spotřebitelé, což je třeba oproti činnosti konkurenční OpenAI extrémní rozdíl. Firmy a pracovní týmy řeší s Claudem programování, analýzy nebo práci s tunami dokumentů. Nová verze Opus 4.6 je ale posunem i pro běžného uživatele. Co konkrétně přináší?

Výkon nejen pro vývojáře

Anthropic prezentuje Opus 4.6 jako svůj dosud nejschopnější model. Podle vlastních firemních dat dosahuje nejlepších výsledků v testech zaměřených na takzvanou znalostní práci – tedy úkoly z oblasti financí, práva, výzkumu nebo vývoje softwaru. V testu, který napodobuje běžnou kancelářskou práci, vychází Claude Opus 4.6 údajně lépe než konkurence včetně ChatGPT a výrazně překonává svou starší verzi.

Velký dopad to má mít na AI asistenta pro vývojáře s názvem Claude Code. V souvislosti s ním Scott White, šéf produktového oddělení v Anthropicu, vypichuje jeden trend: „Claude Code používají i lidé, kteří nejsou profesionální vývojáři, prostě proto, že je to skvělý nástroj na práci.“ Z modelu zaměřeného na kódování se tak podle něj stal univerzální pomocník pro analytiky i produktové manažery. Opus 4.6 by měl do Claude Code přinést méně chyb, a tudíž i menší potřebu lidského dohledu.

Týmy agentů místo jednoho „mozku“

Jednou z největších novinek jsou takzvané agent teams, což jsou týmy autonomních agentů, kteří si mezi sebou dokážou rozdělit práci. Dosud většina chatbotů fungovala jako jeden celek, který postupoval krok za krokem. Nově může Claude rozsáhlý úkol rozsekat na části a řešit je paralelně.

Scott White to přirovnává k situaci, kdy máte k dispozici tým schopných lidí, z nichž každý dělá na svém, ale spolupracují. V praxi se to hodí třeba při analýze stovek dokumentů, kdy jeden agent hledá chyby, druhý navrhuje řešení a třetí kontroluje výstup. Výsledkem je vyšší rychlost a méně přehlédnutých detailů.

grok-gemini-ipad

Přečtěte si takéChatboti si vyzkoušeli přijímačky na střední. Muskova AI pohořelaJak si umělá inteligence poradila s přijímačkami na střední? Gemini překvapil, Grok by šel na učňák

Konec zapomínání v dlouhých projektech

Dlouhodobým problémem chatbotů bylo postupné zhoršování výsledků, jakmile konverzace nebo projekt trvaly příliš dlouho. Starší informace se prostě ztratily v záplavě nových dat a model začal zmatkovat. Opus 4.6 si dokáže najednou udržet v paměti velké množství textu, a to v rámci stovek stran. Když už je informací moc, sám si ty starší průběžně shrnuje, aby se v nich neztratil. Pro uživatele to znamená, že s ním může pracovat celé dny nebo týdny na jednom projektu, aniž by mu musel pořád připomínat, co už spolu řešili.

Od vibe codingu k „vibe workingu“

Zatímco loni byl hitem takzvaný vibe coding, tedy model, kdy stačí svou představu popsat v podstatě vlastními slovy a Claude to naprogramuje, Scott White mluví o přesunu k „vibe workingu“. Nejde už jen o psaní kódu, ale o delegování celých agend. Claude podle něj už nečeká na detailní instrukce pro každý dílčí krok, ale díky adaptivnímu myšlení sám pozná, kdy se má do problému pořádně zakousnout a kdy stačí obyčejnější odpověď.

Klíčem k této autonomii je nový parametr effort. V praxi to podle recenzentů, kteří si Opus 4.6 vyzkoušeli, funguje tak, že Claudovi zadáte, kolik energie má do úkolu investovat, a zbytek necháte na něm. Místo abyste mu diktovali postup, prostě mu svěříte cíl. On pak v roli jakéhosi digitálního projektového manažera sám sestaví plán, rozdělí práci mezi své agenty a vám pak doručí až hotový výsledek.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

AI přímo v kancelářských nástrojích

Posledním zásadním posunem je integrace Clauda přímo do softwaru, ve kterém se v kancelářích tráví většina času. Opus 4.6 je nově součástí PowerPointu jako postranní panel, lépe spolupracuje s Excelem a zvládá komplexní práci s dokumenty. Dříve jste museli AI požádat o vytvoření prezentace a pak ji ručně upravovat. Nově může celý proces probíhat přímo v aplikaci, Claude čte rozvržení snímků, fonty i firemní šablony a drží se vizuální identity. V Excelu zase zvládá plánovat vícekrokové úpravy tabulek nebo strukturovat neuspořádaná data.

anthropic
Foto: Anthropic
Spoluzakladatelé Anthropicu Dario Amodei (CEO) a Daniela Amodei

Boj s OpenAI pokračuje

Téměř ve stejnou dobu přišla s novinkou i konkurenční OpenAI, která představila zmiňovaný model GPT-5.3-Codex. Ten míří především na profesionální vývojáře a technické týmy, které potřebují stabilní a dlouhodobě spolehlivý nástroj pro vývoj, testování a správu softwaru. Pro laika je nejzajímavější to, že OpenAI uvedla, že Codex byl poprvé v historii firmy využit i při vlastním tréninku, ladění a nasazování. Model tak do určité míry pomáhal vytvářet sám sebe. Zatímco Codex funguje spíš jako precizní a předvídatelný specialista pro programátory, Claude míří na širší spektrum znalostní práce od analýz po kancelářskou agendu.

Načasování obou oznámení přitom není náhodné: podle deníku The Wall Street Journal nedávné novinky a průniky Anthropicu dokázaly dát firmě do určité míry náskok před konkurencí. OpenAI tak zareagovala vlastním modelem optimalizovaným pro vysokou spolehlivost a výkon, což jen ukazuje, že oba tábory dnes velmi často dělají podobné kroky a vzájemně se tlačí kupředu.