Grog, Grok… Groq! Na Nvidii dotírá výrobce čipů, který chatbotům dovoluje zařadit vyšší rychlost
Fenomenální byznysový úspěch výrobce čipů Nvidia přitahuje pozornost k menším startupům, jako je Groq. Jeho čipy chatboty dost zrychlují.
Jonathan Ross stál u zrodu čipů Tensor, které si vyvinul a vyrábí Alphabet, mateřská společnost Googlu. Před osmi lety se ale rozhodl osamostatnit, v hlavě měl totiž novou křemíkovou architekturu – a s tou nyní slaví úspěchy, protože se hodí pro velké jazykové modely, jako je ChatGPT. Ty jsou s ní mnohem, ale mnohem rychlejší.
Ross svou společnost pojmenoval Groq. Jde o narážku na sci-fi román Roberta Heinleina Cizinec v cizí zemi. Výrazně tedy předběhl Elona Muska, který se ve stejné knize a stejným slovem inspiroval pro název umělé inteligence Grok, jíž vyvíjí jeho společnost xAI. S názvem populárního alkoholického nápoje ovšem nic z toho nesouvisí.
A stejně jako způsobil velké pozdvižení Musk, když veřejnosti ukázal, co má jeho Grok umět (a co bylo hodně marketingově přifouknuté), v AI kruzích se už několik dní intenzivně řeší i výkony Groqu. Ten ale míří někam jinam – vyzývá čipové krále z Nvidie, která díky boomu AI hlásí rekordní zisky a dramaticky jí stoupá hodnota akcií.
Čipy od Nvidie jsou klíčové pro cloudové poskytovatele, jako jsou Microsoft, Amazon, Meta či Alphabet. Právě jejich datová centra se používají pro trénování a pohánění velkých jazykových modelů, které potřebují obří počítačový výkon při řešení výpočetních úkolů. A grafické čipy od Nvidie známé pod zkratkou GPU jsou na tohle nejvhodnější, takže jí nyní patří přes 80 procent trhu.
Nastartujte svou kariéru
Více na CzechCrunch JobsRossův Groq má k dispozici čipy, které sice nejsou tak vhodné pro trénování umělé inteligence, ale pro její následný provoz už ano – a to výrazně. Jazykové modely na nich fungují mnohem rychleji, ostatně čipy jsou postavené tak, aby sloužily právě tomuto účelu (ty od Nvidie jsou primárně grafické karty). Po CPU a GPU tak přichází LPU (zkratka pro Language Processing Unit).
Jak moc je Groq rychlý, si může každý snadno vyzkoušet na jeho webovém rozhraní. Když jsme si na něm cvičně dali prompt „What are specifics of landing on the Moon?“, tedy „Jaká jsou specifika přistání na Měsíci?“, odpověď na webu Groqu se objevila v podstatě okamžitě, zatímco v ChatGPT pozorujete, jak slova přibývají, jako by je psal průměrný zdatný pisatel na klávesnici.
Kvalita odpovědi byla v obou případech podobná, Groq používá jazykový model Llama od Mety nebo Mixtral od evropského startupu Mistral AI. Rychlost, kterou slibuje, nás pak přibližuje real-time nasazení nástrojů umělé inteligence, která ale zatím v reálném čase moc pracovat neumí.
Prvním investorem Groqu byl už v roce 2016 fond Social Capital známého technologického průkopníka Chamatha Palihapitiyi. Ten nyní ve svém podcastu All-In prohlásil: „Ozývá se nám většina firem z žebříčku S&P 500 a chtějí čipy.“ Jde o to, že šílenství, které se kolem umělé inteligence rozpoutalo, a související nedostatek čipů od Nvidie pohání zájem o startupy, jako je Groq.
Jenže vládce oboru Nvidia se nechce poddat snadno. Jak nedávno řekl Ross pro americký deník Wall Street Journal: „Řada lidí, se kterými se potkáme, nám říká, že kdyby se to dozvěděla Nvidia, měli by problém. Musíte jim zaplatit rok předem, a když se pak dozví, že jednáte s někým jiným, řeknou, že dodávka se zpozdí.“
Výhodou Groqu má být i to, že při produkci čipů, které si začíná vyrábět sám v USA, není závislý na dodavatelích z Asie. A právě diverzifikace a obava firem, které se snaží v umělé inteligenci podnikat, z přílišného vlivu malého množství klíčových dodavatelů, jako je Nvidia nebo OpenAI, je velkým tématem technologického světa.
Ostatně dokonce i Microsoft, který drží výrazný podíl v OpenAI, si to uvědomuje. Jednak navázal spolupráci s americkým Intelem, jednak si domluvil partnerství včetně menší investice se zmíněným ambiciózním francouzským startupem Mistral AI. Ten existuje zhruba rok a jeho valuace už přesahuje dvě miliardy dolarů. Právě jeho otevřený jazykový model Mixtral na svém webu používá i Groq na ukázku toho, co jeho čipová architektura dokáže.