Čínský DeepSeek představil konkurenci pro ChatGPT. Co všechno dokáže a proč vzbudil takový rozruch?
Čínský startup DeepSeek využil starší čipy od Nvidie k vytvoření umělé inteligence, která s velmi nízkými náklady konkuruje technologickým gigantům.
Mladý čínský startup DeepSeek vzbudil rozruch v technologickém světě, když před pár dny představil své modely umělé inteligence DeepSeek-R1 a DeepSeek-V3. Ty zatím dosahují výsledků srovnatelných s produkty technologických gigantů, jako jsou OpenAI nebo Google, ale za pouhý zlomek nákladů. Zároveň jsou díky open-source licenci dostupné zdarma a byly vyvinuty s využitím starších a méně náročných čipů od Nvidie, jejíž hodnota kvůli tomu včera spadla o stovky miliard dolarů. Shrnujeme pět základních bodů, které byste o čínském modelu měli vědět.
Co jsou DeepSeek-R1 a DeepSeek-V3?
DeepSeek-R1 je pokročilý model umělé inteligence, který se specializuje na matematické uvažování, generování kódu a řešení komplexních logických úloh. Je navržen tak, aby konkuroval dosavadním špičkovým hráčům, jako je třeba celosvětově využívaný ChatGPT.
DeepSeek-V3 je pak model, který pohání samotnou aplikaci asistenta umělé inteligence. Obě varianty vznikly s překvapivě nízkými náklady – jejich rozpočet nepřesáhl šest milionů dolarů, zatímco poslední verze ChatGPT-4 byla údajně vytvořena s náklady ve výši 41 až 78 milionů dolarů.
Kdo je vyvinul?
DeepSeek je čínská výzkumná laboratoř zaměřená na umělou inteligenci. V květnu 2023 ji založil čínský miliardář Liang Wen-feng jako dceřinou společnost hedgeového fondu High-Flyer. Ten je jejím jediným majitelem a také investorem. Společnost má zaměstnávat špičkové talenty z čínských univerzit a klást důraz na maximální využití domácích zdrojů.
Na základě čeho modely fungují?
DeepSeek-V3 byl vycvičen pomocí pouhých 2 048 grafických čipů staršího typu H800 od Nvidie, které jsou méně náročné na energii i data než ty, jež využívají nejběžnější modely AI západních společností. Zároveň jde o čipy, jež splňují přísné exportní podmínky USA, které mají z pohledu Washingtonu omezit čínský vývoj v jistých odvětvích, například v rozvoji jaderných zbraní nebo právě umělé inteligence.
Jejich využití nejenže postavilo tuto dlouho zpochybňovanou strategii nejspíš definitivně na hlavu, ale také významně srazilo cenu nových modelů a zatřáslo jak s hodnotou Nvidie, která na prodeji výkonných čipů pohádkově bohatne, ale i rozproudilo debatu o smyslu obřích investic do AI. Pro představu – firmy jako OpenAI potřebují k vývoji svých modelů běžně vyšší tisíce dražších čipů. DeepSeek-V3 má také využívat rozsáhlé techniky posilování učení skrze zpětnou vazbu, vícestupňového trénování nebo víceúrovňové pozornosti.
Oba modely byly ještě během pondělka zdarma dostupné na webu a prostřednictvím mobilní aplikace DeepSeek AI Assistant, kterou bylo možné stáhnout na Apple Storu i na Play Storu od Googlu. Jejich využívání nicméně vyžadovalo registraci, buď skrze účet v čínské aplikaci WeChat, nebo e-mailem. Během pondělí se ale kvůli vysokému náporu nových registrací aplikace potýkala s technickými problémy a nově příchozí uživatele omezila jen na pevninskou Čínu. V Česku je proto nyní služba dostupná většinově jen skrze VPN.
Modely DeepSeeku jsou přitom celosvětově uvolněny jako open-source pod licencí MIT, což umožňuje jejich volné používání a úpravy výzkumnými institucemi nebo jednotlivci. Varianty jsou také dostupné na platformě Hugging Face, která se zaměřuje na vývoj a sdílení nástrojů pro strojové učení.
V čem se liší od ChatGPT?
Produkty DeepSeek jsou sice konkurenty modelů od OpenAI, v některých klíčových ohledech se ale liší. Po tréninku pomocí učení skrze zpětnou vazbu prý získaly například schopnosti uvažování – na rozdíl od tradičních modelů, které jsou většinou závislé na upravování finálního výstupu pod dohledem uživatele.
A liší se i tím, že jsou plně open-source, zatímco modely OpenAI nikoli – za plné využívání ChatGPT Plus si uživatel musí zaplatit 25 dolarů měsíčně, za nejnovější verzi ChatGPT 01 pak dokonce 200 dolarů měsíčně.
Proč DeepSeek všechny zaskočil?
Zmíněná aplikace DeepSeek AI Assistant se dostala na první místo v žebříčku bezplatných stažení na App Storu v USA a patří zároveň mezi nejstahovanější aplikace pro produktivitu v Play Storu od Googlu. Modely dosáhly vysokých hodnocení v různých benchmarkových testech – Chatbot Arena v současné době řadí model R1 jako třetí nejlepší existující model umělé inteligence, přičemž o1 od ChatGPT je na čtvrtém místě.
I proto si teď DeepSeeku všimlo mnoho lidí z technologického průmyslu. Právě v něm modely mnohé šokovaly – v pondělí se na propadly hodnoty akcií společností jako Microsoft, Tesla, Nvidia i Broadcom. Technologická burza Nasdaq klesla o 3,5 procenta a zaznamenala třetí nejhorší den za poslední dva roky.
Někteří odborníci se domnívají, že dosavadní úspěch DeepSeeku zpochybňuje obrovské zdroje, které americké společnosti vynaložily na vývoj své umělé inteligence. Jiní zase naznačují, že by DeepSeek mohl představovat hrozbu pro americké akciové trhy a ovlivnit tamní budoucí investice do AI. Představitelé technologického průmyslu se zatím k tvrzením čínské společnosti staví spíše skepticky, i kvůli tak náhlému a nečekanému spuštění obou modelů.