Ještě nepoužíváte generativní umělou inteligenci, ale chtěli byste? Nevyznáte se v záplavě neustálých novinek, které se ohledně ní valí ze všech stran snad každý den? Připravili jsme tahák, který vám pomůže se zorientovat. Není to vyčerpávající seznam všech existujících nástrojů, ale výběr programů, které jsou uživatelsky přístupné, často stačí pro malé úkoly běžného dne a jsou ochutnávkou toho, co tato technologie dovede.

Šéf firmy OpenAI Sam Altman nazval nástup generativní umělé inteligence nejrychlejší průmyslovou revolucí historie. Loni měl celosvětový trh s AI podle serveru Statista hodnotu 142,3 miliardy dolarů (v přepočtu 3,2 bilionu korun) a čtvrtina veškerých startupových investic v USA šla firmám spojeným s touto technologií, což je podle webu Coinbase dvojnásobek oproti roku 2022.

Podoba programů generativní AI, zřejmě nejžhavější technologie dneška, je přitom z uživatelského pohledu vcelku jednoduchá. Napíšete zadání nebo otázku a systém vám odpoví – ať už textem, obrazem, zvukem nebo i videem. Hodně z nich lze navíc minimálně v omezeném režimu vyzkoušet zdarma.

Pro ty z vás, kteří by se chtěli ponořit do nepřeberného množství všech různých nástrojů, jež generativní AI využívají, existuje spousta detailních seznamů. Doporučit můžeme třeba stránku AIXploria, na které jde software vyhledávat třeba podle zaměření nebo oblíbenosti, kromě toho nabízí i tipy ohledně používání AI. Pro ty, kdo se potřebují v tématu vyznat a hledají jen výběr toho nejužitečnějšího, jsou následující odstavce.

Kde jinde začít než u asi nejznámějšího textového generátoru: ChatGPT. Celý aktuální boom v podstatě začal u tohoto programu od OpenAI, když ho startup Sama Altmana představil na podzim roku 2022. Je také jedním z univerzálních nástrojů. Pohání ho jazykové modely GPT, které následně využívá i mnoho jiných programů. Zvládne pomoct s drtivou většinou úkolů.

K jeho použití je potřeba vytvořit účet, pak už je zdarma k dispozici model GPT-3.5. To je sice starší sourozenec nejnovější verze GPT-4, ale se základními úkoly si poradí. Verze s číslem čtyři velkého jazykového modelu je pak k dispozici za dvacet dolarů měsíčně (zhruba 460 korun). V rámci předplatného ChatGPT Plus navíc dostanete přístup k GPT-4 i k obrazovému generátoru DALL·E, ale k tomu později.

K čemu se ChatGPT hodí? Třeba k tomu, pokud jako autor tohoto textu po dlouhém pracovním týdnu tápete, co podniknout o víkendu. Stačí se chatovacího robota zeptat, klidně i česky, a odpovědí může být třeba seznam podobný tomu, který vidíte na snímku výše. Obecně je to šikovný nástroj pro brainstorming, kdy člověk potřebuje impuls nebo popostrčit k nějakému nápadu. Anebo dokáže udělat solidní shrnutí delšího textu či napsat formální e-mail.

Pokud se vám za nejnovější modely od OpenAI platit nechce, můžete je využít přes program Copilot od Microsoftu. Na umělou inteligenci od Altmanova startupu totiž známá technologická firma jako největší investor OpenAI spoléhá také. K jejímu využití je opět potřeba mít založený účet, po jeho zřízení ale máte k modelu GPT-4 přístup zdarma.

Postup je pak v podstatě stejný jako v ChatGPT. Do příslušného místa napíšete textové zadání, podobně jako při klasickém vyhledávání na internetu, a systém vám odpoví. Copilot poháněný GPT-4 má přístup k internetu, takže se můžete ptát i na aktuální otázky a v odpovědích budou obsaženy odkazy na zdroje informací. ChatGPT a Copilot jsou dostupné i ve formě mobilní aplikace.

Stále ale platí, že je důležité brát výtvory generativní AI s rezervou a kvalitu uvedených údajů neustále kontrolovat. Někdy se například stává, že systém sebevědomě napíše informaci, ke které nabídne i odkaz na internetovou stránku, takže to celé působí velmi věrohodně. Jenže po kliknutí na odkaz zjistíte, že stránka buď neexistuje, nebo dané tvrzení na ní vůbec není.

V podstatě stejně jako předchozí dva programy funguje i umělá inteligence od dalšího velkého technologického hráče, Googlu. Ten svou AI nedávno přejmenoval z Barda na Gemini a lze ji s účtem od Googlu použít zdarma. Mezi další známé textové generátory patří i Claude od amerického startupu Anthropic, který je dostupný za podobnou částku jako ChatGPT.

Programy, které vytvoří vlastní snímky, jsme už zmínili. Některé jsou dnes zabudované do programů, jako je ChatGPT nebo Copilot. Tam je aktivujete opět prostým zadáním textu. Trendem dneška je totiž v generativní AI takzvaná multimodalita, tedy schopnost programů poradit si s různými typy zadání.

V předplatném ChatGPT Plus tak můžete během jedné konverzace programu klást otázky, ale i psát zadání k tvorbě snímků, o které se stará obrazový generátor DALL·E opět od OpenAI. Ten je k dispozici také u již zmíněné služby Copilot od Microsoftu. S ním vytvoříte nejen ilustraci lyžujícího bernardýna, kterou můžete vidět níže.

Čím je ale ChatGPT mezi textovými generátory, tím je mezi těmi obrazovými Midjourney. Jeho snímky na začátku působily směšně, kdy uměle vytvořeným lidem chyběly končetiny nebo měli znetvořené obličeje. S každou novou verzí se ale zlepšuje a nyní dokáže vytvořit třeba i falešný obrázek papeže Františka, kterému naletěla řada lidí na internetu. Základní, velmi omezená verze začíná na deseti dolarech za měsíc (v přepočtu více než dvě stě korun). Je k ní potřeba mít založený účet na síti Discord, ale nově lze použít i v pohodlnějším rozhraní.

Generátor obrázků ve své umělé inteligenci Gemini má i Google. Její obrazotvorné schopnosti ale po nedávné epizodě, kdy uživatelé ve Spojených státech s její pomocí vytvářeli historicky nepřesné snímky, technologický obr pozastavil. Místo Gemini lze nyní zdarma alespoň v omezeném režimu ve webovém rozhraní vyzkoušet třeba obrazový generátor Stable Diffusion od Stability AI nebo službu Firefly od Adobe.

Jak už jsme uvedli, programů na bázi generativní AI vzniká nepřeberné množství a tento text je pouhou ochutnávkou toho, co nabízí. Dalším milníkem odvětví má být široká dostupnost generátorů videa. Takový program s názvem Sora před nedávnem představilo OpenAI, které má software, jenž zatím dokáže vytvořit originální klip dlouhý až 60 vteřin, v plánu zpřístupnit veřejnosti ještě letos. Jeho schopnosti si můžete prohlédnout níže.

Už nějakou dobu je nicméně možné nechat generovat krátká, několikavteřinová videa podle textového popisu i přes nástroj od Runway AI, dalšího startupového jednorožce světa umělé inteligence.

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) February 15, 2024