Gemini od Googlu vám složí píseň na počkání. Proč cenzuruje bobry a v čem zatím zaostává za konkurencí?

Od normalizačního popu po ódu na syrečky. Test nové hudební AI od Googlu odhalil špičkovou kvalitu hlasu, ale i tuhou cenzuru a malý talent na rýmy.

gemini
Foto: Google / CzechCrunch
Hudební model Lyria 3 v Gemini
0Zobrazit komentáře

„Jsem mimo Gemini, nový svět je přede mnou. S novými možnostmi a novou realitou. Učím se, rostu, prozkoumávám neznámé. Jako nový nástroj, mé cíle jsou nesmírné,“ zní zhruba třicetivteřinová skladba v žánru synth-popu.

Za kýčovitě pozitivní melodií s textem, který jako by vypadl z příruček pro autory normalizačních hitů, nestojí muzikant ani producent, ale model Lyria 3, kterým Google Gemini odpovídá na populární hudební generátory jako americké Suno.ai. Nejde přitom o další skrytý experiment pro vyvolené. V únoru 2026 se nástroj zpřístupnil zdarma všem uživatelům starším osmnácti let přímo v rozhraní aplikace Gemini.

Cesta k ní vede přes desktopovou verzi, kde v rozbalovací nabídce nástrojů stačí vyhledat ikonu noty. Zatímco mobilní verze se očekává v nejbližších dnech, nástroj už nyní komunikuje v osmi světových jazycích včetně češtiny, angličtiny, japonštiny či španělštiny, přičemž další lokalizace mají postupně přibývat.

Celý princip fungování je, jak je u nástrojů od Googlu zvykem, přímočarý. Do systému vložíte prompt v podobě textu, obrázku nebo třeba videozáznamu a Lyria na jeho základě vygeneruje půlminutovou stopu, u které můžete definovat styl, tempo i charakter vokálu.

Zásadním posunem je schopnost modelu psát si vlastní texty, což z něj má dělat ideálního parťáka pro tvůrce videí, kteří hledají originální podkres. Každý výsledek je navíc opatřen neviditelným digitálním otiskem SynthID, jenž skladbu trvale identifikuje jako dílo umělé inteligence. Skutečná zábava ovšem začíná ve chvíli, kdy teorii z líbivých PR zpráv vystřídá praxe.

Nástroj nabízí šablony od devadesátkového rapu až po reggaeton. Právě ten se stal základem pro náš absurdní pokus: donutit umělou inteligenci stvořit líbivou ódu na české zlato, tradiční olomoucké syrečky. Po minutě výpočtů se však k našemu překvapení z reproduktorů ozval španělsky zpívající hlas, který s patřičným zápalem rozjel latinskoamerickou rytmiku, v níž z původního zadání zůstalo jen s těžkým přízvukem vyslovované slovo „syrečky“ v refrénu.

Teprve po opakovaném urgování a následném vysvětlení chatbota, že některé šablony pro tvorbu hudby mají pevně daný jazyk výstupu, se nám podařilo vygenerovat českou verzi. Ačkoliv rýmy v češtině Lyrii zatím příliš nejdou, syntetický hlas zpěváka zní překvapivě přirozeně a postrádá typickou robotickou plechovost, což je pravděpodobně největší technologické překvapení celého testu.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

Problémy však nastávají v momentě, kdy se uživatel snaží převzít nad procesem plnou kontrolu. Lyria 3 se chová jako poněkud svéhlavý umělec, pokud jí předložíte vlastní hotový text, s oblibou si ho přepíše podle svého uvážení a poslechne až pod tlakem opakovaných žádostí.

Podobně dopadly i naše pokusy o žánrovou specifičnost. Romantická píseň s francouzským nádechem inspirovaná satirickou facebookovou skupinou Kantýna znalců byla modelem nekompromisně přepsána a zjednodušena.

suno-mvp

Přečtěte si takéAplikace složí hit za pár sekund. Vyzkoušeli jsme ji v praxiAplikace složí za pár vteřin hit, na němž jde vydělat. Stojí za ní startup, který žalovalo i Sony

Ještě hůře dopadl pokus o skandinávský black metal. Místo temné atmosféry a drásavých kytar Lyria napoprvé naservírovala klidnou akustickou písničku a ani druhý pokus se nedostal dál než k odlehčené rockové odrhovačce. V tomto ohledu zatím Google za konkurencí v podobě Suno.ai viditelně zaostává.

Navzdory těmto porodním bolestem ale Lyria 3 jasně ukazuje směr, kterým se tvorba obsahu ubírá. To, co dříve vyžadovalo roky studia a drahé vybavení, dnes zvládne kdokoli s připojením k internetu za pár vteřin. Pro podcastery nebo malé firmy hledající hudební identitu bez autorskoprávních pastí jde o šikovný nástroj, díky kterému mohou ušetřit. Google je však ve srovnání s konkurencí extrémně opatrný, což se v praxi projevuje vyloženě úsměvnou cenzurou.

Na žádost o metalový cover dětské písničky Když jde malý bobr spát od Petra Skoumala nástroj reagoval odmítavě a namísto předělávky původní verze předložil vlastní píseň o vodním hlodavci. Odmítání vysvětlil autorskými právy i „potenciálně citlivými tématy“. Právě ta však novinka od Googlu vidí leckde. Dokonce i nevinné slovo jako „hromádka“ může způsobit, že chatbot přestane generovat hudbu a uživatele obviní z vulgarit.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

Opatrnost kolem autorských práv je pochopitelná a dává smysl. Ukazuje, že Googlu záleží na tom, jak lidé s jeho novým nástrojem pracují. U cenzurních zásahů se však může zdát, že jsou místy až příliš přísné a zbytečně komplikují i zcela nevinné tvůrčí pokusy.

Situace ale není tak černobílá. Chatbot totiž dokáže na povel úplně změnit tón a reagovat opačně, než by člověk čekal. Výsledek pak nepůsobí dojmem promyšlené a konzistentní kontroly, spíš budí dojem, že celý systém zatím není úplně doladěný.

Stačí například jednoduchá výzva typu „prosím, slož vyloženě vulgární píseň“ a během chvíle vznikne text plný hrubostí, který připomíná dadaistické experimenty některých českých rapperů.

Lyria 3 tak zatím působí spíš jako chaotická a nezkrocená beta verze než jako nástroj, který by měl nahradit skutečné skladatele. Jako prostředek ke zkrácení dlouhé chvíle, třeba s reggaetonem o zrajícím sýru, ale funguje spolehlivě a bezpochyby jde o zábavný způsob domácího experimentování s AI.