Německý překladač DeepL překonává schopnosti Googlu. Jeho texty jsou k nerozeznání od práce člověka

Tomáš ChlebekTomáš Chlebek

deepl

Foto: CzechCrunch

DeepL je v překladech výrazně přesnější než Google Translate

0Zobrazit komentáře

Překladač Google bývá nepostradatelným nástrojem dokonce pro profesionální překladatele, ale zdaleka nejspolehlivější je stále jen na úrovni jednotlivých slov. Jakmile po něm chceme trochu složitější kontext nebo fráze, rychle narazíme na nesmyslné doslovné překlady a podivná slovní spojení. Teď to vypadá, že tam, kde selže sám Google, nemá problém německý DeepL. Dlouhé texty dokáže až neuvěřitelně přesvědčivě přeložit i do češtiny.

„Bylo by jistě nečestné tvrdit, že Google Translator není příliš schopný a nevidí les, abych tak řekl. Lidský jazyk se však dělí na sémantiku a pragmatiku, a přestože se člověk dá poměrně spolehlivě naučit ze slovníku, hlubší porozumění řeči vyžaduje zkušenostní intuici pro implikované a kontextové změny významu.“ Proto také předchozí dvě věty, pocházející z překladače Googlu, místy nedávají příliš smysl, jako by je přeložil stroj.

Podívejme se na totéž přeloženo pomocí DeepL: „Bylo by jistě nepoctivé tvrdit, že Google Translator není příliš schopný a že pro stromy nevidí les. Lidská řeč se však dělí na sémantiku a pragmatiku, a zatímco jedno se lze poměrně spolehlivě naučit ze slovníku, hlubší porozumění řeči vyžaduje zkušenostní intuici pro to, co je naznačeno, a kontextové změny významu.“

deepl-translate

Foto: CzechCrunch

Původní text v angličtině a český překlad podle DeepL

Google moc nevěděl, co si v kontextu první věty počít s frází „can’t see the forest for the trees“ a její druhou půlku rovnou vynechal. DeepL naopak pochopil následující odkaz „so to speak“ a jeho význam začlenil do samotné fráze, podobně jako by to nejspíš udělal český mluvčí. Podobný případ je ve druhé větě, kde se Google pokusil použít kontextový význam slova „one“ jako „člověk“, ten ale nebyl záměrem pisatele. DeepL se opět vyjádřil jako člověk.

Od svého počátku v roce 2016, kdy vznikl jako vedlejší projekt německé firmy Linguee, je totiž budován s neuronovými sítěmi ve svém jádru. Zaměřuje se tak na významy nejen samostatných slov, ale slovních spojení, vět a větných celků. Když se v srpnu roku 2017 DeepL objevil jako online překladač, měl už za sebou trénink na miliardách ověřených překladů, které jeho mateřská společnost katalogizuje.

Na vstupu překladatelského tréninku neuronové sítě je soubor základních pokynů pro postup od programátorů a velký objem slov, vět i rozsáhlejších textů. Minimálně ze začátku přitom počítač dostane několik verzí totožných dokumentů v různých jazycích. Postupně se v nich pak sám učí hledat podobnosti a vzorce, které aplikuje a zase srovnává s dalšími daty.

Jelikož se u neuronové sítě, stejně jako u lidského mozku, nejedná o homogenní program, ale celý systém operující s různými interpretacemi dat, funguje v ní něco jako přirozený výběr. To znamená, že spolehlivější interpretace přetrvají a jsou aplikovány často, méně spolehlivé zcela odpadnou nebo se využijí v ojedinělých případech, kdy zase nesedí většinový postup. 

Jak to vypadá v praxi, si můžeme vyzkoušet přímo ve webové verzi DeepL. Na každé slovo překladu totiž můžeme kliknout a vybrat si z nabídky alternativ. Podle našeho výběru se pak nezmění jen dané slovo, ale klidně celá věta tak, aby dávala co nejlepší smysl. Překladač přitom dokáže velice efektivně pracovat se slovosledem, který je například v češtině mnohem intuitivnější než poměrně rigidní angličtina.

neuron-neural-network-brain-1

Foto: Pixabay

Počítačové neuronové sítě se fungováním snaží přiblížit lidskému mozku

Vraťme se ještě ke Google Translatoru. Ten po většinu své existence používal tzv. statistickou metodu, kde se stejně jako u neuronových sítí trénuje na velkých objemech dat. Výsledkem jsou ale pouze pravděpodobnosti – když se v textech například slovo „hello“ objevuje ve stejném kontextu jako „ahoj“, nejspíš jde o stejné slovo. Jelikož se počítač u statistické metody vůbec nezabývá významem, naráží v případech, kdy přesné shody použití slov mezi jazyky neexistují.

Neuronové sítě si naproti tomu dokážou dynamicky vytvářet vlastní nová pravidla a komplexní struktury. V roce 2017 je v ostrém provozu začal používat také Google a jeho překlady se výrazně zlepšily. Počítačový systém si dokonce vymyslel něco jako vlastní jazyk (složitou strukturu znalostí), díky němuž dokázal překládat věty i mezi párem jazyků, s nímž se ještě nesetkal. Už dříve překládal z angličtiny do korejštiny a z angličtiny do japonštiny, načež se pak bez tréninku s novými daty naučil překládat z korejštiny do japonštiny.

Měli by si překladatelé hledat novou práci?

Google Translator i DeepL v současnosti fungují na stejném principu, německému týmu se jen svoji neuronovou síť daří lépe vzdělávat. Sama má stále svoje omezení, takže některé slovní obraty mohou působit uměle. Rychle ovšem vyvstává otázka, jak dlouho ještě budeme potřebovat lidské překladatele. V následujících letech bude přibývat případů, kdy přirozeněji působící věty nebudou potřeba nebo se v rámci šetření oželí.

Samotný DeepL umožňuje zdarma mezi 24 jazyky přeložit najednou pět tisíc znaků, určitý objem za den a nanejvýš tři 5MB soubory Wordu, PowerPointu nebo Poznámkového bloku měsíčně. Technicky zvládne i mnohem větší objemy, ty si ale firma nechá v nejlevnější variantě zaplatit devíti eury (230 korunami) za měsíc, případně šesti eury měsíčně při objednání na rok. Některým společnostem se pak vyplatí kombinace této ceny a lidského korektora, který překlady jen kontroluje.

Seznam Zprávy v souvislosti s tím citují profesionálního překladatele Miroslava Poštu: „Hrozí postupné otupění, vyhoření, protože při posteditaci musí člověk zpracovat větší množství textu než při klasickém překladu. Zažil jsem několik dobrých překladatelů, kteří když začali používat strojový překlad, kvalita jejich produkce se zhoršila.“ Dodává však, že při „rozumném využití“ strojových překladů to podle něj problém být nemusí.

deepl-comparison-google-amazon-microsoft

Srovnání spolehlivosti překladačů podle profesionálních lidských překladatelů

V souvislosti s aplikací neuronových sítí na jazyk pak samozřejmě vzniká také otázka po budoucnosti médií i jiných oborů. Obsah přitom nemusí tvořit jen překlady zahraničních textů, ale také informace sesbírané z různých zdrojů a poskládané do nového celku. Odpovědí i nadále zůstává konstatování, že stroje nedokážou být tak kreativní, aby třeba na závěr článku o DeepL jen tak pro zpestření zmínily hloupost příkladu o tom, jak tisíc opic píše Shakespeara.

Nic podobného jeho dílu žádné zvíře ani počítač v dohledné době nevytvoří. V prvním případě proti nim totiž stojí nepředstavitelně malá pravděpodobnost správné kombinace velkého množství písmenek. Počítač pak čelí nejen významu slov a vět, ale třeba budování atmosféry, složitých intertextuálních odkazů nebo charakterů postav a mnoha dalším aspektům.

I pouhé překlady umělecké literatury, nebo dokonce poezie tak samozřejmě v lidských rukou zůstanou ještě dlouho, ne-li navždy. U formálnějších textů pak možná bude pro lidi čím dál těžší strojům konkurovat svou kreativitou, záležet však bude také na nárocích čtenářů.