Německý překladač DeepL překonává schopnosti Googlu. Jeho texty jsou k nerozeznání od práce člověka

Tomáš ChlebekTomáš Chlebek

deepl

Foto: CzechCrunch

DeepL je v překladech výrazně přesnější než Google Translate

0Zobrazit komentáře

Překladač Google bývá nepostradatelným nástrojem dokonce pro profesionální překladatele, ale zdaleka nejspolehlivější je stále jen na úrovni jednotlivých slov. Jakmile po něm chceme trochu složitější kontext nebo fráze, rychle narazíme na nesmyslné doslovné překlady a podivná slovní spojení. Teď to vypadá, že tam, kde selže sám Google, nemá problém německý DeepL. Dlouhé texty dokáže až neuvěřitelně přesvědčivě přeložit i do češtiny.

„Bylo by jistě nečestné tvrdit, že Google Translator není příliš schopný a nevidí les, abych tak řekl. Lidský jazyk se však dělí na sémantiku a pragmatiku, a přestože se člověk dá poměrně spolehlivě naučit ze slovníku, hlubší porozumění řeči vyžaduje zkušenostní intuici pro implikované a kontextové změny významu.“ Proto také předchozí dvě věty, pocházející z překladače Googlu, místy nedávají příliš smysl, jako by je přeložil stroj.

Podívejme se na totéž přeloženo pomocí DeepL: „Bylo by jistě nepoctivé tvrdit, že Google Translator není příliš schopný a že pro stromy nevidí les. Lidská řeč se však dělí na sémantiku a pragmatiku, a zatímco jedno se lze poměrně spolehlivě naučit ze slovníku, hlubší porozumění řeči vyžaduje zkušenostní intuici pro to, co je naznačeno, a kontextové změny významu.“

deepl-translate

Foto: CzechCrunch

Původní text v angličtině a český překlad podle DeepL

Google moc nevěděl, co si v kontextu první věty počít s frází „can’t see the forest for the trees“ a její druhou půlku rovnou vynechal. DeepL naopak pochopil následující odkaz „so to speak“ a jeho význam začlenil do samotné fráze, podobně jako by to nejspíš udělal český mluvčí. Podobný případ je ve druhé větě, kde se Google pokusil použít kontextový význam slova „one“ jako „člověk“, ten ale nebyl záměrem pisatele. DeepL se opět vyjádřil jako člověk.

Od svého počátku v roce 2016, kdy vznikl jako vedlejší projekt německé firmy Linguee, je totiž budován s neuronovými sítěmi ve svém jádru. Zaměřuje se tak na významy nejen samostatných slov, ale slovních spojení, vět a větných celků. Když se v srpnu roku 2017 DeepL objevil jako online překladač, měl už za sebou trénink na miliardách ověřených překladů, které jeho mateřská společnost katalogizuje.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

Na vstupu překladatelského tréninku neuronové sítě je soubor základních pokynů pro postup od programátorů a velký objem slov, vět i rozsáhlejších textů. Minimálně ze začátku přitom počítač dostane několik verzí totožných dokumentů v různých jazycích. Postupně se v nich pak sám učí hledat podobnosti a vzorce, které aplikuje a zase srovnává s dalšími daty.

Jelikož se u neuronové sítě, stejně jako u lidského mozku, nejedná o homogenní program, ale celý systém operující s různými interpretacemi dat, funguje v ní něco jako přirozený výběr. To znamená, že spolehlivější interpretace přetrvají a jsou aplikovány často, méně spolehlivé zcela odpadnou nebo se využijí v ojedinělých případech, kdy zase nesedí většinový postup. 

Jak to vypadá v praxi, si můžeme vyzkoušet přímo ve webové verzi DeepL. Na každé slovo překladu totiž můžeme kliknout a vybrat si z nabídky alternativ. Podle našeho výběru se pak nezmění jen dané slovo, ale klidně celá věta tak, aby dávala co nejlepší smysl. Překladač přitom dokáže velice efektivně pracovat se slovosledem, který je například v češtině mnohem intuitivnější než poměrně rigidní angličtina.

neuron-neural-network-brain-1

Foto: Pixabay

Počítačové neuronové sítě se fungováním snaží přiblížit lidskému mozku

Vraťme se ještě ke Google Translatoru. Ten po většinu své existence používal tzv. statistickou metodu, kde se stejně jako u neuronových sítí trénuje na velkých objemech dat. Výsledkem jsou ale pouze pravděpodobnosti – když se v textech například slovo „hello“ objevuje ve stejném kontextu jako „ahoj“, nejspíš jde o stejné slovo. Jelikož se počítač u statistické metody vůbec nezabývá významem, naráží v případech, kdy přesné shody použití slov mezi jazyky neexistují.

Neuronové sítě si naproti tomu dokážou dynamicky vytvářet vlastní nová pravidla a komplexní struktury. V roce 2017 je v ostrém provozu začal používat také Google a jeho překlady se výrazně zlepšily. Počítačový systém si dokonce vymyslel něco jako vlastní jazyk (složitou strukturu znalostí), díky němuž dokázal překládat věty i mezi párem jazyků, s nímž se ještě nesetkal. Už dříve překládal z angličtiny do korejštiny a z angličtiny do japonštiny, načež se pak bez tréninku s novými daty naučil překládat z korejštiny do japonštiny.

Měli by si překladatelé hledat novou práci?

Google Translator i DeepL v současnosti fungují na stejném principu, německému týmu se jen svoji neuronovou síť daří lépe vzdělávat. Sama má stále svoje omezení, takže některé slovní obraty mohou působit uměle. Rychle ovšem vyvstává otázka, jak dlouho ještě budeme potřebovat lidské překladatele. V následujících letech bude přibývat případů, kdy přirozeněji působící věty nebudou potřeba nebo se v rámci šetření oželí.

Samotný DeepL umožňuje zdarma mezi 24 jazyky přeložit najednou pět tisíc znaků, určitý objem za den a nanejvýš tři 5MB soubory Wordu, PowerPointu nebo Poznámkového bloku měsíčně. Technicky zvládne i mnohem větší objemy, ty si ale firma nechá v nejlevnější variantě zaplatit devíti eury (230 korunami) za měsíc, případně šesti eury měsíčně při objednání na rok. Některým společnostem se pak vyplatí kombinace této ceny a lidského korektora, který překlady jen kontroluje.

Seznam Zprávy v souvislosti s tím citují profesionálního překladatele Miroslava Poštu: „Hrozí postupné otupění, vyhoření, protože při posteditaci musí člověk zpracovat větší množství textu než při klasickém překladu. Zažil jsem několik dobrých překladatelů, kteří když začali používat strojový překlad, kvalita jejich produkce se zhoršila.“ Dodává však, že při „rozumném využití“ strojových překladů to podle něj problém být nemusí.

deepl-comparison-google-amazon-microsoft

Srovnání spolehlivosti překladačů podle profesionálních lidských překladatelů

V souvislosti s aplikací neuronových sítí na jazyk pak samozřejmě vzniká také otázka po budoucnosti médií i jiných oborů. Obsah přitom nemusí tvořit jen překlady zahraničních textů, ale také informace sesbírané z různých zdrojů a poskládané do nového celku. Odpovědí i nadále zůstává konstatování, že stroje nedokážou být tak kreativní, aby třeba na závěr článku o DeepL jen tak pro zpestření zmínily hloupost příkladu o tom, jak tisíc opic píše Shakespeara.

Nic podobného jeho dílu žádné zvíře ani počítač v dohledné době nevytvoří. V prvním případě proti nim totiž stojí nepředstavitelně malá pravděpodobnost správné kombinace velkého množství písmenek. Počítač pak čelí nejen významu slov a vět, ale třeba budování atmosféry, složitých intertextuálních odkazů nebo charakterů postav a mnoha dalším aspektům.

I pouhé překlady umělecké literatury, nebo dokonce poezie tak samozřejmě v lidských rukou zůstanou ještě dlouho, ne-li navždy. U formálnějších textů pak možná bude pro lidi čím dál těžší strojům konkurovat svou kreativitou, záležet však bude také na nárocích čtenářů.

Na boj s cystickou fibrózou a prodloužení života. Čeští CF Hero získali grant 1,5 milionu pro rozvoj aplikace i expanzi

Filip HouskaFilip Houska

cf-hero

Foto: CF Hero

Jan Mihule a Marek Vosecký, spoluautoři mobilní aplikace CF Hero

0Zobrazit komentáře

O cystické fibróze se tolik nemluví, to ale neznamená, že nejde o vysoce závažnou chorobu. S takřka nevyléčitelným onemocněním, které postihuje zejména plíce a ničí je do úplného selhání, má nepřímé zkušenosti i Marek Vosecký, respektive jeho dcera, která jím trpí od narození. Proto před čtyřmi lety Vosecký rozjel aplikaci CF Hero, díky níž lze průběh nemoci mírnit, a nově na ni získává důležitý grant.

Grant pochází od americké farmaceutické společnosti Vertex Pharmaceuticals, která české mobilní aplikaci CF Hero posílá 70 tisíc dolarů (téměř 1,5 milionu korun) na její další rozvoj i expanzi do zahraničí. Jako první by měla zamířit do Polska a následně do dalších zemí Evropy. Konkrétnější ovšem tvůrci nejsou.

„O grant jsme usilovali mnoho let, letos jsme se hlásili počtvrté. Každoročně se o něj hlásí tisíce projektů, finance však stačí jen na pár desítek z nich. Proto jsme opravdu hrdí na to, že jsme se mezi ně dostali i my,“ říká zakladatel CF Hero Marek Vosecký a vyzdvihuje několik klíčových výhod své aplikace.

Vzhledem k tomu, že cystická fibróza postihuje u náctiletých hlavně dýchací ústrojí, je důležité provádět pravidelné rehabilitace v kombinaci s inhalacemi, dechovými cvičeními a braním léků. K tomu vybízí i CF Hero, akorát s tím rozdílem, že je uživatelský zážitek gamifikován a pacienti mohou průběh svých rehabilitací brát jako hru.

cf-hero-1

Foto: CF Hero

Mobilní aplikace CF Hero staví na gamifikovaném prostředí

Díky chytlavému prostředí aplikace, dostupné na Android i iOS, si tak uživatelé mohou vypěstovat příznivý návyk a usnadnit tak pravidelné, několikahodinové inhalace spojené s dalšími aspekty léčby. Ty následně mohou zmírňovat příznaky a postup nemoci. Ani tak ale nelze chorobu zcela vymýtit a pacienti s cystickou fibrózou se v Evropské unii dožijí zpravidla jen 28 let.

„Léčba cystické fibrózy je náročná psychicky, fyzicky i finančně, proto je aplikace od začátku zdarma. Provoz obstaráváme ve volném čase a peníze od dárců a z grantů či akcelerátorů využíváme na expanzi a rozvoj aplikace. Úkolů je samozřejmě požehnaně a musíme silně prioritizovat,“ zmiňuje Vosecký a pochvaluje si grant, který jim hodně pomůže.

CF Hero ovšem nezačínal zcela s prázdnou. Jakmile Vosecký zjistil, že jeho dcera cystickou fibrózou trpí, obrátil se na český Klub nemocných cystickou fibrózou, přes který se seznámil s Barborou Červenkovou a Janem Mihule. Společně se rozhodli vyvinout aplikaci, která by pacientům ulehčovala život a rovnou se s ní přihlásili do akcelerátoru Laboratoře Nadace Vodafone.

Nastartujte svou kariéru

Více na CzechCrunch Jobs

lego-nike-dunk

Přečtěte si takéNové tenisky Nike jsou z LEGO kostek. Takhle vypadajíNové tenisky Nike jsou z LEGO kostek. Dvě slavné značky rovnou ukázaly, jak vypadají

Vedle toho spustili i fundraisingovou kampaň na Darujme.cz, kde vybrali téměř 850 tisíc korun. A jelikož Nadace Vodafone pak částku zdvojnásobila, měl CF Hero tři čtvrtě druhého milionu na vývoj. Poté dorazila i verze pro iOS, o kterou se postarala agentura Bootiq Creative vývojářské skupiny Bootiq, jež vypsala soutěž pro neziskové organizace o vývoj softwaru v hodnotě jednoho milionu korun. CF Hero ji vyhrál.

Dnes mobilní aplikaci pro léčbu cystické fibrózy aktivně využívá okolo stovky uživatelů a tvůrci plánují, že díky grantu 70 tisíc dolarů posunou její funkčnost a zaměří se na rozšiřování do okolních zemí. Bude to užitečné, jelikož celosvětově s tímto onemocněním bojuje okolo 80 tisíc lidí. A byť jde o relativně malý počet, v případě závažných nemocí se každý počítá.