Test Google Translate – Kvalita prekladu po zavedení Neural Machine Translation (GNMT)

Autor: Martin Smolinský | 30.7.2017 o 22:08 | (upravené 1.8.2017 o 0:24) Karma článku: 3,42 | Prečítané:  427x

Od 19. apríla 2017 využíva Google prekladač revolučnú technológiu prekladu založenú na neurónových sieťach. Využil som túto príležitosť a na základe rovnakého textu som otestoval schopnosti prekladača pred a po zavedení.

Téme histórie a budúcnosti Google Translate som sa už v minulosti venoval, rovnako som priblížil dôvody, prečo Google pri prekladoch robí chyby - nezabudol som ani na zopár legendárnych faux pas, ktoré pobavili či pobúrili celý svet.

Tento rok však prišiel Google s významnou novinkou a to novou technológiou prekladu Google Neural Machine Translation (GNMT). Práve tá je hnacím motorom pri  prekladoch, zatiaľ však iba v kombinácii s angličtinou. Aktuálny zoznam podporovaných jazykov vždy nájdete tu. Výborná správa je, že na zozname sa nachádza aj náš rodný jazyk -  slovenčina.

GNMT prekladá vety ako celok, nielen po kratších slovných spojeniach. Aj preto by mali byť v súčasnosti preklady presnejšie a vo väčšej miere by sa mali približovať prirodzenej ľudskej reči. 

Hindi_GoogleTranslate_v4_Blog.gif

Pred príchodom GNMT sa uplatňovala technológia Recurrent Neutral Networks (RNN). Názory na kvalitu preložených textov vďaka RNN rozdeľovali užívateľov do 2 skupín - na jednej strane stáli ľudia, ktorí si preklad pochvaľovali a vnímali ho ako spoľahlivý, pokiaľ išlo o bežný a všeobecný kontext. Na druhej strane sa nachádzali skeptici, ktorí pokladali jeho výstup za slabý až nedostatočný. Pravda je, že nezriedka bol výsledný preklad vyslovene “strojový” a RNN technológia bola neschopná preniknúť do reálneho významu ani stredne zložitých textov.

Porovnanie kvality prekaldu

Podarilo sa mi porovnať kvalitu prekladu obidvoch vyššie uvedených technológií  prostredníctvom malého experimentu, v ktorom som Google prekladač podrobil jednoduchému testu. Dostal za úlohu preložiť identický slovenský text – prvýkrát v polovici apríla 2017 s využitím RNN, druhýkrát v polovici mája 2017, tesne po nasadení GNMT. Zakaždým vykonal 2 preklady, jeden v postupnosti angličtina → slovenčina, druhý v postupnosti francúzština → japončina → slovenčina. Celkovo tak mám na porovnanie k dispozícii 4 preklady. Ako východiskový text som použil citát Jozefa Mistríka, o čom inom ako práve o jazyku:

„ Jazyk je nástroj, pomocou ktorého človek žije, dorozumieva sa a pohybuje v spoločnosti. Čím lepšie ho poznáme a ovládame, tým viacej môžeme pomocou neho spoločnosti dávať alebo od nej prijímať. Pokrok a modernizácia človeka, jeho vedy a techniky sú nevyhnutne podmienené úrovňou prostriedkov, pomocou ktorých sa človek s človekom dorozumieva. “

- Jazyk a reč, 1999, s. 5

Uvedený text určený na preklad je relatívne jednoduchý, obsahuje slová z bežnej slovnej zásoby, nie sú v ňom použité ani hovorové slová, ani termíny. Platí tiež, že na pochopenie významu citácie nie je potrebný širší kontext.

Preklad angličtina → slovenčina s využitím (staršej) technológie RNN

V prvom prípade pracoval Google prekladač s originálnym slovenským citátom, v ktorom mal, schematicky vyjadrené, urobiť preklad angličtina → slovenčina.

Treba však zdôrazniť, čo som už uviedol v sérii člankov Prekladače, Google Translate nebol pred 19. aprílom 2017 ešte schopný prekladať priamo medzi slovenčinou a angličtinou. Ako sprostredkovateľa preto využíval najpríbuznejší jazyk k slovenčine, teda češtinu. Text sa tak reálne prekladal v postupnosti  čeština → angličtina → čeština → slovenčina.

RNN preklad angličtina - slovenčina (4/2017)

Jazyk je nástroj, pomocou ktorého ľudia žijú, komunikovať a pohybovať sa v spoločnosti. Čím lepšie poznáme a regulácie, tým viac budeme používať dávania z alebo prijímať. Pokroku a modernizácie muž vedy a techniky sú vždy predmetom na úroveň prostriedkov, ktorými človek človek komunikatívne schopnosti.

V porovnaní s pôvodným textom došlo pri spätnom preklade k výrazným zmenám. Zachovalo sa naozaj len minimálne množstvo informácií, viackrát nastali zámeny slovných druhov a gramatických kategórií.

Na druhej strane, postupnosť slov sa viac-menej udržala. Kvalita výstupu však  predurčuje, že je nevyhnutné domýšľať si význam jednotlivých viet. Ak by som nepoznal originálny text, je veľmi pravdepodobné, že by som aj napriek akejkoľvek snahe pochopiť ho, nebol príliš úspešný. Vo všeobecnosti tak môžem konštatovať, že preklad bol na slabej úrovni.

Doplním, že v rovnakom čase som urobil v rámci testu aj nezávislý preklad Mistríkovho citátu zo slovenčiny do češtiny a výstup bol absolútne dokonalý.

Preklad angličtina → slovenčina s využitím novej technológie GNMT

Pri využívaní novej technológie uskutočňuje Google Translate preklady už priamo medzi slovenčinou a angličtinou. Nepotrebuje teda spojku – češtinu, prekladač Google Translate Mistríkov text preložil takto:

GNMT preklad angličtina - slovenčina  (5/2017)

Jazyk je nástroj, pomocou ktorého človek žije, chápe a pohybuje sa v spoločnosti. Čím lepšie vieme a kontrolujeme, tým viac ho môžeme použiť alebo dať spoločnosti. Pokrok a modernizácia človeka, jeho veda a techniky sú nevyhnutne podmienené úrovňou prostriedkov, ktorými sa človek komunikuje s človekom.

Vidieť, že text preložený vďaka aktuálnej technológii GNMT je v porovnaní so starým prekladom podstatne kvalitnejší. Všeobecne môžem konštatovať, že sa zachovalo poradie slov, nedošlo k zmenám ani slovných druhov, ani gramatických kategórií. Podstatná časť informácií je zachovaná spoľahlivo. Významy 2. a 3. vety nie sú úplne jednoznačné. Predpokladám však, že priemerne vzdelaný človek by ich s malým úsilím dokázal vylúštiť. Je evidentné, že preklady prostredníctvom GNMT sú v porovnaní s RNN podstatne presnejšie.

 

Preklad francúzština → japončina → slovenčina

Zaujímavé je tiež sledovať, čo sa stáva s textom, ak ho prekladám do viacerých jazykov. Vychádzajúc zo slovenského textu, Google prekladač dostal za úlohu v polovici apríla vykonať preklad francúzština → japončina → slovenčina. Prvý jazyk som vybral preto, lebo francúzština je spolu s angličtinou moja srdcová záležitosť a každodenná prekladateľská prax. Druhý som zvolil ako reprezentanta mimoeurópskych jazykov.

Ak som už písal, väčšina textov je primárne prekladaná do angličtiny. Originálny slovenský text sa tak práve v tomto prípade v skutočnosti prekladal v postupnosti: čeština → angličtina → francúzština → angličtina → japončina a späť.

Výsledok je naozaj pozoruhodný, posúďte sami:

RNN preklad francúzština → japončina → slovenčina

Jazyk, ľudia a komunikácia live, pohybom v spoločnosti, je nástroj. Viac z ovládacieho prvku, ktorý poznáme, ktorý ste použili k viac dávame alebo prijímať.modernizácie a pokroku vedy a techniky ľudstva, bude vždy predmetom ľudských komunikačných zručností v ceste.

V polovici mája 2017 som test zopakoval. Tentoraz prekladač reálne  pracoval iba v postupnosti francúzština → japončina → slovenčina: 

GNMT preklad francúzština → japončina → slovenčina

Jazyk, ľuďmi, komunikovať žiť sa pohybovať v spoločnosti, je nástroj. Väčšiu kontrolu a vieme, mnoho z viacerých budeme používať spoločnosť viac či menej. Pokroku a modernizácie ľudstva vedy a techniky bude vždy podliehať úrovni prostriedkov z človeka na človeka komunikačných zručností.

Technologická novinka GNMT v porovnaní s RNN priniesla pri konkrétnom preklade určitý kvalitatívny posun, no výstup ostáva aj naďalej veľmi slabý.

Pri obidvoch prekladoch platí, že hádam jediná dobrá správa je, že výsledné texty sú jednoznačne v našom jazyku, bez väčších problémov sa dajú čítať po slovensky. Ide však o bľabotanie, sled slov je bez ladu a skladu. Nielen celé texty, ale aj samotné vety sa vyznačujú nezmyselnosťou, nenesú žiadnu informáciu. Výsledok je prázdny, bez hodnoty a v konečnom dôsledku nevyužiteľný.

Je teda zrejmé, a môj malý test to potvrdil, že Google prekladač sa vďaka technológii GNMT posúva na vyššiu úroveň. Preklady medzi angličtinou a slovenčinou sú dnes podstatne presnejšie ako v nedávnej minulosti.

Ku kvalitatívnemu posunu došlo taktiež pri prekladaní medzi viacerými jazykmi, no výstup strojového prekladu ostáva v tomto prípade naďalej veľmi nepresný. Odporúčam vždy dobre zvážiť, do akej miery je vhodné spoliehať sa na výsledok prekladu prostredníctvom Google Translate alebo radšej zainvestovať do odborného prekladu od profesionála.

Výsledný preklad má od dokonalosti stále ďaleko, napokon potvrdzujú to aj slová samotných vývojárov spoločnosti Google:

 

GNMT môže stále urobiť zásadnú chybu, ktorú by ľudský prekladateľ nikdy neurobil – môžu mu vypadnúť slová, môže nesprávne preložiť vlastné mená či netradičné termíny alebo preloží izolované vety namiesto zohľadnenia kontextu odseku alebo strany.


Na druhej strane však služba Google Translate prechodom na GNMT prekročila ďalší míľnik v ceste za víziou komunikácie bez jazykových bariér.

Páčil sa Vám tento článok? Pridajte si blogera medzi obľúbených a my Vám pošleme email keď napíše ďalší článok
Pridaj k obľúbeným

Hlavné správy

SVET

Historické fiaská aj rekordné úspechy. Česko má po voľbách víťazov i porazených

V novom českom parlamente zasadne deväť strán. Nie všetky sú so svojim výsledkom spokojné.

KOMENTÁRE

Balada o zrade, alebo bez Babiša to nepôjde

Andrej Babiš vyhral v premiérskom referende.

SVET

Politológ: České voľby? Fenomenálny úspech populizmu

Babiš vyhral, lebo kauzy prezentoval ako snahu o zničenie, tvrdí Miloš Gregor.


Už ste čítali?