Počítačové překladače díky strojovému učení/neuronovým sítím/umělé inteligenci podstatně vyspěly. Techniky neural machine translation (NMT) dnes dávají podstatně lepší výsledky než systémy založené na pravidlech nebo statistické analýze.
Vědci z německého Karlsruhe Institute of Technology nicméně upozorňují, že tyto systémy mají zatím jeden problém. Jsou natrénované na překlady správných (=celých) vět. Pokud je sdělení nějak zkomolené a chybí mu konec, systém se bude snažit „dopovědět“, tj. vyprodukuje překlad v podobě celé smysluplné věty. Což může být problém i v případě, že chceme překládat „on-line“, s nízkou latencí, tj. aby překlad začal ještě předtím, než mluvčí dokončí celou větu. Někdy může dojít prý také k tomu, že systém opakuje poslední zachycené slovo (PH: Při chybě v přenosu? Nebo když je věta neúplná?). Cílem nového projektu je tedy generování částečných vět – ať už nedořečených, nebo pro překlad během proslovu řečníka.
Tréninkové sady obsahující částečné věty sice nebyly k dispozici, ale autoři výzkumu si je dokázali automatizovaně generovat. Zvolenou strategií hlubokého učení byla tzv. multi-task learning. Problém ovšem je, aby si systém přitom zachoval i svou původní funkci, tedy překládání celých vět – cílem bylo mít stále 1 univerzální překladač/1 model, což se údajně nakonec podařilo.
Zdroj. TechXplore.com
Low-Latency Neural Speech Translation, arXiv: 1808.00491v1 [cs.CL]. arxiv.org/abs/1808.00491
Poznámka PH: Ovšem požadovat, aby překlad začal, ještě než má systém k dispozici celou větu, je nutně problematické, potíže by zde měli i lidé. I v češtině známe např. tzv. zavádějící věty, které fungují jako „chytáky“. Poslední slovo změní oproti původnímu celou gramatickou strukturu (Autobusy a vlaky jezdí školáci apod.).