Překladače založené na statistické metodě už možná dosáhly svých limitů a nahradí je neuronové sítě.
Představte si imaginární, vzdálenou zemi, kde si můžete zajít do restaurace nazvané U chyb automatického překladače, a užít si vydatnou hostinu v podobě dětských sendvičů a dortu z manželky, a to všechno spláchnout trochou ďábelské vody. Kdyby se vám při hodování zlomil některý ze skřípáků, žádné obavy – kolem je spousta metodistů, kteří vám ochotně poškozený zub vytrhnou.
A jakmile se vám ona země přejí, stačí nasednout na široce provařené letadlo a odletět domů. Jen, prosím, nezapomeňte, že po příletu na letiště je přísně zakázáno jíst koberec. Píše to zpravodajský server BBC. Ne, jeho autoři se nezbláznili. To, co uvádějí, jsou skutečné příklady famózních chyb automatických překladačů cizích jazyků.
Ovšem žerty stranou, špatné překlady mohou mít nepříjemné následky pro firmy, které v případě nesprávného překladu riskují, že urazí zákazníky, přijdou o obchod, anebo budou přinejmenším vypadat velmi amatérsky.
Řadu let už odborníci slibují, že se stanou realitou stroje schopné učit se jazyky a zpracovávat je tak, aby dokázaly poskytnout bezchybný a prakticky simultánní překlad. Ovšem jak dlouho ještě bude nutné na ně čekat?
V lednu spustil program Skype svůj překládací program, který umožňuje hlasový překlad v rámci sedmi jazyků. I on však trpí dětskými neduhy a nejméně při jedné příležitosti náhodně zaměňoval čínská slova za vulgarity.
Překládací programy, jako je například Google Translate, jsou tradičně stavěny na základě mechanického překladu frází, které se opírají o statistickou pravděpodobnost. To znamená, že analyzují katalog textů, které už byly přeloženy – například vědecké studie a podobně. Analýza běží paralelně v obou jazycích – původním i cílovém – a na základě statistické pravděpodobnosti vyberou nejvhodnější překlad.
Jejich účinnost do značné míry závisí na kvalitě původních vzorků jazyka. Jsou tedy náchylné k chybám, nemluvě o tom, že často překlad zní kostrbatě a mechanicky. Z tohoto důvodu ředitel odboru jazykových technologií na facebooku Alan Packer před časem uvedl, že překladače založené na statistické metodě už dosáhly „konce svého přirozeného života“.
Místo toho se nyní technologie překladačů přesouvá k umělým neuronovým sítím. Ty jsou strukturovány podobně jako lidský mozek a používají složité algoritmy, aby vybraly a použily odpovídající překlad. Ovšem namísto překládání jednotlivých slov se neuronová síť může naučit metafory a významy daného jazyka, což umožňuje vybrat překlad, který znamená stejnou věc v různých kulturách, místo doslovného překladu, který v některých případech může znít urážlivě.
Facebook hodlá podobný systém spustit ještě letos. Profesor Philipp Koehn, počítačový odborník a expert na překládací technologii Edinburské univerzity, zpravodajské stanici BBC řekl, že je ještě třeba ujít dlouhou cestu. Jsou zde složité problémy se sémantikou a také rozsahem znalostí, které je třeba nejdřív vyřešit, a k tomu se zatím ani neblížíme,“ podotkl Koehn.
Například čínština nemá ekvivalent množného čísla, slovesných časů či zájmen. Angličtina pro změnu nemá k podstatným jménům přiřazené rody, což komplikuje překlad do jazyků, které je mají – francouzština, italština nebo němčina. Proto je překlad tak složitý, vysvětluje Koehn. Dokud se tyto problémy nepodaří překonat, pak se chyby překladů – jako ty uvedené na začátku tohoto textu – budou s největší pravděpodobností opakovat.