Například anglické slovo funded zní podobně jakou founded. Pro počítač je snadné tato slova zaměnit a udělat v překladu třeba do němčiny chybu. Je-li však díky tlumočníkovi k dispozici simultánní překlad do češtiny (financováno vs. založeno)… Ondřej Bojar a Dominik Macháček z ÚFAL MFF UK získali americký patent pro simultánní …
více »Jazyky v tropech jsou prý hlasitější
Lingvista Søren Wichmann z Kiel University a jeho kolegové došli na základě statistického rozboru k závěru, že průměrná teplota prostředí ovlivňuje hlasitost některých zvuků lidské řeči. „Obecně platí, že jazyky v teplejších oblastech jsou hlasitější než jazyky v těch chladnějších.“ „Na jedné straně suchý studený vzduch představuje výzvu pro tvorbu …
více »Interpunkce pod lupou: v různých jazycích rychle vznikly podobné statistické charakteristiky
Analýza 7 evropských jazyků ukázala, že v jejich psané formě se použití interpunkce řídí stejným statistickým rozdělením. Do interpunkce vědci z Ústavu jaderné fyziky Polské akademie věd v Krakově započítávali 10 „oddělovačů“ – tečku, tři tečky, čárku, středník, pomlčku, otazník, vykřičník, dvě závorky a uvozovky. Zkoumaly se dva soubory textů. …
více »Nová analýza tvrdí, že indoevropské jazyky nevznikly ve stepi
Převažující názor dnes klade původ indoevropských jazyků do oblasti na sever a severovýchod od Černého moře, dává je do souvislosti především s jámovou kulturou pozdního eneolitu. Nositelé této kultury byli částečně kočovníci žijící ve stepi, i když kde to bylo možné, provozovali i usedlé zemědělství. Expanze Indoevropanů do Evropy pak …
více »Málo frekventovaná slova umožní určit autora textu
Olomoučtí lingvisté analyzovali texty spisovatelů, politiků i vrahů a patentovali novou technologii, která pomůže určit autora. Vědci z Filozofické fakulty Univerzity Palackého v Olomouci (FF UP) vyvinuli unikátní technologii, která umožňuje automatické profilování osob. Zcela nová technologie najde využití v uzpůsobování internetového obsahu, v reklamě, v personalistice i při komunikaci …
více »Jazyk plný „vyjmenovaných slov“
Angličtina měla v dávných dobách, řekněme tak v 10. století, pravopis dokonce fonologičtější než my. Anglický výraz pro vlka se ovšem dodnes píše „wolf“, tedy nejen s vyslovovaným, ale i s psaným „f“ na konci, byť množné číslo zní a píše se s „v“ – „wolves“. V češtině na rozdíl od angličtiny, …
více »Slovo hurikán znali už předkolumbovští obyvatelé střední Ameriky
Hurikán Ian, který 28. září udeřil na pobřeží Floridy, se zřejmě zařadí k dosud nejničivějším událostem tohoto tisíciletí. Zatímco vznik hurikánu dokážeme fyzikálně vysvětlit, původ tohoto odborného termínu byl opředen tajemstvím. Pracovníci Filosofického ústavu AV ČR a Ústavu fyziky atmosféry AV ČR nedávno společně obohatili Elektronický meteorologický slovník o vysvětlení …
více »Vědci z Matfyzu vyvinuli automatický překladač mezi češtinou a ukrajinštinou
Výzkumníci z Ústavu formální a aplikované lingvistiky (ÚFAL) vyvinuli v rekordním čase veřejně dostupný automatický překladač mezi češtinou a ukrajinštinou. Cílem projektu je pomoci uprchlíkům z Ukrajiny překonat jazykovou bariéru a usnadnit jim kontakt v českém prostředí. O uplynulém víkendu skupina výzkumníků z Ústavu formální a aplikované lingvistiky MFF UK …
více »Umělá inteligence má při zpracování jazyka fungovat podobně jako mozek
Alespoň tedy při jedné jazykové úloze, odhadování dalšího slova následujícího ve větě. Cílem systémů umělé inteligence při zpracování přirozeného jazyka je dojít k výsledku, nikoliv kopírovat postupy, které používají lidé (AI vzniklá strojovým učením pro nás může být černá skříňka, a nakonec přesný postup nemusíme znát ani u člověka, o …
více »Umělá inteligence zatím pořádně nechápe přebírání slov
Vezměme množinu textů v jednom jazyce a přidejme slovníky jiných jazyků. Úkolem je zjistit, která slova v textech jsou cizí a odkud byla převzata. Současným systémům umělé inteligence to moc nejde. Pokud by AI zvládala výpůjčky identifikovat spolehlivě (což bychom ověřili na případech, kde jsme si sami jisti), určitě by …
více »