Umělá inteligence pozná, zda obrázek patří k textu

Pavel Houser 4. 12. 2018 Články

Když obrázek nebo video nejsou tím, čím se zdají být – respektive byly s určitým sdělením zkombinovány až dodatečně.

Problematika falešných zpráva je dnes módní záležitostí. Následující výzkum se zaměřuje na jeden speciální aspekt tohoto problému, multimediální obsah.
Klasickými metodami dokážeme maximálně určit, zda je určitá fotografie, video nebo audio soubor upravená/umělé vytvořená apod. I zde přitom zůstává otázka, jak spolehlivé je takové rozpoznání, zvlášť když třeba neuronové sítě se mohou nejen učit falešný obsah odhalovat, ale i vytvářet. Vědci z University of California v Davisu se ale soustředili na jiný problém. Mnohdy se stane, že určitý multimediální soubor se rozšíří po sociálních sítích apod. platformách, ale je připojen k jinému obsahu než původně. Sám o sobě je sice autentický, ale fotografii jednoho letadla např. přidáte k informaci o havárii jiného apod. Video původně patřící k letadlu US Airways 1549 (nouzové přistání letadla na řece Hudson v roce 2009) se tak dostalo k vymyšleným zprávám o Malaysia Airlines 370 (letadlo, které záhadně zmizelo v roce 2014 během letu z Kuala Lumpur do Pekingu); to se dalo odhalit snadno, protože v obou případech šlo o velmi dobře zpravodajsky pokryté události. Někdy nemusí jít ani o úmysl klamat, ale prostě o přidání podobného ilustračního obrázku z nějaké databáze, o záměrnou hříčku v podobě odkazu k jiné události apod.
Nová studie zatím publikovaná na serveru arXiv (práce, které neprošly odbornou oponenturou), sleduje vazbu mezi multimediálním obsahem a doprovodným textem a přitom porovnává různé platformy, např. Facebook, Google (zde zejména hledání Google Images), Baidu a Twitter. Protože obsah na nich je v různých jazycích, proces zahrnuje i překlady, respektive extrakci informací. Hlavní použitou metodou je nikoliv překvapivě strojové učení. Při vlastní práci se postupuje tak, že v příslušné tabulce jednotlivých zdrojů se vytvoří abstraktní, na jazyce nezávislý vyextrahovaný „význam“ a mezi všemi platformami se pak tato data porovnávají mezi sebou.
Samozřejmě dochází pouze k porovnávání různých platforem a kontrole toho, zda se text provázející multimediální obsah přibližně shoduje. Systém nedokáže detekovat problém, pokud je příslušná informace obdobná na všech zdrojích (s tím si ovšem těžko může poradit i člověk); určí ale, kde došlo ke zkreslení významu a jaký kontext multimédií je zřejmě správný (převládající, starší/původní apod.). Cílem je nejen zjistit, že nějaká informace je fáma, ale i identifikovat, jak se vynořila, tj. kde jako poprvé byl např. obrázek použit přiřazený k jiné události.

Zdroj: TechXplore.com

Cross- Lingual Cross-Platform Rumor Verification Pivoting on Multimedia Content. arXiv:1808.04911v1 [cs.CL] . arxiv.org/pdf/1808.04911.pdf
Zdroj: TechXplore.com

Sciencemag.cz

Umělá inteligence pozná, zda obrázek patří k textu

Related Articles

Příprava dalekohledu Nancy Grace Roman na start pokračuje

Napsat komentář