Umělá inteligence dokáže shrnout text

Pavel Houser 20. 9. 2017 Články

Nástroje pro shrnutí (sumarizaci) textů pracují dvěma hlavními způsoby: extrakcí a abstrakcí.

Společnost Salesforce, dodavatel řešení CRM (řízení vztahů se zákazníky), má vlastního asistenta na poli umělé inteligence, kterému říká Einstein. Víceméně má jít o software s funkčností Apple Siri, Google Now nebo Microsoft Cortana.

Nyní Salesforce oznamuje další milník umělé inteligence – její technologie prý dokáže přepsat dokument tak, aby několika větami shrnula jeho obsah. Autoři oznámení, vývojáři Salesforce Romain Paulus, Caiming Xiong a Richard Socher označují příslušný specializovaný nástroj jako MetaMind.
Podobné služby existují už dávno, jsou však určeny pro indexování a nebo text předzpracovávají pro jiné softwarové nástroje (analyzuje se např. výskyt jednotlivých slov a porovnává s výskytem slov v obecné množině textů a používá řada dalších triků – např. se uvádí, že důležitá slova se nacházejí blízko sebe, méně důležitá spíše rozházená v celém dokumentu apod.). V tomto případě má ale jít opravdu o shrnutí v přirozeném jazyce. Výstup je určen přímo člověku, asi jako kdyby mu shrnutí poskytla živá asistentka.
Salesforce uvádí, že lidé procházením webů, e-mailu i sociálních sítí a pracovních dokumentů tráví v průměru 12 hodin denně. Asistent dokáže proto podstatným způsobem zvýšit produktivitu, firma zmiňuje např. právníky. Speciálně Salesforce uvádí (pochopitelně) uplatnění v oblasti CRM, např. přebírání obchodních případů, kdy člověk dokáže rychle pochopit i historii zahrnující desítky na sebe reagujících e-mailů. U péče o zákazníky se prý zase automatickou analýzou konverzace dá snadno zjistit, zda je vhodnější nabídnout klientovi dodatečnou podporu, věrnostní slevu nebo ještě něco jiného.
MetaMind využívá strojového učení, konkrétně se pro fázi učení modelu zmiňují techniky kontextového generování slov a tzv. reinforcement learning. Autoři software uvádějí následující podrobnosti.
Nástroje pro shrnutí (sumarizaci) textů pracují dvěma hlavními způsoby: extrakcí a abstrakcí. V prvním případě se ke shrnutí používá vět (částí vět) vybraných ze vstupního textu, které se považují za významné. Tento způsob generuje sdělení v dobře srozumitelném cca přirozeném jazyce (asi jako kdyby si člověk zažlutil věty v původním textu), nicméně tyto techniky postrádají větší pružnost – nedokáží používat např. nová slova nebo shrnující parafráze. Abstraktní přístup více odpovídá tomu, jak s textem pracují lidé. Obecně by měl dávat lepší výsledky, je však náročnější v tom, že vyžaduje schopnost generovat nové věty. Příslušné modely mohou produkovat text špatně čitelný a postrádající soudržnost (koherenci). Techniky typu reinforcement learning mají právě minimalizovat tento problém.
Salesforce tvrdí, že jejich nový systém dosahuje lepších výsledků než konkurence a odvolává se na benchmarky pomocí metodiky ROUGE (Recall-Oriented Understudy for Gisting Evaluation); přitom ovšem samotnou maximalizací hodnot ROGUE to nemá končit, protože dále upravené modely generují shrnutí s větší čitelností. Autoři výzkumu upozorňují, že by bylo vhodné přijít i s novými metrikami.

Zdroj: TechXplore.com a další

Sciencemag.cz

Umělá inteligence dokáže shrnout text

Related Articles

Překvapení: Buckyball připravili i z 80 atomů boru

Napsat komentář