Sofistikované technologie umožňují automatizovat činnosti zdánlivě rutinní, jenže bez AI by to šlo složitě.
Odpovídá Petr Baudiš, zakladatel společnosti Rossum. P. Baudiš je jedním z vývojářů systému Git a vytvořil také AI systém hrající deskovou hru Go. V tomto rozhovoru se však soustředíme na produkt Elis, který dokáže vyčíst informace z faktur.
Motivace pro podobný systém je celkem evidentní, protože faktury přicházejí v různých formátech, takže se často ručně přepisují – a to i ty, které se posílají elektronicky. Na druhé straně však už ale existují systémy pro správu dokumentů, které tyto procesy automatizují. Co zde může nabídnout umělá inteligence?
Základní rozdíl spočívá v tom, že systémy bez umělé inteligence musíte složitě nastavovat pro každé použití zvlášť, a i pak automatizují pouze nejčastější formáty přicházejících faktur. Tradiční OCR systémy, které umožňují extrakci informací, se totiž nastavují podle sady pravidel, které jsou vždy ušité na míru konkrétním formátům přijímaných faktur a jejich tvorba je hodně pracná. Nakonec to dopadne tak, že zavedení takového systému je hodně náročné a dotáhnou ho jen uživatelé s opravdu velkými objemy dat. Naopak bývalo neproveditelné, aby vyčítání faktur bylo třeba jako univerzální komponenta účetního software.
Když ale použijeme umělou inteligenci, tak to znamená, že systém fakturám “rozumí” na hlubší úrovni a dokáže najít informace i v rozložení textu, které systém nikdy předtím neviděl. Zároveň se nemusí ručně nastavovat, stačí ho naučit ukazováním údajů na konkrétních příkladech faktur. To znamená, že náš systém Elis je mnohem jednodušší nasadit (zákazník dostává cloudovou službu) a vyplatí se i s malým počtem faktur. Jediné, co vždy zbývá vyřešit, je propojení s účetním systémem. Elis navíc dokážeme snadno učit na mnoha jazycích, takže systém prodáváme stejně tak u nás jako na zahraničních trzích.
Součástí je ovšem i rozhraní umožňující kontrolu procesu, eventuálně úpravu dat. Nakonec totiž vždy míříme na to, co nejvíce času ušetřit lidem, kteří faktury zadávají. Vyladěné rozhraní na co nejpohodlnější kontrolu a doplnění dat zní méně sexy, ale v praxi je podobně důležité jako ta umělá inteligence na pozadí.
Kdo jsou typičtí zákazníci?
Nejčastější koncoví zákazníci jsou pro nás podnikové služby velkých firem. O menší zákazníky se staráme společně s našimi partnery – buď výrobci účetního software nebo třeba DMS, a pak jde o integrátory, kteří zákazníkům na míru zapojí Elis do jejich procesu a software typu SAP. Tady mohu zmínit konkrétně v ČR třeba konzultační firmu EY. Pro menší firmy chystáme velmi brzy oficiální spuštění samoobslužné integrace skrze internetovou službu Dativery.
Nakolik je pokrok umělé inteligence (hluboké učení, různé typy neuronových sítí…) umožněn prostě pokrokem hardwaru, např. grafickými procesory nebo přímo procesory specializovanými na AI?
Výkonný hardware zde samozřejmě hraje významnou roli, ale zdaleka nejde jen o něj. Když se ohlédneme zpět za jednotlivými průlomy v oblasti umělé inteligence, většinou přínos rychlejšího hardware a lepších algoritmů vychází 1:1.
Jako příklad můžeme vzít Elis, což rozhodně není produkt, kde bychom jenom poskládali několik open source komponent a zabalili je do hezkého hávu. Občas se pojem umělá inteligence používá spíše jako marketing, ale Elis opravdu vyvíjíme na základě nejnovějších vědeckých poznatků z oboru AI, čteme v Rossumu neustále nejnovější vědecké články a zkoušíme nové metody. Nakonec jako zakladatelé Rossumu jsme se potkali právě v akademickém prostředí při studie umělé inteligence, na postgraduálu na ČVUT. Takže jsme třeba nejdříve v Rossumu zkoušeli používat existující OCR programy, ale nakonec nám vyšlo zdaleka nejlépe i základní úlohu převodu obrázku na text vyřešit zcela vlastními silami. Máme na to neuronové sítě speciálně navržené, aby fungovaly dobře na obchodních dokumentech s hodně neuniformním rozložením. Samotný proces hledání informací je úplně unikátní i vzhledem k vědecké literatuře, vychází ale z metod strojového vidění – inspirovali jsme se v dokumentech tím, co dobře funguje v robotice nebo samořídících autech.
Elis by tedy nemohla fungovat bez toho, abychom věnovali opravdu hodně práce vývoji nových algoritmů. Zároveň by ale bylo úplně nemyslitelné naše hodně složité neuronové sítě používat právě bez rychlého hardware na bázi grafických procesorů – i na nejvýkonnějších cloudových serverech teď každá nová obrátka tréninku trvá několik dní.
Na jakých datech vlastně systém učíte a jak zdokonalujete, když jde vlastně o důvěrná data. V jaké podobě máte faktury pro učení systému (např. by se jistě hodilo mít faktury zákazníka, abyste viděli, kde systém selhal, ale lze to? Musíte nějak složitě pak řešit ochranu osobních údajů apod.?)
Ochranu dat samozřejmě bereme hodně vážně. Skutečně, pokud si má systém “zvyknout” na faktury konkrétního dodavatele a dojít v přesnosti až na lidskou úroveň, musíme trénovací vzorky takových faktur uchovávat. Proto je pro nás důležité zabezpečení dat, zároveň se s velkými zákazníky můžeme dohodnout, jaký stupeň archivace je ideální.
Když mluvíme o osobních údajích, každého hned napadne zkratka GDPR a navíc třeba v Německu jsou na toto ještě citlivější než v ČR. Ve sféře B2B faktur ale na dokladech mnoho osobních údajů nebývá, nebo jsou ryze obchodního charakteru. Navíc data používáme jen pro další trénink, ne pro žádné marketingové nebo ani statistické účely.
Když zmiňujete počátky firmy, jak start-up Rossum.ai vlastně vznikal a získal finance. Pomohl vám v tomto např. inkubátor ČVUT nebo jiný z inkubátorů, akcelerátorů apod.?
Prošli jsme akcelerátorem Startup Yard a posléze získali na rozjezd finance od startupového studia Miton.