(c) Graphicstock

Umělá inteligence předvídá nové termoelektrické materiály

AI jako vědec, algoritmus se sám předtím zvládl naučit fyziku a chemii.

Na Lawrence Berkeley National Laboratory (spadá pod Ministerstvo energetiky USA) nechali algoritmus přečíst celou záplavu vědeckých studií, které byly v posledních desetiletích publikovány na téma termoelektrických materiálů. Cílem však v tomto případě nebylo, aby program provedl redakční práci a vytvořil ze záplavy dat nějaký pro člověka srozumitelný souhrn (viz také: Kniha o bateriích napsaná umělou inteligencí příliš nenadchla), ale skutečně udělat z programu vědce – měl dokázat předpovědět nové poznatky.
Algoritmus Word2vec přitom na počátku nebyl žádným expertním systémem, tj. neměl žádné znalosti v oblasti věd o materiálech. Všechny informace o chemických prvcích a jejich sloučeninách si musel sám získat, chemii i fyziku (zejména krystalografii, magnetismus atd.) se učil prostě analýzou slov, jak se vyskytovaly blízko sebe v různých textech. Program celkem prošel 3,3 milionů abstraktů vědeckých článků, trénink neprováděli lidští experti na obor. Word2vec zpracovával asi půl milionu slov a základní strukturou, v níž reprezentoval své znalosti, byl vektor ve 200 rozměrech. Tímto způsobem se počítala vazba-vzdálenost mezi jednotlivými slovy. Laicky: vzdálenost jednotlivých prvků/sloučenin apod. od určitých slov charakterizujících termoelektrické materiály pak (nějak) odpovídala tomu, s jakou pravděpodobností bude látka termoelektrická.
Program takto dokázal navrhnout nové materiály – takové, které měly k pojmu termoelektrický blíž než ty známé. Samozřejmě nevíme, zda jde o správné tipy. O úspěšnosti programu bylo třeba rozhodnout jinak. Výzkumníci mu v další fázi poskytli abstrakty článků pouze do roku 2000 (v několika verzích se datum posouvalo) a zkoumali, zda učiní nějaký mezitím uskutečněný/potvrzený objev. Tímto způsobem program vybral několik látek, ty se v následných studiích vyskytovaly 4krát pravděpodobněji, než kdyby byly vybrány náhodně. Kromě vysloveně úspěšných tipů (3 z 5 nejnadějnějších s daty do roku 2008) občas program navrhl jako kandidáty na termoelektrické materiály takové látky, které sice mají požadované vlastnosti, ale nejsou vhodné z jiných důvodů – např. jsou toxické nebo příliš drahé (2 z top 5). Tyto výsledky jsou podle autorů studie velmi nadějné, vědci je sami nečekali.
Algoritmus tedy nefunguje pouze jako shrnutí pro vědce, kteří se nedokáží prokousat záplavou dat, ale zde i vědecké objevy přímo sám dělá. Neměl by být problém program přesadit do jiného oboru a nechat ho procházet abstrakty i zde. Součástí studie je i publikace 50 nejnadějnějších dosud neznámých termoelektrických materiálů, které navrhuje program Word2vec.

Vahe Tshitoyan, John Dagdelen, Leigh Weston, Alexander Dunn, Ziqin Rong, Olga Kononova, Kristin A. Persson, Gerbrand Ceder, Anubhav Jain. Unsupervised word embeddings capture latent knowledge from materials science literature. Nature, 2019; 571 (7763): 95 DOI: 10.1038/s41586-019-1335-8
Zdroj: ScienceDaily

Exotická fyzika neutronových hvězd: jaderné těstoviny a odkapávání protonů

Neutronové hvězdy jsou extrémní objekty, do jejichž nitra nevidíme. S poloměrem kolem 12 kilometrů mohou …

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *