Konkrétní sekvence aminokyselin sice určuje vlastnosti výsledné bílkoviny, ale rozhodně ne způsobem, který by byl na první pohled nějak zvlášť zřejmý. Následně se protein skládá do složitých struktur se sekundární i terciální konformací a z toho vyplývající funkcí. Ze samotného pořadí aminokyselin těžko poznat, zda výsledek bude fungovat jako hemoglobin nebo jako kolagen. Navíc některé proteiny se pak mohou sestavovat i spolu s dalšími látkami nebo navzájem do ještě složitějších komplexů.
Lidský odborník samozřejmě prací v oboru získá určitou zkušenost, respektive intuici, která mu umožní něco o chování proteinu odhadnout i ze samotné sekvence. Totéž lze naučit i systémy umělé inteligence. Nová studie porovnává právě prediktivní schopnosti lidského experta a programu. Jako lidský odborník se v souboji zúčastnil Vikas Nanda z Rutgersovy univerzity, který se speciálně proteiny zabývá přes 20 let, dále vědci z Argonne National Laboratory v Illinois a další specialisté. Umělá inteligence celkově triumfovala, byť její výsledky byly lepší jen mírně. Strojové učení má tedy v této oblasti obrovský potenciál, protože tyto systémy se mohou dále podstatně rychleji vylepšovat.
Hlavní motivací pro tento výzkum není analýza proteinů známých, ale návrh nových podle zadání – tj. jaká sekvence by po sbalení do příslušné 3D struktury měla požadované vlastnosti (účinné léčivo, katalyzátor určité reakce apod.). Co se pak týče ještě složitějších „superstruktur“ z více proteinů, ty se uplatňují např. při neurodegenerativních chorobách (priony, amyloidové plaky při Alzheimerově chorobě), některé viry z nich mají své obaly (kapsidy) atd.
V experimentu dostali V. Nanda a jeho pět kolegů seznam proteinů a měli předpovědět, které z nich se pravděpodobně samy složí právě do takových superstruktur. Vědci takto vybrali 11 proteinů, počítačový program 9; v obou skupinách bylo správně 6 odpovědí. Lidé měli údajně tendenci upřednostňovat některé aminokyseliny (třeba na základě toho, že vědí, jak jsou hydrofilní/hydrofobní nebo kyselé/zásadité), program se dokázal trefit u proteinů, kde by to odborníci nečekali.
Rohit Batra et al, Machine learning overcomes human bias in the discovery of self-assembling peptides, Nature Chemistry (2022). DOI: 10.1038/s41557-022-01055-3
Zdroj: Rutgers University / Phys.org a další