Software dokáže najít aktivní místa na povrchu proteinu, kde se mohou vázat malé molekuly (ligandy). Jejich identifikace je nezbytná pro vývoj většiny léčiv, včetně léku na onemocnění COVID-19.
Počítačové metody jsou dnes nedílnou součástí procesu hledání nových léčiv, zvláště pak v tzv. racionálním vývoji léčiv. Zde se vědci snaží identifikovat funkční sloučeniny s ohledem na znalost struktur a funkcí, molekulárních cílů, které jsou v systému narušovány, nebo které naopak zdravé procesy narušují.
Informatici z Matematicko-fyzikální fakulty UK vyvinuli nástroj P2Rank určený k predikci tzv. protein-ligand aktivních míst. Software dokáže na povrchu zadané proteinové struktury najít místa, jež jsou s vysokou pravděpodobností schopna vázat nespecifikované malé molekuly, tzv. ligandy.
„Vzhledem k tomu, že prakticky všechny procesy v živých organismech zprostředkovávají proteiny, identifikace těchto míst je důležitá, protože umožňuje navrhovat malé sloučeniny, které tak mohou modifikovat biochemické procesy, jichž se tyto proteiny účastní. To je ostatně způsob, jakým funguje naprostá většina současných léků,“ vysvětluje vedoucí projektu David Hoksza z Katedry softwarového inženýrství MFF UK. Léky představují právě tyto malé molekuly, které se navážou na makromolekulární cíl, a tím znemožní replikaci viru v buňce nebo jeho interakci s hostitelským organismem.
Nový software je založen na strojovém učení a dokáže se z velké trénovací sady známých protein-ligand komplexů naučit, jaké vlastnosti typicky mají místa na povrchu proteinů, které jsou schopny ligand vázat. Tuto znalost pak aplikuje v procesu identifikace aktivních míst.
Nástroj vznikl ve spolupráci s Přírodovědeckou fakultou a do jeho vývoje jsou zapojeni také studenti informatiky a bioinformatiky, společného studijního programu MFF UK a PřF UK. Software je nyní volně k dispozici jako webový server a také jako samostatná aplikace, která je určena náročnějším uživatelům.
„Předností tohoto nástroje je, že poskytuje výrazně kvalitnější predikce než ostatní volně přístupné nástroje podobného typu. Navíc je snadno použitelný, uživateli stačí zadat cílový protein a za několik okamžiků vidí predikovaná aktivní místa přímo na zadané struktuře. Díky tomu jej mohou okamžitě využívat akademické týmy z celého světa,“ zmiňuje hlavní výhody softwaru dr. Hoksza.
P2Rank už byl využit v rámci několika studií zaměřených na výzkum nového typu koronaviru a vývoj léku na COVID-19, mimo jiné sloužil k mapování tzv. spike proteinu, který SARS-CoV-2 používá k navázání a vstupu do hostitelské buňky. Nepomáhá však pouze v boji s koronavirem, ale také s jinými typy onemocnění, byl například využit k identifikaci potenciálních makromolekulárních cílů v bakterii Chlamydia trachomatis, která bývá nejčastější příčinou oslepnutí vlivem infekce.
Týmu se také podařilo navázat spolupráci s evropskou Protein Data Bank (PDBe), centrálním úložištěm 3D struktur makromolekul, s níž P2Rank sdílí predikce o zhruba 130 tisících proteinových strukturách.
„Od prvního kroku uplynulo už deset let, nicméně vývoj byl častokrát přerušovaný a soustavněji se posouvá zhruba od roku 2018. Aktuálně máme plně funkční produkt a teď se zaměřujeme na vylepšení jeho funkcionalit a rozšíření do dalších oblastí detekce biologicky zajímavých částí proteinů,“ nastiňuje další plány dr. Hoksza.