Genetický kód jistě nevznikl najednou ve své současné podobě. Především se zdá pravděpodobné, že ze dvaceti běžných aminokyselin se počátečního formování organického biosvěta účastnila asi jen polovina (Gly, Ala, Asp, Glu, Val, Ser, Ile, Leu, Pro, Thr), zatímco ty ostatní, s odvozenějšími a složitějšími dráhami syntézy, se přidávaly později. Naopak, prvních deset patří mezi běžné produkty reakcí v ještě abiotickém prostředí.
Všimněme si, kde se tyto aminokyseliny v proteinech vyskytují a jaká je jejich úloha. Často se jedná o aminokyseliny, které vytvářejí strukturní motivy proteinů důležité pro udržení tvaru a oporu. Naopak, na formování funkčních částí katalytických center se podílejí zejména aminokyseliny „modernější“, tedy histidin, arginin, asparagin, tyrosin, serin, lysin. Je tedy možné, že prvotní funkcí aminokyselin a jejich shluků v předbuněčném světě nebyla přímo katalýza, ale spíše role ve stabilizaci již existujících katalytických struktur ribozymů.
Velmi důležitý je fakt, že posloupnost nukleotidů v DNA nebo RNA může přímo vázat aminokyseliny. Nejedná se o nic neobvyklého, nekovalentní interakce mohou vznikat mezi jakýmikoliv vhodnými partnery, a i dnešní DNA a RNA s proteiny komunikují na mnoha různých úrovních. Vykazuje-li RNA ribozymovou aktivitu, může katalyzovat vytváření vazeb mezi přichycenými aminokyselinami a dochází k syntéze peptidu. Některé aminokyseliny se tak skutečně mohou na triplety nukleotidů v RNA vázat a preference pro určité kodony či antikodony u nich byla prokázána. Tento jev byl popsán především u aminokyselin se složitějšími postranními řetězci. Jenže ty se k univerzálnímu genetickému kódu přidružily až později a nepatří k těm zcela původním aminokyselinám, o kterých jsme hovořili výše. Vzhledem k širším možnostem složitějších aminokyselin obecně vytvářet bohatší spektrum nekovalentních interakcí jejich vazba na RNA není nijak překvapivá a nemusí souviset s původním stavem vývoje genetického kódu. Přesto význam přímé interakce mezi těmito dvěma typy biomolekul při úvahách o vzniku kódu zatratit nelze, naopak, vzájemné vazby aminokyselin a nukleových kyselin jej podmiňují.
Při hledání jednoduššího stadia genetického kódu je možné nahlédnout na systém, který není založen na tripletech, ale na dvojicích nukleotidů. Tento jednodušší dupletový (dvojicový) kód je zajímavý tím, že samozřejmě dostačuje pro rozlišení původních asi 10 aminokyselin (připomeňme si, že poskytuje celkem 16 možností poskládání čtyř bází do rozdílných dvojic: AA, AG, AC, AU, GA, GG, GC, GU, CA, CG, CC, CU, UA, UG, UC a UU). Význam třetího znaku jako by nabyl na důležitosti až s nástupem zbývajících aminokyselin. Ostatně jsme již zmiňovali, že třetí pozice často nese nulovou nebo jen omezenou informační hodnotu (aminokyseliny serin, leucin, prolin, arginin, threonin, alanin a glycin jsou kódovány de facto jen dvěma prvními nukleotidy, které jednoznačně určují aminokyselinu – třetí nukleotid v tripletu kodonu může být jakýkoliv).
Dupletový kód může být přechodným článkem směrem k modernímu stavu. Na druhou stranu ovšem nese tato představa i svá úskalí. Za prvé vazba mezi aminokyselinami a oligonukleotidy bude jistě tím silnější, čím budou úseky delší a budou nabízet různorodější povrch k interakci. Primárně tripletový kód by tudíž mohl být výhodnější od samého počátku, jelikož vazebný povrch není tvořen pouze dvěma, ale třemi nukleotidy. Za druhé může být velice obtížný přechod od dupletového k tripletovému kódu vzhledem k nutnému posunu čtecího rámce. Podívejme se, jak moc bude změněn smysl nesené informace, pokud přejdeme od dupletového ke kódu tripletovému: např. od AA GU CG GG CU UA k AAG UCG GGC UUA. Pravděpodobnost, že v obou případech bude výsledkem translace identický protein, je mizivá, i když uvážíme, že třetí pozice kodonu není důležitá.
Jakým způsobem však probíhala evoluce raného genetického kódu, nevíme, a je možné, že nakonec i scénář přechodu od dvojicového k trojicovému kódu je možný. Není nutné, aby byl kód čten přímo jeden nukleotid za druhým. Způsob posunu a prostorové možnosti vazebných míst katalyzátorů mohly vybírat třeba každou druhou dvojici, nebo čtené dvojice byly tak jako tak oddělovány jedním nukleotidem. To by odpovídalo i do dneška zachovanému nízkému významu třetí pozice. Je tedy možné, že gen byl čten a překládán následujícím způsobem, kde malá písmena značí nukleotidy nepřekládané a velká ty, jež jsou faktickými kodony: GCgGCuGCaUCa. Kód je sice dupletový, ale zápis je funkčně tripletový.
Kódování aminokyselin
V abiotických systémech se nejběžněji vyskytují glycin, alanin, aspartát, glutamát a valin. Zajímavé je, že první bází v tripletu, který je kóduje, je guanin. Dvojice guanin-cytosin se tak jeví jako do značné míry primární, jak uvidíme vzápětí. Dále, kodony zmiňovaných aminokyselin se liší na druhé pozici – GU připadá valinu, GC alaninu, GG glycinu a GA aspartátu a glutamátu (v proteinech tyto dvě aminokyseliny sdílejí velice podobné vlastnosti, jsou polární a nesou záporný náboj – do jisté míry jsou zaměnitelné a pravděpodobně jejich rozlišení nebylo zcela zásadní ani v dávné minulosti). Třetí pozice může být obsazena jakýmkoliv nukleotidem, aniž by byl změněn význam kodonu. Pozorujeme tak výše popsanou situaci – klíčové jsou první dva nukleotidy tripletu, třetí pouze přispívá k vytvoření dostatečně pevné interakce mezi kodonem a antikodonem, což je potřebné vzhledem k časovému průběhu výstavby peptidové vazby mezi aminokyselinami nesenými transferovou RNA.
Náhrada guaninového nukleotidu na první pozici jinými vedla k rozšíření genetického kódu. Postupně se připojily izoleucin a leucin, zachovávajíce na druhé pozici uracil, dále threonin, serin a prolin (uprostřed kodonu C), glutamin, asparagin a lysin (expanzí významu tripletů s adenosinem uprostřed), a nakonec další aminokyseliny, přičemž nejmladšími nováčky jsou patrně methionin a tryptofan, kódované vždy pouze jediným kodonem. Shrneme-li postupné nabývání významu jednotlivých pozic v kodonu, primárně byla nesena informace pozicí 2, pak 1, a nakonec 3.
V nedávné době se objevil názor, že původní kód byl přece jen tripletový, ale že v prvotním stadiu byly využívány jen dvě z nukleových bází, a to cytosin a guanin. Vazby mezi C a G jsou pevnější než A-U a výsledné molekuly RNA, tvořené jen C a G, jsou stabilnější. Patrná je zejména vyšší odolnost k vysokým teplotám, což se zvláště v prostředí hydrotermálních pramenů může hodit. Analýza prastarých genů (pro tRNA) ukazuje, že v nich skutečně C a G převládají. Navržen byl tedy model, ve kterém původní stav kodonů sestavených jen z C a G umožňoval kódování pouze několika aminokyselin, ale ty patří mezi základní a přítomné v prostředí hydrotermálních pramenů či asteroidů. Teprve následné a postupné začlenění dvojice adenin-uracil rozšířilo a obohatilo možnosti genetického kódu vzhledem k začlenění všech 20 biogenních aminokyselin. Který z uvažovaných modelů je blíže skutečnému průběhu událostí, zatím nevíme.
tento text je úryvkem z knihy
Vladimir Rudajev: Příběh buňky. Od molekul ke vzniku života a prvním organismům
Academia 2022
O knize na stránkách vydavatele
Poznámka PH: Knihu rozhodně doporučuji všem zájemcům o evoluční biologii (a biochemii).
Takhle ten výňatek působý jako takové samoúčelné filozofování. Předpokládám ale, že je to jen důsledek toho, že je to výňatek, a tak schází spousta dat. Jsou ve zbytku knihy uváděny nějaká pozorování, experimenty, měření a podobné podklady, na základě kterých dochází k závěrům které předkládá?
Třeba hned první věta: „Genetický kód jistě nevznikl najednou ve své současné podobě.“ – Celkem logická úvaha. Geny v plné parádě jsou moc komplexní, aby mohly nějak uvěřitelně vzniknout. Tudíž super rešerže, že „šlo by to takto“. Jsou k tomu přiloženy nějaké odkazy na experimenty a jejich výsledky? Matematické/počítačové simulace? A tak?