Kompletní osekvenování lidského genomu bylo sice oznámeno už v roce 2003, ale toto tvrzení platilo jen s určitými výhradami. Asi 8 % genomu ve skutečnosti scházelo, a to především proto, že se skládá z vysoce repetitivních (opakujících se) kusů DNA, které se obtížně analyzují.
Tři roky staré vědecké konsorcium T2T (Telemere-to-Telomere Consortium; telomera = koncová část chromozomu) nyní doplnilo i zbývající části DNA a poskytlo vědcům i lékařům první sekvenci lidského genomu opravdu bez mezer.
Nově dokončený genom (tzv. T2T-CHM13) má představovat zásadní vylepšení současného referenčního genomu (GRCh38), který používají lékaři při hledání mutací spojených s nemocemi a vědci zabývající se evolucí lidských genetických variací. Nově přečtené sekvence DNA mj. ukazují dosud neznámé podrobnosti o oblasti kolem centromery („zaškrcení“, které chromozom dělí na krátké a dlouhé rameno). O významu události svědčí i to, že vedle textu v dubnovém Science (viz zdroj níže) byly na toto téma publikovány i další 4 články v dubnovém Nature Methods. Na projektu se podílel tým více než 100 lidí.
Verze všech 22 autozomů a pohlavního chromozomu X bez mezer, kterou konsorcium vytvořilo, se skládá z 3 055 miliardy párů bází a 19 969 genů kódujících bílkoviny. Tým nalezl přibližně 2 000 nových genů, z nichž většina je deaktivována, ale 115 z nich se může stále projevovat. Nové přečtené sekvence DNA v centromeře a jejím okolí tvoří přibližně 6,2 % celého genomu, tedy téměř 190 milionů nukleotidů. Ze zbývajících nově přidaných sekvencí se většina nachází kolem telomer na konci každého chromozomu a v oblastech obklopujících ribozomální geny.
Nově přečtený lidský genom pocházel z nezhoubného („nerakovinného“, non-cancerous) nádoru, tzv. hydatidiformního mateřského znaménka. Jde v podstatě o embryo, které odmítlo mateřskou DNA a namísto toho duplikovalo tu otcovskou. Taková „embrya“ odumírají a mění se v „nádory“. To, že příslušné buňky měly dvě identické kopie otcovské DNA, obě s mužským chromozomem X, usnadnilo jejich sekvenování. Vědci souběžně dokončili také kompletní sekvenování chromozomu Y z jiného zdroje; sestavení sekvence trvalo téměř stejně dlouho jako zbytku genomu dohromady. Analýza této nové sekvence chromozomu Y se objeví v některé z budoucích publikací.
Autoři výzkumu již také nový referenční genom použili pro porovnání DNA centromer u 1 600 jedinců z celého světa. Najevo vyšly velké rozdíly v sekvenci i počtu kopií repetitivní DNA v okolí centromery. Předchozí studie ukázaly, že když skupiny dávných lidí migrovaly z Afriky do zbytku světa, vzaly si s sebou jen malý vzorek genetických variací (tj. většina genetické variability existuje v rámci Afriky). Stejný výsledek platí i pro centromery, alespoň co se týče chromozomu X.
Za úspěchem projektu T2T stojí vedle vynaloženého úsilí (a financování) především zdokonalené techniky sekvenování dlouhých úseků DNA najednou, což pomáhá při určování pořadí vysoce repetitivních úseků DNA. Mezi nové metody patří sekvenování HiFi společnosti PacBio, které dokáže s vysokou přesností přečíst úseky o délce více než 20 000 párů bází. Technologie vyvinutá společností Oxford Nanopore Technologies zase dokáže přečíst sekvenci až několika milionů párů bází, avšak s menší přesností. Pro srovnání, tzv. sekvenování nové generace společnosti Illumina bylo dosud omezeno na čtení stovek párů bází v jedinom kroku.
Vedoucími projektu T2T byli Karen Miga z Kalifornské univerzity v Santa Cruz, Evan Eichler z Washingtonské univerzity a Adam Phillippy z National Human Genome Research Institute.
Nicolas Altemose et al, Complete genomic and epigenetic maps of human centromeres, Science (2022). DOI: 10.1126/science.abl4178. www.science.org/doi/10.1126/science.abl4178
Zdroj: University of California – Berkeley / MedicalXpress.com
Poznámka PH: Z přečtených krátkých sekvencí lze celou sekvenci získat pomocí analýzy překryvů. Problém ale je, pokud se určité stejné nebo skoro stejné části opakují za sebou (zejména opakují-li se mnohokrát). To jsou právě ony „repetitivní sekvence“.