Báze DNA nabízejí teoreticky obrovskou hustotu záznamu. Často diskutované jsou projekty DNA počítačů, DNA však nemusí fungovat jen jako aktivní výpočetní prvek, ale také hrát roli úložiště.
Vědci z Columbia University a New York Genome Center nyní demonstrovali, kolik dat lze do DNA vlastně uložit a jak by při tom šlo postupovat. Výsledky byly publikovány v Science (autoři Yaniv Erlich a Dina Zielinskiová).
Pro konkrétní distribuci dat byly použity tzv. fontánové kódy, které podporují kompresi i opravu chyb. Data byla uspořádána do „shluků“, které nadto měly předřazeny speciální návěstí, aby se dalo jednoduše poznat, kam příslušná část v rámci celku patří. Přitom se navíc vzaly v úvahu i samotné vlastnosti DNA, takže bity se na „písmenka“ ACGT mapovaly způsobem, aby se předešlo řetězcům, které jsou při sestavování a čtení/kopírování speciálně náchylné ke vzniku chyb.
Z dat, které takto výzkumníci chtěli uložit, nakonec vznikl seznam 72 000 řetězců DNA, každý o délce 200 bází. Podle pokynů (dosud jsme na úrovni klasických souborů s jedničkami a nulami) pak kalifornský start-up Twist Bioscience provedl vlastní syntézu řetězců DNA a příslušné datové médium poté poslal zadavatelům v lahvičce.
Pomocí moderních sekvenovacích technologií se podařilo dodanou informaci bezchybně přečíst a zrekonstruovat do původní binární podoby. Informaci v DNA lze pomocí technik jako PCR dále kopírovat s dostatečnou přesností; prakticky se ověřilo, že z kopií DNA z lahvičky, ba i z kopií kopií, dokázali vědci stále bezchybně rekonstruovat původní soubor.
Hustota záznamu v tomto experimentu dosáhla 215 petabajtů dat na gram DNA, což řádově překonává obdobné pokusy uskutečněné v nedávné minulosti. Na 1 bázi DNA (4 možnosti) lze uložit až 2 bity informace, nicméně další úvahy (redundance kvůli opravě chyb) ukazují, že teoretické maximum je spíše kolem 1,8 bitů na bázi DNA. Nyní se podařilo dosáhnout hodnoty 1,6 bitu, což už se teoretickému maximu blíží a představuje to každopádně opět zlepšení proti předcházejícím pokusům.
DNA dokáže být mimochodem v chladu a suchu jako datové médium také celkem trvanlivá. Podařilo se již takto přečíst genetickou informaci z nálezů starých téměř půl milionu let – i když k dinosauří DNA z Jurského parku to má zatím tedy celkem daleko.
Zbývá ovšem dodat, že DNA jako datové médium je v tuto chvíli stále velmi drahá – syntéza DNA pro uložení 2 MB dat stála 7 000 dolarů, čtení dat pak vyšlo na další 2 000 dolarů. Ceny sekvenování DNA sice klesají exponenciálně (něco jako Moorův zákon?), nicméně pro její syntézu to neplatí. Možné by bylo zvolit techniky syntézy DNA fungující s menší přesností a vylepšit opravné mechanismy, zkrátit molekuly DNA apod. (obecně „předat více práce do počítače“, kvůli snížení ceny se smířit s nižší hustotou záznamu na gram DNA…).
Zdroj: Phys.org