Použití trojkové soustavy pro kódování dat v DNA je zajímavé. Samotná DNA obsahuje 4 číslice, takže je jedna číslice možná použita jako oddělovač slov nebo pro kontrolu integrity? Ale čtení DNA je hodně otravná práce. Četl jsem článek o délce DNA a informacích v ní uložených kde se zmínili, že lidský genom má pouze cca 700 mb, ale DNA sekvencer při čtení vytvoří cca 200 gb dat plných metadat a dalšího zbytečného odpadu. Ruční čtečky DNA jsou ještě daleko.
O sekvenátorech (ne sekvencerech, když tak anglicky sequencing) něco vím. Skoro všechny metody sekvenování, kromě Sangera a těch posledních jako Nanopore a BioPac jsou výrazně omezeny délkou tzv. čtení - úsek DNA, který jsou schopny kontinuálně převést na sekvenci písmen. Výsledná podoba - originální DNA (i když spíš odhad blížící se 100%) se skládá až z těch čtení na základě jejich překryvů - proto jich je hodně. Pro další zájem se hodí termína sekvenování, Illumina, sequencing atd. Jsou i na youtube videa.
http://www.osel.cz/9749-zazraky-na-pockani-kapesni-ctecka-dna-precetla-cely-lidsky-genom.html
Loose s kolegy načetli s MinIONem celkem 91,2 Gb dat o sekvencích, což představuje asi 30-násobek velikosti celého lidského genomu. Zároveň vyvinuli nový protokol, díky němuž MinION zvládne číst ultradlouhé kusy DNA najednou, až do délky téměř 900 tisíc bází.