Ukládání digitálních dat DNA - DNA digital data storage

Ukládání digitálních dat DNA je proces kódování a dekódování binárních dat do a ze syntetizovaných řetězců DNA .

Zatímco DNA jako paměťové médium má díky své vysoké hustotě skladování obrovský potenciál, její praktické využití je v současné době velmi omezené kvůli vysokým nákladům a velmi pomalým dobám čtení a zápisu.

V červnu 2019 vědci oznámili, že všech 16 GB textu z anglické verze Wikipedie bylo zakódováno do syntetické DNA .

Bez buněk

V současné době je nejrozšířenější používanou technologií sekvenování DNA vyvinutá společností Illumina, která zahrnuje imobilizaci jednovláknové DNA na pevném nosiči, amplifikaci sekvencí polymerázovou řetězovou reakcí (PCR) a značení jednotlivých bází DNA komplementárními bázemi označenými fluorescenční markery (viz sekvenování barviva Illumina ). Fluorescenční obrazec (jiná barva pro každou ze čtyř bází DNA) může být poté zachycen na obrázku a zpracován k určení sekvence DNA. Nedávno vyvinutou alternativou je technologie nanopórů, ve které molekuly DNA procházejí póry v nano měřítku pod kontrolou ratchetovacího enzymu. Průchod molekul DNA způsobuje malou změnu elektrického proudu, kterou lze měřit. Hlavní výhodou technologie nanopórů je, že je lze číst v reálném čase. Přesnost čtení této technologie je však v současné době pro ukládání dat nedostatečná.

In vivo

Genetický kód v živých organismech může být potenciálně kooptován pro ukládání informací. Kromě toho lze syntetickou biologii použít k inženýrství buněk pomocí „molekulárních zapisovačů“, což umožní ukládání a získávání informací uložených v genetickém materiálu buňky. Editaci genu CRISPR lze také použít k vložení umělých sekvencí DNA do genomu buňky.

Dějiny

Myšlenka ukládání digitálních dat DNA se datuje do roku 1959, kdy fyzik Richard P. Feynman ve "Ve spodní části je spousta místa: pozvánka ke vstupu do nového oboru fyziky" nastínil obecné vyhlídky na vytváření umělých objektů podobné objektům mikrokosmu (včetně biologických) a které mají podobné nebo dokonce rozsáhlejší schopnosti. V letech 1964–65 publikoval Michail Samoilovič Neiman , sovětský fyzik, 3 články o mikrominiaturizaci v elektronice na molekulárně-atomové úrovni, které samostatně představily obecné úvahy a některé výpočty týkající se možnosti záznamu, ukládání a získávání informací o syntetizované DNA a Molekuly RNA. Po zveřejnění prvního článku MS Neimana a poté, co redaktor obdržel rukopis jeho druhého příspěvku (8. ledna 1964, jak je uvedeno v tomto příspěvku), byl zveřejněn rozhovor s kybernetikem Norbertem Wienerem. N. Wiener vyjádřil myšlenky o miniaturizaci paměti počítače, blízké myšlenkám, navržené nezávisle MS Neimanem. Tyto Wienerovy myšlenky MS Neiman zmínil ve třetím ze svých příspěvků. Tento příběh je podrobně popsán.

K jednomu z prvních použití skladování DNA došlo ve spolupráci 1988 umělce Joe Davise a výzkumníků z Harvardu. Obraz uložený v sekvenci DNA v E.coli byl uspořádán v matici 5 x 7, která po dekódování vytvořila obraz starověké germánské runy představující život a ženskou Zemi. V matici ty odpovídaly tmavým pixelům, zatímco nuly odpovídaly světlým pixelům.

V roce 2007 bylo na univerzitě v Arizoně vytvořeno zařízení využívající adresující molekuly ke kódování míst nesouladu v řetězci DNA. Tyto nesoulady pak bylo možné přečíst provedením restrikčního souhrnu, čímž se data obnoví.

V roce 2011 George Church, Sri Kosuri a Yuan Gao provedli experiment, který by zakódoval knihu o 659 kb, jejímž spoluautorem je Church. Za tímto účelem provedl výzkumný tým korespondenci dva ku jedné, kde binární nula byla reprezentována buď adeninem nebo cytosinem a binární jedna byla reprezentována guaninem nebo thyminem. Po vyšetření bylo v DNA nalezeno 22 chyb.

V roce 2012 George Church a kolegové z Harvardské univerzity publikovali článek, ve kterém byla DNA zakódována digitálními informacemi, které obsahovaly návrh HTML 53 400 slovní knihy napsané vedoucím výzkumníkem, jedenáct obrázků JPG a jeden program JavaScript. Bylo přidáno více kopií pro nadbytečnost a do každého kubického milimetru DNA lze uložit 5,5 petabitů . Vědci použili jednoduchý kód, kde byly bity mapovány jedna ku jedné se základnami, což mělo ten nedostatek, že to vedlo k dlouhým běhům stejné báze, jejichž sekvenování je náchylné k chybám. Tento výsledek ukázal, že kromě jiných funkcí může být DNA také dalším typem paměťového média, jako jsou pevné disky a magnetické pásky.

V roce 2013 článek vedený výzkumnými pracovníky z Evropského institutu pro bioinformatiku (EBI) a předložený přibližně ve stejnou dobu jako papír Církve a kolegů podrobně ukládal, vyhledával a reprodukoval více než pět milionů bitů dat. Všechny soubory DNA reprodukovaly informace mezi 99,99% a 100% přesností. Hlavními novinkami v tomto výzkumu bylo použití kódovacího schématu opravujícího chyby k zajištění extrémně nízké míry ztráty dat, stejně jako myšlenka kódování dat v sérii překrývajících se krátkých oligonukleotidů identifikovatelných pomocí schématu indexování založeného na sekvenci . Sekvence jednotlivých řetězců DNA se také překrývaly takovým způsobem, že každá oblast dat se opakovala čtyřikrát, aby se předešlo chybám. Dva z těchto čtyř pramenů byly konstruovány dozadu, také s cílem eliminovat chyby. Náklady na megabajt byly odhadnuty na 12 400 $ na kódování dat a 220 $ na načítání. Bylo však poznamenáno, že exponenciální pokles nákladů na syntézu DNA a sekvenování, pokud bude pokračovat do budoucnosti, by měl do roku 2023 zajistit, aby byla technologie nákladově efektivní pro dlouhodobé ukládání dat.

V roce 2013 vyvinul Manish K.Gupta a spolupracovníci software DNACloud pro kódování počítačových souborů do jejich reprezentace DNA. Implementuje verzi algoritmu navrženou Goldmanem et al. S efektivitou paměti. pro kódování (a dekódování) dat do DNA (soubory .dnac).

Dlouhodobá stabilita dat kódovaných v DNA byla hlášena v únoru 2015 v článku výzkumníků z ETH Zurich . Tým přidal nadbytečnost pomocí kódování pro korekci chyb Reed-Solomon a zapouzdřením DNA do koulí ze silikonového skla pomocí chemie Sol-gel .

V roce 2016 byl publikován výzkum Church and Technicolor Research and Innovation, ve kterém bylo uloženo 22 MB MPEG komprimované filmové sekvence a získáno z DNA. Bylo zjištěno, že obnovení sekvence má nulové chyby.

V březnu 2017 publikovali Yaniv Erlich a Dina Zielinski z Kolumbijské univerzity a New York Genome Center metodu známou jako DNA Fountain, která ukládala data v hustotě 215 petabajtů na gram DNA. Tato technika se blíží Shannonově kapacitě ukládání DNA a dosahuje 85% teoretického limitu. Metoda nebyla připravena pro použití ve velkém měřítku, protože syntéza 2 megabajtů dat stojí 7 000 $ a její čtení dalších 2 000 $.

V březnu 2018 University of Washington a Microsoft zveřejnily výsledky demonstrující ukládání a načítání přibližně 200 MB dat. Výzkum také navrhl a vyhodnotil metodu náhodného přístupu k datovým položkám uloženým v DNA. V březnu 2019 stejný tým oznámil, že předvedl plně automatizovaný systém pro kódování a dekódování dat v DNA.

Výzkum publikovaný Eurecom a Imperial College v lednu 2019 prokázal schopnost ukládat strukturovaná data do syntetické DNA. Výzkum ukázal, jak kódovat strukturovaná nebo konkrétněji relační data v syntetické DNA, a také ukázal, jak provádět operace zpracování dat (podobné SQL ) přímo na DNA jako chemické procesy.

V červnu 2019 vědci oznámili, že všech 16 GB Wikipedie bylo zakódováno do syntetické DNA .

První článek popisující ukládání dat o nativních sekvencích DNA pomocí enzymatického nickingu byl publikován v dubnu 2020. V příspěvku vědci demonstrují novou metodu záznamu informací do páteře DNA, která umožňuje bitový přístup s náhodným přístupem a výpočet v paměti.

Bitcoinová výzva Davos

21. ledna 2015 Nick Goldman z Evropského institutu pro bioinformatiku (EBI), jeden z původních autorů dokumentu Nature 2013 , oznámil Davos Bitcoin Challenge na výročním zasedání Světového ekonomického fóra v Davosu. Během jeho prezentace byly rozdány publiku zkumavky DNA se zprávou, že každá zkumavka obsahovala soukromý klíč přesně jednoho bitcoinu , všechny kódované v DNA. První, kdo sekvenoval a dekódoval DNA, mohl získat bitcoin a vyhrát výzvu. Výzva byla stanovena na tři roky a skončila by, pokud by cenu nikdo nepřevzal do 21. ledna 2018.

Téměř o tři roky později, 19. ledna 2018, EBI oznámil, že belgický doktorand Sander Wuyts z Antverpské univerzity a Vrije Universiteit Brussel byl prvním, kdo výzvu dokončil. Vedle instrukcí o tom, jak žádat o Bitcoin (uložené jako prostý text a soubor PDF ), logo EBI, logo společnosti, která tištěného DNA (CustomArray) a náčrt Jamese Joyce byly získány z DNA.

DNA věcí

Koncept DNA věcí (DoT) představil v roce 2019 tým výzkumníků z Izraele a Švýcarska, včetně Yaniva Erlicha a Roberta Grassa. DoT kóduje digitální data do molekul DNA, které jsou pak vloženy do objektů. To dává možnost vytvářet objekty, které nesou svůj vlastní plán, podobný biologickým organismům. Na rozdíl od internetu věcí , což je systém vzájemně propojených výpočetních zařízení, DoT vytváří objekty, které jsou nezávislými objekty úložiště, zcela mimo síť .

Jako důkaz koncepce DoT výzkumník 3D vytiskl stanfordského zajíce, který obsahuje svůj plán v plastovém vláknu použitém pro tisk. Když králíkovi uřízli malý kousek ucha, byli schopni přečíst plán, rozmnožit ho a zplodit další generaci králíčků. Kromě toho byla schopnost DoT sloužit pro steganografické účely prokázána výrobou nerozlišitelných čoček, které obsahují video z YouTube integrované do materiálu.

Viz také

Reference

Další čtení