DNA Jako Flash Disk: Proč Zapisovat Digitální Data Do Genomu - Alternativní Pohled

Obsah:

DNA Jako Flash Disk: Proč Zapisovat Digitální Data Do Genomu - Alternativní Pohled
DNA Jako Flash Disk: Proč Zapisovat Digitální Data Do Genomu - Alternativní Pohled

Video: DNA Jako Flash Disk: Proč Zapisovat Digitální Data Do Genomu - Alternativní Pohled

Video: DNA Jako Flash Disk: Proč Zapisovat Digitální Data Do Genomu - Alternativní Pohled
Video: Jak vybrat nejlepší flešku (USB disk) 2024, Duben
Anonim

Nárůst objemu digitálních informací vede vědce k tomu, aby hledali kompaktnější způsoby jejich záznamu a uložení. A co by mohlo být kompaktnější než DNA? RIA Novosti společně s odborníkem zjistili, jak kódovat slova nukleotidy a kolik dat jedna molekula obsahuje.

Důvody-kódy

DNA je sekvence nukleotidů. Jsou pouze čtyři: adenin, guanin, tymin, cytosin. Ke kódování informací je každé z nich přiřazen číselný kód. Například thymin - 0, guanin - 1, adenin - 2, cytosin - 3. Kódování začíná skutečností, že všechna písmena, čísla a obrázky jsou převedeny do binárního kódu, tj. Sekvence nul a jedniček, a jsou již převedeny na posloupnost nukleotidů, tj. Kvartérní kód.

Před zakódováním dat do DNA je musíte převést do digitálního kódu / obrázku od RIA Novosti. Alina Polyanina
Před zakódováním dat do DNA je musíte převést do digitálního kódu / obrázku od RIA Novosti. Alina Polyanina

Před zakódováním dat do DNA je musíte převést do digitálního kódu / obrázku od RIA Novosti. Alina Polyanina.

Pouze tři nukleotidy mohou být použity k vytvoření kódu (ternární kód) a čtvrtý je rozdělit sekvence na části. Existuje možnost s konstrukcí bází ve formě binárního kódu, kdy dvě z nich odpovídají nule a dvě odpovídají jednomu.

Pro čtení se používá několik technik. Jedním z nejčastějších je to, že řetězec molekuly DNA je kopírován pomocí bází, z nichž každá má barevný štítek. Poté čte data velmi citlivý detektor a počítač použije barvy k rekonstrukci nukleotidové sekvence.

"Molekula DNA je velmi prostorná." Dokonce i v bakteriích obvykle obsahuje asi milion základen a v lidech až tři miliardy. To znamená, že každá lidská buňka obsahuje objem informací srovnatelných s kapacitou jednotky flash. A máme biliony takových buněk. V DNA lze zaznamenat velké množství dat, ale psaní a čtení z takového média je stále příliš pomalé a nákladné, “říká Alexander Panchin, Ph. D., vedoucí výzkumný pracovník Ústavu pro problémy s přenosem informací, pojmenovaný po A. A. Charkeviči, Ruské akademii věd.

Propagační video:

Hustota záznamu roste

V červnu 1999 časopis Nature publikoval článek amerických vědců, kteří vyvinuli techniku zasílání tajných zpráv pomocí DNA. Syntetizovali molekulu začleněním nukleotidové sekvence vytvořené pomocí kvartérního kódu. Tajná DNA ve směsi byla odeslána do jiné laboratoře. Její zaměstnanci pomocí speciálních chemických klíčů našli požadovanou molekulu a extrahovali z ní informace.

„Obecně existují dva přístupy k zaznamenávání údajů o DNA. První je, když syntetizujete zcela novou DNA pomocí chemického syntetizátoru. Na příkaz počítače jsou nukleotidy přidávány do roztoku v určitém pořadí a požadovaný řetězec bází postupně „roste“. Ve druhém případě jsou data zakódována v již existující DNA organismu, “vysvětluje Panchin.

V květnu 2010 skupina Craig Venter, která poprvé zmapovala lidský genom, zveřejnila příspěvek o vytvoření umělé bakterie. Jako základ vzali bakteriální buňku vyčištěnou z genomu a umístili zde vytvořenou sekvenci bází. Výsledkem je nová, docela aktivní a živá bakterie, která se liší od obvyklých pouze tím, že její DNA byla vytvořena ručně. Kromě toho tým demonstroval smysl pro krásu tím, že psal jejich jména a citace z klasiků pomocí kvartérního kódu v bakteriální DNA.

V roce 2012 skupina vedená molekulárním biologem Georgeem Churchem zaujala zásadnější přístup a DNA kódovala 52 000-slovní knihu Regenesis: Jak syntetická biologie znovuobjeví přírodu a sebe, několik obrázků a jeden program Java. Používali binární kód. Celkové množství dat bylo 658 kilobajtů. Bylo zjištěno, že hustota informací je téměř 1018 bytů na gram molekul. Pro srovnání, pevný disk o velikosti 1012 bajtů váží asi sto gramů. Hlavní nevýhodou této metody je nestabilita zaznamenaných informací.

„Molekula DNA má tendenci mutovat, což snižuje spolehlivost ukládání dat. Zejména pokud je nositelem DNA živá buňka schopná dělení: když se duplikuje DNA, obzvláště často se plazí chyby. Spolehlivost úložiště dat se zvýší, pokud máte tisíce kopií stejné zprávy. Nebo prostě uložte DNA, řekněme, do mrazničky. Při nízkých teplotách je schopnost molekuly mutovat výrazně snížena, “vysvětluje odborník.

Kromě toho se informace při čtení někdy ztratí. Chyby mohou být chemické povahy, pokud je k prvku připojena nesprávná báze nebo je vypočítána čistě, to je v závislosti na počítači.

Drahé, spolehlivé

V březnu 2017 časopis Science publikoval článek amerických vědců, kterým se podařilo napsat 2 * 1017 bytů na gram DNA. Biologové zdůrazňují, že neztratili jediný bajt. Jednoduše řečeno, to, co jsme zaznamenali, je to, co jsme dostali na výstupu.

Pro běžného uživatele ještě není k dispozici „genetická jednotka flash“, protože je velmi obtížné ukládat informace a rychlost čtení / zápisu je nízká. Vědci odhadují, že čtení jen jednoho megabajtu vyžaduje asi tři a půl tisíce dolarů a několik hodin času.

Mezi nepochybné výhody zaznamenávání informací o DNA patří obrovská hustota ukládání dat a stabilita nosiče - pouze při nízkých teplotách.