DNA是個(gè)生物數(shù)據(jù)庫(kù),存儲(chǔ)著我們體內(nèi)的海量基因代碼?茖W(xué)家發(fā)現(xiàn),它的這種能力其實(shí)還可以用來(lái)存儲(chǔ)外部信息,一克DNA即能儲(chǔ)存上千億個(gè)千兆字節(jié),相當(dāng)于1000億G的內(nèi)容。 近日,哈佛大學(xué)維斯生物工程研究所的研究人員將一本大約有5.34萬(wàn)個(gè)單詞的書籍編碼到不到一沙克(億萬(wàn)分之一克)的DNA(脫氧核糖核酸)微芯片中,連同文字一起的還有11張圖片和一段Java程序。這是迄今為止人類使用DNA遺傳物質(zhì)儲(chǔ)存數(shù)據(jù)量最大的一次實(shí)驗(yàn),被刊登在最新《科學(xué)》期刊上。團(tuán)隊(duì)負(fù)責(zé)人喬治·丘齊(GeorgeChurch)表示:“今后,拇指大小的設(shè)備或許就能存下整個(gè)互聯(lián)網(wǎng)的信息。” DNA存儲(chǔ)的“野心” “利用DNA來(lái)存儲(chǔ)數(shù)據(jù)并不是一個(gè)新的概念。事實(shí)上,自從生物學(xué)確定了DNA結(jié)構(gòu),就有研究人員嘗試將其用于存儲(chǔ)和運(yùn)算。北京華大基因研究中心醫(yī)學(xué)事業(yè)部主任甄二真告訴記者。 他介紹,DNA由4種堿基組成,分別為A(腺嘌呤)、C(胞嘧啶)、G(鳥嘌呤)及T(胸腺嘧啶),它們兩兩互補(bǔ)成對(duì)出現(xiàn),共同構(gòu)成了相互纏繞的雙鏈螺旋結(jié)構(gòu)。DNA可以被視為四位運(yùn)算存儲(chǔ)方式,存儲(chǔ)量比二位運(yùn)算存儲(chǔ)大得多。 “目前通用的存儲(chǔ)模式都是二位運(yùn)算的。為了存儲(chǔ)更多數(shù)據(jù),早已有科學(xué)家嘗試過(guò)使用物理方法實(shí)現(xiàn)四位運(yùn)算。但是技術(shù)上難以實(shí)現(xiàn),只能出現(xiàn)"有"、"無(wú)"、"中間"三種狀態(tài),也就是三位運(yùn)算,無(wú)法實(shí)際操作!闭缍嬲f(shuō),與之相比,DNA是天然的四位運(yùn)算,有四個(gè)不同狀態(tài),與二位運(yùn)算相比存儲(chǔ)量大、運(yùn)算速度也快得多。 處于信息爆炸的時(shí)代,很多科學(xué)家嘗試以DNA存儲(chǔ)數(shù)據(jù)。比如今年年初,臺(tái)灣國(guó)立清華大學(xué)和德國(guó)卡爾斯魯厄技術(shù)研究所以三文魚的DNA作為基礎(chǔ),制造出單次寫入多次讀取的存儲(chǔ)器。不過(guò),這個(gè)DNA存儲(chǔ)器的有效時(shí)長(zhǎng)只有30小時(shí)。 甄二真表示,這些DNA無(wú)法長(zhǎng)期存儲(chǔ)數(shù)據(jù)是因?yàn)檠芯咳藛T使用的是來(lái)自活細(xì)胞的基因組,這些細(xì)胞不僅會(huì)死亡,而且還會(huì)分裂復(fù)制,對(duì)其中存儲(chǔ)的數(shù)據(jù)有致命性打擊。 合成DNA:改變存儲(chǔ)模式 為了排除細(xì)胞會(huì)死亡、分裂、變異而使數(shù)據(jù)內(nèi)容發(fā)生改變的危險(xiǎn),丘奇率領(lǐng)的團(tuán)隊(duì)避免使用活細(xì)胞,而是采用人工合成的DNA片段,并將片段用噴墨打印機(jī)嵌入到芯片上。 這一次,丘奇選擇存儲(chǔ)在合成DNA片段上的信息是他的著作《再生:合成生物學(xué)將如何改變未來(lái)的自然和自己》。首先,他把書中的圖片、文字、程序轉(zhuǎn)化為HTML格式的文件,再將其編譯為由0和1組成的電腦能夠讀懂的二進(jìn)制數(shù)據(jù)。隨后,這些二進(jìn)制數(shù)據(jù)被轉(zhuǎn)化為四種堿基,即把0轉(zhuǎn)為A或C,把1轉(zhuǎn)成G或者T,并將其建立在DNA雙鏈螺旋結(jié)構(gòu)上來(lái)。 至于讀取數(shù)據(jù)的過(guò)程其實(shí)就是測(cè)序,通過(guò)DNA測(cè)序儀將DNA序列中的編碼按順序排列,還原為二進(jìn)制格式的數(shù)據(jù),用電腦“讀”出來(lái)。 盡管聽起來(lái)很復(fù)雜,甄二真表示其中重要一步就是將二進(jìn)制數(shù)據(jù)轉(zhuǎn)化為4位運(yùn)算數(shù)據(jù)(A、C、G、T),做成DNA鏈結(jié)構(gòu),這可以使存儲(chǔ)量按級(jí)數(shù)增長(zhǎng)。而以經(jīng)化學(xué)反應(yīng)得到的合成DNA取代活細(xì)胞使得這項(xiàng)研究成果更符合現(xiàn)實(shí)意義。此前以細(xì)胞內(nèi)DNA來(lái)存儲(chǔ)信息一直無(wú)法取得技術(shù)突破,只能在短期內(nèi)保證數(shù)據(jù)安全,此次轉(zhuǎn)換思路是被《科學(xué)》認(rèn)可的關(guān)鍵。 突破傳統(tǒng)存儲(chǔ)的極限 與目前流行的存儲(chǔ)方式相比,DNA存儲(chǔ)的最大優(yōu)勢(shì)就是單位存儲(chǔ)量大。北京郵電大學(xué)信息與通信工程學(xué)院副教授陳光表示,現(xiàn)在使用的光介質(zhì)和磁介質(zhì)在存儲(chǔ)量上都幾乎達(dá)到了極限,這就需要研究其他存儲(chǔ)方式,比如DNA存儲(chǔ)這樣的生物介質(zhì)。 他告訴記者,磁介質(zhì)包括磁帶、磁盤、硬盤等。硬盤的存儲(chǔ)量可達(dá)上百G,但由于現(xiàn)在硬盤數(shù)據(jù)存儲(chǔ)密度提升的空間已經(jīng)有限,基本不太可能出現(xiàn)單碟1000G的硬盤,所以如果硬盤體積不變,容量難以實(shí)現(xiàn)大幅突破。而CD、DVD等光介質(zhì)存儲(chǔ)對(duì)表面積的要求更大,磁介質(zhì)可以分幾層存儲(chǔ)數(shù)據(jù),光介質(zhì)只能單層平鋪保存信息,單位存儲(chǔ)量更小。 DNA可以很好地解決這一存儲(chǔ)量的問(wèn)題。甄二真表示,這不僅與四位運(yùn)算的特性有關(guān),也與DNA特有的雙鏈螺旋結(jié)構(gòu)有關(guān)。這一結(jié)構(gòu)可以把DNA序列壓縮得足夠小,整個(gè)立體空間都可以利用,比磁介質(zhì)和光介質(zhì)的平面存儲(chǔ)更具優(yōu)勢(shì)。按照哈佛團(tuán)隊(duì)給出的數(shù)據(jù),“一克DNA即能儲(chǔ)存上千億個(gè)千兆字節(jié),相當(dāng)于1000億G的內(nèi)容”。 此外,合成DNA的穩(wěn)定性也很優(yōu)秀。陳光介紹,磁介質(zhì)是建立在電磁的基礎(chǔ)上,工作環(huán)境受到限制,容易出現(xiàn)消磁等現(xiàn)象;而光介質(zhì)受環(huán)境影響小一些,但耐久性不理想。與這兩者相比,合成DNA不存在細(xì)胞死亡、變異等影響,在室溫下很穩(wěn)定,甚至可以存放數(shù)萬(wàn)年而不變。 來(lái)源:北京青年報(bào) |