在科技飛速發(fā)展的今天,數(shù)據(jù)量正呈現(xiàn)出井噴式的增長態(tài)勢。據(jù)國際數(shù)據(jù)公司(IDC)預(yù)測,2025年全球?qū)a(chǎn)生213ZB數(shù)據(jù)(1ZB=10億TB),2029年數(shù)據(jù)量將再次翻倍。傳統(tǒng)硅基存儲技術(shù)(如硬盤、閃存等)正陷入存儲密度逼近物理極限、能耗成本高、介質(zhì)壽命有限等多重瓶頸,基于現(xiàn)有技術(shù)預(yù)計5年內(nèi)將只有不到1%的數(shù)據(jù)可被保存。在ZB級數(shù)據(jù)洪流的沖擊下,研究開發(fā)新型數(shù)據(jù)存儲技術(shù)勢在必行。而此時,一種全新的存儲技術(shù)——DNA數(shù)據(jù)存儲,正逐漸嶄露頭角,有望引領(lǐng)數(shù)據(jù)存儲從“硅基”向“碳基”的重大轉(zhuǎn)變。
一、DNA數(shù)據(jù)存儲介紹
DNA數(shù)據(jù)存儲是利用人工合成的脫氧核糖核酸(DNA)作為信息載體的前沿存儲技術(shù)。作為生物體遺傳信息的天然存儲器,DNA由四種核苷酸構(gòu)成,分別是腺嘌呤(A)、胸腺嘧啶(T)、鳥嘌呤(G)、胞嘧啶(C)四種堿基,可以翻譯成二進(jìn)制中的00(A)、01(T)、10(G)、11(C)。在數(shù)據(jù)寫入時,先將文本、圖片等信息翻譯成二進(jìn)制代碼,再將二進(jìn)制代碼轉(zhuǎn)換為堿基的四進(jìn)制序列,然后通過人工合成技術(shù)生成對應(yīng)的DNA分子,并放到適宜環(huán)境中保存,從而實現(xiàn)數(shù)據(jù)的高密度存儲。當(dāng)數(shù)據(jù)讀取時,再通過DNA測序技術(shù)反向操作即可。

圖片來源:擎科生物公眾號
圖1 DNA數(shù)據(jù)存儲及讀取流程圖
二、發(fā)展歷程
DNA數(shù)據(jù)存儲的發(fā)展并非一蹴而就,而是經(jīng)歷了多個關(guān)鍵的技術(shù)突破階段。
早期探索階段——從概念構(gòu)想到實驗突破。20世紀(jì)60年代,美國麻省理工學(xué)院教授維納與蘇聯(lián)物理學(xué)家涅曼率先提出“遺傳記憶”概念,大膽設(shè)想將DNA作為信息存儲載體,為DNA數(shù)據(jù)存儲技術(shù)播下理論種子。但受限于當(dāng)時落后的DNA測序與合成技術(shù),這一構(gòu)想長期停留在紙面。直到1988年,哈佛大學(xué)教授戴維斯成功設(shè)計并合成含18個核苷酸的DNA片段,完成DNA存儲的首次實驗驗證,標(biāo)志著該技術(shù)從理論走向?qū)嵺`,開啟了科研界對DNA存儲的探索之路。
突破性發(fā)展階段——從實驗可行到實踐可行。2012年,哈佛大學(xué)教授丘奇采用短鏈DNA進(jìn)行編碼,成功將一本659kb的書籍內(nèi)容轉(zhuǎn)化為DNA序列,最終測序結(jié)果僅出現(xiàn)22個錯誤。2016年,微軟和華盛頓大學(xué)的研究人員對外公布,其利用DNA存儲技術(shù)成功實現(xiàn)了約200MB數(shù)據(jù)的保存,包括《戰(zhàn)爭與和平》在內(nèi)的100部文學(xué)作品。這些成果首次證明DNA能夠存儲大容量數(shù)據(jù),充分展現(xiàn)了其作為存儲介質(zhì)的巨大潛力。
快速迭代階段——技術(shù)革新與成本優(yōu)化。2025年,麻省理工學(xué)院的研究團(tuán)隊研發(fā)出一種新型聚合物材料,能夠在室溫環(huán)境下實現(xiàn)DNA的長期穩(wěn)定保存。同年,中國科學(xué)院北京基因組研究所(國家生物信息中心)等單位科研人員提出了一種經(jīng)濟(jì)高效的存儲方法——DNA活字噴墨打印機(jī)“畢昇一號”。該技術(shù)以預(yù)制短DNA片段為存儲單元,每個片段存1字節(jié)信息,通過酶連接組裝成DNA活字塊,類似于畢昇印刷術(shù)的“活字重組邏輯”,通過標(biāo)準(zhǔn)化預(yù)制片段的靈活拼接實現(xiàn)信息的高效存儲與組合。“畢昇一號”成功實現(xiàn)各類數(shù)字文件的高效存儲與精準(zhǔn)還原,解碼準(zhǔn)確率達(dá)100%,并且無需從頭合成DNA序列進(jìn)行編碼,將DNA活字存儲成本降至122美元/MB(主流DNA存儲3500美元/MB),推動DNA存儲技術(shù)邁向?qū)嵱没?/p>

圖片來源:中國科學(xué)院北京基因組研究所(國家生物信息中心)官網(wǎng)
圖2 “畢昇一號”DNA活字存儲流程圖
三、優(yōu)勢分析
與傳統(tǒng)數(shù)據(jù)儲存方式相比,DNA數(shù)據(jù)存儲主要具有以下三大優(yōu)勢:
超高存儲密度:DNA數(shù)據(jù)存儲的超高存儲密度堪稱“數(shù)據(jù)存儲界的奇跡”,1克DNA就能容納約215PB的數(shù)據(jù)(約1000萬小時高清視頻),理論上一噸DNA即可存儲全球現(xiàn)有數(shù)據(jù)總量,遠(yuǎn)超傳統(tǒng)硬盤或磁帶的容量極限。
超長存儲壽命:DNA具有高度穩(wěn)定性,在適宜條件下,可保存數(shù)千年乃至更久。近年科學(xué)家曾從格陵蘭島凍土中成功提取200萬年前的DNA序列,其中信息仍歷歷可辨。相比硬盤等傳統(tǒng)存儲介質(zhì)幾年到十幾年的使用壽命,DNA存儲優(yōu)勢顯著。
超低能耗:傳統(tǒng)數(shù)據(jù)中心每存儲1PB數(shù)據(jù),每年的耗電量大致在8萬-30萬度電;與之相比,DNA數(shù)據(jù)存儲僅在DNA合成、編碼過程中產(chǎn)生少量能耗,一旦數(shù)據(jù)寫入完成,僅需基礎(chǔ)的冷藏保存條件,后續(xù)能耗幾乎可忽略不計。
四、面臨的挑戰(zhàn)
存儲成本高。當(dāng)下,主流DNA存儲多以化學(xué)合成堿基來寫入數(shù)據(jù),過程復(fù)雜、耗時久且成本高。雖然以“畢昇一號”為代表的創(chuàng)新技術(shù)已將DNA活字存儲成本降至122美元/MB,但與傳統(tǒng)硬盤、閃存每MB不到0.01美元的成本相比,仍存在巨大差距。
讀寫速度慢。相較于硬盤、閃存等讀寫速度最快可達(dá)到數(shù)百/數(shù)千MB/S,DNA存儲寫入速度目前每天僅能達(dá)到MB量級,讀取速度同樣遲緩。傳統(tǒng)DNA存儲依賴逐條合成與測序,在DNA合成過程中,每添加一個堿基所需時間大約為0.1秒鐘,這使得整體寫入過程極為緩慢。
DNA合成出現(xiàn)錯誤。在DNA合成過程中易出現(xiàn)堿基缺失錯誤,每堿基發(fā)生率約0.2%~1%。這類缺失會導(dǎo)致序列閱讀框移位,進(jìn)而使解碼時數(shù)據(jù)出現(xiàn)連貫性偏差,為準(zhǔn)確還原存儲信息帶來巨大挑戰(zhàn)。此外,合成中還可能伴隨少量堿基插入或替換錯誤,進(jìn)一步增加了數(shù)據(jù)解碼的復(fù)雜性。
技術(shù)標(biāo)準(zhǔn)不統(tǒng)一。目前DNA數(shù)據(jù)存儲技術(shù)尚未形成統(tǒng)一的行業(yè)執(zhí)行標(biāo)準(zhǔn),不同的實驗室科研人員和企業(yè)使用者在操作DNA存儲介質(zhì)時,無法按照同樣的方式來進(jìn)行DNA存儲和讀取,這阻礙了DNA信息存儲技術(shù)走向商業(yè)化應(yīng)用的進(jìn)程。
五、發(fā)展趨勢及對策建議
DNA存儲的獨特優(yōu)勢正促使其應(yīng)用領(lǐng)域不斷拓展。在長期冷數(shù)據(jù)(國家歷史檔案、珍貴文物資料等)存儲方面,其超長存儲時間和高存儲密度特性使其成為理想選擇。在航天領(lǐng)域,低能耗、高穩(wěn)定性和高存儲密度讓它有望用于存儲航天器飛行數(shù)據(jù)、科學(xué)實驗數(shù)據(jù)等。在醫(yī)療健康領(lǐng)域,能用于長期保存患者個體基因數(shù)據(jù)。未來DNA存儲將走進(jìn)千家萬戶,在數(shù)據(jù)存儲市場占據(jù)重要地位,與傳統(tǒng)存儲方式共同構(gòu)建多元化存儲格局。
建議加快推動DNA數(shù)據(jù)存儲技術(shù)與人工智能、生物信息學(xué)等前沿技術(shù)的交叉融合,通過跨學(xué)科協(xié)同創(chuàng)新突破技術(shù)瓶頸;積極開展與大型數(shù)據(jù)中心、醫(yī)療機(jī)構(gòu)等合作,以應(yīng)用場景驅(qū)動技術(shù)迭代;同時,加強(qiáng)國際間技術(shù)交流與合作,共同推動DNA數(shù)據(jù)存儲技術(shù)標(biāo)準(zhǔn)制定與應(yīng)用推廣,加速新技術(shù)的成熟與普及。期待DNA數(shù)據(jù)存儲技術(shù)在未來能夠徹底改變數(shù)據(jù)存儲格局,開啟一個全新的“碳基”存儲時代。
參考文獻(xiàn)
[1]董一名,孫法家,武瑞君,錢瓏.DNA數(shù)字信息存儲的研究進(jìn)展[J].合成生物學(xué),2021,2(3):323-334.
[2]DNA存儲技術(shù)及其在檔案信息存儲中應(yīng)用的可能[EB/OL].https://mp.weixin.qq.com/s/-nDb4qK3wWQda0pk-oO2pg
[3]基因合成驅(qū)動DNA存儲:開啟萬億數(shù)據(jù)存儲的新時代[EB/OL].
https://mp.weixin.qq.com/s/0nP3E4_GVFCnUJY_5zEV8w
作者介紹
趙瑞鑫
中級經(jīng)濟(jì)師
長期關(guān)注研究生物經(jīng)濟(jì)、醫(yī)藥健康等領(lǐng)域,深度參與《北京合成生物發(fā)展現(xiàn)狀及未來發(fā)展路徑研究》《北京市“十五五”時期生物醫(yī)藥產(chǎn)業(yè)發(fā)展分析服務(wù)》《完善北京市支持創(chuàng)新藥械發(fā)展的監(jiān)管和支付機(jī)制研究》等多項北京市相關(guān)產(chǎn)業(yè)研究、政策制定等咨詢服務(wù),獲2025年北京市優(yōu)秀咨詢成果獎一等獎1項。
嚴(yán)一凡
咨詢師
長期關(guān)注研究生物經(jīng)濟(jì)領(lǐng)域,深度參與《國家生物制造產(chǎn)業(yè)創(chuàng)新中心創(chuàng)新能力建設(shè)項目》《北京合成生物發(fā)展現(xiàn)狀及未來發(fā)展路徑研究》等多項生物領(lǐng)域咨詢項目,在北京市生物產(chǎn)業(yè)戰(zhàn)略規(guī)劃、政策制定等方面擁有豐富實踐,獲2025年北京市優(yōu)秀咨詢成果獎一等獎1項。
編輯:張 華
審核:蘭國威