龜甲、宣紙、磁(ci)帶、硬盤……
數據怎么存、存在哪
始終是(shi)人們孜孜以求的問題
時代變遷,社會發展
我們的(de)生(sheng)活每天都在產(chan)生(sheng)海(hai)量數據
傳統硅基材料
難(nan)以滿足日益增長的數據存儲(chu)需求
北京大學張成、錢瓏團隊(dui)
與合作者另辟蹊徑
以表觀修飾作為(wei)存儲介(jie)質
通過分(fen)子信息并行寫(xie)入實現信息存儲
為這道(dao)難題提出新的解法(fa)
10月23日
團隊研究成果已發表于Nature

△研究(jiu)成果已正式發表于Nature
1公斤便可“裝下”全世界
2024年10月23日,北(bei)京大學計(ji)算機學院張(zhang)成與(yu)定量(liang)生物學中(zhong)心錢瓏(long)聯合研(yan)究團隊(dui)與(yu)合作者,在(zai)國(guo)(guo)際學術期刊(kan)Nature上(shang)(shang)發表題為“Parallel molecular data storage by printing epigenetic bits on DNA”的研(yan)究論文,首次提出了一種基于(yu)并(bing)行寫入策(ce)略的DNA存(cun)儲策(ce)略,成功將(jiang)信息(xi)打印(yin)在(zai)DNA分子之上(shang)(shang),猶如(ru)“活(huo)字(zi)印(yin)刷(shua)”,在(zai)白紙上(shang)(shang)批量(liang)印(yin)刷(shua)信息(xi)。團隊(dui)在(zai)實驗中(zhong),成功將(jiang)中(zhong)國(guo)(guo)漢代“白虎”瓦(wa)當和大熊貓的高清圖片(數(shu)據量(liang)超過27.5萬比(bi)特)寫入DNA分子中(zhong),并(bing)無(wu)損還(huan)原(yuan)了原(yuan)始數(shu)據,解(jie)析出高清圖片。
DNA具有超高(gao)存儲密度,僅(jin)1克(ke)DNA就足以(yi)(yi)存儲1000萬小時(shi)高(gao)清視(shi)頻數(shu)據;1公斤DNA,便可以(yi)(yi)裝下全世界(jie)數(shu)據。此外(wai),如果避免潮濕和紫外(wai)線照射,DNA可以(yi)(yi)保存數(shu)十萬年之久,擁有超長壽命。相比之下,硬盤往往需要每(mei)隔幾年更換一次以(yi)(yi)防止數(shu)據損(sun)壞。因此,DNA顯(xian)示出作為顛覆性存儲介質的巨大潛力。
然(ran)而,傳統DNA存(cun)儲(chu)依賴“從頭合成”的(de)(de)信息(xi)寫入路線(xian),在成本和(he)速度上(shang)面(mian)臨著(zhu)“速度慢”“易出錯”“價格貴(gui)”的(de)(de)多重巨大(da)挑戰(zhan)。不(bu)同于傳統技術(shu)路線(xian),張成-錢瓏(long)聯合團(tuan)隊開發的(de)(de)“表觀比特(epi-bit)”DNA存(cun)儲(chu)技術(shu),利用預制(zhi)的(de)(de)DNA模板和(he)“分(fen)子活(huo)字(zi)塊”,通(tong)過DNA自(zi)組裝介(jie)導(dao)的(de)(de)分(fen)子信息(xi)排版,經選擇(ze)性酶促甲基修飾轉移,實現了“活(huo)字(zi)印(yin)刷”,達到分(fen)子級“信息(xi)打印(yin)”的(de)(de)目的(de)(de)。
該技術(shu)不(bu)依賴(lai)于(yu)主流(liu)的“從頭合(he)成”寫入路(lu)線原理,通(tong)過DNA自組裝與選擇性酶(mei)促(cu)甲(jia)基化(DNA分子(zi)的一(yi)種表觀(guan)遺(yi)傳修飾(shi))的組合(he)原理,無需(xu)合(he)成,就像在(zai)紙上(shang)印(yin)(yin)(yin)刷文字(zi)。首(shou)先(xian),研(yan)究團隊設計并(bing)預制(zhi)通(tong)用的單(dan)鏈DNA載(zai)體和(he)互補短(duan)單(dan)鏈DNA“文字(zi)庫(ku)”。然后,通(tong)過將“文字(zi)庫(ku)”裝到DNA載(zai)體的相同加載(zai)序列(lie)上(shang),任意(yi)表觀(guan)比特(te)信息就得以(yi)被排版。接下來,堿基修飾(shi)(5-甲(jia)基胞(bao)嘧啶)通(tong)過酶(mei)的選擇性甲(jia)基化以(yi)并(bing)行的方式(shi)穩定地“打印(yin)(yin)(yin)”在(zai)DNA載(zai)體上(shang),一(yi)場(chang)精(jing)密、高效(xiao)的“分子(zi)印(yin)(yin)(yin)刷術(shu)”就大功告(gao)成了(le)。
這種(zhong)被稱為(wei)“表觀(guan)比(bi)特(te)(te)”類似于(yu)傳統的比(bi)特(te)(te),以兩個(ge)二(er)進制數值中(zhong)的一個(ge)(0或(huo)1)來存(cun)儲信(xin)息,對應(ying)堿基是(shi)否(fou)甲基化。研究團隊通過(guo)使用(yong)有限(xian)的700種(zhong)DNA活字和5個(ge)模(mo)板進行編程,在自(zi)動平(ping)臺上(shang)實現了約(yue)27.5萬(wan)個(ge)比(bi)特(te)(te)的免(mian)合(he)成寫(xie)(xie)入,每個(ge)反應(ying)的寫(xie)(xie)入輸出(chu)為(wei)350比(bi)特(te)(te),遠(yuan)超過(guo)去依賴DNA從頭合(he)成的數據存(cun)儲系(xi)統每個(ge)反應(ying)約(yue)僅1比(bi)特(te)(te)的輸出(chu)量,實現了重大突破。
同時,這一研究還(huan)成功實現(xian)了個人定(ding)制DNA存(cun)(cun)儲示例,證(zheng)明了便捷的分布式(shi)DNA存(cun)(cun)儲應(ying)用潛力。該方法的建(jian)立(li),不僅為實現(xian)了快(kuai)速、低成本的大規模分子數(shu)據存(cun)(cun)儲奠定(ding)了技術(shu)基礎,還(huan)為未來DNA存(cun)(cun)儲的發展(zhan)提供了全新思(si)路。

基于表觀(guan)比特條碼的高位并行大規模存儲示(shi)意
“這項技術的核心突破在(zai)于(yu),我們能夠通過預(yu)制(zhi)的DNA模板和活(huo)字塊,在(zai)分子底(di)層以排(pai)版的方(fang)式打印epi-bit信息,實(shi)現分子數(shu)據(ju)的精確并(bing)行寫(xie)入,進而完成大規(gui)模并(bing)行DNA存(cun)儲。”論(lun)文(wen)通訊(xun)作者、北(bei)京大學研(yan)究員(yuan)張成介紹(shao)說,“與傳統DNA數(shu)據(ju)存(cun)儲方(fang)法相比(bi),這種活(huo)字印刷并(bing)行寫(xie)入方(fang)式僅需有限數(shu)量(liang)的預(yu)制(zhi)DNA分子,從(cong)而避免了復雜繁瑣DNA序列編(bian)碼過程,不僅大幅降(jiang)低分子信息寫(xie)入復雜度(du),還能降(jiang)低成本,提高操控(kong)靈(ling)活(huo)性。”
把照片“存在”DNA里
團隊(dui)在(zai)實(shi)驗中,將中國漢(han)代“白虎”瓦當和(he)國寶大(da)熊貓“飛(fei)云”的高清圖片(pian)(pian)成(cheng)功寫入(ru)DNA分子(zi)(zi)中,數(shu)據(ju)(ju)量(liang)超(chao)過27.5萬比特,相比此前(qian)發(fa)表(biao)的其他非傳統DNA存儲技術,數(shu)據(ju)(ju)規(gui)模提升(sheng)超(chao)過300倍。這些(xie)信(xin)息讀取(qu)使用便攜式納米孔(kong)測序儀,實(shi)現(xian)了對DNA模板上復(fu)雜表(biao)觀(guan)比特信(xin)息的高通(tong)(tong)量(liang)讀取(qu),并通(tong)(tong)過單次超(chao)240種不同修飾模式的并行解(jie)析,無損還原(yuan)了原(yuan)始數(shu)據(ju)(ju),解(jie)析出高清圖片(pian)(pian),真正有望實(shi)現(xian)“經典永流傳”。實(shi)驗結果驗證了該創新型(xing)分子(zi)(zi)存儲技術的可行性和(he)準確(que)性,還展示了表(biao)觀(guan)比特的穩(wen)定性。
值得(de)關注的是(shi),團隊還展示了(le)這項技術的分(fen)布(bu)式(shi)存儲應用(yong)潛力。在個(ge)人(ren)定制DNA存儲實驗中,邀請了(le)北京大(da)(da)學(xue)、華(hua)北電力大(da)(da)學(xue)等單(dan)位60名(ming)背景廣泛的青年志愿者,由他們在日(ri)常(chang)環境下,將(jiang)私(si)人(ren)數據親手寫入DNA并由個(ge)人(ren)保存。這些數據直到使(shi)用(yong)時才被讀取(qu),可(ke)有效保障個(ge)人(ren)數據的隱私(si)與安全。這種(zhong)分(fen)布(bu)式(shi)DNA存儲方式(shi),不僅能極(ji)大(da)(da)降低DNA存儲的使(shi)用(yong)門檻,且(qie)保障了(le)數據隱私(si),有望(wang)推動DNA存儲的個(ge)人(ren)應用(yong)。

表觀比特(te)DNA存儲原理流程和實驗結果
從(cong)二進制數據(ju)(ju)到DNA數據(ju)(ju),從(cong)從(cong)頭合成到并行(xing)寫入,從(cong)DNA存(cun)儲(chu)(chu)池到細胞存(cun)儲(chu)(chu),從(cong)二代測(ce)序(xu)到納米孔測(ce)序(xu)……在(zai)多維技(ji)術的(de)(de)突破性革命與(yu)融(rong)會貫(guan)通下,誕(dan)生了(le)如今(jin)的(de)(de)表(biao)觀比特(te)DNA存(cun)儲(chu)(chu)框架(jia),這(zhe)一(yi)框架(jia)為(wei)大規模(mo)數據(ju)(ju)存(cun)儲(chu)(chu)提供了(le)全(quan)新的(de)(de)解決方案,有(you)望突破DNA存(cun)儲(chu)(chu)的(de)(de)成本和速度壁壘。此項技(ji)術的(de)(de)開發,還展現了(le)非傳統(tong)(tong)分子比特(te)在(zai)數據(ju)(ju)存(cun)儲(chu)(chu)中的(de)(de)獨特(te)優勢,為(wei)未來新型分子信息(xi)處理系統(tong)(tong)的(de)(de)研發奠(dian)定了(le)堅實的(de)(de)基(ji)礎。
“在DNA這張白紙上批量(liang)打印信息,代表著DNA存儲技術的(de)重要突(tu)破(po)與革新(xin)。”論文通訊作(zuo)者(zhe)、北京大學研究員錢瓏(long)表示,“可(ke)預見的(de)是,在未來,無論身(shen)處何(he)時(shi)何(he)地,我們(men)都(dou)將無需依賴大型實驗儀器,就能實現(xian)簡單、準確(que)、高(gao)效的(de)DNA數據存儲。”
① 凡本(ben)站(zhan)(zhan)注(zhu)明“稿(gao)件來(lai)源:中(zhong)國(guo)教育在線(xian)”的所(suo)有(you)文字、圖片和(he)音視頻稿(gao)件,版權(quan)均屬本(ben)網(wang)所(suo)有(you),任何媒(mei)體(ti)、網(wang)站(zhan)(zhan)或(huo)個(ge)人未(wei)經本(ben)網(wang)協議授權(quan)不得轉載(zai)、鏈接(jie)、轉貼或(huo)以其他方(fang)式復制發(fa)表(biao)。已經本(ben)站(zhan)(zhan)協議授權(quan)的媒(mei)體(ti)、網(wang)站(zhan)(zhan),在下載(zai)使用時(shi)必須注(zhu)明“稿(gao)件來(lai)源:中(zhong)國(guo)教育在線(xian)”,違者本(ben)站(zhan)(zhan)將依法追(zhui)究責任。
② 本站注明(ming)稿件來源為其他媒體(ti)的文/圖等稿件均為轉(zhuan)載(zai)稿,本站轉(zhuan)載(zai)出(chu)于(yu)非商業性(xing)的教育和科(ke)研之目的,并(bing)不(bu)意味著(zhu)贊同其觀點或證實其內容的真實性(xing)。如轉(zhuan)載(zai)稿涉及版權等問題,請作者在兩周內速(su)來電(dian)或來函聯系(xi)。




中國教育在線
