起源于幾千年前的中華“陰陽”思想,被應(yīng)用于今天的生物學(xué)技術(shù)領(lǐng)域,并可能逐步改變未來的大數(shù)據(jù)產(chǎn)業(yè)發(fā)展。這或許是中國科學(xué)家才能碰撞出的“科技+文化”火花。
4月25日,《自然-計算科學(xué)》(Nature Computational Science)發(fā)表華大研究成果,研究團(tuán)隊基于華大智造DNBSEQ-T7測序平臺開創(chuàng)了一套獨具優(yōu)勢的“陰陽”編解碼系統(tǒng),用以解決當(dāng)前DNA信息存儲領(lǐng)域的技術(shù)難題。
Nature Computational Science官網(wǎng)截圖
所有信息在計算機中只由二進(jìn)制的方式存儲,即0和1兩個數(shù)碼;
生物的遺傳信息則儲存在DNA中,以A、T、G、C四種堿基表現(xiàn)。
如果屏幕前的你是一位家長,在孩子學(xué)會這兩個知識點之后,或許可以引導(dǎo)他們思考:
倘若把信息語言的0和1,轉(zhuǎn)換為生物語言的ATGC,我們是不是就能把各類信息長久地保存在DNA中,讓DNA成為“完美”的存儲器了?
擅于把腦洞變?yōu)楝F(xiàn)實的科學(xué)家,已經(jīng)用實際研究成果對這個問題給出了樂觀的回答。
DNA憑什么碾壓現(xiàn)有信息存儲器?
科學(xué)家成功完成100萬年前猛犸象DNA測序
研究10年,科學(xué)家們還有什么煩惱?
DNA存儲流程圖,與傳統(tǒng)信息存儲的“信息寫入-保存-讀取”步驟類似
以中華“陰陽”思想,解DNA存儲難題
“陰陽”編解碼規(guī)則示意圖
機智的朋友可能會問,人工合成的DNA要保存在哪?目前,常用的保存方法分為體內(nèi)和體外兩種模式,兩者孰優(yōu)孰劣尚未形成明確定論。為了全方位驗證“陰陽”系統(tǒng)的信息恢復(fù)穩(wěn)定性,華大研究院團(tuán)隊通過體外DNA干粉和細(xì)胞體內(nèi)大片段兩種存儲環(huán)境進(jìn)行測試,皆實現(xiàn)了原始存儲數(shù)據(jù)的完整恢復(fù)。
體外模式,研究團(tuán)隊采用不同濃度的原始DNA文庫溶液進(jìn)行了共200多組測試。結(jié)果證明,“陰陽”編碼采用的線性數(shù)據(jù)恢復(fù)模式在每種DNA分子的平均拷貝數(shù)僅有100時,仍然能恢復(fù)最高88%的原始數(shù)據(jù)。而DNA噴泉碼使用的編碼方式使得每個數(shù)據(jù)包間存在一定的拓?fù)潢P(guān)聯(lián),在同樣條件下,平均恢復(fù)率僅有1.3%。
華大研究團(tuán)隊曾將《開國大典》影片存儲于DNA中從起步至今短短十年時間,DNA信息存儲領(lǐng)域已取得不少令人矚目的研究成果,包括檢索、修改等高級功能也已完成原理驗證性的測試,以微軟、谷歌等產(chǎn)業(yè)巨頭形成的DNA存儲聯(lián)盟更是在為其商業(yè)化廣泛合作蓄勢。
該研究由深圳華大生命科學(xué)研究院主導(dǎo),深圳國家基因庫、首都師范大學(xué)、美國哈佛大學(xué)等多個研究團(tuán)隊共同參與。華大研究院平質(zhì)博士為論文第一作者,華大研究院沈玥研究員、徐訊研究員與哈佛大學(xué)George M. Church教授為論文的共同通訊作者。
該研究受到國家重點研發(fā)計劃(2021YFF1200100、2020YFA0712100)、國家青年科學(xué)基金(32101182)、廣東省高通量基因組測序與合成編輯應(yīng)用重點實驗室(2017B030301011)、深圳合成生物學(xué)創(chuàng)新研究院等項目支持。本研究已通過倫理審查,嚴(yán)格遵循相應(yīng)法規(guī)和倫理準(zhǔn)則。