• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      新技術(shù)使DNA數(shù)據(jù)存儲成為可能

      2022-04-16 17:13:07
      中國科學(xué)探險 2022年1期
      關(guān)鍵詞:字節(jié)檢索標(biāo)簽

      在日前的一項(xiàng)新研究中,美國麻省理工學(xué)院的科學(xué)家開發(fā)了一種標(biāo)記和檢索DNA數(shù)據(jù)文件的技術(shù),這或許能讓DNA數(shù)據(jù)存儲成為可能。

      此時此刻,地球上大約有10萬億吉字節(jié)(GB)的數(shù)據(jù)量,而每一天,人類制造出來的電子郵件、照片、社交媒體動態(tài)和其他數(shù)字文件加起來,又有250萬吉字節(jié)的數(shù)據(jù)。這些數(shù)據(jù)中的大部分都存儲在名為“艾字節(jié)(exabyte,簡稱EB)數(shù)據(jù)中心”的巨大設(shè)施中(1EB相當(dāng)于10億GB),其規(guī)??赡苡袔讉€足球場那么大,建造和維護(hù)成本約為10億美元。

      許多科學(xué)家認(rèn)為,解決天量數(shù)據(jù)存儲問題的另一種辦法在于包含我們遺傳信息的生物大分子:脫氧核糖核酸(DNA)。從地球生命誕生至今,DNA已經(jīng)進(jìn)化到可以以極高的密度存儲大量信息。麻省理工學(xué)院的生物工程學(xué)教授馬克·巴思表示,理論上一個裝滿DNA的咖啡杯就可以存儲世界上所有的數(shù)據(jù)。

      “我們需要新的解決方案,來存儲世界正不斷積累的大量數(shù)據(jù),尤其是檔案數(shù)據(jù),”他說,“DNA的密度甚至是閃存的1000倍。另一個有趣的特性是,DNA聚合物一旦制造出來,它就不會再消耗任何能量。你可以把數(shù)據(jù)寫入DNA,然后永久存儲起來。”

      科學(xué)家已經(jīng)證明,圖像和文本可以編碼為DNA,但我們還需要一種從許多DNA片段混合物中挑選出所需文件的簡單方法。在新研究中,馬克·巴思及其同事展示了一種方法,能將每個數(shù)據(jù)文件封裝到一個6微米的二氧化硅球形“膠囊”中,并使用DNA短序列作為標(biāo)簽,以顯示其文件內(nèi)容。

      利用這種方法,研究人員從包含20張圖像的DNA文件中準(zhǔn)確提取出了以DNA序列形式存儲的單個圖像??紤]到可以用到的標(biāo)簽數(shù)量,這種方法最多能擴(kuò)展到1020個文件。

      穩(wěn)定的存儲介質(zhì)

      數(shù)字存儲系統(tǒng)將文本、照片和其他類型的信息都編碼為一系列的0和1,同樣的信息也可以用構(gòu)成遺傳密碼的4種核苷酸(A、T、G和C,即腺嘌呤、胸腺嘧啶、鳥嘌呤和胞嘧啶)編碼在DNA中。例如,G和C可以代表0,而A和T代表1。

      作為存儲介質(zhì),DNA還具有其他幾個特點(diǎn)。首先,它非常穩(wěn)定,而且合成和測序都相當(dāng)容易(但目前還十分昂貴)。其次,它具有非常高的存儲密度——1個核苷酸相當(dāng)于2個比特,大約為1立方納米。因此,以DNA形式存儲的數(shù)據(jù)完全可以放在我們的手掌中。

      這種存儲數(shù)據(jù)的新方法面臨著諸多障礙,首先就是合成如此大量DNA需要耗費(fèi)的成本。目前,寫入1拍字節(jié)(100萬GB)的數(shù)據(jù)需要花費(fèi)1萬億美元。為了與磁帶(通常用于存儲檔案數(shù)據(jù))競爭,巴思估計DNA合成的成本需要降低約6個數(shù)量級。他指出,這一目標(biāo)可能會在10年或20年內(nèi)實(shí)現(xiàn),就像過去幾十年來閃存存儲信息的成本大幅下降一樣。

      除了成本之外,使用DNA存儲數(shù)據(jù)的另一個主要瓶頸是,我們很難從所有文件中挑選出想要的文件。

      “假設(shè)寫入DNA的技術(shù)已經(jīng)很先進(jìn),可以實(shí)現(xiàn)在DNA中寫入1艾字節(jié)或1澤字節(jié)(zettabyte,簡稱ZB,1 ZB=1 000 EB)數(shù)據(jù)的成本效益,會發(fā)生什么?你會有一大堆的DNA,也就是無數(shù)的文件、圖像或電影和其他東西,但你需要在其中找到想要的某一張圖片或某一部電影,”巴思說,“這就像大海撈針?!?/p>

      目前,DNA文件通常使用PCR(聚合酶鏈?zhǔn)椒磻?yīng))方法來檢索。每個DNA數(shù)據(jù)文件都包含一個與特定PCR引物結(jié)合的序列。為了讀取某個特定的文件,需要將該引物添加到樣品中,找到并放大所想要的序列。然而,這種方法的一個缺點(diǎn)是,引物與目標(biāo)序列以外的DNA序列之間可能存在串?dāng)_,導(dǎo)致不必要的文件輸出。此外,PCR的檢索過程需要用到酶,最終會消耗庫中的大部分DNA。

      “這有點(diǎn)像在干草堆里找一根針,因?yàn)槠渌蠨NA都沒有被放大,因此基本上它們都被扔掉了?!卑退颊f。

      解決DNA文件檢索難題

      麻省理工學(xué)院的研究小組開發(fā)了一種新的檢索技術(shù),希望取代PCR方法。他們將每個DNA文件封裝到一個微小的二氧化硅膠囊中,每個膠囊都貼上了由單鏈DNA組成的“條形碼”,與文件內(nèi)容相對應(yīng)。為了證明這種方法的成本效益,研究人員將20個不同的圖像編碼到大約長度為3 000個核苷酸的DNA片段中,這大致相當(dāng)于100個字節(jié)(他們的研究還顯示,這些膠囊可以容納高達(dá)1 GB的DNA文件)。

      研究中的每個文件都有相應(yīng)的條形碼標(biāo)簽,如“貓”或“飛機(jī)”等。當(dāng)研究人員想要提取一個特定的圖像時,他們會取出一個DNA樣本,加入與目標(biāo)標(biāo)簽相對應(yīng)的引物。例如,老虎的圖像對應(yīng)的標(biāo)簽是“貓”“橘色”和“野生”,而家貓的圖像對應(yīng)“貓”“橘色”和“家養(yǎng)”。

      這些引物用熒光或磁性顆粒標(biāo)記,便于從樣本中提取并識別匹配片段。通過這種方法,研究人員可以將需要的文件移出來,剩下的DNA則完整地放回去,繼續(xù)存儲數(shù)據(jù)。他們的檢索過程允許布爾邏輯語句,如“總統(tǒng)和18世紀(jì)”會生成“喬治·華盛頓”的結(jié)果,這很類似谷歌的圖像檢索。

      論文的另一主要作者麻省理工學(xué)院的詹姆斯·巴納爾說:“在目前的概念驗(yàn)證階段,我們的搜索速度是每秒1 000字節(jié)(1KB)。我們的文件系統(tǒng)的搜索速度是由每個膠囊的數(shù)據(jù)量大小決定的,而目前限制數(shù)據(jù)量大小的因素就是在DNA上寫入100兆字節(jié)(MB)數(shù)據(jù)所需的高昂成本,以及可以并行使用的分類器的數(shù)量。如果DNA合成變得足夠便宜,我們就能夠用這種方法將每個文件存儲的數(shù)據(jù)量最大化?!?/p>

      研究人員所使用的條形碼——單鏈DNA序列——取自哈佛醫(yī)學(xué)院遺傳學(xué)和醫(yī)學(xué)教授史蒂芬·埃利奇開發(fā)的序列庫,其中包含了10萬個序列。如果給每個文件貼上2個這樣的標(biāo)簽,就可以唯一地標(biāo)記1 010個不同的文件;如果每個文件上有4個標(biāo)簽,就可以唯一地標(biāo)記1 020個文件。

      哈佛醫(yī)學(xué)院遺傳學(xué)教授喬治·丘奇并沒有參與這項(xiàng)研究,但他將這項(xiàng)技術(shù)描述為“知識管理和搜索技術(shù)的巨大飛躍”。

      “在DNA中寫入、復(fù)制、讀取,以及用DNA進(jìn)行低能耗的檔案數(shù)據(jù)存儲方面,我們?nèi)〉昧丝焖龠M(jìn)步,但這也使得從巨大的數(shù)據(jù)庫(1021字節(jié),澤字節(jié)規(guī)模)中精確檢索數(shù)據(jù)文件變得極為困難,”丘奇說,“這項(xiàng)新研究引人注目的地方在于,它使用一個完全獨(dú)立的DNA外層解決了這個問題,擴(kuò)展了DNA的不同屬性(雜交而非測序),而且使用的是現(xiàn)有的儀器和化學(xué)試劑。”

      巴思設(shè)想這種DNA封裝技術(shù)可以用于存儲“冷”數(shù)據(jù),即保存在檔案中但不經(jīng)常訪問的數(shù)據(jù)。目前,他的實(shí)驗(yàn)室已經(jīng)成立了一家名為Cache DNA的初創(chuàng)公司,正在開發(fā)DNA的長期存儲技術(shù),既可以用于長期的DNA數(shù)據(jù)存儲,也能用于短期的臨床和其他現(xiàn)有的DNA樣品存儲。

      “雖然我們可能還需要一段時間才能將DNA作為數(shù)據(jù)存儲介質(zhì),但目前在COVID-19檢測、人類基因組測序和其他基因組學(xué)領(lǐng)域中,對于DNA和RNA樣品的低成本和大規(guī)模存儲的解決方案都有很緊迫的需求?!卑退颊f道。

      猜你喜歡
      字節(jié)檢索標(biāo)簽
      No.8 字節(jié)跳動將推出獨(dú)立出口電商APP
      2019年第4-6期便捷檢索目錄
      No.10 “字節(jié)跳動手機(jī)”要來了?
      無懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      簡談MC7字節(jié)碼
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      標(biāo)簽化傷害了誰
      基于多進(jìn)制查詢樹的多標(biāo)簽識別方法
      人類進(jìn)入“澤它時代”
      阳泉市| 德昌县| 朔州市| 连山| 阜平县| 子洲县| 蒙自县| 南召县| 砀山县| 大邑县| 望奎县| 隆子县| 柳江县| 衡山县| 禹城市| 新建县| 汶上县| 夏邑县| 宝坻区| 大竹县| 宜丰县| 黄骅市| 安溪县| 北辰区| 西宁市| 阿勒泰市| 灌南县| 海盐县| 宜兰县| 桓台县| 文化| 满城县| 瑞昌市| 弋阳县| 和龙市| 东丰县| 理塘县| 高平市| 渑池县| 浑源县| 厦门市|