“Hello World”是許多程序員的第一行代碼,但你見過從生物活體內讀出的“Hello World”嗎?哥倫比亞大學的一個研究小組做到了,他們把數(shù)據寫入活細菌的DNA。相關研究2021年1月11日發(fā)表于《自然—生物化學》。
對數(shù)據存儲而言,DNA在許多方面都很有吸引力。比如,相較于目前結構最緊湊的硬盤,DNA的密度是前者的1 000倍以上,一粒鹽大小的面積上能存儲10部完整的數(shù)字電影。
隨著時間推移,讀取和寫入DNA的技術終將迎來實用性更強、成本更低的那一天。但實際上,用DNA存儲數(shù)據并不是個新點子。據美國的《科學》(Science)報道,研究人員通常將二進制語言0和1轉換為DNA的4個堿基AGCT(腺嘌呤、鳥嘌呤、胞嘧啶、胸腺嘧啶),再用合成器將代碼寫入DNA。
但這種方法也有缺點,DNA合成的準確性會隨代碼獲取時間延長而降低,研究人員不得不將文件拆成多個部分,分別將其寫入200~300個堿基長度的DNA片段內。為了標識在文件中的位置,再給這些片段加索引,當測序儀讀取時得以重新組裝。按該方法,1兆位信息合成的成本高達3 500美元,而且存儲著信息的DNA還會隨時間降解。
一直以來,研究人員都在尋找更持久、更易于編碼的方法。這次,研究人員將大腸桿菌及其攜帶的信息添加到正常土壤微生物的混合物中,通過對混合物測序,以獲取先前存儲的內容。
論文通信作者、哥倫比亞大學系統(tǒng)生物學系的Harris H. Wang早在2017年就和課題組成員探索將數(shù)據寫入生物體DNA的方法,曾利用基因編輯CRISPR系統(tǒng)識別生物信號,成功鑒定出果糖的存在。
當果糖被添加到大腸桿菌細胞中時,基因表達在質粒(一種環(huán)狀DNA)中增加。接著,CRISPR系統(tǒng)中的成分進化為防御病毒入侵的細菌,將過表達的質粒切成碎片,并將其中一些放入細菌DNA的特定部分,以“記住”先前的病毒入侵者。插入的遺傳位代表二進制里的1,如果沒有果糖信號,細菌會存儲隨機的DNA片段以表示二進制中的0。對大腸桿菌DNA測序后,這些信息即可被讀取。
之后,為了加大數(shù)據存儲量,研究團隊用電子輸入替代了果糖識別系統(tǒng)。他們將一系列基因插入大腸桿菌,讓細胞能響應電壓、增加質粒表達。表達增加后,這些被數(shù)字化的表達物就能存進細菌DNA。為了讀取存儲內容,研究人員對細菌測序即可。
Wang表示,將數(shù)據存儲在活的生物體中還為時過早,因此不會與當前的存儲系統(tǒng)產生競爭。未來還需要改進辦法,防止細菌復制時發(fā)生突變導致降解。