任志方
用什么樣的方法保存信息最長(zhǎng)久?刻在石頭上!這是科幻小說《三體》提出的解決方法。從巖石上的雕刻,到現(xiàn)在的磁介質(zhì)數(shù)據(jù)存儲(chǔ),數(shù)千年來,人類一直在用各種手段保存信息。盡管在過去幾十年里,人類存儲(chǔ)的數(shù)據(jù)量出現(xiàn)了極大增長(zhǎng),我們的生活、我們的記憶越來越多地以數(shù)字形式儲(chǔ)存在我們的硬盤里或“云端”,但這些數(shù)據(jù)的壽命卻很短,甚至長(zhǎng)不過我們的一生。如何才能將這些數(shù)據(jù)長(zhǎng)期保存不丟失?越來越多的研究者正在著手解決這個(gè)問題。
目前保存最久的信息
是10萬多年前的巖畫
在古代,蘇美爾人在黏土板上存儲(chǔ)信息;法老在石柱上刻象形文字記述自己的故事;據(jù)說,象形文字的基督教十誡是刻在石板上的。石頭和黏土可以保存記錄幾百年甚至幾千年。
此后出現(xiàn)的羊皮紙和紙張,在精心保管的情況下,可以保存一百多年。賽璐珞照片、醫(yī)療記錄、電影膠片和縮微膠片在氣候條件控制良好的環(huán)境中也能大約保存100年。
但今天,在數(shù)字化存儲(chǔ)數(shù)據(jù)的時(shí)代,數(shù)據(jù)、文檔或記錄時(shí)長(zhǎng)卻糟糕透頂。存儲(chǔ)在磁介質(zhì)上的數(shù)據(jù)每2~3年就要重寫一次,目前廣泛應(yīng)用的硬盤驅(qū)動(dòng)器可以存儲(chǔ)大量的數(shù)據(jù),但只能在室溫下使用大約10年。即便是光盤,雖說未經(jīng)記錄驗(yàn)證的保存壽命可達(dá)50年,但一旦寫入數(shù)據(jù),壽命就會(huì)下降一個(gè)數(shù)量級(jí),只有5年。
數(shù)字文本
比印刷書更脆弱
放眼看來,日常應(yīng)用中的數(shù)字儲(chǔ)存介質(zhì)似乎還沒有能讓數(shù)據(jù)安全地保存幾十年以上的。
那么,那些必須長(zhǎng)時(shí)間保存的數(shù)據(jù)又該怎么辦呢?比如建筑圖紙,如果樓房、橋梁、大壩、水渠等需要修理或翻新,在需要使用這些數(shù)據(jù)時(shí),發(fā)現(xiàn)它們讀不出來,總不能敲開建筑物內(nèi)部再測(cè)量一遍吧?
再比如,美國(guó)健康保險(xiǎn)便利轉(zhuǎn)移和責(zé)任法案(HIPAA)規(guī)定,數(shù)字醫(yī)療記錄至少要保留7年,對(duì)少年患者要保留到他們21歲之后再繼續(xù)保留7年。一旦因?yàn)閮?chǔ)存介質(zhì)失效,數(shù)據(jù)缺失,就會(huì)給保存機(jī)構(gòu)帶來法律責(zé)任,甚至付出經(jīng)濟(jì)賠償。
問題不止這些,“互聯(lián)網(wǎng)之父”溫頓·瑟夫曾提出這樣一個(gè)假設(shè):我們創(chuàng)造的舊的文件格式不能用最新軟件來閱讀,因?yàn)椴荒芸偸潜WC新軟件能與過去匹配。因此長(zhǎng)久下去的情況是,即便我們匯集了大量數(shù)字內(nèi)容,我們可能都不會(huì)知道這些內(nèi)容是什么。由于我們進(jìn)入“數(shù)字黑暗時(shí)代”,隨著硬件和軟件過時(shí),未來的人可能難以找到有關(guān)21世紀(jì)的任何記錄。
哈佛大學(xué)圖書館名譽(yù)圖書館員羅伯特·達(dá)頓說:“我們的文化無法承受災(zāi)難性損失的風(fēng)險(xiǎn),這一點(diǎn)上數(shù)字文本比印刷書更脆弱?!?/p>
儲(chǔ)存在玻璃里的信息
可達(dá)到地球年齡的3倍
這些聽起來很可怕,所幸的是,人類的智慧和創(chuàng)造能力是無限的。
就在2016年2月,英國(guó)南安普頓大學(xué)科學(xué)家開發(fā)出一種新的數(shù)據(jù)存儲(chǔ)技術(shù),利用玻璃中的微型納米結(jié)構(gòu)去編碼信息?;谶@一技術(shù),標(biāo)準(zhǔn)尺寸光碟能保存約360TB的數(shù)據(jù),而在溫度高達(dá)190℃的環(huán)境中可維持長(zhǎng)達(dá)138億年。這一時(shí)間與宇宙的歷史相仿,是地球年齡的3倍。
這一技術(shù)被稱作“五維數(shù)據(jù)存儲(chǔ)”,最初發(fā)表在2013年的一篇論文中。自那時(shí)以來,科學(xué)家仍在繼續(xù)對(duì)技術(shù)進(jìn)行優(yōu)化。目前,科學(xué)家計(jì)劃進(jìn)一步推動(dòng)這項(xiàng)技術(shù)的發(fā)展,甚至實(shí)現(xiàn)商用。
五維光碟能使用位于玻璃碟片內(nèi)的微型物理結(jié)構(gòu),即用“納米格柵”保存信息,而通過讀取折射的激光可以表達(dá)5種數(shù)據(jù)狀態(tài)。這也是這種技術(shù)名稱的來源。利用激光技術(shù),設(shè)備可以知道納米格柵的方向、激光折射的強(qiáng)度以及用X、Y、Z軸表示的空間中的位置。因此,相對(duì)于傳統(tǒng)光碟,五維光碟的數(shù)據(jù)存儲(chǔ)密度更大;藍(lán)光光碟可以保存128GB的數(shù)據(jù),而五維光碟存儲(chǔ)的數(shù)據(jù)量可以達(dá)到藍(lán)光光碟的近3000倍,即360TB。
由于玻璃是一種堅(jiān)固的材料,只有很高的高溫才能導(dǎo)致玻璃熔化或變形,而玻璃又有著良好的化學(xué)穩(wěn)定性,因此這種五維光碟能確保數(shù)據(jù)在非常長(zhǎng)的時(shí)間里不會(huì)丟失。
對(duì)圖書館和博物館來說,五維數(shù)據(jù)存儲(chǔ)技術(shù)很有潛力。盡管在這種光碟中記錄信息還需要用到成本高昂的實(shí)驗(yàn)室激光設(shè)備,但光碟數(shù)據(jù)的讀取并不困難。南安普頓大學(xué)的團(tuán)隊(duì)表示,類似DVD播放器的光碟讀取設(shè)備將在未來幾十年面市。
保存軟件和設(shè)備信息
可考慮建數(shù)字博物館
再回到溫頓·瑟夫提出的“數(shù)字黑暗時(shí)代”,在信息能長(zhǎng)期保存的情況下,如何使過去的信息被將來的人解讀?
1963年,飛利浦公司發(fā)明了盒式錄音磁帶,彼時(shí),一盤90分鐘的錄音帶只能存儲(chǔ)700KB到1M大小的數(shù)據(jù)。1971年,IBM推出8英寸容量為81KB的磁盤。1980年飛利浦和索尼共同研制出了數(shù)字光盤。
但在今天,除非專門購(gòu)買一個(gè)讀取設(shè)備,否則最常見的電腦也無法讀取上述儲(chǔ)存設(shè)備的信息,因?yàn)槲覀冏顬榱餍械囊苿?dòng)存儲(chǔ)設(shè)備已經(jīng)是U盤了。這不僅涉及硬件的問題,還有不斷更新的操作系統(tǒng)和那些被淘汰了的配套軟件。因此,可以設(shè)想一下,1000年以后的人類,面對(duì)我們今天使用的U盤或移動(dòng)硬盤,可能就像一百年前的人們初次發(fā)現(xiàn)甲骨文一樣。
如何解決這個(gè)難題?那就是保存所有軟件和硬件,使它們永不過時(shí),就好像博物館一樣。但這個(gè)博物館是數(shù)字形式的,放在云端的伺服器上。通過對(duì)內(nèi)容、應(yīng)用軟件和操作系統(tǒng)一起做一個(gè)快照,加上對(duì)其所運(yùn)行機(jī)器的描述,然后長(zhǎng)期保存。在漫長(zhǎng)的時(shí)間中,這些快照還需要根據(jù)當(dāng)時(shí)的技術(shù)環(huán)境,從一個(gè)云端移到另一個(gè)云端,方便任何需要者使用。
這看上去很復(fù)雜,不過,誰(shuí)又能知道幾千年后的情景呢?也許再過幾年或幾十年,我們真的就能利用一片類似五維光碟的簡(jiǎn)單玻璃保存文化、語(yǔ)言,以及人類的精華。這將提供給未來的文明,或是其他可能出現(xiàn)的一切。