文/河南省駐馬店市城市規(guī)劃檔案館 賈鵬飛
隨著信息化在生活中的不斷深入,人們對計算機(jī)系統(tǒng)的依賴程度提高,數(shù)字化的檔案信息較以往已經(jīng)成倍地增加,一旦數(shù)據(jù)遭到竊取、泄露、丟失,都將會對社會帶來巨大的打擊。在面對這些威脅的時候,數(shù)字檔案的備份工作就顯得越發(fā)重要。備份就是將數(shù)字檔案通過一定方式進(jìn)行保留,當(dāng)數(shù)據(jù)信息遭到外力損壞時能夠在最短時間內(nèi)恢復(fù)并再次使用的過程。
我國數(shù)字檔案備份工作起步較晚,以“數(shù)字檔案備份”作為檢索詞,對已有學(xué)術(shù)數(shù)據(jù)庫進(jìn)行搜索,獲得文章3352篇,這些文獻(xiàn)涉及到經(jīng)濟(jì)、建筑、氣象、計算機(jī)、法律等40個學(xué)科。其中研究重點包括備份技術(shù)、模式、載體等各個方面。通過對這3352篇文章進(jìn)行分析,得到以下結(jié)果:我國最早提到對數(shù)字檔案備份是來源于1977年頒布的《無線電廣播技術(shù)維護(hù)制度和管理辦法(草案)》,并且于1998年首次提出了電子時代檔案的保護(hù)。以“數(shù)字檔案備份”and“方式”為檢索詞進(jìn)行檢索得到1871篇文章,我們會發(fā)現(xiàn)在2001年前只有零星幾篇文章,2001年美國911事件和2008年汶川地震成為檔案學(xué)者對數(shù)字檔案備份工作研究的時間轉(zhuǎn)折點,文獻(xiàn)數(shù)量呈幾何級增長。在這1871篇文獻(xiàn)中,對引用次數(shù)較高的文獻(xiàn)進(jìn)行查閱,得出具有代表性的觀點。孫曉霞、王潔在其《數(shù)字檔案備份中心的備份模式及其選擇》中將檔案備份分為兩種方式?;诓煌臻g范圍:原地備份、異地備份?;诓煌ㄔO(shè)方式:自建模式、共建模式、外包模式。趙生輝、侯文希在其《政府信息資源災(zāi)備體系建設(shè)模式綜述》中將數(shù)字檔案災(zāi)備分為兩種。基于災(zāi)備范圍的分類:本地災(zāi)備、異地災(zāi)備、區(qū)域災(zāi)備和分布式災(zāi)備。基于建設(shè)方式的分類:自建、互助、共享和外包。
數(shù)字檔案開放利用和其他各種不確定因素的威脅,使得數(shù)字檔案在長期安全保存中存在諸多的問題,社會各界越來越多地關(guān)注和研究數(shù)字檔案的安全問題。
隨著各國政府積極推動辦公無紙化這一措施,越來越多的檔案文件開始通過計算機(jī)網(wǎng)絡(luò)來進(jìn)行傳輸、保存。計算機(jī)在對檔案收集、整理、保存、利用等方面產(chǎn)生積極效果的同時,也由于計算機(jī)在硬件、軟件、環(huán)境、人員等方面存在的風(fēng)險給數(shù)字檔案安全帶來了不小的安全隱患??傮w來說,數(shù)字檔案安全受到以下方面的威脅:
(一)自然災(zāi)害。自然災(zāi)害對人類社會帶來的破壞力是驚人的。地震、洪水、臺風(fēng)、火災(zāi)這些災(zāi)害具有范圍廣、破壞力強的特點,往往在人們意料之外給檔案文件帶來毀滅性的打擊。例如在2008年發(fā)生的汶川大地震,強烈的地震波無情地吞沒無數(shù)生命的同時,它摧毀房屋,使得災(zāi)區(qū)大量的檔案庫房坍塌損毀,檔案文件或被水浸泡或被亂石掩埋。膠片、硬盤、光盤這些新型材質(zhì),因?qū)鸷退母叨让舾行?,使其在遇到水?zāi)、火災(zāi)時,會變硬變脆甚至粘連在一起,如果不及時搶救,將導(dǎo)致嚴(yán)重的后果。據(jù)估算,建國以來,全國各級檔案館因火災(zāi)而導(dǎo)致300萬份檔案損毀。
(二)硬件故障。墨菲定律告訴我們,會出錯的事總會出錯。檔案是“前世賴之可以告古,后世賴之可以告今”的寶貴歷史材料,我們并不希望它只能保存10年、20年,而是千年甚至永久。高密度的現(xiàn)代數(shù)字檔案存儲介質(zhì)在長時間高速運行的時候發(fā)生故障是無法避免的,硬盤驅(qū)動器損壞、服務(wù)器故障、電源中斷等等因為質(zhì)量、環(huán)境等因素導(dǎo)致的故障,會給檔案機(jī)構(gòu)造成無法彌補的損失。根據(jù)EMC公司在年初發(fā)布的報告中我們不難發(fā)現(xiàn),在2014年的12個月中,因為數(shù)據(jù)丟失和宕機(jī)而造成的直接經(jīng)濟(jì)損失達(dá)到驚人的1.7萬億美元,這相當(dāng)于制造業(yè)大國德國近一半的GDP。而從2012開始,數(shù)據(jù)丟失比例增長4倍的同時,令人傷心的是,有超過2/3的企業(yè)并不認(rèn)為自己能夠恢復(fù)這些數(shù)據(jù)。調(diào)查的同時,我們得到Kroll Ontrack公司最新的調(diào)查數(shù)據(jù),結(jié)果顯示在EMC的報告結(jié)果中,驚人的72%的數(shù)據(jù)丟失是由硬件故障導(dǎo)致的。
(三)人為入侵。如果說因為自然災(zāi)害、硬件故障而導(dǎo)致的數(shù)據(jù)丟失還給數(shù)字檔案所有者留有恢復(fù)余地的話,那么來自人為入侵、破壞而導(dǎo)致的數(shù)字檔案、數(shù)據(jù)的丟失將是難以彌補的。這方面的破壞主要包括計算機(jī)被盜取、存儲服務(wù)器網(wǎng)絡(luò)遭到黑客入侵,數(shù)據(jù)被篡改、刪除。
(四)軟件因素。我們這里指的軟件因素包括相對于硬件設(shè)施而言的操作軟件故障和操作、維護(hù)數(shù)據(jù)存儲系統(tǒng)的檔案管理人員。軟件故障大多是指存儲系統(tǒng)設(shè)置不正確、存儲系統(tǒng)更新不及時給數(shù)據(jù)存儲系統(tǒng)正常運行帶來困難。數(shù)字檔案保管機(jī)構(gòu)的操作人員是數(shù)字檔案的直接接觸者,其自身素質(zhì)影響著存儲的數(shù)據(jù)是否安全。在日常管理中,常見的由于操作錯誤而導(dǎo)致的誤刪除占到各類問題的80%左右。數(shù)字檔案的安全存儲始終要堅持“三分技術(shù)、七分管理”的原則,這說明了規(guī)范管理是確保檔案信息安全的重要因素。
(五)數(shù)字檔案存儲介質(zhì)的不穩(wěn)定?,F(xiàn)代新型的存儲介質(zhì)使單位密度上能夠存儲的數(shù)據(jù)量成倍增長,但其使用壽命卻遠(yuǎn)不及傳統(tǒng)的紙質(zhì)載體和縮微膠片。一般而言,光盤的保存期限為5~100年、磁帶的保存上限為30年,磁盤的實際壽命只有5~10年,這還不包括因為日常誤操作而導(dǎo)致介質(zhì)損壞、保存環(huán)境不達(dá)標(biāo)造成存儲介質(zhì)腐壞。根據(jù)日本國會圖書館對2003年前入館保存的電子文獻(xiàn)進(jìn)行調(diào)查發(fā)現(xiàn),69%存在利用困難的文獻(xiàn)中有12%是由于存儲介質(zhì)導(dǎo)致的。
(六)數(shù)字檔案存儲格式的不穩(wěn)定。網(wǎng)絡(luò)、計算機(jī)、信息系統(tǒng)是數(shù)字檔案的基礎(chǔ),也是影響數(shù)字檔案安全的主要因素。隨著計算機(jī)技術(shù)的飛速發(fā)展,平均每3個月就有一種計算機(jī)語言面世,而語言間是不存在溝通互換的。數(shù)字檔案是基于一種語言存儲在其對應(yīng)的信息系統(tǒng)中的,隨著時間的推移,這個特征會給數(shù)據(jù)檔案的正常讀取帶來困難。
(一)數(shù)字檔案備份的基本分類方法。1.根據(jù)備份介質(zhì)分類:(1)磁盤備份?,F(xiàn)今我們選擇磁盤進(jìn)行備份主要包括了內(nèi)部的硬盤和外部的磁盤陣列。硬盤具有讀寫速度快的特點,是進(jìn)行實時備份的最佳選擇,然而數(shù)字檔案備份的首要前提是保證數(shù)據(jù)安全穩(wěn)定,硬盤由于在運行中容易出現(xiàn)故障,決定了其只適用于小范圍的實時備份系統(tǒng)。之后出現(xiàn)的磁盤陣列技術(shù)保留了前者的高速持續(xù)讀寫這一特點,又增加了利用冗余信息的方式使磁盤失效時不會使訪問數(shù)據(jù)受損主要有RAID0、RAID0+1、RAID5三種,后三者配合熱插拔技術(shù)可以實現(xiàn)數(shù)據(jù)的在線恢復(fù),是未來數(shù)字檔案的主要存儲介質(zhì)。(2)磁帶備份。磁帶備份技術(shù)由于價格低廉、存儲量大、易于保管是目前產(chǎn)量最大和用途最廣的存儲方式。磁帶是出現(xiàn)最早的存儲介質(zhì),其標(biāo)準(zhǔn)化程度高,目前技術(shù)最成熟的DLT8000磁帶機(jī)讀寫速度可以達(dá)到30M/S,適合大型檔案館、數(shù)字中心保存數(shù)字檔案。但是,磁帶的數(shù)據(jù)結(jié)構(gòu)是成線性排列,不利于檔案信息檢索。(3)光盤備份。光盤是以塑料為盤基,金屬為涂層,記錄光信息的存儲介質(zhì)。比起硬盤,以光盤為備份載體可以節(jié)省大量資金,又可以通過光盤庫技術(shù)將多張光盤組合起來,實現(xiàn)信息的海量存儲,并且具備硬盤的高速讀寫功能。但是,以金屬為存儲介質(zhì)的光盤,會因為金屬的氧化而造成數(shù)據(jù)丟失。目前好的光盤能夠保存20年左右,不好的只能保存2年,不能夠滿足數(shù)字檔案的長時間安全存儲。2.根據(jù)空間范圍分類:(1)本地備份。本地備份是指在檔案館所在地進(jìn)行數(shù)據(jù)備份,在本地建立容災(zāi)備份中心,這種建設(shè)方式只能保證主服務(wù)器數(shù)據(jù)在遭到人為破壞后保證業(yè)務(wù)流程的連續(xù)性,但是在遇到區(qū)域性自然災(zāi)害時不能夠發(fā)揮作用,只能作為異地備份的補充。(2)異地備份。異地備份方式主要包括了三種:一是遠(yuǎn)程異地備份,是指將數(shù)據(jù)檔案備份到不屬于同一地震帶、同一電網(wǎng)、同一河流流域、同一海岸線的區(qū)域,確保在災(zāi)難發(fā)生時,數(shù)字檔案不被丟失。二是互助備份,是指兩個不用地理環(huán)境的政府通過簽訂協(xié)議,將數(shù)字檔案傳輸?shù)綄Ψ较到y(tǒng)中進(jìn)行存儲,這種方式不需要另外建設(shè)庫房,以最小的投資,最大限度地提高了檔案館的容災(zāi)能力。三是區(qū)域備份,區(qū)域備份是指區(qū)域政府為了保護(hù)區(qū)域內(nèi)數(shù)字檔案的信息安全,通過政府出資建設(shè)區(qū)域備份中心,提供給區(qū)域內(nèi)用戶使用,實現(xiàn)數(shù)字檔案集中備份管理。3.根據(jù)建設(shè)方式分類:(1)自建模式。自建模式是檔案館依托自身力量建設(shè)的數(shù)字檔案備份體系,這種模式要求了檔案館需要具備足夠的資金、專業(yè)的技術(shù)人員,建設(shè)難度大,后期維護(hù)困難。但是這種方式能夠最大程度滿足自身數(shù)字檔案備份的需要、安全性高。適合于大型的國家檔案館。(2)共建模式。共建模式是兩個或兩個以上檔案館共同出資建設(shè)。優(yōu)點是節(jié)省財力物力人力,缺點是多家檔案館共同管理可能會導(dǎo)致職權(quán)不明確、責(zé)任認(rèn)定不清楚。是目前國內(nèi)政府檔案機(jī)構(gòu)使用范圍最廣的一種方式。(3)外包模式。外包模式是指將數(shù)字檔案備份工作交由專業(yè)的服務(wù)提供商來解決,由提供商來分析數(shù)字檔案的方式,給出最佳的備份方式和服務(wù)。這種方式的優(yōu)點是投資少,缺點是不能保證數(shù)據(jù)的保密性。適合于小型并且對保密性要求不高的企業(yè)。
隨著信息社會的來臨,信息作為人類發(fā)展與進(jìn)步的動力,在人類社會中扮演的角色越來越重要,它已然成為繼物資、能源的“第三大動力”,其載體形式也由過去單一的紙制、膠片保管存儲發(fā)展到近來最熱門的數(shù)字化檔案備份與存儲。為了有效地開發(fā)利用檔案信息資源,最大地發(fā)揮檔案的價值,世界各國都在積極利用現(xiàn)代化技術(shù)和設(shè)備建設(shè)數(shù)字檔案備份中心,但總體來說,由于數(shù)字檔案館需要占用大量土地資源、后期的設(shè)備維護(hù)、人員經(jīng)費開支等諸多因素都影響了數(shù)字檔案備份中心的建設(shè),中小型企業(yè)在巨大的資金壓力下,對數(shù)字檔案備份中心的建設(shè)只能是望而卻步,使其只能在大型企業(yè)集團(tuán)、國家政府中得以利用,對數(shù)字檔案的系統(tǒng)延續(xù)造成破壞。本人在借鑒他人研究成果并結(jié)合實際工作中遇到的問題,基于現(xiàn)有云技術(shù)的推廣以現(xiàn)有幾家云存儲工具為例,對未來云環(huán)境下數(shù)字檔案備份工作提出見解。云存儲是由云計算技術(shù)延伸過來的新型概念,是一種新型的存儲技術(shù)。云存儲利用云計算技術(shù)的集群應(yīng)用、網(wǎng)絡(luò)技術(shù)和分布式文件系統(tǒng)等功能,將大量的網(wǎng)絡(luò)存儲設(shè)備通過并行協(xié)同軟件集合起來,共同向外部提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能。簡單來說,云存儲就是將需要存儲的資源放到“云”上供人存取,使用者可以在任何時間、任何地點,通過連接到網(wǎng)絡(luò)的授權(quán)設(shè)備對數(shù)據(jù)進(jìn)行操作。
(一)云存儲的不利因素。1.數(shù)據(jù)的隱私保護(hù)。使用本地建設(shè)來進(jìn)行數(shù)字檔案的備份雖然耗資巨大,但是在對數(shù)據(jù)檔案的隱私保護(hù)方面是有保證的,新型的云端存儲是將數(shù)據(jù)放到網(wǎng)絡(luò)之上,在獲得極大便利的同時,將失去對數(shù)據(jù)的物理地址控制,所有的數(shù)據(jù)訪問權(quán)限交由云提供商處理,意味著數(shù)據(jù)的保管責(zé)任部分轉(zhuǎn)移,給數(shù)據(jù)隱私保護(hù)帶來隱患。2.數(shù)據(jù)的安全保護(hù)。數(shù)字檔案的存儲是為了盡量保證數(shù)據(jù)零損毀。當(dāng)需要進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)恢復(fù)時,云端數(shù)據(jù)因為種種原因丟失,云存儲提供商只能進(jìn)行賠付,但并不能為用戶找回數(shù)據(jù)。微軟曾在2009年冬天,因為SIDEKICK故障,導(dǎo)致用戶不能訪問郵箱、日歷等一系列服務(wù)一個星期,微軟隨后表明因為管理人員忘記進(jìn)行備份操作,導(dǎo)致數(shù)十萬用戶數(shù)據(jù)永久丟失。國內(nèi)的盛大云磁盤在2012年因為位于無錫的物理機(jī)本地磁盤損壞導(dǎo)致用戶數(shù)據(jù)丟失,造成巨大損失。
(二)云存儲的優(yōu)勢。1.節(jié)約成本。云存儲技術(shù)的應(yīng)用對數(shù)字檔案備份成本的影響是巨大的。一般來說,傳統(tǒng)的數(shù)字檔案備份中心建設(shè)需要耗費巨大的資金,而檔案部門在企業(yè)部門中一向是處于末位。傳統(tǒng)的數(shù)字檔案備份對存儲介質(zhì)的要求極為苛刻,必須兼容系統(tǒng)的要求,而存儲技術(shù)的發(fā)展是迅速的,云存儲的利用可以使得檔案部門在不需要購買設(shè)備的情況下,享受到優(yōu)質(zhì)的服務(wù)。云存儲提供商大多采用的更加環(huán)保綠色的節(jié)能技術(shù),包括通過對太陽能的利用,冷卻水的循環(huán),支持基于性能加速技術(shù)的低能耗串口盤作為存儲載體,可以實現(xiàn)高速的網(wǎng)絡(luò)備份,整體能耗遠(yuǎn)低于傳統(tǒng)的數(shù)字備份傳輸。2.可靠持續(xù)性服務(wù)。傳統(tǒng)的數(shù)字檔案備份中心系統(tǒng)管理中,檔案操作人員往往需要同時操作不同的存儲設(shè)備,使用不同的存儲設(shè)備需要檔案操作人員了解每個組件的具體性能和操作方式,使得工作復(fù)雜而繁重,不利于數(shù)字檔案的安全備份保管。云存儲提供商依托自身多機(jī)房部署保證數(shù)據(jù)訪問穩(wěn)定,通過冗余備份應(yīng)用系統(tǒng)保證可以在極短的時間內(nèi)還原業(yè)務(wù)系統(tǒng),大大縮減了災(zāi)難后的數(shù)據(jù)恢復(fù)時間,提高災(zāi)難恢復(fù)的效率。相比于傳統(tǒng)的數(shù)字檔案備份中心容量擴(kuò)容,云服務(wù)商提供的云存儲采用并行存儲管理系統(tǒng),當(dāng)使用者需要對容量進(jìn)行擴(kuò)大時,不再需要對存儲服務(wù)器進(jìn)行配置和調(diào)試,降低了因為配置錯誤而造成的服務(wù)器宕機(jī),威脅到數(shù)字檔案備份工作的進(jìn)行。3.提高競爭力。通過使用云存儲,利用最新的虛擬化和管理創(chuàng)新,在提升效率的同時簡化基礎(chǔ)結(jié)構(gòu)。根據(jù)微軟公司提供的數(shù)據(jù),云存儲成本大約只占到SAN存儲的四分之一。IDC的報表介紹到,一家典型商業(yè)機(jī)構(gòu)的數(shù)據(jù)存儲量每年平均增長50-60%,但只有其中一小部分?jǐn)?shù)據(jù)需要經(jīng)常使用。SAN/NAS等完全本地化的數(shù)據(jù)存儲對于此類數(shù)據(jù)存儲比較昂貴。
對于中小型企業(yè)來說,市場規(guī)則總是在不斷變化,企業(yè)需要實現(xiàn)精益并保持精益,減少不必要的投入,而在必要時迅速擴(kuò)展。云服務(wù)商提供的云存儲服務(wù)現(xiàn)已提供數(shù)據(jù)分析服務(wù),在隨時隨地處理業(yè)務(wù)的同時,幫助企業(yè)在競爭中領(lǐng)先。
在當(dāng)今的企業(yè)環(huán)境下,人們的最新標(biāo)準(zhǔn)是要用較小資源做更多的事,充分利用每一筆投資是大勢所趨。
綜上所述,傳統(tǒng)的存儲技術(shù)在面臨信息時代數(shù)據(jù)量的爆炸式增長暴露出局限性的時候,使用云存儲能夠解決其中一些難題,表現(xiàn)出一定優(yōu)勢。但是,由于現(xiàn)階段云存儲還不是很成熟,其存在的各種問題是開展數(shù)字檔案備份工作不得不考慮的問題。
[1] 王巍.數(shù)字檔案長期安全保存對策[J].信息化建設(shè),2008(03):36~38.
[2] 范韞.重要數(shù)字檔案異質(zhì)異地備份探析[J].數(shù)字與縮微影像,2012(01):25~28.
[3] 孫曉霞,王潔.數(shù)字檔案備份中心的備份模式及其選擇[J].浙江檔案,2012(12):54~55.
[4] 丁宜.檔案異地備份研究[D].安徽大學(xué),2013.
[5] 姜巖.數(shù)字檔案保管模式比較研究[D].黑龍江大學(xué),2014.
[6] 楊景云.遠(yuǎn)程容災(zāi)系統(tǒng)的研究[D].浙江工業(yè)大學(xué),2012.
[7] 梁艷萍.檔案異地備份研究[D].鄭州大學(xué),2011.
[8] 周丹.關(guān)于檔案登記備份制度的理論思考[D].浙江大學(xué),2011.
[9] 許桂清,趙荔.電子檔案異地容災(zāi)備份中心建設(shè)的實踐[J].中國檔案,2010(04):62~64.
[10] 譚必勇,張瑩.電子政務(wù)環(huán)境下數(shù)字檔案登記備份體系的構(gòu)建研究[J].浙江檔案,2010(12):5~9.
[11] 陶水龍.檔案數(shù)字資源云備份策略的分析與研究[J].檔案學(xué)通訊,2012(04):12~16.
[12] 王玉龍.“云”環(huán)境下的檔案異地備份方案設(shè)計[J].上海檔案,2012(06):10~13.