廖梅
摘要:在大數(shù)據(jù)時代,傳統(tǒng)的檔案存儲思維無法滿足互聯(lián)網(wǎng)環(huán)境下的實際存儲需求。因此,本文討論了傳統(tǒng)檔案的存儲與互聯(lián)網(wǎng)環(huán)境下檔案數(shù)據(jù)的存儲之間的概念差異,闡明了檔案數(shù)據(jù)保全原理和技術(shù)思路。在大量數(shù)據(jù)的背景下,檔案歸檔工作必須以數(shù)字保全為基礎(chǔ),從傳統(tǒng)的檔案存儲工作轉(zhuǎn)向數(shù)據(jù)保全,因為這兩者之間的關(guān)系從根本上改變了檔案歸檔的基本屬性。
關(guān)鍵詞:檔案數(shù)據(jù);大數(shù)據(jù);保全
1 緒論
大數(shù)據(jù)時代的到來對人類生存的本質(zhì)和虛擬空間產(chǎn)生了戲劇性的影響。個人和組織之間的關(guān)系界限及其自身權(quán)利越來越取決于確定和維護個人和組織的數(shù)據(jù)主權(quán),特別是在司法有效性和數(shù)據(jù)存儲原創(chuàng)性的背景下處理檔案數(shù)據(jù),這與個人是否參與網(wǎng)絡(luò)虛擬空間中的身份確認和行為識別等一系列活動直接相關(guān)。這樣,個人存在狀態(tài)和運行痕跡的大數(shù)據(jù)肖像進而整個時代的社會記憶就被編制出來了。
本文以物聯(lián)網(wǎng)為基礎(chǔ),論述了保全檔案數(shù)據(jù)的內(nèi)涵、保全檔案數(shù)據(jù)與傳統(tǒng)保全檔案數(shù)據(jù)的區(qū)別以及保全檔案數(shù)據(jù)的基本原則和技術(shù)思路。
2 檔案數(shù)據(jù)保全概述
本文認為數(shù)據(jù)保全的概念可以理解為保全存檔數(shù)據(jù)。在此基礎(chǔ)上,首先要理解歸檔數(shù)據(jù)和數(shù)據(jù)保全的概念。數(shù)據(jù)是檔案科學(xué)領(lǐng)域的熱門術(shù)語。檔案資料在中國“十一五”檔案發(fā)展規(guī)劃綱要等官方文件中多次提及。在科學(xué)研究領(lǐng)域,關(guān)于檔案數(shù)據(jù)的討論越來越熱烈,檔案數(shù)據(jù)的概念不僅包括生成的檔案數(shù)據(jù),如物理檔案的數(shù)字化改造結(jié)果還包括以實時生成的原始數(shù)據(jù)為形式的檔案數(shù)據(jù)。這樣做時,歸檔數(shù)據(jù)隨著其多來源和異構(gòu)特性的進一步發(fā)展,不僅包括歸檔內(nèi)容、結(jié)構(gòu)、背景數(shù)據(jù),它還應(yīng)包含來自存檔業(yè)務(wù)的相關(guān)數(shù)據(jù),但沒有集成到管理系統(tǒng)中的完整數(shù)據(jù)。例如業(yè)務(wù)系統(tǒng)數(shù)據(jù)、歷史數(shù)據(jù)、過程數(shù)據(jù)、應(yīng)用程序數(shù)據(jù)和重要數(shù)據(jù)。
總的來說,現(xiàn)在討論的檔案數(shù)據(jù)應(yīng)該是綜合體的通用名稱,而不僅限于具體內(nèi)容,還包括數(shù)據(jù)本身及其相關(guān)環(huán)境和信息收集。在電子數(shù)據(jù)保全研究中,“保全”一詞常常被理解為重點應(yīng)放在電子數(shù)據(jù)的整合和存儲上,并檢查和確認其內(nèi)容的真實性和可靠性。保全數(shù)據(jù)可以從這個想法中吸取教訓(xùn),確實有必要在整個過程中使用整合前端管理和動態(tài)維護的想法。因此,本文指出,存檔數(shù)據(jù)的存儲可以理解為歸檔部根據(jù)歸檔記錄本身及相關(guān)屬性信息,利用相關(guān)技術(shù)對特征進行分析,預(yù)先提取并標記數(shù)據(jù),并實時跟蹤數(shù)據(jù)本體或數(shù)據(jù)標簽,以確保管理和維護歸檔數(shù)據(jù)資源的原創(chuàng)性、真實性、安全性。
3 檔案數(shù)據(jù)保全的原則
3.1 用戶需求原則
檔案數(shù)據(jù)保全必須滿足用戶作為目標的需求,并滿足不斷變化的社會需求。因此,能否滿足用戶需求,是評估和驗證存檔數(shù)據(jù)完整性的標準。因此,檔案數(shù)據(jù)管理和維護系統(tǒng)必須以需求為導(dǎo)向,首先,目標是使用戶的需求易于理解,并對其進行充分地研究和分析。其次,必須將系統(tǒng)中每個層的定位分開,使整個系統(tǒng)協(xié)調(diào)有序;最后,必須建立有效的反饋和評價機制,及時接受用戶的評價和反饋,并對系統(tǒng)進行優(yōu)化和調(diào)整。社會和用戶的需求貫穿于保全歸檔數(shù)據(jù)的整個過程。
3.2 政府主導(dǎo)第三方參與原則
中國的檔案工作有很強的行政領(lǐng)導(dǎo)和集中領(lǐng)導(dǎo)力。檔案本身是檔案資源最重要的“收藏者、管理者和服務(wù)提供者”?;ヂ?lián)網(wǎng)治理不是政府主導(dǎo)的模式,但也是政府宏觀管理現(xiàn)代化體系的重要組成部分。檔案工作必須注重政府管理的宏觀現(xiàn)代化,并開始協(xié)調(diào)數(shù)據(jù)管理的標準。國家對制度建設(shè)、資本、人力和物力的傾向支持,對于提高檔案機構(gòu)能力、穩(wěn)定資源主導(dǎo)地位、有效實施檔案數(shù)據(jù)保全、實現(xiàn)長期、穩(wěn)定和可持續(xù)發(fā)展目標具有重要作用。目前,國內(nèi)外第三方組織正在利用其在歸檔數(shù)據(jù)、維護和保全歸檔數(shù)據(jù)方面的獨特優(yōu)勢,相互促進,共同推動發(fā)展。
4 檔案數(shù)據(jù)保全技術(shù)思路
為了確保上述歸檔原則的實現(xiàn),我們可以從數(shù)據(jù)保留技術(shù)、數(shù)據(jù)安全技術(shù)和數(shù)據(jù)可信度技術(shù)等各個方面實現(xiàn)歸檔數(shù)據(jù)的保全。值得注意的是,這些技術(shù)的使用通常側(cè)重于傳統(tǒng)文件保全和文件數(shù)據(jù)存儲在大數(shù)據(jù)方面的區(qū)別:傳統(tǒng)文件保全強調(diào)微觀文件保全者(檔案或其他機構(gòu))的秘密工作和文件管理,以及由真實性引發(fā)的可信任問題而且背后的邏輯是由規(guī)章制度形成的。
本文分析了檔案數(shù)據(jù)在物聯(lián)網(wǎng)背景下的行為,強調(diào)檔案數(shù)據(jù)本身與互聯(lián)網(wǎng)海量數(shù)據(jù)外部環(huán)境之間的關(guān)系可以從數(shù)據(jù)本身和技術(shù)層面進行快速、高效、高密度的管理。從而使其信任網(wǎng)絡(luò)的較低層次認識到互聯(lián)網(wǎng)的開放共享機制,并以分布式數(shù)據(jù)處理、數(shù)據(jù)冗馀、數(shù)據(jù)安全等技術(shù)為基礎(chǔ),保證互聯(lián)網(wǎng)生態(tài)的穩(wěn)定發(fā)展,特別是Bt Chan等新技術(shù)和量子通信應(yīng)運而生。從而為這一思路的實現(xiàn)提供了有效的保障。
4.1 數(shù)據(jù)安全性技術(shù)應(yīng)用思路
隱藏數(shù)據(jù)是一種隱寫方法,用于識別版權(quán)、注解和其他內(nèi)容。數(shù)據(jù)加密技術(shù)得到廣泛應(yīng)用。為了解決存儲、處理和傳輸過程中非法訪問和操縱存檔數(shù)據(jù)的問題,它提供了硬盤加密技術(shù)以及IP加密、VPN加密、SSL加密和其他協(xié)議標準,以確保數(shù)據(jù)的安全傳輸。數(shù)字指紋也稱為SHA,是一種未加密的算法,可確保傳輸?shù)奈募]有被篡改,生成一個偽裝的數(shù)字指紋,并評估文件是否被篡改,網(wǎng)上檔案數(shù)據(jù)保全也強調(diào)信息安全技術(shù)的應(yīng)用,但其技術(shù)思路和手段更注重捕捉互聯(lián)網(wǎng)的動態(tài)特性。
4.2 數(shù)據(jù)有效性技術(shù)應(yīng)用思路
文件歸檔過程中的數(shù)據(jù)有效性技術(shù)主要包括數(shù)據(jù)時間戳和數(shù)據(jù)簽名技術(shù)。傳統(tǒng)歸檔是基于存儲在計算機硬盤上的圖像文件、關(guān)機前存儲的所有信息、在收集歸檔數(shù)據(jù)期間獲得的數(shù)據(jù)、管理人員每天記錄的歸檔數(shù)據(jù)的副本等的臨時標記,以確保歸檔數(shù)據(jù)內(nèi)容變化的技巧,并確保數(shù)據(jù)的可靠性。數(shù)據(jù)簽名技術(shù)旨在改變由行為權(quán)威和利益相關(guān)者的權(quán)利聲明引起的數(shù)據(jù)可信度。在海量數(shù)據(jù)環(huán)境下,保全歸檔數(shù)據(jù)更加重視各種協(xié)議技術(shù)的應(yīng)用,也就是說,在保全歸檔數(shù)據(jù)的過程中,數(shù)據(jù)時間戳技術(shù)的應(yīng)用必須基于網(wǎng)絡(luò)系統(tǒng)中不同類型的操作協(xié)議、安全協(xié)議或應(yīng)用協(xié)議動態(tài)生成的互聯(lián)網(wǎng)指紋,并動態(tài)詳細地記錄存檔數(shù)據(jù)的執(zhí)行信息、授權(quán)變化等可能影響數(shù)據(jù)有效性的參考信息。例如可以結(jié)合數(shù)據(jù)簽名檢查歸檔數(shù)據(jù)傳輸過程中日志文件的完整性和一致性,以避免危及歸檔備份系統(tǒng)和數(shù)據(jù)有效性的不正常操作,如偽造IP地址和管理帳號。
5 小結(jié)
傳統(tǒng)時代檔案材料的存儲或保管與大數(shù)據(jù)條件下存儲數(shù)據(jù)的保全之間的根本區(qū)別可以歸納為保全為今后使用的,幾者之間的關(guān)系還沒有達到范式轉(zhuǎn)換的水平,這是由于存儲時間的變化而形成的概念升級。傳統(tǒng)的密封強調(diào)了在各種物理存儲和通信環(huán)境限制下存儲庫管理的性質(zhì),而在數(shù)據(jù)量大的環(huán)境中存儲的數(shù)據(jù)則強調(diào)初始準備。智能識別和監(jiān)控整個數(shù)據(jù)存儲過程基于多種在線數(shù)據(jù)技術(shù),即存儲數(shù)據(jù)過程的真實性和可靠性。通過internet功能(即存儲數(shù)據(jù))連接所有內(nèi)容,強調(diào)集中資源的訪問和控制,而存儲數(shù)據(jù)則遵循分散的internet概念,并強調(diào)數(shù)據(jù)或管理節(jié)點之間的交互作用。新的信任關(guān)系和第三方的廣泛參與是其發(fā)生和發(fā)展的重要因素。
互聯(lián)網(wǎng)對人類社會的滲透徹底改變了人們和社會互動的方式,記錄和描繪人類行為和社會發(fā)展痕跡的一項重要任務(wù)將是檔案人員的長期使命。不同的是,記錄工具已從歸檔切換到電子環(huán)境中的其他歸檔數(shù)據(jù)。我們必須面對這種大數(shù)據(jù)時代帶來的顛覆性理念和實踐創(chuàng)新,不要屈服于技術(shù)創(chuàng)新的威脅,不要專注于數(shù)字化過程,從保全檔案數(shù)據(jù)入手,面對原始檔案文獻證據(jù)在物聯(lián)網(wǎng)環(huán)境下面臨的信任網(wǎng)絡(luò)變革等新挑戰(zhàn),堅守學(xué)職陣地。
參考文獻
[1]周爍奇. 單套制環(huán)境下檔案數(shù)據(jù)保全研究[D].蘇州大學(xué),2020.
[2]王婧逸.數(shù)據(jù)保全視角下電子文件單軌制管理模式研究[J].檔案與建設(shè),2020(02):26-29.
[3]余亞榮.全國檔案數(shù)據(jù)保全高端學(xué)術(shù)研討會綜述[J].中國檔案研究,2019(01):250-253.
[4]李洪湖.檔案數(shù)據(jù)安全存儲及智慧監(jiān)管平臺建設(shè)實踐分析[J].浙江檔案,2017(02):58.