張成
摘 要:本文通過對檔案信息數(shù)字化的意義及其本質(zhì)的闡釋,結(jié)合分析當(dāng)前國內(nèi)檔案信息數(shù)字化現(xiàn)狀,提出了目前檔案信息數(shù)字化存在的問題并加以分析,并對我國檔案信息數(shù)字化工作提出了合理化意見。
關(guān)鍵詞:檔案信息;數(shù)字化;現(xiàn)狀分析;對策研究
檔案信息化的逐步推進,深刻改變了傳統(tǒng)的檔案管理模式,使檔案工作、檔案事業(yè)發(fā)生了翻天覆地的變化。檔案學(xué)是以檔案現(xiàn)象為研究對象,以揭示檔案現(xiàn)象的本質(zhì)和規(guī)律為目標(biāo)的一門綜合性學(xué)科。信息時代檔案事業(yè)出現(xiàn)的一系列新事物、新現(xiàn)象、新問題、新技術(shù)等,使檔案學(xué)面臨著前所未有的挑戰(zhàn)。風(fēng)物長宜放眼量。從科學(xué)發(fā)展的角度看,檔案學(xué)是一個年輕的學(xué)科,也應(yīng)該是一個富有朝氣、生機活潑、不斷變革的學(xué)科。
要想實現(xiàn)檔案信息化,就必須對現(xiàn)有檔案進行數(shù)字化。所謂數(shù)字化,本質(zhì)就是將人們感受到的信息抽象為可以度量的用符號表達的數(shù)字、數(shù)據(jù),再將這些數(shù)字、數(shù)據(jù)按照一定的數(shù)字化模型(編碼規(guī)則)轉(zhuǎn)換為一系列計算機可以識別的二進制代碼,從而可以通過計算機對這些數(shù)據(jù)進行高效率的處理、存儲、傳輸,這就是數(shù)字化的基本過程。
檔案信息數(shù)字化無疑就是將存儲于傳統(tǒng)載體上的檔案信息進行數(shù)字化的過程。
1 檔案信息數(shù)字化的現(xiàn)狀
加拿大檔案學(xué)家特里.庫克精辟地指出:“20世紀(jì)末期,公眾對檔案的認識,或至少是用納稅人資金建立起來的檔案館的認識已經(jīng)發(fā)生了根本變化,即現(xiàn)在檔案是屬于人民,為人民服務(wù),甚至通常由人民管理。在普通公民看來,檔案不僅要涉及政府的職責(zé)和保護公民的個人利益,而且更多的是還要為他們提供根源感、身份感、地方感和集體記憶?!彪S著網(wǎng)絡(luò)的普及,為了適應(yīng)數(shù)字化的網(wǎng)絡(luò)時代,檔案的服務(wù)利用方式正在悄然改變,這就要求我們對檔案信息進行數(shù)字化,那么,檔案信息數(shù)字化的問題就擺在了我們的面前。
目前我國正處于檔案信息現(xiàn)代化管理發(fā)展的快速發(fā)展時期,實質(zhì)上從本質(zhì)上改變了傳統(tǒng)檔案信息管理和利用以檔案工作者為主體的風(fēng)格,不但應(yīng)用目錄計算機檢索技術(shù)替換傳統(tǒng)手工目錄檢索,而且真正把紙質(zhì)檔案信息通過數(shù)據(jù)錄入和計算機掃描技術(shù)把檔案信息以數(shù)據(jù)庫和圖像格式存儲在存儲設(shè)備上,實現(xiàn)檔案信息的全文檢索。其關(guān)鍵技術(shù)就是把文本類電子文件中檔案信息提純出來,以數(shù)據(jù)庫形式存放,提供檢索和利用,或者以案件級和文件級目錄下掛接電子文件,如圖像格式(TTIF、JPEG、PDF)等,實現(xiàn)不進檔案庫房,不調(diào)檔案案卷,不翻閱檔案就可以利用相當(dāng)于原始的數(shù)字化檔案信息,在時間、效率、利用人群、效果上都充分發(fā)揮了檔案信息的作用。
全國各級各類檔案館大都進行過至少一次的全館檔案信息的數(shù)字化,但是效果卻不盡如人意,存在的問題主要有:第一,只是機械地將檔案信息進行采集后的數(shù)字化,不能提取檔案信息中的元數(shù)據(jù);第二,電子文件的真實性問題;第三,網(wǎng)絡(luò)安全問題;第四,檔案信息數(shù)字化后數(shù)據(jù)的存儲與維護;第五,出現(xiàn)的一些新情況新問題,有些檔案信息本來就是數(shù)字化或者已經(jīng)數(shù)字化的,比如博客和電子文件。如果說,“電子文件是數(shù)字時代人類活動的主要記錄,是人類文明的重要載體”,那么,網(wǎng)絡(luò)檔案信息資源也是網(wǎng)絡(luò)時代人類活動的重要記錄,包括博客在內(nèi)的網(wǎng)絡(luò)檔案信息資源也值得保存。
中外檔案界早有重視現(xiàn)行文件管理的傳統(tǒng),數(shù)字文件管理的復(fù)雜度加深了這種認知,同時也提升了實施和監(jiān)管現(xiàn)行文件管理的難度。中國人民大學(xué)信息資源管理學(xué)院課題組通過對我國46個省級、副省級檔案館電子文件移交進館及管理情況的調(diào)查,指出立檔單位電子文件歸檔工作不完善是電子文件移交進館的基本障礙。
而備受關(guān)注的全國第一家數(shù)字檔案館項目建設(shè)單位深圳市檔案館,則通過自身十多年的實踐,深刻認識到:只有從文件形成的源頭抓起,將可用性、可信性融入長期保存這個連續(xù)過程及保管機構(gòu)中,建設(shè)高品質(zhì)的元數(shù)據(jù)標(biāo)準(zhǔn),才能實現(xiàn)長期保存的目標(biāo)。其數(shù)字檔案館第三期的核心將是借助于深圳市文檔中心,建立面向機構(gòu)提供組件化服務(wù)的電子文件全程管理系統(tǒng)。
2 對檔案信息數(shù)字化存在問題的原因分析
1.檔案信息數(shù)字化的元數(shù)據(jù)抽取問題。目前的數(shù)字化由于只是對檔案信息進行簡單的數(shù)字處理,將其從載體上剝離出來,但是這些數(shù)據(jù)并沒有進行相關(guān)的元數(shù)據(jù)抽取,可用性較差,不能滿足公眾日益增長的信息需求。由于對元數(shù)據(jù)抽取需要進行大量的工作,所以目前仍然沒有一個具體和切實可行并行之有效的標(biāo)準(zhǔn)規(guī)范出臺,用以指導(dǎo)檔案信息數(shù)字化過程中的元數(shù)據(jù)抽取。
2.電子文件真實性問題。目前維護電子文件真實性的方法主要有:存取權(quán)限控制技術(shù)、密鑰法、數(shù)字水印技術(shù)、電子簽名、數(shù)字時間印章等等。這些措施對保護電子文件的真實性起到一定的作用,但還不能達到確保電子文件真實性的目的。制定嚴格的管理制度和研究先進的技術(shù)以維護電子文件的真實性將是一項長期而又艱巨的工作。
3. 檔案信息數(shù)字化后的存儲與維護。隨著計算機網(wǎng)絡(luò)的發(fā)展,如何維護檔案信息數(shù)字化后的數(shù)據(jù)問題也日益突出,病毒、網(wǎng)上黑客的攻擊、網(wǎng)上竊聽與篡改等無時不刻地侵犯著檔案信息的安全,盡管有防火墻、身份驗證、第三方認證等安全防范措施,卻也難以止住檔案信息或數(shù)據(jù)的丟失。加強數(shù)字化檔案信息的安全防范措施是實現(xiàn)檔案信息數(shù)字化的棘手課題。
3 關(guān)于解決檔案信息數(shù)字化問題的對策措施
1.準(zhǔn)確抽取元數(shù)據(jù)。各級各類檔案館要實現(xiàn)更高程度的數(shù)字化,即各館實現(xiàn)數(shù)據(jù)交互,就必須有一個統(tǒng)一的檔案信息數(shù)字化標(biāo)準(zhǔn),而不是各自為政,各自為戰(zhàn),其中元數(shù)據(jù)的標(biāo)準(zhǔn)化顯得尤為重要。以美國ARC研究項目為例,是將元數(shù)據(jù)從檔案信息中抽取出來后,按照上位類和下位類的方式重新進行排列組合,進而達到了提高檔案信息使用效率的目的,我國檔案信息數(shù)字化過程中的元數(shù)據(jù)抽取可以有選擇的進行借鑒和參考。
2.注重檔案信息數(shù)字化系統(tǒng)的整體功能。我們知道,系統(tǒng)的結(jié)構(gòu)決定系統(tǒng)的功能。所謂的功能,是指系統(tǒng)在與外部環(huán)境,與其他系統(tǒng)的相互作用中,表現(xiàn)出影響和改變外部環(huán)境或其他系統(tǒng)抵抗和承受它們的作用和能力。4而系統(tǒng)的要素之于系統(tǒng)的整體功能并不是簡單的“1+1=2”數(shù)學(xué)公理,要發(fā)揮檔案信息數(shù)字化系統(tǒng)的整體功能就必須重新整合檔案信息數(shù)字化系統(tǒng)中各要素的結(jié)構(gòu),通過這些要素的重構(gòu)與優(yōu)化,從而實現(xiàn)在整體功能上達到“1+1>2”的效果。
3.盡快開展電子文件管理系統(tǒng)規(guī)范化標(biāo)準(zhǔn)化工作。即各館實現(xiàn)數(shù)據(jù)交互,就必須有一個統(tǒng)一的檔案信息數(shù)字化標(biāo)準(zhǔn),而不是各自為政,各自為戰(zhàn),其中元數(shù)據(jù)的標(biāo)準(zhǔn)化顯得尤為重要。同時,對電子文件管理系統(tǒng)進行規(guī)范化操作,如制作下發(fā)統(tǒng)一的電子文件管理系統(tǒng)。
4.針對未來需求進行相應(yīng)的理論探索。結(jié)合目前實踐運用情況,綜合各館實際情況,在充分調(diào)研統(tǒng)計數(shù)據(jù)的基礎(chǔ)上,對未來的需求進行梳理總結(jié),通過現(xiàn)有實踐基礎(chǔ)探討未來電子文件發(fā)展方向,進而做到在理論上先行一步。
5.探索檔案數(shù)字信息的存儲與維護。在現(xiàn)有的計算機和網(wǎng)絡(luò)技術(shù)的條件環(huán)境中,為確保數(shù)字化的檔案信息安全,應(yīng)時刻關(guān)注在計算機安全方面的技術(shù)發(fā)展,及時更新計算機數(shù)據(jù)庫方面安全防范手段,調(diào)整計算機網(wǎng)絡(luò)安全策略,保證檔案信息數(shù)字化的成果。
數(shù)字時代的檔案館應(yīng)當(dāng)是高度信息化的檔案館,實現(xiàn)這一目標(biāo)必須有豐富的數(shù)字化資源作為保障。檔案館館藏檔案信息數(shù)字化的實現(xiàn),不僅使館藏檔案信息資源最大限度為社會服務(wù),資源共享,也為檔案館明天的生存與發(fā)展帶來了希望和活力。
參考文獻
[1]馮惠玲、張輯哲:《檔案學(xué)概論》(第二版),北京,中國人民大學(xué)出版,2001,第191頁。
[2]趙愛國:《檔案學(xué)的“變”與“通”》,檔案學(xué)通訊,2003(4),第1頁
[3]【加拿大】特里.庫克:《1898年荷蘭手冊出版以來檔案理論與實踐的相互影響》,第十三屆國際檔案大會報告集,中國檔案出版社,1997年版。
[4]徐忠勇:《檔案信息數(shù)字化方法研究》,http://www.archives.sh.cn/docs/200802/d_154128.html,2009年7月9日訪問。
[5]《建議將電子文件管理納入國家信息化發(fā)展戰(zhàn)略》(全國政協(xié)委員毛福民在政協(xié)十一屆一次會議上的提案摘要),《中國檔案報》,2008-3-13(3)。
[6]劉越南、楊程婕、熊瑤、張喜波:《我國省級、副省級檔案館電子文件移交進館及管理情況調(diào)查分析》,檔案學(xué)通訊,2011(4):7-12。
[7]劉越男、劉語葉、李雪君、吳云鵬:《電子文件的長期保存:多維互動的領(lǐng)域》,檔案學(xué)研究,2014(4),第56頁。
[8]陳 娟 洪艷芳:《淺談數(shù)字化時代檔案利用工作》,http://www.cqn.com.cn/news/zgjyjy/265879.html,2009年7月5日訪問。
[9]張建理:《從系統(tǒng)論的結(jié)構(gòu)和功能看語言和語言教學(xué)》,《浙江大學(xué)學(xué)報(人文社會科學(xué)版)》1987年第2期。
[10]楊福平:《檔案信息數(shù)字化的認識與思考》,http://blog.sina.com.cn/s/blog_5f9104ad0100dpzp.html,2009年7月10日訪問。
[11]張正強.基于XML的電子文件著錄與檢索研究[R].上海市課題,2012.
[12]張正強.知識組織與標(biāo)準(zhǔn)化研究[M].北京:解放軍出版社,2007.
[13]趙芳.《檔案著錄規(guī)則》應(yīng)用中的局限性分析[J].蘭臺世界,2009(8)
[14]王志宇、趙淑梅:《非結(jié)構(gòu)化電子檔案數(shù)據(jù)管理探析》,檔案學(xué)通訊,2014(5),第54頁。
[15]黃新榮、王曉杰、龐文琪:《網(wǎng)絡(luò)時代電子文件歸檔方式研究》,檔案學(xué)通訊,2014(5),第49頁。
[16]陶水龍、田雷:《電子檔案雙套制管理問題研究》,檔案學(xué)研究,2014(4),第61頁。