孫楊民
(佳木斯大學,黑龍江 佳木斯 154007)
檔案管理現(xiàn)代化的一個重要特征是數(shù)字化檔案的使用與傳播。20世紀80年代開始有關(guān)檔案的數(shù)字化實踐工作就已經(jīng)開展了,主要方式是利用計算機模擬傳統(tǒng)檔案管理方式實現(xiàn)簡單的檔案目錄管理工作,更多的是作為手工管理的一種補充。隨著信息時代的到來尤其是互聯(lián)網(wǎng)技術(shù)的發(fā)展,檔案管理的信息化、數(shù)字化工作得到長足發(fā)展,已成為檔案管理的工作方式和手段不再只是作為輔助,同時借助檔案的數(shù)字化副本帶來的便利性可以實現(xiàn)檔案信息資源的共享以及高效利用,把長期沉睡檔案的內(nèi)涵價值最大限度地挖掘出來,實現(xiàn)其社會價值。
紙質(zhì)檔案數(shù)字化或者說檔案數(shù)字化是檔案管理現(xiàn)代化的重要一環(huán),可以說每一座檔案館都收藏有大量的紙質(zhì)檔案,對這些紙質(zhì)檔案數(shù)字化并管理是一項重要工作。由于人員、資金、設備等條件的限制和制約,不同的檔案機構(gòu)面臨不同的問題和困難,如何做好存量紙質(zhì)檔案的數(shù)字化工作有許多問題值得探討和研究,而構(gòu)建紙質(zhì)檔案數(shù)字化的管理與利用體系是開展此項工作的重中之重。
紙質(zhì)檔案數(shù)字化是一個長期的回溯過程,需要系統(tǒng)謀劃來完成,目前普遍使用的辦法是通過采用數(shù)碼轉(zhuǎn)換設備并輔助人工來完成紙質(zhì)檔案的數(shù)字化加工并存儲在磁帶、磁盤、光盤等能被計算機讀取與識別的設備上,當前使用較多的轉(zhuǎn)換設備仍然是掃描儀和數(shù)碼相機。作為數(shù)字資源的一種,數(shù)字化的紙質(zhì)檔案改變了傳統(tǒng)的檔案利用和傳輸方式,使檔案工作者從繁瑣的日常事務性管理中解脫出來,更加專注于檔案內(nèi)容的管理、傳播和利用,可以說這種轉(zhuǎn)變是革命性的,拓展了檔案利用的外延,豐富了檔案工作的內(nèi)涵。
紙質(zhì)檔案數(shù)字化的兩種主要方式是掃描與拍攝,區(qū)別在于根據(jù)紙質(zhì)檔案的形態(tài)和質(zhì)量差異而采用不同的儀器設備,由于紙質(zhì)檔案的形成方式和來源不同人工輔助依然不可缺少,因為無法實現(xiàn)完全自動化從而增加了轉(zhuǎn)換難度和轉(zhuǎn)換時間,成本居高不下??焖俚玫郊堎|(zhì)檔案的靜態(tài)數(shù)字圖像可以使用掃描儀,對于無法使用掃描儀的不規(guī)則文本可以使用照相機或高拍儀等設備拍攝,得到紙質(zhì)檔案的數(shù)字影像,后續(xù)開展內(nèi)容識別得到數(shù)字文本,按照檔案著錄規(guī)則獲取元數(shù)據(jù)并進行標引工作也是不容忽視的重要工作。一些先進的紙質(zhì)檔案數(shù)字化設備、更高效的圖像拼接技術(shù)、字符識別技術(shù)等使得紙質(zhì)檔案數(shù)字化的人力成本和時間成本得到降低,比如不拆卷的斷層掃描儀可以不用破壞檔案完成數(shù)字圖像的獲取。
合理、高效開展紙質(zhì)檔案的數(shù)字化工作受到多方因素的影響和制約,這項工作涉及到許多部門和環(huán)節(jié),是一項系統(tǒng)工程,不可能一蹴而就,需要結(jié)合實際工作開展。毋庸置疑,構(gòu)建合理有效的紙質(zhì)檔案數(shù)字化體系是推進紙質(zhì)檔案數(shù)字化、信息化工作的基礎,需要通過事前的調(diào)查研究確定一個可操作性強的、較為完備的紙質(zhì)檔案數(shù)字化體系。這個體系至少要包括數(shù)字化加工體系、數(shù)字化存儲體系、數(shù)字化安全體系等三個方面,如果可能的話還要增加一個數(shù)字化工作的評價體系和數(shù)字化檔案管理和使用規(guī)范來保證數(shù)字化檔案工作的有效性、連續(xù)性、完整性。
當前大多數(shù)檔案機構(gòu)的紙質(zhì)檔案數(shù)字化工作的通常做法是依靠掃描儀或計算機的分散式處理來完成,一般所使用的都是基于c/s結(jié)構(gòu)的集成管理系統(tǒng),當館藏資源較少時還可以應對,隨著數(shù)據(jù)量的不斷增加以及面對海量資源時能力明顯不足。一整套的數(shù)字化加工體系可以達到事半功倍的效果,借助現(xiàn)代信息技術(shù)所建立的數(shù)字化加工體系是基于云存儲的網(wǎng)絡環(huán)境下的流程式系統(tǒng),利用快速的輸入、輸出設備,高效的識別技術(shù),數(shù)字化編輯軟件的協(xié)同工作,實現(xiàn)高效、快速、安全、準確的數(shù)字化加工,進而得到高質(zhì)量的數(shù)字圖像或影像,為后續(xù)的數(shù)字資源管理打下堅實的基礎。
檔案的數(shù)字化工作是一個連續(xù)的不間斷過程,存儲系統(tǒng)是不可或缺的剛性需求。建立合理有效的存儲體系要充分考慮到海量數(shù)據(jù)實時存儲、處理、永久保存、方便存取、容災容錯等因素的影響。首先,連續(xù)不斷的檔案數(shù)字化過程所產(chǎn)生的數(shù)據(jù)量是隨時間不斷積累增加的,因此建立的數(shù)字化存儲體系容量需要不斷增長的同時具備較高的存儲效率,即可擴展性和高效存取要平衡;其次,選用合適的媒介和技術(shù)方法來保證數(shù)字化成果在長期保存之后還要可以訪問和使用,并永久保存;此外,對新技術(shù)新方法的使用不依賴于特定的設備與人員,能夠加快和保證數(shù)據(jù)的無縫訪問和管理。
確保檔案的安全是檔案管理工作的一項重要工作,和檔案的存在形態(tài)無關(guān),而數(shù)字化資源的易復制、易傳播、易篡改的特點又決定了數(shù)字資源的安全保護工作更加復雜和不確定性。因此建立一套完整的、可操作性強的、可實施的紙質(zhì)檔案數(shù)字化安全保障體系是十分必要的,這樣就從源頭上保障了檔案實體、檔案信息的安全和真實有效。一個強健的可實施的數(shù)字化安全體系至少應當包括有效的數(shù)字檔案安全制度,信息系統(tǒng)安全保障措施、檔案的傳播與利用的安全保證等方面。
紙質(zhì)檔案的數(shù)字化過程及結(jié)果要保證完整性、準確性,這就需要有一個評價體系來對整個流程進行質(zhì)量評價進而保證所得到的數(shù)字化檔案的完整、準確。這個評價體系使得整個的數(shù)字化過程可控并可追溯,并可對接續(xù)的數(shù)字化流程提供改進方案和措施,提高效率。首先建立綜合評價指標體系,對數(shù)字化檔案工作所存在問題與解決措施等一系列情況進行全面的事前評估。其次評估紙質(zhì)檔案數(shù)字化流程是否合理有效,獲取的數(shù)字影像或數(shù)字文本是否保證了檔案的真實性和完整性;再者,對接下來的數(shù)字化工作提出合理化的建議和改進措施。
紙質(zhì)檔案數(shù)字化的最終目的還是為了更好地開發(fā)和利用檔案資源,數(shù)字化的檔案信息依靠合理高效的科學管理方法和全新的技術(shù)手段實現(xiàn)對紙質(zhì)檔案信息的深層次挖掘。檔案事業(yè)的發(fā)展在信息時代、網(wǎng)絡時代與過往相比存在較大的不同或差異,現(xiàn)代信息技術(shù)的廣泛應用是保證檔案有效管理的必要條件。經(jīng)過深加工的數(shù)字化檔案使得檔案管理手段和方式極大豐富,尤其是檢索速度和檢索效率提高使得檔案工作者從繁重的檔案日常重復管理中解脫出來,專注于檔案內(nèi)容管理、數(shù)據(jù)挖掘、提高信息服務水平等。
紙質(zhì)檔案的數(shù)字化過程需要多方人、財、物的配合以及連續(xù)不斷的工作積累,是一項艱巨的任務,是一個不可間斷的密集勞動過程。在這個過程中需要合理規(guī)劃,對將要遇到的問題進行提前預判、充分論證并給出妥善解決辦法,這樣才可以達到事半功倍的效果,爭取工作的早日完成。
檔案數(shù)字化工作需要員工借助某些特定設備、系統(tǒng)來完成,所以專業(yè)的檔案管理人員仍然是檔案數(shù)字化工作的主體勞力。檔案管理人員需要通過不斷的政治理論學習和業(yè)務學習,提高政治理論素質(zhì)、工作責任心、業(yè)務能力,積極主動合理高效地做好紙質(zhì)檔案的前期收集、整理工作,同時要具備一定的科研、攻關(guān)意識,工作中做到理論與實踐相結(jié)合,合理創(chuàng)新,拓寬數(shù)字化檔案工作的服務領(lǐng)域。檔案管理部門也要為館員創(chuàng)造終身學習的良好環(huán)境,這不只是檔案數(shù)字化的要求,也是檔案事業(yè)發(fā)展的要求。
從手工到自動化,從實體到數(shù)字文本,檔案的管理方式和存放方式改變的同時也需要全新的管理理念相適應。這種轉(zhuǎn)變的一個重要特征是由藏向用的轉(zhuǎn)變,即管理向服務的轉(zhuǎn)變,從接收檔案入館到主動開展各級各類檔案的收集與征集工作使得館藏極大豐富,借助于現(xiàn)代信息技術(shù)尤其是互聯(lián)網(wǎng)技術(shù)使得檔案的管理和利用更加方便快捷等。
技術(shù)手段在紙質(zhì)檔案數(shù)字化的過程中尤其重要,目前的數(shù)字化技術(shù)多種多樣,圖像處理和圖像識別技術(shù)是紙質(zhì)檔案數(shù)字化過程中最主要的技術(shù),采用規(guī)范化的通用技術(shù)對后續(xù)的數(shù)字資源的存儲和管理十分必要。新技術(shù)新方法層出不窮,目前以云計算為核心的現(xiàn)代信息技術(shù)已經(jīng)成為數(shù)字化管理的主流,在本館的紙質(zhì)檔案數(shù)字化工作中引入云計算的過程中要合理有效地利用現(xiàn)有資源和技術(shù),不斷改進工作方案,科學地融入,從而保持工作的一致性和連續(xù)性。
檔案由藏到用的轉(zhuǎn)變一個重要的特點是由關(guān)注檔案的實體到對檔案內(nèi)容的利用與分析,如何從海量信息中找到有價值的信息是檔案數(shù)字化之后的后續(xù)關(guān)鍵問題。借助于信息挖掘技術(shù)找出有價值的檔案資源為管理機構(gòu)和個人提供更專業(yè)的服務并解決問題是提高檔案服務水平的一個重要手段,在實際工作中起到重要作用。得益于時代的發(fā)展,檔案數(shù)字化成為當前檔案工作的主要內(nèi)容之一,檔案從業(yè)者也在采用新的信息技術(shù)和新的檔案管理理念的推動下不斷探索與發(fā)現(xiàn)檔案數(shù)字化管理工作的新思路。雖然無論是已經(jīng)開始或即將開始紙質(zhì)檔案數(shù)字化的管理機構(gòu)都面臨著各種各樣的問題,但通過構(gòu)建高效的數(shù)字化工作體系開展的數(shù)字化工作已經(jīng)逐漸實現(xiàn)了沉睡檔案巨大價值的深度發(fā)掘和使用,在今后的工作中,隨著技術(shù)的發(fā)展和進步,紙質(zhì)檔案的數(shù)字化工作將取得更大成就。