趙小鵬
數(shù)字資源保存的目的是保證未來用戶可以檢索、獲取、瀏覽、理解各種數(shù)據(jù)和記錄,它是一項長期的需要大量投資的工程。目前我國僅有少數(shù)幾個文獻機構開始了相關研究和試驗工作,而在歐美、澳大利亞等國家,數(shù)字資源長期保存方面的戰(zhàn)略研究和應用已經(jīng)取得了一些進展,并開展了一系列的研究項目,積累了大量的知識和經(jīng)驗。
在數(shù)字資源保存中,需要保存數(shù)字信息本身及相關技術、方法和工具,包括保存數(shù)字比特流,保存數(shù)字格式與處理信息,保存數(shù)字信息處理環(huán)境,保存數(shù)字信息的驗證和管理機制,保存數(shù)字信息的組織和利用環(huán)境等。這些均需要成本核算與因素分析。成本核算分析,主要是利用成本核算及其他有關資料,全面分析成本水平與構成的變動情況,系統(tǒng)地研究成本變動的因素和原因,挖掘降低成本的潛力。通過分析,可以正確認識和掌握成本變動的規(guī)律,有利于實現(xiàn)降低成本的目標,并為編制成本計劃和制定新的經(jīng)營決策提供依據(jù)。對數(shù)字保存成本進行分析可以明晰各種費用支出,合理調配各種資源,為尋求降低成本的方法提供一些思路。數(shù)字資源長期保存的成本一般包括:固定成本、技術成本、基礎設施建設成本、人員成本、組織管理成本、可變成本和更新資源成本。
1.選擇數(shù)字資源的不同保存方法
目前常用的兩種保存方法是遷移和仿真。遷移是把數(shù)字信息定期從一代計算機上遷移到新一代計算機上,仿真是對原始軟硬件、操作系統(tǒng)的模仿,從長期保存來看,這兩種策略都是很昂貴的。使用遷移法對數(shù)字資源進行格式轉換的代價較高,仿真法需要的是更多的初始投資。遷移法的實施對象不是一個數(shù)字資源的整體,而是單個對象,需對集合中的每一個數(shù)字對象單獨進行轉換,因此遷移法的費用與需要轉換的數(shù)字資源集合的規(guī)模有直接關系,規(guī)模越大,所需費用越多,而仿真工具是應用在一個數(shù)字資源集合的整體,其使用費用不受數(shù)字資源集合規(guī)模的影響。保存策略將對數(shù)字資源生命周期的管理及所需的相關費用產(chǎn)生非常重要的影響,反過來,保存費用的預算也將決定或限制保存策略的選擇,對一個具體的機構而言,是采用遷移法還是仿真法,要視機構的保存時間、保存目標、資金等具體情況做出選擇。
2 數(shù)字資源保存的成本因素
2.1 物理環(huán)境方面。物理場所主要包括安放服務器和相關設備的空間、足夠的辦公室空間、安全防護設施(如防靜電地板、防盜裝置、空調系統(tǒng))等。數(shù)字保存活動需要在一定的空間場所實施,對環(huán)境條件要求較高,這部分開支是必須的。服務器用于數(shù)字文檔的儲存和長期保存的管理,把開發(fā)、測試和生產(chǎn)等各種設備分開安裝,可以減少風險、提高效率,但相應地會增加保存成本。
2.2 硬件方面。主要包括以下成本:存儲數(shù)字文檔的服務器,磁帶、磁盤或其他存儲介質,備份設備,網(wǎng)絡通信費用等。文檔的保存需要硬件設施,如果對需要存儲的文檔規(guī)模有大致的了解,就可以對購買存儲介質的成本進行評估,以便有足夠的預算來配置相應的存儲設備。保存系統(tǒng)接收來自不同地方的大量數(shù)字文檔,需要高速的線路或靈活的、能夠容納不同負荷的線路,因而網(wǎng)絡設施也是很重要的不容忽視的成本。
2.3 軟件方面。主要包括操作系統(tǒng)、安全管理軟件、文檔管理軟件、新/舊應用軟件、顯示程序、通信軟件、數(shù)據(jù)庫使用許可等費用。這一部分涉及到購買操作系統(tǒng)的問題,同時需要系統(tǒng)保護軟件(防止病毒以及未授權的獲取等),也需要具體的軟件來獲取和存儲數(shù)字記錄。另外,每一個進行數(shù)字保存的機構,不管其規(guī)模大小,都需要文件管理系統(tǒng)(Document Management System,DMS)或文檔管理應用軟件(Records Management Application)。存儲系統(tǒng)要提供對存儲文檔的獲取功能,這就要求除了普通的存儲軟件外,還需要具體的應用軟件或顯示軟件,以便用戶能顯示或使用存儲的記錄。在準備這些預算時,也不要忽視通信軟件和網(wǎng)絡數(shù)據(jù)庫使用許可費用。
2.4 人員成本。人員是一個很大的成本影響因素,對不同的知識庫進行成本分析的結果一致表明,人員成本占總體成本的69%-82%。數(shù)字保存的整個過程都離不開人員的參與,不同的工作需要相應的工作人員擔負不同的任務。數(shù)字保存不僅需要專家,也需要管理人員、信息技術人員、提供服務的人員等。
成本分析的根本任務是挖掘降低成本的潛力,促使單位以最少的勞動和資金消耗取得最大的使用價值和效益。數(shù)字資源保存的成本與機構的其他開支是分不開的,數(shù)字資源保存主要是保存其長期的獲取,因此,數(shù)字生命周期所有部分的成本都是相關的,甚至數(shù)字資料制作的成本也是成本因素的組成部分。對數(shù)字資源而言,資料的制作和保存之間的聯(lián)系尤其重要,因為數(shù)字對象制作的方式影響著如何實施保存計劃,同樣,保存階段所做的決定影響著資料將來如何被存取,因此說保存的“成本”在資源被制作時就開始了。但至今還沒有一種正式的機制可以確保數(shù)字資源長期或永久地得以保藏和使用,也沒有一個國際性的數(shù)字資源的法定存儲處。如何在長期存儲和降低成本之間尋求一個平衡點是一個亟待人們探索的問題。