文/陳霄
國家檔案局9號令提出,檔案館要適應(yīng)信息化建設(shè)的需要,收集電子檔案和紙質(zhì)檔案的數(shù)字化副本。檔案數(shù)字化工作越來越受重視,相應(yīng)的數(shù)字化要求也會越來越高。我國檔案工作“十二五”規(guī)劃中特別就數(shù)字化工作作了明確要求。上海市檔案事業(yè)發(fā)展“十二五”規(guī)劃提出:“檔案數(shù)字化全文覆蓋率平均達到60%-70%”。浙江省檔案事業(yè)發(fā)展“十二五”規(guī)劃提出:“對機關(guān)單位未到移交進館年限的紙質(zhì)檔案,全部進行數(shù)字化”。文化遺產(chǎn)資料數(shù)字化技術(shù)指南來自于國際檔案理事會網(wǎng)站。國際檔案理事會(簡稱ICA)是全球文件和檔案專業(yè)人員的代表,致力于文件的有效管理和世界檔案遺產(chǎn)的保護和利用。在其網(wǎng)站上發(fā)布了很多專業(yè)的檔案項目,其中一個項目為圖像視聽檔案工作組的,指南是其工作的一個重要成果。
指南從技術(shù)概述、成像工作流、不同記錄類型的數(shù)字化規(guī)則、文件格式比較、元數(shù)據(jù)、儲存推薦、質(zhì)量管理等方面全面介紹了如何開展數(shù)字化工作。指南共分8個章節(jié),它們是:
第一章:引言
第二章:技術(shù)概述
第三章:成像工作流
第四章:各類文稿的數(shù)字化規(guī)范
第五章:文件格式比較
第六章:元數(shù)據(jù)
第七章:推薦存儲
第八章:質(zhì)量管理
其目的是開發(fā)這套用于鼓勵各個聯(lián)邦機構(gòu)(以及其它有意向的機構(gòu))協(xié)作的數(shù)碼圖像指南,為公眾提供格式統(tǒng)一的圖像,為數(shù)字化服務(wù)供應(yīng)商和制造商提供常見的實踐方式和技術(shù)基準(zhǔn)。提供一套符合當(dāng)前實際的數(shù)字化方法。提供一套適用于各種輸出和各種用途的一致的成像和元數(shù)據(jù)收集方法。定義用于描述評價數(shù)碼成果及用于評測符合規(guī)定要求的驗證方法的通用的質(zhì)量或品質(zhì)指標(biāo)。
指南指令性條文性的內(nèi)容很少,信息翔實案例豐富,側(cè)重于實用性。
本文涉及的主題包含以下內(nèi)容:
靜態(tài)圖像的數(shù)字圖像采集——主文件創(chuàng)建、圖像參數(shù)、數(shù)字化環(huán)境、色彩管理等。
色彩編碼準(zhǔn)確度——色彩空間、圖像處理圖像閱覽的色溫、線性及區(qū)域矩陣質(zhì)量、不同插值算法的質(zhì)量。
數(shù)字圖像品質(zhì)——評估數(shù)字圖像特性的可操作指標(biāo)和標(biāo)準(zhǔn)的發(fā)展,該指標(biāo)和標(biāo)準(zhǔn)用于數(shù)字圖像的檢測或質(zhì)量控制,包括多種位圖類型的分辨率、噪聲、色彩編碼、失真的指標(biāo)和標(biāo)準(zhǔn)。
圖像處理工作流范例——包含圖像處理、銳化等方面的指南。
元數(shù)據(jù)最低要求——討論為了主文件能夠可讀、可查、可用所需收集和建立的最小元數(shù)據(jù)集。
文件格式——主文件的推薦格式和編碼等。
文件命名的方法。
基本存儲建議。
質(zhì)量管理——圖像、元數(shù)據(jù)、圖像檢查、接受和拒絕、計量(保證檢測和質(zhì)檢設(shè)備讀數(shù)精確精準(zhǔn))這些方面的質(zhì)量保證和質(zhì)量控制。
(一)指標(biāo)量化。指南對數(shù)字化過程中各類指標(biāo)及術(shù)語都做了詳盡的說明。在技術(shù)概述章節(jié)中詳細(xì)描述了數(shù)字化過程涉及的各種專業(yè)術(shù)語,比如柵格圖像特性方面的空間分辨率、其測量方式為每英寸的像素即PPI或每英寸點數(shù)即DPI,信號分辨率,其表示為位深度,比如8比特位(8-bits),色彩模式、常見的色彩模式包含RGB(紅red、綠 green、藍 blue),CMYK( 青Cyan、品 紅 Magenta、黃 Yellow、黑Black[ K:blacK = 黑色,為了避免與RGB的Blue藍色混淆而改稱K])和LAB(明度lightness、紅/品紅和綠色red-green、黃和藍 yellow-blue)。
?
?
在數(shù)字化環(huán)境方面的參數(shù)、其中提到數(shù)字化中對顯示器有較高要求。
掃描儀和數(shù)碼相機性能的量化章節(jié)提供了套用于評估數(shù)碼成像的通用質(zhì)量指標(biāo),也是該指南的一個關(guān)鍵章節(jié),共六個表,一個主表(第一部分——數(shù)碼成像性能分類),五個附表(第二部分——數(shù)碼成像的評估和質(zhì)量控制)。這些表和評估標(biāo)準(zhǔn)用于指導(dǎo)具體數(shù)字化工作。以下是主表(表1)和其中一個附表(表2)的范例。在每個表中任何指標(biāo)該指南都有詳細(xì)的技術(shù)說明。
(二)范例豐富。各類文稿的數(shù)字化規(guī)范章節(jié)中,對手稿、書籍、圖文稿、插畫、地圖、平面圖、照片、航拍照片、實物及文物等類型原稿都有詳細(xì)的操作實例,并給出了具體的處理建議和技術(shù)參數(shù),說明詳盡,圖文并茂,使讀者能很快了解不同原稿處理時的注意點,處理的關(guān)鍵,掌握操作步驟。指南還提供了這些文稿數(shù)字化處理工作流實例。
以指南中文稿印章掃描為例,圖1中顯示的左側(cè)為普通平板掃描的成果,文稿中的印章幾乎無法識別。指南在印章處理章節(jié)中詳細(xì)說明如何進行實際操作,右側(cè)是按照指南中印章處理的方法,在掃描過程中采用單側(cè)光源,印章內(nèi)容清晰可見。
本人在平時的工作過程中,會有檔案員咨詢?nèi)绾螌⒈臼袛?shù)字化規(guī)則應(yīng)用到工作中,說明本市數(shù)字化規(guī)則在設(shè)定時,還是側(cè)重于條文,而在范例應(yīng)用上比較欠缺。以后在制定數(shù)字化規(guī)則時,可以參考指南,引入操作范例。
(三)元數(shù)據(jù)在數(shù)字化過程中的應(yīng)用。指南的一大特點就是,在數(shù)字化過程中引入元數(shù)據(jù)的管理。在元數(shù)據(jù)章節(jié)中,指南建議選擇合適的元數(shù)據(jù),在數(shù)字化過程和數(shù)字化成果保存利用過程中都需要應(yīng)用元數(shù)據(jù)。元數(shù)據(jù)選取過程中首先要考慮以下內(nèi)容,元數(shù)據(jù)是否已在其它系統(tǒng)中存在,比如數(shù)據(jù)庫、書目記錄、檢索工具、或者類似都柏林核心數(shù)據(jù)庫或本地數(shù)據(jù)的數(shù)據(jù)格式中,元數(shù)據(jù)由誰來獲取,如何獲取,何時收集,何處存儲,如何存儲,是否與其他系統(tǒng)交互,元數(shù)據(jù)記錄明細(xì)度等。
在質(zhì)量管理章節(jié)中,指南建議數(shù)字化圖像100%驗證,即全面質(zhì)檢,并要求圖像的元數(shù)據(jù)完整。
在我國,元數(shù)據(jù)在檔案信息化過程的應(yīng)用也是一個熱點話題,浙江省也是元數(shù)據(jù)應(yīng)用的國家試點地區(qū)。而在日常工作中,數(shù)字化加工很少涉及元數(shù)據(jù)。如何將元數(shù)據(jù)應(yīng)用在數(shù)字化工作中,以確保數(shù)字化成果完整性、有效性,使數(shù)字化成果能夠長久保持,方便利用。筆者認(rèn)為在這方面可以參照指南,是值得研究的。
指南在文獻遺產(chǎn)數(shù)字化方面提出的操作標(biāo)準(zhǔn)及理念處于世界領(lǐng)先水平,又是國際檔案理事會推薦的數(shù)字化標(biāo)準(zhǔn),因而指南對本地數(shù)字化工作有啟示意義。當(dāng)然,指南中的標(biāo)準(zhǔn)及參數(shù)是建立在美國聯(lián)邦機構(gòu)數(shù)字化實踐的基礎(chǔ)上,與我們的實際工作會有不同的地方,因而在如何學(xué)習(xí),如何提高本地數(shù)字化工作上,需要做很多努力。