李文媛 王輝 陳湘輝 歐陽瓊
摘 要:檔案數(shù)字化作為檔案信息化的基礎(chǔ)工作之一既是時代發(fā)展的趨勢也是現(xiàn)實工作的需求,但在實踐中仍然存在經(jīng)費限制、標(biāo)準(zhǔn)實踐差異、質(zhì)檢效果效率失衡、外包管理混亂等問題,據(jù)此筆者提出爭取重視、合理規(guī)劃經(jīng)費,開展試驗、敲定標(biāo)準(zhǔn)細節(jié),嚴(yán)格把關(guān)、確保質(zhì)檢成效,制定方案、落實工作流程和現(xiàn)場管控等實踐工作建議。
關(guān)鍵詞:檔案數(shù)字化;實踐;問題;外包
在信息時代背景下,檔案信息化發(fā)展勢不可擋,數(shù)字化是檔案資源化的重要途徑之一,但是數(shù)字化工作在實踐中仍然存在種種問題。在此情況下,檔案工作人員需要認清形勢,積極迎接挑戰(zhàn),探索適合本單位的數(shù)字化方式,遵循檔案管理要求,滿足檔案和業(yè)務(wù)工作需求,提高檔案利用率,增加檔案工作顯示度。
1 檔案數(shù)字化的必要性
1.1 檔案數(shù)字化是時代發(fā)展的必然趨勢
當(dāng)今社會是信息化的時代,信息量劇增、信息傳遞迅速,傳統(tǒng)檔案工作模式已難以適應(yīng)信息時代的要求。只有傳統(tǒng)載體的檔案資源轉(zhuǎn)化成為數(shù)字資源,才能夠順應(yīng)時代發(fā)展,使檔案資源在信息化浪潮中得到更有效的應(yīng)用,檔案工作才能取得進一步的發(fā)展。檔案數(shù)字化則是實現(xiàn)檔案資源形態(tài)轉(zhuǎn)化的必要手段之一。面對新形勢新任務(wù)新要求,兩辦提出“各檔案館(室)要大力開展傳統(tǒng)載體檔案數(shù)字化工作”[1],國家檔案局《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》提出“全面推進檔案資源存量數(shù)字化、增量電子化、利用網(wǎng)絡(luò)化”的發(fā)展目標(biāo)[2]。這都是國家層面順應(yīng)時代要求對檔案工作的新規(guī)劃新要求。
1.2 檔案數(shù)字化是現(xiàn)實工作的迫切要求
檔案工作既要為國家存史,也要為經(jīng)濟社會發(fā)展服好務(wù)。存史則要保管好檔案,服務(wù)則要利用好檔案,而當(dāng)下的檔案工作常常面臨庫房緊張、檔案損壞老化、利用效率低等問題,管好用好檔案都存在難以長期為繼的風(fēng)險。而檔案數(shù)字化則能夠減少傳統(tǒng)檔案實體的限制,減輕庫房壓力、降低檔案實體使用率從而在一定程度上保護檔案,同時可以提高檔案管理和服務(wù)效率,能更好地為單位、公眾、社會所利用。對于數(shù)字化工作的推進,國家和各地方檔案管理主管部門了也提出了具體的目標(biāo):對綜合檔案館來說,國家對館藏數(shù)字化率作出了“全國省級、地市級和縣級國家綜合檔案館館藏永久檔案數(shù)字化的比例,分別達到30—60%、40—75%和25—50%”[3]的明確要求;對機關(guān)企事業(yè)單位等移交單位來說,許多綜合檔案館已經(jīng)要求移交進館的檔案同時移交數(shù)字化副本。這些都充分說明了現(xiàn)實工作對檔案數(shù)字化緊迫要求。
1.3 檔案數(shù)字化是檔案信息化建設(shè)的重要基礎(chǔ)
圍繞“以信息化為核心的檔案管理現(xiàn)代化水平明顯提升”的檔案管理信息化發(fā)展目標(biāo)[4],檔案信息化建設(shè)成為近些年檔案事業(yè)發(fā)展和各檔案館(室)的工作重點。檔案數(shù)字化既是檔案信息化的重要組成部分,也是檔案信息化建設(shè)的重要基礎(chǔ)。存量檔案數(shù)字化是檔案信息化建設(shè)的數(shù)據(jù)資源來源之一,與增量電子化共同構(gòu)成檔案信息化的信息資源基礎(chǔ)。信息技術(shù)也是近一二十年的才迎來高速發(fā)展,各檔案館(室)除了面臨現(xiàn)在海量的新增電子信息資源,更有積累數(shù)十年甚至上百年的大量傳統(tǒng)載體檔案在庫房中亟待更好地發(fā)揮其價值,因此檔案數(shù)字化是一項不可或缺的基礎(chǔ)性工作。
2 實踐中檔案數(shù)字化工作的困境
盡管檔案數(shù)字化工作開展較為普遍,但在工作中還存在著諸多問題,突出表現(xiàn)在經(jīng)費有限、標(biāo)準(zhǔn)實踐差異、質(zhì)檢效率效果難平衡、外包管理混亂等。
2.1 經(jīng)費限制
各單位檔案管理部門雖然可以自行開展檔案數(shù)字化工作,但是通常情況是專職檔案員十分有限、數(shù)字化任務(wù)量卻十分巨大,要自行完成全部館藏檔案的數(shù)字化工作難度很大,因此目前采取業(yè)務(wù)外包的形式更為普遍。雖然檔案數(shù)字化是一次性投入無后續(xù)維護等追加費用,但是數(shù)十年館藏量的積累以及逐步提升的人力成本,一般需要較大的經(jīng)費投入,從十幾萬到幾十甚至上百萬不等的成本開支使得經(jīng)費問題成為數(shù)字化工作能否開展的首要問題。特別是檔案工作的存在感較低,在不是以檔案資料管理為主要業(yè)務(wù)的單位,檔案工作常是邊緣性、非顯性的工作,得到的重視程度有限,經(jīng)費支持相應(yīng)的也十分有限,直接限制了檔案數(shù)字化工作的開展。
2.2 標(biāo)準(zhǔn)實踐差異
國家層面近些年陸續(xù)制定出臺了若干個檔案數(shù)字化工作標(biāo)準(zhǔn)文件,對檔案數(shù)字化工作開展有很大的實踐指導(dǎo)價值。但是這些標(biāo)準(zhǔn)都是行業(yè)推薦標(biāo)準(zhǔn),不具備強制性且用詞上也多以建議性為主,所以在實踐過程中仍然有對標(biāo)準(zhǔn)尺度把握不確定的問題,例如在掃描分辨率、存儲格式、OCR處理的選擇。
《DA/T 31-2017 紙質(zhì)檔案數(shù)字化規(guī)范》規(guī)定“掃描分辨率應(yīng)不小于200dpi。如文字偏小、密集、清晰度較差時,建議掃描分辨率不小于300dpi”,在存儲格式上“紙質(zhì)檔案數(shù)字圖像長期保存格式為TIFF、JPEG或JPEG2000等通用格式”。通過以上條款可知,200dpi的分辨率能夠滿足檔案工作需要,而在實踐中,高比低好的心態(tài)、移交進館等要求等促使300dpi的選用成為常態(tài)。同樣的,在實際工作中JPEG有損壓縮的保存格式在視覺感官上幾乎難以分辨,但是出于信息完整新的保存還是不少單位會選擇TIFF無壓縮。然而,分辨率和存儲格式的差異,占用空間會有幾倍甚至幾十倍的差距,在數(shù)十萬頁、數(shù)百萬頁的館藏數(shù)字化量級的情況下更高的分辨率和無壓縮的存儲格式會給檔案信息的存儲造成較大壓力。全文檢索是深度利用檔案的一個重要檢索途徑,數(shù)字化資源實現(xiàn)全文檢索則要依賴于OCR識別。目前OCR技術(shù)對普通文字文檔識別準(zhǔn)確率較高,但對圖表、手寫體的識別率則大大降低,在工作中需要投入更多的財力人力進行軟件智能學(xué)習(xí)、人工校對。因此在不少單位對數(shù)字化圖像進行OCR處理沒有進一步要求。
2.3 質(zhì)量檢查效果效率難平衡
成果檢查是保證檔案數(shù)字化成果質(zhì)量的關(guān)鍵步驟。質(zhì)量檢查分為機器檢查和人工檢查,也分為全檢和抽檢。所謂機器檢查就是通過計算機軟件對數(shù)字化掃描參數(shù)、圖像處理情況、目錄數(shù)據(jù)及掛接等項目進行檢查,有速度快、效率高等特點。但據(jù)目前了解的情況來看,實踐中能夠做到機檢的并不太多,更多的質(zhì)量檢查工作還是依賴人工。在檢查結(jié)果上,全檢的質(zhì)量控制效果一般是優(yōu)于抽檢的,但在效率上則很難滿足工作實際。因為全檢工作意味著要對數(shù)字化原件出入庫、裝訂還原等情況進行逐件檢查,也要對數(shù)字化成果的各項參數(shù)、標(biāo)準(zhǔn)等逐件逐頁檢查,對人力投入有很大的要求。然而,鑒于檔案工作人員普遍不足的現(xiàn)狀,全檢幾乎難以實現(xiàn),人工抽檢是目前的較為普遍的選擇,因此在質(zhì)量控制上就有存在誤差的可能性,質(zhì)檢效率效果需要仔細衡量。
2.4 外包工作管理混亂
由于人手不足、工作效率較低等因素的限制,檔案數(shù)字化業(yè)務(wù)外包成為當(dāng)前檔案部門的普遍選擇,由此卻引發(fā)了業(yè)務(wù)外包管理的問題。首先是準(zhǔn)入問題,盡管各省市均陸續(xù)出臺了檔案中介服務(wù)機構(gòu)備案等管理規(guī)定,但行業(yè)準(zhǔn)入門檻不高、公司人員流動性大、專業(yè)程度不高等問題一直存在,是檔案數(shù)字化工作的潛在隱患。其次是安全問題,數(shù)字化項目開展往往是臨時安排的工作場所,視頻監(jiān)控系統(tǒng)、工作設(shè)備、專用裝具等安全保障不一定完備,存在一定的安全風(fēng)險。最后是過程管理問題,數(shù)字化工作一般數(shù)量多任務(wù)重,工作流程較長且有反復(fù),過程中容易出現(xiàn)監(jiān)督、指導(dǎo)和管理不及時不到位的情況,也會對檔案數(shù)字化工作的成效造成影響。
3 對檔案數(shù)字化實踐工作的建議
3.1 爭取重視,合理規(guī)劃經(jīng)費
通過加強宣傳、努力提高檔案工作地位、提升檔案工作顯示度,爭取領(lǐng)導(dǎo)對檔案和檔案工作的重視,爭取獲得足額工作經(jīng)費支持并合理使用,以保證數(shù)字化工作順利開展。在經(jīng)費有限的情況下,更需要科學(xué)規(guī)劃工作、合理安排經(jīng)費,按檔案資料的重要程度劃分確定數(shù)字化工作對象的優(yōu)先級,有效地發(fā)揮有限經(jīng)費的最大價值。檔案資料的重要程度可以按保管期限、利用頻率、是否需要移交進館等維度來進行判斷,保管期限為永久的檔案一般價值較高是數(shù)字化重點對象,利用頻率高的檔案說明是工作常用且出于檔案實體保護目的應(yīng)該提前數(shù)字化,需要移交進館的檔案因為進館要求必須數(shù)字化。
3.2 開展試驗,敲定標(biāo)準(zhǔn)細節(jié)
檔案數(shù)字化最終成果質(zhì)量的高低依賴于工作要求細化的程度,標(biāo)準(zhǔn)細化程度越高,數(shù)字化工作實施更明確。檔案數(shù)字化工作全面展開前,可以先進行小范圍試驗,以根據(jù)實際情況選擇最適宜的掃描分辨率、存儲格式,明確文件命名規(guī)則、目錄數(shù)據(jù)著錄項、圖像處理程度以及是否進行OCR識別等工作細節(jié)要求。在試驗中,應(yīng)注意測試全面、成果完整,以避免在正式開展工作時出現(xiàn)過多的新問題導(dǎo)致方案頻繁修改。同時,積極尋求檔案主管部門業(yè)務(wù)指導(dǎo),與已開展檔案數(shù)字化工作單位交流學(xué)習(xí),與檔案中介服務(wù)機構(gòu)積極溝通,將數(shù)字化加工的工作要求、質(zhì)量標(biāo)準(zhǔn)落在紙上,落實在工作中。
3.3 嚴(yán)格把關(guān),確保質(zhì)檢成效
在數(shù)字化工作開展期間,盡量增設(shè)人手確保質(zhì)量檢查工作有效開展。在人手不足且以人工檢查為主的情況下,需要制定適宜的質(zhì)檢策略,做好質(zhì)檢效果和效率的平衡,確保檢查覆蓋率更全面、關(guān)鍵點檢查不缺失、質(zhì)檢結(jié)果有保證。質(zhì)檢策略可以采取分批分步分級分點的方式:分批即將整個項目待數(shù)字化的檔案根據(jù)數(shù)量、工期、加工人數(shù)等情況分若干批次,完工一批質(zhì)檢一批;分步即數(shù)字化工作中每一個后續(xù)環(huán)節(jié)對前序環(huán)節(jié)質(zhì)檢,并設(shè)置全面質(zhì)檢和驗收抽檢環(huán)節(jié);分級即分為項目組和驗收組分別質(zhì)檢,分別設(shè)置全檢和相應(yīng)的抽檢比例分點即明確抽檢合格標(biāo)準(zhǔn);區(qū)分關(guān)鍵點(文件命名、目錄掛接等)和一般檢查點的合格率,針對問題頻發(fā)和新進人員提交的數(shù)據(jù)可以進行定向抽檢[5]。另外,建議加強加快數(shù)字化成果檢查軟件平臺的研發(fā)和轉(zhuǎn)化推廣,切實減輕數(shù)字化質(zhì)檢的工作量,提高工作效率[6]。
3.4 制定方案,落實工作流程和現(xiàn)場管控
檔案數(shù)字化工作應(yīng)當(dāng)早謀劃、早準(zhǔn)備,明確工作方式、安排工作場所、制定工作方案,嚴(yán)格落實和執(zhí)行。明確工作方式即明確是自行開展還是引進外包,采取業(yè)務(wù)外包形式的,則應(yīng)嚴(yán)格做好資質(zhì)審查、技術(shù)能力評估以及管理能力考察,確保外包單位技術(shù)扎實、管理可靠。工作場所則盡可能的提前,在申請經(jīng)費、制定工作方案的時候即可著手準(zhǔn)備符合規(guī)范要求的工作場地和設(shè)施設(shè)備,避免加工項目組即將進場才臨時匆忙安排的情況。工作方案和管理制度的制定上,既要明確加工流程及質(zhì)量也要規(guī)范工作現(xiàn)場的管理,因此需要制定工作流程及各環(huán)節(jié)質(zhì)量要求及包括人員、場地、設(shè)備、數(shù)據(jù)、實體管理等在內(nèi)的數(shù)字化管理制度,加強全流程安全管理并建立問題反饋機制,根據(jù)情況制定實用的工作記錄表單,有效落實工作流程和現(xiàn)場管控,做到可備查、可追溯[7]。
參考文獻
[1]中共中央辦公廳 國務(wù)院辦公廳印發(fā)《關(guān)于加強和改進新形勢下檔案工作的意見》.[EB/OL].[2018-11-1].http://www.zgdazxw.com.cn/news/2014-05/05/content_45061.htm
[2]全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要(檔發(fā)〔2016〕4號).[EB/OL].[2018-1-10].http://www.saac.gov.cn/news/ 2016-04/07/ content_136280.htm
[3]同上。
[4]同上。
[5]徐杰,楊永,張穎.歷史檔案數(shù)字化質(zhì)量控制探析[J].中國檔案,2018(5):72-73.
[6]王學(xué)平.淺議我國檔案數(shù)字化建設(shè)實踐與發(fā)展策略[J].檔案學(xué)通訊,2011(6):54-57.
[7]張柘蓉.科技成果檔案數(shù)字化建設(shè)的思考[J].數(shù)字與縮微影像,2011(1):24-25.