摘 要:檔案數(shù)字化是數(shù)字檔案建設(shè)的一項最基礎(chǔ)性工作,是將各種形態(tài)檔案以數(shù)字化形式存儲、以網(wǎng)絡(luò)化形式互連,并利用計算機(jī)技術(shù)進(jìn)行管理,從而構(gòu)建起有序結(jié)構(gòu)的檔案信息庫,實現(xiàn)檔案信息資源共享。需要通過前端、中端、末端全過程質(zhì)量控制,切實提高檔案數(shù)字化質(zhì)量。此外,檔案數(shù)字化形成大量電子檔案數(shù)據(jù)信息,與傳統(tǒng)檔案管理面臨的安全形式不同,需要切實提高檔案數(shù)字化安全控制能力和水平。
關(guān)鍵詞:檔案數(shù)字化;數(shù)字化掃描;安全控制
根據(jù)《紙質(zhì)檔案數(shù)字化規(guī)范》的相關(guān)規(guī)定,數(shù)字化是指利用計算機(jī)技術(shù)將模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程。檔案數(shù)字化是將紙質(zhì)、圖片、錄音、錄像等不同載體檔案資源轉(zhuǎn)化為數(shù)字化檔案信息,它是隨著數(shù)字?jǐn)z影技術(shù)、數(shù)據(jù)庫技術(shù)、多媒體技術(shù)、掃描線性CCD技術(shù)、計算機(jī)技術(shù)、掃描技術(shù)、OCR技術(shù)和存儲技術(shù)的發(fā)展而產(chǎn)生的一種新型檔案信息形態(tài)。檔案數(shù)字化是數(shù)字檔案建設(shè)的一項最基礎(chǔ)性工作,是將各種形態(tài)檔案以數(shù)字化形式存儲、以網(wǎng)絡(luò)化形式互連,并利用計算機(jī)技術(shù)進(jìn)行管理,從而構(gòu)建起有序結(jié)構(gòu)的檔案信息庫,實現(xiàn)檔案信息資源共享[1 ]。
由于各類檔案形成的歷史沿革不同,以紙質(zhì)檔案為例,其形成的紙質(zhì)載體種類多樣,有宣紙、麻紙、再生紙等,若需要滿足檔案掃描后圖像符合查閱瀏覽要求,就需要根據(jù)不同紙質(zhì)載體質(zhì)地、類型、大小、字跡的掃描技術(shù)條件,通過前端、中端、末端全過程質(zhì)量控制,切實提高檔案數(shù)字化質(zhì)量。此外,檔案數(shù)字化形成大量電子檔案數(shù)據(jù)信息,與傳統(tǒng)檔案管理面臨的安全形式不同,需要切實提高檔案數(shù)字化安全控制能力和水平[2 ]。
1 檔案數(shù)字化掃描全過程質(zhì)量控制原則
從檔案數(shù)字化前端、中端、末端全過程質(zhì)量控制的內(nèi)容、要求和特點來看,應(yīng)堅持全過程質(zhì)量控制的原則,把這些原則和要求貫穿于檔案數(shù)字化掃描全過程。
1.1 質(zhì)量控制原則
所謂質(zhì)量控制是指為達(dá)到質(zhì)量要求所采取的作業(yè)技術(shù)和活動。就檔案數(shù)字化掃描而言,就是要通過質(zhì)量控制,使紙質(zhì)、照片等不同載體形態(tài)的檔案掃描達(dá)到數(shù)字化標(biāo)準(zhǔn)和要求。這就需要堅持全業(yè)務(wù)流程、全員、全方位質(zhì)量控制原則。認(rèn)真梳理檔案數(shù)字化掃描業(yè)務(wù)流程節(jié)點,確定節(jié)點質(zhì)量、標(biāo)準(zhǔn)和要求、業(yè)務(wù)人員與其關(guān)系、檔案流轉(zhuǎn)情況、工序內(nèi)容等,通過“工序環(huán)節(jié)”為基礎(chǔ)的質(zhì)檢和“業(yè)務(wù)人員”為基礎(chǔ)的管理兩套流程體系,全面、全員、全流程把控檔案數(shù)字化掃描質(zhì)量。
1.2 問題導(dǎo)向原則
所謂問題導(dǎo)向,就是把“問題”作為研究制定政策的落腳點,把解決最突出的矛盾作為著力點,系統(tǒng)分析、研判檔案數(shù)字化過程中各類風(fēng)險隱患,明確影響質(zhì)量控制的各類因素,從而在后期數(shù)字化實施過程中進(jìn)行有效規(guī)避。從檔案數(shù)字化掃描前端、中端、末端的分析來看,其風(fēng)險因素包括管理、規(guī)范、業(yè)務(wù)、技術(shù)、機(jī)構(gòu)及安全等六個方面,每一個方面中又涉及若干情況,需要具體問題具體分析。
1.3 價值、保護(hù)和利用優(yōu)先原則
檔案數(shù)字化掃描是一項規(guī)模浩大的系統(tǒng)性、基礎(chǔ)性工作,需要按照價值從優(yōu)、保護(hù)從優(yōu)和利用從優(yōu)的原則,循序漸進(jìn)、穩(wěn)步實施[3 ]。價值優(yōu)先,即,優(yōu)先將特殊館藏、字跡褪變、年代久遠(yuǎn)的珍貴檔案優(yōu)先進(jìn)行數(shù)字化掃描。如河?xùn)|區(qū)檔案館檔案數(shù)字化掃描優(yōu)先將珍貴歷史資料29223卷、照片檔案78冊2596張進(jìn)行整理以及數(shù)字化掃描。保護(hù)優(yōu)先,一方面要求對字跡模糊、破損等具有高滅失風(fēng)險的檔案優(yōu)先進(jìn)行掃描;另一方面則是要求始終把保護(hù)放在首位,貫穿于檔案數(shù)字化全過程。利用優(yōu)先,則是指根據(jù)館藏檔案借閱登記、查詢利用情況的分析,確定高頻利用檔案范圍,優(yōu)先對其進(jìn)行數(shù)字化掃描。如,河?xùn)|區(qū)檔案優(yōu)先將教育、就業(yè)、醫(yī)療、養(yǎng)老、社保、不動產(chǎn)等檔案優(yōu)先進(jìn)行數(shù)字化掃描。
1.4 適宜性原則
檔案掃描數(shù)字化應(yīng)用到各種先進(jìn)技術(shù),有些檔案因技術(shù)制約而暫時達(dá)不到預(yù)期轉(zhuǎn)化效果;或達(dá)到轉(zhuǎn)化效果而因容量大、傳遞速度慢、利用不便又不適宜檔案數(shù)字化。這時就需要暫緩對這一部分檔案數(shù)字化,待技術(shù)發(fā)展成熟再進(jìn)行數(shù)字化掃描,總之,檔案數(shù)字化掃描應(yīng)始終堅持適宜性原則,綜合考慮成本、技術(shù)等各方因素。
2 前端控制:檔案數(shù)字化掃描前質(zhì)量控制
檔案數(shù)字化掃描前端質(zhì)量控制,是指在紙質(zhì)檔案等檔案轉(zhuǎn)化為電子檔案信息之前進(jìn)行適時的前端控制、干預(yù),保證檔案齊全完整、數(shù)據(jù)信息長期可用和安全。在開展檔案數(shù)字化掃描之前,需要開展一項十分重要的基礎(chǔ)性工作,需要通過拆卷、修復(fù)、整理等對數(shù)字化檔案的對象進(jìn)行梳理和界定,為檔案數(shù)字化做好各項準(zhǔn)備工作。
2.1 成立工作機(jī)構(gòu)
檔案數(shù)字化掃描涉及諸多業(yè)務(wù)、技術(shù)和法律問題,尤其是技術(shù)應(yīng)用,需要擁有過硬業(yè)務(wù)能力的人才能承擔(dān)。人員素質(zhì)直接關(guān)乎著檔案數(shù)字化掃描工作質(zhì)量。因此,在開展檔案數(shù)字化掃描工作前,應(yīng)成立高質(zhì)量的檔案數(shù)字化工作領(lǐng)導(dǎo)小組,小組負(fù)責(zé)人由單位主要負(fù)責(zé)人擔(dān)任,領(lǐng)導(dǎo)小組成員由分管負(fù)責(zé)人、相關(guān)技術(shù)、法律及檔案管理人員組成,定期研判檔案數(shù)字化質(zhì)控過程中遇到的問題,及時予以解決[4 ]。如,某檔案館成立檔案數(shù)字化工作領(lǐng)導(dǎo)小組,領(lǐng)導(dǎo)小組下設(shè)設(shè)計組、數(shù)據(jù)組、編碼組、測試組、文檔組合服務(wù)組,各小組按項目流程協(xié)同工作,在領(lǐng)導(dǎo)小組領(lǐng)導(dǎo)下分工負(fù)責(zé)、各司其職。
備注:人員數(shù)量及工作分配可根據(jù)實際調(diào)配。
2.2 把準(zhǔn)工作需求
在正式開展檔案數(shù)字化掃描前,需要對館藏檔案資源數(shù)量、類型、利用等方面的現(xiàn)狀進(jìn)行深入調(diào)研,結(jié)合檔案館自身的經(jīng)濟(jì)能力、技術(shù)儲備等進(jìn)行準(zhǔn)備。既不能蠻干硬上,無論檔案是多是少“先數(shù)字化了再說”,也不能毫無目標(biāo)、漫無目的地為了數(shù)字化而數(shù)字化。需要在充分進(jìn)行現(xiàn)狀調(diào)研的基礎(chǔ)上,進(jìn)一步地分析研判或通過發(fā)放征求意見表等形式,開展檔案數(shù)字化需求調(diào)研,并制定檔案數(shù)字化進(jìn)程時間表、任務(wù)書等,掌握進(jìn)度,控制質(zhì)量[5 ]。
2.3 選定工作對象
按照價值優(yōu)先、保護(hù)優(yōu)先、利用優(yōu)先和適宜性原則,選定檔案數(shù)字化掃描對象,結(jié)合本次檔案數(shù)字化工作,進(jìn)一步明確館藏檔案中哪些檔案資料需要數(shù)字化,哪些檔案資料不需要數(shù)字化,及時剔除無價值、應(yīng)銷毀的檔案,將寶貴的檔案管理資源應(yīng)用到關(guān)鍵處。在選定檔案數(shù)字化掃描之后,根據(jù)數(shù)字化目標(biāo)要求,進(jìn)一步確定檔案數(shù)字化順序,保證檔案數(shù)字化掃描工作循序漸進(jìn),壓茬推進(jìn)。
2.4 制定工作方案
制訂詳細(xì)的檔案數(shù)字化實施方案,涵蓋檔案內(nèi)容及數(shù)量、檔案數(shù)字化環(huán)節(jié)及質(zhì)量要求、檔案驗收、檔案安全要求等檔案數(shù)字化需求分析;人員及設(shè)備配套等檔案數(shù)字化實施準(zhǔn)備;檔案借出、分卷、錄入、檢查、掃描、處理、掛接、刻盤、入庫等檔案數(shù)字化項目實施流程質(zhì)量要求;以及現(xiàn)場安全事項??傊?,檔案數(shù)字化方案應(yīng)是針對整體檔案數(shù)字化全過程中各環(huán)節(jié)、因素制訂詳細(xì)計劃、程序,用以指導(dǎo)檔案數(shù)字化工作有序開展。
2.5 嚴(yán)控工作流程
從調(diào)卷、核對、整理和目錄對接等四個方面全流程把控質(zhì)量。例如,調(diào)卷,需要以“年度”為單位,安排專人負(fù)責(zé)將館藏檔案原件調(diào)出至數(shù)字化工作現(xiàn)場,并逐一進(jìn)行清點、核對和登記。再如,核對,由工作人員認(rèn)真核對即將進(jìn)行數(shù)字化掃描的檔案材料,按照年度、機(jī)構(gòu)、目錄號逐件、逐卷、逐頁核對清點。還如,整理,在核對無誤后,將領(lǐng)取的檔案根據(jù)掃描需要進(jìn)行平整、分頁、糾正等整理工作。最后是目錄對接,即檔案材料與檔案管理系統(tǒng)中的目錄一一對應(yīng)。
3 中端控制:檔案數(shù)字化掃描中質(zhì)量控制
掃描工作是檔案數(shù)字化工作的核心和關(guān)鍵,其質(zhì)量控制直接影響到檔案數(shù)字化工作整體質(zhì)量,就紙質(zhì)檔案掃描而言,需要把控好檔案掃描、圖像預(yù)處理、圖像處理、圖像質(zhì)檢等工序環(huán)節(jié)中的每個流程質(zhì)量關(guān),嚴(yán)把流程質(zhì)量控制點。
3.1 檔案掃描
根據(jù)館藏檔案紙張幅面大小、破損程度確定相應(yīng)規(guī)格及型號的掃描儀,例如,對紙張狀況較差且保存年代久遠(yuǎn)、出現(xiàn)嚴(yán)重破損的紙質(zhì)檔案推薦使用平板快速掃描儀,在后期掃描過程中應(yīng)將紙質(zhì)檔案端正放置,避免前后紙張出現(xiàn)重疊的情況,可確保掃描的紙質(zhì)檔案內(nèi)容完整,而相對于紙張狀況保存較好、保存年代較近的紙質(zhì)檔案,建議使用高速掃描儀,增強(qiáng)紙質(zhì)檔案掃描的速度和效率。
3.2 圖像預(yù)處理
在紙質(zhì)檔案掃描后、分配給圖像處理人員圖像處理前,還需要對掃描后的圖像進(jìn)行相應(yīng)的預(yù)處理。先是要對紙質(zhì)檔案圖像進(jìn)行矯正傾斜度,去除紙質(zhì)檔案中的雜點、黑邊,提升紙質(zhì)檔案文字效果等自動批量化處理,要保證圖像經(jīng)預(yù)處理后的傾斜度<90%,處理后的圖像雜點、黑邊被大面積去除。
3.3 圖像處理
經(jīng)過預(yù)處理之后,還需要根據(jù)檔案保存標(biāo)準(zhǔn)和要求,進(jìn)一步做好圖像的相關(guān)再處理。逐頁檢查掃描后的圖像,即,要做到掃描圖像文件檢查全覆蓋,對仍然存在黑邊、傾斜、網(wǎng)紋的掃描圖片要進(jìn)一步做好去黑邊、糾偏、去網(wǎng)紋等技術(shù)性處理,要保證掃描圖像正文內(nèi)容、頁眉頁腳、印章、注釋等內(nèi)容與原紙質(zhì)檔案內(nèi)容一致。進(jìn)一步清除干凈因掃描過程中操作不到位而留下的黑線、陰影及指印等。對于分開處理的圖片檔案,經(jīng)相關(guān)處理后,還需要對其進(jìn)行拼接,確保紙質(zhì)檔案掃描圖像的完整性。
3.4 圖像質(zhì)檢
紙質(zhì)檔案經(jīng)掃描、預(yù)處理、處理后,檔案數(shù)字化質(zhì)檢人員應(yīng)按照規(guī)定,以不低于50%的比例抽檢處理后的紙質(zhì)檔案。納入抽檢范圍并經(jīng)過抽檢的圖像文件,要確保經(jīng)99%以上的質(zhì)量合格率。未達(dá)到這一合格率的,需要將不合格圖像進(jìn)行返工處理,交由檔案掃描人員和圖像處理人員重新進(jìn)行處理,經(jīng)質(zhì)檢合格的圖像文件則進(jìn)入下一步工序。
4 末端:檔案數(shù)字化掃描后質(zhì)量控制
檔案經(jīng)掃描、預(yù)處理、處理和質(zhì)檢合格后,還需要進(jìn)行一系列“后期”處理,這一環(huán)節(jié)的質(zhì)量控制也十分關(guān)鍵,直接影響到前期檔案掃描成果,以及后期檔案數(shù)字化利用及安全。
4.1 圖像掛接
經(jīng)質(zhì)檢合格的圖像文件按照卷內(nèi)目錄意義對應(yīng)的原則,掛接于專門的檔案管理應(yīng)用系統(tǒng),且,掛接完成的圖像文件應(yīng)保持與卷宗中的實物檔案順序一致,即,掃描的圖像文件與檔案條目數(shù)據(jù)之間保證對應(yīng)關(guān)系,掛接準(zhǔn)確率應(yīng)保證在100%。
4.2 掛接質(zhì)檢
為了保證圖像掛接準(zhǔn)確率達(dá)到100%,需要進(jìn)一步做好掛接質(zhì)檢工作,以免影響到檔案數(shù)字化結(jié)束后檔案利用效果。質(zhì)檢的內(nèi)容既包括圖像與條目數(shù)據(jù)質(zhì)檢是否一一對應(yīng),也要檢查掛接的每一張圖片是否達(dá)到可讀性、正確性、完整性,以及是否滿足相應(yīng)的技術(shù)處理的相關(guān)要求。
4.3 檔案整理
為滿足檔案掃描的現(xiàn)實需要,需要對檔案文件進(jìn)行相應(yīng)的拆卷、修補(bǔ)等工序,經(jīng)掃描完成后,需要按照歸檔標(biāo)準(zhǔn)對其進(jìn)行整理。例如:原文順序是否準(zhǔn)確,破損紙質(zhì)文件是否修復(fù)、裝裱,不合格的裝訂物是否進(jìn)行了更換,“三孔一線”裝訂后是否存在壓字、缺頁、順序顛倒、裝訂不齊、脫頁等情況,以及卷皮、卷內(nèi)目錄與原文不一致等情形。
4.4 數(shù)據(jù)備份
數(shù)據(jù)備份旨在進(jìn)一步加強(qiáng)檔案信息的安全性,通常選用移動硬盤備份或者一次性寫入光盤備份,且至少應(yīng)備份2套。
4.5 成果驗收
主要是將掃描后的實體檔案驗收和數(shù)字化掃描成果的成品總驗收。檔案數(shù)字化掃描完成相關(guān)的圖像掛接、質(zhì)檢、數(shù)據(jù)備份等工序后,需要將實體檔案歸還,要做到當(dāng)日領(lǐng)卷當(dāng)日歸還,主要驗收歸還的檔案卷數(shù)、件數(shù)是否與實際一致,是否存在應(yīng)歸還未歸還的情況。另一方面的驗收,就是按照檔案數(shù)字化的標(biāo)準(zhǔn)和要求,驗收目錄錄入準(zhǔn)確率、圖像掛接正確率、圖像處理及檔案材料掃描質(zhì)量、破損文件材料修復(fù),以及實體檔案和移交數(shù)據(jù)的完整性。經(jīng)驗收合格的,需要交驗雙方簽署“成品數(shù)據(jù)提交清單”,驗收不合格的,就要糾正。
5 檔案數(shù)字化掃描安全控制
近年來,隨著經(jīng)濟(jì)社會的快速發(fā)展,尤其是技術(shù)進(jìn)步、更新迭代加快,數(shù)字檔案館建設(shè)步伐加快,檔案數(shù)字化成為時代發(fā)展的趨勢和要求。與傳統(tǒng)檔案管理相比,檔案數(shù)字化過程中也面臨著許多非傳統(tǒng)的安全因素威脅,應(yīng)綜合施策,確保紙質(zhì)材料及電子數(shù)據(jù)安全,從人、物、技三個方面織密安全網(wǎng)。
5.1 人防:增強(qiáng)安全保密意識
建立檔案數(shù)字化安全保密領(lǐng)導(dǎo)小組,加強(qiáng)安全保密知識培訓(xùn),增強(qiáng)安全保密意識及能力。根據(jù)檔案數(shù)字化掃描前、掃描中、掃描后的工序特點,采取針對性、精細(xì)化的安全保密法則培訓(xùn)。例如,掃描前要重點做好環(huán)境、制度等方面安全保密培訓(xùn),嚴(yán)禁私自帶入移動存儲工具進(jìn)入工作場所;掃描中要做好檔案本身安全;掃描后,則要重點做好網(wǎng)絡(luò)利用等安全,委托第三方數(shù)字化掃描的,應(yīng)及時將數(shù)字化成品信息載體或復(fù)制件返還、銷毀。
5.2 物防:營造良好工作環(huán)境
為保證檔案數(shù)字化掃描工作的安全、高效進(jìn)行,需要建立與之相適應(yīng)的軟硬件環(huán)境,做好物防。如,做好服務(wù)器、網(wǎng)絡(luò)交換機(jī)、計算機(jī)選用,空調(diào)、恒溫機(jī)、除濕機(jī)也是安全設(shè)施的重要保障,購買高質(zhì)量一次性可讀寫光盤或移動硬盤。及時做好數(shù)據(jù)遷移和載體更新,避免因技術(shù)升級不及時或設(shè)備載體老化影響檔案數(shù)字化安全。
5.3 技防:注重技術(shù)保障應(yīng)用
運(yùn)用先進(jìn)技術(shù),建立完備的檔案數(shù)字化安全風(fēng)險監(jiān)控體系。例如,運(yùn)用好計算機(jī)病毒檢測、入侵檢測、防火墻、漏洞掃描、網(wǎng)絡(luò)監(jiān)控、安全審計、身份認(rèn)證等技術(shù)手段,安裝操作系統(tǒng),及時更新查殺病毒軟件,防止非法訪問。重要涉密檔案數(shù)字化信息應(yīng)與互聯(lián)網(wǎng)物理隔離,使用密鑰、單導(dǎo)盒等,阻止網(wǎng)絡(luò)攻擊。
參考文獻(xiàn):
[1]劉卉.紙質(zhì)檔案數(shù)字化質(zhì)量控制與管理研究[J].蘭臺內(nèi)外,2021(21):31—32.
[2]李建朋.檔案數(shù)字化面臨的風(fēng)險及其防控[J].四川檔案,2011(2):20—23.
[3]方彥.PDCA循環(huán)下館藏紙質(zhì)檔案數(shù)字化質(zhì)量控制[J].中國檔案,2020(12):44—45.
[4]黃偉麗.檔案數(shù)字化過程質(zhì)量控制研究[J].檔案時空,2013(6):26—28.
[5]韓雪晨.檔案數(shù)字化過程中質(zhì)量控制策略研究[J].質(zhì)量與市場,2021(6):44—45.
作者簡介:李如巖(1964— ),本科,臨沂市河?xùn)|區(qū)檔案局副研究館員,主要從事檔案管理、指導(dǎo)等工作。
3860500338288