高珊
一、關(guān)于電子文件單軌制與單套制概念辨析
“軌”與“套”常被人混淆,現(xiàn)加以辨析?!败墶眰?cè)重整體性、系統(tǒng)性[1],指文件全生命周期的運(yùn)行狀態(tài)。若始終以一種形式運(yùn)行流轉(zhuǎn),則稱為單軌,若運(yùn)行過(guò)程某時(shí)出現(xiàn)另一種形式,則稱為多軌或混軌?!疤住眲t是指歸檔時(shí)及歸檔后的文件狀態(tài),以歸檔節(jié)點(diǎn)作為分水嶺,如果僅以一種形式歸檔及保存,則稱單套制。從時(shí)間段來(lái)說(shuō),軌的時(shí)間段長(zhǎng)于套的時(shí)間段。二者的區(qū)別在圖1中顯而易見(jiàn)。
電子文件單軌制是指電子文件自生成、流轉(zhuǎn)、歸檔、利用及銷毀等過(guò)程僅以電子文件的方式,不再生成其它載體形式的檔案管理方式。電子文件單套制是指歸檔、保存時(shí)僅以電子文件這一種方式。隨著大數(shù)據(jù)、區(qū)塊鏈、云計(jì)算等新興信息技術(shù)的發(fā)展和各類無(wú)紙化辦公系統(tǒng)的普及,大多文件產(chǎn)生時(shí)即為電子文件,且僅以電子的形式進(jìn)行流轉(zhuǎn)、歸檔、保存及利用,獨(dú)立電子文件管理成為必然趨勢(shì),與之對(duì)應(yīng)的檔案管理模式為電子文件單軌制。
二、電子文件單軌制管理模式重點(diǎn)問(wèn)題——檔案數(shù)據(jù)保全
2019年12月在主題為“從數(shù)字化到數(shù)據(jù)化:電子文件管理的縱深發(fā)展” 的第十屆中國(guó)電子文件管理論壇中,國(guó)家檔案局領(lǐng)導(dǎo)明確指出,認(rèn)可電子檔案法律效力的《〈檔案法〉修訂草案》已獲得國(guó)務(wù)院審議通過(guò),下一步將沿著“標(biāo)準(zhǔn)先行、試點(diǎn)推進(jìn)、穩(wěn)步推進(jìn)、風(fēng)險(xiǎn)可控”的路線推行電子文件單軌制管理。2021年1月,《中華人民共和國(guó)檔案法》正式施行,第三十七條規(guī)定:電子檔案應(yīng)當(dāng)來(lái)源可靠、程序規(guī)范、要素合規(guī)。電子檔案與傳統(tǒng)載體檔案具有同等效力,可以以電子形式作為憑證使用。電子文件的法律憑證地位正式得到保證。
電子文件單軌制管理模式有保持電子文件的原生性,節(jié)省人力物力等諸多優(yōu)勢(shì),但檔案管理過(guò)程中的風(fēng)險(xiǎn)也不容忽視。檔案數(shù)據(jù)因與載體分離,無(wú)法通過(guò)辨識(shí)載體或存儲(chǔ)介質(zhì)的狀態(tài)來(lái)分辨電子文件的真?zhèn)?,“冷備份”無(wú)法做到對(duì)數(shù)據(jù)狀態(tài)的實(shí)時(shí)監(jiān)測(cè);檔案數(shù)據(jù)存在于各類業(yè)務(wù)系統(tǒng)中,保存環(huán)境是動(dòng)態(tài)的技術(shù)環(huán)境,易受病毒攻擊,易被篡改,操作不當(dāng)易丟失;特定技術(shù)環(huán)境下生成的檔案數(shù)據(jù)的解析及封裝依賴于軟硬件環(huán)境的變化。以上等因素導(dǎo)致電子文件的“四性”難以維持。檔案數(shù)據(jù)的鎖定與固化、存證與保全,是急需解決的問(wèn)題。
國(guó)際數(shù)據(jù)組織聯(lián)合會(huì)認(rèn)為,數(shù)據(jù)保全是在需要的情況下長(zhǎng)期訪問(wèn)數(shù)據(jù)所需的一系列托管活動(dòng),廣義來(lái)說(shuō),就是在超出媒體故障或技術(shù)變化的限制范圍內(nèi),保持對(duì)數(shù)據(jù)的訪問(wèn)可行所需的所有操作[2]。電子文件單軌制管理模式下的數(shù)據(jù)保全,要求技術(shù)人員在檔案數(shù)據(jù)形成、流轉(zhuǎn)、歸檔及保存各個(gè)環(huán)節(jié)進(jìn)行全程管理,從檔案數(shù)據(jù)生命早期開(kāi)始進(jìn)行持續(xù)的實(shí)時(shí)監(jiān)控,采取相關(guān)技術(shù)手段固化檔案數(shù)據(jù),對(duì)檔案數(shù)據(jù)的原生環(huán)境的升級(jí)改變進(jìn)行持續(xù)跟蹤管理,適時(shí)進(jìn)行檔案數(shù)據(jù)遷移,以使數(shù)據(jù)長(zhǎng)期可讀、可用。
三、檔案數(shù)據(jù)保全相關(guān)技術(shù)
(一)全程監(jiān)控?cái)?shù)據(jù)生成及運(yùn)行環(huán)境
電子文件單軌制管理模式下,檔案部門的監(jiān)管職責(zé)應(yīng)延伸到電子文件創(chuàng)建前期,指導(dǎo)歸檔部門做好電子文件創(chuàng)建及流轉(zhuǎn)環(huán)境安全管理。
使用局域網(wǎng)進(jìn)行物理隔離[3],專機(jī)專用,重視漏洞排查、補(bǔ)丁安裝、防火墻設(shè)置等軟硬件維護(hù),監(jiān)控系統(tǒng)運(yùn)行日志。采用抑源法、屏蔽法和噪聲干擾法等技術(shù)手段,防范電磁泄漏造成的信息失密,為原生電子數(shù)據(jù)的生成流轉(zhuǎn)提供安全、穩(wěn)定的物理環(huán)境。壓實(shí)主體責(zé)任,嚴(yán)控服務(wù)器及業(yè)務(wù)系統(tǒng)的訪問(wèn)權(quán)限,對(duì)流轉(zhuǎn)過(guò)程進(jìn)行全面持續(xù)的監(jiān)控和跟蹤記錄[3],提高電子文件的安全系數(shù)。
為便于電子文件歸檔及后期利用,各業(yè)務(wù)系統(tǒng)應(yīng)與檔案系統(tǒng)統(tǒng)一接口規(guī)范、元數(shù)據(jù)及存儲(chǔ)格式標(biāo)準(zhǔn),做到無(wú)縫銜接。業(yè)務(wù)系統(tǒng)設(shè)計(jì)建設(shè)時(shí),檔案部門應(yīng)介入溝通并給予指導(dǎo),規(guī)避后期電子文件線上歸檔、利用的諸多問(wèn)題。
(二)檔案數(shù)據(jù)的固化與保全
運(yùn)用哈希函數(shù)進(jìn)行運(yùn)算加密,對(duì)檔案數(shù)據(jù)進(jìn)行內(nèi)容固化是保障電子文件“四性”的重要手段。哈希函數(shù)又稱散列函數(shù), 哈希運(yùn)算具有單向性、不可逆、輸出位數(shù)固定、高靈敏性、抗碰撞性等特點(diǎn)。以算法SH256為例,對(duì)任一文件進(jìn)行哈希運(yùn)算都會(huì)得到一個(gè)64位的十六進(jìn)制的字符串,又稱哈希值、數(shù)字摘要、數(shù)字指紋。對(duì)文件的任何微小改動(dòng)都會(huì)導(dǎo)致哈希值變化,且不同文件運(yùn)算后哈希值相同的概率幾乎為零,因而哈希算法廣泛應(yīng)用于各類檢驗(yàn)機(jī)制。
1.實(shí)時(shí)預(yù)警、修復(fù)的三角模型比對(duì)法
蘇大蘇航數(shù)據(jù)保全中心在數(shù)據(jù)保全系統(tǒng)采用三角模型比對(duì)法,可有效解決數(shù)據(jù)在保管過(guò)程中丟失無(wú)法恢復(fù)、被篡改無(wú)法溯源的問(wèn)題[4]。電子文件的微小變化都將造成哈希值變化,因而可靠存儲(chǔ)文件的哈希值就足以鎖定電子文件的內(nèi)容信息。
三角模型比對(duì)法原理:將歸檔的文件一式多套備份,不定期進(jìn)行抽查,對(duì)其中一套進(jìn)行哈希運(yùn)算得到哈希值與原哈希值進(jìn)行比對(duì),若一致則此套未被篡改,若不一致則繼續(xù)對(duì)下一套進(jìn)行哈希值的計(jì)算與對(duì)比。若這套一致,則用這套數(shù)據(jù)對(duì)上一套數(shù)據(jù)進(jìn)行修復(fù);若哈希值比對(duì)結(jié)果仍然不一致,則需取另一套進(jìn)行計(jì)算比對(duì)??梢?jiàn),原哈希值的存儲(chǔ)情況關(guān)系到檔案數(shù)據(jù)的安全與穩(wěn)定??蓪㈦娮游募脑V瞪蟼髦恋谌娇尚艜r(shí)間戳服務(wù)中心或區(qū)塊鏈,以確保檔案數(shù)據(jù)的原始性及完整性。三角模型比對(duì)法可實(shí)現(xiàn)對(duì)檔案數(shù)據(jù)的實(shí)時(shí)監(jiān)測(cè)、實(shí)時(shí)預(yù)警、實(shí)時(shí)修復(fù)、實(shí)時(shí)保全[4]。
2.可信時(shí)間戳技術(shù)用于檔案數(shù)據(jù)的保全及驗(yàn)證
戴艷清在《時(shí)間戳技術(shù)在檔案數(shù)據(jù)管理中的應(yīng)用》[5]中認(rèn)為,檔案數(shù)據(jù)應(yīng)包含檔案內(nèi)容信息的數(shù)據(jù)、檔案管理運(yùn)行過(guò)程中產(chǎn)生的實(shí)時(shí)數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)、元數(shù)據(jù)及其他數(shù)據(jù)的集合。時(shí)間戳技術(shù)與檔案管理的緊密結(jié)合,可提供對(duì)檔案數(shù)據(jù)真實(shí)性、完整性的保障。應(yīng)選擇可信的、權(quán)威的時(shí)間戳服務(wù)機(jī)構(gòu)DTS(Digital Time-stamp Service),時(shí)間來(lái)源也應(yīng)絕對(duì)精確。國(guó)家授時(shí)中心是我國(guó)唯一的法定時(shí)間源。時(shí)間戳技術(shù)運(yùn)用了哈希運(yùn)算和非對(duì)稱加密算法。存往第三方服務(wù)機(jī)構(gòu)的是檔案數(shù)據(jù)的哈希值不是檔案數(shù)據(jù)本身,由哈希值無(wú)法推算出原數(shù)據(jù)文件,因此即使哈希值在傳輸過(guò)程被截獲亦不會(huì)影響原檔案數(shù)據(jù)的安全性及完整性。
檔案數(shù)據(jù)保全過(guò)程如下:對(duì)檔案數(shù)據(jù)進(jìn)行哈希運(yùn)算提取哈希值(數(shù)字指紋、數(shù)字摘要),將哈希值上傳時(shí)間戳服務(wù)中心申請(qǐng)時(shí)間戳[6]。將下載的時(shí)間戳文件及時(shí)間戳認(rèn)證證書(shū)與檔案數(shù)據(jù)一起打包進(jìn)行固化、保全。驗(yàn)證過(guò)程如下:從時(shí)間戳文件提取哈希值,將檔案數(shù)據(jù)使用相同的哈希運(yùn)算計(jì)算出新的哈希值,將兩個(gè)哈希值對(duì)比,相同則表示檔案數(shù)據(jù)未被篡改(見(jiàn)圖2)。
3.區(qū)塊鏈技術(shù)用于檔案數(shù)據(jù)的保全與驗(yàn)證
2016年工信部發(fā)布的《中國(guó)區(qū)塊鏈技術(shù)和應(yīng)用發(fā)展白皮書(shū)》對(duì)區(qū)塊鏈作出定義:區(qū)塊鏈?zhǔn)菈K鏈?zhǔn)椒植际綌?shù)據(jù)存儲(chǔ)、點(diǎn)對(duì)點(diǎn)傳輸、共識(shí)機(jī)制、加密算法、利用智能合約來(lái)編程操作數(shù)據(jù)的計(jì)算機(jī)技術(shù)新型應(yīng)用模式,具有防篡改、可追溯、去中心化等特點(diǎn)[7]。由于采用分布式帳本多點(diǎn)記帳,任一節(jié)點(diǎn)對(duì)數(shù)據(jù)的修改必須征得大多數(shù)節(jié)點(diǎn)的同意,且對(duì)數(shù)據(jù)的修改全程留痕可追溯,因此應(yīng)用于檔案數(shù)據(jù)保全中可用來(lái)驗(yàn)證電子文件的真實(shí)性。檔案數(shù)據(jù)固化與驗(yàn)證過(guò)程與時(shí)間戳技術(shù)有些類似。將歸檔文件的原始哈希值上傳區(qū)塊鏈后,對(duì)電子文件再次哈希運(yùn)算算出哈希值,將區(qū)塊鏈中的哈希值與新算得的哈希值比對(duì),一致則表明文件真實(shí)未被篡改。國(guó)內(nèi)已有多家通過(guò)了工信部區(qū)塊鏈標(biāo)準(zhǔn)測(cè)試的服務(wù)公司,可提供成熟的區(qū)塊鏈應(yīng)用體系。在電子文件長(zhǎng)期保管中使用區(qū)塊鏈技術(shù),可守護(hù)國(guó)家的數(shù)字記憶。
4. CA認(rèn)證、數(shù)字簽名技術(shù)用于檔案數(shù)據(jù)的保全與驗(yàn)證
基于非對(duì)稱加密算法和數(shù)字摘要綜合應(yīng)用的數(shù)字簽名技術(shù)是保障檔案數(shù)據(jù)遷移過(guò)程中安全性及完整性的重要方法。為防數(shù)據(jù)傳輸中被竊聽(tīng),引入CA認(rèn)證(Certificate Authority),提供更為真實(shí)、可靠的驗(yàn)證。CA向通過(guò)審核的用戶簽發(fā)數(shù)字證書(shū)。數(shù)字證書(shū)中含有密鑰及證書(shū)所有者的識(shí)別信息、權(quán)威機(jī)構(gòu)的簽字等,通過(guò)識(shí)別傳送信息的真?zhèn)?,可?shí)現(xiàn)對(duì)證書(shū)持有者身份及接收信息真實(shí)性的驗(yàn)證。
非對(duì)稱加密體系的密鑰分為公鑰與私鑰。私鑰只有密鑰擁有者自己知道,公鑰則是公開(kāi)的。對(duì)于發(fā)方私鑰簽名加密的數(shù)據(jù),收方可用發(fā)方的公鑰解密;發(fā)方用收方公鑰簽名加密的數(shù)據(jù),收方可以用自己的私鑰解密。例如,收方收到發(fā)方帶數(shù)字簽名的消息M(包含數(shù)字簽名、電子原文、發(fā)方公鑰),為了驗(yàn)證消息M的真實(shí)性,首先需從CA獲取發(fā)方的數(shù)字證書(shū),并利用CA公鑰驗(yàn)證該證書(shū)的真?zhèn)?,證書(shū)為真則發(fā)方可信。而后,用發(fā)方的公鑰驗(yàn)證消息M的真實(shí)性。驗(yàn)證過(guò)程如下:收方用發(fā)方的公鑰解密數(shù)字簽名,析出數(shù)字摘要。同時(shí)對(duì)電子文件原文進(jìn)行哈希運(yùn)算得到新的數(shù)字摘要,若摘要相同則發(fā)方發(fā)送的電子文件都為真。驗(yàn)證過(guò)程見(jiàn)圖3。
(三)格式登記系統(tǒng)保障文件長(zhǎng)期可用
隨著軟硬件的更新及新型文件格式的涌現(xiàn),檔案數(shù)據(jù)存在著因讀寫環(huán)境的升級(jí)帶來(lái)的失讀風(fēng)險(xiǎn)。進(jìn)行歸檔文件格式管控,收集文件格式信息,追蹤文件格式變化[8],保證檔案數(shù)據(jù)長(zhǎng)期可讀,也是檔案數(shù)據(jù)保全的重要內(nèi)容。
2016年國(guó)家頒布了GB∕T 33190-2016 《電子文件存儲(chǔ)與交換格式版式文件》,規(guī)定電子文件可采用OFD(Open Fixed-layout Document)版式文件,打破了諸多部門電子公文格式不統(tǒng)一的狀態(tài),可更為方便地進(jìn)行電子文檔的存儲(chǔ)、讀取以及編輯,在版式文檔范疇內(nèi)反映了行業(yè)管理要求,提供了足夠的擴(kuò)展性,成為業(yè)內(nèi)常用技術(shù)規(guī)范。
電子文件格式登記系統(tǒng)是對(duì)電子文件格式數(shù)據(jù)進(jìn)行描述、識(shí)別、記錄、保存,并通過(guò)相關(guān)機(jī)制確定相應(yīng)的文件格式信息,并對(duì)電子文件進(jìn)行識(shí)別、轉(zhuǎn)換、展示和保存的系統(tǒng)。電子文件格式登記系統(tǒng)使用戶能夠在信息技術(shù)不斷更新的情況下,實(shí)現(xiàn)對(duì)電子文件的識(shí)別、解碼、遷移。國(guó)外文件格式登記系統(tǒng)有若干種,PRONOM是英國(guó)國(guó)家檔案館早期開(kāi)展的項(xiàng)目,目前版本是PRONOM6.2。電子文件進(jìn)入系統(tǒng)后,可進(jìn)行格式識(shí)別,確定打開(kāi)文件所需的軟件,并能進(jìn)行風(fēng)險(xiǎn)評(píng)估、元數(shù)據(jù)提取、遷移路徑規(guī)劃、驗(yàn)證等[8],從而保證了電子文件持續(xù)保存過(guò)程中長(zhǎng)期可用。
結(jié)語(yǔ)
除以上探討內(nèi)容外,信息隱藏技術(shù)、量子通信技術(shù)等新興技術(shù)也為檔案數(shù)據(jù)保全提供了更多可能,能夠有效降低電子文件單套制引發(fā)的社會(huì)記憶丟失風(fēng)險(xiǎn),使檔案數(shù)據(jù)內(nèi)容得以固化保全,檔案數(shù)據(jù)的原始性、真實(shí)性、憑證性得以有效保障和發(fā)揮,為電子文件單套制管理模式的推行起到了保駕護(hù)航的作用。
參考文獻(xiàn):
[1]黃琳. 單套制電子文件管理模式的辨析與思考[J]. 檔案與建設(shè),2020(11):5.
[2]周爍奇. 單套制環(huán)境下檔案數(shù)據(jù)保全研究[D].蘇州:蘇州大學(xué), 2020.
[3]王婧逸. 數(shù)據(jù)保全視角下電子文件單軌制管理模式研究[J].檔案與建設(shè),2020(2):4.
[4]陳恬,余亞榮,張照余,畢建新等. 基于數(shù)據(jù)保全思想的科學(xué)數(shù)據(jù)全流程管理研究[J].檔案與建設(shè),2020(12):4-9.
[5]戴艷清, 胡于恬. 時(shí)間戳技術(shù)在檔案數(shù)據(jù)管理中的應(yīng)用[J].北京檔案,2021(5):4.
[6]余亞榮, 張照余. 基于可信時(shí)間戳服務(wù)的電子檔案證據(jù)取證和驗(yàn)證方案設(shè)計(jì)[J]. 檔案管理, 2020(1):3.
[7]聶云霞,肖坤,何金梅. 基于區(qū)塊鏈技術(shù)的可信電子文件長(zhǎng)期保存策略探析[J].山西檔案,2019(4):76-82.
[8]周祺, 張照余. 國(guó)外電子文件格式登記與管控項(xiàng)目研究[J].浙江檔案,2020(5):28-32.
作者單位:中國(guó)海洋大學(xué)檔案館