陳臻鈺
(湘潭大學 公共管理學院,湖南 湘潭 411105)
2016年,國務院印發(fā)了《“十三五”國家信息化規(guī)劃》,正式將“區(qū)塊鏈技術”納入國家規(guī)劃[1]。2020年新修訂的《中華人民共和國檔案法》對數(shù)字檔案館和檔案信息資源管理、共享服務建設提出了新的要求[2]。這兩項條例和法案體現(xiàn)了區(qū)塊鏈技術應用于國家信息化建設中的更多可能,也體現(xiàn)了國家層面對于檔案館數(shù)字化轉型與電子檔案資源共享的深層次需求。自2017年起,國家檔案局的科技研究項目一直出現(xiàn)區(qū)塊鏈應用于電子檔案管理、利用等,體現(xiàn)了區(qū)塊鏈技術在電子檔案中應用的活力。
理論上,區(qū)塊鏈技術不可篡改、透明可溯源、安全性高的優(yōu)勢與在傳輸共享電子檔案前后需要保障其真實、完整、安全的需求有較高的適配度。實踐中,區(qū)塊鏈不斷被各級檔案局、館應用于電子文件歸檔、管理、跨館利用等,說明區(qū)塊鏈技術在管理使用電子檔案的各流程中能夠適配不同的應用場景,也說明了區(qū)塊鏈技術是當前檔案館數(shù)字化、智慧化轉型過程中保障電子檔案安全可信度相對較高、成熟度較高的技術。因此,在實現(xiàn)電子檔案跨部門共享過程中,運用區(qū)塊鏈技術解決其中可能存在問題有一定的理論和實踐的基礎。
學界對于區(qū)塊鏈的定義并未達成共識,因為其應用于不同學科和行業(yè)表現(xiàn)出的特性有所不同。從數(shù)據(jù)傳輸共享的角度出發(fā),可以說區(qū)塊鏈是一種比較安全的數(shù)據(jù)傳輸和存儲的方式。區(qū)塊鏈最重要的特性是去中心化和分布式,這代表不需要任何權威組織對區(qū)塊鏈中傳輸、存儲的數(shù)據(jù)進行集中管理、維護,其依靠的是每個上傳數(shù)據(jù)的用戶節(jié)點進行共同維護,同時每個用戶節(jié)點都有權對節(jié)點上每個數(shù)據(jù)進行查看和復制,保障了其在存儲空間足夠大、存儲量大的情況下能使數(shù)據(jù)維護成本保持較低,還能使用戶間方便快捷地進行數(shù)據(jù)共享。區(qū)塊鏈技術在保障每個用戶節(jié)點能方便快捷地訪問海量數(shù)據(jù)庫時,能使用哈希算法、Base58編碼和零知識證明等加密算法保護每個節(jié)點上的數(shù)據(jù),使數(shù)據(jù)被上傳后不可被更改,保障數(shù)據(jù)在不同用戶節(jié)點間傳輸?shù)陌踩?而在每個節(jié)點上的數(shù)據(jù)被傳輸?shù)搅硪粋€用戶節(jié)點后還需進行解密才能獲得原有形式的數(shù)據(jù),保證了傳輸后數(shù)據(jù)仍然可靠。
根據(jù)區(qū)塊鏈上用戶上傳和訪問數(shù)據(jù)的權限不同、去中心化的程度不同,區(qū)塊鏈被分為公有鏈、私有鏈和聯(lián)盟鏈,而不同類型的區(qū)塊鏈能夠適配不同的數(shù)據(jù)管理利用場景。
公有鏈:公有鏈中,公有代表該鏈對每一個想進入?yún)^(qū)塊鏈的數(shù)據(jù)所有者都是開放的,也意味著每個數(shù)據(jù)所有者都能上傳數(shù)據(jù)形成一個數(shù)據(jù)節(jié)點,成為區(qū)塊鏈中的用戶,其數(shù)據(jù)節(jié)點的數(shù)據(jù)能被鏈上的其他用戶隨時訪問,而該用戶也能隨時訪問節(jié)點上的其他數(shù)據(jù)。公有鏈的去中心化程度高,任意用戶都能上傳數(shù)據(jù)并訪問鏈上所有數(shù)據(jù)。也正因為每個用戶都能上傳數(shù)據(jù),公有鏈上的數(shù)據(jù)量相對較大,對于存儲、訪問數(shù)據(jù)的服務器硬件性能要求高,數(shù)據(jù)處理速度也相對較慢。
私有鏈:私有鏈僅對單個用戶開放上傳和訪問數(shù)據(jù)的權限,只有獲得授權的節(jié)點才能接入,進入該鏈后,用戶可以按照其規(guī)則參與數(shù)據(jù)的讀寫。私有鏈速度快、成本低、抗惡意攻擊能力強,但由于其完全不開放,對私有節(jié)點的控制高度集權化。
聯(lián)盟鏈:對特定的一組用戶開放上傳和訪問數(shù)據(jù)的權限,只有獲得授權的節(jié)點才能接入,進入該鏈后,用戶可以按照其規(guī)則參與數(shù)據(jù)的讀寫。通過控制用戶的數(shù)量,聯(lián)盟鏈在一定程度上兼?zhèn)淞斯墟湹娜ブ行幕潭雀吆退接墟渹鬏斝矢叩膬?yōu)點。
在國外,區(qū)塊鏈應用于電子檔案共享早已有實例。愛沙尼亞曾提出了名為e-Estonia的項目,即“數(shù)字愛沙尼亞”計劃[3],這一計劃通過記錄公民檔案,將一個個公民化身為一個個數(shù)字公民的身份,通過數(shù)字身份識別在區(qū)塊鏈系統(tǒng)實現(xiàn)跨部門乃至跨國家的電子檔案資源的共享。美國國家檔案部門發(fā)布的《區(qū)塊鏈白皮書》中提出用區(qū)塊鏈保障電子文檔在傳輸利用時的有效性與時效性,相比于數(shù)字簽名保障電子文檔有效性而無法保障時效性,區(qū)塊鏈上的數(shù)據(jù)難以篡改并能很好地長時間保障其真實性與時效性。英國的薩利大學同英國國家檔案館和開放數(shù)據(jù)研究所設計運用區(qū)塊鏈技術保存電子檔案,同時保障其內(nèi)容的完整性與可靠性,從而促進電子檔案能更好地被訪問、更好地被共享。
相較于國外已將區(qū)塊鏈技術應用于電子文件共享水平成熟,我國對于區(qū)塊鏈應用于電子文件共享研究理論上,賀智明等[4]提出了區(qū)塊鏈與可搜索加密結合的電子病歷共享方案,該方案將原始電子病歷保存在私有鏈上,最大限度地保障了電子病歷數(shù)據(jù)的安全性,降低了數(shù)據(jù)泄漏的風險,而將電子病歷的索引詞保存于聯(lián)盟鏈中,使數(shù)據(jù)訪問更加細化,也減少了通信的消耗。岳征祥[5]提出的區(qū)塊鏈文件系統(tǒng)實現(xiàn)了電子病歷共享,以區(qū)塊鏈技術中心的聯(lián)盟鏈為核心,解決了醫(yī)療數(shù)據(jù)在共享過程中的信任問題。電子文件共享研究實踐中,我國將此類技術主要應用于民生檔案的異地共享利用。
與國外已經(jīng)較為成熟落地的基于區(qū)塊鏈的電子檔案共享案例相比,我國關于區(qū)塊鏈在電子檔案中的應用主要側重于管理和安全層面,應多將意識提升到共享利用層面,提升我國電子檔案跨部門共享的水平,以提高電子檔案利用效能。在進行電子檔案跨部門共享研究與具體落實時,可以參考國外跨部門、跨國家共享的經(jīng)驗,結合我國電子檔案體量與具體分布情況,充分了解區(qū)塊鏈不同類型鏈的特點,推進我國電子檔案跨部門共享具體機制和模式的建立。
數(shù)據(jù)標準不統(tǒng)一、網(wǎng)絡環(huán)境不相同和基礎平臺有差異等技術原因已成為阻礙數(shù)據(jù)資源整合共享的重要因素[6]。而電子檔案資源要實現(xiàn)便捷的跨部門共享,首先就需要專有的共享平臺。各部門都擁有自身的電子檔案管理系統(tǒng),使得在互聯(lián)網(wǎng)背景下政府和社會不斷增長的數(shù)據(jù)共享需要的情況下,業(yè)務辦理效率大打折扣,響應共享需求的時間變長。
在電子檔案的共享過程中,會存在各共享參與部門在進行共享電子檔案上傳時有所保留,甚至可能出現(xiàn)不愿參與共享的情況,而導致不愿共享的原因是擔心部門利益受到影響。大數(shù)據(jù)時代,人們對于數(shù)字化資產(chǎn)的保護意識逐漸提高,電子檔案是資產(chǎn)的一種,關乎利益,而經(jīng)濟利益又是部門對自身各方面進行升級改造的基礎,是關乎部門發(fā)展主導地位的重要影響因素。電子檔案的共享過程中可能因為數(shù)據(jù)安全等原因?qū)е陆?jīng)濟利益的受損,也許是檔案部門和其他政府機構不愿主動推動電子檔案共享最直接的原因。而問題的本質(zhì)其實是政府機構的風險規(guī)避文化[7]?;ヂ?lián)網(wǎng)環(huán)境下電子檔案在共享過程中的確存在著許多安全隱患,在電子檔案采集、存儲、處理、傳輸、交換、銷毀的全生命周期6個階段都存在不同程度的安全風險。若是在此過程中造成了數(shù)據(jù)的泄露,不僅可能給部門帶來安全威脅,還可能會因此被問責。各參與共享的部門,特別是檔案體量較大的綜合檔案館,為了規(guī)避這種數(shù)據(jù)安全威脅,思想上不敢于共享,對于共享的積極主動性不高,行為上表現(xiàn)為提供共享的電子檔案數(shù)據(jù)不全,從而導致電子檔案共享內(nèi)容和共享范圍上的受限。
目前,檔案的電子化大多數(shù)停留在對檔案目錄數(shù)據(jù)化的階段,缺少對檔案內(nèi)容的數(shù)字化與數(shù)據(jù)化,不利于對電子檔案的內(nèi)容進行數(shù)據(jù)層面的提取和集成,也不利于對檔案內(nèi)容的深入高效挖掘而提升檔案價值。我國按部門對檔案進行管理的原則一定程度上限制了學者對于某種類型檔案搜集、整理和研究的完整性,如果形成數(shù)據(jù)化檔案庫,通過關鍵詞檢索能很好地解決這一問題。檔案數(shù)據(jù)化程度不高在很大程度上是由檔案原始記錄性的特性所決定的。紙質(zhì)檔案和紙質(zhì)檔案經(jīng)過掃描形成的圖片形式的數(shù)字化檔案與數(shù)據(jù)化檔案相比,篡改難度較大,檔案被數(shù)據(jù)化上傳到數(shù)據(jù)庫中是以數(shù)據(jù)的形式存在的,非常容易被篡改,很容易使檔案的原始性受到破壞。因此,如何保障電子檔案不被篡改,保護電子檔案的安全是從技術層面解決檔案數(shù)據(jù)化程度不高這一問題的關鍵。
電子檔案資源共享平臺的建設,首先需要建立統(tǒng)一的數(shù)據(jù)標準,因為數(shù)據(jù)標準是數(shù)據(jù)治理的基礎,能很好地保障數(shù)據(jù)質(zhì)量。電子檔案跨部門共享能與區(qū)塊鏈技術中聯(lián)盟鏈的應用場景相適配,而進入聯(lián)盟鏈的前提除了是被授權用戶,還需按照各節(jié)點用戶共同制定的規(guī)則寫入數(shù)據(jù),這為制定電子檔案共享平臺的數(shù)據(jù)標準提供了契機。同時,由于有檔案館這類數(shù)字化、數(shù)據(jù)化的主要實踐部門和其他政府機構這類對檔案查詢及利用需求高的部門作為節(jié)點用戶共同制定數(shù)據(jù)標準,能夠很好解決單機構制定數(shù)據(jù)標準帶來的元數(shù)據(jù)屬性制定得不夠?qū)嵱玫膯栴},強化電子檔案的流轉能力,讓其能在各政府職能部門被充分地共享利用,解決政府職能部門間存在的“信息孤島”問題。
一般說來, 區(qū)塊鏈技術適用于“新型數(shù)據(jù)庫、多業(yè)務主體、彼此不互信、業(yè)務強相關”的場景[8]。聯(lián)盟鏈作為區(qū)塊鏈技術的一種類型,兼?zhèn)淞斯墟溤试S不止一個用戶在區(qū)塊鏈上進行數(shù)據(jù)的讀取寫入以及私有鏈只允許授權用戶在區(qū)塊鏈上進行數(shù)據(jù)讀取寫入的特性。電子檔案作為信息資源的一種,其共享需要相關利益方一同參與,才能保證電子檔案共享的安全。在聯(lián)盟鏈應用到電子檔案跨部門共享時,表明共享數(shù)據(jù)的開放只針對授權用戶,而授權用戶指的就是作為自身數(shù)據(jù)節(jié)點和電子檔案利益代表方的政府部門。一方面,政府是社會中可信度高的機構組織,另一方面,在電子檔案跨部門共享的過程中只有政府部門能寫入、讀取共享區(qū)塊鏈上的數(shù)據(jù),這兩點能有效防止電子檔案在傳輸過程中泄漏,同時,因為共同的數(shù)據(jù)利益,政府部門會增強自身數(shù)據(jù)節(jié)點安全意識,防止電子檔案從自身所在數(shù)據(jù)節(jié)點泄漏,以此建立起聯(lián)盟鏈內(nèi)部參與電子檔案共享的各政府部門間的相互信任。出于數(shù)據(jù)利益的交換與相互間信任度的提升,各用戶節(jié)點能逐步全面上傳和共享所擁有的電子檔案,一同共享海量的檔案資源。
區(qū)塊鏈中運用復雜的加密算法,如哈希算法、Base58編碼和零知識證明等,加密算法能夠?qū)?shù)據(jù)轉換成一串隨機的數(shù)字,用密鑰解密后才能將其還原成原有的數(shù)據(jù)形式。此類加密算法能保障區(qū)塊鏈上數(shù)據(jù)的不可篡改性,也保障了數(shù)據(jù)在不同用戶節(jié)點之間的安全傳輸。電子檔案是檔案的另一種形式,檔案經(jīng)過數(shù)據(jù)化變成電子檔案后在存貯、傳輸過程中仍然需要保有其原始性的特征,而區(qū)塊鏈中使用的加密算法能很好地保障電子檔案不可被篡改,從而保障其原始性,讓更多政府機構進行檔案的數(shù)據(jù)化形成更多的電子檔案在不同層級政府部門間進行流通共享,不僅從技術層面解決了檔案數(shù)據(jù)化程度不高的問題,同時強化了電子檔案在各部門跨層級流通能力。
其一,區(qū)塊鏈信用性好、安全性高、透明性強、可拓展性好的優(yōu)點非常利于區(qū)塊鏈上的機構、部門進行電子檔案的跨層級共享,但其優(yōu)點是在電子檔案上傳到區(qū)塊鏈上后才能保障的,也就是說其強加密性可以保證已經(jīng)存于一個個區(qū)塊上的電子檔案的不可篡改性,但在其保存于區(qū)塊前的電子檔案真實性并不能得到保障,在其存儲之前,電子檔案是否可信、是否完整,這些需要各部門在檔案管理階段就應做好并保障。其二,目前區(qū)塊鏈作為賬本數(shù)據(jù)庫, 存儲的數(shù)據(jù)類型多為文本, 單個文件的數(shù)據(jù)量都不是很大[9],但在數(shù)據(jù)化時代,區(qū)塊鏈若是作為信息資源共享中心,而各節(jié)點發(fā)展程度又不一樣,一些區(qū)塊即共享節(jié)點的承載程度將受到很大挑戰(zhàn)。其三,當今默認區(qū)塊鏈能保障節(jié)點上的信息不可更改,但也只能說運用區(qū)塊鏈進行電子檔案資源共享的模式是具有較高安全性的,并不存在絕對的安全。隨著計算機計算能力的高速發(fā)展,區(qū)塊鏈運用的加密算法被快速解出的情況也不是沒有可能出現(xiàn)的。其四,任何一種技術如若離開了標準化, 便很難推廣和發(fā)展下去[10]。雖然中國區(qū)塊鏈技術和產(chǎn)業(yè)發(fā)展論壇先后發(fā)布了《區(qū)塊鏈參考架構》和《區(qū)塊鏈數(shù)據(jù)格式規(guī)范》兩項團體標準,但區(qū)塊鏈的標準化仍然處于成長階段,不夠成熟,區(qū)塊鏈的發(fā)展過程會對電子檔案的共享模式造成一定的影響,而這種影響的好壞也是未知的。
隨著大數(shù)據(jù)時代的到來,數(shù)字化、數(shù)據(jù)化深刻地影響著每一個行業(yè),檔案部門、各政府職能部門的檔案室也受到了很大的影響,電子檔案出現(xiàn)不僅方便了檔案資源的存儲,更方便了對其進行共享利用與價值挖掘。但如何運用現(xiàn)代化技術保障電子檔案在各跨層級共享過程中的完整性、可靠性是當今一個重要的課題。區(qū)塊鏈技術的出現(xiàn)帶來了信用性好、安全性高、透明性強、可拓展性好的數(shù)據(jù)保護技術,為電子檔案這一對完整性、真實性有極致要求的信息資源在進行跨部門共享利用上提供技術支持,促進了我國數(shù)據(jù)治理能力與治理水平的提升。但是,區(qū)塊鏈是依靠復雜算法保障區(qū)塊上的信息資源不被破壞的,因此,在計算機更新迭代快速的今天,區(qū)塊鏈上的信息資源仍然有被篡改甚至刪除的風險,選擇提升區(qū)塊鏈算法的復雜性還是顛覆原有基于區(qū)塊鏈的電子檔案跨部門共享方式是今后電子檔案跨部門共享發(fā)展過程中需要深思熟慮的問題。