文/天津武警后勤學(xué)院 郭媛 張彥如 羅南
《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》明確指出,要“促進(jìn)檔案信息資源館際、館室共建互通,推進(jìn)檔案信息資源跨層級(jí)跨部門共享利用”,但在傳統(tǒng)互聯(lián)網(wǎng)模式下,數(shù)字檔案資源的利用多局限于內(nèi)網(wǎng)查詢管理,服務(wù)對(duì)象、服務(wù)方式和服務(wù)范圍受到限制,未能發(fā)揮數(shù)字檔案資源建設(shè)的優(yōu)勢(shì)。區(qū)塊鏈?zhǔn)且环N分布式的共享信息存儲(chǔ)技術(shù),已被廣泛應(yīng)用到金融、餐飲等多個(gè)領(lǐng)域,并取得一定的成功。在檔案相關(guān)領(lǐng)域,也有學(xué)者嘗試從理論層面探索如何讓區(qū)塊鏈在檔案方面發(fā)揮作用。在中國(guó)知網(wǎng)平臺(tái)上,檢索到發(fā)表時(shí)間最早的一篇文章是黃永剛關(guān)于電子健康檔案安全建設(shè)的文章。在此之后,研究區(qū)塊鏈應(yīng)用在電子檔案方面的文章增多,涉及數(shù)據(jù)管理、體系建設(shè)、信息安全、數(shù)據(jù)存儲(chǔ)等內(nèi)容,如張珊探討區(qū)塊鏈技術(shù)在電子檔案管理中的適用性;白茹花探討基于區(qū)塊技術(shù)的電子檔案信任體系建設(shè);聶云霞等人關(guān)于區(qū)塊鏈的區(qū)域檔案資源協(xié)同治理的模式和路徑的研究等文章。研究?jī)?nèi)容的多元化為檔案數(shù)據(jù)的利用、流動(dòng)提供探究思路,為實(shí)現(xiàn)數(shù)據(jù)互聯(lián)互通提供研究方向。本文在前人研究的基礎(chǔ)上,嘗試探討區(qū)塊鏈在檔案數(shù)據(jù)共享方面的應(yīng)用。
(一)區(qū)塊鏈的概念。區(qū)塊鏈概念第一次被引入是在基于點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò)的比特幣電子現(xiàn)金系統(tǒng)中,它是一個(gè)分布式存儲(chǔ)賬本,網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)都具備記賬能力,可實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)的去中心化功能,確保數(shù)據(jù)傳輸和訪問(wèn)的安全性和透明度。區(qū)塊鏈將數(shù)字簽名技術(shù)、智能合約、共識(shí)機(jī)制的技術(shù)、P2P網(wǎng)絡(luò)、默克爾樹(shù)結(jié)構(gòu)、哈希算法等等技術(shù)組合,在對(duì)等網(wǎng)絡(luò)環(huán)境下,通過(guò)透明和可信規(guī)則,構(gòu)建具有去中心化、不可偽造、不可篡改和可追溯的塊鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)。
(二)區(qū)塊鏈的特征。1.去中心化。區(qū)塊鏈的每個(gè)節(jié)點(diǎn)既能平等、自由地交換數(shù)據(jù),也能相互連接、制約,使區(qū)塊鏈具備了容錯(cuò)性、抗攻擊力、防合謀的優(yōu)點(diǎn)。2.不可篡改性。區(qū)塊鏈通過(guò)共識(shí)機(jī)制將信息添加到區(qū)塊后,所有節(jié)點(diǎn)會(huì)共同記錄,并通過(guò)加密保證前后區(qū)塊的關(guān)聯(lián)性,很難實(shí)現(xiàn)對(duì)記錄的修改。3.自治性。區(qū)塊鏈通過(guò)共識(shí)機(jī)制和智能合約,能使節(jié)點(diǎn)自由安全地交換數(shù)據(jù),擺脫以往系統(tǒng)對(duì)人的依賴性。
(三)區(qū)塊鏈的類型。1.公有鏈。公有鏈?zhǔn)峭耆ブ行幕?,鏈上的?shù)據(jù)完全公開(kāi)透明。它允許全部節(jié)點(diǎn)準(zhǔn)入,而且全部節(jié)點(diǎn)都是共識(shí)參與方,適用于數(shù)據(jù)能對(duì)所有人開(kāi)放的情況。2.聯(lián)盟鏈。聯(lián)盟鏈?zhǔn)遣糠秩ブ行幕?,系統(tǒng)有幾個(gè)權(quán)威機(jī)構(gòu)共同分布式記賬,數(shù)據(jù)部分透明,公眾可以進(jìn)行查閱和交易,讀取權(quán)限由具有準(zhǔn)入機(jī)制的組織或機(jī)構(gòu)決定。聯(lián)盟鏈適用于允許有限節(jié)點(diǎn)準(zhǔn)入,共識(shí)參與方是預(yù)選節(jié)點(diǎn)的情況。3.私有鏈。私有鏈的特點(diǎn)是系統(tǒng)內(nèi)的每個(gè)節(jié)點(diǎn)的權(quán)限都需要組織來(lái)分配,鏈上的數(shù)據(jù)不透明,由于讀取數(shù)據(jù)設(shè)有權(quán)限,任何節(jié)點(diǎn)參與者都很難獲得鏈上面的數(shù)據(jù)。它適用于允許有限節(jié)點(diǎn)準(zhǔn)入,但共識(shí)參與方為中心節(jié)點(diǎn)的情況。
(一)保證檔案數(shù)據(jù)的原始真實(shí)性。區(qū)塊鏈上數(shù)據(jù)的驗(yàn)證、記賬、存儲(chǔ)、維護(hù)和傳輸?shù)冗^(guò)程均基于分布式系統(tǒng)結(jié)構(gòu),借助共識(shí)算法建立節(jié)點(diǎn)間的信任關(guān)系。當(dāng)檔案數(shù)據(jù)經(jīng)過(guò)驗(yàn)證添加到區(qū)塊鏈后,將在不同節(jié)點(diǎn)同步進(jìn)行記錄,變成“全網(wǎng)共享”的模式,保證了數(shù)據(jù)的不可篡改性,也避免了傳統(tǒng)復(fù)式記賬的復(fù)雜性。此外,鏈上的任何一塊區(qū)塊都會(huì)記載之前產(chǎn)生的所有信息,并永久保存,即使管理者和用戶都想終止也無(wú)法修改或刪除,有效保證上鏈檔案數(shù)據(jù)的原始記錄性。
(二)區(qū)跨鏈類型與檔案共享層級(jí)相對(duì)應(yīng)。依據(jù)檔案數(shù)據(jù)共享范圍,可將檔案數(shù)據(jù)劃分為完全共享、局部共享和不可共享三種類型。區(qū)塊鏈也有三種類型,因此,可以根據(jù)檔案數(shù)據(jù)共享范圍對(duì)應(yīng)選擇區(qū)塊鏈類型。完全對(duì)公眾開(kāi)放的檔案數(shù)據(jù)適合使用“公有鏈”,比如解密的紅色檔案資源;只在局部小范圍內(nèi)進(jìn)行共享的檔案數(shù)據(jù)適合使用中心化程度最高的“私有鏈”;若是在一定范圍內(nèi)共享的檔案數(shù)據(jù),則可以考慮使用聯(lián)盟鏈,聯(lián)盟鏈公開(kāi)程度介于公有鏈和私有鏈兩者之間,既有效避免了公有鏈擴(kuò)展性太強(qiáng),又避免了私有鏈擴(kuò)展性太弱的不足。需要注意的是,在檔案數(shù)據(jù)共享的過(guò)程中,去中心化并不意味著所有參與主體具有相同的權(quán)限,在數(shù)據(jù)共享之初,還需要對(duì)參與的各節(jié)點(diǎn)、各主體進(jìn)行權(quán)責(zé)劃分。
(三)智能合約提高檔案數(shù)據(jù)共享效能。智能合約是區(qū)塊鏈的重要組成部分,是一種信息化方式的計(jì)算機(jī)協(xié)議,主要用來(lái)傳播、驗(yàn)證或執(zhí)行合同,Nick Szabo將其描述為“一個(gè)智能合約,就是一套以數(shù)字形式定義的承諾”。在用戶使用檔案數(shù)據(jù)時(shí),智能合約會(huì)直接研判用戶的申請(qǐng)與自身要求是否相互符合,只有當(dāng)申請(qǐng)符合合約要求時(shí),也就是當(dāng)合約事件出現(xiàn)時(shí),區(qū)塊鏈才會(huì)自動(dòng)啟動(dòng)執(zhí)行代碼型合約,為用戶提取和提供所需的檔案數(shù)據(jù)。這種服務(wù)方式,改變了以往局域網(wǎng)的單向檔案信息傳遞模式,即前期需要在傳統(tǒng)信息平臺(tái)進(jìn)行著錄和標(biāo)引,制作出規(guī)范化檢索標(biāo)識(shí)并存儲(chǔ)的方式,這就要求當(dāng)檔案工作者或檔案信息用戶使用平臺(tái)時(shí),需要運(yùn)用能被系統(tǒng)理解的檢索標(biāo)識(shí)或檢索表達(dá)式表達(dá)需求,以便于系統(tǒng)進(jìn)行相符性對(duì)比。最終,平臺(tái)只能將符合標(biāo)識(shí)或檢索表達(dá)式的條目信息找出來(lái)提供給需求者。在這種服務(wù)模式下,易存在檢索的檔案內(nèi)容不完整、數(shù)據(jù)不齊全、分類邏輯不科學(xué)、著錄不規(guī)范、格式不規(guī)范等現(xiàn)象,增加了用戶獲取檔案信息的難度,導(dǎo)致平臺(tái)檔案信息利用效率低。
(四)多種技術(shù)保障檔案數(shù)據(jù)安全。區(qū)塊鏈?zhǔn)且环N分布式網(wǎng)絡(luò),鏈上的所有數(shù)據(jù)會(huì)被分成小塊分布在整個(gè)網(wǎng)絡(luò)中,并通過(guò)哈希計(jì)算、數(shù)字簽名、非對(duì)稱加密算法、數(shù)據(jù)加密技術(shù)等多種技術(shù)集合,對(duì)上鏈的數(shù)據(jù)也僅具備“增查”兩種功能,從而能有效地應(yīng)對(duì)檔案數(shù)據(jù)泄露和被篡改的風(fēng)險(xiǎn)。比如,時(shí)間戳將相關(guān)的檔案數(shù)據(jù)記入同一條時(shí)間鏈,并精確地形成唯一的時(shí)間印跡,從而保證檔案數(shù)據(jù)的可查驗(yàn)、可追溯;非對(duì)稱密碼算法以一一對(duì)應(yīng)的密鑰的方式,可對(duì)不同保密層級(jí)的檔案數(shù)據(jù)設(shè)置不同的權(quán)限;智能合約對(duì)檔案信息用戶進(jìn)行身份識(shí)別并簽訂協(xié)議后,通過(guò)公鑰進(jìn)行加密,檔案信息用戶接收到加密的檔案信息資源后再通過(guò)自身私鑰對(duì)其解密,從而達(dá)到利用檔案信息資源并保障其傳輸安全性的目的。
(一)樹(shù)立區(qū)塊鏈應(yīng)用和檔案共享意識(shí)。理論指導(dǎo)行動(dòng),檔案部門要實(shí)現(xiàn)區(qū)塊鏈在檔案數(shù)據(jù)共享方面的應(yīng)用,既要加強(qiáng)理論探討和實(shí)踐探索,也要提高思想認(rèn)識(shí),通過(guò)加強(qiáng)意識(shí)引領(lǐng),達(dá)成區(qū)跨鏈共享數(shù)據(jù)共識(shí)。一直以來(lái),不少檔案部門對(duì)數(shù)據(jù)共享的響應(yīng)不積極,存在不愿共享、不敢共享、不會(huì)共享的情況。這主要受兩大方面的因素影響:一是檔案管理者的知識(shí)構(gòu)成多側(cè)重于本學(xué)科內(nèi)容,缺少對(duì)先進(jìn)信息技術(shù)知識(shí)的儲(chǔ)備,在應(yīng)用新技術(shù)時(shí)存在數(shù)據(jù)知識(shí)掌握不全面、數(shù)據(jù)工具運(yùn)用不熟練以及畏難心理;二是由于區(qū)塊鏈技術(shù)在檔案領(lǐng)域還未得以充分實(shí)踐,檔案人員在技術(shù)的使用性能和安全可靠性上存在擔(dān)憂,一旦出現(xiàn)問(wèn)題會(huì)被追責(zé)問(wèn)責(zé),這也削弱了應(yīng)用區(qū)塊鏈技術(shù)的意愿。因此,可先在一定區(qū)域范圍建設(shè)試驗(yàn)單位,政策方面給予傾斜,加大資金、物力、人力的投入,并將建設(shè)經(jīng)驗(yàn)和取得的結(jié)果通過(guò)短視頻、網(wǎng)絡(luò)、公眾號(hào)、專家講座等形式進(jìn)行宣傳,以此來(lái)提高行業(yè)內(nèi)的共享意愿。
(二)編制安全可靠的智能合約。檔案數(shù)據(jù)共享過(guò)程中需要依靠區(qū)塊鏈中的核心技術(shù)之一智能合約來(lái)實(shí)現(xiàn),它是區(qū)塊鏈中運(yùn)行在分布式賬本上的各種規(guī)則的計(jì)算機(jī)程序,這些規(guī)則包括設(shè)置規(guī)則、狀態(tài)、響應(yīng)、交換記錄、價(jià)值信息等,通常用于實(shí)現(xiàn)物聯(lián)網(wǎng)設(shè)備的訪問(wèn)控制。
智能合約影響著數(shù)據(jù)的使用率和安全性,在進(jìn)行檔案數(shù)據(jù)訪問(wèn)控制時(shí),要保證數(shù)據(jù)所有者對(duì)數(shù)據(jù)訪問(wèn)策略有安全控制權(quán),能進(jìn)行靈活且可擴(kuò)展的訪問(wèn)控制管理,并能對(duì)是否是惡意訪問(wèn)作出判斷,對(duì)惡意訪問(wèn)作出懲罰,保護(hù)好訪問(wèn)用戶信息的安全性。編制時(shí)可結(jié)合自身實(shí)際需要,參考不同學(xué)者提出的模式,例如姜慶臣等人提出了采用PBFT算法構(gòu)建一種面向智能合約數(shù)據(jù)庫(kù)共享(To-Contract Database Share,To C-DBS)模式,以保證數(shù)據(jù)共享的安全性和可信性。由于檔案數(shù)據(jù)共享范圍不同,共享權(quán)限存在差異,智能合約則需要解決訪問(wèn)的信任問(wèn)題。XIA等人提出的Me DShare系統(tǒng)可以解決無(wú)信任環(huán)境下醫(yī)療大數(shù)據(jù)的共享問(wèn)題,通過(guò)智能合約技術(shù)完成數(shù)據(jù)的審計(jì)和追蹤具有一定的可借鑒性。此外,由于用戶訪問(wèn)時(shí),智能合約需要提升系統(tǒng)在響應(yīng)時(shí)間、數(shù)據(jù)吞吐量、時(shí)間延遲等方面的性能。因此,檔案部門在訂立智能合約時(shí),需要通盤考慮,可按照概念模型、邏輯模型、合約程序設(shè)計(jì)、合約編譯和部署等過(guò)程,制定好合約內(nèi)容。
(三)實(shí)現(xiàn)跨鏈檔案數(shù)據(jù)共享。從目前情況看,檔案機(jī)構(gòu)對(duì)區(qū)塊鏈的信任度不高,局限于聯(lián)盟內(nèi)部,各種共識(shí)機(jī)制還屬于“中心化”范疇,小范圍的“信任”,并沒(méi)有發(fā)揮出區(qū)塊鏈技術(shù)應(yīng)有的技術(shù)優(yōu)勢(shì)。區(qū)塊鏈上的數(shù)據(jù)共享存在同鏈共享、不同鏈共享、同鏈不同系統(tǒng)、不同鏈不同系統(tǒng)間數(shù)據(jù)共享等多種類型,若要實(shí)現(xiàn)跨鏈的數(shù)據(jù)共享是一個(gè)很復(fù)雜的過(guò)程,需要節(jié)點(diǎn)具備單獨(dú)驗(yàn)證能力和對(duì)鏈外信息的獲取能力,解決區(qū)塊鏈應(yīng)用彼此隔離、不同業(yè)務(wù)場(chǎng)景的獨(dú)立區(qū)塊鏈應(yīng)用不能互聯(lián)的問(wèn)題,才能實(shí)現(xiàn)跨不同類型、不同系統(tǒng)間的數(shù)據(jù)共享。因此,在進(jìn)行建設(shè)時(shí),可以優(yōu)先建立兩類聯(lián)盟區(qū)塊鏈:一是省級(jí)檔案局(館)聯(lián)盟區(qū)塊鏈;二是省級(jí)以下檔案機(jī)構(gòu)聯(lián)盟區(qū)塊鏈。并通過(guò)跨鏈技術(shù)把它們連在一起,形成區(qū)域范圍內(nèi)的檔案機(jī)構(gòu)聯(lián)盟區(qū)塊鏈系統(tǒng),各省級(jí)檔案館各掌握一個(gè)授權(quán)節(jié)點(diǎn),每個(gè)授權(quán)節(jié)點(diǎn)之間都可以實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)的信息交互,并通過(guò)共識(shí)機(jī)制和智能合約機(jī)制共同維護(hù)聯(lián)盟區(qū)塊鏈的運(yùn)行;各省級(jí)以下檔案機(jī)構(gòu)共同建立一條聯(lián)盟區(qū)塊鏈,并通過(guò)跨鏈技術(shù)與省級(jí)檔案局(館)聯(lián)盟區(qū)塊鏈相連,從而實(shí)現(xiàn)更大范圍的檔案信息資源共享。
(四)加強(qiáng)政策法規(guī)建設(shè)。法治建設(shè)能為基于區(qū)跨鏈技術(shù)的檔案數(shù)據(jù)共享工作開(kāi)展提供有力保障。從我國(guó)法治建設(shè)情況來(lái)看,2016年10月工信部出臺(tái)關(guān)于區(qū)塊鏈《中國(guó)區(qū)塊鏈技術(shù)和應(yīng)用發(fā)展白皮書》,2019年中國(guó)國(guó)家互聯(lián)網(wǎng)信息辦公室又發(fā)布了《區(qū)塊鏈信息服務(wù)管理規(guī)定》,為區(qū)塊鏈的信息服務(wù)提供了可靠有效的法律依據(jù)??傮w而言,我國(guó)的區(qū)塊鏈發(fā)展還處于探索階段,因此一方面,需要加強(qiáng)頂層設(shè)計(jì)相關(guān)政策規(guī)章制度的建設(shè),頂層設(shè)計(jì)的缺失,會(huì)導(dǎo)致檔案數(shù)據(jù)在共享原則、數(shù)據(jù)分類、共享范圍、共享質(zhì)量、互操作性等方面存在問(wèn)題,且一旦出現(xiàn)問(wèn)題,也難以找到相應(yīng)問(wèn)題解決的依據(jù);另一方面,要完善法律保障體系,例如,如何對(duì)完全公開(kāi)的公有鏈違法存儲(chǔ)數(shù)據(jù)和傳播數(shù)據(jù)相關(guān)權(quán)責(zé)進(jìn)行認(rèn)定,如何在法定或約定事由出現(xiàn)并產(chǎn)生糾紛時(shí),個(gè)人刪除的權(quán)益無(wú)法得到保障等等,都需要相關(guān)法規(guī)政策進(jìn)行明確。
檔案數(shù)據(jù)共享是充分調(diào)動(dòng)檔案信息資源、實(shí)現(xiàn)檔案信息資源流轉(zhuǎn)、發(fā)揮檔案信息資源價(jià)值的基礎(chǔ),數(shù)據(jù)共享的前提需要技術(shù)做支撐。區(qū)塊鏈在理論和技術(shù)層面可以為上鏈的檔案數(shù)據(jù)共享提供可信、安全保障。檔案行業(yè)在積極探討和應(yīng)用區(qū)塊鏈優(yōu)勢(shì)的同時(shí),也應(yīng)關(guān)注區(qū)塊鏈潛在的問(wèn)題和風(fēng)險(xiǎn),并研究制定相適應(yīng)的應(yīng)對(duì)策略,為檔案數(shù)據(jù)共享工作良好發(fā)展奠定基礎(chǔ)。