李高峰 胡國強
(1.西北農林科技大學檔案館,陜西楊凌 712100;2.西北農林科技大學網絡與教育技術中心,陜西楊凌 712100)
在我國《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中,第12、13、14條明確提出了,持續(xù)推進數字檔案館建設,加快提升電子檔案管理水平,加快檔案信息資源共享服務平臺建設,拓寬檔案服務的渠道,所以,檔案行業(yè)亟需通過結合新科技,變革改進檔案行業(yè)現(xiàn)狀,以求進步。其實不單是檔案行業(yè)對新的科技有單向需求,新科技同樣要尋求新的行業(yè)寄主來檢驗并實現(xiàn)新科技的創(chuàng)新價值。通過科技強國有關政策性向導文件,可以發(fā)現(xiàn)一些趨勢。2016年10月工業(yè)和信息化部發(fā)布《中國區(qū)塊鏈技術和應用發(fā)展白皮書(2016)》,2016年12月國務院首次將區(qū)塊鏈作為戰(zhàn)略性前沿技術、顛覆性技術寫入《國務院關于印發(fā)“十三五”國家信息化規(guī)劃的通知》。在人工智能方面,美國早在2016年就發(fā)布了《為人工智能的未來做好準備》和《國家人工智能研發(fā)戰(zhàn)略規(guī)劃》兩份重要報告(白宮科技政策辦公室),旨在為人工智能技術未來發(fā)展指明道路?,F(xiàn)階段檔案行業(yè)既面臨自發(fā)求變求進的內因,又有新技術和新政策驅動的外因,所以檔案人應該抓住這種機遇,實現(xiàn)檔案管理跨越式發(fā)展。
本文以人工智能和區(qū)塊鏈技術為引領,切入檔案協(xié)查環(huán)節(jié),探討在區(qū)塊鏈基礎上的離開人操控的檔案協(xié)查DAO。筆者相信,結合了人工智能(AI,Artificial Intelligence)和區(qū)塊鏈(Block chain)的技術高度與無人值守智能檔案協(xié)查DAO,將在檔案信息管理上實現(xiàn)跨越發(fā)展,推進檔案管理上一個新的高度。并超過目前已經實現(xiàn)的無人值守庫房,自動獲取檔案數據系統(tǒng)等智能檔案管理系統(tǒng)的智能水平,將在協(xié)查環(huán)節(jié)徹底解放人力資源,大大節(jié)約成本,提高工作效率。
未來檔案管理的趨勢就是減少人員參與,借助更多科學技術實現(xiàn)智能管理,提高檔案工作效率,推廣檔案滲透范圍。本文就是基于AI和區(qū)塊鏈技術,探討構建無人值守智能檔案協(xié)查DAO可能。協(xié)查DAO是一種基于區(qū)塊鏈組織結構,應用了AI技術的檔案協(xié)查分布式自治組織。是在區(qū)塊鏈上通過智能合約驅動,可以在無人干預和管理的情況下自主運行的檔案組織形式。協(xié)查DAO和比特幣、以太坊等區(qū)塊鏈DAO項目類似。
本文雖然探討無人值守智能檔案協(xié)查DAO,但檔案活動可以離開人嗎?答案很明顯,肯定是離不開人的。盡管目前的檔案管理已經進入檔案智能化管理階段,隨著物聯(lián)網高度發(fā)達,檔案日常管理中的局部環(huán)節(jié)已經減少,甚至去掉了人的參與,這個現(xiàn)象在檔案保管環(huán)節(jié)顯得尤為明顯。但是檔案管理離不開人的因素,因為檔案管理的每個環(huán)節(jié)都離不開人為因素存在。檔案的生命周期內無處沒有人類活動的烙印,人類是貫穿檔案的主體。第一,檔案的社會屬性決定了人的主導因素。檔案作為原始記錄憑證,在我國起源很早,商代“冊”,周代“中”,以及后來的“典籍”“文書”“文案”“案牘”“案卷”“簿書”,直至現(xiàn)在“檔案”。無論稱謂如何,檔案一直是人們在各項社會活動中直接形成的各種形式的具有保存價值的原始記錄[1],檔案是人類特有的記錄形式,人類是檔案的主體。第二,檔案管理離不開人的參與。檔案管理亦稱檔案工作,是檔案館(室)直接對檔案實體和檔案信息進行管理并提供利用服務的各項業(yè)務工作的總稱[2],包含檔案的收集、整理、保管、編目、檢索、鑒定、統(tǒng)計和提供利用的活動。這些環(huán)節(jié)無論分開還是連貫,無時無刻不穿插人的行為活動。第三,檔案的功能對象是人。檔案不但有“資政、育人”功能,而且檔案存在的目的性很強。檔案不但要忠實地記錄人的社會活動,同時它還具有為人類改造世界過程中提供參考憑證的作用與延續(xù)人類歷史、人類文化科學技術的傳承作用,是連接現(xiàn)在人和未來人的紐帶和橋梁,檔案是為人服務的。所以本文探討范圍僅限于檔案協(xié)查環(huán)節(jié)離開自然人參與,并不是離開人的因素。
現(xiàn)階段人工智能和區(qū)塊鏈應用,未深入普及至檔案領域。通過參考其他領域現(xiàn)有的AI和區(qū)塊鏈應用文獻,本文簡單對協(xié)查DAO在檔案專業(yè)宏觀層面和檔案協(xié)查應用上優(yōu)勢做簡單闡述。
1.協(xié)查DAO強化檔案使命,消除不必要的人為因素
基于AI和區(qū)塊鏈的協(xié)查DAO,通過檔案協(xié)查共識、獎勵規(guī)則和加密規(guī)則及其他的公開公正的規(guī)則,在無人干預和管理的情況下自主自動運行,遠離人的主觀因素,讓檔案運行在陽光下,使檔案使命無干擾、純粹化。第一,使技術創(chuàng)新與檔案權力關系并行變革,使檔案使命回歸,存檔于民用檔于民,借助區(qū)塊鏈技術將檔案權力從中心化機構的剝離,消除檔案管理環(huán)節(jié)中的各類人為壁壘。實現(xiàn)檔案利用權力平等化,不再“看人臉色”,幫助檔案權力向弱勢方偏移;第二,實現(xiàn)檔案最小利用單位—個人檔案權利主張效力趨同于機構檔案權利效力,在檔案信息產生階段,記錄每一個上鏈檔案記錄,不屈從任何勢力,使檔案信息自由真實記錄,并依法依規(guī)順暢傳播;第三,通過便捷性、安全性以及適當的獎勵來爭取眾多檔案弱勢群體參與檔案管理,使檔案弱勢群體和檔案形成對彼此的良性依賴;第四,使普通個人可以在檔案管理中對專家和權威持有自信的正面懷疑態(tài)度。這里的懷疑態(tài)度是指在協(xié)查DAO中以檔案專業(yè)要求為基礎經過人工智能匹配后產生的檔案主張,和檔案專家權威主觀主張不一致,不應盲目信從;第五,通過嚴格的人工智能篩選,協(xié)查DAO強化檔案技能的客觀性,消除檔案管理人員主觀上的檔案專業(yè)技能負偏差。
2.協(xié)查DAO提高協(xié)查自動化,節(jié)約人力成本
檔案協(xié)查過程依賴于檔案信息,但和檔案工作其他環(huán)節(jié)有很大不同。檔案協(xié)查過程,實際就是對檔案“真實性”的一種傳遞,檔案真實并不等同于檔案文本的真實[3],協(xié)查方式的答復以真實性為基礎原則,答復形式和傳遞以方便快捷為目標。新的協(xié)查DAO無論是檔案內容核實還是信息的反饋都較傳統(tǒng)的協(xié)查模式具有以下幾點優(yōu)勢,一是解決協(xié)查信息量小,但離不開人員操作困境;二是解決協(xié)查方式復雜,反饋渠道多樣問題。以檔案真實性為基礎,重新統(tǒng)一協(xié)查方案,做到答復形式和傳遞快捷方便又全面準確;三是通過智能設定對比,將根據協(xié)查內容匹配情況,自動識別并發(fā)出定向用戶邀請協(xié)助;四是自動收集協(xié)查內容有關的佐證信息并統(tǒng)一匯總,并迅速作出協(xié)查反應;五是通過協(xié)查條件匹配,如協(xié)查內容高度重復,可根據設定的匹配上閥值觸發(fā)自動處理程序,迅速重新辦理已經成功的協(xié)查過程;六是協(xié)查DAO可靈活設置模塊,如可以根據協(xié)查發(fā)出方需求信息DIY協(xié)查結果反饋單,可設置快遞對接模塊,對有需求用戶提供自動的快遞服務等;七是協(xié)查DAO可模擬人工協(xié)查方式,自動學習和優(yōu)化檔案協(xié)查流程。如遇到協(xié)查不暢問題,定向求助系統(tǒng)匹配的特定帳號或通過獎勵機制全鏈尋找可以解決的辦法。
本文所探討的無人值守的基礎,基于AI和區(qū)塊鏈技術。AI技術模仿人類活動方式,提供解決復雜問題可能。整個區(qū)塊鏈中,提供利用由自動化腳本代碼組成的智能合約來編程和操作數據的分布式基礎架構與計算方式[4],簡單說就是提供了AI和程序腳本執(zhí)行的平臺。所以協(xié)查DAO運行具備了智力支持和技術平臺支持。此外區(qū)塊鏈中獎勵機制(錢包)將有效地調動可能的人力資源來配合完成協(xié)查DAO運行。
1956年人工智能大師約翰·麥卡錫在達特茅斯會議上首次提出了人工智能概念。人工智能技術被劃分為兩類:一類是通過特定的技術制造智能機器;另一類是通過智能化手段解決復雜問題。本文主要介紹第二類人工智能技術在檔案協(xié)查的應用。第二類人工智能技術包含自然語言處理、人工神經網絡、模式識別、專家系統(tǒng)、機器學習、多Agent系統(tǒng)、智能決策系統(tǒng)、自動定理證明、智能搜索等技術。自然語言處理(Natural Language Processing,NLP)研究實現(xiàn)人機之間用自然語言(如中文、英語等)進行交流的各種理論和方法[5],其目標是實現(xiàn)人機之間可以用自然語言相互交流,研究內容包括:語言計算、語言資源建設、機器翻譯、文本分類、社會計算等。模式識別(Pattern Recognition)對事物或現(xiàn)象進行描述、辨認、分類和解釋的過程[6],現(xiàn)階段主要研究視覺模式和聽覺模式的識別,主要集中在圖形識別和語音識別。專家系統(tǒng)是依靠人類專家已有的知識建立起來的知識系統(tǒng),其包含“知識庫”和“推理機”,廣泛應用于商業(yè)和工業(yè)領域。機器學習,主要研究如何更好地讓計算機模擬和實現(xiàn)人類的學習行為,從而實現(xiàn)知識的自動獲取和產生。近年來機器學習受到廣泛關注,其在網絡安全檢測、圖像識別、自動駕駛以及其他與人們日常生活密切相關的領域表現(xiàn)突出[7]。Agent可以看做是一個自動執(zhí)行的實體,它通過傳感器感知環(huán)境,通過效應器作用于環(huán)境。多Agent系統(tǒng)技術廣泛應用于網絡態(tài)勢感知、入侵檢測和入侵防御等網絡安全領域。智能決策支持系統(tǒng)是決策支持系統(tǒng)與人工智能技術相互結合的產物[8],主要用來輔助決策者進行決策。自動定理證明是一種利用計算機完全或部分代替人工進行定理證明的方式[9],即用計算機程序實現(xiàn)數字定理證明。智能搜索技術是結合了新一代人工智能的新一代搜索技術,此技術可根據用戶自身特點,提供個性化的信息服務。通過以上介紹AI技術的各類算法注入智能合約為協(xié)查DAO提供了智力支持。
區(qū)塊鏈是由節(jié)點參與的分布式數據庫系統(tǒng)[10],是基于時間戳由區(qū)塊有序鏈接起來形成的一種數據結構,其中區(qū)塊是指數據的集合,相關信息和記錄都包括在區(qū)塊里面,是形成區(qū)塊鏈的基本單元[11]。區(qū)塊鏈本身不是什么新技術,是一種技術架構新思維,但它通過將已有的技術通過鏈結構整合在一起,達到了公開透明、高度信任、無法篡改、方便追溯的特點[12],且具有很強的移植性和可管理性,不依賴中心機構的管理,不存在中心服務器,每個運行區(qū)塊鏈軟件的計算設備都可以當作區(qū)塊鏈網絡的一個對等節(jié)點,節(jié)點之間無需考慮信任問題。區(qū)塊鏈依靠密碼學,使得區(qū)塊鏈網絡中的任意兩個節(jié)點可以直接交易,解決了中介信用問題,其核心技術技術有分布式賬本技術、非對稱加密算法以及智能合約。區(qū)塊鏈特殊的工作原理賦予了其四大特征,即去中心化、共識機制、可追溯性、高度信任。這些特征能夠有效解決實際交易中的用戶隱私安全、中介信用、交易成本高等問題。整個區(qū)塊鏈中,廣泛存在定勢觸發(fā)思維模式和契約精神。即利用由自動化腳本代碼組成的智能合約來編程和操作數據的分布式基礎架構與計算方式[13],簡單說就是通過區(qū)塊鏈的智能合約規(guī)范,達到某個條件或突破某個限制,自動執(zhí)行合約,比如自動轉移證券、自動付款等等。區(qū)塊鏈模擬了人類特有的合約操作環(huán)境,為協(xié)查DAO提供了可運轉的理想平臺,實現(xiàn)了檔案協(xié)查DAO技術層面的強力支撐。
改變現(xiàn)有檔案體系下協(xié)查環(huán)境運作方式,顯然不能只有口號和可能性,改革需要一定驅動力,區(qū)塊鏈技術創(chuàng)新和區(qū)塊鏈運作方式為協(xié)查DAO上鏈提供了足夠的驅使動力。
1.檔案信息資產化
數據越來越成為一種新型資產,面對蓬勃發(fā)展的人工智能、互聯(lián)網,甚至物聯(lián)網行業(yè)的到來,其重要性不言而喻。傳統(tǒng)的檔案管理,只是單純地從保管利用角度去解讀檔案數字化信息化價值。檔案從未被賦予真正的資產定義,檔案的資產化屬性未得到真正的體現(xiàn)。區(qū)塊鏈將檔案信息資產與區(qū)塊鏈通證經濟里的通證(token)建立一一對應的關系。使檔案資產化,通過模擬現(xiàn)實中檔案服務標準和成本以及可能收益等因素,對實體檔案數字化并通過通證對映收益等步驟,實現(xiàn)檔案數字資產的自由流通和交換。檔案資產化將帶來檔案管理以下優(yōu)勢,一是檔案資產化可健全知識產權,為檔案保護體系提供抓手;二是有利于開展檔案資產的評估工作,并逐步使其走上規(guī)范化、法制化的軌道;三是深化檔案資產認識,促進檔案資產的有效利用,防止檔案資產的流失;四是有利于對檔案資產的保護,如為建立檔案綜合保險等實施提供有效資料[14]。
2.數據的永久安全存儲
區(qū)塊鏈是一個分布式數據存儲的賬本技術,從廣義角度來看,這個賬本運行在全球所有的存儲系統(tǒng)當中,黑客無法通過入侵、攻擊某一個中心化數據庫,來破壞整個網絡系統(tǒng)。區(qū)塊鏈構建的檔案數據容器,其突出的數據處理技術特點和數據儲備特點,使檔案數據得以永久安全的保存,無法被篡改,無需刻意對數據異地備份,全鏈直接為檔案實時多點自動備份。檔案數據不但存儲安全可靠,同時減少檔案管理運營成本,甚至可以達到“一勞永逸”。
3.分布式檔案管理的促進檔案管理環(huán)節(jié)創(chuàng)新
區(qū)塊鏈解決了信任問題,顛覆了傳統(tǒng)的單點信任和對中心機構的信任問題,實現(xiàn)了公開透明、高度信任,為各類場景實現(xiàn)提供了一個的公平包容的生態(tài)環(huán)境。所以區(qū)塊鏈技術與檔案結合將徹底顛覆檔案小圈子思想,改變檔案分布格局,讓更多的參與者開發(fā)檔案信息,使檔案管理環(huán)境作出進一步的改進和完善,使參與者發(fā)揮自己的創(chuàng)意,促進檔案管理與服務圈子接納更多的創(chuàng)新元素使其更有活力更有生命力。協(xié)查DAO借助應用層的客戶端,通過調用擴展層自建智能合約和第三方合約范本,實現(xiàn)自動流轉數據、自動轉賬等通用動作,完成檔案協(xié)查過程。自建智能合約是通過對檔案協(xié)查過程深入學習了解,形成協(xié)查共識,用計算機語言編寫定制的檔案協(xié)查智能合約,能實現(xiàn)檔案信息自動匹配、檔案傳輸數據特定加密等特色功能。調用這些合約范本來實現(xiàn)檔案塊數據開發(fā)、檔案塊數據治理(檔案塊數據分享、傳遞、鏈上鏈下數據融合分析等)、用戶審核審查、獎勵換算確權、協(xié)查附件自動轉遞等模塊開發(fā),從而解決檔案協(xié)查環(huán)節(jié)的各類問題。模塊運作不但能實現(xiàn)網上檔案協(xié)查信息自主反饋,還能通過物聯(lián)網實現(xiàn)自動發(fā)送快遞過程,實現(xiàn)“人——檔案——人”自動檔案協(xié)查。
本系統(tǒng)要實現(xiàn)的最終目標是通過通證經濟實現(xiàn)確權,在獎勵規(guī)則干預下,實現(xiàn)各類規(guī)則和協(xié)查的環(huán)節(jié)在區(qū)塊鏈環(huán)境下公開公正的運行,在無人干預和管理的情況下自主自動運行。在運作的過程中,根據協(xié)查遇到實際情況通過AI設定嘗試解決協(xié)查問題,并不斷的自我維護和升級,通過不斷的自我完善來匹配適應周圍的鏈環(huán)境,從而達到智能自動協(xié)查過程。
本文根據檔案協(xié)查DAO場景的需求及技術實現(xiàn)機制,簡單架構了檔案協(xié)查DAO場景概略圖,參考區(qū)塊鏈的邏輯結構,場景架構簡單分為三層,即協(xié)議層、擴展層、應用層。由于檔案協(xié)查DAO主要活動范圍集中在擴展層和協(xié)議層,本文將對這兩層結構進行簡單直觀圖文述說。本系統(tǒng)的架構設化趨于簡單化理想化,僅為簡要說明檔案協(xié)查DAO的主要特征和便于呼應本文闡述的觀點。本系統(tǒng)建設過程注重利用區(qū)塊鏈特點,既強化分布模塊設計,又加強系統(tǒng)的聯(lián)動性和協(xié)調性,同時借鑒成熟有經驗場景模塊,來降低建設系統(tǒng)的難度。(如圖1)
1.基礎模塊特征及介紹
基礎模塊是借鑒成熟和投入使用的其他區(qū)塊鏈場景的模塊功能及合約和信息等,在系統(tǒng)形成的非專業(yè)但不可或缺的調用模塊。如識別模塊,此模塊根據檔案查詢經驗和檔案協(xié)查工作規(guī)則建立起協(xié)查智能合約,及調用別的可用的系統(tǒng)或平臺已經記錄的用戶信用信息。在協(xié)查方向上對協(xié)查委托方身份識別把關,對協(xié)查內容審查,并進行必要分類,如身份信息、獎勵規(guī)則、反饋通道及附加信息等。在反饋方向上對客戶端反饋進DAO系統(tǒng)的信息進行識別,對協(xié)查反饋人員進行把關審核,對反饋方也進行身份信息、錢包、信譽等級等必要信息收集分類管理。同時根據協(xié)查過程時事反饋對需要識別的特殊信息進行有目地的甄別核查分類管理。
2.基于AI算法的部分學習及決策模塊功簡介
此類模塊是基于AI算法形成的“知識庫”和“推理機”,簡單模仿人工操作程序,尤其是協(xié)查的關鍵環(huán)節(jié),調用各類模塊使協(xié)查順暢快捷。類似功能模塊如下:一是自然語言處理模塊。此模塊的作用類似于語言翻譯、專業(yè)化復述以及協(xié)查程式制定綜合過程;是DAO系統(tǒng)讀取和辨識工作的開始段,是自然語言和機器語言的交互環(huán)節(jié),是輸出和反饋的末端。這個模塊要更多借用借鑒,目前成熟的各類人機交互系統(tǒng)。二是機器學習模塊。此模塊可以區(qū)塊鏈上收集各類查詢信息,并對信息的重要程度和查閱量進行利用的權重統(tǒng)計,以此類統(tǒng)計數據為基準和檔案信息建立關聯(lián)性,并對相關的檔案數據進行必要的節(jié)點備份和查詢優(yōu)先級設計,可以優(yōu)化協(xié)查速度。同時以統(tǒng)計數據為參考,指導協(xié)查數據庫預建設和信息存儲優(yōu)化。三是智能決策模塊。智能決策模塊顧名思義,就是模擬人類在協(xié)查過程的做法,把握協(xié)查過程走向或最終結果智能反饋模塊。這部分內容既要對簡單的協(xié)查進行無障礙流轉,并要結合機器學習模塊和基于檔案協(xié)查工作規(guī)則建立起來的智能合約聯(lián)合應用,對存有疑難的協(xié)查進行智能決策,比如與到復雜問題進行多Agent的互相協(xié)作完成協(xié)查問題,或者啟用人機求助模式,通過有償的信息啟事來完成協(xié)查工作等。
3.通過物聯(lián)網和第三方平臺提供完善的其他環(huán)節(jié)服務
通過架構一個模塊化的物聯(lián)網操作系統(tǒng),提供3G、4G、NB-IoT、GPRS、北斗等公共網絡的無線通信功能,支持藍牙、NFC、RFID等主流的近場通信功能,支持TCP/IP網絡協(xié)議的有線網絡接口功能[15]。并通過提供內置XML文件解析功能,將各類協(xié)議相互轉換,通過各類GUI接口和API接口將協(xié)查數據轉換成為各類信號如文字、圖片、語音、視頻等信號傳輸至鏈網外,再通過連接的外設硬件設備實現(xiàn)實物化。部分反饋信息實物,可以調用郵政、快遞等第三方的預約服務,最終實現(xiàn)信息反饋物證至協(xié)查委托方。這些功能借助現(xiàn)有的檔案服務網絡,實現(xiàn)區(qū)塊鏈協(xié)查和現(xiàn)有檔案服務體系無縫融合,達到協(xié)查目的。同時協(xié)查DAO將更多的借用現(xiàn)階段成熟的各類外圍平臺,形成可調用的程序化模塊,為協(xié)查工作其他環(huán)節(jié)做好基礎服務。
本系統(tǒng)基于分布式基礎架構與觸發(fā)式計算方式,通過系統(tǒng)在應用層的客戶端,調用擴展層自建智能合約模塊和第三方合約范本,實現(xiàn)自動流轉數據、自動轉賬等通用動作,完成檔案協(xié)查過程。本系統(tǒng)最終實現(xiàn),第一,去中心化的檔案管理環(huán)境,檔案查閱通過利用客戶端交互,滿足各類合約觸發(fā)條件,實現(xiàn)數據流轉最終達到協(xié)查檔案信息流轉。第二,擴展提升檔案數據屬性,如檔案管理經濟化,使檔案資產化,使檔案經濟屬性作用進一步強化,并利用檔案經濟屬性收益反饋檔案管理,擺脫檔案傳統(tǒng)的“計劃從屬”和“撥款贊助”古板形象。第三,通過探索的方式使檔案的工具效應得到增強,在新時代改變人們檔案“深閨”形象和利用檔案手續(xù)“繁縟”“刻板”的觀點。
基于區(qū)塊鏈技術實現(xiàn)智能檔案協(xié)查DAO,是為了構建廣泛分布的便于服務社會的檔案協(xié)查業(yè)務網絡,鼓勵檔案行業(yè)內的機構走出小圈思維,鼓勵更多的檔案需求人員和團體改變傳統(tǒng)的檔案管理模式,拓展檔案資源集聚渠道,擴大檔案利用范圍。引入AI技術是為了更好切合區(qū)塊鏈技術,使檔案協(xié)查更趨向智能化,減少人力成本和人為的阻礙因素。但需強調的是,僅通過技術來驅動的檔案服務設想,過于理想化,無論是檔案協(xié)查還是檔案管理離不開人的基礎工作,檔案協(xié)查和檔案管理也終究要服務于人。本文討論的只是將人從檔案的繁文縟節(jié)中解放出來,做檔案工作中更有意義的事情。