李軼昶 林空/浙江省檔案館
黨的十八大以來(lái),以習(xí)近平同志為核心的黨中央高度重視數(shù)字化發(fā)展,作出了一系列重大部署,擘畫(huà)了數(shù)字中國(guó)建設(shè)的宏偉藍(lán)圖?!丁笆奈濉比珖?guó)檔案事業(yè)發(fā)展規(guī)劃》明確:加強(qiáng)大數(shù)據(jù)、人工智能等新一代信息技術(shù)在數(shù)字檔案館(室)建設(shè)中的應(yīng)用,推動(dòng)數(shù)字檔案館(室)建設(shè)優(yōu)化升級(jí)。
檔案數(shù)據(jù)化生存與數(shù)據(jù)檔案化管理日益明顯,檔案工作環(huán)境、內(nèi)容、模式發(fā)生深刻調(diào)整,迫切要求檔案事業(yè)“數(shù)智化”蛻變。2020年,浙江省檔案館正式啟動(dòng)省檔案數(shù)據(jù)中心建設(shè)項(xiàng)目,建設(shè)的主要內(nèi)容包括檔案數(shù)據(jù)共享服務(wù)和檔案業(yè)務(wù)智慧治理兩方面,全面開(kāi)啟以“數(shù)智”為目標(biāo)的數(shù)字檔案館向檔案智能化管理系統(tǒng)的迭代升級(jí)。
利用先進(jìn)的計(jì)算機(jī)技術(shù),加強(qiáng)系統(tǒng)集成、管理集成、技術(shù)集成,優(yōu)化檔案接收征集、檔案資源管理、檔案開(kāi)發(fā)利用等方面的工作流程,加強(qiáng)內(nèi)部管理協(xié)同,促進(jìn)檔案實(shí)體管理和檔案數(shù)據(jù)管理一體化、智能化,檔案業(yè)務(wù)流程自動(dòng)化、可留痕。在檔案接收征集方面,加強(qiáng)檔案接收工作過(guò)程管理、檔案數(shù)字復(fù)制件質(zhì)量檢測(cè)、實(shí)體入庫(kù)過(guò)程管理等工作的智能化;在檔案資源管理方面,加強(qiáng)全宗、目錄、涉密篩查等智能化;在檔案開(kāi)發(fā)利用方面,優(yōu)化調(diào)卷、自助查檔、外借審批、智能編研等應(yīng)用。著力推動(dòng)檔案工作與大數(shù)據(jù)、人工智能等新一代信息技術(shù)深度融合,實(shí)現(xiàn)檔案服務(wù)創(chuàng)新性變革,助力數(shù)字檔案館建設(shè)從“數(shù)字”向“數(shù)智”的目標(biāo)邁進(jìn)。
迭代升級(jí)后的檔案智能化管理系統(tǒng)整體采用“3+2”的架構(gòu)設(shè)計(jì),“3”是前置接收子系統(tǒng)、長(zhǎng)久保存子系統(tǒng)和數(shù)字檔案館子系統(tǒng)共行支撐檔案資源收管存用的全方位管理;“2”是檔案資源治理和檔案業(yè)務(wù)治理并重形成全新的檔案館管理體系。
2.1.1 前置接收子系統(tǒng)。前置接收子系統(tǒng)部署在館內(nèi)政務(wù)外網(wǎng),與部署在政務(wù)云上的接收系統(tǒng)進(jìn)行對(duì)接,通過(guò)接口實(shí)現(xiàn)電子檔案的在線接收與移交,是電子檔案的“總收發(fā)室”。
2.1.2 長(zhǎng)久保存子系統(tǒng)。長(zhǎng)久保存子系統(tǒng)用于保存原始存檔信息包和數(shù)字檔案館系統(tǒng)中轉(zhuǎn)換為長(zhǎng)期保存格式后形成的返回信息包,以ZIP包為管理單位進(jìn)行長(zhǎng)久保存管理,采用可信時(shí)間戳、數(shù)據(jù)保全、OFD 格式轉(zhuǎn)換等技術(shù)策略,優(yōu)化數(shù)據(jù)監(jiān)測(cè)、監(jiān)管和保真功能,做到實(shí)時(shí)檢測(cè)、實(shí)時(shí)預(yù)警、實(shí)時(shí)保全,真正實(shí)現(xiàn)檔案資源的存、用分離。
2.1.3 數(shù)字檔案館子系統(tǒng)。數(shù)字檔案館子系統(tǒng)結(jié)合工作人員與查檔用戶(hù)長(zhǎng)期使用的實(shí)際情況提出的意見(jiàn)建議,作了大量的適用性改造和優(yōu)化,各項(xiàng)功能進(jìn)一步滿足開(kāi)展數(shù)字檔案資源移交、接收、整理、編目、審核、管理、保存、編研、利用、統(tǒng)計(jì)等工作的需要。
2.2.1 檔案資源治理體系。為實(shí)現(xiàn)檔案實(shí)體管理和檔案數(shù)據(jù)管理一體化、智能化的目標(biāo),打造檔案資源治理體系。順應(yīng)浙江省數(shù)字化改革的大趨勢(shì),結(jié)合浙江省檔案館實(shí)際需求,既考慮傳統(tǒng)檔案數(shù)字化成果的管理利用問(wèn)題,又充分考慮電子文件歸檔、電子檔案移交、接收、保存和共享利用的規(guī)定與流程,著力打造存量數(shù)字化和增量電子化并重的檔案資源治理體系。
2.2.2 檔案業(yè)務(wù)治理體系。為實(shí)現(xiàn)檔案業(yè)務(wù)流程自動(dòng)化、可留痕的目標(biāo),打造檔案業(yè)務(wù)治理體系。以“定準(zhǔn)核心業(yè)務(wù)—確定業(yè)務(wù)模塊—拆解業(yè)務(wù)單元—梳理業(yè)務(wù)事項(xiàng)—確定業(yè)務(wù)流程—明確協(xié)同關(guān)系—建立指標(biāo)體系—匯總數(shù)據(jù)需求”為路徑,從梳理館內(nèi)核心業(yè)務(wù)出發(fā),逐層拆解到最具體最基本的單元,以各職能處室為主體,逐一明確業(yè)務(wù)流程的數(shù)據(jù)指標(biāo),實(shí)現(xiàn)事項(xiàng)的標(biāo)準(zhǔn)化、數(shù)字化。
3.1.1 新增AI輔助開(kāi)放審核功能,采用NLP技術(shù)結(jié)合專(zhuān)家訓(xùn)練和機(jī)器學(xué)習(xí),探索AI輔助檔案開(kāi)放審核核心算法引擎,從成熟的審核樣本中尋找規(guī)律,并運(yùn)用這些規(guī)律對(duì)各類(lèi)檔案的內(nèi)容價(jià)值進(jìn)行判斷,作為檔案人員審核的參考,在一定程度上統(tǒng)一開(kāi)放審核標(biāo)準(zhǔn),從而有效提高開(kāi)放審核工作效率;開(kāi)發(fā)正文拆分模塊,針對(duì)開(kāi)放審核時(shí)認(rèn)定全文中部分不能開(kāi)放的內(nèi)容,可以對(duì)全文進(jìn)行拆分,生成新的全文進(jìn)行開(kāi)放,利用和導(dǎo)出時(shí),可只導(dǎo)出可以開(kāi)放的部分;開(kāi)發(fā)復(fù)審理由記錄功能,工作人員可以記錄敏感詞庫(kù)和規(guī)則庫(kù)中不存在的詞條,并在人工審定后將規(guī)則和敏感詞增加到規(guī)則庫(kù)和敏感詞庫(kù)中;預(yù)警提醒功能也能同時(shí)對(duì)到期需要開(kāi)放審核的館藏檔案進(jìn)行開(kāi)放審核提醒。
3.1.2 新增檔案多維分類(lèi)管理功能,通過(guò)定義檔案數(shù)據(jù)標(biāo)簽并對(duì)館藏檔案進(jìn)行賦值標(biāo)簽的操作,對(duì)館藏檔案添加自定義標(biāo)簽進(jìn)行分類(lèi),打破傳統(tǒng)數(shù)字檔案館檔案管理的固有模式,對(duì)復(fù)雜檔案數(shù)據(jù)資源進(jìn)行簡(jiǎn)易化統(tǒng)計(jì)、篩選、加工、沉淀,通過(guò)可視化線索分析精準(zhǔn)定位,實(shí)現(xiàn)海量檔案數(shù)據(jù)資源的多維分類(lèi)管理,為后續(xù)的工作提供更有力的支撐。
3.1.3 新增系統(tǒng)糾錯(cuò)功能,工作人員或查檔用戶(hù)可以在日常的查檔用檔過(guò)程中發(fā)現(xiàn)錯(cuò)誤,并上報(bào)錯(cuò)誤,以便系統(tǒng)數(shù)據(jù)管理員對(duì)錯(cuò)誤數(shù)據(jù)進(jìn)行修改,不斷提高館藏檔案的數(shù)據(jù)質(zhì)量。
3.2.1 優(yōu)化全文搜索功能,在基于關(guān)鍵字搜索全文內(nèi)容的基礎(chǔ)上新增音視頻檢索,采用人臉識(shí)別技術(shù),在視頻檔案存儲(chǔ)過(guò)程中,檢測(cè)提取人臉,建立視頻人臉庫(kù),支持“1vN”人臉庫(kù)信息檢測(cè),關(guān)聯(lián)視頻所在事件文本信息,打破視頻文件傳統(tǒng)存儲(chǔ)模式,打造“視頻+音頻+文字+人臉+目錄”創(chuàng)新存儲(chǔ)模式,加速視頻文件內(nèi)容的快速檢索利用。
3.2.2 新增檔案編研功能,采用NLP技術(shù)探索建設(shè)檔案智能檢索場(chǎng)景,形成檔案知識(shí)圖譜,建立檔案編研“中央廚房化”,初步探索檔案智能挖掘、檔案智能檢索、檔案智能關(guān)聯(lián)等檔案利用新模式,并支持多人同時(shí)在線編研。
3.3.1 新增流程管理功能,根據(jù)檔案資源管理收管存用的總體要求對(duì)檔案接收(含實(shí)體檔案接收、數(shù)字化成果接收、電子檔案接收等)、檔案開(kāi)放審核、檔案查閱、館藏檔案數(shù)字化掃描、檔案修復(fù)、檔案數(shù)轉(zhuǎn)模、檔案征集編研、檔案展覽等核心業(yè)務(wù)流程進(jìn)行拆解重組、逐項(xiàng)明確,每項(xiàng)流程均涵蓋任務(wù)制定、任務(wù)執(zhí)行、任務(wù)完成等環(huán)節(jié),形成閉環(huán)式管理,所有環(huán)節(jié)按需定制功能點(diǎn),適應(yīng)多部門(mén)、多應(yīng)用、多業(yè)務(wù)場(chǎng)景的需求。
浙江省檔案館檔案智能化管理系統(tǒng)迭代升級(jí)明細(xì)表
3.3.2新增流程監(jiān)控中心功能,記錄流程管理模塊中所有業(yè)務(wù)流程流轉(zhuǎn)的系統(tǒng)日志,并根據(jù)日志中記錄的返回狀態(tài)來(lái)實(shí)時(shí)監(jiān)控各流程實(shí)例的全流程周期,包括待辦監(jiān)控、隊(duì)列監(jiān)控、消息監(jiān)控、接口監(jiān)控、緩存監(jiān)控等,通過(guò)視圖可快速查看當(dāng)前異常流程、告警信息,可供管理人員快速發(fā)現(xiàn)問(wèn)題,定位問(wèn)題,實(shí)現(xiàn)流程的執(zhí)行全過(guò)程管理和監(jiān)控。同時(shí)集成核心業(yè)務(wù)完成情況的統(tǒng)計(jì)及工作量統(tǒng)計(jì)的功能。
優(yōu)化用戶(hù)權(quán)限管理模式,以“用戶(hù)—角色”替代“用戶(hù)—模塊”權(quán)限控制方式。多年實(shí)踐經(jīng)驗(yàn)表明,檔案智能化管理系統(tǒng)中的用戶(hù)(主要指工作人員)數(shù)量眾多且工作崗位經(jīng)常變動(dòng)應(yīng)該,這就增加了權(quán)限授權(quán)管理的難度,通過(guò)根據(jù)調(diào)研核心業(yè)務(wù)流程建立的《智能化管理系統(tǒng)模塊角色對(duì)應(yīng)表》和《智能化管理系統(tǒng)權(quán)限分配表》,引入角色(與特定業(yè)務(wù)工作流程相關(guān)的一個(gè)功能模塊集合)這一中介,實(shí)現(xiàn)了用戶(hù)與功能模塊的邏輯分離,采用“用戶(hù)—角色”的權(quán)限控制方式。當(dāng)用戶(hù)改變工作崗位時(shí)只需進(jìn)行角色的撤銷(xiāo)和重新分配即可。采用這種權(quán)限控制方式的優(yōu)勢(shì)在于,從系統(tǒng)管理員的視角來(lái)看,管理用戶(hù)對(duì)應(yīng)的角色代替用戶(hù)對(duì)應(yīng)的功能模塊,權(quán)限管理的壓力減??;從用戶(hù)視角來(lái)看,無(wú)需了解自己在系統(tǒng)所需使用的功能模塊,而只需要定位自己的業(yè)務(wù)流程中的角色,系統(tǒng)的學(xué)習(xí)成本降低。
以館內(nèi)核心業(yè)務(wù)流程重塑為基礎(chǔ),從單向以檔案數(shù)字資源的收管存用驅(qū)動(dòng)發(fā)展為“檔案資源+檔案業(yè)務(wù)”雙向驅(qū)動(dòng)的檔案智能化管理模式,將傳統(tǒng)線下業(yè)務(wù)和以數(shù)字檔案館為載體的線上業(yè)務(wù)相結(jié)合,實(shí)現(xiàn)數(shù)字環(huán)境下檔案業(yè)務(wù)工作的流程自動(dòng)化、可留痕。
在館藏檔案高數(shù)字化率(突破90%)的基礎(chǔ)上,轉(zhuǎn)而關(guān)注館藏檔案的“數(shù)據(jù)化”工作。通過(guò)數(shù)字檔案資源的“數(shù)據(jù)化”,打破版式文檔、圖片、音頻、視頻等數(shù)字檔案資源格式對(duì)計(jì)算機(jī)理解檔案內(nèi)容的限制,實(shí)現(xiàn)維度跨越與知識(shí)互通,實(shí)現(xiàn)檔案價(jià)值從數(shù)據(jù)向信息乃至知識(shí)的躍升。
將大數(shù)據(jù)、人工智能等信息技術(shù)應(yīng)用在數(shù)字檔案資源建設(shè)中,推動(dòng)檔案數(shù)據(jù)化與智能化之間緊密融合,檔案數(shù)據(jù)與智能技術(shù)相互嵌入。以AI輔助開(kāi)放審核、輔助音視頻檔案管理利用,建設(shè)檔案編研“中央廚房化”、檔案多維分類(lèi)管理等,實(shí)現(xiàn)檔案管理和利用層面的技術(shù)賦能與能力提升,充分延伸檔案價(jià)值空間。
檔案智能化管理系統(tǒng)的核心在于云計(jì)算、大數(shù)據(jù)、人工智能等信息技術(shù)在數(shù)字檔案資源建設(shè)中的應(yīng)用,數(shù)據(jù)化與智能化之間緊密融合,檔案數(shù)據(jù)與智能技術(shù)相互嵌入。前文所提到的場(chǎng)景諸如AI輔助開(kāi)放審核、AI輔助音視頻檔案管理利用、檔案編研“中央廚房化”、檔案多維分類(lèi)管理等很大程度上依賴(lài)于數(shù)字檔案資源“數(shù)據(jù)化”程度,可以說(shuō),數(shù)字檔案資源“數(shù)據(jù)化”的數(shù)量和質(zhì)量決定了這些場(chǎng)景的應(yīng)用前景。
隨著現(xiàn)代信息技術(shù)的廣泛應(yīng)用,檔案館從傳統(tǒng)的手工管理模式逐步走向數(shù)字化、智能化、智慧化,檔案服務(wù)也從被動(dòng)接待走向主動(dòng)提供和推送檔案信息的新境界。迭代升級(jí)后的檔案智能化管理系統(tǒng)將繼續(xù)通過(guò)自然語(yǔ)言處理、音頻轉(zhuǎn)譯、人臉識(shí)別等技術(shù)對(duì)館藏檔案數(shù)據(jù)進(jìn)行聚合處理,實(shí)現(xiàn)檔案管理系統(tǒng)的互通融合、檔案信息資源的深度挖掘,全方位滿足用戶(hù)個(gè)性化、精準(zhǔn)化、知識(shí)化的檔案利用需求。