科技檔案作為重要的科技創(chuàng)新資源[1-2],記錄著科技創(chuàng)新活動的來龍去脈和創(chuàng)新成果產(chǎn)出,對其進行有效利用能夠促進科技創(chuàng)新水平提升。然而,目前科技檔案管理工作的重點仍停留在檔案實體管理等常規(guī)工作上,缺少基于科技檔案內(nèi)容的知識服務、檔案智能檢索等深度開發(fā),難以發(fā)揮出科技檔案資源對科技創(chuàng)新活動的賦能作用[3]。
人工智能技術(shù)[4]誕生于1956年,是研究、開發(fā)用于模擬、延伸和擴展人類智能的理論、方法、技術(shù)以及應用系統(tǒng)的一門技術(shù)科學。目前,其在自然語言處理、模式識別、生物特征識別以及知識圖譜等領(lǐng)域取得顯著進展[5]?!丁笆奈濉比珖鴻n案事業(yè)發(fā)展規(guī)劃》提出要探索人工智能在檔案信息深層加工和利用中的應用以及數(shù)字檔案館建設中的應用。當前,城建等行業(yè)探索將人工智能技術(shù)應用于行業(yè)檔案管理,并形成了較為成熟的研究成果[6]。將人工智能技術(shù)與科技檔案特點和管理規(guī)律相結(jié)合并運用在科技檔案工作之中,勢必能夠發(fā)揮科技檔案資源對創(chuàng)新的賦能作用。
一、人工智能技術(shù)在科技檔案領(lǐng)域的適用性分析
科技檔案作為檔案資源重要組成部分,具有完整性、綜合性和動態(tài)性等顯著特點。
在完整性方面,科技檔案記錄科研項目立項論證、研究實施、過程管理、結(jié)題驗收、績效評價、成果登記等環(huán)節(jié),各環(huán)節(jié)之間既相互獨立又緊密相關(guān),反應了科研項目的全流程,具有較強的完整性。
在綜合性方面,科學研究、技術(shù)開發(fā)都是綜合且復雜的系統(tǒng)工程,項目可行性研究、立項論證、研究方案制定、技術(shù)路線實施、成果應用與轉(zhuǎn)化等環(huán)節(jié)之間有著較強的關(guān)聯(lián)性,這就決定了科技檔案具有形式多樣性、內(nèi)容廣泛性的特點。
在動態(tài)性方面,科技創(chuàng)新是不斷發(fā)展進步的迭代過程,科技檔案工作必須要與科技創(chuàng)新保持同步,進行必要的動態(tài)跟蹤管理,對已有檔案進行及時補充、完善和更新,使科技檔案能夠全面、真實反應科技創(chuàng)新水平。
科技檔案的上述特點決定了其在科技創(chuàng)新過程中發(fā)揮著重要作用,同時也促進參與創(chuàng)新活動的各類主體、科創(chuàng)活動管理部門、成果轉(zhuǎn)化及應用部門的聯(lián)系更加緊密,這都對科技檔案管理的工作量和檔案質(zhì)量提出了新的要求。同時,由于科技檔案要具備動態(tài)性,檔案部門及時對接科創(chuàng)活動各相關(guān)方,在第一時間合規(guī)獲取最新檔案,并發(fā)揮科技檔案對科技創(chuàng)新的參考、憑證、資政的多重價值。為此,需要處理好各部門間的資源對接、文件歸檔、卷宗管理,并從內(nèi)容層面甚至語義層面對檔案進行信息檢索和智能分析,根據(jù)用戶需求提供精準信息服務。然而,科技檔案管理部門受體制機制、人員編制、業(yè)務水平等因素制約,難以全部滿足上述要求。
人工智能技術(shù)的本質(zhì)是信息系統(tǒng)在資源受限的情況下,對外界環(huán)境或需求變化作出自適應的調(diào)整。同時,根據(jù)《國家新一代人工智能標準體系建設指南》,可將人工智能技術(shù)分為通用技術(shù)(如知識圖譜、模式識別等)和關(guān)鍵領(lǐng)域技術(shù)(如自然語音處理、生物特征識別等)。這些細分技術(shù)在社會生產(chǎn)、生活各方面均得到較為成熟的應用[7],同時以ChatGPT為代表的智能產(chǎn)品將人工智能技術(shù)帶到了新的高度。因此,將人工智能技術(shù)應用到科技檔案工作當中,勢必能夠滿足科技檔案高質(zhì)量管理、精準服務等方面的要求,破解目前科技檔案部門工作中存在的各類資源相對不足的難題。
二、人工智能在科技檔案領(lǐng)域的應用場景分析
科技檔案作為檔案資源的一個重要類型,其全生命周期包括“收管存用”四個環(huán)節(jié)。
(一)智能化采集
在大數(shù)據(jù)時代,科技檔案具有種類多樣、形式多元、來源多渠道等特征。因此,在進行檔案資料采集時,一方面需要借助智能終端設備在線爬取互聯(lián)網(wǎng)信息資源等作為元數(shù)據(jù),并通過自然語言處理技術(shù)將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),實現(xiàn)原始檔案素材的采集;另一方面,利用人工智能技術(shù)可以將科技檔案中對專家學者進行采訪獲得的口述史等原始音頻和視頻素材轉(zhuǎn)錄為文字資料。
(二)智能化管理
1.檔案智能分類
利用自然語言處理技術(shù)和自監(jiān)督學習技術(shù)訓練出人工智能文本分類器模型,對科技檔案文本進行面向特定服務的語義級檔案分類,如:從研究領(lǐng)域、成果形式、項目單位等維度對科技檔案進行分類。同時,利用文字識別技術(shù)對科技檔案內(nèi)容進行智能分類,輔助開展科技檔案分類體系建設。
2.檔案開放鑒定
將《文書檔案保管期限表》《科學技術(shù)研究檔案管理規(guī)定》等作為人工智能模型訓練的微調(diào)知識,進行下游任務訓練,使人工智能模型具備科技管理和檔案管理等相關(guān)知識,能夠?qū)崿F(xiàn)專家系統(tǒng)的功能,模擬人類專家對檔案開放共享策略作出決策,為科技檔案有效開放利用提供工具支撐和技術(shù)保障。
3.檔案修復及安全管理
利用人工智能技術(shù)修復文字檔案中的文字壞損、音頻或視頻檔案中的信息失幀等,提升科技檔案的完整性。同時,將生物特征識別、模式識別等技術(shù)嵌入檔案門禁管理系統(tǒng)、識別跟蹤系統(tǒng)以及防火墻等產(chǎn)品中,實現(xiàn)檔案訪問權(quán)限控制、安全預警、風險監(jiān)控等,提升科技檔案的使用安全性。
(三)智能化保存
將人工智能技術(shù)運用在科技檔案保存環(huán)節(jié)是將人工智能模型與檔案數(shù)字化系統(tǒng)進行系統(tǒng)集成和功能融合,實現(xiàn)對科技活動中形成的項目申報書、研究報告、研究方案等科研過程文檔進行電子化保存和自動化歸檔。一方面,可以利用人工智能提升檔案數(shù)字化系統(tǒng)功能,使其能夠?qū)萍紮n案進行自動化保存,實現(xiàn)檔案電子化即歸檔的功能。另一方面,可以將人工智能模型融入檔案數(shù)字化管理系統(tǒng),對管理系統(tǒng)中錄入的檔案信息進行智能化處理,將離散的系統(tǒng)信息整合為可直接歸檔的科技檔案文件。
(四)智能化利用
1.檔案智能化檢索
利用人工智能中的自然語言處理技術(shù)訓練科技檔案語料庫,使人工智能模型具備針對特定主題或研究領(lǐng)域的智能檢索能力,同時結(jié)合人工智能技術(shù)實現(xiàn)智能化檢索主題檔案、智能化存取檔案操作以及智能化檔案歸檔等,減輕一線工作人員的勞動強度。
2.檔案知識服務
通過自然語言處理技術(shù)實現(xiàn)語義級的檔案內(nèi)容提取,實現(xiàn)面向特定應用場景或用戶需求的檔案內(nèi)容服務。如:針對同一科研項目檔案,既可以對項目研究領(lǐng)域進行分析,形成該領(lǐng)域的研究案例,還可以對項目成果轉(zhuǎn)化情況進行概述歸納,形成研究成果展示素材。同時,通過從語義級提取科技檔案信息、獲取科技檔案內(nèi)容,利用內(nèi)容標注與分類技術(shù),將科技檔案進行多維度劃分,實現(xiàn)對同一檔案資源的多場景復用。
3.科技主題宣傳
利用“人工智能多模態(tài)大模型+數(shù)字檔案館”提取科技檔案中的文字內(nèi)容信息,利用文生圖、文生視頻技術(shù)生成圖片或視頻等多媒體資料并通過音頻和視頻的方式進行同步展現(xiàn),利用新媒體對外發(fā)布,實現(xiàn)對科技創(chuàng)新活動及其成果的推廣宣傳。
三、人工智能在科技檔案管理中的應用策略
(一)夯實數(shù)字化檔案資源基礎(chǔ)
推進科技檔案資源增量數(shù)字化和存量電子化,將科技檔案中包含的文字、圖片等轉(zhuǎn)化為計算機可讀、可用的格式,并作為人工智能模型訓練的先驗知識,訓練出科技檔案管理垂直領(lǐng)域模型,提升模型對科技檔案資源管理及開發(fā)利用的適用性。此外,對現(xiàn)有檔案管理信息系統(tǒng)進行改造,將人工智能模型嵌入現(xiàn)有系統(tǒng),實現(xiàn)檔案管理的智能化與自動化。
(二)注重檔案資源利用安全性
部分科技檔案會涉及對國家科技安全具有重要影響的項目信息,而人工智能的“黑盒”特性使其輸出結(jié)果不可解釋、運行過程不安全。因此,注重人工智能產(chǎn)品訓練過程中的數(shù)據(jù)安全,篩選已在行業(yè)主管部門登記備案的人工智能產(chǎn)品進行模型訓練,確保訓練過程不發(fā)生數(shù)據(jù)泄露;同時,加強人工智能使用過程中的數(shù)據(jù)安全制度設計,形成涵蓋檔案電子化與數(shù)字化、檔案信息提取、檔案信息資源輸入、人工智能產(chǎn)品輸出等全鏈條的數(shù)據(jù)安全制度。
(三)編制科技檔案領(lǐng)域人工智能應用指南
編制科技檔案領(lǐng)域人工智能應用指南,提升利用人工智能技術(shù)的規(guī)范性和應用效能。一方面,促進人工智能與檔案管理學融合,對人工智能應用于科技檔案來源、全宗原則、文件生命周期,以及電子檔案四性保障、元數(shù)據(jù)管理等場景進行梳理,實現(xiàn)檔案管理原則、方法與人工智能技術(shù)的有機融合;另一方面,引導人工智能模型集成至科技檔案管理系統(tǒng)框架,使其支撐數(shù)字化檔案全生命周期、全流程、全要素的管理與服務,發(fā)揮人工智能對科技檔案資源開發(fā)利用的引領(lǐng)作用,更好服務科技創(chuàng)新。
四、結(jié)語
科技檔案具有完整性、綜合性、動態(tài)性等特點,將人工智能應用在科技檔案管理工作的“收管存用”四個環(huán)節(jié),通過網(wǎng)絡信息爬取、信息轉(zhuǎn)錄、檔案分類、開放鑒定、檔案修復與安全管理、檔案知識服務、智能檢索等,可充分提升科技檔案利用效能,但在此過程中,也要注意夯實數(shù)字化檔案資源基礎(chǔ)、注重檔案資源利用安全、編制應用指南等,以更好發(fā)揮人工智能技術(shù)在檔案管理中的作用。
參考文獻:
[1] 張文馨,張笑星,田議方.我國人工智能在檔案領(lǐng)域的應用研究綜述[J].蘭臺內(nèi)外,2021 (15):12-15.
[2] 郝莎.科技檔案編研探析[J].蘭臺世界,2017(18):60-63.
[3] 贠疆鵬,加小雙,王妍.人工智能在我國檔案管理中的應用現(xiàn)狀與對策分析[J].檔案與建設,2023(2):62-65.
[4] 沙洲.人工智能在檔案工作中的應用研究[J].檔案與建設,2018(2):36-39.
[5] 林凱,鄭慧. 國外人工智能在檔案工作中的應用研究及啟示[J].山西檔案,2020(1):104-111.
[6] 孫琳,陳著,劉謹銘.人工智能技術(shù)在城建檔案管理中的可能應用場景及推進策略[J].檔案與建設,2023(7):68-70.
[7] 劉麗,王兆偉,張明智.生成式人工智能對檔案工作的影響[J].浙江檔案,2023(9):47-50.
基金項目:天津市科技計劃智庫項目“天津市應用基礎(chǔ)研究項目‘首席制’組織管理模式研究”(21ZLZKZF00500)
作者單位:天津市科學技術(shù)發(fā)展戰(zhàn)略研究院 天津工業(yè)大學后勤管理處