• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      人工智能技術(shù)賦能我國檔案工作發(fā)展的現(xiàn)狀與建議

      2024-09-20 00:00:00潘未梅韓禹榮劉楊董星儀馬林青
      檔案與建設(shè) 2024年7期

      摘 要:為了解當(dāng)前我國檔案領(lǐng)域人工智能技術(shù)應(yīng)用的發(fā)展現(xiàn)狀,論文運(yùn)用內(nèi)容分析法對(duì)全國及各省檔案事業(yè)“十四五”規(guī)劃、檔案領(lǐng)域人工智能應(yīng)用實(shí)踐案例及國家檔案局科技項(xiàng)目立項(xiàng)進(jìn)行分析。研究發(fā)現(xiàn)我國鼓勵(lì)并支持人工智能技術(shù)在檔案領(lǐng)域的應(yīng)用,正在初步探索人工智能助推檔案工作的路徑和方法。在此基礎(chǔ)上,論文從三個(gè)方面提出建議,分別是:推動(dòng)人工智能技術(shù)在檔案全流程管理中的應(yīng)用,推動(dòng)人工智能技術(shù)與檔案工作的深度融合,以及關(guān)注人工智能技術(shù)成功應(yīng)用于檔案工作的影響因素。

      關(guān)鍵詞:人工智能;檔案管理;科技項(xiàng)目;融合;合作

      分類號(hào):TP18;G270.7

      Research on the Current Situation of and Suggestions for Artificial Intelligence Empowering Archival Undertakings in China

      Pan Weimei1, Han Yurong1, Liu Yang1, Dong Xingyi1, Ma Linqing2,3,4,5

      (1.School of Management, Tianjin Normal University, Tianjin 300387; 2. School of Information Resource Management, Renmin University of China, Beijing 100872; 3. Center for Digital Records Management Research, Renmin University of China, Beijing 100872; 4. Center for Archival Undertakings, Renmin University of China, Beijing 100872; 5. Research Institute of Digital Humanities, Renmin University of China, Beijing 100872)

      Abstract: To understand the current status of the application of AI in Chinese archival field, this study performed content analysis on the 14th Five-year Plan for the development of archival undertakings in national and provincial level, cases of application of artificial intelligence in Chinese archival field, and science and technology projects of the National Archives Administration. It was found that China encourages and supports the application of AI in the archival field, and is currently in the stage of preliminary exploration. Based on the research findings, this paper concludes by putting forward suggestions from three dimensions: promoting the application of AI in the whole process of archival management, promoting the deep integration of AI and archival undertakings, and paying attention to the influencing factors of the successful application of AI in archival undertakings.

      Keywords: Artificial Intelligence; Archives Management; Technology Projects; Fusion; Cooperation

      隨著數(shù)智轉(zhuǎn)型的持續(xù)推進(jìn),檔案工作面臨著數(shù)據(jù)體量大、非結(jié)構(gòu)化程度高、信息過載、利用不充分、管理方式傳統(tǒng)和方法效率低等問題,亟須轉(zhuǎn)變檔案工作理念、流程和方法,實(shí)現(xiàn)檔案工作的“系統(tǒng)重塑”。新一代人工智能(Artificial Intelligence,AI)是一種具有智能學(xué)習(xí)和自主決策能力的顛覆性技術(shù),能夠運(yùn)用數(shù)據(jù)和計(jì)算能力優(yōu)勢(shì),提煉出默會(huì)知識(shí),進(jìn)而識(shí)別模式并實(shí)現(xiàn)更為復(fù)雜的功能。作為一種通用型技術(shù),新一代人工智能具備與經(jīng)濟(jì)社會(huì)各行業(yè)、生產(chǎn)生活各環(huán)節(jié)相互融合的潛能[1],可以對(duì)大量檔案數(shù)據(jù)進(jìn)行處理并識(shí)別潛在模式,進(jìn)而輔助其實(shí)現(xiàn)自動(dòng)化與智能化管理升級(jí)。

      當(dāng)前,國內(nèi)外對(duì)AI應(yīng)用于檔案工作的現(xiàn)狀展開了多維度研究,如從AI應(yīng)用的檔案場(chǎng)景、主要業(yè)務(wù)環(huán)節(jié)及主要技術(shù)等維度對(duì)多案例進(jìn)行梳理[2-5],對(duì)AI應(yīng)用于特定檔案業(yè)務(wù)環(huán)節(jié)實(shí)踐的介紹[6-9]。此外,學(xué)界還關(guān)注AI在檔案管理中的應(yīng)用邏輯、前景、挑戰(zhàn)與實(shí)現(xiàn)路徑等。然而,學(xué)界已有研究主要是針對(duì)特定業(yè)務(wù)環(huán)節(jié)、特定問題或個(gè)別案例,以整體視角對(duì)我國檔案領(lǐng)域AI應(yīng)用的全面調(diào)查研究較為有限。在此背景下,有必要就我國檔案領(lǐng)域人工智能應(yīng)用的現(xiàn)狀從政策、行業(yè)實(shí)踐案例和行業(yè)研究三個(gè)角度進(jìn)行全面調(diào)查和分析,在此基礎(chǔ)上識(shí)別存在的問題和挑戰(zhàn),預(yù)測(cè)未來的發(fā)展趨勢(shì),并對(duì)其今后發(fā)展提出針對(duì)性的建議。

      1 數(shù)據(jù)收集及分析方法

      本研究從政策導(dǎo)向、實(shí)踐現(xiàn)狀以及行業(yè)研究熱點(diǎn)三個(gè)維度展開。

      首先,為深入了解和把握我國檔案領(lǐng)域人工智能技術(shù)應(yīng)用的政策導(dǎo)向,本研究對(duì)我國國家檔案局官網(wǎng)、各省檔案館官網(wǎng)、北大法寶以及各省政府信息公開網(wǎng)站等進(jìn)行檢索,截至2024年2月1日,發(fā)現(xiàn)我國國家與地方層面尚未頒布針對(duì)檔案領(lǐng)域人工智能應(yīng)用的專門政策,僅有政策為全國和省級(jí)“十四五”檔案事業(yè)發(fā)展規(guī)劃中的人工智能相關(guān)內(nèi)容。本研究將以全國及27個(gè)省級(jí)的“十四五”檔案事業(yè)發(fā)展規(guī)劃(缺少河南、寧夏、青海、四川及港澳臺(tái)地區(qū))為數(shù)據(jù)基礎(chǔ)。

      其次,為了解我國檔案領(lǐng)域人工智能應(yīng)用的實(shí)踐情況,本研究從國家檔案局組織的全國企業(yè)檔案工作管理創(chuàng)新優(yōu)秀案例匯編(2017—2020,4年)與相關(guān)文獻(xiàn)(截至2024年2月7日)中,選擇出相關(guān)信息較豐富的37個(gè)案例作為本研究的數(shù)據(jù)源,案例時(shí)間跨度從2017年到2023年。案例分析采用內(nèi)容分析法,在通讀案例、結(jié)合已有研究提煉關(guān)鍵信息并制定編碼表后,對(duì)每個(gè)案例進(jìn)行編碼,并對(duì)編碼結(jié)果進(jìn)行統(tǒng)計(jì)。編碼表包括案例單位性質(zhì)及合作情況、實(shí)踐單位所應(yīng)用人工智能技術(shù)、應(yīng)用的業(yè)務(wù)場(chǎng)景、檔案類型、人機(jī)協(xié)同等方面。受數(shù)據(jù)所限,對(duì)人工智能應(yīng)用開發(fā)過程、應(yīng)用算法、應(yīng)用效果等內(nèi)容本研究未有發(fā)現(xiàn)。

      最后,為把握我國檔案領(lǐng)域人工智能應(yīng)用的行業(yè)研究熱點(diǎn),本研究以2017年到2024年立項(xiàng)的共903項(xiàng)國家檔案局科技項(xiàng)目為數(shù)據(jù)源[10],選取其中與人工智能相關(guān)的科研立項(xiàng)進(jìn)行分析。篩選的標(biāo)準(zhǔn)為項(xiàng)目名稱中明確包括“人工智能”“智能”“AI”等術(shù)語或某種具體的人工智能技術(shù),如“NLP”“大語言模型”“計(jì)算機(jī)視覺”“深度學(xué)習(xí)”“數(shù)據(jù)挖掘”“圖像識(shí)別”“語義網(wǎng)”“知識(shí)圖譜”等,最終獲得相關(guān)項(xiàng)目136項(xiàng)。但由于立項(xiàng)項(xiàng)目可獲得信息較少,相關(guān)分析僅針對(duì)項(xiàng)目名稱、承擔(dān)單位以及推薦單位展開。

      2 研究結(jié)果

      2.1 我國檔案領(lǐng)域人工智能應(yīng)用政策導(dǎo)向

      《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》明確提出,到2025年,新一代信息技術(shù)在檔案工作中的應(yīng)用更為廣泛,信息化與檔案事業(yè)各項(xiàng)工作深度融合,檔案管理數(shù)字化、智能化水平得到提升,檔案工作基本實(shí)現(xiàn)數(shù)字轉(zhuǎn)型。在具體任務(wù)方面,“十四五”規(guī)劃分別在檔案利用與檔案信息化建設(shè)兩個(gè)環(huán)節(jié)明確指出探索人工智能技術(shù)。

      在省級(jí)“十四五”檔案事業(yè)發(fā)展規(guī)劃層面,所調(diào)研27份規(guī)劃中,8份未提及“人工智能”,其他19份分別在數(shù)字檔案館建設(shè)(13)、檔案信息深層加工和利用(5)、檔案開放審核(3)、檔案行政監(jiān)管(1)等工作領(lǐng)域的內(nèi)容中提及應(yīng)用“人工智能”,且在具體表述上呈現(xiàn)一定的趨同性。如針對(duì)“數(shù)字檔案館建設(shè)”的表述多為“加強(qiáng)大數(shù)據(jù)、人工智能等新一代信息技術(shù)在數(shù)字檔案館(室)建設(shè)中的應(yīng)用”;針對(duì)“檔案信息深層加工和利用”的表述多為“積極探索知識(shí)管理、人工智能、數(shù)字人文等技術(shù)在檔案信息深層加工和利用中的應(yīng)用”。另外,10份省級(jí)規(guī)劃均倡導(dǎo)探索人工智能等新一代信息技術(shù)在檔案全鏈路管理中的應(yīng)用研究,形成一批標(biāo)志性成果,運(yùn)用信息技術(shù)解決檔案工作中的堵點(diǎn)和難點(diǎn)問題。

      2.2 我國檔案領(lǐng)域人工智能技術(shù)應(yīng)用案例分析

      (1)案例單位性質(zhì)及合作情況

      37個(gè)案例單位覆蓋了企業(yè)、國家機(jī)關(guān)、高校和事業(yè)單位等不同性質(zhì)的機(jī)構(gòu)。其中,檔案館/局/研究中心等事業(yè)單位有14個(gè),企業(yè)17個(gè)(包括國有企業(yè)8個(gè)、中央企業(yè)及其子公司5個(gè)、民營企業(yè)4個(gè)),機(jī)關(guān)單位和高校開展的案例分別有2個(gè)和3個(gè)。

      近一半的案例(40.54%)由多元主體合作完成。合作的形式主要有兩種:其一為合作單位共同研發(fā)建設(shè)相關(guān)平臺(tái)或軟件;其二為雙方分別提供數(shù)據(jù)和技術(shù)。另外,73.33%的參與主體包含檔案服務(wù)機(jī)構(gòu)或者信息科技公司,20%包含高等院校。

      (2)檔案類型及前處理工作

      人工智能技術(shù)主要應(yīng)用于案例實(shí)踐單位內(nèi)部檔案管理。37個(gè)案例中,17個(gè)案例明確了人工智能技術(shù)所應(yīng)用的檔案/數(shù)據(jù)基礎(chǔ),涉及會(huì)計(jì)檔案、滿文檔案、聲像檔案、戶籍檔案、政務(wù)服務(wù)電子文件等不同載體、不同語種和不同內(nèi)容性質(zhì)的檔案。

      另外,應(yīng)用人工智能技術(shù),還需要進(jìn)行一些前期準(zhǔn)備工作,包括檔案數(shù)字化、確定人工智能自動(dòng)化的標(biāo)準(zhǔn)以及篩選算法訓(xùn)練所需的數(shù)據(jù)樣本等。例如,遼寧省檔案館在應(yīng)用AI技術(shù)實(shí)現(xiàn)檔案安全保密時(shí)首先選取了部分涉密檔案作為訓(xùn)練樣本,其中80%樣本作為訓(xùn)練數(shù)據(jù)集供模型學(xué)習(xí),20%樣本進(jìn)行算法驗(yàn)證。再如,中國移動(dòng)通信集團(tuán)江蘇有限公司在應(yīng)用人工智能技術(shù)開展保管期限判定時(shí),以“國家檔案局第10號(hào)令”為基礎(chǔ),通過對(duì)室存的檔案數(shù)據(jù)源進(jìn)行分析,形成人工智能模型。

      (3)所使用人工智能技術(shù)及其所應(yīng)用業(yè)務(wù)場(chǎng)景

      37個(gè)案例使用了多種人工智能技術(shù),包括但不限于計(jì)算機(jī)視覺(人臉識(shí)別、OCR識(shí)別、圖像識(shí)別、自動(dòng)圖像處理、內(nèi)容識(shí)別、字符識(shí)別)(17)、深度學(xué)習(xí)(BP神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、生成式對(duì)抗網(wǎng)絡(luò))(12)、自然語言處理(自然語義、語義解析、語義識(shí)別、信息抽?。?2)、語音處理(語音識(shí)別、語音轉(zhuǎn)寫)(5)、知識(shí)圖譜(5)、機(jī)器學(xué)習(xí)(支持向量機(jī)SVM)(3)、自動(dòng)化和機(jī)器人技術(shù)(“小鐵人”機(jī)器人)(1)、專家系統(tǒng)(1)等。[11]

      人工智能技術(shù)所應(yīng)用的業(yè)務(wù)場(chǎng)景基本囊括了檔案管理的全部環(huán)節(jié):收集(2)、整理(包括分類)(4)、歸檔(1)、修復(fù)(2)、著錄(3)、鑒定(包括確定保管期限、開放審核、保密)(9)、數(shù)字化(包括數(shù)據(jù)化、成果質(zhì)檢)(6)、檢索(9)、開發(fā)利用(包括編研、文化傳播、信息共享)(9)、檔案服務(wù)(包括查檔)(3)、檔案安全(包括門禁系統(tǒng)、元數(shù)據(jù)采集、四性檢測(cè))(4)。[12]

      檔案的數(shù)字化、鑒定、檢索和開發(fā)利用環(huán)節(jié)是目前人工智能技術(shù)應(yīng)用的主要環(huán)節(jié)。不同業(yè)務(wù)場(chǎng)景所應(yīng)用的AI技術(shù)在整體上是一致的,在具體技術(shù)的實(shí)現(xiàn)上有細(xì)微差別。計(jì)算機(jī)視覺是覆蓋應(yīng)用場(chǎng)景最多的技術(shù)。所分析案例中,檔案的收集多表現(xiàn)為口述檔案的采集,故語音處理技術(shù)和音視頻轉(zhuǎn)寫技術(shù)是主要應(yīng)用的技術(shù)。鑒定環(huán)節(jié)多應(yīng)用自然語言處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)與計(jì)算機(jī)視覺技術(shù);檢索環(huán)節(jié)較多應(yīng)用自然語言處理、語音處理、視頻內(nèi)容解析、知識(shí)圖譜與計(jì)算機(jī)視覺等技術(shù);開發(fā)利用環(huán)節(jié)由于涉及多種檔案開發(fā)形式,其所應(yīng)用技術(shù)范圍也相應(yīng)較廣泛,包括自動(dòng)化和機(jī)器人技術(shù)、自然語言處理、知識(shí)圖譜、知識(shí)挖掘以及機(jī)器學(xué)習(xí)等多種技術(shù)。人臉識(shí)別等身份識(shí)別技術(shù)(屬于計(jì)算機(jī)視覺領(lǐng)域)多用來保證檔案的實(shí)體安全。

      (4)人工智能技術(shù)應(yīng)用與實(shí)現(xiàn)方式

      人工智能技術(shù)的具體使用可以分為三個(gè)層次:其一,使用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)文本、圖像的識(shí)別、對(duì)比、匹配等;其二,使用自然語言處理技術(shù)對(duì)檔案內(nèi)容中的實(shí)體、關(guān)系、情感等進(jìn)行識(shí)別,輔助檔案檢索等;其三,綜合使用多種技術(shù),如自然語言處理、機(jī)器學(xué)習(xí)、支持向量機(jī)等,基于對(duì)檔案屬性的判斷以及與相關(guān)屬性的匹配,實(shí)現(xiàn)特定任務(wù)的自動(dòng)化,如價(jià)值鑒定、密級(jí)鑒定等。

      29個(gè)案例對(duì)人工智能技術(shù)的實(shí)現(xiàn)方式進(jìn)行了闡述,具體包括以下三種形式:其一,作為功能專一的獨(dú)立系統(tǒng),如人工智能輔助檔案開放審核系統(tǒng)、檔案智能劃控系統(tǒng)等,能夠針對(duì)性處理檔案開放審核和劃控問題。這也是人工智能技術(shù)在檔案領(lǐng)域數(shù)量最多的應(yīng)用形式。其二,作為多功能平臺(tái)的一個(gè)構(gòu)成部分,例如瀘州老窖智慧檔案館的智慧一體化支撐保障平臺(tái)集成了5大系統(tǒng),12個(gè)子系統(tǒng),能夠?qū)崿F(xiàn)檔案檢索、檔案保管期限自動(dòng)鑒定與元數(shù)據(jù)自動(dòng)采集等多項(xiàng)功能。其三,作為某一系統(tǒng)的一個(gè)工具或組件,例如“檔案AI輔助開放審核”組件和檔案圖文智能定位與精細(xì)化檢索工具等。

      (5)檔案工作者與人工智能技術(shù)的關(guān)系形式

      37個(gè)案例中,有13個(gè)案例對(duì)人工智能技術(shù)開發(fā)或應(yīng)用過程中與檔案工作者之間的關(guān)系進(jìn)行了闡述,可以歸納為兩種模式:其一,檔案工作者輔助算法的完善。人與機(jī)器須同步完成某一工作,檔案工作者對(duì)結(jié)果不一致的地方進(jìn)行修正與反饋,促進(jìn)機(jī)器工作規(guī)則學(xué)習(xí)與改進(jìn)。比如中國移動(dòng)通信集團(tuán)在檔案保管期限鑒定環(huán)節(jié),采取“機(jī)器判定+人工判定”相結(jié)合的方式,通過人工的復(fù)核判定、機(jī)器的自我學(xué)習(xí),來實(shí)現(xiàn)模型的動(dòng)態(tài)更新和完善,以滿足實(shí)際需要。其二,算法生成結(jié)果為檔案工作者的決策提供參考,輔助決策。比如遼寧省檔案館的智能篩密系統(tǒng)將智能鑒定功能嵌入數(shù)字檔案館系統(tǒng)的鑒定模塊內(nèi),通過檔案目錄中的敏感詞進(jìn)行智能分析,給出AI預(yù)測(cè)值和敏感度,作為人工鑒定的參考。

      2.3 我國檔案領(lǐng)域人工智能應(yīng)用行業(yè)研究熱點(diǎn)

      總體上看,國家檔案局科技項(xiàng)目中與人工智能相關(guān)的立項(xiàng)數(shù)量及在每年立項(xiàng)項(xiàng)目中所占比例呈上升趨勢(shì);2017年所占比例為3.3%,2018—2022年所占比例在12%左右,2023年所占比例上升至22.3%,到2024年達(dá)29.63%,見圖1。

      對(duì)136項(xiàng)項(xiàng)目承擔(dān)單位類型出現(xiàn)的頻次進(jìn)行統(tǒng)計(jì)發(fā)現(xiàn),項(xiàng)目承擔(dān)單位以企業(yè)及其下屬檔案部門(85)頻次最高,其次分別是各級(jí)檔案局及其下設(shè)機(jī)構(gòu)、各級(jí)國家檔案館(73),高等院校及其檔案部門(40),其他事業(yè)單位及其下屬檔案部門(13),研究院所及其下屬檔案館(12),其他國家機(jī)關(guān)及其下屬檔案部門(6)。[13]

      對(duì)于相關(guān)立項(xiàng)項(xiàng)目所關(guān)注技術(shù),136項(xiàng)立項(xiàng)項(xiàng)目中,42項(xiàng)是針對(duì)廣泛意義上的人工智能技術(shù),65項(xiàng)在項(xiàng)目名稱中明確了具體的人工智能技術(shù),包括知識(shí)圖譜(17)、自然語言處理(8)、深度學(xué)習(xí)(18)、數(shù)據(jù)挖掘(5)、圖像識(shí)別(6)及語義分析(5)等,29項(xiàng)僅提到了“智能”。

      具體到人工智能技術(shù)應(yīng)用的業(yè)務(wù)環(huán)節(jié),檔案開發(fā)利用(28)及檔案管理整體(22)中應(yīng)用的項(xiàng)目數(shù)量排在前兩位,檔案開放審核(9)與檔案修復(fù)(7)次之,其他業(yè)務(wù)還包括檔案分類(3)、檔案脫敏(1)、檔案檢索(4)及檔案驗(yàn)收(1)。

      對(duì)于人工智能技術(shù)應(yīng)用的檔案類型,71項(xiàng)項(xiàng)目明確了檔案類型,涵蓋聲像檔案(包括音視頻檔案、影像檔案、照片檔案等)(14)、多媒體檔案(包括全媒體檔案和媒資檔案)(4)、文書檔案(3)等多種載體形式,核電檔案(6)、電力檔案(3)、城建檔案(4)、醫(yī)療檔案(2)、軍工檔案(3)及氣象檔案(2)等不同行業(yè)領(lǐng)域共23種門類。

      3 討 論

      研究發(fā)現(xiàn),我國檔案領(lǐng)域中人工智能的政策導(dǎo)向、實(shí)踐現(xiàn)狀以及行業(yè)研究熱點(diǎn)三者之間存在一定的一致性,我國檔案領(lǐng)域?qū)?yīng)用人工智能技術(shù)正處于初級(jí)探索階段,在應(yīng)用單位類型、應(yīng)用業(yè)務(wù)環(huán)節(jié)、應(yīng)用形式等方面呈現(xiàn)初級(jí)探索階段的特征,未來相關(guān)探索將繼續(xù)深入,應(yīng)用質(zhì)量將會(huì)提高。

      3.1 我國檔案領(lǐng)域人工智能應(yīng)用政策導(dǎo)向

      《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》明確了繼續(xù)推進(jìn)新一代信息技術(shù)與檔案工作深度融合,以及其在提升檔案數(shù)智化轉(zhuǎn)型上的作用,但僅在檔案利用與檔案信息化建設(shè)上明確提到了人工智能技術(shù),政策引導(dǎo)缺乏系統(tǒng)性和全面性。大多數(shù)省份的檔案“十四五”規(guī)劃呼應(yīng)了全國規(guī)劃的內(nèi)容,明確鼓勵(lì)在特定任務(wù)中探索應(yīng)用人工智能技術(shù),此外一部分省份強(qiáng)調(diào)加強(qiáng)對(duì)人工智能技術(shù)的研究和在特定領(lǐng)域的先行探索,這也反映了人工智能技術(shù)在檔案領(lǐng)域的應(yīng)用尚處于探索階段。

      總的來說,我國檔案領(lǐng)域已關(guān)注且認(rèn)識(shí)到人工智能技術(shù)對(duì)于推動(dòng)檔案工作數(shù)智轉(zhuǎn)型的潛力。但從具體內(nèi)容上來看,目前主要突出其在檔案開發(fā)利用中的應(yīng)用,對(duì)于其對(duì)其他工作環(huán)節(jié)和領(lǐng)域的影響尚未提及,存在對(duì)應(yīng)用場(chǎng)景和影響認(rèn)識(shí)不夠深入全面的情況。

      3.2 我國檔案領(lǐng)域人工智能應(yīng)用實(shí)踐現(xiàn)狀

      針對(duì)實(shí)踐案例的分析顯示,目前我國檔案領(lǐng)域人工智能的應(yīng)用探索主要由國企與綜合檔案館開展。因?yàn)檫@些單位具備檔案工作基礎(chǔ)較好、檔案體量較大、對(duì)檔案工作要求高等特質(zhì),所以會(huì)嘗試探索新型信息技術(shù)在檔案管理中的應(yīng)用。而未來人工智能技術(shù)是否會(huì)在其他類型機(jī)構(gòu)的檔案工作中得到應(yīng)用、如何應(yīng)用等問題亟待持續(xù)關(guān)注。另外,案例分析發(fā)現(xiàn),人工智能應(yīng)用的開發(fā)往往需要多方協(xié)作,如信息技術(shù)公司與檔案部門的深度合作。這意味著檔案部門需要深度介入數(shù)據(jù)訓(xùn)練、方法設(shè)計(jì)、原則制定等工作,這也對(duì)檔案工作人員的能力提出了新要求。

      從人工智能應(yīng)用具體情況來看,我國檔案領(lǐng)域就多種人工智能技術(shù)在不同類型、不同載體的檔案管理的不同工作環(huán)節(jié)中的應(yīng)用展開了探索,但主要集中于鑒定、數(shù)字化和檢索,證明人工智能應(yīng)用仍處于探索階段,尚未全面展開。另外,需要說明的是,僅有部分案例在解決方案的闡述部分突出了人工智能技術(shù),其他僅將其作為所應(yīng)用多種技術(shù)中的一種進(jìn)行交代,對(duì)人工智能技術(shù)的重視程度不足。

      從人工智能技術(shù)的使用形式來看,目前的使用方式比較初級(jí),主要體現(xiàn)在:其一,計(jì)算機(jī)視覺技術(shù)的使用居多,主要用于對(duì)檔案內(nèi)容的識(shí)別,即尚停留在“會(huì)看”“會(huì)聽”的階段;其二,有少部分案例開始綜合使用自然語言處理、支持向量機(jī)等多種技術(shù),即“會(huì)學(xué)習(xí)”的階段,但對(duì)于所學(xué)習(xí)的標(biāo)準(zhǔn)、學(xué)習(xí)的過程、學(xué)習(xí)的結(jié)果等交代較少。人工智能技術(shù)的應(yīng)用往往需要相關(guān)管理工作的同步開展,比如厘清人工智能技術(shù)所應(yīng)用自動(dòng)化的標(biāo)準(zhǔn),實(shí)施檔案的數(shù)字化工作等,人工智能技術(shù)的深度應(yīng)用任重而道遠(yuǎn)。

      另外,我國檔案領(lǐng)域在這些實(shí)踐探索中就一些關(guān)鍵問題形成了基本認(rèn)識(shí),比如檔案工作者與人工智能應(yīng)用關(guān)系的處理、人工智能技術(shù)成功應(yīng)用的基礎(chǔ)、人工智能技術(shù)實(shí)現(xiàn)的形式等,但實(shí)踐數(shù)量和人工智能應(yīng)用的質(zhì)量有待提高。

      3.3 我國檔案領(lǐng)域人工智能應(yīng)用行業(yè)研究熱點(diǎn)

      行業(yè)研究熱點(diǎn)可以一定程度上預(yù)測(cè)未來數(shù)年我國檔案領(lǐng)域人工智能應(yīng)用的發(fā)展情況。根據(jù)國家檔案局科技項(xiàng)目立項(xiàng)情況,人工智能相關(guān)立項(xiàng)項(xiàng)目數(shù)量及在當(dāng)年立項(xiàng)項(xiàng)目中所占比例均逐年上升,顯示了我國檔案學(xué)領(lǐng)域?qū)ζ潢P(guān)注度的提高。從立項(xiàng)單位的情況來看,企業(yè)與綜合檔案館占比較高,仍然是人工智能應(yīng)用探索的主要部門。從所關(guān)注業(yè)務(wù)環(huán)節(jié)、人工智能技術(shù)及檔案類型來看,目前相關(guān)探索覆蓋的領(lǐng)域較廣泛,但也存在對(duì)檔案開發(fā)利用扎堆關(guān)注、對(duì)其他環(huán)節(jié)關(guān)注不足的問題。這些意味著未來數(shù)年我國檔案領(lǐng)域人工智能應(yīng)用的探索仍然會(huì)保持當(dāng)前的特征,但會(huì)突出人工智能技術(shù)本身的技術(shù)特點(diǎn),在探索的數(shù)量與深度上有所提升。

      4 人工智能技術(shù)賦能我國檔案工作智能化發(fā)展建議

      本研究認(rèn)為,人工智能技術(shù)在我國檔案領(lǐng)域的應(yīng)用已經(jīng)取得一些初步成果,并預(yù)測(cè)其在未來數(shù)年將進(jìn)入快速發(fā)展階段。為充分釋放人工智能技術(shù)在我國檔案工作領(lǐng)域的驅(qū)動(dòng)力量,推動(dòng)檔案工作智能化轉(zhuǎn)型升級(jí),應(yīng)關(guān)注以下幾個(gè)方面的問題。

      4.1 推動(dòng)人工智能技術(shù)在檔案全流程管理中的應(yīng)用

      為發(fā)揮人工智能技術(shù)對(duì)我國檔案工作智能化轉(zhuǎn)型升級(jí)的驅(qū)動(dòng)作用,有必要系統(tǒng)研究和推動(dòng)人工智能技術(shù)在檔案管理各環(huán)節(jié)的應(yīng)用。具體而言,應(yīng)結(jié)合人工智能技術(shù)的特點(diǎn),基于相關(guān)理論和原則(如封閉性原則)[14],在充分調(diào)研我國檔案工作的堵點(diǎn)、難點(diǎn)和充分考慮檔案工作者訴求基礎(chǔ)上,形成人工智能賦能我國檔案工作的具體環(huán)節(jié)清單。

      國際檔案學(xué)領(lǐng)域已開展相關(guān)研究,如大型跨國跨學(xué)科研究項(xiàng)目InterPARES(始于1998年)的第五期I(nterPARES)Trust AI的子課題RP01使用問卷調(diào)查法與訪談法,對(duì)檔案工作中重復(fù)性的、費(fèi)時(shí)的、適用于使用人工智能技術(shù)來應(yīng)對(duì)的工作環(huán)節(jié)進(jìn)行了調(diào)研,發(fā)現(xiàn)元數(shù)據(jù)的增添與抽取、數(shù)字化、捕獲、文件完整性審查、著錄、文件管理、鑒定、備份和文件重命名等頻率較高。

      4.2 推動(dòng)人工智能技術(shù)與檔案工作的深度融合

      除了人工智能應(yīng)用于檔案工作的廣度,其與各個(gè)環(huán)節(jié)結(jié)合的深度也將影響其賦能檔案工作的效果。

      首先,應(yīng)繼續(xù)深入探索不同類型人工智能技術(shù)在檔案工作中的應(yīng)用,并就不同人工智能技術(shù)對(duì)同一業(yè)務(wù)環(huán)節(jié)賦能路徑和效果開展對(duì)比試驗(yàn)研究。相較于我國,國際檔案領(lǐng)域?qū)λ褂萌斯ぶ悄芗夹g(shù)研究更深入,聚焦具體算法,如自組織地圖、命名實(shí)體識(shí)別、主題建模等。比如,Payne與Baron[15]Franks[16]分gfjllpRPH9QQzhCOP+hBfPPhk9UD5cUCd0yarczSY04=別就機(jī)器學(xué)習(xí)中的多種算法(如基于規(guī)則的分類、模糊關(guān)聯(lián)、向量空間方法、相似度/臨近算法、基于樹的方法與神經(jīng)網(wǎng)絡(luò)模型等)與支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)以及語言模型三種技術(shù)路徑用于檔案分類的適用性進(jìn)行了討論或試驗(yàn)。

      其次,應(yīng)關(guān)注檔案工作與數(shù)據(jù)本身應(yīng)做何種調(diào)整以適應(yīng)人工智能技術(shù)的應(yīng)用。比如,I Trust AI的子課題MA08,其對(duì)按照檔案領(lǐng)域標(biāo)準(zhǔn)記錄的元數(shù)據(jù)和機(jī)器學(xué)習(xí)社區(qū)的信息需求之間的匹配程度(包括差異、相似之處、改善兼容性的機(jī)會(huì)以及注意事項(xiàng)等)進(jìn)行了探索,并探討了檔案和機(jī)器學(xué)習(xí)社區(qū)之間存在的認(rèn)識(shí)論或本體論差異。

      再次,應(yīng)厘清檔案工作的原則與方法,并探索檔案學(xué)理論與方法在人工智能技術(shù)應(yīng)用中的價(jià)值。早在20世紀(jì)60年代,檔案學(xué)者就提出要警惕在開發(fā)AI應(yīng)用時(shí)將其他領(lǐng)域的標(biāo)準(zhǔn)強(qiáng)加于檔案工作。[17]人工智能技術(shù)應(yīng)用于檔案工作應(yīng)是對(duì)檔案工作原則與方法的自動(dòng)化,其前提是檔案工作者能就檔案工作的原則與方法達(dá)成一致并闡釋清楚。此外,研究也表明在應(yīng)用人工智能技術(shù)時(shí)若能充分關(guān)照檔案學(xué)的方法將提升應(yīng)用的效果,比如使用文件關(guān)鍵背景信息(古文書學(xué)視域下的背景)對(duì)自動(dòng)分類器進(jìn)行訓(xùn)練,其分類結(jié)果優(yōu)于專家的人工分類。[18]

      最后,人工智能技術(shù)應(yīng)用于檔案工作過程中如何保障檔案的真實(shí)性仍是一個(gè)核心議題。檔案真實(shí)性的保障是檔案證據(jù)屬性保障的核心,是檔案學(xué)的學(xué)科之本。比如,I Trust AI項(xiàng)目的核心研究問題為:我們能否在利用AI技術(shù)承擔(dān)檔案管理職能的同時(shí)尊重文件的本質(zhì)屬性并確保其長(zhǎng)期可信?人工智能技術(shù)用于處理檔案是否會(huì)對(duì)檔案真實(shí)性帶來威脅?隨著人工智能技術(shù)在社會(huì)活動(dòng)開展過程中的滲透,文件的生成背景也將發(fā)生改變,而這又會(huì)對(duì)文件真實(shí)性的內(nèi)涵產(chǎn)生什么樣的影響?這些問題都亟待更多相關(guān)研究。

      4.3 關(guān)注人工智能技術(shù)成功應(yīng)用于檔案工作的影響因素

      內(nèi)外部的影響因素也將影響人工智能技術(shù)與檔案工作深度融合的程度,包括AI技術(shù)本身的風(fēng)險(xiǎn)以及檔案資源應(yīng)用人工智能技術(shù)的準(zhǔn)備度等。我國學(xué)者在不同研究中就制約AI在檔案工作中應(yīng)用的因素進(jìn)行了討論,如算法風(fēng)險(xiǎn)、AI素養(yǎng)、AI的效率、結(jié)果的準(zhǔn)確度、檔案開放程度、檔案資源可用性等[19-21]。楊建梁與劉越男[22]也指出機(jī)器學(xué)習(xí)在檔案管理中深化應(yīng)用面臨檔案管理、檔案數(shù)據(jù)、機(jī)器信任、法律環(huán)境與專業(yè)能力等方面的挑戰(zhàn)。

      此外,人工智能應(yīng)用本身的一些特征也將影響其在檔案領(lǐng)域的廣泛應(yīng)用。比如在對(duì)相關(guān)文獻(xiàn)及人工智能應(yīng)用調(diào)查的基礎(chǔ)上,Hutchinson等認(rèn)為人工智能應(yīng)用設(shè)計(jì)與功能開發(fā)過程中應(yīng)考慮以下因素:可用性、互操作性、靈活性、迭代性以及可配置[23]。

      因此,有必要結(jié)合人工智能驅(qū)動(dòng)檔案工作的潛力與限度,在中外檔案領(lǐng)域人工智能應(yīng)用現(xiàn)狀與典型模式基礎(chǔ)上[24],結(jié)合人工智能技術(shù)在檔案工作中應(yīng)用的幾個(gè)階段[25],系統(tǒng)發(fā)現(xiàn)影響人工智能在檔案領(lǐng)域應(yīng)用的影響因素及驅(qū)動(dòng)模式,并針對(duì)每種類型的影響因素開展針對(duì)性的研究。

      5 結(jié) 語

      參照技術(shù)與結(jié)構(gòu)的互動(dòng)關(guān)系框架,在結(jié)構(gòu)功能視角下,人工智能推動(dòng)檔案工作發(fā)展體現(xiàn)為一組“滲透—傳導(dǎo)—擴(kuò)散”的連貫機(jī)制,表現(xiàn)為“AI技術(shù)原始吸納—AI技術(shù)作用于檔案工作系統(tǒng)構(gòu)成要素—檔案工作自我重塑”的演進(jìn)邏輯。易言之,AI技術(shù)首先滲透成為檔案工作系統(tǒng)的一個(gè)組成部分,進(jìn)而影響檔案工作的技術(shù)基礎(chǔ)、內(nèi)外部環(huán)境和主體的觀念和行為;該滲透過程將帶來傳導(dǎo)效應(yīng),打破檔案工作系統(tǒng)原先的平衡,對(duì)檔案工作系統(tǒng)的各要素產(chǎn)生影響,進(jìn)而帶來檔案工作的轉(zhuǎn)型升級(jí)。依據(jù)本研究的發(fā)現(xiàn),目前我國檔案領(lǐng)域人工智能技術(shù)的應(yīng)用主要停留在“AI技術(shù)原始吸納”階段,并開始向“AI技術(shù)作用于檔案工作系統(tǒng)構(gòu)成要素”階段發(fā)展,在此過程中,應(yīng)結(jié)合相關(guān)影響因素推動(dòng)人工智能在我國檔案領(lǐng)域的“向上”“向善”發(fā)展。

      *本文系天津市高等學(xué)校人文社會(huì)科學(xué)研究項(xiàng)目“我國民事案例中電子文件可采性評(píng)定規(guī)則研究”(項(xiàng)目編號(hào):2019SK054)階段性研究成果。

      作者貢獻(xiàn)說明

      潘未梅:確定選題,確定內(nèi)容框架,指導(dǎo)及審核數(shù)據(jù)收集與分析,論文寫作修改并最終定稿;韓禹榮:參與數(shù)據(jù)收集與分析,論文寫作及修改工作;劉楊:參與數(shù)據(jù)收集與分析,論文寫作及修改工作;董星儀:參與數(shù)據(jù)收集與分析工作;馬林青:參與論文修改。

      注釋與參考文獻(xiàn)

      [1]郭朝先,方澳.人工智能促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展:機(jī)理、問題與對(duì)策[J].廣西社會(huì)科學(xué),2021(8):8-17.

      [2]陳慧,羅慧玉,張凱,等.AI賦能檔案:AI技術(shù)在檔案管理中的賦能模式探究[J].山西檔案,2020(4):76-83,131.

      [3]DURANTI L,ABDUL-MAGEED M,HOFMAN D,et al. I Trust AI,the latest InterPARES research project[J/OL].Anuario Escuela de Archivología,2021,13:36-55[2024-07-16]. https://revistas.unc. edu.ar/index.php/anuario/article/view/37898/37827.

      [4]COLAVIZZA G. BLANKE T. JEURGENS C. et al. Archives and AI:An overview of current debates and future perspectives[J]. ACM Journal on Computing and Cultural Heritage(JOCCH),2021,15(1):1-15.

      [5]贠疆鵬,加小雙,王妍. 人工智能在我國檔案管理中的應(yīng)用現(xiàn)狀與對(duì)策分析[J]. 檔案與建設(shè),2023(2):62-65.

      [6]李新功.自動(dòng)著錄技術(shù)在戶籍檔案數(shù)字化中的應(yīng)用研究與實(shí)踐[J].北京檔案,2022(6):39-41.

      [7]馬怡琳,李宗富.賦能·助力·提升:人工智能技術(shù)在檔案解密與開放審核工作中的應(yīng)用探索[J].山西檔案,2022(4):112-118.

      [8]陳會(huì)明,史愛麗,王寧,等.人工智能在檔案工作中的應(yīng)用實(shí)踐與挑戰(zhàn)——以北京市市場(chǎng)監(jiān)督管理局為例[J].檔案與建設(shè),2019(7):53-56.

      [9]LEE C A. Computer-assisted appraisal and selection of archival materials[C/OL]//IEEE,2018 IEEE International Conference on Big Data. 2018:2721-2724[2023-09-03].https://ils.unc.edu/callee/p2721-lee.pdf.

      [10]作為我國檔案領(lǐng)域的重要研究課題之一,國家檔案局科技項(xiàng)目的申報(bào)對(duì)象包括全國各級(jí)檔案機(jī)構(gòu)、高等院校、專門科研機(jī)構(gòu)、企事業(yè)單位和社會(huì)組織。項(xiàng)目立項(xiàng)對(duì)全國檔案科技工作具有重要的引導(dǎo)示范意義,是我國檔案事業(yè)發(fā)展方向的重要體現(xiàn)。

      [11]由于一個(gè)案例可能使用多種人工智能技術(shù),故此處人工智能技術(shù)應(yīng)用的數(shù)量總和>37。

      [12]由于一個(gè)案例中人工智能技術(shù)的運(yùn)用在不同的檔案管理環(huán)節(jié)有所體現(xiàn),故此處不同業(yè)務(wù)場(chǎng)景數(shù)量的綜合>37。

      [13]由于項(xiàng)目的承擔(dān)單位可以有多個(gè),所以不同承擔(dān)單位的項(xiàng)目數(shù)之和>104。

      [14]陳小平.封閉性場(chǎng)景:人工智能的產(chǎn)業(yè)化路徑[J].文化縱橫,2020(1):34-42,142.

      [15]PAYNE N,BARON J R. Auto-categorization methods for digital archives[C]//2017 IEEE International Conference on Big Data ,IEEE,2017:2288-2298.

      [16]FRANKS J. Text classification for records management[J]. Journal on Computing and Cultural Heritage(JOCCH),2022,15(3):1-19.

      [17]HIRTLE P B. Artifical intelligence,expert systems,and archival automation[J]. Provenance,Journal of the Society of Georgia Archivists,1987,5(1):76-88.

      [18]PAYNE N. An intelligent class:The development of a novel context capturing method for the functional auto classification of records[C]//2022 IEEE International Conference on Big Data,IEEE,2022:2546-2555.

      [19]程妍妍,宋瑩,鄭伽.國外檔案工作與人工智能:潛力和挑戰(zhàn)[J].中國檔案,2022(8):78-80.

      [20]于英香,李雨欣.“AI+檔案”應(yīng)用的算法風(fēng)險(xiǎn)與治理路徑探析[J].北京檔案,2021(10):5-9.

      [21]聶云霞,范志偉.AI技術(shù)在檔案開放審核中的SWOT分析[J].山西檔案,2023(4):35-45,88.

      [22]楊建梁,劉越男.機(jī)器學(xué)習(xí)在檔案管理中的應(yīng)用:進(jìn)展與挑戰(zhàn)[J].檔案學(xué)通訊,2019(6):48-56.

      [23]HUTCHINSON T. Natural language processing and machine learning as practical toolsets for archival processing[J]. Records Management Journal,2020,30(2):155-174.

      [24]薛圓圓.人工智能時(shí)代檔案管理創(chuàng)新路徑研究[J].蘭臺(tái)世界,2021(1):84-86.

      [25]馬仁杰,鄧齊鳳.論人工智能技術(shù)在我國檔案工作中的應(yīng)用[J].檔案管理,2024(2):84-87.

      (責(zé)任編輯:張 帆 馮婧愷)

      运城市| 乐业县| 远安县| 新绛县| 盘锦市| 新沂市| 宜黄县| 万年县| 黄平县| 扶绥县| 罗田县| 靖边县| 湖口县| 白朗县| 咸阳市| 雷州市| 长宁县| 茌平县| 咸丰县| 宾阳县| 平利县| 兴隆县| 康乐县| 罗江县| 黄浦区| 义乌市| 沂源县| 邻水| 阿拉尔市| 保靖县| 邹城市| 纳雍县| 扎鲁特旗| 大竹县| 通化县| 柞水县| 公主岭市| 荔浦县| 师宗县| 盐山县| 上虞市|