• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      AIGC賦能檔案知識服務:價值意蘊與應用場景

      2024-09-20 00:00:00顏涵于英香
      檔案與建設(shè) 2024年7期

      摘 要:人工智能時代,人工智能生成內(nèi)容(AIGC)在顛覆內(nèi)容生產(chǎn)行業(yè)的同時,也驅(qū)動著其他領(lǐng)域的革新與發(fā)展。AIGC賦能檔案知識服務,將助推檔案資源知識轉(zhuǎn)化效能的提升、檔案知識融合障礙的清除以及檔案知識服務交互體驗的優(yōu)化。AIGC融入檔案知識服務涉及知識組織、知識生產(chǎn)與知識供應三大環(huán)節(jié)的具體場景,可通過夯實資源基礎(chǔ)、促進質(zhì)效提升、提升用戶體驗等共同推動檔案服務的轉(zhuǎn)型升級。

      關(guān)鍵詞:AIGC;ChatGPT;檔案知識服務;應用場景

      分類號:G270.7

      AIGC Enabling Archival Knowledge Service: Value Implications and Application Scenarios

      Yan Han, Yu Yingxiang

      ( School of Cultural Heritage and Information Management of Shanghai University, Shanghai 200444 )

      Abstract: In the era of artificial intelligence, Artificial Intelligence Generated Content (AIGC) is not only subverting the content production industry, but also driving innovation and development in other fields. AIGC enables archival knowledge service, which will promote the efficiency of archival resource knowledge transformation, remove the obstacles of archival knowledge fusion and optimize the interactive experience of archival knowledge service. The integration of AIGC into the three specific scenarios of knowledge organization, knowledge production and knowledge supply involved in archival knowledge services can jointly promote the transformation and upgrading of archival services from the aspects of consolidating the resource base, promoting the improvement of quality and efficiency, and improving user experience.

      Keywords: AIGC; ChatGPT; Archival Knowledge Service; Application Scenarios

      2022年底,美國OpenAI公司推出了人工智能生成內(nèi)容(AIGC)的典型代表ChatGPT,該應用上線后僅用兩個月時間便打破了TikTok歷時九個月達到1億月活用戶的最快紀錄。ChatGPT的出圈成功引爆了AIGC,2023年初AIGC的概念迅速席卷了科技領(lǐng)域及各大網(wǎng)絡社交平臺,引發(fā)了各行各業(yè)產(chǎn)學研界的廣泛關(guān)注。2023年7月10日,國家互聯(lián)網(wǎng)信息辦公室等七個部門聯(lián)合發(fā)布了我國首個針對生成式人工智能產(chǎn)業(yè)的規(guī)范性政策——《生成式人工智能服務管理暫行辦法》,并于2023年8月15日起正式實施。該政策的出臺在規(guī)范AIGC發(fā)展的同時,也鼓勵和引導其在各行業(yè)、各領(lǐng)域的創(chuàng)新應用。目前AIGC雖暫未在檔案領(lǐng)域掀起研究與應用的熱潮,但與檔案相關(guān)的現(xiàn)有法律規(guī)劃中卻彰顯了明顯的技術(shù)指向。2021年,《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》明確指出:要積極探索知識管理、人工智能、數(shù)字人文等技術(shù)在檔案信息深層加工和利用中的應用。[1]2020年修訂的《中華人民共和國檔案法》也提出加速推進科研成果轉(zhuǎn)化,充分發(fā)揮科技力量在檔案事業(yè)發(fā)展中的支撐作用。[2]可見,作為高階人工智能的AIGC被應用于檔案領(lǐng)域已是大勢所趨。當前,檔案利用向知識服務發(fā)展的趨勢,已成為檔案界的共識。[3]伴隨著服務升級,傳統(tǒng)“手動式”“半自動化”的檔案工作模式,已無法滿足檔案部門面臨的“更全面、更高效、更高質(zhì)”的現(xiàn)實工作需求。AIGC賦能檔案知識服務將優(yōu)化檔案工作流程,為用戶創(chuàng)造更為優(yōu)質(zhì)的利用體驗,“智能化”將成為知識服務背景下檔案工作發(fā)展的應然走向。AIGC在檔案知識服務中的應用,不僅順應了數(shù)智時代發(fā)展的需要,還將為檔案工作與事業(yè)帶來新的發(fā)展契機。

      1 AIGC賦能檔案知識服務的價值意蘊

      AIGC全稱為AI Generated Content(人工智能生成內(nèi)容),旨在通過機器翻譯、文檔自動摘要、智能文本生成、自動問答系統(tǒng)、文檔分類檢索以及圖像識別等技術(shù)自動生成所需內(nèi)容[4],能夠從認知計算、跨模態(tài)內(nèi)容理解和策略生成等方面滿足用戶多元化的信息與知識需求。[5]“AIGC+檔案知識服務”的應用將重新定義檔案利用的途徑與方式,勢必會帶來檔案服務理念、服務形式、服務功能、服務層次等相應變革,繼而推動檔案工作模式的轉(zhuǎn)變,充分滿足用戶日益增長的知識利用需求,實現(xiàn)檔案的知識價值,打造全新業(yè)態(tài)。結(jié)合AIGC的技術(shù)特征與檔案知識服務的現(xiàn)實需要,可以從三個方面具體闡釋AIGC賦能檔案知識服務的價值。

      1.1 從人工轉(zhuǎn)向智能:提升檔案資源的知識轉(zhuǎn)化效能

      檔案知識服務作為檔案信息資源深層次開發(fā)利用的技術(shù)和手段之一,其實現(xiàn)以檔案信息資源的知識化組織為前提。因此,檔案工作過程中的數(shù)字化與數(shù)據(jù)化處理、知識抽取、知識聚合、知識關(guān)聯(lián)等環(huán)節(jié)尤為重要。目前,絕大多數(shù)檔案館的業(yè)務流程與管理工作都是通過人工來完成的,部分檔案館順應信息化、數(shù)字化轉(zhuǎn)型趨勢利用云計算、關(guān)聯(lián)數(shù)據(jù)、OCR等技術(shù)輔助完成數(shù)字化工作,但總體而言,檔案工作效率仍偏低且人工成本較高,對于檔案信息資源的開發(fā)利用仍停留在淺層次的實體檔案信息服務層面,未對檔案信息資源進行相應的知識轉(zhuǎn)化。將AIGC引入檔案知識服務,利用支持向量機、神經(jīng)網(wǎng)絡等機器學習、深度學習算法對呈爆炸式增長的檔案信息資源進行大規(guī)模自動化批處理(規(guī)范化、語義化處理等)[6-7],形成計算機能夠識別和分析推理的檔案知識資源,實現(xiàn)檔案分類、著錄、標引、知識關(guān)聯(lián)、知識聚合、編研等工作環(huán)節(jié)的智能化轉(zhuǎn)向,構(gòu)建起完整的檔案知識庫,同時透過用戶行為數(shù)據(jù)感知用戶的行為狀態(tài),進而為用戶提供個性化的知識推薦。

      1.2 從單模態(tài)轉(zhuǎn)向多模態(tài):清除檔案知識融合障礙

      為了促進檔案知識的高效共享,要善于對檔案中蘊含的各種顯性或隱性知識進行加工處理,形成完整系統(tǒng)的知識體系,同時對于知識的表達也不能局限于文本形式,要上升到多媒體形式的可視化層面。[8]大數(shù)據(jù)背景下,傳統(tǒng)檔案館依據(jù)館藏紙質(zhì)檔案及電子文件所提供的單一模態(tài)(以檔案文本為主)的、分散式的檔案資源內(nèi)容,已無法充分滿足用戶日益增長的多元化利用需求,特別是知識需求。將AIGC技術(shù)引入檔案知識服務,可進一步健全檔案資源體系,在豐富資源形態(tài)的同時,促進不同模態(tài)及異構(gòu)數(shù)據(jù)中蘊含的檔案知識的融合,拓展檔案知識服務所提供的內(nèi)容形式?!翱缒B(tài)融合”作為AIGC的顯著技術(shù)特征,能夠打通不同載體檔案及異構(gòu)檔案數(shù)據(jù)服務利用過程中存在的壁壘,利用AIGC技術(shù)對多模態(tài)(文本、音頻、視頻、圖片等)檔案資源進行聚類、融合與重組,可以豐富檔案部門為用戶提供利用的資源類型與數(shù)據(jù)形態(tài),生成滿足用戶個性化需求的多樣化信息與知識,并通過知識關(guān)聯(lián)以多元組合的形式對檔案知識內(nèi)容進行立體化呈現(xiàn),從而提升知識服務水平。

      1.3 從單向轉(zhuǎn)向雙向:優(yōu)化檔案知識服務的交互體驗

      傳統(tǒng)的檔案信息服務仍停留在檔案館的單向輸出層面,缺乏與用戶的關(guān)聯(lián)互動,檔案知識服務應充分考慮用戶參與,為用戶提供其所需的 知識。[9]隨著CLIP(Contrastive Language-Image Pretraining)、Stable Diffusion和ChatGPT等預訓練大模型的出現(xiàn)及芯片算力的進一步提升,AIGC具備了更強的數(shù)據(jù)分析與運算處理能力,基于云平臺、超算中心等數(shù)據(jù)基礎(chǔ)設(shè)施的有力支撐,可以實現(xiàn)多模態(tài)數(shù)據(jù)的實時采集與分析,從而對檔案數(shù)據(jù)資源、用戶行為數(shù)據(jù)進行及時更新,將用戶數(shù)據(jù)反饋出來的用戶個性化需求與檔案知識庫中的信息相匹配,并通過智慧問答與自主推薦相結(jié)合的模式,實現(xiàn)檔案知識服務“以用戶需求為中心”的核心要義,進一步優(yōu)化檔案館智慧服務模式。AIGC的應用,將打造虛實交融的服務場域,打破檔案實體資源與虛擬資源之間的壁壘,實現(xiàn)數(shù)字世界與虛擬世界的雙向交互;推動檔案館知識服務從簡單的數(shù)據(jù)資源分析與可視化處理向數(shù)字內(nèi)容孿生、數(shù)字內(nèi)容編輯和數(shù)字內(nèi)容創(chuàng)作轉(zhuǎn)變,以更高的效率為用戶提供沉浸式交互體驗與智慧服務。

      現(xiàn)今,檔案管理愈發(fā)關(guān)注其信息資源價值,重視并強調(diào)應用檔案顯性知識提供知識服務[10],與此同時,檔案信息資源中還蘊含著大量的隱性知識,能夠創(chuàng)造巨大的經(jīng)濟效益與社會效益。AIGC作為一種全新的內(nèi)容生產(chǎn)模式,其本質(zhì)就是通過將現(xiàn)有的知識進行組合,從而產(chǎn)生新的知識。[11]故把AIGC融入檔案知識服務實現(xiàn)所涉及的具體流程——“知識組織”“知識生產(chǎn)”“知識供應”之中(如圖1所示),將驅(qū)動檔案資源中蘊含的隱性知識顯性化,充分彰顯檔案信息資源的潛在價值,助推檔案部門的工作效率與用戶服務水平的提升,進而滿足用戶多元化的利用需求。

      2 AIGC+檔案知識組織,夯實知識服務的資源基礎(chǔ)

      國外學者將“知識組織”定義為對文獻的分類、標引、編目、文摘、索引等一系列整序活動。[12] 將海量的檔案信息資源重新組織為檔案知識資源,構(gòu)建起系統(tǒng)性的檔案知識庫,使雜亂的檔案信息有序化、有序的檔案信息知識化[13],是凸顯檔案信息資源知識價值,提升檔案知識服務水平的有效路徑。通過將AIGC具體應用到檔案知識組織過程中的“資源分類標引”“知識元抽取”“知識關(guān)聯(lián)的可視化呈現(xiàn)”等具體場景之中,將促進系統(tǒng)化檔案知識庫的構(gòu)建,為檔案知識服務提供強大的資源支持。

      2.1 基于思維鏈推理的自動化分類標引

      所謂“分類標引”,即對檔案內(nèi)容進行主題分析,賦予檢索標識的過程[14],是檔案部門提供知識服務的前期準備工作。當前檔案館館藏仍以文本形式的檔案居多,且檔案資源來源廣泛、主題種類繁多,因此需要對其進行系統(tǒng)分類標引,才能便于檔案的有效管理與充分利用,以提升檔案知識服務的效能。傳統(tǒng)的分類一是直接根據(jù)來源、形成時間、載體等條件對檔案資源進行分類;二是通過人工閱讀和理解具體的檔案內(nèi)容,提取出關(guān)鍵信息,再按照擬定的劃分標準手動進行分類和規(guī)范化標注。前者往往難以全面描述各檔案資源之間的多元復雜關(guān)系,后者不僅人工成本高昂且效率低下。ChatGPT作為AIGC生成的聊天機器人,可以說是AIGC的集大成者,其本質(zhì)也是人工智能生成技術(shù)。[15]一方面,ChatGPT具備思維鏈推理能力,能夠通過對題名及全文內(nèi)容進行語義分析,推理出檔案的中心內(nèi)容及涉及的主要問題、判明其屬性特征、解釋相應的推理過程,并構(gòu)建起推理模型,為檔案的正確歸類提供一定的參考,同時還可以在此基礎(chǔ)之上根據(jù)檔案內(nèi)容及用戶使用情況自動生成聚合性、實用性更強的新類別,使雜亂、分散的檔案知識進一步有序化。另一方面,可以充分利用ChatGPT具備的自動分類功能,將ChatGPT模型訓練成一個文本分類器[16],通過一定的數(shù)據(jù)訓練,使得模型能夠根據(jù)輸入檔案文本的主體內(nèi)容,依照檔案來源、內(nèi)容主題等不同劃分標準,對不同來源的檔案信息資源進行智能化的系統(tǒng)分類,形成多元檔案集合;根據(jù)設(shè)置的著錄標引標準格式,快速從冗長的檔案文本信息中提取出相關(guān)信息實現(xiàn)自動著錄標引,進一步解放檔案館工作人員,減少人為失誤,進而提高分類標引的效率和準確性,為構(gòu)建檔案知識庫做好前期的資源準備。

      2.2 基于“語境-語用-語義”的細粒度知識元抽取

      從檔案數(shù)字資源中抽取知識元是提供知識服務的基礎(chǔ),為了深入到檔案知識內(nèi)容層次的內(nèi)容管理,必須對檔案中蘊含的知識內(nèi)容進行顆?;磉_與組織,實現(xiàn)檔案資源的知識元化。[17]“知識元”作為知識結(jié)構(gòu)和內(nèi)容的基本單元,將有助于知識用戶的知識發(fā)現(xiàn)和知識點更新。目前知識抽取技術(shù)正轉(zhuǎn)向以文獻內(nèi)容結(jié)構(gòu)分析為重點,如段落、句子、語法分析等。[18]AIGC中具備強大語言處理和自監(jiān)督學習能力的ChatGPT、BERT(Bidirectional Encoder Representation from Transformer)、Megatron-Turing NLG等代表性自然語言處理模型(NLP),通過對海量無標注語料的預訓練與學習,可以掌握語言表達模式及文字前后邏輯。利用相關(guān)模型對大量檔案文本中的詞句進行基于上下文的語用分析、理解與推斷,從中提取出標題、摘要等能夠表達整篇文檔關(guān)鍵信息的相關(guān)內(nèi)容(如段主題、句主題等),并在此基礎(chǔ)上抽取出更加細顆粒度的主題詞同時自動做好相應的語義標注作為知識元,將檔案中的隱性知識內(nèi)容特征顯性化。根據(jù)語義、語境抽取知識元而非傳統(tǒng)的基于關(guān)鍵詞或句子的重要程度進行抽取,可以有效避免單篇文檔中內(nèi)容信息的主題遺漏。隨后利用CBOW(Continuous Bag-of-Words)、Skip-gram等模型將知識元轉(zhuǎn)化為稠密向量,進行比較分析,構(gòu)建起以主題為單位的知識元集合,進而為用戶以知識元為單位的知識檢索創(chuàng)造條件。同時,AIGC還可以對圖像、音頻、視頻進行智能分析,從中發(fā)現(xiàn)知識信息,便于用戶對多模態(tài)檔案資源的瀏覽與檢索。

      2.3 多源異構(gòu)數(shù)據(jù)內(nèi)在關(guān)聯(lián)的可視化呈現(xiàn)

      知識圖譜作為AIGC的重要分支技術(shù),即通過挖掘、分析將散落的知識信息重新組合,對相關(guān)內(nèi)容之間的復雜關(guān)系進行可視化呈現(xiàn)。檔案知識圖譜建構(gòu)是將檔案內(nèi)容向顯性結(jié)構(gòu)化檔案知識轉(zhuǎn)化的過程[19],可以實現(xiàn)檔案資源中多源異構(gòu)知識數(shù)據(jù)的有效集成。AIGC中的知識圖譜技術(shù),能夠從大量結(jié)構(gòu)化和非結(jié)構(gòu)化的檔案數(shù)據(jù)中提取和整合關(guān)聯(lián)的知識,并將其組織成易于理解和操作的結(jié)構(gòu)化形式,最終通過各類圖形,將各類檔案資源中的知識內(nèi)容的顯性與隱性關(guān)系加以呈現(xiàn),自動構(gòu)建起系統(tǒng)的知識網(wǎng)絡。例如,基于GPT-4的圖像生成能力,GPT系列模型可以幫助檔案工作人員更好地可視化處理數(shù)據(jù),如生成圖表、詞云等,使得檔案服務平臺具備對用戶提出的相關(guān)問題、概念進行精準識別、全面解釋的能力,進而提升檔案的知識服務水平。

      3 AIGC+檔案知識生產(chǎn),促進知識服務的質(zhì)效提升

      檔案知識服務是面向知識內(nèi)容的服務,故在其日常管理工作中不僅要聚焦于檔案的存儲與保護,更應重視檔案知識內(nèi)容的生產(chǎn),充分釋放檔案所蘊含的多元化價值。AIGC賦能檔案知識生產(chǎn),可大幅提高知識生產(chǎn)效率,并使產(chǎn)出內(nèi)容具備豐富性、完整性、創(chuàng)新性等優(yōu)勢特征。

      3.1 融合多模態(tài)資源的知識內(nèi)容生成

      數(shù)字時代,檔案資源的模態(tài)形式逐步由文本、圖像、音頻、視頻等單一模態(tài)向相互融合的多模態(tài)形式轉(zhuǎn)變。[20]對于某一人物或事件的描述可能由紙質(zhì)檔案與圖像、視頻記錄共同呈現(xiàn),不同模態(tài)檔案資源間的組合性不斷增強,但在計算機綜W9NVzQIYZgQewZDxfzzMbRHpy8YbAfv4jC+3yp1W9oA=合處理多模態(tài)檔案資源的過程中容易產(chǎn)生語義糾纏問題。而AIGC能夠通過抽取、克隆、識別、對齊、理解和組合等方式對信息的語義糾纏問題進行拆分解析。[21]AIGC利用多模態(tài)大模型尋找不同模態(tài)數(shù)據(jù)間的對應關(guān)系,然后通過原始數(shù)據(jù)映射、統(tǒng)一對齊語義空間、完成不同模態(tài)信息的理解。[22]基于此,檔案部門可以對跨模態(tài)的檔案資源進行多樣化組合,進而提高檔案知識生產(chǎn)創(chuàng)作的內(nèi)容豐富度、創(chuàng)新檔案知識生產(chǎn)最終呈現(xiàn)的內(nèi)容形態(tài)。AIGC的可增強多模態(tài)內(nèi)容深度學習后的可理解性、可解釋性和可處理性,將關(guān)于同一事件、主題的不同模態(tài)檔案資源關(guān)聯(lián)匯集,打破不同模態(tài)檔案資源綜合運用、聯(lián)合開發(fā)的技術(shù)壁壘,可以進一步拓展檔案知識生產(chǎn)的創(chuàng)作空間。例如,在虛擬展覽中,AIGC通過利用圖像合成、語音合成和肢體語言合成等技術(shù),并與AR/VR技術(shù)相結(jié)合,對檔案文本、圖像、音頻、視頻資源進行綜合處理,實現(xiàn)“歷史再現(xiàn)”“人物面貌神態(tài)、肢體動作、聲音還原”等展覽效果,為用戶創(chuàng)造沉浸式體驗,通過多模態(tài)內(nèi)容的融合完成跨時空、跨場景的檔案知識生產(chǎn)。

      3.2 降本增效的智能化編研

      檔案編研是實現(xiàn)社會知識生產(chǎn)的關(guān)鍵路徑,也是檔案部門提供知識服務的基礎(chǔ)性工作。現(xiàn)有的檔案編研工作基本由人工完成,主要可分為兩種編研模式:一是把分散凌亂的原始材料進行排列、組織,成為系列匯編;二是根據(jù)既定題目,精選檔案內(nèi)容并加以分析。[23]前者在知識組織階段就已經(jīng)完成;后者能夠?qū)n案信息知識化、隱性知識顯性化,實現(xiàn)真正意義上的知識生產(chǎn)。在檔案編研過程中引入AIGC,充分發(fā)揮其內(nèi)容創(chuàng)作能力,將實現(xiàn)檔案自動化、智能化編研,降低編研工作消耗的人力資源,并大幅縮短知識成果的生產(chǎn)周期。具體來看,一是可以利用AIGC自然語言處理技術(shù),在編研素材收集時通過檔案智能檢索,在檔案編研素材語料庫中快速篩選出符合編研主題且較為完整的各類模態(tài)檔案資源,為檔案編研提供豐富、高質(zhì)量的素材,提高檔案編研的質(zhì)量和效率。二是AIGC具有強大的認知對抗中的內(nèi)容生成能力,在檔案編研的文本內(nèi)容分析創(chuàng)作過程中,通過對大量的自然語言文本數(shù)據(jù)進行訓練,能夠?qū)斎氲臋n案資源內(nèi)容進行語義識別,理解任務主題,生成符合語法和語義規(guī)則、主題語言情境,具有一定完整性、連貫性與邏輯性的長文本,即文本類編研成果。三是利用AIGC+視頻生成技術(shù)可直接生成檔案視頻內(nèi)容,搭建起檔案資源描述的故事場景,并在虛擬空間建立代表自我的數(shù)字人,獨立完成活動任務,以探尋檔案蘊藏的奧秘。

      3.3 缺損內(nèi)容的補充還原

      檔案知識生產(chǎn)是以海量的檔案信息資源為基礎(chǔ)的,是在保障檔案真實性的基礎(chǔ)之上對于已有檔案信息資源的再創(chuàng)造。對于檔案資源中模糊、缺損資源的補充還原,能夠為檔案部門開展新的知識生產(chǎn)提供強大的資源支撐。傳統(tǒng)的OCR技術(shù)的識別能力已無法適應數(shù)據(jù)時代多元檔案資源的修復需要,而AIGC的技術(shù)應用演化出了強大的智能數(shù)字內(nèi)容孿生能力,其包含的智能增強技術(shù)在檔案資源內(nèi)容修復方面具有巨大的潛力。一方面,部分館藏檔案資源在內(nèi)容完整性方面可能帶有一定的先天缺陷。另一方面,館藏紙質(zhì)檔案因其自身載體的脆弱性、保存時間過長或保管不當,可能會出現(xiàn)字跡模糊或消失、照片褪色、紙張破損等現(xiàn)象。同時,部分檔案數(shù)據(jù)資源在收集、傳輸和存儲的過程中,可能存在缺失或損壞的問題。AIGC的智能增強技術(shù)可以有效消除檔案先天或后期存儲過程中所產(chǎn)生的信息內(nèi)容缺失問題,能夠根據(jù)給定的低質(zhì)量原始檔案數(shù)據(jù)信息生成經(jīng)過增強后的高質(zhì)量數(shù)字內(nèi)容,在數(shù)字世界中孿生再現(xiàn)或重構(gòu)完整的數(shù)據(jù)信息內(nèi)容,還原那些珍貴的記憶。而且,對于有缺陷的音視頻檔案,相關(guān)的智能增強技術(shù)可以解決片段缺失、脈沖干擾和音頻失真等問題,對檔案數(shù)據(jù)資源進行相應的修復與增強,復原生成高質(zhì)量的數(shù)據(jù)內(nèi)容。

      4 AIGC+檔案知識供應,提升知識服務的用戶體驗

      檔案知識服務與信息服務最大的區(qū)別在于,知識服務是一種用戶目標驅(qū)動的服務,其驅(qū)動力來源于用戶。故檔案知識服務的實現(xiàn)與升級,亟須從需求端入手完成相應的檔案知識供應。所謂知識供應即在知識組織與知識生產(chǎn)的基礎(chǔ)之上,根據(jù)知識服務對象的實際需求,經(jīng)過知識獲取、知識推送、知識反饋將知識傳遞給知識需求者的階段[24],其主要任務是在合適的時候?qū)⑷?、正確的知識提供給需要知識的人,最終實現(xiàn)主動智能知識服務。檔案部門的知識供應涉及用戶知識需求分析、知識推送與拉取、知識服務反饋等具體流程,知識供應過程中AIGC的融入,將完善檔案知識供應機制,進而助推檔案知識服務工作變被動為主動,創(chuàng)新檔案利用服務模式,提升檔案資源的利用率,彰顯檔案部門服務的智慧化特征。

      4.1 基于即時糾錯的問答式知識獲取

      用戶的檔案知識利用需求在檢索過程中需要轉(zhuǎn)化為規(guī)范化的檢索語言,在語言表達轉(zhuǎn)換過程中容易出現(xiàn)轉(zhuǎn)換誤差,因此在將用戶需求與檔案資源內(nèi)容匹配時,會出現(xiàn)供需不適配的現(xiàn)象,從而降低檔案知識服務水平并破壞用戶體驗。AIGC生成的聊天機器人,以ChatGPT為典型代表,并非通過有監(jiān)督的“問題—答案式”的訓練直接給出結(jié)果,而是通過“基于人類反饋的強化學習(RLHF)”來學習什么是好的回答,以此模仿人類的思維方式,能夠主動承認錯誤、不斷自我更新、不斷理解人類語言、不斷認知用戶需求場景,并經(jīng)過多輪長對話輸出優(yōu)質(zhì)結(jié)果。檔案部門可以借助AIGC生成的聊天機器人,為用戶提供交互式知識服務,當用戶對檢索結(jié)果不滿意時,可以通過與用戶進行多輪對話,根據(jù)用戶的補充描述或提出的質(zhì)疑,準確把握用戶的知識利用需求,不斷更新完善自身提供的答案,最終篩選出用戶真正需要的、滿意的檔案資源。

      4.2 基于深度學習算法與動態(tài)模型的個性化知識推送

      檔案知識服務是一種“以用戶需求為中心” “面向問題”的主動式服務。AIGC技術(shù)可以通過深度學習算法,幫助檔案館實現(xiàn)用戶行為偏好數(shù)據(jù)的長期收集與分析,并對其進行管理追蹤,建立起更為完整的多維用戶畫像體系,再將用戶畫像與基于檔案知識數(shù)據(jù)內(nèi)容的資源畫像相匹配,以此來錨定用戶獨特的利用需求,主動為用戶提供個性化精準服務,克服基于用戶自主檢索的推薦范式存在的缺陷,并免除用戶在海量檔案信息內(nèi)容中的搜索之苦。例如,當用戶登錄檔案網(wǎng)站時,網(wǎng)站后臺會根據(jù)關(guān)鍵詞匹配、用戶查詢記錄與使用軌跡制定相應算法,進而推斷用戶的個人偏好及潛在需求,并基于此自動調(diào)用相關(guān)檔案信息資源,形成對應的知識內(nèi)容庫,以增強用戶深度個性化體驗。同時AIGC技術(shù)能夠自動學習和調(diào)整推薦模型,不斷適應用戶行為的變化。相比傳統(tǒng)的推薦算法,AIGC技術(shù)融入后可以更加精準地捕捉到用戶的需求演變,幫助檔案知識供給端及時調(diào)整推薦策略。經(jīng)過對大量數(shù)據(jù)的反復訓練,形成各類推薦模式,再由多種推薦算法復合形成綜合性的智能推薦模型,進而實現(xiàn)檔案知識內(nèi)容的“精準推送”。

      4.3 基于智能轉(zhuǎn)譯的跨模態(tài)知識檢索

      檔案館信息檢索的效果是評價其用戶服務水平的重要標準之一。當前,檔案館及檔案網(wǎng)站使用的檔案檢索語言與檢索工具的專業(yè)性較強,雖然這在一定程度上保證了檢索的規(guī)范性,但同時也提高了信息檢索利用的門檻,不利于多層次社會群體的使用[25],同時檢索結(jié)果的形式也較為單一,用戶體驗較差。AIGC賦能的檔案檢索,可以綜合利用各種多模態(tài)預訓練模型,支持用戶使用自然語言(具有專指度高、詞匯更新及時和面向用戶能力好等優(yōu)勢[26])進行跨模態(tài)檢索。例如,由OpenAI團隊推出的跨模態(tài)深度學習模型CLIP,能夠同時進行自然語言理解和計算機視覺分析,進而找到文本、圖像與音視頻等不同模態(tài)信息資源溝通對話的交界點,并實現(xiàn)跨模態(tài)資源間的關(guān)聯(lián)匹配。即用戶在檔案檢索系統(tǒng)中利用文字進行搜索,系統(tǒng)除了會通過提取檔案資源的語義內(nèi)容來實現(xiàn)匹配和推理,篩選符合要求的文本資料,同時還可以利用智能轉(zhuǎn)譯技術(shù)將檔案音頻、視頻中的內(nèi)容信息轉(zhuǎn)化為文本模態(tài)的數(shù)據(jù)信息,與用戶需求相匹配,最終將多模態(tài)內(nèi)容組合,實現(xiàn)跨模態(tài)檢索,為用戶提供多元完整的檔案知識信息。同時,還可以利用AIGC中基于多模態(tài)模型的智能轉(zhuǎn)譯技術(shù),為具有視覺障礙的用戶提供語音檢索服務。

      5 結(jié) 語

      隨著人工智能技術(shù)的深入發(fā)展,未來AIGC在檔案領(lǐng)域的價值會愈發(fā)凸顯,并逐步實現(xiàn)檔案服務模式的轉(zhuǎn)型,為用戶提供更全面、滿意度更高的智慧服務。然而,盡管AIGC在檔案領(lǐng)域具有諸多的應用場景,且依據(jù)其技術(shù)特征能夠進一步提升檔案知識服務的效能、優(yōu)化檔案用戶體驗、促進檔案工作的轉(zhuǎn)型升級,但目前檔案部門的算力、算法及軟硬件基礎(chǔ)設(shè)施與企業(yè)差距較大,仍有很大的提升空間,故AIGC賦能檔案知識服務的具體進路亟待進一步的研究。而如何在實際的檔案工作中“用好”“用對”AIGC,如何采取相應的措施有效防范應用過程中存在的風險挑戰(zhàn),如何在堅持技術(shù)理性的基礎(chǔ)上逐步推進其應用,是未來檔案學界與檔案實踐工作者需要持續(xù)關(guān)注的問題。

      *本文系上海市哲學社會科學規(guī)劃一般項目“知識服務背景下檔案數(shù)據(jù)化轉(zhuǎn)型機制研究”(項目編號:2023BTQ001)階段性研究成果。

      作者貢獻說明

      顏涵:提出選題與研究框架、撰寫論文,本文通訊作者;于英香:參與選題討論與框架設(shè)計、修改論文并定稿。

      注釋與參考文獻

      [1]中辦國辦印發(fā)《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》[EB/OL].[2024-06-01].https://www.saac. gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb5 5c890762868683.shtml.

      [2]中華人民共和國檔案法[EB/OL].[2024-06-01].https://www.saac.gov.cn/daj/falv/202006/79ca4 f151fde470c996bec0d50601505.shtml.

      [3]夏天,錢毅.面向知識服務的檔案數(shù)據(jù)語義化重組[J].檔案學研究,2021(2):36-44.

      [4]姚元杰,龔毅光,劉佳,等.基于深度學習的智能問答系統(tǒng)綜述[J].計算機系統(tǒng)應用,2023(4):1-15.

      [5][7]趙楊,張雪,范圣悅.AIGC驅(qū)動的智慧圖書館轉(zhuǎn)型:框架、路徑與挑戰(zhàn)[J].情報理論與實踐,2023(7):9-16.

      [6]呂元智.數(shù)字檔案資源跨媒體語義關(guān)聯(lián)聚合實現(xiàn)策略研究[J].檔案學研究,2015(5):60-65.

      [8]劉永.檔案信息服務工程之知識服務[J].檔案管理,2012(2):4-9.

      [9]胡鳳華,袁繼軍.略論檔案知識服務學研究[J].蘭臺世界,2014(17):6-7.

      [10]周建軍.顯性知識服務:檔案管理的有為之路[J].檔案學通訊,2015(1):51-54.

      [11]陳永偉.超越ChatGPT:生成式AI的機遇、風險與挑戰(zhàn)[J].山東大學學報(哲學社會科學版),2023(3):127-143.

      [12]張凌,喬曉東.基于知識地圖的企業(yè)知識組織設(shè)計研究[J].圖書情報工作,2014(18):110-116.

      [13]楊智勇,金波,周楓.“智慧型”檔案信息服務模式研究[J].檔案管理,2018(6):21-25.

      [14]詳見GB/T 15418-2009,《檔案分類標引規(guī)則》。

      [15]儲節(jié)旺,杜秀秀,李佳軒.人工智能生成內(nèi)容對智慧圖書館服務的沖擊及應用展望[J].情報理論與實踐,2023(5):6-13.

      [16]陳亮,秦玉婷,費鴻虹,等.GPT賦能檔案館智慧服務:技術(shù)特征、應用場景與實現(xiàn)路徑[J].檔案與建設(shè),2023(12):35-38.

      [17]牛力,袁亞月,韓小汀.對檔案信息知識化利用的幾點思考[J].檔案學研究,2017(3):26-33.

      [18]鄭彥寧,化柏林.句子級知識抽取在情報學中的應用分析[J].情報理論與實踐,2011(12):1-4.

      [19]蔡之玲,陸陽.基于DKN算法的檔案知識推薦系統(tǒng)模型構(gòu)建[J].檔案學通訊,2021(2):63-71.

      [20]牛力,展超凡,高晨翔,等.人物事件導向的多模態(tài)檔案資源知識聚合模式研究[J].檔案學通訊,2021(4):36-44.

      [21]詹希旎,李白楊,孫建軍.數(shù)智融合環(huán)境下AIGC的場景化應用與發(fā)展機遇[J].圖書情報知識,2023(1):75-85,55.

      [22]王雨竹,謝珺,陳波,等.基于跨模態(tài)上下文感知注意力的多模態(tài)情感分析[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2021(4):49-59.

      [23]霍艷芳,張嘉瑋.紅色檔案編研的現(xiàn)狀和發(fā)展路徑探析——以華東六省一市為例[J].檔案與建設(shè),2024(1):77-81.

      [24]毛秀梅,楊曄.面向政府的網(wǎng)絡輿情知識服務體系構(gòu)建研究[J].情報科學,2016(9):124-128.

      [25]馬仁杰,譚亞楠,王沐輝.論我國檔案檢索工作中存在的問題與改進對策[J].檔案學通訊,2016(3):42-45.

      [26]史江,李金峰.檔案利用信息反饋工作的問題與對策探討[J].檔案學通訊,2007(3):27-30.

      (責任編輯:孫 潔 陳 騫)

      都匀市| 社旗县| 波密县| 黑水县| 肃北| 临沭县| 钦州市| 水富县| 通州区| 临泉县| 宁明县| 微博| 根河市| 铁岭县| 惠州市| 静海县| 九江县| 栾川县| 册亨县| 长白| 突泉县| 余江县| 清远市| 江安县| 开封市| 慈溪市| 公主岭市| 上虞市| 手机| 大竹县| 鄯善县| 和顺县| 水富县| 盐边县| 保德县| 彭阳县| 佛教| 灯塔市| 梅州市| 广水市| 西乌|