文/天津機電職業(yè)技術(shù)學院 毛妮娜
近年來,計算機領(lǐng)域人工智能技術(shù)快速發(fā)展,智能服務(wù)產(chǎn)品不斷成熟并向各行各業(yè)推廣,帶來了新的生機與活力。在2017年的《政府工作報告》中明確提出,要大力發(fā)展人工智能技術(shù)。在圖書情報與檔案管理領(lǐng)域,我國第六次全國公共圖書館評估工作明確提出數(shù)字參考咨詢成為省級(副省級)評估定級的加分項。因此,基于人工智能技術(shù)的智慧服務(wù),尤其是參考咨詢類服務(wù)是未來一段時間內(nèi)圖書館、檔案館的重點發(fā)展方向。
智能咨詢服務(wù)是指利用機器人模擬人類回復咨詢問題的服務(wù)方式。目前,智能咨詢服務(wù)在圖書館領(lǐng)域受到了極大關(guān)注,國內(nèi)清華大學圖書館、上海交通大學圖書館等高校圖書館均已利用智能咨詢技術(shù)開展智能參考咨詢服務(wù),并且取得了不錯的成果。相比較于傳統(tǒng)的咨詢服務(wù),智能咨詢服務(wù)可以提供24小時在線服務(wù),無需人員值守,無需占用單獨的服務(wù)空間,尤其是在當前新冠疫情時期,可以實現(xiàn)無接觸咨詢,減少感染風險。
高校的檔案管理工作是一項關(guān)系師生切身利益的重要工作,將人工智能技術(shù)與檔案咨詢服務(wù)相結(jié)合有其現(xiàn)實的需求性,主要體現(xiàn)為以下特征:第一,傳統(tǒng)的檔案咨詢服務(wù)依靠人工提供服務(wù),在查檔高峰期,例如:開學季、畢業(yè)季、教師成果申報時段等,大多高校對于檔案管理工作無法提供足夠的管理人員,以至于面對大量的電話咨詢、郵件咨詢甚至現(xiàn)場咨詢無法提供及時、有效的回復;第二,移動設(shè)備的普及,手機、電腦的廣泛應用,讓用戶群體對于網(wǎng)上咨詢的需求越來越突出,咨詢需求的即時化、泛在化、個性化對目前主流的人工檔案咨詢服務(wù)提出了挑戰(zhàn);第三,目前世界范圍內(nèi),新冠疫情持續(xù)爆發(fā),傳統(tǒng)的人工檔案咨詢工作需要師生用戶與檔案管理人員直接接觸咨詢,是一種高傳播風險的方式,從用戶與檔案管理人員的安全角度考慮,將咨詢服務(wù)改變?yōu)榉墙佑|的智能咨詢方式,也是當前時代的需求。與圖書館參考咨詢服務(wù)類似,師生用戶對檔案類的咨詢也具備共性特質(zhì),例如:查檔案需要攜帶的資料、查檔的時間、是否提供在線查詢方式等。智能咨詢服務(wù)可以完美解決這些問題,讓檔案管理工作徹底從大量重復性咨詢中解脫出來,集中時間、集中精力做好檔案管理、檔案信息化建設(shè)工作。因此,在高校中引入智能咨詢服務(wù)十分必要。
為探究我國檔案學研究領(lǐng)域有關(guān)智能咨詢服務(wù)的研究現(xiàn)狀,筆者結(jié)合文獻試檢過程,挑選與智能咨詢服務(wù)相關(guān)的同義詞、近義詞構(gòu)造檢索式,最終以“檔案AND(智能咨詢OR智能問答OR智能回復OR自動回復)”作為檢索式,在中國知網(wǎng)全文數(shù)據(jù)庫提供的專業(yè)檢索途徑進行主題檢索,共得到8篇相關(guān)文獻。經(jīng)過人工篩選,真正和檔案學智能咨詢服務(wù)相關(guān)的研究只有3篇。從研究數(shù)量角度分析,我國檔案領(lǐng)域有關(guān)智能咨詢服務(wù)的相關(guān)研究數(shù)量是明顯偏少的。
從研究內(nèi)容分析,馬欣以移動網(wǎng)絡(luò)時代為背景,提出了利用微信平臺應用智能咨詢服務(wù)提升檔案管理服務(wù)中的智能化、個性化水平的建議;徐彤陽針對檔案多源數(shù)據(jù)的需求,構(gòu)建了基于多源數(shù)據(jù)的知識服務(wù)智能問答模型。從知識庫構(gòu)建角度為檔案領(lǐng)域搭建智能咨詢模型提供了參考;王雪荻在分析高校檔案咨詢服務(wù)現(xiàn)狀的基礎(chǔ)上提出了智能檔案信息咨詢服務(wù)模式,將智能檔案管理分為訓練端、管理端和訪客端三層架構(gòu),并分別闡述了各層的主要功能,為檔案領(lǐng)域智能咨詢服務(wù)的運行機制設(shè)計提供了參考。遺憾的是,該研究只是從基本功能角度對智能咨詢系統(tǒng)進行介紹并進行了有意義的探討,對于檔案智能咨詢服務(wù)模式的具體分析需要進一步加強。
基于上述研究內(nèi)容可以看出,有關(guān)檔案領(lǐng)域智能咨詢服務(wù)的研究已經(jīng)開始引起了領(lǐng)域內(nèi)學者的關(guān)注,但是研究數(shù)量較少,研究角度、研究深度有待進一步加強。
按照智能咨詢服務(wù)的信息流向,可以將智能咨詢服務(wù)分為數(shù)據(jù)層、業(yè)務(wù)邏輯層和智能人機接口層。筆者將這一模型進行詳細分析,結(jié)合高校的特點,設(shè)計出高校檔案智能咨詢服務(wù)模型(如圖1所示)。
圖1 高校檔案智能咨詢服務(wù)模型
(一)知識庫。知識庫建設(shè)是智能咨詢系統(tǒng)建設(shè)中的重要環(huán)節(jié),知識庫建設(shè)的好壞將直接影響智能咨詢系統(tǒng)的回復效果。針對高校而言,檔案智能咨詢服務(wù)主要目的是解決師生用戶查閱檔案過程中產(chǎn)生的咨詢提問,提供更加便捷的咨詢服務(wù),減輕檔案員的工作壓力。因此,知識庫建設(shè)的目標應該是盡可能覆蓋用戶在查詢檔案過程中遇到的各種咨詢提問。基于此目標,可以從三種途徑建設(shè)知識庫:首先,應盡可能搜集互聯(lián)網(wǎng)上有關(guān)檔案的咨詢提問內(nèi)容,例如百度百科、360百科等,并基于獲取內(nèi)容形成有關(guān)檔案領(lǐng)域基礎(chǔ)知識的問答知識庫,用以滿足用戶對檔案基礎(chǔ)知識的提問,比如:學籍檔案包含哪些內(nèi)容,從檔案中可以獲取哪些信息等;其次,應充分利用國內(nèi)高校、高校檔案館(檔案室)所總結(jié)的FAQ問答內(nèi)容,這些問答內(nèi)容是基于用戶的日常提問總結(jié)的,考慮到檔案管理的規(guī)范性、統(tǒng)一性,F(xiàn)AQ問答可以在一定程度上提取用戶咨詢的共同提問,快速建設(shè)高質(zhì)量的知識庫;最后,本校檔案管理人員是長期服務(wù)于用戶的一線人員,對于本校用戶的提問特點、本校的查檔的規(guī)章制度、檔案提取流程等有豐富的知識和經(jīng)驗,基于本校管理人員的本校特色知識庫建設(shè)將更加具備本地特色,更精準地滿足本校師生查檔時產(chǎn)生的咨詢需求。
檔案知識庫建設(shè)的另一個重要內(nèi)容就是對知識問答的組織方式,由于不同類型的檔案具有不同的特點,使用方式也存在一定的差異,所以,應以檔案的分類作為信息組織方式。例如,將知識庫分為:人事檔案、科研檔案、教學檔案、基建檔案等,以及其他專項檔案、特色檔案。
(二)算法邏輯。算法邏輯是聯(lián)通知識庫問答知識與讀者咨詢提問的橋梁。與知識庫的重要性相類似,檔案智能咨詢的核心功能是對用戶咨詢提問內(nèi)容的理解。當用戶發(fā)出查詢請求時,智能問答系統(tǒng)首先要對查詢提問內(nèi)容進行解析與推理,通常要對用戶提問進行分詞處理用以提取用戶提問的關(guān)鍵詞語,常用的分詞方法包括結(jié)巴分詞、Stanford NLP、中科院計算所ICTCLAS、HanLP等。分詞完成后,可根據(jù)預先建立候選關(guān)鍵詞問題集,計算問題與知識庫內(nèi)提問的相似度,查找相似度符合的問題和答案,將對應的結(jié)果返回輸出給用戶。目前常見的邏輯匹配算法包括:基于范例推理、關(guān)鍵詞匹配、人工智能標記語言邏輯推斷、向量空間模型計算相似度、深度學習等。檔案智能咨詢服務(wù)可以根據(jù)實際情況選用其中的一種或者幾種方案作為核心算法邏輯,進行知識匹配。
(三)交互展示。交互展示是系統(tǒng)與用戶咨詢問答的窗口,常用的交互途徑主要包括:網(wǎng)站、微信公眾號和移動APP,考慮到移動服務(wù)已經(jīng)成為主流,而獨立開發(fā)、維護一個APP的難度較高,再結(jié)合當前國內(nèi)對于基于微信公眾號開展檔案咨詢服務(wù)的研究越來越成熟,微信公眾號的智能咨詢服務(wù)可以作為高校檔案智能咨詢服務(wù)的首選途徑。
用戶與系統(tǒng)的功能交互內(nèi)容應包含兩部分:問答交互以及用戶反饋。其中問答交互是指用戶提出咨詢提問,系統(tǒng)根據(jù)讀者咨詢提問內(nèi)容選擇知識庫內(nèi)最相關(guān)的答案返回給讀者,這是檔案智能咨詢服務(wù)的核心功能模塊;用戶反饋是指用戶在收到系統(tǒng)返回給自己的答案后,根據(jù)答案與自己提問的相符合程度,對本次咨詢問答的反饋內(nèi)容。用戶反饋的主要目的是基于用戶真實使用體驗對知識庫內(nèi)知識問答、算法匹配效果進行評價。尤其是對于知識問答內(nèi)容的反饋,是優(yōu)化知識庫內(nèi)容,以滿足用戶需求的最佳途徑。
在智慧服務(wù)成為主流的信息技術(shù)時代,高校檔案咨詢服務(wù)應緊跟時代潮流,利用智能技術(shù)改變傳統(tǒng)的人工咨詢服務(wù)方式,為用戶提供更加方便、快捷、非接觸式的咨詢服務(wù)是檔案咨詢服務(wù)發(fā)展的必然要求。本文基于檔案領(lǐng)域智能咨詢服務(wù)的研究現(xiàn)狀,將傳統(tǒng)人工檔案咨詢服務(wù)與智能咨詢技術(shù)相結(jié)合,構(gòu)建了檔案智能咨詢服務(wù)模型框架,從知識庫、算法邏輯、交互展示3個層次對高校檔案咨詢服務(wù)智能化建設(shè)進行理論探討。
同時,除了模型提到的功能外,有關(guān)檔案智能咨詢服務(wù)的探討不應局限于當前智能咨詢服務(wù)所具備的功能,還應結(jié)合檔案數(shù)字化建設(shè)的未來發(fā)展和最新的人工智能技術(shù)手段進行規(guī)劃。
國家檔案管理有明確的法律、法規(guī)和政策,檔案數(shù)字化必須遵循有關(guān)規(guī)定,在嚴格保障安全的前提下進行。在符合國家規(guī)定的同時,海量的數(shù)字化檔案信息中也蘊含著大量的潛在價值信息。如何充分挖掘這些信息,為用戶提供更加方便、快捷的服務(wù),以實現(xiàn)檔案服務(wù)創(chuàng)新,顯得十分重要。檔案智能咨詢服務(wù)平臺應充分結(jié)合檔案的數(shù)字化發(fā)展趨勢,在常見咨詢服務(wù)的基礎(chǔ)上,融合數(shù)字化檔案中獲取的有價值信息,在確保數(shù)據(jù)安全和用戶身份認證的基礎(chǔ)上,為用戶提供除了日常咨詢之外,更深層次的服務(wù),從被動服務(wù)轉(zhuǎn)為主動服務(wù)。
人工智能技術(shù)正處于井噴式快速發(fā)展階段,以用戶畫像技術(shù)為代表的用戶個性化服務(wù)目前正在呈現(xiàn)多點爆發(fā)的研究態(tài)勢,受到了相關(guān)領(lǐng)域?qū)W者的重視。基于用戶畫像技術(shù)為用戶提供更多個性化檔案推薦服務(wù),可以讓用戶在瀏覽檔案信息的同時獲取更多的檔案資源。基于用戶畫像技術(shù),可以讓數(shù)字化檔案以新的方式得到開發(fā)與利用,進一步推動高校檔案數(shù)字化的建設(shè)和檔案服務(wù)轉(zhuǎn)向數(shù)據(jù)服務(wù)和知識服務(wù)。