[摘 要]從知識服務的底層邏輯思考人工智能時代知識服務的根本性變革,對改造和發(fā)揮情報系統(tǒng)傳統(tǒng)資源能力,針對用戶復雜問題及其解決方案的認知型決策型知識服務能力,知識服務支持進行了深入的研究和探討。主要從數(shù)據(jù)支撐、服務重構、創(chuàng)新賦能、能力重塑4個方面詳細討論知識服務體系重塑,并提出當前面臨的困境及思考。
[關鍵詞]知識服務 人工智能 ChatGPT
[分類號]G252.7
1 引言
2022年11月30日,OpenAI發(fā)布了新一代聊天機器人程序ChatGPT,在短短兩個月內其用戶數(shù)量突破了一億,引發(fā)了廣泛關注。ChatGPT是一種基于互聯(lián)網(wǎng)數(shù)據(jù)訓練的深度學習模型,具備語言理解和文本生成能力,通過持續(xù)的迭代改進,該模型逐漸具備了對生成答案進行評判的能力,是一項革命性的生成式人工智能技術[1]。除了作為聊天機器人,ChatGPT還具備智能化內容創(chuàng)作能力,可以根據(jù)對話的上下文環(huán)境生成特定內容,這一創(chuàng)新的人工智能技術對教育、科學研究、醫(yī)療健康和生物工程等領域產生了重要影響,并促使?jié)撛趹醚芯靠焖僭黾印?/p>
ChatGPT的突破為圖書館發(fā)展帶來了新的機遇,根據(jù)《新媒體聯(lián)盟地平線報告:2017年圖書館版》,人工智能(AI)被列為圖書館發(fā)展的六大技術方向之一,其中包括內容智能分析能力的提升和服務效能的改善。目前,已有高校圖書館開始運用ChatGPT提供知識服務和情報咨詢。這些聊天機器人利用自然語言處理和機器學習等技術,能夠與用戶進行實時互動和交流,回答有關圖書館資源、檢索技巧、研究方法等方面的問題,并根據(jù)用戶需求快速獲取和分析大量圖書館數(shù)據(jù),提供個性化的知識解答。人工智能聊天機器人的引入為高校圖書館的知識服務和情報服務帶來了新的機遇。
中國科學院文獻情報中心張智雄等人在《ChatGPT對文獻情報工作的影響》一文中闡述了人工智能技術迅速發(fā)展對文獻情報工作的啟示,以及ChatGPT對文獻情報工作多個方面的影響,從數(shù)據(jù)組織方式、知識服務模式、情報分析方法、文獻使用方式、文獻情報隊伍建設要求以及文獻情報工作重點6個方面分析了ChatGPT對文獻情報領域的影響,并基于文獻情報工作的特點,提出人工智能時代文獻情報領域發(fā)展的9條建議[2]。吳建中提出圖書館可以借力人工智能,提升內容智能分析能力,探索提升圖書館服務效能的研究與實踐[3]。茆意宏指出,智能識別(圖像識別、語音識別、其他感知技術)、智能處理(組織、分析)、智能服務(檢索、推薦、咨詢)是人工智能對圖書館的主要影響方向,特別是在數(shù)字資源處理與服務方面將帶來更大的變革[4]。張曉林深入探討了ChatGPT對知識服務帶來的挑戰(zhàn)和應對方法,從知識服務的底層邏輯對人工智能時代知識服務的根本性變革,改造和發(fā)揮情報系統(tǒng)傳統(tǒng)資源能力,針對用戶復雜問題及其解決方案的認知型決策型知識服務能力,知識服務支持進行了深入的分析和探討[5]。筆者以此為切入點,重新思考人工智能時代知識服務的未來走向及服務體系重塑路徑。
2 人工智能時代知識服務體系的重塑
以ChatGPT為代表的AI革命對知識服務帶來的巨大挑戰(zhàn)使高校圖書館不得不認真思考AI時代知識服務體系的重塑問題,以下將從數(shù)據(jù)支撐、服務重構、創(chuàng)新賦能、能力重塑4個方面進行詳細討論。
2.1 數(shù)據(jù)支撐:構建專業(yè)領域語料庫,建立并組織垂直領域信息資源
ChatGPT的語料庫來源于各種公開的互聯(lián)網(wǎng)資源,如書籍、文章、維基百科、網(wǎng)頁、論壇、社交媒體等,這些文本資源經(jīng)過深度清洗和處理,確保了數(shù)據(jù)的質量和準確性。ChatGPT通過大規(guī)模的預訓練來學習語言模型,并努力讓模型能夠對輸入的問題作出有意義和準確的回答,但不會從特定的作者或來源處引用信息,它所產生的回答基于訓練過程中接觸到的廣泛語料庫的總體知識和理解,無法提供特定來源的實時或專業(yè)領域的最新信息,而是根據(jù)先前學習到的信息進行組織。因此,ChatGPT回答的質量和可信度可能受到訓練數(shù)據(jù)和模型的限制。語料是AI獲取知識的源泉,高價值語料工作是一切AI的基礎[6],構建該專業(yè)垂直領域信息資源的語料庫極為重要。
構建一個知識庫,整合領域知識、決策模型和規(guī)則。知識庫中包括專業(yè)數(shù)據(jù)庫資源、專家知識、經(jīng)驗數(shù)據(jù)、規(guī)則庫等,與智能服務相結合,形成一個綜合的決策支持系統(tǒng)。知識庫的更新和管理可以通過專家反饋、領域知識更新等方式進行。首先,在構建高校圖書館專業(yè)領域語料庫之前,需要明確目標和范圍,確定好要收集的專業(yè)領域以及相關學科的范圍;同時,需要考慮語料庫的規(guī)模和深度,以及所涵蓋的材料類型。其次,通過多種途徑進行數(shù)據(jù)收集和抽取,包括訂閱和購買專業(yè)期刊、數(shù)據(jù)庫、學術搜索引擎等,還可以與相關學院、研究機構合作,獲取他們的研究成果和數(shù)據(jù)。針對文獻類資源,可以利用文獻檢索工具進行全文或摘要的抽取,確保語料庫的廣度和質量;在數(shù)據(jù)收集和抽取過程中,要注重數(shù)據(jù)的整理和標注。為了提高語料庫的可利用性,應該對數(shù)據(jù)進行分類、歸類和標記,以便后續(xù)的檢索和利用??梢允褂米詣踊姆椒ㄟM行初步的整理與分類,再結合人工的校對來提高準確性和完整性。再次,建立適當?shù)男畔⒔M織與存儲模型,可以使用知識圖譜、本體論和語義網(wǎng)絡等技術手段來組織和表示垂直領域的信息,使用戶能夠更加方便地瀏覽、搜索和發(fā)現(xiàn)信息資源。此外,還可以利用標簽、關鍵詞和元數(shù)據(jù)等方式來描述和索引語料庫中的文獻和資源。為了提高垂直領域信息資源的可用性和互操作性,可以將語料庫與其他已有的知識庫和信息資源進行鏈接和集成,通過建立統(tǒng)一的標準和接口,實現(xiàn)各種資源之間的相互補充和共享,這樣不僅能夠增強垂直領域信息資源的價值,也能夠促進學術交流和合作。最后,需要注意語料庫的持續(xù)維護和更新,專業(yè)領域的知識和信息在不斷發(fā)展和變化,因此語料庫也需要及時更新和補充。同時,要對語料庫進行專業(yè)的質量控制和評估,確保信息的準確可靠。
2.2 服務重構:傳統(tǒng)知識服務的AI智能化改造
ChatGPT能夠通過自然語言處理和生成,實現(xiàn)智能問答、文檔摘要、自動翻譯等功能,提供更加高效和精準的知識服務。這將改變傳統(tǒng)的人工檢索和信息提供方式,使知識情報服務更加自動化、智能化,大大減少人工工作量。
2.2.1 個性化咨詢和智能檢索
傳統(tǒng)情報知識服務系統(tǒng)的檢索功能通常依賴于關鍵詞匹配,而ChatGPT等AI技術可以根據(jù)用戶的需求和背景提供個性化咨詢服務,并通過自然語言理解和生成實現(xiàn)智能、靈活的檢索,使傳統(tǒng)的一對多咨詢模式變得更加精準和高效。用戶不再受限于特定的關鍵詞或查詢語法,可以用自然語言描述所需信息,更輕松地找到知識。
2.2.2 實時情報和跨學科知識整合
ChatGPT等AI技術可以通過與多個數(shù)據(jù)源實時連接,提供即時的情報服務。傳統(tǒng)情報知識服務系統(tǒng)需要人工整理和歸納大量信息,而ChatGPT可以將這一過程自動化,快速提供最新的信息和動態(tài)更新,幫助用戶及時了解最新的發(fā)展動態(tài)。傳統(tǒng)的學科知識服務往往由單個領域專家提供,而ChatGPT等AI技術可以整合多個學科領域的知識,提供跨學科的綜合解決方案。通過對多個領域的知識進行深度學習和推理,ChatGPT可以為用戶提供更全面、綜合的知識服務。
2.2.3 個性化教育培訓和多模態(tài)知識支持
AI技術可以根據(jù)用戶的學習需求和進度,提供個性化的教育培訓服務。通過與用戶的對話交互,AI技術可以了解用戶的學習水平和目標,并根據(jù)用戶的反饋和表現(xiàn)調整教學內容和方式,提供有針對性的學習支持。此外,AI技術還可以支持多種模態(tài)的知識表達和呈現(xiàn),如圖像、語音、視頻等,使知識更加直觀和易于理解。
2.2.4 海量數(shù)據(jù)分析以及自動文獻挖掘
傳統(tǒng)情報知識服務系統(tǒng)往往無法有效分析和處理海量的數(shù)據(jù),而ChatGPT等AI技術可以通過強大的計算能力和機器學習算法實現(xiàn)對大數(shù)據(jù)的快速挖掘和分析。這將幫助用戶更好地理解和利用龐大的數(shù)據(jù)資源,發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的價值點。傳統(tǒng)的科技文獻挖掘通常需要人工閱讀和篩選大量文獻,而ChatGPT等AI技術可以通過機器學習和自然語言處理,自動分析和提取科技文獻中的關鍵信息。張智雄在2023年第六屆未來智慧圖書館發(fā)展論壇中介紹了ChatGPT在國家重點研發(fā)計劃項目“科技文獻內容深度挖掘及智能分析關鍵技術和軟件”中的應用,這將大大提高文獻挖掘的效率和準確性,幫助用戶快速獲取所需的科技知識。
通過以上4個方面的改造,傳統(tǒng)知識服務得以智能化,同時提升了個性化咨詢、檢索和教育培訓的效果,實現(xiàn)實時情報、跨學科知識整合、多模態(tài)知識支持、大數(shù)據(jù)分析及自助文獻挖掘,為用戶提供更智能、便捷和全面的知識服務體驗。
2.3 創(chuàng)新賦能:AI創(chuàng)新助力解決多維復雜知識服務課題
隨著AI技術的發(fā)展和應用范圍的擴大,越來越多的科學領域開始利用AI方法和技術解決科學問題,推動科學研究的進展。利用AI方法可以加速科學研究的過程,改善科學實驗和觀測的效率,發(fā)現(xiàn)新的科學知識和洞見,并提供對復雜系統(tǒng)和現(xiàn)象的解釋和預測。通過將AI與科學研究相結合,可以提高科學研究的效率和創(chuàng)新能力,推動科學的發(fā)展。同時,AI還可以通過積極的用戶反饋和需求分析,了解用戶提出的復雜問題的背景、具體需求和期望解決方案,與用戶進行深入的對話和交流,以確保對問題的準確理解,并獲取更多關鍵信息,對于復雜問題通過多次迭代和確認,不斷優(yōu)化回答以滿足其需求和期望。
2.3.1 改善科學實驗和觀測的效率、加速科學研究的過程
AI可以處理大規(guī)模數(shù)據(jù)集,幫助科研人員從中發(fā)現(xiàn)模式、關聯(lián)和趨勢。借助AI的巨大技術優(yōu)勢,可將數(shù)學計算和科學模型相結合,高效處理海量數(shù)據(jù),使傳統(tǒng)的科研過程變得自動化、規(guī)模化、并行化和平臺化,從而解決原來傳統(tǒng)科學研究范式無法解決的問題,幫助科學家突破科研瓶頸。AI可以幫助科研人員在大量文獻中搜索、過濾和整理信息,提供全面和準確的文獻綜述。此外,利用自然語言處理和知識圖譜技術,還可以構建領域知識圖譜,幫助科研人員理解領域內的概念和關系。
2.3.2 發(fā)現(xiàn)新的科學知識和洞見
AI可以幫助科研人員從大量數(shù)據(jù)中挖掘潛在的模式和關聯(lián)。通過機器學習和數(shù)據(jù)挖掘技術,AI能夠識別出科學領域中的新現(xiàn)象、規(guī)律或趨勢,這些新的洞察為科研人員提供了觀察和探索的起點,激發(fā)了新的研究方向和問題。通過處理來自不同學科領域的大量數(shù)據(jù)和信息,AI能夠融合多個學科的知識和數(shù)據(jù),發(fā)現(xiàn)不同學科之間的聯(lián)系和相互影響,促進跨學科的創(chuàng)新。同時AI還為科研人員提供了許多創(chuàng)新工具和技術,例如基于深度學習的圖像識別和分析軟件、藥物虛擬篩選工具、自然語言處理的文獻綜述系統(tǒng)等。這些工具和技術可以幫助科研人員更好地處理和理解復雜的數(shù)據(jù),從而推動知識創(chuàng)新的進程。
2.3.3 提供對復雜系統(tǒng)和現(xiàn)象的解釋和預測
利用自然語言處理、文本挖掘和機器學習等技術,對復雜問題進行知識分析和解決方案生成,將知識庫中的信息與用戶問題進行匹配和推理,生成針對性的解決方案,并提供詳細的解釋和理由以增強可信度,整合專家知識和AI技術,建立專家系統(tǒng)和決策支持系統(tǒng)。通過與領域專家的合作和知識的融合,提供更加深入和全面的解決方案,同時保留專家的判斷和經(jīng)驗。
利用機器學習和反饋機制,不斷優(yōu)化和提升知識服務能力。通過分析用戶的使用數(shù)據(jù)和反饋意見,修正和更新知識模型,提高決策的準確性和針對性。要具備針對用戶復雜問題及其解決方案的認知型決策型知識服務能力,需要不斷學習和改進,從用戶需求和問題本身出發(fā),整合專家知識與技術手段,提供個性化、深入和全面的知識服務。
2.4 能力重塑:重塑基于用戶需求的感知型知識服務能力
重塑基于用戶需求的感知型知識服務能力對圖書館服務提升具有重要意義。它可以提高用戶滿意度、優(yōu)化服務質量、增加用戶參與度,支持學術研究與教學,幫助圖書館提供更精細化、個性化、高質量的知識服務,提升用戶體驗和服務質量,實現(xiàn)圖書館的可持續(xù)發(fā)展,進而推動整個圖書館行業(yè)的創(chuàng)新與進步。
2.4.1 技術培訓與教育
提供AI技術培訓,組織培訓課程,使館員了解AI技術的基本原理、應用場景和潛在價值,掌握AI在知識服務中的具體應用方法。強化AI素養(yǎng),培養(yǎng)館員對AI技術的認知和理解,使其能夠主動了解和關注AI技術的發(fā)展動態(tài),并將其運用到實際的知識服務工作中。
2.4.2 培養(yǎng)數(shù)據(jù)分析與判斷能力
培養(yǎng)館員的數(shù)據(jù)分析和判斷能力,使其能夠對大量數(shù)據(jù)進行有效整合和分析,培養(yǎng)數(shù)據(jù)驅動的決策思維,從中發(fā)現(xiàn)用戶需求和行為特征,為知識服務提供有針對性的改進和優(yōu)化策略。鼓勵館員結合用戶反饋和AI輸出進行綜合研判,準確把握用戶需求,拓展和精細化知識服務內容,提高滿意度和質量。
2.4.3 基于用戶體驗的知識服務設計
鼓勵館員與用戶保持密切聯(lián)系,定期進行用戶滿意度調研和需求分析,了解用戶對AI技術應用的期望和需求,為設計和改進知識服務提供指導。借助AI技術,培養(yǎng)館員提供個性化的知識服務能力,如通過智能推薦系統(tǒng)和智能問答系統(tǒng)提供精準、個性化的圖書推薦和問題解答服務。
3 面臨的困境與思考
3.1 語義理解和上下文理解的困境
ChatGPT等AI在語義理解和上下文理解方面仍然面臨挑戰(zhàn),存在對問題理解不準確,或者無法理解復雜的上下文信息的問題。這可能導致回答的不準確或無法滿足用戶的需求,需要不斷改進模型來提高其語義理解和上下文理解的能力,也需要優(yōu)化方法以提高回答的質量,比如提供更詳細的足夠明確和具體的問題、在問題中添加上下文、對模型的回答進行主動約束、進行迭代反饋等,避免模棱兩可的問題。對于這類問題,最好明確要求ChatGPT給出客觀事實或提供多個可能的觀點。ChatGPT生成的回答有時會存在錯誤或不準確的情況,在使用回答之前,最好對其進行人工檢查和必要的編輯,以確?;卮鸬臏蚀_性。
ChatGPT雖然強大,但仍然存在一定的局限性。持續(xù)的反饋和優(yōu)化可以幫助改善回答的質量,但在關鍵任務或重要決策中,最好仍然依靠人類專業(yè)知識和判斷。與用戶、專業(yè)人士和領域專家建立密切的合作關系,通過不斷收集反饋和經(jīng)驗教訓,改進和優(yōu)化ChatGPT的性能和回答質量。同時,持續(xù)關注最新的技術進展和研究成果,公開透明的溝通可以增加用戶對服務的信任度。
3.2 數(shù)據(jù)隱私和安全性的挑戰(zhàn)
ChatGPT在提供知識服務時需要訪問和處理用戶的數(shù)據(jù)。這可能帶來數(shù)據(jù)隱私和安全性的問題,如數(shù)據(jù)泄露、濫用等。在使用ChatGPT提供知識情報服務時,需要保護用戶的數(shù)據(jù)隱私,并采取相應的安全措施。確保ChatGPT處理用戶數(shù)據(jù)的合法性和隱私保護,遵守相關的隱私和數(shù)據(jù)保護規(guī)定。建立適當?shù)臄?shù)據(jù)存儲壁壘,保障用戶數(shù)據(jù)的安全性和保密性。
3.3 數(shù)據(jù)偏見和不公平
AI模型的訓練數(shù)據(jù)往往存在偏見和不公平性,這會導致模型在處理特定群體或敏感問題時出現(xiàn)偏差或歧視。缺乏多樣性和代表性的訓練數(shù)據(jù),以及對數(shù)據(jù)收集和處理過程的不透明性,是導致這種困境的主要原因之一。應獲取具有多樣性和代表性的訓練數(shù)據(jù),避免數(shù)據(jù)中的偏見。可以通過廣泛涵蓋不同群體、地域和文化背景的數(shù)據(jù)來提高模型的包容性和公正性。在數(shù)據(jù)預處理和模型訓練過程中,采取措施檢測和糾正潛在偏見。這可能涉及對訓練數(shù)據(jù)進行分析、使用公平性指標來評估模型輸出,以及應用公平性增強技術來平衡模型的決策。
3.4 信息可信度與錯誤傳播
AI模型在生成文本時可能受到虛假信息或誤導性內容的影響,這可能導致錯誤的信息傳播。模型的輸出缺乏審查和驗證機制,容易被濫用或誤解,對社會產生負面影響。加強對AI模型輸出的審核和驗證,確保生成文本的內容準確可信。引入領域專家或人工審核,以審查和過濾誤導性或虛假信息,需要向用戶提供關于AI技術及其應用的教育,增強信息素養(yǎng)和媒體素養(yǎng),使用戶具備判斷虛假信息和誤導性內容的能力。
3.5 法律與倫理問題
AI的廣泛應用引發(fā)了一系列法律和倫理問題,例如責任和道德、知識產權和數(shù)據(jù)使用權問題等。法律法規(guī)的滯后和對新問題適用的不確定性,使解決這些問題變得復雜而具有挑戰(zhàn)性。
4 結語
隨著AI技術的不斷發(fā)展,高校圖書館將迎來更多的機遇與挑戰(zhàn)。應保持敏銳的洞察力,緊跟時代步伐,靈活應用AI技術,推動高校圖書館知識服務體系的深度重塑。同時,要注重人文關懷,保持人類智慧的核心地位,通過合理的規(guī)劃和管理,確保AI與人類智慧的有機結合,為用戶提供豐富多樣、人性化的知識服務。
參考文獻:
[1] 喻國明,蘇健威.生成式人工智能浪潮下的傳播革命與媒介生態(tài)——從ChatGPT到全面智能化時代的未來[J].新疆師范大學學報:哲學社會科學版,2023(5):81-90.
[2] 張智雄,等.ChatGPT對文獻情報工作的影響[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2023(3):36-42.
[3] 吳建中.再議圖書館發(fā)展的十個熱門話題[J].中國圖書館學報,2017(4):4-17.
[4] 茆意宏.人工智能重塑圖書館[J].大學圖書館學報,2018(2):11-17.
[5] 張曉林.從猿到人:探索知識服務的鳳凰涅槃之路[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2023(3):1-4.
[6] 劉文艷.面向專題領域的垂直信息服務模式研究[J].信息技術與信息化,2007(1):93-95.
肖榮榮 女,1980年生。碩士,副研究館員。研究方向:智慧圖書館與知識服務。
郭晨晨 女,1985年生。碩士,館員。研究方向:數(shù)據(jù)分析與數(shù)據(jù)研究。
(收稿日期:2023-12-31;責編:劉清揚。)