潘瑜
(中共太原市委黨校,山西 太原 030000)
近年來,圖書館的數(shù)字化技術(shù)已經(jīng)日趨發(fā)展完善,不論是從技術(shù)上還是概念上,已經(jīng)達(dá)到了飽和狀態(tài),各種數(shù)字圖書館層出不窮,而各個(gè)數(shù)字圖書館之間的差距,大多為藏書量的差距,人工智能AI 的數(shù)字圖書館已經(jīng)進(jìn)入人們的視野。ChatGPT 作為AI 的一項(xiàng)重要產(chǎn)物,自2022-11-30 上線起,僅兩個(gè)月活躍用戶數(shù)就已經(jīng)突破1 億,震驚世界。伴隨著ChatGPT 的興起,ChatGPT 在圖書管理方面的應(yīng)用前景廣闊,尤其是在建立智慧圖書館方面有著不可替代的作用。
ChatGPT 是由美國OpenAI 公司自主研發(fā)誕生的一款聊天機(jī)器人。ChatGPT 是人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具,使用了Transformer 神經(jīng)網(wǎng)絡(luò)架構(gòu)。其能夠理解和學(xué)習(xí)人類語言,并能夠根據(jù)學(xué)習(xí)語言的情況和人類進(jìn)行對(duì)話,根據(jù)聊天的上下文進(jìn)行互動(dòng),就好像和真人在對(duì)話一樣。經(jīng)過擴(kuò)展功能的ChatGPT甚至能完成編寫郵件、編寫視頻腳本、編寫文案、翻譯文獻(xiàn)、編寫代碼等工作。目前ChatGPT 在生活中的運(yùn)用,除日常聊天助手外,也被廣泛用于在線教育、新聞生成、代碼輔助編寫等多個(gè)領(lǐng)域。
ChatGPT 特有的優(yōu)勢,使其受到人類的青睞和喜愛:①自然語言處理能力。ChatGPT 可以理解和生成接近人類水平的文本,使其能夠與用戶進(jìn)行流暢的交互。在某些測試情境下,ChatGPT 在教育場景、考試場景等方面的回答結(jié)果比一般人類都要好。②多任務(wù)適應(yīng)性。由于其龐大的訓(xùn)練數(shù)據(jù)和強(qiáng)大的模型結(jié)構(gòu),使其可以應(yīng)對(duì)多種任務(wù),從簡單問答到復(fù)雜的文本生成。③實(shí)時(shí)交互能力。與傳統(tǒng)搜索引擎不同,ChatGPT可以實(shí)時(shí)響應(yīng)用戶請(qǐng)求,提供即時(shí)反饋??梢哉f,ChatGPT 的出現(xiàn)極大地滿足了人類對(duì)于人工智能的期待,為包括圖書館在內(nèi)的許多場所和產(chǎn)業(yè)催生內(nèi)動(dòng)力。一方面,可以強(qiáng)化用戶的學(xué)習(xí)欲望,進(jìn)一步豐富展現(xiàn)內(nèi)容,并且增強(qiáng)知識(shí)的動(dòng)態(tài)性和可交互性,最終使得圖書館業(yè)務(wù)更加信息化和個(gè)性化。另一方面,ChatGPT的智能化可以彌補(bǔ)人類在圖書管理工作中的缺失,從而幫助圖書館服務(wù)更加全面化。
ChatGPT 作為一款人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具,其本身具有強(qiáng)大的對(duì)話功能,可以直接實(shí)現(xiàn)與人類的對(duì)話、體會(huì)人類的思維,可以在底層上與人類實(shí)現(xiàn)基本對(duì)話。在基本對(duì)話的基礎(chǔ)上,可以衍生出圖書機(jī)器人,幫助人類完成圖書借閱、歸還、查詢、預(yù)定等功能,這樣相當(dāng)于多了一個(gè)能夠自主對(duì)話的機(jī)器人客服。其不僅可以處理日常的咨詢和投訴,還可以為用戶提供圖書的相關(guān)幫助。例如,當(dāng)用戶不確定如何使用圖書編碼等專業(yè)內(nèi)容來查詢書籍時(shí),ChatGPT可以為用戶提供指導(dǎo)和建議。除以上基本方面外,由于ChatGPT 具有人工智能及自主學(xué)習(xí)功能,加之其強(qiáng)大的底層數(shù)據(jù)庫,其中會(huì)包含海量的圖書數(shù)據(jù),因此在圖書借閱方面,ChatGPT 可以通過查詢強(qiáng)大的底層數(shù)據(jù)庫,鎖定目標(biāo)圖書,并盡快呈現(xiàn)在讀者面前。ChatGPT 作為一項(xiàng)新興技術(shù),可以有效地將圖書館的業(yè)務(wù)層級(jí)式推進(jìn),最終實(shí)現(xiàn)智能化[1]。
一本圖書如何發(fā)揮最大用處,就是讓讀者能夠看到內(nèi)心最需要的內(nèi)容。一方面,ChatGPT 擁有所有書籍的全部內(nèi)容,其可以通過AI 智能,自我學(xué)習(xí)書籍的全部內(nèi)容,并且能夠通過人工智能技術(shù),將圖書內(nèi)容標(biāo)簽化,同時(shí)抓取圖書內(nèi)容的側(cè)重點(diǎn),最終提取出該圖書較為完全的特征。這些特征可以使其在與人類對(duì)話過程中被程序所加以使用,盡快找到用戶所需要的內(nèi)容。
作為一款能夠?qū)υ挼娜斯ぶ悄軝C(jī)器,用戶可以直接與ChatGPT 進(jìn)行對(duì)話。在工作中,用戶可以直接將自己想要學(xué)習(xí)的內(nèi)容與ChatGPT 進(jìn)行對(duì)話,即使是通過模糊查詢對(duì)話,ChatGPT 也能通過與用戶對(duì)話中所表達(dá)的需求和細(xì)微差別,推薦更為適合讀者的書籍。隨著個(gè)人學(xué)習(xí)進(jìn)度的推進(jìn),ChatGPT 還可以根據(jù)讀者對(duì)知識(shí)的理解程度,及時(shí)調(diào)整閱讀書籍,所以在某種程度上,ChatGPT 能夠根據(jù)讀者的需要及掌握程度,將藏書內(nèi)容作用發(fā)揮到最大化,以助于人們進(jìn)一步理解和掌握知識(shí)。例如,許多讀者在查找資料或書籍時(shí),可能不清楚具體的書名或作者,但可以描述其想要查找的具體內(nèi)容,ChatGPT 可以根據(jù)讀者的描述,甚至結(jié)合讀者的喜好、年齡、文化水平及所涉及書籍的難易程度,快速地為其提供相關(guān)書籍或資料建議,這樣有助于節(jié)約時(shí)間,提高圖書利用率,進(jìn)而使圖書館更加高效化、便捷化。
作為圖書管理員,圖書的編碼分類是確保圖書館書籍有序排列的關(guān)鍵。傳統(tǒng)上,這一任務(wù)需要圖書管理員依靠人工完成。但是利用ChatGPT 結(jié)合計(jì)算機(jī)技術(shù),特別是深度學(xué)習(xí)算法,可以自動(dòng)識(shí)別書籍內(nèi)容,并為其分配適當(dāng)?shù)姆诸惥幋a。具體功能如下:①快速推薦目標(biāo)書籍。ChatGPT 能夠根據(jù)閱讀歷史、瀏覽歷史等數(shù)據(jù),自動(dòng)識(shí)別用戶的興趣愛好、行為方式、潛在需求等,在最短的時(shí)間內(nèi),向用戶提供更為適合的圖書和文獻(xiàn)資源。②自動(dòng)摘要與分類。ChatGPT 可以通過處理數(shù)據(jù),自動(dòng)生成書籍、文章和其他資源的文摘,方便用戶更快捷地找到所需要的資源。同時(shí),能夠根據(jù)內(nèi)容等不同類別,對(duì)新進(jìn)入圖書館庫藏的書籍進(jìn)行分類,提高圖書館的信息管理效率。當(dāng)新錄入圖書時(shí),ChatGPT 可以自動(dòng)分析書籍內(nèi)容,盡快對(duì)圖書進(jìn)行分類,為圖書打上合適的標(biāo)簽及檢索關(guān)鍵詞,從而幫助圖書管理員更加高效地進(jìn)行書籍管理。③強(qiáng)大的糾錯(cuò)功能。ChatGPT 可以用來自動(dòng)檢測并糾正錯(cuò)誤或過時(shí)的圖書編碼。例如,如果二月河的小說《康熙大帝》在不知情的情況下,很容易被編入歷史文獻(xiàn)這一類別從而造成錯(cuò)誤,而ChatGPT 可以通過分析書籍的內(nèi)容、標(biāo)題和作者等信息來自動(dòng)修正這一錯(cuò)誤,確保分類科學(xué)無誤。同時(shí),當(dāng)書籍出現(xiàn)多次印刷及不同版本時(shí),ChatGPT 可以自動(dòng)獲取內(nèi)容上的不同,并且根據(jù)人工學(xué)習(xí)推薦給讀者更貼合實(shí)際的版本,從而避免一些錯(cuò)誤知識(shí)。④智能翻譯。尤其是對(duì)外國文獻(xiàn),可以通過ChatGPT 實(shí)現(xiàn)較為準(zhǔn)確的翻譯,打破語言壁壘和障礙,強(qiáng)化圖書的可利用性[2]。
ChatGPT 擁有強(qiáng)大的語言模型,這種語言模型可以有效運(yùn)用于圖書管理工作中。把現(xiàn)有的圖書館數(shù)字資源整合到ChatGPT 的語言模型之中,為數(shù)字圖書館時(shí)代提供了豐富的想象力。豐富的館藏資源和計(jì)算機(jī)技術(shù)的融合以及人機(jī)交互,需要一個(gè)長久的訓(xùn)練,而ChatGPT 語言模型把這種人機(jī)交互漫長而復(fù)雜的訓(xùn)練過程變得更短,以往需要很多數(shù)據(jù)去不斷地進(jìn)行訓(xùn)練,現(xiàn)在運(yùn)用人工智能技術(shù)進(jìn)行機(jī)器訓(xùn)練,可以進(jìn)一步解放圖書管理員,讓人工智能來處理各個(gè)環(huán)節(jié),既能提高效率,又能降低錯(cuò)誤率。例如,利用AI 完成對(duì)館內(nèi)藏書的自動(dòng)清點(diǎn),可有助于用戶對(duì)所需資源的信息進(jìn)行實(shí)時(shí)快速查找,使館藏資源的檢索效率得以大幅增強(qiáng)。
數(shù)據(jù)體量較大。由于ChatGPT 需要的數(shù)據(jù)較為詳細(xì),加之現(xiàn)有的數(shù)據(jù)分析處理后,新生成的數(shù)據(jù)也會(huì)占有一定體量的存儲(chǔ)體積。因此,使用ChatGPT 需要有海量的存儲(chǔ)空間。所以在這個(gè)方面,ChatGPT 對(duì)于現(xiàn)有的書籍?dāng)?shù)據(jù)量來說,需要在存儲(chǔ)技術(shù)上運(yùn)用更為先進(jìn)的技術(shù),例如云存儲(chǔ)。
算法復(fù)雜。ChatGPT 能夠有如此出眾的表現(xiàn),少不了人工智能算法模型。近些年來,人工智能生成算法主要涉及生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)、擴(kuò)散模型(Diffusion Model)、神經(jīng)網(wǎng)絡(luò)模型(Transformer)、跨模態(tài)深度學(xué)習(xí)模型(Contrastive Language-Image Pre-Training,CLIP)等。其中,GAN 模型主要通過對(duì)真假數(shù)據(jù)的反復(fù)對(duì)抗訓(xùn)練,從而使機(jī)器變得更為智能,這種算法主要在圖像、視頻和語音生成方面應(yīng)用較多。Diffusion Model 模型主要能夠讓AI 圖像生成質(zhì)量更高、速度更快,例如現(xiàn)在ChatGPT 生成的AI 繪圖就是運(yùn)用這種技術(shù)。Transformer 模型的出現(xiàn)使得生成算法模型可擴(kuò)展性更強(qiáng),并更加適應(yīng)并發(fā)運(yùn)算。CLIP 模型主要運(yùn)用于文本、圖像、視頻之間的互相轉(zhuǎn)換,使得ChatGPT 有著更為豐富的應(yīng)用場景。大多數(shù)模型都是應(yīng)用了以上算法,使得ChatGPT 技術(shù)能力產(chǎn)生了質(zhì)的飛躍,可以運(yùn)用于多種場景。當(dāng)然,在語言交流方面,自然語言處理技術(shù)(NLP)是ChatGPT 能夠與人類正常交流對(duì)話的重要技術(shù)。在這項(xiàng)技術(shù)出現(xiàn)之前,人類必須通過計(jì)算機(jī)指令和語言同計(jì)算機(jī)進(jìn)行交流,且交流內(nèi)容較為簡單,對(duì)語法要求也較為苛刻。而隨著NLP 的應(yīng)用發(fā)展,計(jì)算機(jī)具有了人類語言理解能力,能夠通過識(shí)別、認(rèn)知、理解,呈現(xiàn)出人類可以理解的生成結(jié)果。目前NLP 主要應(yīng)用于聊天機(jī)器人、語音識(shí)別、機(jī)器翻譯等。以上功能的實(shí)現(xiàn),完全離不開算法和語言處理模式。當(dāng)前這些算法和語言處理還有很多需要完善的地方,例如對(duì)于人類底層感情的捕捉等,這就導(dǎo)致這個(gè)工具雖然擁有了一定的智能化,但距完全智能化仍有一定差距。這些都是目前ChatGPT 應(yīng)用在圖書館領(lǐng)域存在的不足[3]。
隱私容易泄露。由于ChatGPT 的特性,會(huì)存在一系列潛在的隱私方面的問題。例如,在銀行業(yè)已暴露出跨境數(shù)據(jù)泄露等風(fēng)險(xiǎn)。同樣,在圖書館管理中,使用人員的隱私,包括愛好、習(xí)慣等方面,可能也會(huì)被ChatGPT 搜集,如果不加以保護(hù),很容易被不法分子所利用。
復(fù)雜查詢?nèi)蝿?wù)處理能力不強(qiáng)。盡管ChatGPT 可以處理大多數(shù)的查詢?nèi)蝿?wù),但由于機(jī)器語言仍然處在一個(gè)弱人工智能階段,即使是ChatGPT,也是依賴于強(qiáng)大的數(shù)據(jù)庫及長時(shí)間訓(xùn)練的機(jī)器運(yùn)算。因此,在一些特定情況下,其也可能會(huì)提供不準(zhǔn)確的信息。例如,在借閱者使用中文與英文時(shí),可能出現(xiàn)的結(jié)果并不相同,存在一定差別。同時(shí),對(duì)于一個(gè)問題的描述,使用不同的語言習(xí)慣、對(duì)于所需要的書籍描述的復(fù)雜和詳細(xì)程度,也會(huì)導(dǎo)致結(jié)果不同。甚至如果輸入的語言中存在一些錯(cuò)誤或語法問題,也有可能會(huì)導(dǎo)致生成錯(cuò)誤答案。
數(shù)據(jù)同步更新能力弱。隨著新書籍的加入和舊書籍的淘汰,圖書館的數(shù)據(jù)庫會(huì)不斷更新。但是,ChatGPT只是會(huì)根據(jù)人類的指令及數(shù)據(jù)庫的內(nèi)容進(jìn)行回答,并不會(huì)自動(dòng)更新數(shù)據(jù)庫并進(jìn)行學(xué)習(xí),所以ChatGPT 可能無法實(shí)時(shí)同步更新數(shù)據(jù),導(dǎo)致查詢結(jié)果出現(xiàn)偏差。
服務(wù)對(duì)象有特定性。ChatGPT 初期針對(duì)的人群,是一些具有較高電腦技術(shù)和操作水平的人員,對(duì)于那些不具備強(qiáng)大電腦操作能力的人群來說,這種方式很難融入到他們正常的圖書閱讀生活中,其可能更傾向于采用人工方式進(jìn)行圖書借閱和管理,對(duì)于這部分使用人群,ChatGPT 的功能并不友好。
根據(jù)上述存在的問題,需要通過以下手段進(jìn)行解決。
定期更新ChatGPT 的模型。隨著人類研究的不斷深入,語言模型、計(jì)算模型等將會(huì)進(jìn)一步進(jìn)行優(yōu)化,使其更加準(zhǔn)確和高效。例如ChatGPT 從3.5 版本演化到4.0 版本,就是模型的飛躍。同時(shí),ChatGPT 在進(jìn)行訓(xùn)練和編寫時(shí),更加考慮符合中文表達(dá)習(xí)慣,從而使其對(duì)中文信息內(nèi)容有更好的理解。
人工審核加以輔助。弱人工智能需要通過不斷學(xué)習(xí)進(jìn)行提升,但受訓(xùn)練次數(shù)、數(shù)據(jù)源的影響,其學(xué)習(xí)效能受限。因此人們不能完全依賴于ChatGPT 的結(jié)果,部分較為重要的查詢內(nèi)容,還需要通過人工審核,定期對(duì)ChatGPT 人工對(duì)話的內(nèi)容進(jìn)行抽樣檢查,從而確保其準(zhǔn)確性。由此可見,在強(qiáng)人工智能時(shí)代沒有到來之前,對(duì)于ChatGPT 所生成的內(nèi)容進(jìn)行人工審核非常必要。
深度學(xué)習(xí)訓(xùn)練。認(rèn)真利用讀者提供的反饋,不斷完善ChatGPT 在圖書管理工作中的應(yīng)用及學(xué)習(xí),通過對(duì)ChatGPT 進(jìn)行不斷深度學(xué)習(xí)訓(xùn)練,同時(shí)對(duì)反饋的問題也進(jìn)行多次學(xué)習(xí),確保其能夠準(zhǔn)確理解并處理后續(xù)對(duì)話。
數(shù)據(jù)庫保持與實(shí)際數(shù)據(jù)實(shí)時(shí)同步。通過計(jì)算機(jī)技術(shù),可以設(shè)置自動(dòng)同步機(jī)制,及時(shí)更新ChatGPT 的數(shù)據(jù)庫,確保ChatGPT 的數(shù)據(jù)庫始終與圖書館的實(shí)際數(shù)據(jù)保持一致。
采用ChatGPT 輔助并行模式。對(duì)于圖書管理服務(wù)來說,不能單一采用ChatGPT 或單純的人工模式。采用混合模式,既能夠提升圖書的管理效率,還能有效彌補(bǔ)服務(wù)對(duì)象特定性的問題。
綜上,以ChatGPT 為標(biāo)志的AI 技術(shù)將為圖書館注入新的活力。本文從技術(shù)創(chuàng)新層面探討了ChatGPT在圖書館中的應(yīng)用,分析了其優(yōu)勢和不足,并提出了解決措施,力求為圖書管理工作帶來創(chuàng)新和提升,使其能夠更好地為圖書館和讀者服務(wù)。未來,基于ChatGPT 技術(shù)應(yīng)用于圖書館,用戶一定會(huì)獲得更佳體驗(yàn),從而進(jìn)一步提升圖書館的使用效率,為其發(fā)展注入新活力。