• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      圖書(shū)館智能問(wèn)答系統(tǒng)分析與設(shè)計(jì)

      2021-09-30 01:26:04王學(xué)光馬愛(ài)芝王海東穆瑩雪李燕燕
      關(guān)鍵詞:管理員語(yǔ)料庫(kù)數(shù)據(jù)庫(kù)

      王學(xué)光 馬愛(ài)芝 王海東 穆瑩雪 李燕燕

      (河北建筑工程學(xué)院,河北 張家口 075000)

      0 引 言

      隨著社會(huì)的高速發(fā)展,信息的制造速度也在不斷加快.而作為公眾重要基礎(chǔ)設(shè)施之一的圖書(shū)館,有著越來(lái)越多的實(shí)體資源和電子資源,需要提供更加簡(jiǎn)單、高效、快捷、全面的功能,最大限度地為單個(gè)用戶或用戶群提供個(gè)性化信息服務(wù).

      圖書(shū)館是師生讀者獲取知識(shí)信息的重要渠道,而讀者在日常查詢(xún)圖書(shū)館資源的過(guò)程中,一些問(wèn)題不能得到及時(shí)的解答.圖書(shū)館智能問(wèn)答系統(tǒng)開(kāi)發(fā)的目的就是為了更好地滿足讀者需求和更大程度地釋放圖書(shū)館的人力資源.

      1 國(guó)內(nèi)外發(fā)展現(xiàn)狀

      智能問(wèn)答機(jī)器人是模擬人類(lèi)對(duì)話的計(jì)算機(jī)程序,研究者需要預(yù)先構(gòu)建知識(shí)庫(kù),機(jī)器接收問(wèn)題后經(jīng)過(guò)計(jì)算,返回最貼切的匹配.近年來(lái),“互聯(lián)網(wǎng)+”的快速發(fā)展悄然改變了信息服務(wù)的傳統(tǒng)方式,互聯(lián)網(wǎng)問(wèn)答社區(qū)日益興起,問(wèn)答社區(qū)以知識(shí)與經(jīng)驗(yàn)共享為目的,參與者可以關(guān)注感興趣的話題,可以提問(wèn)尋求幫助,其他用戶則可以根據(jù)自身的知識(shí)、見(jiàn)解在線給予解答.

      國(guó)外在問(wèn)答系統(tǒng)技術(shù)上的研究起步比較早,目前在工業(yè)界或者學(xué)術(shù)界已經(jīng)產(chǎn)出了一些比較成熟的問(wèn)答系統(tǒng)和聊天機(jī)器人系統(tǒng),如蘋(píng)果公司的Siri,谷歌的Google Now,微軟的Cortana,MIT大學(xué)的Start系統(tǒng),還有AskJeeves、AnswerBus、LAMP等.我國(guó)雖然發(fā)展較晚,但是發(fā)展速度很快,現(xiàn)在也出現(xiàn)了如阿里巴巴的天貓精靈、百度的小度智能音箱、小米的小愛(ài)同學(xué)等.因?yàn)閲?guó)內(nèi)巨頭紛紛布局IoT(物聯(lián)網(wǎng))產(chǎn)業(yè),其控制也都依賴(lài)于智能問(wèn)答系統(tǒng),所以智能問(wèn)答系統(tǒng)的發(fā)展?jié)摿薮?

      2 系統(tǒng)需求分析及總體設(shè)計(jì)方案

      2.1 系統(tǒng)需求分析

      圖書(shū)館智能問(wèn)答系統(tǒng)需求分析如圖1所示.用戶端群體對(duì)系統(tǒng)大致上有三個(gè)方面的需求:(1)能夠快速獲得“目標(biāo)書(shū)籍”的相關(guān)信息,信息中應(yīng)該涵蓋圖書(shū)作者、館藏地點(diǎn)、在館狀態(tài)等重要信息;(2)關(guān)于圖書(shū)館的問(wèn)題能夠得到實(shí)時(shí)反饋,用戶的提問(wèn)首先應(yīng)該符合正常的語(yǔ)言邏輯,在此前提下系統(tǒng)所反饋的結(jié)果應(yīng)該最大程度地滿足用戶需求,并且系統(tǒng)能夠推測(cè)和分析用戶問(wèn)題,凸顯出系統(tǒng)的機(jī)器智能;(3)可以滿足用戶查詢(xún)歷史信息,主要包括自己的歷史提問(wèn)以及所更新的回復(fù),更新的回復(fù)會(huì)給予用戶提示.

      圖1 圖書(shū)館智能問(wèn)答系統(tǒng)需求分析圖

      系統(tǒng)除了具備良好的使用性能外,還應(yīng)該具有靈活易用的管理機(jī)制,智能問(wèn)答系統(tǒng)中衍生出管理員版塊并將其分為“功能型管理”和“管理型管理”.功能型管理對(duì)于系統(tǒng)無(wú)法回答的問(wèn)題進(jìn)行更新維護(hù),不僅能做到問(wèn)題的集中回復(fù)和清洗,還可以充實(shí)語(yǔ)料庫(kù)優(yōu)化系統(tǒng)的學(xué)習(xí);第二,管理型管理是面向管理者的管理,也可稱(chēng)為“超級(jí)管理”,主要包括了對(duì)于普通管理員的新增、刪除、查詢(xún)等功能,兩層管理者的設(shè)置使得系統(tǒng)后端的更新維護(hù)更加穩(wěn)定.

      2.2 系統(tǒng)主要模塊功能設(shè)計(jì)

      2.2.1 用戶端功能設(shè)計(jì)

      用戶端功能設(shè)計(jì)分析如圖2所示.根據(jù)用戶端需求進(jìn)行功能設(shè)計(jì),將用戶行為進(jìn)行拆解,由于本系統(tǒng)主要面向局域網(wǎng)用戶,所以用戶在進(jìn)入系統(tǒng)前首先會(huì)進(jìn)行身份驗(yàn)證,驗(yàn)證身份后用戶進(jìn)入智能問(wèn)答的系統(tǒng)界面進(jìn)行提問(wèn).系統(tǒng)中加入了問(wèn)題識(shí)別機(jī)制,能夠分辨用戶的提問(wèn)類(lèi)型,判斷標(biāo)準(zhǔn)是問(wèn)題中是否含有指定的標(biāo)記.通俗地講,用戶的提問(wèn)含有指定標(biāo)記,則系統(tǒng)判定這條提問(wèn)是關(guān)于書(shū)籍查詢(xún)的,否則,系統(tǒng)會(huì)理解為這是一個(gè)關(guān)于圖書(shū)館的提問(wèn),判別后系統(tǒng)會(huì)自動(dòng)進(jìn)入下一環(huán)節(jié).

      圖2 用戶端功能設(shè)計(jì)分析圖

      問(wèn)題帶有標(biāo)記會(huì)觸發(fā)“查詢(xún)館藏”的算法,主要包括智能爬蟲(chóng)和數(shù)據(jù)清洗兩個(gè)步驟.首先,算法中嵌入爬蟲(chóng)框架,定義好爬蟲(chóng)的結(jié)構(gòu)并填充有關(guān)內(nèi)容,再將用戶的提問(wèn)進(jìn)行清洗,截取書(shū)目名稱(chēng)作為參數(shù)傳遞,爬蟲(chóng)獲得關(guān)鍵詞后進(jìn)行數(shù)據(jù)抓取.通過(guò)模擬瀏覽器訪問(wèn)圖書(shū)館網(wǎng)站的書(shū)目查詢(xún)系統(tǒng),再利用關(guān)鍵詞模擬人工檢索獲得資源列表,利用先前在爬蟲(chóng)算法中填充的正則表達(dá)式進(jìn)行匹配獲得有關(guān)數(shù)據(jù),拿到數(shù)據(jù)后根據(jù)需求進(jìn)行數(shù)據(jù)清洗和計(jì)算,將館藏位置、在館數(shù)量等信息封裝成json數(shù)據(jù)傳遞給前端.

      問(wèn)題若沒(méi)有標(biāo)記則會(huì)進(jìn)入“智能回復(fù)”版塊,具體的實(shí)現(xiàn)主要包括文本相似度的計(jì)算、數(shù)據(jù)庫(kù)的操縱以及多重邏輯判斷等.智能回復(fù)版塊中的難點(diǎn)在于如何使系統(tǒng)具有智能的操作,算法中為了賦予系統(tǒng)“近似”人類(lèi)的思考,添加了基于文本相似度量的多重邏輯判斷,做到將不同的問(wèn)題進(jìn)行分類(lèi).

      文本相似度計(jì)算采用TF-IDF算法和分詞算法結(jié)合的方式,首先將提問(wèn)進(jìn)行分詞,再利用TF-IDF算法進(jìn)行文本相似度計(jì)算.計(jì)算完畢取最大相似值,同時(shí)判斷該值與閾值的關(guān)系,并觸發(fā)“直接回復(fù)”、“猜你想問(wèn)”、“圖靈回答”三個(gè)路徑之一.在“直接回復(fù)”路徑,系統(tǒng)回復(fù)正確的答案,問(wèn)題答案基于語(yǔ)料庫(kù);在“猜你想問(wèn)”路徑,系統(tǒng)會(huì)根據(jù)相似度排名返回最相似的幾條問(wèn)題,用戶選擇一條記錄反饋將重新觸發(fā)“智能回復(fù)”;若問(wèn)題相似度過(guò)低并無(wú)法進(jìn)入上述兩條路徑,則問(wèn)題會(huì)歸為“圖靈回答”,此時(shí)算法會(huì)調(diào)用圖靈機(jī)器人,將圖靈回復(fù)的數(shù)據(jù)傳遞給用戶.

      后端算法中加入數(shù)據(jù)庫(kù)操縱機(jī)制,建立系統(tǒng)與數(shù)據(jù)庫(kù)的聯(lián)系,該模塊主要是用戶行為記錄表和語(yǔ)料庫(kù)表的使用:(1)將用戶的行為記錄用于歷史數(shù)據(jù)的查詢(xún),系統(tǒng)依靠該數(shù)據(jù)表實(shí)現(xiàn)了歷史查詢(xún)的功能,可以滿足用戶查詢(xún)歷史數(shù)據(jù);(2)系統(tǒng)依照已經(jīng)設(shè)定好的關(guān)鍵詞對(duì)用戶提問(wèn)進(jìn)行分析,該機(jī)制可分辨出有意義的問(wèn)題并留存,該類(lèi)未回答問(wèn)題將由后臺(tái)管理員進(jìn)行回答并同時(shí)補(bǔ)充進(jìn)語(yǔ)料庫(kù)供系統(tǒng)學(xué)習(xí)使用.管理者進(jìn)行未回答問(wèn)題維護(hù)后,系統(tǒng)會(huì)進(jìn)行數(shù)量統(tǒng)計(jì),待用戶下一次登錄時(shí)反饋給用戶歷史問(wèn)題的更新數(shù)量,用戶可以點(diǎn)擊對(duì)歷史數(shù)據(jù)進(jìn)行查看.

      2.2.2 管理端功能設(shè)計(jì)

      管理員端功能設(shè)計(jì)分析如圖3所示.本模塊主要包括管理員的基本操作和超級(jí)管理員的必要操作,在具體實(shí)現(xiàn)中重要部分是代碼和數(shù)據(jù)庫(kù)的關(guān)聯(lián),算法主要依靠數(shù)據(jù)庫(kù)操縱語(yǔ)言進(jìn)行系列操作.由于管理員具有一定的高級(jí)功能,所以在登錄過(guò)程中還是需要進(jìn)行驗(yàn)證的,并且在超級(jí)管理員登錄時(shí)實(shí)現(xiàn)了二次驗(yàn)證.

      圖3 管理員端功能設(shè)計(jì)分析圖

      超級(jí)管理員與普通管理員同時(shí)具有基本功能,包括問(wèn)題的回答和選擇刪除,這兩者的實(shí)現(xiàn)主要是通過(guò)用戶行為記錄表和語(yǔ)料庫(kù)表進(jìn)行關(guān)聯(lián),未回答的問(wèn)題得到管理員的回答后,首先會(huì)填充進(jìn)語(yǔ)料庫(kù),這一過(guò)程使語(yǔ)料庫(kù)愈加完整;其次在用戶行為記錄表中記錄該回答,并且將該條信息的閱讀狀態(tài)置為用戶未讀,以便計(jì)算未讀數(shù)量.

      普通管理員只實(shí)現(xiàn)最基本的功能,而超級(jí)管理員比普通管理員實(shí)現(xiàn)更多操作,例如管理員的新增、刪除和查詢(xún)等功能,算法中主要是嵌入了數(shù)據(jù)庫(kù)操縱語(yǔ)言并關(guān)聯(lián)管理員表進(jìn)行實(shí)現(xiàn),這一部分的難點(diǎn)是數(shù)據(jù)庫(kù)連接與操作,算法中設(shè)立了提交和回滾機(jī)制,數(shù)據(jù)庫(kù)操縱語(yǔ)句生成后會(huì)連接數(shù)據(jù)庫(kù)進(jìn)行提交操作,為了防止數(shù)據(jù)庫(kù)執(zhí)行語(yǔ)句進(jìn)行數(shù)據(jù)批量操作時(shí)報(bào)錯(cuò),設(shè)置了回滾操作來(lái)優(yōu)化數(shù)據(jù)庫(kù).

      2.2.3 數(shù)據(jù)庫(kù)端設(shè)計(jì)

      數(shù)據(jù)庫(kù)端設(shè)計(jì)分析如圖4所示.數(shù)據(jù)庫(kù)的建設(shè)是系統(tǒng)穩(wěn)定運(yùn)行的基本保障,由于數(shù)據(jù)庫(kù)串聯(lián)各個(gè)功能,無(wú)論是用戶行為還是管理者行為都會(huì)涉及數(shù)據(jù)庫(kù)的操縱,但歸根結(jié)底數(shù)據(jù)庫(kù)無(wú)非是數(shù)據(jù)的增刪改查,算法中嵌入數(shù)據(jù)庫(kù)操縱語(yǔ)言來(lái)進(jìn)行代碼與數(shù)據(jù)庫(kù)的交流,系統(tǒng)開(kāi)發(fā)中建立了本地MySQL數(shù)據(jù)庫(kù)并通過(guò)3306端口進(jìn)行訪問(wèn).

      圖4 數(shù)據(jù)庫(kù)端設(shè)計(jì)分析圖

      系統(tǒng)數(shù)據(jù)庫(kù)中主要建立了三張數(shù)據(jù)表,分別是用戶行為記錄表、語(yǔ)料庫(kù)表、管理員表,表中字段依照需求進(jìn)行編輯和設(shè)計(jì).

      用戶行為記錄表記錄的是用戶進(jìn)行的操作,如表1所示,以用戶的一次提問(wèn)為單位,進(jìn)行一次提問(wèn)數(shù)據(jù)表中就會(huì)增加該條記錄;管理員表中記錄的是管理員的相關(guān)信息,如表2所示,主要包括管理員的個(gè)人信息和管理類(lèi)型以及設(shè)立時(shí)間等內(nèi)容;語(yǔ)料庫(kù)表記錄的是先前準(zhǔn)備的語(yǔ)料,如表3所示,主要內(nèi)容是有關(guān)于圖書(shū)館的問(wèn)題和答案,其中以問(wèn)題ID作為標(biāo)識(shí),每一個(gè)ID對(duì)應(yīng)一個(gè)問(wèn)題.

      表1 用戶行為記錄表

      表2 管理員表

      表3 語(yǔ)料庫(kù)表

      2.2.4 智能問(wèn)答系統(tǒng)總體設(shè)計(jì)說(shuō)明

      (1)本系統(tǒng)采用Python Flask框架進(jìn)行開(kāi)發(fā),通過(guò)程序中定義接口實(shí)現(xiàn)具體功能,依照功能需求進(jìn)行設(shè)計(jì).

      (2)Login接口:用于用戶的登錄操作,在接口中定義了身份驗(yàn)證功能,用賬號(hào)和密碼進(jìn)行圖書(shū)館官網(wǎng)的模擬登錄,拿到cookie判斷登錄狀態(tài),若cookie顯示成功登錄,那么程序會(huì)返回一個(gè)狀態(tài)碼標(biāo)記用戶成功登錄,同時(shí)login接口中也定義了管理員的身份驗(yàn)證機(jī)制,不同的身份都會(huì)對(duì)應(yīng)不同的狀態(tài)碼標(biāo)記.

      (3)answer接口:用于回答用戶的問(wèn)題以及記錄用戶行為,首先獲得用戶賬號(hào)以及提問(wèn),判斷用戶的提問(wèn)是否具有標(biāo)記,若帶標(biāo)記則截取書(shū)目關(guān)鍵詞進(jìn)行爬蟲(chóng)操作獲取數(shù)據(jù),若不帶標(biāo)記則進(jìn)行提問(wèn)與語(yǔ)料庫(kù)的文本相似度計(jì)算,根據(jù)計(jì)算結(jié)果進(jìn)入不同的回答渠道并進(jìn)行不同的標(biāo)記.

      (4)myquestion接口:用于用戶查詢(xún)歷史記錄,用戶觸發(fā)該功能接口時(shí),會(huì)根據(jù)用戶賬號(hào)構(gòu)造數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)句,同時(shí)提交到數(shù)據(jù)庫(kù)執(zhí)行,獲取數(shù)據(jù)后將其封裝成json格式傳送,并將數(shù)據(jù)庫(kù)中該用戶的所有提問(wèn)未讀狀態(tài)更改為已讀狀態(tài).

      (5)number接口:用于向用戶提示未讀信息的數(shù)量,用戶登錄成功的同時(shí)會(huì)自動(dòng)觸發(fā)該功能接口,程序獲得用戶賬號(hào)后構(gòu)造數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)句并提交到數(shù)據(jù)庫(kù)進(jìn)行執(zhí)行,計(jì)算管理員回復(fù)但未讀狀態(tài)的記錄數(shù)量,并將其封裝傳送給前端界面.

      (6)reply接口:用于管理員的回復(fù)問(wèn)題操作,管理員觸發(fā)該功能接口后,程序會(huì)查詢(xún)并計(jì)算出未得到回答的問(wèn)題,獲取未回答問(wèn)題及其問(wèn)題ID,將數(shù)據(jù)集進(jìn)行封裝傳遞給前端界面.

      (7)Submission接口:用于管理員回復(fù)問(wèn)題后的提交操作,管理員回答完畢后點(diǎn)擊觸發(fā)該接口,程序拿到問(wèn)題ID和答案,同時(shí)將數(shù)據(jù)格式進(jìn)行轉(zhuǎn)化,并將每條信息對(duì)應(yīng)寫(xiě)成數(shù)據(jù)庫(kù)更新語(yǔ)句提交執(zhí)行.

      (8)Delete_question接口:用于管理員刪除問(wèn)題,管理員選擇要?jiǎng)h除的問(wèn)題并點(diǎn)擊觸發(fā)該功能接口,程序會(huì)獲得需要?jiǎng)h除的問(wèn)題ID,獲得問(wèn)題ID后程序自動(dòng)生成數(shù)據(jù)庫(kù)刪除語(yǔ)句并提交執(zhí)行.

      (9)Increase接口:用于超級(jí)管理員進(jìn)行新增管理員操作,超級(jí)管理員錄入新增管理員的基本信息后點(diǎn)擊提交,系統(tǒng)獲取該數(shù)據(jù)后自動(dòng)生成數(shù)據(jù)庫(kù)執(zhí)行語(yǔ)句并提交,由于超級(jí)管理權(quán)限較高,不能隨意增加超級(jí)管理,本系統(tǒng)的超級(jí)管理員是從數(shù)據(jù)庫(kù)底層進(jìn)行設(shè)置的.

      (10)Delete接口:用于超級(jí)管理員刪除普通管理員的操作,觸發(fā)該功能接口時(shí),程序會(huì)再一次驗(yàn)證是否為超級(jí)管理員,這一步為了防止直接調(diào)用接口進(jìn)行惡意攻擊,程序獲取到需要?jiǎng)h除的普通管理的賬戶,通過(guò)數(shù)據(jù)庫(kù)操縱進(jìn)行刪除操作.

      (11)Query接口:此接口用于超級(jí)管理員的查詢(xún)普通管理員信息的操作,觸發(fā)此接口時(shí)程序會(huì)獲取所有管理員的數(shù)據(jù),封裝后傳送給前端.

      (12)Del_cookie接口:此接口用于用戶和管理員退出操作,由于用戶和管理員登錄系統(tǒng)都需要驗(yàn)證,驗(yàn)證通過(guò)后程序會(huì)賦予用戶或管理員一個(gè)cookie,用戶和管理員拿到cookie后才能正常訪問(wèn)接口執(zhí)行功能.這些cookie記錄于系統(tǒng)緩存中,用戶退出登錄時(shí),需要清除掉這些緩存數(shù)據(jù).

      3 結(jié) 語(yǔ)

      高校圖書(shū)館是高校師生獲取知識(shí)的重要方式,圖書(shū)館的智能問(wèn)答系統(tǒng)能較實(shí)時(shí)和準(zhǔn)確地為用戶服務(wù),從而在一定程度上推動(dòng)了圖書(shū)館資源利用.在系統(tǒng)開(kāi)發(fā)中,除了可以進(jìn)行人機(jī)對(duì)話之外,還可以進(jìn)行書(shū)目信息的查詢(xún).系統(tǒng)優(yōu)化了管理者對(duì)于系統(tǒng)的管理,設(shè)置了超級(jí)管理員與普通管理員及其相應(yīng)的系列操作,主要通過(guò)各類(lèi)接口以及數(shù)據(jù)庫(kù)操縱進(jìn)行實(shí)現(xiàn).

      隨著互聯(lián)網(wǎng)以及人工智能的發(fā)展,機(jī)器會(huì)逐漸取代人工完成一些繁瑣并且重復(fù)性較高的工作,這是時(shí)代進(jìn)步的體現(xiàn).當(dāng)然,隨著人工智能更深入地發(fā)展,會(huì)有越來(lái)越多智能系統(tǒng)出世,本系統(tǒng)的開(kāi)發(fā)雖然已經(jīng)達(dá)到了基本的使用效果,但隨著時(shí)代的進(jìn)步,針對(duì)圖書(shū)館的智能問(wèn)答系統(tǒng)或者其他智能系統(tǒng)必然還會(huì)有更大地提升.

      猜你喜歡
      管理員語(yǔ)料庫(kù)數(shù)據(jù)庫(kù)
      我是小小午餐管理員
      我是圖書(shū)管理員
      我是圖書(shū)管理員
      《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
      可疑的管理員
      把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      丰台区| 镇雄县| 永善县| 河间市| 海淀区| 麟游县| 红安县| 宣城市| 金山区| 个旧市| 东安县| 盐边县| 漳浦县| 尼勒克县| 永泰县| 从江县| 延吉市| 腾冲县| 咸宁市| 长阳| 嘉兴市| 璧山县| 大港区| 太和县| 富源县| 开鲁县| 福安市| 通江县| 时尚| 句容市| 郓城县| 双柏县| 徐水县| 榆社县| 清徐县| 阿鲁科尔沁旗| 陆丰市| 油尖旺区| 遂溪县| 连平县| 临湘市|