摘要:傳統(tǒng)查詢系統(tǒng)未在語(yǔ)義相似度上進(jìn)行探討,已不能滿足圖書館智能化發(fā)展需求。為此,設(shè)計(jì)一種基于詞匯樹(shù)檢索的圖書館書目智能查詢系統(tǒng),用戶在用戶管理模塊登錄自己賬號(hào)進(jìn)入圖書館主頁(yè),在圖書館主頁(yè)進(jìn)到提問(wèn)式書目查詢界面,選取分類查詢途徑輸入分類號(hào),用戶上傳分類號(hào)之后書目數(shù)據(jù)庫(kù)通過(guò)基于詞匯樹(shù)的書目查詢方法,判斷查詢書目與書目數(shù)據(jù)庫(kù)中書目的相似度,完成書目智能查詢,最后用戶在查詢結(jié)果界面可查看查詢結(jié)果。經(jīng)驗(yàn)證,所設(shè)計(jì)系統(tǒng)可高效率地區(qū)性完成高精度的圖書館書目智能查詢?nèi)蝿?wù),且查詢操作簡(jiǎn)單易行,查詢性能顯著優(yōu)于同類查詢系統(tǒng)。
關(guān)鍵詞:圖書館書目;智能查詢;詞匯樹(shù)檢索;系統(tǒng)設(shè)計(jì);書目數(shù)據(jù)庫(kù);對(duì)比分析
中圖分類號(hào):TN915-34; TP391
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-373X( 2019)24-0180-03
0 引 言
伴隨信息化社會(huì)的發(fā)展腳步,提取與共享信息成為人們工作生活的重要組成部分[1]。在這信息繁雜的生活背景下,人們?cè)鯓痈咝c快速地獲取信息是目前科研人員關(guān)注的熱點(diǎn)問(wèn)題[2]。
現(xiàn)圖書館信息查詢系統(tǒng)存在查詢效率低的缺點(diǎn),為進(jìn)一步提升查詢效率,本文設(shè)計(jì)一種基于詞匯樹(shù)檢索的圖書館書目智能查詢系統(tǒng),以期實(shí)現(xiàn)高精度、高效率且操作簡(jiǎn)單的圖書館書目智能查詢[3]。
1 圖書館書目智能查詢系統(tǒng)設(shè)計(jì)
1.1 系統(tǒng)硬件設(shè)計(jì)
本文設(shè)計(jì)的查詢系統(tǒng)由用戶管理模塊、書目分類導(dǎo)航模塊以及數(shù)據(jù)庫(kù)構(gòu)成[4]。用戶進(jìn)到提問(wèn)式書目查詢界面,輸入分類號(hào),在查詢結(jié)果界面即可查看結(jié)果。系統(tǒng)整體結(jié)構(gòu)圖如圖1所示。
1)用戶管理模塊
此模塊用于管理用戶信息,為其修改密碼,建立檔案[5]。用戶管理模塊的整體結(jié)構(gòu)圖見(jiàn)圖2。
2)書目分類導(dǎo)航模塊
書目分類導(dǎo)航模塊整體結(jié)構(gòu)圖如圖3所示。
為了確保書目分類導(dǎo)航模塊完成五項(xiàng)基本功能,構(gòu)建《中國(guó)圖書館分類法》。用戶進(jìn)入提問(wèn)式書目查詢界面,選取分類號(hào),之后通過(guò)書目對(duì)數(shù)據(jù)庫(kù)查詢。用戶通過(guò)超鏈接進(jìn)到三級(jí)類目導(dǎo)航界面后進(jìn)到查詢程序,向書目數(shù)據(jù)庫(kù)傳輸查詢申請(qǐng)[6-8]。
3)數(shù)據(jù)庫(kù)
因?yàn)閳D書館數(shù)據(jù)庫(kù)中存在的數(shù)據(jù)量較大,本文使用Access數(shù)據(jù)庫(kù)構(gòu)建數(shù)據(jù)庫(kù)ztf.mdb,當(dāng)中包含《中國(guó)圖書館分類法》表ztf.dbf與分類統(tǒng)計(jì)表fltj.dbf,詳情見(jiàn)表1和表2。
1.2 系統(tǒng)軟件設(shè)計(jì)
系統(tǒng)軟件部分使用基于詞匯樹(shù)的方法。向SIFT特征訓(xùn)練庫(kù)實(shí)行分層K-means聚類,獲取層數(shù)有分支因子依次是A與B的詞匯樹(shù),標(biāo)記成C(A,B)。此詞匯樹(shù)里的各個(gè)節(jié)點(diǎn)都描述一個(gè)書目單詞ur,其中,上標(biāo)Z描述此節(jié)點(diǎn)在詞匯里所處的層數(shù),上標(biāo)ht描述此節(jié)點(diǎn)在此層數(shù)節(jié)點(diǎn)里的索引[9]。
基于式(6)獲取的相似度便可完成書目庫(kù)中與用戶查詢書目相關(guān)信息的查詢[10]。
2 實(shí)驗(yàn)分析
將本文系統(tǒng)應(yīng)用在某高校圖書館中,設(shè)定科技、數(shù)學(xué)、動(dòng)物、軍事、醫(yī)學(xué)、天文、地理7種類型,使用本文系統(tǒng)進(jìn)行書目查詢的準(zhǔn)確率高達(dá)99.99%。結(jié)果表明本文系統(tǒng)可有效完成圖書館書目的智能查詢。
采用本文系統(tǒng)、圖書智能檢索系統(tǒng)、基于RFID的圖書查詢系統(tǒng)進(jìn)行對(duì)比實(shí)驗(yàn)。
2.1 查準(zhǔn)率與查全率
使用查準(zhǔn)率與查全率進(jìn)行性能對(duì)比,查準(zhǔn)率與查全率分別為:
查準(zhǔn)率=查詢獲取的有關(guān)書目×100% (7)
查詢獲取的全部書目
查全率=查詢獲取的有關(guān)書目×100% (8)
全部書目
由實(shí)驗(yàn)數(shù)據(jù)得知,本文系統(tǒng)的查準(zhǔn)率與查全率均大于95%,圖書智能檢索系統(tǒng)與基于RFID均低于本文系統(tǒng),本文查詢性能優(yōu)勢(shì)顯著。
2.2 查詢效率
采用系統(tǒng)響應(yīng)耗時(shí)與用戶查詢耗時(shí)作為三種系統(tǒng)的對(duì)比指標(biāo),三種系統(tǒng)的響應(yīng)耗時(shí)與查詢耗時(shí)對(duì)比結(jié)果如表3所示。
分析表3數(shù)據(jù)可知,本文系統(tǒng)的綜合查詢效率平均值為0.10 ms;傳統(tǒng)方法效率平均值依次為2.64 ms、7.14 ms,本文系統(tǒng)綜合查詢效率最高。
2.3 復(fù)雜度
設(shè)定10次書目查詢實(shí)驗(yàn),對(duì)比三種系統(tǒng)的查詢復(fù)雜度,對(duì)比結(jié)果見(jiàn)圖4。
分析圖4數(shù)據(jù)可知,本文系統(tǒng)的查詢復(fù)雜度未大于0.1,且始終低于圖書智能檢索系統(tǒng)與基于RFID的圖書查詢系統(tǒng),表明本文系統(tǒng)的查詢操作較為簡(jiǎn)單,易于掌握。
3 結(jié)論
本文的查詢系統(tǒng)應(yīng)用于某高校圖書館后,經(jīng)驗(yàn)證明,本文系統(tǒng)對(duì)7種類型的查詢準(zhǔn)確率高達(dá)99.99%;與傳統(tǒng)方法對(duì)比,本文系統(tǒng)的查準(zhǔn)率、查全率以及查詢效率均更好,且查詢復(fù)雜度最低,查詢性能顯著。
參考文獻(xiàn)
[1]陳瑩,郭佳宇,利用位置信息加權(quán)詞匯樹(shù)的圖像檢索[J].系統(tǒng)仿真學(xué)報(bào),2017,29(10):2353-2359.
CHEN Ying, GUO Jiayu. Image retrieval using weighted vocab-ularv tree with location information [J]. Journal of system simu-Iation, 2017, 29(10): 2353-2359.
[2]郭佳宇,陳瑩.融合顏色特征與詞匯樹(shù)的圖像檢索[Jl小型微型計(jì)算機(jī)系統(tǒng),2017,38(7):1653-1657.
GUO Jiayu, CHEN Ying. Image retrieval using the fusion ofcolor feature and vocabulary tree[J]. Journal of Chinese com-puter systems. 2017, 38(7): 1653-1657.
[3]王睿,楊舒卉,張麗.基于潛在語(yǔ)義分析的電子文獻(xiàn)檢索方法及實(shí)驗(yàn)分析[J]海軍T程大學(xué)學(xué)報(bào)(綜合版),2017 .14(1):88-92.
WANG Rui. YANG Shuhui, ZHANG Li.Electronic docu-ments retrieval methods and experiment analvsis based on la-tent semantic analysis [J]. Journal of Naval University of Engi-neering. 2017, 14(1): 88-92.
[4]劉作國(guó),陳笑蓉.面向文本聚類的實(shí)體:動(dòng)作關(guān)聯(lián)模型研究[J]中文信息學(xué)報(bào),2018,32(5):22-30.
LIU Zuoguo, CHEN Xiaorong.A entity-action relationship mod-el for text clustering[J]. Journal of Chinese information process-ing, 2018, 32(5): 22-30.
[5] FENG Q D,XU M, ZHANG X.RETRACTED ARTICLE: Themodel for improving big data suh-image retrieval performanceusing scalable vocabulary tree based on predictive clustering[J]. Cluster computing, 2016. 19(2): 699-708.
[6]張興旺.以信息推薦為例探討圖書館人工智能體系的基本運(yùn)作模式[J].情報(bào)理論與實(shí)踐,2017 .40( 12):69-74.
ZHANG Xingwang. Study on the basic operation mode of artifi-cial intelligence system of library based on information recom-mendation [J]. Information studies: theorv & application,2017. 40(12):69-74.
[7] WALLHEIM H.From complex realitY to formal description:bibliographic relationships and problems of operationalizationin RDA [J]. Cataloging&classification quarterly, 2016. 54(7): 1-21.
[8]周曉政,王正興.信息一知識(shí)一智能轉(zhuǎn)換視野下圖書館信息素養(yǎng)教育的目標(biāo)功能定位[J].現(xiàn)代情報(bào),2016.36(1):26-29.
ZHOU Xiaozheng, WANG Zhengxing. Information - knowledge -intelligence conversion perspective on functional objectives oflibrary information literacy education [J]. Modern information,2016. 36(1):26-29.
[9] AGRAS H, FERRAGUT C, ABRALDES J A.Match analysisin futsal:a svstematic review[J].International journal of perfor-mance analysis in sport, 2016. 16(2): 652-686.
[10]馮璐.圖書館閱讀需求資源利用率優(yōu)化管理仿真[J]計(jì)算機(jī)仿真,2018,35(3):271-274.
FENG Lu. Simulation of optimal management of librarv read-ing demand resource utilization [J]. Computer simulation,2018. 35(3):271-274.
作者簡(jiǎn)介:周洪賓(1975-),女,山東聊城人,圖書館館員,研究方向?yàn)殡娮訄D書檔案管理、計(jì)算機(jī)應(yīng)用。