摘 ?要: 信息化時(shí)代背景下利用碎片化時(shí)間在電子圖書(shū)館中快速檢索所需圖書(shū)信息是時(shí)代發(fā)展潮流,因此文中設(shè)計(jì)了一種電子圖書(shū)館碎片化閱讀的快速檢索系統(tǒng)十分必要。由快速檢索系統(tǒng)總體架構(gòu)表示層、應(yīng)用層、集成層和數(shù)據(jù)源層構(gòu)成。構(gòu)建圖書(shū)信息數(shù)據(jù)庫(kù),通過(guò)檢索器從圖書(shū)信息數(shù)據(jù)庫(kù)中快速檢索出用戶(hù)所需的相關(guān)圖書(shū)信息,完成圖書(shū)信息的快速檢索。仿真實(shí)驗(yàn)結(jié)果表明,所設(shè)計(jì)系統(tǒng)可快速檢索用戶(hù)所需圖書(shū)信息,具有較強(qiáng)的圖書(shū)信息深度關(guān)聯(lián)和挖掘能力,實(shí)用性強(qiáng)。
關(guān)鍵詞: 快速檢索; 碎片化閱讀; 電子圖書(shū)館; 圖書(shū)信息檢索; 系統(tǒng)設(shè)計(jì); 仿真實(shí)驗(yàn)
中圖分類(lèi)號(hào): TN99?34; TP391 ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)02?0067?03
Design of rapid retrieval system for fragmented reading in electronic library
LU Xiaoqin
Abstract: Under the background of the information age, it is the trend of era development to use the fragmented time to quickly retrieve the required book information in the electronic library. Therefore, it is very necessary to design a rapid retrieval system for fragmented reading in the electronic library. The overall architecture of the rapid retrieval system is composed of the presentation layer, application layer, integration layer and data source layer. The book information database is built, from which the relevant book information required by users can be quickly retrieved with the retrieval engine, so as to complete the quick retrieval of book information. The simulation experimental results show that the designed system can quickly retrieve the book information required by users, has strong ability of depth correlation and mining of the book information, and has strong practicability.
Keywords: rapid retrieval; fragmented reading; electronic library; book information retrieval; system design; simulation experiment
0 ?引 ?言
移動(dòng)網(wǎng)絡(luò)與科學(xué)技術(shù)的發(fā)展對(duì)人們閱讀習(xí)慣的改變影響深遠(yuǎn),碎片化閱讀模式的產(chǎn)生使人們閱讀時(shí)間和地點(diǎn)呈現(xiàn)碎片化發(fā)展[1]。碎片化閱讀發(fā)展模式給傳統(tǒng)電子圖書(shū)館提供的系統(tǒng)化服務(wù)帶來(lái)沖擊[2],它要求用戶(hù)檢索圖書(shū)信息的速度更快,檢索出的圖書(shū)信息結(jié)果更加符合用戶(hù)的使用需求,且在提供具體檢索信息結(jié)果的基礎(chǔ)上還對(duì)感興趣的內(nèi)容進(jìn)行推薦。因此為使電子圖書(shū)館這種碎片化的閱讀需求得到滿(mǎn)足,本文設(shè)計(jì)一種適合電子圖書(shū)館碎片化閱讀的快速檢索系統(tǒng),旨在縮短用戶(hù)對(duì)所需信息檢索用時(shí),提升用戶(hù)檢索結(jié)果的質(zhì)量并向用戶(hù)提供高質(zhì)量的相關(guān)檢索內(nèi)容信息。
1 ?系統(tǒng)總體架構(gòu)
設(shè)計(jì)快速檢索系統(tǒng)總體架構(gòu)分為4個(gè)層次,包括表示層、應(yīng)用層、集成層和數(shù)據(jù)源層[3?4]。表示層接收用戶(hù)的碎片化檢索需求。應(yīng)用層中信息搜索模塊搜索出電子圖書(shū)館中所有圖書(shū)信息。應(yīng)用層包括檢索結(jié)果的相關(guān)性排序和檢索結(jié)果優(yōu)化功能,且相關(guān)性排序和優(yōu)化后檢索結(jié)果以網(wǎng)絡(luò)服務(wù)形式發(fā)布到系統(tǒng)接口。集成層接收用戶(hù)的檢索請(qǐng)求后,采用適配器將檢索請(qǐng)求轉(zhuǎn)化為檢索系統(tǒng)數(shù)據(jù)庫(kù)的可識(shí)別的形式[5],如圖1所示。
1.1 ?信息搜索模塊設(shè)計(jì)
電子圖書(shū)館圖書(shū)信息搜集模塊將電子圖書(shū)館平臺(tái)中URL作為種子,按照不重復(fù)原則遍歷URL種子指向所有圖書(shū)資源,將圖書(shū)資源下載到系統(tǒng)服務(wù)器。信息搜索模塊采用Lucene項(xiàng)目的子項(xiàng)目Nutch中的圖書(shū)信息收集器實(shí)現(xiàn)電子圖書(shū)館中信息的全部收集[6]。為降低圖書(shū)信息的收集精度,可通過(guò)正則表達(dá)式縮小種子遍歷范圍,故采用正則表達(dá)式可匹配特定的URL,避免系統(tǒng)搜集到無(wú)關(guān)圖書(shū)信息[7?8]。
1.2 ?信息快速檢索模塊
信息快速檢索模塊處于系統(tǒng)總體架構(gòu)的應(yīng)用層,以信息搜索模塊搜索出的圖書(shū)信息為處理對(duì)象[9]。信息檢索模塊的信息檢索過(guò)程如圖2所示。
2 ?系統(tǒng)實(shí)現(xiàn)
電子圖書(shū)館碎片化閱讀快速檢索系統(tǒng)通過(guò)檢索組件完成檢索[10],系統(tǒng)快速檢索流程如圖3所示。
3 ?實(shí)驗(yàn)分析
為驗(yàn)證本文系統(tǒng)在電子圖書(shū)館碎片化閱讀應(yīng)用中的性能優(yōu)劣,仿真分析本文系統(tǒng)的實(shí)際應(yīng)用效果。實(shí)驗(yàn)以我國(guó)南方某高校的電子圖書(shū)館為仿真實(shí)驗(yàn)環(huán)境,將本文系統(tǒng)仿真用于該電子圖書(shū)館中,分析本文系統(tǒng)的檢索能力。
3.1 ?系統(tǒng)檢索性能檢測(cè)
實(shí)驗(yàn)將基于Web服務(wù)器框架的圖書(shū)信息快速檢索系統(tǒng)和基于移動(dòng)Agent的圖書(shū)信息快速檢索系統(tǒng)與本文系統(tǒng)進(jìn)行比較。
在該南方高校中某日電子圖書(shū)館進(jìn)行,在使用人數(shù)中隨機(jī)選取10人,研究對(duì)象均對(duì)自己感興趣的圖書(shū)信息進(jìn)行檢索,系統(tǒng)檢索性能的評(píng)價(jià)指標(biāo)還包括系統(tǒng)在不同并發(fā)人數(shù)下的信息處理速率。實(shí)驗(yàn)將三種系統(tǒng)個(gè)人檢索信息檢索用時(shí)以及系統(tǒng)在不同人數(shù)使用下的平均檢索時(shí)長(zhǎng)分別如表1和表2所示。
從表1數(shù)據(jù)以看出,實(shí)驗(yàn)隨機(jī)選取的10個(gè)研究對(duì)象采用不同系統(tǒng)對(duì)相同信息進(jìn)行檢索時(shí),檢索時(shí)間差異較大。橫向分析三種系統(tǒng)對(duì)相同信息檢索結(jié)果可知,本文系統(tǒng)檢索用時(shí)低于另外兩種系統(tǒng);縱向分析結(jié)果可知,采用本文系統(tǒng)各次檢索用時(shí)較穩(wěn)定,而另外兩種方法用時(shí)差值較大,檢索用時(shí)受研究對(duì)象主觀因素影響嚴(yán)重,檢索容易則檢索較快,反之需要的檢索時(shí)間長(zhǎng)。
實(shí)驗(yàn)比較三種系統(tǒng)在不同并發(fā)人數(shù)下的平均響應(yīng)能力,系統(tǒng)使用人數(shù)越多響應(yīng)越快,證明系統(tǒng)承壓能力越強(qiáng)。結(jié)果顯示采用本文系統(tǒng)進(jìn)行碎片化閱讀信息快速檢索的平均用時(shí)雖與系統(tǒng)并發(fā)人數(shù)成正相關(guān),但檢索平均用時(shí)增長(zhǎng)速度較慢;基于Web服務(wù)器框架系統(tǒng)進(jìn)行碎片化閱讀信息快速檢索時(shí)同樣存在系統(tǒng)并發(fā)人數(shù)越多,檢索平均用時(shí)越長(zhǎng)的結(jié)果,但該系統(tǒng)并發(fā)人數(shù)超出5 000后,系統(tǒng)發(fā)生崩潰;分析基于移動(dòng)Agent系統(tǒng)的平均檢索用時(shí)可看出,該系統(tǒng)碎片化閱讀快速檢索能力較差,且在系統(tǒng)使用人數(shù)超出3 000時(shí)無(wú)法提供服務(wù)。故本文系統(tǒng)碎片化閱讀快速檢索信息能力強(qiáng)。
3.2 ?檢索結(jié)果質(zhì)量比較
檢索結(jié)果是否符合碎片化閱讀可從檢索結(jié)果的簡(jiǎn)潔性和便捷性?xún)牲c(diǎn)出發(fā),實(shí)驗(yàn)將三種系統(tǒng)的檢索結(jié)果分為5個(gè)等級(jí),從1~5級(jí)分別表示檢索結(jié)果適合碎片化閱讀能力逐漸增強(qiáng),實(shí)驗(yàn)將10位研究對(duì)象采用三種系統(tǒng)圖書(shū)信息檢索結(jié)果質(zhì)量評(píng)價(jià),結(jié)果如表3所示。
由表3可知,采用三種檢索系統(tǒng)對(duì)研究對(duì)象的檢索結(jié)果質(zhì)量存在較大差異。表中顯示各位研究對(duì)象對(duì)采用本文系統(tǒng)圖書(shū)信息檢索結(jié)果的簡(jiǎn)潔性和便捷性評(píng)價(jià)結(jié)果滿(mǎn)意度均較強(qiáng),另外兩種系統(tǒng)檢索結(jié)果評(píng)價(jià)結(jié)果大部分為較好或一般等結(jié)果,說(shuō)明本文系統(tǒng)在電子圖書(shū)館碎片化閱讀快速圖書(shū)信息檢索中可得到簡(jiǎn)潔性和便捷性高的檢索結(jié)果。
3.3 ?檢索系統(tǒng)相關(guān)信息關(guān)聯(lián)和挖掘能力分析
對(duì)系統(tǒng)的圖書(shū)信息深度關(guān)聯(lián)和挖掘能力進(jìn)行分析,用戶(hù)在使用檢索系統(tǒng)檢索信息時(shí)除檢索出自身需要的知識(shí)外,系統(tǒng)應(yīng)具有相關(guān)信息推薦和挖掘能力,讓用戶(hù)了解更多的相關(guān)知識(shí)。實(shí)驗(yàn)研究中的對(duì)象分別對(duì)自己感興趣的圖書(shū)類(lèi)型進(jìn)行快速檢索,檢索結(jié)果按相關(guān)度依次排序。研究對(duì)象檢索結(jié)果的關(guān)聯(lián)書(shū)目推薦如圖4所示。
從圖4曲線可知,采用本文系統(tǒng)碎片化閱讀快速檢索得到的關(guān)聯(lián)書(shū)目始終在40條以上;而采用基于移動(dòng)Agent系統(tǒng)檢索得到的相關(guān)圖書(shū)推薦結(jié)果只有2次較高,其余檢索中的相關(guān)數(shù)據(jù)推薦結(jié)果較少;基于Web服務(wù)器框架系統(tǒng)檢索得到相關(guān)書(shū)目推薦整體保持在15~25條。故采用本文系統(tǒng)在碎片化閱讀環(huán)境下進(jìn)行檢索時(shí),檢索結(jié)果不僅有用戶(hù)真正需要的檢索結(jié)果,還包括大量的引申推薦結(jié)果,可加強(qiáng)電子圖書(shū)館碎片化閱讀中知識(shí)的了解范圍。
4 ?結(jié) ?論
為使電子圖書(shū)館這種碎片化的閱讀需求得到滿(mǎn)足,本文設(shè)計(jì)一種適合電子圖書(shū)館碎片化閱讀的快速檢索系統(tǒng),旨在縮短用戶(hù)對(duì)所需信息檢索用時(shí),提升用戶(hù)檢索結(jié)果的質(zhì)量并向用戶(hù)提供高質(zhì)量的相關(guān)檢索內(nèi)容信息。本文設(shè)計(jì)的快速信息檢索系統(tǒng)具有較強(qiáng)的信息檢索速率,同時(shí)能夠深度挖掘出較多的圖書(shū)信息,加強(qiáng)電子圖書(shū)館碎片化閱讀中知識(shí)的了解范圍,是一種實(shí)用性強(qiáng)的快速信息檢索系統(tǒng)。
參考文獻(xiàn)
[1] 何赫,劉濤,李丹.基于RFID的圖書(shū)館圖書(shū)定位系統(tǒng)研究與設(shè)計(jì)[J].電子器件,2017,40(3):688?691.
[2] 蘇福,柯平.國(guó)際圖書(shū)情報(bào)學(xué)熱點(diǎn)與前沿動(dòng)態(tài)研究(2014—2015年):27種SSCI核心期刊的全樣本分析[J].大學(xué)圖書(shū)館學(xué)報(bào),2017,35(1):11?19.
[3] 李白楊,肖希明.公共數(shù)字文化資源整合中的檢索系統(tǒng)框架設(shè)計(jì)[J].國(guó)家圖書(shū)館學(xué)刊,2016,25(2):42?47.
[4] 付兵.基于Android的GDRMS移動(dòng)圖書(shū)館信息服務(wù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代情報(bào),2015,35(12):60?64.
[5] 姜婷婷,陳舜昌,高慧琴.大學(xué)圖書(shū)館OPAC系統(tǒng)用戶(hù)信息搜尋路徑的可視化分析[J].大學(xué)圖書(shū)館學(xué)報(bào),2017,35(1):63?71.
[6] 趙振營(yíng).圖書(shū)館圖書(shū)信息用戶(hù)快速自動(dòng)查閱仿真研究[J].計(jì)算機(jī)仿真,2017,34(9):432?434.
[7] 姚舜.圖書(shū)館微信借書(shū)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].圖書(shū)館建設(shè),2015(2):84?87.
[8] 王捷.基于現(xiàn)代信息技術(shù)的圖書(shū)館全空間信息服務(wù)系統(tǒng)研究[J].圖書(shū)館工作與研究,2018(5):66?71.
[9] 歐石燕,唐振貴,蘇翡斐.面向信息檢索的術(shù)語(yǔ)服務(wù)構(gòu)建與應(yīng)用研究[J].中國(guó)圖書(shū)館學(xué)報(bào),2016,42(2):32?51.
[10] 薛輝.“互聯(lián)網(wǎng)+”環(huán)境下圖書(shū)館自獲取信息服務(wù)研究[J].圖書(shū)館工作與研究,2017(8):45?49.
作者簡(jiǎn)介:魯曉琴(1980—),女,甘肅蘭州人,館員,研究方向?yàn)橛?jì)算機(jī)檔案、電子圖書(shū)。