邵絲媞
(1.西北工業(yè)大學(xué),陜西 西安 710000;2.寶雞市圖書館,陜西 寶雞 721000)
伴隨知識(shí)經(jīng)濟(jì)日益發(fā)展,圖書館讀者信息需求量逐漸提升,導(dǎo)致信息出現(xiàn)爆炸式增長(zhǎng),圖書館中海量信息資源能夠?yàn)樽x者提供各種類型學(xué)習(xí)資源,但是信息過載容易導(dǎo)致讀者查詢效率低,降低對(duì)圖書館使用興趣[1]。讀者是圖書館唯一服務(wù)對(duì)象,讀者減少會(huì)導(dǎo)致圖書館存在不再具有價(jià)值,所以,圖書館需要與時(shí)俱進(jìn)為讀者提供個(gè)性化信息服務(wù)。如何為讀者提供準(zhǔn)確便捷高效的個(gè)性化服務(wù)成為當(dāng)前各個(gè)圖書館急需解決的問題[2]。目前讀者大多喜歡通過圖書館管理信息系統(tǒng)查詢獲取自己所需信息,而空間信息能夠讓讀者在真實(shí)直觀的圖書館空間上檢索各類信息資源,可讓讀者較好理解和感知所獲取文獻(xiàn)資源的空間定位信息,完成圖書館里空間信息與文獻(xiàn)信息的綜合管理[3],提高圖書館個(gè)性化資源集成服務(wù)質(zhì)量。因此,本文設(shè)計(jì)基于空間信息支持的圖書館個(gè)性化資源集成系統(tǒng),提高讀者信息查詢的查全率與查準(zhǔn)率。
為了提高圖書館用戶信息查詢的查全率和查準(zhǔn)率,設(shè)計(jì)基于空間信息支持的圖書館個(gè)性化資源集成系統(tǒng)。
基于空間信息支持的圖書館個(gè)性化資源集成系統(tǒng)主要由空間信息管理模塊、個(gè)性化數(shù)據(jù)源集成模塊、服務(wù)器、后臺(tái)數(shù)據(jù)庫以及WAP 展示層構(gòu)成,如圖1所示。讀者在圖書館數(shù)據(jù)庫列表里選取多個(gè)目標(biāo)數(shù)據(jù)庫實(shí)行檢索后,個(gè)性化數(shù)據(jù)源集成模塊提取并集成各類數(shù)據(jù)源,構(gòu)建統(tǒng)一查詢接口,通過findAPI 的規(guī)定建立檢索請(qǐng)求將集成數(shù)據(jù)源上傳至服務(wù)器,服務(wù)器將數(shù)據(jù)源存儲(chǔ)到后臺(tái)數(shù)據(jù)庫中。將后臺(tái)數(shù)據(jù)庫中各數(shù)據(jù)庫結(jié)果集的序號(hào)傳輸至空間信息管理模塊,該模塊在結(jié)果集里提取包含每個(gè)數(shù)據(jù)庫檢索標(biāo)記信息,融合空間信息和屬性信息,基于讀者需要檢索的資源屬性判斷資源空間位置,準(zhǔn)確提取與屬性相符數(shù)據(jù)資源[4],將數(shù)據(jù)資源存儲(chǔ)在XMI 文檔后呈現(xiàn)給用戶。系統(tǒng)檢索資源時(shí),把緩存數(shù)據(jù)與日志信息保存在對(duì)應(yīng)數(shù)據(jù)表里。
圖1 系統(tǒng)整體結(jié)構(gòu)圖Fig.1 Overall structure diagram of system
1)個(gè)性化數(shù)據(jù)源集成模塊
圖書館中海量數(shù)據(jù)信息資源由不同數(shù)據(jù)商提供,運(yùn)行的軟、硬件環(huán)境存在差異,導(dǎo)致數(shù)據(jù)信息資源存在較大的差異性。為滿足用戶的個(gè)性化服務(wù)需求,采用個(gè)性化數(shù)據(jù)源集成模塊統(tǒng)一組織和處理后不同數(shù)據(jù)信息資源,實(shí)現(xiàn)數(shù)據(jù)信息資源的有效集成[5],并將集成數(shù)據(jù)信息資源存儲(chǔ)到后臺(tái)數(shù)據(jù)庫中。
數(shù)據(jù)源集成模塊主要用于提取并集成各類數(shù)據(jù)源,構(gòu)建統(tǒng)一查詢接口,并采用findAPI 的規(guī)定建立用戶檢索請(qǐng)求,將集成數(shù)據(jù)源傳輸?shù)椒?wù)器后存儲(chǔ)到后臺(tái)數(shù)據(jù)庫中。其中包含查詢接口模式選取、查詢接口集成與建立統(tǒng)一接口。把采集獲取的全部數(shù)據(jù)源按照站點(diǎn)的接口分類,合并同一領(lǐng)域里的全部站點(diǎn)查詢接口,并分析和提取接口屬性。例如需要查詢圖書、接口的模式信息中就設(shè)定書名、作者以及價(jià)格等屬性。之后將某一領(lǐng)域的接口集成構(gòu)建為統(tǒng)計(jì)集成查詢接口,建立系統(tǒng)整體查詢接口。數(shù)據(jù)源集成模塊如圖2所示。
圖2 數(shù)據(jù)源集成模塊結(jié)構(gòu)圖Fig.2 Structure diagram of data source integration module
2)空間信息管理模塊
該模塊由空間數(shù)據(jù)庫、空間信息分析和處理子模塊構(gòu)成,如圖3所示。主要用于管理圖書館的各類信息,把后臺(tái)數(shù)據(jù)庫中各數(shù)據(jù)庫結(jié)果集中包含各數(shù)據(jù)庫檢索標(biāo)記信息中的空間信息和屬性信息相結(jié)合,根據(jù)讀者需要檢索的資源屬性判斷資源空間位置,準(zhǔn)確提取與屬性相符的數(shù)據(jù)資源,將數(shù)據(jù)資源存儲(chǔ)在XML 文檔采用WAP 展示層反饋給用戶,為用戶提供個(gè)性化服務(wù)[6]。
圖3 空間信息管理模塊Fig.3 Structure diagram of spatial information management module
系統(tǒng)軟件采用一種本體驅(qū)動(dòng)的圖書館個(gè)性化資源空間相關(guān)信息自動(dòng)檢索策略,實(shí)現(xiàn)圖書館個(gè)性化資源的常規(guī)檢索和擴(kuò)展檢索。
1)個(gè)性化資源空間信息本體概念匹配
本體概念匹配是將用戶輸入條件變換為本體里已設(shè)定的標(biāo)準(zhǔn)概念中,讓查詢條件具備語義信息的過程,在該過程中用戶通過系統(tǒng)準(zhǔn)確查詢語音信息。概念匹配原理是:假定用戶輸入關(guān)鍵詞是A,在本體里定義的概念集合是為數(shù)量詞;函數(shù)描述某詞語e所述語義信息;針對(duì)若則概念Ri和關(guān)鍵詞A匹配;設(shè)與關(guān)鍵詞匹配的概念集合為若則概念R是關(guān)鍵詞A最終匹配。
2)個(gè)性化資源空間信息本體常規(guī)檢索
個(gè)性化資源空間信息本體常規(guī)檢索是把目標(biāo)信息建立成本體實(shí)例,即實(shí)例檢索。
在用戶采用關(guān)鍵詞檢索信息過程中,首先采用本體里對(duì)應(yīng)的概念替換輸入條件,然后匹配變換后的概念條件和本體概念標(biāo)識(shí)后的目標(biāo)信息,實(shí)現(xiàn)語義層次的信息匹配[8]。采用本體概念取代輸入條件就是系統(tǒng)分析用戶輸入語義信息的過程,本體信息檢索方法示意圖如圖4所示。
圖4 本體信息常規(guī)檢索方法Fig.4 Schematic diagram for routine retrieval method of ontology information
3)個(gè)性化資源空間信息本體擴(kuò)展檢索
本體常規(guī)檢索后通過本體擴(kuò)展檢索根據(jù)推理?xiàng)l件拓展查詢條件,獲取隱含信息。此功能一般用于本體的語義檢索、一致性判斷和概念自動(dòng)分類[9]。此類應(yīng)用都需要通過本體推理獲取隱含信息,也就是在已知部分信息的背景下獲取隱含的部分信息[10]。
個(gè)性化資源空間信息本體擴(kuò)展檢索的原理是:假定用戶輸入關(guān)鍵詞相應(yīng)的本體概念集合是檢索條件為概念Ri和其他概念之間的關(guān)聯(lián)性,那么條件概念Ri的檢索結(jié)果是或設(shè)是概念Ri和其他概念之間的某類具有可擴(kuò)展關(guān)聯(lián)性,概念Ri根據(jù)Gn擴(kuò)展后獲取的擴(kuò)展概念用Rin描述,那么概念Ri的擴(kuò)展查詢結(jié)果是當(dāng)中檢索條件R通過擴(kuò)展處理后獲取檢索結(jié)果是
將本文系統(tǒng)應(yīng)用于某大學(xué)校園后,實(shí)驗(yàn)采用AHP方法對(duì)本文系統(tǒng)進(jìn)行評(píng)價(jià),設(shè)定11 個(gè)評(píng)價(jià)指標(biāo)如表1所示。
表1 本文系統(tǒng)評(píng)價(jià)指標(biāo)設(shè)定Table 1 Setting of evaluation index in this system
實(shí)驗(yàn)中使用5 個(gè)評(píng)價(jià)等級(jí),分別是:A,B,C,D,E,其中 A 為優(yōu),B 為良,C 為一般,D 為差,E 為很差,當(dāng)系統(tǒng)整體評(píng)價(jià)值>0.1 便認(rèn)為系統(tǒng)的評(píng)價(jià)結(jié)果優(yōu)秀。本文系統(tǒng)的評(píng)價(jià)指標(biāo)、權(quán)系數(shù)與專家給出指標(biāo)語言評(píng)價(jià)信息見表2。
表2 本文系統(tǒng)的綜合評(píng)價(jià)結(jié)果Table 2 Comprehensive evaluation results of this system
表2中,系統(tǒng)的整體評(píng)價(jià)值為0.752 5,系統(tǒng)整體評(píng)價(jià)值大于0.1,可認(rèn)為本文系統(tǒng)的評(píng)價(jià)較高,具有一定使用價(jià)值。將本文系統(tǒng)、圖書館智能化研修間系統(tǒng)、公共數(shù)字文化資源整合檢索系統(tǒng)應(yīng)用于學(xué)校圖書館,統(tǒng)計(jì)大一、大二和大三3 個(gè)年級(jí)信息技術(shù)專業(yè)學(xué)生使用三種系統(tǒng)進(jìn)行5 次學(xué)習(xí)管理專業(yè)系統(tǒng)資源檢索實(shí)驗(yàn),統(tǒng)計(jì)三種系統(tǒng)的查全率,分別如圖5~圖7所示。
圖5 本文系統(tǒng)查全率測(cè)試結(jié)果Fig.5 Test results of recall ratio of this system
圖6 圖書館智能化研修間系統(tǒng)查全率測(cè)試結(jié)果Fig.6 Test results of recall ratio of intelligent research room system of library
圖7 公共數(shù)字文化資源整合檢索系統(tǒng)查全率測(cè)試結(jié)果Fig.7 Test results of recall ratio of public digital cultural resources integrated retrieval system
分析圖5~圖7可知,大一學(xué)生使用本文系統(tǒng)后查全率最大值為98%,大二學(xué)生使用本文系統(tǒng)后查全率最大值為98%,大三學(xué)生使用本文系統(tǒng)后查全率最大值為98%,則本文系統(tǒng)的查全率均值為(98% +98% +98%)/3=98%。同理,圖書館智能化研修間系統(tǒng)查全率均值為73%,公共數(shù)字文化資源整合檢索系統(tǒng)查全率均值為75%。經(jīng)對(duì)比,本文系統(tǒng)的查全率最高。統(tǒng)計(jì)上述實(shí)驗(yàn)中各年級(jí)學(xué)生使用三種系統(tǒng)的查準(zhǔn)率,三種系統(tǒng)的查準(zhǔn)率對(duì)比結(jié)果如圖8所示。由圖8可知,5 次查詢實(shí)驗(yàn)中,本文系統(tǒng)的查準(zhǔn)率最大值高達(dá)99%,相比圖書館智能化研修間系統(tǒng)的查準(zhǔn)率本文系統(tǒng)高出20%,相比公共數(shù)字文化資源整合檢索系統(tǒng)查準(zhǔn)率本文系統(tǒng)高出20%,說明本文系統(tǒng)具有較高的查準(zhǔn)率。
圖8 三種系統(tǒng)查準(zhǔn)率對(duì)比結(jié)果Fig.8 Comparison of precision ratio results of three systems
為了提高圖書館信息集成質(zhì)量,實(shí)現(xiàn)個(gè)性化服務(wù),本文設(shè)計(jì)基于空間信息支持的圖書館個(gè)性化資源集成系統(tǒng)。系統(tǒng)中設(shè)計(jì)個(gè)性化數(shù)據(jù)源集成模塊和空間信息管理模塊,建立系統(tǒng)整體查詢接口,并在海量圖書館信息數(shù)據(jù)庫里準(zhǔn)確提取用戶所需信息,為用戶提供個(gè)性化服務(wù)。系統(tǒng)軟件采用一種本體驅(qū)動(dòng)的圖書館個(gè)性化資源空間相關(guān)信息自動(dòng)檢索策略,能夠擴(kuò)展用戶查詢的結(jié)果,提高系統(tǒng)的查全率與查準(zhǔn)率。與傳統(tǒng)的圖書館智能化研修間系統(tǒng)、公共數(shù)字文化資源整合檢索系統(tǒng)相比,本文系統(tǒng)的查全率和查準(zhǔn)率接近于100%,且采用AHP評(píng)價(jià)本文系統(tǒng)后,本文系統(tǒng)評(píng)價(jià)值為0.752 5,系統(tǒng)整體評(píng)價(jià)值大于0.1。結(jié)果表明本文系統(tǒng)具備較高的現(xiàn)實(shí)應(yīng)用價(jià)值。