程秀峰 范曉瑩 楊金慶
摘要:[目的/意義]將情境感知技術(shù)引入圖書館以提高服務(wù)的智能化,已成為數(shù)字圖書館的發(fā)展趨勢(shì)之一。為了提高情境感知模型中推薦結(jié)果的準(zhǔn)確度。[方法/過程]本文研究并提出了一種融合了樸素貝葉斯算法與情景感知功能的協(xié)同推薦模型,并通過實(shí)驗(yàn)對(duì)推薦效果進(jìn)行了評(píng)估。具體為:首先,獲取用戶的當(dāng)前任務(wù)和情景信息,同時(shí)提取歷史信息庫(kù)用戶的行為偏好;其次基于屬性加權(quán)貝葉斯算法計(jì)算用戶的行為相似度,繼而進(jìn)行協(xié)同推薦;通過計(jì)算目標(biāo)情景中所有情景屬性對(duì)所推薦資源的影響的權(quán)值,對(duì)協(xié)同推薦所得評(píng)分進(jìn)行加權(quán)處理,形成最終的預(yù)測(cè)預(yù)測(cè);最后通過實(shí)驗(yàn)對(duì)模型進(jìn)行檢驗(yàn)。[結(jié)果/結(jié)論]結(jié)果表明:使用該模型得出的推薦結(jié)果優(yōu)于傳統(tǒng)的協(xié)同推薦結(jié)果。因此該模型能夠更好地為為個(gè)性化信息服務(wù)提供支持。
關(guān)鍵詞:情景感知;樸素貝葉斯;協(xié)同推薦;圖書館
DOI:10.3969/j.issn.1008-0821.2019.02.007
〔中圖分類號(hào)〕TP391〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2019)03-0057-09
隨著互聯(lián)網(wǎng)技術(shù)的日益發(fā)展,知識(shí)庫(kù)中的信息量呈指數(shù)增長(zhǎng),用戶的專業(yè)性知識(shí)需求隨之增加,簡(jiǎn)單的非語義化搜索引擎已經(jīng)很難捕捉、定位到用戶真實(shí)需求。作為知識(shí)存儲(chǔ)、組織與利用重要機(jī)構(gòu)的圖書館,其自身擁有的個(gè)性化服務(wù)雖能在表面上滿足大多數(shù)用戶需求,但在深層需求挖掘與感知上,仍然表現(xiàn)出諸多不足,具體表現(xiàn)為:1)情境適用性差。雖然查詢系統(tǒng)十分方便,但仍不能獲取用戶潛在需求;2)推薦結(jié)果不夠精確。即使能通過網(wǎng)絡(luò)信息顯式獲取用戶需求,但可用性和可靠性仍不理想;3)資源匹配自適應(yīng)性低。當(dāng)用戶的信息需求不具有很強(qiáng)目的性,或無法準(zhǔn)確被描述時(shí),系統(tǒng)很難根據(jù)畫像推出用戶可能感興趣的信息。
針對(duì)以上問題,基于情境感知技術(shù)的推薦系統(tǒng)能夠很好地解決圖書館目前面臨的困境。個(gè)性化推薦能夠針對(duì)用戶的興趣點(diǎn)進(jìn)行推薦,可以更好地滿足用戶的需求。情境感知技術(shù)具有探測(cè)用戶潛在需求與感知性描述用戶情境的功能,從而使得具有這種功能的推薦系統(tǒng)能夠有效感知處于不同位置、不同時(shí)間和不同狀態(tài)下的用戶需求[1]。兩者相結(jié)合的新型推薦系統(tǒng)將是一個(gè)解決數(shù)字圖書館目前面臨問題的有效方案。
本文將利用基于屬性加權(quán)的樸素貝葉斯算法的情景化用戶資源類別偏好學(xué)習(xí)以及融合該類別偏好的協(xié)同過濾個(gè)性化信息推薦,通過加入情境感知算法,即對(duì)不同影響力的情境因素賦予權(quán)重來提高傳統(tǒng)協(xié)同過濾算法的準(zhǔn)確度,從而為讀者在不同情景因素下提供更加準(zhǔn)確地推薦服務(wù)。
1相關(guān)研究
情景,是指用來描述實(shí)體情形和特征的任何信息[2],利用情景向用戶提供相關(guān)信息服務(wù)的過程就是情境感知服務(wù)[3]。引入情景和情景感知能使推薦系統(tǒng)能夠具有“個(gè)性化”和“普適計(jì)算”的優(yōu)勢(shì),進(jìn)一步提高個(gè)性化服務(wù)的精準(zhǔn)度和用戶滿意度[4],這引起了學(xué)者的普遍關(guān)注。Kim J等將情境感知與個(gè)性化推薦用個(gè)性化健康服務(wù)系統(tǒng)中,他們將提出的情境感知模型應(yīng)用于協(xié)同過濾過程中的用戶偏好缺失值提取上,實(shí)現(xiàn)了協(xié)同過濾與情境感知的結(jié)合[5]。Kown O等創(chuàng)建的NAMA原型系統(tǒng)通過用戶情境、用戶描述等信息來發(fā)現(xiàn)用戶的信息需求,從而為電子商務(wù)購(gòu)買者提供個(gè)性化信息[6]。Mylonas P等分析了用戶的歷史情景和當(dāng)前情景的表示,并對(duì)不確定環(huán)境下的模糊情景(如用戶注意力和愿望等)展開了研究,認(rèn)為情景是提升個(gè)性化信息服務(wù)質(zhì)量的有效手段[7]。李晟建立用戶觀影的情景模型,將用戶觀影情境因素應(yīng)用到現(xiàn)有的推薦系統(tǒng)中,提升電影推薦的用戶滿意度[8]。
對(duì)于圖書館來說,情景感知作為普適計(jì)算的核心技術(shù)之一,能夠利用傳感器使軟件根據(jù)使用地點(diǎn)、服務(wù)器、相關(guān)用戶、周邊設(shè)備等變化而調(diào)整自身狀態(tài),以達(dá)到支持用戶隨時(shí)隨地獲取符合個(gè)性化需求的信息的目的[9]。Lee提出通過提供圖書狀態(tài)信息、內(nèi)容信息、電子書是否可借閱等實(shí)現(xiàn)情感感知在圖書館中的應(yīng)用[10]。Aittola M等提出將情境感知與導(dǎo)航系統(tǒng)相結(jié)合,從而讀者在圖書館中可通過手持PDA設(shè)備獲取位置感知服務(wù),根據(jù)有關(guān)書籍的地圖向?qū)а杆僬业剿鑸D書等[11]。
對(duì)于圖書館的使用者來說,圖書館最主要的用途是為其提供所需要查閱或?yàn)g覽的書籍。當(dāng)用戶無法明確描述自己的需求時(shí),就需要系統(tǒng)為其提供合適的內(nèi)容推送。結(jié)合情景感知的推薦系統(tǒng)相較于傳統(tǒng)推薦系統(tǒng)能夠更加動(dòng)態(tài)、主動(dòng)地察覺用戶的潛在需求,從而為用戶推薦恰當(dāng)、符合當(dāng)前場(chǎng)景的內(nèi)容,如何將情境感知與圖書館個(gè)性化服務(wù)結(jié)合起來。張劍等集成情景感知的圖書館服務(wù)體系框架,將圖書館的管理及信息服務(wù)與情境感知技術(shù)相結(jié)合,通過用戶的信息和定位為用戶提供服務(wù)[12]。黃傳慧將情境感知理論應(yīng)用于圖書館學(xué)術(shù)信息推薦系統(tǒng),并提出基于情境感知—目標(biāo)用戶—資源協(xié)同驅(qū)動(dòng)推薦模型,采用隱式獲取用戶情景偏好信息的方式,結(jié)合協(xié)同過濾為學(xué)術(shù)用戶提供科研方面的推薦[13]。洪亮等基于移動(dòng)數(shù)字圖書館的特性,提出了一種WSSQ算法構(gòu)建用戶信任網(wǎng)絡(luò),由此給出改進(jìn)的情境感知推薦方法,并將情景作為參數(shù)納入用戶信任度、相似度的計(jì)算中,以體現(xiàn)情景對(duì)用戶選擇的影響[14]。
綜上所述,圖書館作為一個(gè)知識(shí)信息中心,必須要適應(yīng)新技術(shù)的變化,將情景因素考慮到個(gè)性化推薦中,才能滿足用戶的不同需求。目前的情境感知推薦系統(tǒng)中,存在的主要問題有構(gòu)建的模型無法用于現(xiàn)實(shí)、推薦內(nèi)容與用戶實(shí)際需求匹配度較低等問題。一方面是因?yàn)樘岢龅哪P吞^于理想化,偏向于靜態(tài)、穩(wěn)定的環(huán)境,而現(xiàn)實(shí)圖書館的推薦系統(tǒng)需要面對(duì)的是一個(gè)動(dòng)態(tài)、變化的環(huán)境;另一方面則是沒有考慮到在一個(gè)情景中不同的情景屬性對(duì)用戶選擇影響是不同的。基于此,本文提出對(duì)判斷在某一場(chǎng)景下用戶選擇某類資源的概率的樸素貝葉斯算法進(jìn)行屬性加權(quán)的想法,通過計(jì)算特定場(chǎng)景中不同情景屬性對(duì)用戶選擇該類資源影響程度的大小,使得樸素貝葉斯算法的概率計(jì)算更加精確,從而適應(yīng)在動(dòng)態(tài)的環(huán)境中的推薦。
2圖書館情景感知自適應(yīng)個(gè)性化服務(wù)的應(yīng)用模式
在傳統(tǒng)的信息交流體系中,圖書館是傳播科學(xué)知識(shí)和提供知識(shí)服務(wù)的重要角色。但隨著數(shù)字資源和信息技術(shù)的發(fā)展,用戶獲取和使用信息的方式也相應(yīng)發(fā)生了變化,圖書館若要避免自己信息服務(wù)中心的地位發(fā)生變化,就必須尋找并精確地滿足用戶變化的信息需求。因此,如何將基于情景的推薦系統(tǒng)與圖書館個(gè)性化服務(wù)結(jié)合,實(shí)現(xiàn)圖書館信息服務(wù)的可持續(xù)發(fā)展,受到了許多學(xué)者的關(guān)注。
現(xiàn)有圖書館的個(gè)性化推薦主要考慮用戶和資源或用戶和服務(wù)兩個(gè)方面的因素,而基于情景感知的個(gè)性化推薦在嘗試通過用戶的需求和服務(wù)情景生成精準(zhǔn)度更高的推薦,由于科技水平等方面的限制,還無法完全智能化的捕獲情景信息,實(shí)現(xiàn)全面、準(zhǔn)確的推薦還存在困難。Mighali V等提出的“物聯(lián)網(wǎng)—情境感知服務(wù)模型”,通過可捕捉和處理用戶觀察內(nèi)容的穿戴設(shè)備,將用戶的情景信息發(fā)送至可與設(shè)備交互的處理中心[15]。張帥等提出的“基于情境感知的高校移動(dòng)圖書館個(gè)性化推薦模型”,采用向量空間模型表示方法和智能信息處理技術(shù),并通過對(duì)環(huán)境變化和已有情景信息的挖掘?qū)崿F(xiàn)對(duì)用戶個(gè)性化信息推薦服務(wù)[16]。周玲元等提出了一種“智慧圖書館”情境感知服務(wù)模式,通過情景感知技術(shù)構(gòu)建“智慧圖書館服務(wù)平臺(tái)”,實(shí)現(xiàn)圖書館實(shí)體與線上移動(dòng)設(shè)備融合的個(gè)性化服務(wù)[17]。因此,如何將情景信息,尤其時(shí)間信息,融入多維關(guān)系模型,是我們?cè)跇?gòu)建模型時(shí)重點(diǎn)討論的問題。
在我們的推薦系統(tǒng)中,用戶直接接觸和接受反饋的是圖書館在每個(gè)樓層中提供的圖書查詢機(jī)。查詢機(jī)中的系統(tǒng)完成的兩個(gè)主要任務(wù):通過定位和系統(tǒng)自帶程序收集用戶此時(shí)的情景信息及需求信息,其中位置信息由查詢機(jī)中的定位系統(tǒng)采集,時(shí)間信息由系統(tǒng)的時(shí)間系統(tǒng)獲取,需求信息(包括閱讀目的和類別)由用戶輸入的內(nèi)容和查詢時(shí)類別選項(xiàng)的勾選進(jìn)行判斷。將結(jié)果發(fā)送至推薦系統(tǒng),然后由負(fù)責(zé)分析情景加權(quán)和協(xié)同推薦的功能完成搜索結(jié)果的推薦并將結(jié)果反饋給查詢機(jī)的系統(tǒng)終端。
由圖1可知,“數(shù)字圖書館服務(wù)推薦模型”的基本服務(wù)過程可劃分為圖書館服務(wù)平臺(tái)、情景數(shù)據(jù)獲取層、情景數(shù)據(jù)分析層和智能推薦層4個(gè)模塊。讀者通過數(shù)字圖書館系統(tǒng)終端進(jìn)入并使用圖書館時(shí),推薦系統(tǒng)的數(shù)據(jù)采集層將會(huì)自動(dòng)獲取用戶的當(dāng)前任務(wù)和情景信息,如用戶的位置、使用時(shí)間、閱讀目的和目標(biāo)圖書類別,并將所獲得的數(shù)據(jù)進(jìn)行處理,以便根據(jù)用戶歷史信息庫(kù)中存儲(chǔ)的用戶偏好和情景信息和用戶瀏覽或檢索的關(guān)鍵詞,合并生成相應(yīng)的情景信息模型。在情景數(shù)據(jù)分析層,數(shù)字圖書館平臺(tái)根據(jù)其他讀者在相同情境下對(duì)資源的需求,計(jì)算出基于協(xié)同過濾的用戶相似度,找到與目標(biāo)讀者相似的鄰居讀者,向目標(biāo)讀者生成推薦信息候選集。最后,智能推薦層通過計(jì)算該情景中所有情景屬性對(duì)所推薦資源的影響的權(quán)值,綜合得到用戶此時(shí)的情景化信息需求,生成最優(yōu)的個(gè)性化推薦信息列表推送給用戶。用戶根據(jù)推薦結(jié)果進(jìn)行瀏覽并反饋,數(shù)字圖書館系統(tǒng)將用戶反饋和獲取到的當(dāng)前情景信息錄入用戶歷史信息庫(kù),將系統(tǒng)推薦給讀者的資源錄入情景信息庫(kù)和基本信息庫(kù),為以后系統(tǒng)進(jìn)行相同推薦提供數(shù)據(jù)和便利。
3基于屬性加權(quán)樸素貝葉斯算法的個(gè)性化圖書館服務(wù)推薦模型
傳統(tǒng)的情景感知信息推薦模型是基于“所有的情景屬性對(duì)于信息推薦所起的作用是相同的”這一背景所進(jìn)行推薦,即這些推薦方法假定在任何情境下,不同情景因素對(duì)信息影響的權(quán)重值相同[18],屬于靜態(tài)、封閉環(huán)境中的推薦方法。在實(shí)際生活中,讀者對(duì)相同的情境信息中的不同情景因素通常有不同的偏好,有些情景因素比其他情景更能改變用戶的最終選擇。有學(xué)者將同一讀者對(duì)于不同情境發(fā)生變化的感知能力的不同稱之為“情境感知度”[19],即有些情景只是發(fā)生細(xì)微的變化,讀者對(duì)同一資源的興趣程度就會(huì)發(fā)生明顯的改變;而有些情境雖然發(fā)生較大的變化,但讀者對(duì)該資源的
圖1圖書館情景感知個(gè)性化服務(wù)的應(yīng)用模式
興趣程度仍然保持不變。按照這一理念,我們將讀者對(duì)不同情境的不同感受定義為“情境感受性”,它反映了情景變化對(duì)讀者興趣變化的影響程度。例如,對(duì)于推薦的娛樂類書籍,在“時(shí)間”情景因素下,用戶可能更傾向于在周末的非工作時(shí)間的情景屬性中選擇娛樂類書籍;而在“完成論文”這個(gè)情景屬性下,用戶更可能在工作時(shí)間選擇科研類的書籍,以此獲得更多有用的信息。為了確定不同環(huán)境因素對(duì)信息推薦所產(chǎn)生的不同影響,本文提出了“基于屬性加權(quán)樸素貝葉斯算法的協(xié)同推薦模型”來度量用戶的情境感知性。由于環(huán)境中情境屬性之間彼此的相關(guān)性較小,即用戶查閱時(shí)間的不同并不會(huì)影響用戶所在樓層這一情景屬性,而樸素貝葉斯算法對(duì)屬性相關(guān)性較小的數(shù)據(jù)有著較好的分類效率和質(zhì)量。因此相較于其他分類算法,屬性加權(quán)樸素貝葉斯算法更適用于對(duì)協(xié)同推薦進(jìn)行情景加權(quán)處理,在動(dòng)態(tài)、開放的環(huán)境下對(duì)用戶進(jìn)行推薦。
3.2當(dāng)前情境下讀者相似度計(jì)算
推薦系統(tǒng)可采用的推薦方法有:基于內(nèi)容過濾,協(xié)同過濾以及混合推薦,我們采用的是應(yīng)用較為廣泛,分類效果也相對(duì)較好的協(xié)同過濾來對(duì)用戶進(jìn)行初步推薦。相較于傳統(tǒng)過濾推薦算法的用戶、事件的二維關(guān)系,基于屬性加權(quán)貝葉斯算法的協(xié)同過濾推薦是將其擴(kuò)展為用戶、事件、環(huán)境的三維關(guān)系,在算法中融入了情景信息。推薦步驟主要分為3步:第一步,根據(jù)“用戶×資源”評(píng)分矩陣計(jì)算用戶之間的相似度;第二步,根據(jù)用戶間的相似度為當(dāng)前用戶尋找近鄰,對(duì)其進(jìn)行預(yù)測(cè)評(píng)分;第三步,結(jié)合屬性加權(quán)的貝葉斯算法,計(jì)算出情境權(quán)重,繼而實(shí)現(xiàn)推薦。
4實(shí)證
4.1實(shí)驗(yàn)數(shù)據(jù)獲取
本文數(shù)據(jù)集來源于事先從華中師范大學(xué)數(shù)字圖書館的官方網(wǎng)站上,選取熱門借閱提供的22個(gè)分類中的10個(gè)分類,分別用爬蟲工具抓取30個(gè)左右的書籍名稱,共計(jì)330個(gè),人工將其分為哲學(xué)社科類(如馬列主義等)、人文藝術(shù)類(如文學(xué)、藝術(shù)等)、工業(yè)技術(shù)類(如計(jì)算機(jī)技能等)和綜合科學(xué)類(如數(shù)理科學(xué)等),以下簡(jiǎn)稱為社哲類、人文類、工技類和科學(xué)類,每個(gè)分類下約有80個(gè)書籍名稱,作為此次試驗(yàn)中受試者進(jìn)行評(píng)分和情景選擇的對(duì)象。
實(shí)驗(yàn)中考察的情境因素共有3個(gè),分別為:時(shí)間(工作日,周末)、地點(diǎn)(圖書館1~9樓)、閱讀目的(科研、擴(kuò)展、休閑、技能等)。在實(shí)驗(yàn)中如果受試者對(duì)某類書籍的閱讀情景的選擇為組合A:(周末,圖書館5樓,休閑),那么當(dāng)該受試者再次遇到情景組合A時(shí),系統(tǒng)將會(huì)優(yōu)先為他推薦該類書籍他更可能想要的書。
本實(shí)驗(yàn)共選取8名19~22歲的在校大學(xué)生作為測(cè)試者。實(shí)驗(yàn)分為訓(xùn)練集準(zhǔn)備和推薦集測(cè)試兩個(gè)部分。在訓(xùn)練集準(zhǔn)備階段,所進(jìn)行的實(shí)驗(yàn)是通過發(fā)放調(diào)查問卷的方式為模型收集足夠的情景信息和用戶偏好;在推薦集測(cè)試階段,在指定情境下通過協(xié)同推薦和樸素貝葉斯算法情境加權(quán)計(jì)算為受試者形成推薦書單,再讓受試者對(duì)書單的內(nèi)容進(jìn)行打分,從而判斷改良算法相較于傳統(tǒng)算法的優(yōu)劣性。
在準(zhǔn)備階段,筆者為每個(gè)測(cè)試者提供了1份包含50個(gè)書籍名的書單,書籍名均從以上4類中隨機(jī)抽取,為保證數(shù)據(jù)集的可靠性和真實(shí)性,每份書單中的書籍名都有一定的重復(fù)率,測(cè)試者需對(duì)其進(jìn)行閱讀情境的選擇和情感偏好的評(píng)分,其中情感偏好的評(píng)分范圍為1~5,從低到高分別表示非常不喜歡、不喜歡、無所謂、喜歡、非常喜歡。例如,受試者在對(duì)《百年孤獨(dú)》進(jìn)行場(chǎng)景選擇時(shí),時(shí)間上更傾向于選擇周末,地點(diǎn)一般是在2樓,閱讀目的一般為休閑,比較喜歡閱讀《百年孤獨(dú)》類小說但更喜歡同書單的《白夜行》,所以打分為4分。將所有問卷回收后,根據(jù)分類標(biāo)準(zhǔn)將所得數(shù)據(jù)進(jìn)行整理后,所得數(shù)據(jù)如表1所示。
4.2數(shù)據(jù)處理與分析
4.2.1情景因素權(quán)值獲取
由于每份書單中都有一定的重復(fù)率,且不同受試者對(duì)同一本書的情景屬性選擇不同,因此我們將其看做兩條不同的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),一共得到400條數(shù)據(jù),除去不確定的數(shù)據(jù)條后所得有效數(shù)據(jù)為378項(xiàng)。將收集到的數(shù)據(jù)按照不同類別和不同屬性的交叉對(duì)應(yīng)關(guān)系進(jìn)行數(shù)量統(tǒng)計(jì),分別計(jì)算每個(gè)屬性值在不同類別下所占比例,再計(jì)算不同類別在同一屬性值下出現(xiàn)的概率,將所得數(shù)據(jù)進(jìn)行歸一化處理后,可得到單項(xiàng)情景因素屬性對(duì)不同類別的影響權(quán)重。例如,在人文類書籍中,選擇工作日查閱的書籍共有13本,選擇在周末查閱的書籍共有80本,經(jīng)過統(tǒng)計(jì)所得工作日對(duì)人文類書籍影響權(quán)重為0.138,而周末對(duì)人文類書籍的影響權(quán)重為0.862,這說明受試者在閱讀人文類書籍時(shí)更習(xí)慣于在周末進(jìn)行。
此處為避免權(quán)值為0,我們將所有的權(quán)重進(jìn)行加1處理,所得結(jié)果如表2所示:
4.2.2協(xié)同過濾推薦與屬性加權(quán)
在推薦集測(cè)試階段,我們首先讓受試者選擇一個(gè)情景M,系統(tǒng)將生成一組符合用戶所選情景的推薦A和一組以傳統(tǒng)協(xié)同過濾算法生成的推薦B供受試者選擇,受試者根據(jù)情景M和自身的閱讀習(xí)慣對(duì)所提供書單中的書籍一一進(jìn)行推薦準(zhǔn)確度的打分,重復(fù)進(jìn)行多次不同情景的實(shí)驗(yàn),最后通過計(jì)算A、B兩組書單中書籍的最終得分,比較兩種算法的優(yōu)劣性。
在生成推薦列表A時(shí),由于情景此時(shí)已經(jīng)確定,不屬于此情景的數(shù)據(jù)對(duì)推薦無任何用途,反而會(huì)成為干擾項(xiàng)對(duì)最終的推薦造成偏差,所以為減少運(yùn)算花費(fèi)的時(shí)間,我們嘗試將與所選情景中屬性值均不相同的數(shù)據(jù)行置為零,事實(shí)證明該操作是可行的。構(gòu)建用戶×物品的二維矩陣并將用戶的評(píng)分填入關(guān)系矩陣中,然后根據(jù)皮爾遜相關(guān)系數(shù)計(jì)算用戶之間的相似度形成用戶評(píng)分相似矩陣:
因?yàn)橛脩簟廖锲肪仃囕^為稀疏,所以我們選擇相關(guān)系數(shù)較高的前兩位用戶作為相似用戶組建近鄰矩陣,按照最后評(píng)分高低得到排名前15的推薦列表。前面實(shí)驗(yàn)步驟所得的情景權(quán)值已知,根據(jù)情境M的屬性值,將用戶的推薦結(jié)果進(jìn)行加權(quán)處理后重新排名,選取排名前10的結(jié)果形成最終的推薦列表。例如此處我們?yōu)橛脩鬊設(shè)定的情景M為{工作日,5樓,科研},在傳統(tǒng)算法中《演講的藝術(shù)》排名非??壳?,這是因?yàn)橛脩鬊和他的相似用戶群體對(duì)這類書籍的興趣較高。但在改良方法中,《演講的藝術(shù)》排名較低,并不在前五的行列中,這是因?yàn)椤堆葜v的藝術(shù)》屬于人文類書籍,在情景M中它的情景因素屬性加權(quán)值較低,因此最后的綜合得分較低。經(jīng)過整理后部分結(jié)果如表3所示:
表3本文方法與傳統(tǒng)方法推薦結(jié)果對(duì)比(部分)
用戶A用戶B改良方法傳統(tǒng)方法改良方法傳統(tǒng)方法
1《馬克思民主觀的文本研究》《馬克思民主觀的文本研究》《管理心理學(xué)》《演講的藝術(shù)》
2《列寧論科學(xué)社會(huì)主義》《元代理學(xué)倫理思想研究》《社會(huì)心理學(xué)》《平凡的世界》
3《社會(huì)契約論》《社會(huì)心理學(xué)》《社會(huì)研究方法實(shí)用教程》《愛情心理學(xué)》
4《元代理學(xué)倫理思想研究》《列寧論科學(xué)社會(huì)主義》《老年社會(huì)學(xué)》《精讀魯迅》
5《老年社會(huì)學(xué)》《SQL Server范例開發(fā)大全》《愛情心理學(xué)》《管理心理學(xué)》
4.2.3推薦效果評(píng)價(jià)
基于情景感知的個(gè)性化推薦是為幫助用戶更準(zhǔn)確的找到所需要的資源,而廣泛采用的平均絕對(duì)偏差MAE(Mean Absolute Error)反映的是實(shí)際預(yù)測(cè)誤差的大小,無法判斷用戶對(duì)推薦資源的滿意程度。本文實(shí)驗(yàn)中借鑒了前人的評(píng)價(jià)方法[21],即用讀者接受度(Reader Acceptance Radio,RAR)來判斷推薦的優(yōu)劣,計(jì)算公式如下:
RAR=∑RInterest{I.1,I.2,…,I.N}∩(Top-N Book)(Top-N Book)(9)
其中∑RInterest{I.1,I.2,…,I.N}表示目標(biāo)讀者感興趣的文獻(xiàn)資源,{Top-N Book}表示在該列表中讀者對(duì)資源的采納程度。則RAR的值越高,該推薦方法在當(dāng)前情景下給讀者推薦的資源越合適。
在對(duì)推薦效果進(jìn)行評(píng)價(jià)時(shí),推薦系統(tǒng)算法根據(jù)指定情景M生成兩組推薦推薦書籍,其中一組是符合用戶所選情景的推薦書單A,一組是以傳統(tǒng)協(xié)同過濾算法生成的推薦書單B,受試者根據(jù)設(shè)定的情境M分別對(duì)推薦書單A、B中的項(xiàng)目進(jìn)行反饋,如情景M為{周末,7樓,技能},對(duì)推薦書單中的書籍《博弈論導(dǎo)論》,受試者根據(jù)個(gè)人喜好和閱讀目的對(duì)推薦書籍與目標(biāo)書籍的相似度進(jìn)行評(píng)價(jià),即在滿分10下對(duì)書籍的滿意度進(jìn)行打分。設(shè)定評(píng)分大于等于5的書籍為讀者采納資源{Top-N Book},評(píng)分大于等于8的書籍為讀者感興趣的資源∑RInterest{I.1,I.2,…,I.N},最后統(tǒng)計(jì)書單A和書單B中符合要求的書籍的個(gè)數(shù),計(jì)算讀者接受度(RAR)。為保證實(shí)驗(yàn)的準(zhǔn)確性,筆者為每個(gè)用戶提供多個(gè)情景,對(duì)不同的情境系統(tǒng)推薦的資源不同,均需測(cè)試者提供反饋。根據(jù)提供的反饋進(jìn)行推薦準(zhǔn)確率的計(jì)算,從而衡量推薦的質(zhì)量。將用戶反饋的數(shù)據(jù)進(jìn)行剔除和篩選后,計(jì)算傳統(tǒng)協(xié)同過濾算法和改進(jìn)的方法的讀者接受度,對(duì)比結(jié)果如圖2所示。因?yàn)槊總€(gè)測(cè)試者對(duì)應(yīng)多種情境的推薦,此處的接受度為多種情況推薦的接受度的均值,最后一組的數(shù)據(jù)為前八組數(shù)據(jù)的均值。
圖2兩種協(xié)同過濾出信息推薦方法的比較
從圖2中可以看出,A組數(shù)據(jù)的推準(zhǔn)率普遍優(yōu)于B組。說明在實(shí)際情況下,本文提出的算法相較傳統(tǒng)協(xié)同過濾算法,有著較高的準(zhǔn)確率和性能優(yōu)越性。因?yàn)閭鹘y(tǒng)協(xié)同推薦算法在為用戶進(jìn)行推薦時(shí),僅僅只是依靠之前的數(shù)據(jù)為用戶提供他會(huì)感興趣的內(nèi)容,但凡場(chǎng)景發(fā)生些許變化,傳統(tǒng)算法就很難再處理好高評(píng)分內(nèi)容和實(shí)際需求內(nèi)容之間的關(guān)系。而基于樸素貝葉斯加權(quán)的情境感知協(xié)同過濾推薦算法在傳統(tǒng)算法的基礎(chǔ)上融入了情景信息,由原來的用戶×資源的二維關(guān)系變?yōu)橛脩簟临Y源×情景的三維關(guān)系,從而通過對(duì)不同情景下的用戶進(jìn)行不同內(nèi)容的推薦來滿足用戶個(gè)性化的需求,而非對(duì)任何情景都進(jìn)行單一內(nèi)容的推薦。實(shí)驗(yàn)結(jié)果也表明,基于樸素貝葉斯加權(quán)的情境感知協(xié)同過濾算法能夠更好地識(shí)別不同情景對(duì)信息推薦的影響力大小,能夠提供給讀者更加精準(zhǔn)的個(gè)性化推薦,提高推薦系統(tǒng)的質(zhì)量、水平和準(zhǔn)確性。
5結(jié)語
在移動(dòng)互聯(lián)網(wǎng)高速發(fā)展的背景下,圖書館需要從被動(dòng)滿足讀者需求變?yōu)橹鲃?dòng)感知用戶情境并進(jìn)行個(gè)性化服務(wù)推薦,簡(jiǎn)單的資源內(nèi)容推送已經(jīng)難以發(fā)揮館藏的最大價(jià)值,也不能突出圖書館本身的特點(diǎn)和實(shí)現(xiàn)社會(huì)信息溝通的目的。引入情境感知技術(shù)以提高服務(wù)的智能化、人性化、個(gè)性化,已成為數(shù)字圖書館的發(fā)展趨勢(shì)。本文從情境感知的角度,針對(duì)圖書館個(gè)性化服務(wù)推薦進(jìn)行研究,并提出了基于樸素貝葉斯算法的屬性加權(quán)情景信息結(jié)合傳統(tǒng)協(xié)同過濾方法對(duì)圖書館的用戶進(jìn)行智能化推薦的算法,能夠根據(jù)用戶的時(shí)間、地點(diǎn)等信息,向用戶推薦符合當(dāng)前情景的信息。通過實(shí)驗(yàn)表明該算法相較于傳統(tǒng)協(xié)同推薦算法有著更好的推薦效果和準(zhǔn)確率。然而,本文雖然實(shí)驗(yàn)數(shù)據(jù)足夠,但實(shí)驗(yàn)者數(shù)目較少,考慮的情景影響因素量也有待增加,同時(shí)實(shí)驗(yàn)中存在較多泛化因素,因此實(shí)驗(yàn)還有待于進(jìn)一步提高。此外,下一步的研究方向可以是用戶情境感知信息的有效獲取和多維情景信息下對(duì)推薦的影響,以進(jìn)一步證明該模型的有效性和推薦的準(zhǔn)確性。
參考文獻(xiàn)
[1]袁靜.情景感知自適應(yīng):圖書館個(gè)性化服務(wù)新方向[J].圖書情報(bào)工作,2012,56(7):79-82,97.
[2]Dey A K,Abowd G D,Salber D.A Conceptual Framework and a Toolkit for Supporting the Rapid Prototyping of Context-Aware Applications[J].Human-computer Interaction,2001,16(2-4):97-166.
[3]Dey A K.Understanding and Using Context Personal and Ubiquitous Computing Journal[J].Personal & Ubiquitous Computing,2001,5(1):4-7.
[4]郭高尚.情景感知的移動(dòng)推薦研究[D].邯鄲:河北工程大學(xué),2014.
[5]Kim J,Lee D,Chung K Y.Item Recommendation Based on Context-aware Model for Personalized U-healthcare Service[J].Multimedia Tools & Applications,2014,71(2):855-872.
[6]Kwon O,Choi S,Park G.NAMA:A Context-aware Multi-agent Based Web Service Approach to Proactive Need Identification for Personalized Reminder Systems[J].Expert Systems with Applications,2005,29(1):17-32.
[7]Mylonas P,Vallet D,Castells P,et al.Personalized Information Retrieval Based on Context and Ontological Knowledge[J].Knowledge Engineering Review,2008,23(1):73-100.
[8]李晟.基于情境感知的個(gè)性化電影推薦[D].北京:北京郵電大學(xué),2012.
[9]Schilit B,Adams N,Want R.Context-Aware Computing Applications[C]//The Workshop on Mobile Computing Systems & Applications,1994:85-90.
[10]Lee,The Concept of the Context-Aware Computing and Its Application to the Library Information Services.
[11]Aittola M,Ryhnen T,Ojala T.SmartLibrary-Location-Aware Mobile Library Service[M]//Human-Computer Interaction with Mobile Devices and Services.Springer Berlin Heidelberg,2003:411-416.
[12]張劍.移動(dòng)時(shí)代高校圖書館的情境感知服務(wù)系統(tǒng)研究[J].新世紀(jì)圖書館,2012,(5):42-45,1.
[13]黃傳慧.基于情境感知的圖書館學(xué)術(shù)信息推薦系統(tǒng)構(gòu)建研究[J].圖書館工作與研究,2015,(10):21-26.
[14]洪亮,錢晨,樊星.移動(dòng)數(shù)字圖書館資源的情境感知個(gè)性化推薦方法研究[J].現(xiàn)代圖書情報(bào)技術(shù),2016,(Z1):110-119.
[15]Mighali V,F(xiàn)iore G D,Patrono L,et al.Innovative IoT-aware Services for a Smart Museum[C]//International Conference on World Wide Web.ACM,2015:547-550.
[16]張帥,郭順利.基于情境感知的高校移動(dòng)圖書館個(gè)性化推薦模型研究[J].情報(bào)探索,2014,(10):6-11.
[17]周玲元,閆思琪,朱翔宇.“智慧圖書館”情境感知服務(wù)模式及評(píng)價(jià)研究[J].圖書館學(xué)研究,2017,(21):23-30.
[18]Adomavicius G,Tuzhilin A.Context-aware Recommender Systems[C]//ACM Conference on Recommender Systems.ACM,2008:335-336.
[19]曾子明.移動(dòng)環(huán)境下基于情境感知的數(shù)字圖書館個(gè)性化信息推薦研究[J].圖書情報(bào)工作,2013,57(12):123-128.
[20]秦鋒,任詩(shī)流,程澤凱,羅慧.基于屬性加權(quán)的樸素貝葉斯分類算法[J].計(jì)算機(jī)工程與應(yīng)用,2008,(6):107-109.
[21]曾子明,李鑫.移動(dòng)環(huán)境下基于情境感知的個(gè)性化信息推薦[J].情報(bào)雜志,2012,31(8):166-170.
(責(zé)任編輯:郭沫含)