孫常麗++孫達(dá)辰++郭冬梅++武麗影++金松跟
[摘要]文章概述了高校圖書館薦讀系統(tǒng)的發(fā)展現(xiàn)狀,對(duì)推薦系統(tǒng)中的核心技術(shù)——推薦算法進(jìn)行了探討分析,同時(shí)進(jìn)行了高校推薦系統(tǒng)地推薦模式的創(chuàng)新性設(shè)計(jì),簡(jiǎn)述了基于局部數(shù)據(jù)推薦模式的實(shí)現(xiàn)過(guò)程,對(duì)國(guó)內(nèi)圖書館提供推薦服務(wù)的未來(lái)做出了展望。
[關(guān)鍵詞]高校圖書館;推薦系統(tǒng);推薦技術(shù);推薦算法;推薦服務(wù)
[DOI]1013939/jcnkizgsc201704221
高校圖書館擁有豐富的藏書資源,是知識(shí)和信息的集散地,但是在知識(shí)爆炸的時(shí)代,移動(dòng)設(shè)備頻頻更新?lián)Q代,讀者閱讀行為已經(jīng)改變,如果圖書館不能推出新的面向讀者的服務(wù)方式,高校圖書館將無(wú)法很好發(fā)揮其資源的優(yōu)勢(shì)。在這種環(huán)境下,文章提出了在高校圖書館領(lǐng)域構(gòu)建基于局部數(shù)據(jù)的圖書薦讀系統(tǒng)(推薦系統(tǒng)),既能很好地滿足廣大師生的信息需求,同時(shí)也能夠通過(guò)這種主動(dòng)推薦的模式幫助更多師生節(jié)省查找圖書資料的時(shí)間,提高工作學(xué)習(xí)效率。
1推薦系統(tǒng)在國(guó)內(nèi)外的發(fā)展現(xiàn)狀
近年來(lái),推薦系統(tǒng)在各個(gè)領(lǐng)域內(nèi)逐漸興起,并得到越來(lái)越廣泛的應(yīng)用,1992年12月,美國(guó)施樂公司研究所開發(fā)了最早的推薦系統(tǒng)Tapestry;[1]1994年,GroupLens系統(tǒng)可以根據(jù)用戶的興趣推薦相關(guān)的網(wǎng)絡(luò)新聞的文章;之后又出現(xiàn)了Citeseer等應(yīng)用于不同領(lǐng)域的推薦系統(tǒng);近年來(lái),很多網(wǎng)站可以為消費(fèi)者提供個(gè)性化推薦,其中,最著名的是亞馬遜電子商務(wù)網(wǎng)站,它采用的是條目對(duì)條目的協(xié)同推薦算法;目前,在圖書館領(lǐng)域應(yīng)用推薦系統(tǒng)的比比皆是,除了各自采用不同的推薦方式之外,目的都是為讀者提供更快、更好的信息推送服務(wù),其中斯坦福大學(xué)的Fab推薦系統(tǒng),它將基于內(nèi)容和協(xié)同過(guò)濾算法結(jié)合起來(lái),采用混合推薦技術(shù)為特定用戶進(jìn)行推薦;加州大學(xué)的Melvy推薦系統(tǒng),它采用了兩種生成推薦系統(tǒng)的方法,一種是利用圖書館的流通數(shù)據(jù)進(jìn)行推薦,另一種是基于相似性的推薦;美國(guó)俄勒岡的SERF推薦系統(tǒng)是一種通過(guò)寫作過(guò)濾的新型搜索引擎;在國(guó)內(nèi),雖然也有高校圖書館推出了推薦系統(tǒng),但并不普遍,其中中國(guó)人民大學(xué)圖書館的推薦系統(tǒng)比較成型,它同樣采用了混合的推薦模式為讀者推送書目信息。
綜上所述,推薦系統(tǒng)在國(guó)際上已有成熟范例,而國(guó)內(nèi)圖書館領(lǐng)域仍屬于起步階段,需我們各大高校共同努力,實(shí)現(xiàn)圖書館領(lǐng)域的智能圖書推薦,并且可以為相似領(lǐng)域提供一定的參考思路。
2高校圖書推薦系統(tǒng)的個(gè)性化推薦模式探討
圖書推薦系統(tǒng)的主要推薦模式有三種:個(gè)性化推薦、智能化檢索和社會(huì)化推薦。[2]其中智能化推薦需要利用大數(shù)據(jù)和云計(jì)算技術(shù)構(gòu)建一個(gè)強(qiáng)大的互動(dòng)知識(shí)分享平臺(tái),社會(huì)化推薦旨在解決用戶在網(wǎng)上書店的社交網(wǎng)絡(luò)需求,而對(duì)于高校圖書館而言,目前,僅僅實(shí)現(xiàn)了低級(jí)信息化,圖書數(shù)據(jù)的元數(shù)據(jù)不多,使得圖書的全文檢索功能受到限制,而且高校圖書館有其自身藏書特點(diǎn),專業(yè)書籍占藏書比例相對(duì)要高,由于讀者水平及其專業(yè)各不相同,使得圖書館中大部分書籍成了擺設(shè),無(wú)人問津,為了解決以上問題,本文嘗試采用個(gè)性化的推薦模式來(lái)構(gòu)建高校圖書館領(lǐng)域的圖書推薦系統(tǒng)。[3]
目前,推薦系統(tǒng)在各行各業(yè)中應(yīng)用廣泛,其核心算法已經(jīng)基本成熟,個(gè)性化推薦是將協(xié)同過(guò)濾推薦算法應(yīng)用于高校圖書館領(lǐng)域,其基本思想是為一個(gè)用戶找到他真正感興趣的內(nèi)容的最好方法是首先找到與此用戶有相似喜好的其他用戶,然后將他們所喜好的內(nèi)容推薦給當(dāng)前用戶,該思想類似于現(xiàn)實(shí)生活中的“口碑傳播”(word-of-mouth)。它是在用戶對(duì)于一些項(xiàng)目或新聞資訊的評(píng)分或可以表達(dá)用戶喜好的行為的基礎(chǔ)上,查找具有相同興趣愛好或行為的用戶,以此來(lái)為目標(biāo)用戶推薦一些他們可能會(huì)感興趣的資料的技術(shù)。協(xié)同過(guò)濾推薦算法是目前較常用的推薦技術(shù),它的計(jì)算所依賴的原始數(shù)據(jù)都是用戶數(shù)據(jù)評(píng)分矩陣,根據(jù)我們的經(jīng)驗(yàn),協(xié)同過(guò)濾算法可以基于相似用戶的歷史行為獲得更多“不知曉”的項(xiàng)目,它的優(yōu)點(diǎn)是不需要對(duì)物品或者用戶進(jìn)行嚴(yán)格的建模,且不要求物品的描述是機(jī)器可以理解的,與領(lǐng)域無(wú)關(guān)的,而且它計(jì)算出來(lái)的推薦是開放的,可以共用他人的經(jīng)驗(yàn),很好地支持用戶發(fā)現(xiàn)潛在的興趣偏好,且發(fā)現(xiàn)速度更快;這種推薦方法隨著時(shí)間推移性能會(huì)提高,且其推薦個(gè)性化、自動(dòng)化程度都很高,能處理復(fù)雜的非結(jié)構(gòu)化對(duì)象;但是,這種方法存在稀疏性問題、可擴(kuò)展問題和新用戶問題,其推薦效果取決于歷史數(shù)據(jù)集,且系統(tǒng)剛開始時(shí)推薦質(zhì)量較差。
這種方法不同于其他算法,在國(guó)內(nèi)應(yīng)用不多。文章將采用個(gè)性化推薦模式,主要是根據(jù)《中圖法》對(duì)圖書館中的圖書類別按照分類號(hào)進(jìn)行劃分,同時(shí)根據(jù)讀者的借閱習(xí)慣劃分出相似讀者群,并為讀者找到具有更為相似借閱習(xí)慣的近鄰讀者,對(duì)其進(jìn)行圖書推薦服務(wù),這種推薦模式可以為讀者提供相同及不同分類號(hào)的圖書推薦服務(wù),同時(shí)還提供近鄰讀者推薦,一方面,對(duì)讀者推薦可能感興趣的作者及其作品,另一方面,對(duì)作者推薦相似讀者及其圖書興趣。其主要推薦過(guò)程為:①數(shù)據(jù)預(yù)處理:將得到的數(shù)據(jù)按照運(yùn)算模式進(jìn)行預(yù)處理;②數(shù)據(jù)處理:通過(guò)已經(jīng)設(shè)計(jì)好的個(gè)性化推薦體系將得到的預(yù)處理數(shù)據(jù)進(jìn)行數(shù)據(jù)加工處理,得到備用數(shù)據(jù)集;③數(shù)據(jù)測(cè)試:將數(shù)據(jù)集代入個(gè)性化協(xié)同過(guò)濾模式中進(jìn)行數(shù)據(jù)測(cè)試;④評(píng)分:進(jìn)行計(jì)算并得出有意義的評(píng)分集合;⑤進(jìn)行推薦:根據(jù)我們得到的評(píng)分集合來(lái)進(jìn)行圖書推薦。[4]
3推薦方法的創(chuàng)新設(shè)計(jì)
在采用個(gè)性化推薦模式的基礎(chǔ)之上,文章創(chuàng)新性地提出了基于局部近鄰搜索的思想,即基于局部用戶數(shù)據(jù)(User-Based,CF)的協(xié)同過(guò)濾推薦算法來(lái)構(gòu)建圖書推薦系統(tǒng),該算法是假設(shè)如果某些讀者同時(shí)喜歡某一專業(yè)或某一類別的圖書,那么他們對(duì)其他專業(yè)或類別的圖書的喜愛也比較相似,即評(píng)分相似。高校由于其按專業(yè)進(jìn)行劃分的這種特點(diǎn),在挑選圖書時(shí),相同專業(yè)的讀者往往會(huì)挑選相同或相似類別的圖書,因此,我們?cè)谶M(jìn)行推薦方法設(shè)計(jì)時(shí)創(chuàng)新性地采用了讀者局部數(shù)據(jù),即采用相同專業(yè)的讀者借閱數(shù)據(jù)來(lái)進(jìn)行圖書推薦服務(wù),這種方法區(qū)別于以往的利用全校讀者的借閱數(shù)據(jù)來(lái)發(fā)掘讀者潛在興趣,提供推薦服務(wù)的模式。
這種基于創(chuàng)新圖書推薦方法的圖書推薦服務(wù)的實(shí)現(xiàn),需要我們根據(jù)讀者所屬專業(yè)的不同將圖書館中讀者借還數(shù)據(jù)進(jìn)行分類,并計(jì)算相同專業(yè)不同讀者之間的借閱相似度,我們需要根據(jù)這種相似度的高低來(lái)找到目標(biāo)讀者的K個(gè)最近鄰居,在這一過(guò)程中將采用最近鄰方法進(jìn)行篩選。同時(shí),我們將讀者借閱相似度作為權(quán)重得出預(yù)測(cè)評(píng)分,這需要計(jì)算最近鄰居對(duì)未評(píng)分項(xiàng)目的加權(quán)平均值,對(duì)得到的預(yù)測(cè)評(píng)分進(jìn)行排序,將評(píng)分較高的項(xiàng)目作為目標(biāo)進(jìn)行推薦。這種方式的推薦結(jié)果推薦精度高、且具有推薦對(duì)象多樣化等優(yōu)點(diǎn)。
4結(jié)論
將推薦系統(tǒng)應(yīng)用于圖書館領(lǐng)域,可以提高圖書館現(xiàn)有資源的利用率,節(jié)省讀者查找所需圖書資料的時(shí)間,為高校教學(xué)科研提供極大便利。目前,國(guó)內(nèi)很少有成熟的推薦系統(tǒng)應(yīng)用在高校圖書館領(lǐng)域,由于構(gòu)建推薦系統(tǒng)的算法多種多樣,各具優(yōu)勢(shì),各大高校應(yīng)該根據(jù)自己院校的特點(diǎn)進(jìn)行選擇,適當(dāng)創(chuàng)新,以促進(jìn)推薦系統(tǒng)在未來(lái)高校圖書館中的發(fā)展應(yīng)用。
參考文獻(xiàn):
[1] Goldberg D,Nichols D,Okibm,et alUsing Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM,1992,35(12):61-70
[2]張閃閃,黃鵬高校圖書館圖書推薦系統(tǒng)中的稀疏性問題實(shí)證探析[J].大學(xué)圖書館學(xué)報(bào),2014(6):47-53
[3]姜志英基于數(shù)據(jù)挖掘的數(shù)字圖書館個(gè)性化推薦算法研究[D].秦皇島:燕山大學(xué),2007
[4]楊玲圖書推薦服務(wù)系統(tǒng)構(gòu)建與應(yīng)用研究[D].廣州:華南理工大學(xué),2014