郭恒 孫瑩 勞野
摘 要:隨著互聯(lián)網(wǎng)的出現(xiàn)及其普遍應(yīng)用,帶來了信息量的大幅增長,同時(shí)也產(chǎn)生了信息超載問題。推薦系統(tǒng)的出現(xiàn)很好的解決了信息超載問題,且被廣泛應(yīng)用在多個(gè)領(lǐng)域。本文首先對(duì)高校圖書館推薦系統(tǒng)的現(xiàn)狀以及系統(tǒng)架構(gòu)進(jìn)行簡要闡述,接著介紹了推薦系統(tǒng)中常用的幾種算法,最后結(jié)合工作中的實(shí)際情況對(duì)其應(yīng)用進(jìn)行了簡述。
關(guān)鍵詞:高校圖書館;推薦系統(tǒng);個(gè)性化推薦
高校圖書館的館藏資源非常豐富,且處于穩(wěn)定增長的狀態(tài),其主要用戶群是學(xué)校的教職工及學(xué)生。面對(duì)著用戶的專業(yè)不同、興趣不同,需求也是各不相同的。如何能夠結(jié)合自身的特點(diǎn),更主動(dòng)化、人性化的滿足用戶的不同需求,是圖書館發(fā)展階段的一項(xiàng)重要內(nèi)容。在網(wǎng)絡(luò)技術(shù)飛速發(fā)展的今天,利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)推薦系統(tǒng)的應(yīng)用,對(duì)于高校圖書館發(fā)展的現(xiàn)代化有著重要的意義。
1 高校圖書館推薦系統(tǒng)概述
1.1 高校圖書館推薦系統(tǒng)的發(fā)展及其現(xiàn)狀
最早的推薦系統(tǒng)Tapestry,是由美國施樂公司研究所于1992年12月開發(fā)出來的[1]。在這之后,又出現(xiàn)了應(yīng)用于不同領(lǐng)域的推薦系統(tǒng),有的可以根據(jù)用戶的興趣推薦相關(guān)的網(wǎng)絡(luò)新聞,有的可以根據(jù)消費(fèi)者的興趣提供個(gè)性化的商品推薦,有的可以根據(jù)用戶的學(xué)習(xí)內(nèi)容及習(xí)慣提供私人定制的學(xué)習(xí)計(jì)劃。在這些推薦系統(tǒng)的應(yīng)用中,比較出名的有國外的亞馬遜、Yahoo等電子商務(wù)網(wǎng)站[2],以及國內(nèi)的淘寶、京東等購物平臺(tái)。
隨著科技的發(fā)展,國內(nèi)的各個(gè)高校圖書館也隨后加強(qiáng)了對(duì)個(gè)性化推薦技術(shù)的研究。早在2000年初,名為“基于Web的數(shù)字圖書館定制系統(tǒng)”的項(xiàng)目由北京大學(xué)承擔(dān);中國人民大學(xué)的數(shù)字圖書館Kingbase DL,通過記錄和分析用戶描述信息,構(gòu)建讀者概貌,進(jìn)而產(chǎn)生與之相匹配的圖書推薦[3]。在研究人員對(duì)推薦技術(shù)研究的同時(shí),圖書推薦系統(tǒng)也逐步的應(yīng)用在高校圖書管理系統(tǒng)中。隨著其廣泛應(yīng)用,可以發(fā)現(xiàn),有圖書推薦功能的系統(tǒng),可以很好的滿足師生的信息需求,節(jié)省了用戶大量的搜索時(shí)間,通過更有針對(duì)性的圖書推薦,使得圖書館可以更好的發(fā)揮其資源優(yōu)勢。
1.2 推薦系統(tǒng)的架構(gòu)
目前來說,大多數(shù)正在使用的推薦系統(tǒng)是在現(xiàn)有的圖書管理系統(tǒng)之上增加的一種個(gè)性推薦功能。推薦系統(tǒng)可以分為以下幾個(gè)部分,即數(shù)據(jù)獲取和處理部分、模型建立及內(nèi)容過濾提取部分以及結(jié)果展示部分等。在數(shù)據(jù)獲取和處理部分,主要是對(duì)用戶數(shù)據(jù)和圖書數(shù)據(jù)進(jìn)行收集及處理;模型建立及內(nèi)容過濾提取部分是整個(gè)系統(tǒng)的核心,先建立出分析用戶興趣與需求的模型,然后通過推薦算法,篩選出用戶可能借閱的圖書資源;結(jié)果展示部分是對(duì)推薦結(jié)果的顯示的管理,包括展示的位置、內(nèi)容、數(shù)量以及推薦結(jié)果的發(fā)布渠道等[4]。
2 常用的推薦算法
在推薦系統(tǒng)的研究中,可用到的算法有很多,較常用的有以下幾種:基于關(guān)聯(lián)規(guī)則的推薦,基于內(nèi)容的推薦、基于協(xié)同過濾的推薦等。其中協(xié)同過濾算法是目前應(yīng)用比較廣泛的推薦算法。
2.1 基于關(guān)聯(lián)規(guī)則的推薦
基于關(guān)聯(lián)規(guī)則的推薦是從大量的數(shù)據(jù)中找到項(xiàng)目與項(xiàng)目之間的內(nèi)在聯(lián)系,即挖掘出強(qiáng)關(guān)聯(lián)規(guī)則[5]。一般關(guān)聯(lián)規(guī)則的產(chǎn)生如下:首先需要在項(xiàng)目集合中生產(chǎn)所有的頻繁項(xiàng)集,然后在頻繁項(xiàng)集眾尋找強(qiáng)規(guī)則。該算法能發(fā)現(xiàn)新的興趣點(diǎn)、不需要領(lǐng)域知識(shí),但是靈活性較差,存在屬性重疊問題[6]。
2.2 基于內(nèi)容的推薦
此種算法首先對(duì)項(xiàng)目的特征進(jìn)行提取,然后基于項(xiàng)目特征填充用戶檔案信息,最后產(chǎn)生推薦項(xiàng)目給用戶[7]。該算法比較簡單,但是對(duì)內(nèi)容提取能力有限,面對(duì)高校圖書館的所產(chǎn)生的巨量數(shù)據(jù),難以全面、準(zhǔn)確的實(shí)現(xiàn)對(duì)其內(nèi)容的挖掘。
2.3 基于協(xié)同過濾的推薦
此方法可以分為兩類:基于用戶的協(xié)同過濾和基于項(xiàng)目的協(xié)同
過濾。
基于用戶的協(xié)同過濾是根據(jù)用戶的歷史行為數(shù)據(jù)建立用戶-物品評(píng)分矩陣,采用特有的方法計(jì)算用戶之間的相似程度,找到與目標(biāo)用戶興趣相同或者相似的用戶,從而根據(jù)相似用戶的行為預(yù)測目標(biāo)用戶感興趣的資源[8]?;陧?xiàng)目的協(xié)同過濾是通過分析用戶的歷史行為,計(jì)算物品之間的相似度,然后根據(jù)目標(biāo)用戶喜歡的物品,找到相似的物品集合進(jìn)行推薦[9]。此方法算法簡單,查準(zhǔn)率較高,能夠發(fā)現(xiàn)讀者新的閱讀興趣,但是存在數(shù)據(jù)系稀疏、冷啟動(dòng)等問題[10]。
3 推薦系統(tǒng)的應(yīng)用
高校圖書館的推薦功能,是根據(jù)不同用戶的信息搜索內(nèi)容,獲得其個(gè)性化興趣,從中找出規(guī)律性,從而提高館藏圖書的利用率。我校圖書管理系統(tǒng)中的推薦模塊分為以下幾個(gè)部分:熱門借閱、熱門評(píng)分、熱門收藏、熱門圖書以及借閱關(guān)系圖等。熱門借閱推薦界面如圖1所示,包括題名、責(zé)任者、出版信息、索書號(hào)、館藏、借閱冊(cè)數(shù)以及借閱比。其中,借閱比是在一定的時(shí)間段內(nèi)(本系統(tǒng)中為2個(gè)月),某本書的總借閱次數(shù)和館藏量的比值。
熱門評(píng)分包括題名、責(zé)任者、出版信息、索書號(hào)、總體評(píng)價(jià)和評(píng)價(jià)人次,推薦模式是可從總體評(píng)價(jià)、評(píng)價(jià)人次、好評(píng)前100名等幾種方式來進(jìn)行選擇推薦;熱門收藏部分除了題名、責(zé)任者、出版信息、索書號(hào)等基本信息外,增加了收藏人數(shù),推薦結(jié)果以圖書的收藏人數(shù)由高到低進(jìn)行展示;熱門圖書部分是以圖書的瀏覽次數(shù)來進(jìn)行推薦的。借閱關(guān)系圖可以展示出某個(gè)讀者類型或者某個(gè)系別的讀者與圖書之間的借閱關(guān)系,如圖2所示。
4 結(jié)語
在如今網(wǎng)絡(luò)技術(shù)飛速發(fā)展的時(shí)代,高校圖書館在學(xué)生學(xué)習(xí)、教職工教學(xué)、科研的過程中發(fā)揮著不可替代的作用,要利用好新技術(shù),以讀者為本,在實(shí)際應(yīng)用中及時(shí)進(jìn)行修正、改進(jìn),從而構(gòu)建出更完善、實(shí)用的高校圖書館推薦系統(tǒng)。
參考文獻(xiàn)
[1]Goldberg D. , Nichols D.,Okibm, et al..Using Collaborative Filtering to Weave an Information Tapestry [J].Communications of the ACM, 1992,35(12):61-70.
[2]孫常麗,孫達(dá)辰,郭冬梅,武麗影,金松跟.推薦系統(tǒng)在高校圖書館中的個(gè)性化應(yīng)用[J].研究探索,2017(04):221-222.
[3]連鍥.高校圖書館圖書推薦系統(tǒng)研究-基于興趣漂移理論和協(xié)同過濾算法[J].中國教育信息化,2018(10):87-88.
[4]趙泉.高校圖書館圖書推薦系統(tǒng)研究[J].新余學(xué)院學(xué)報(bào),2018,23(03):92-93.
[5]Yang H.Improved Collaborative Filtering Recommendation Algorithm Based on Weighted Association Rules[J].Applied Mechanics&Materials,2013:411-414;94-97.
[6]邵方舒.基于協(xié)同過濾及關(guān)聯(lián)規(guī)則的個(gè)性化圖書推薦[D].浙江工商大學(xué),2018 (01):12-14.