• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于個性化的協(xié)同過濾圖書推薦算法研究

      2016-12-21 11:09:59黃瑛楊維偉
      電腦知識與技術(shù) 2016年28期
      關(guān)鍵詞:推薦系統(tǒng)影響因子

      黃瑛+楊維偉

      摘要:近年來,隨著國家對教育的重視,圖書館圖書呈線性增長,借閱者很難從海量的圖書資源中選取有用的信息?;趥€性化的協(xié)同過濾推薦算法有效地解決了這個問題,為了提高推薦的準(zhǔn)確度,引入相似度影響因子,充分考慮不同因素對推薦結(jié)果影響力的大小。

      關(guān)鍵詞:推薦系統(tǒng);系統(tǒng)過濾;用戶相似性;影響因子

      中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)28-0088-02

      1 背景

      協(xié)同過濾算法給我們的生活帶來了極大的便利,特別是當(dāng)我們在網(wǎng)上購物時,網(wǎng)站總是能推送我們需要的商品,簡化了購物過程,方便了我們的生活。協(xié)同過濾算法可以根據(jù)用戶偏好和其他特征為用戶推薦相似物品,面對海量的圖書館圖書資源,如果可以將協(xié)同推薦算法用于圖書館圖書推薦,將能極大地方便學(xué)生的學(xué)習(xí)生活。

      2 相關(guān)工作

      以前圖書館推薦算法直接依據(jù)圖書評分?jǐn)?shù)據(jù),按評分高低向用戶進(jìn)行推薦,沒有考慮到用戶的偏好和需求。隨著技術(shù)的發(fā)展,圖書推薦算法也得到了改進(jìn),目前常用的圖書館推薦算法大致分為三種:

      1)基于內(nèi)容的推薦算法:該算法的基本思想是根據(jù)用戶的借閱歷史記錄,分析借閱書籍,提取用戶標(biāo)簽數(shù)據(jù),然后將用戶標(biāo)簽和圖書標(biāo)簽進(jìn)行匹配,觀察匹配程度,選取前N本圖書,生成圖書推薦列表。

      2)協(xié)同過濾推薦算法:該算法在基于內(nèi)容的推薦算法上進(jìn)一步改進(jìn),加入相似度概念,考慮有著相似興趣愛好的讀者對用戶的影響。我們需要計算用戶相似度,找到與該用戶最相似的top-N用戶,然后分析用戶對這些相似用戶已借閱讀書的感興趣程度,得到圖書推薦列表。目前有三種常用方法用于計算用戶之間的關(guān)聯(lián)度。

      歐幾里得距離法:將用戶對讀書的評分轉(zhuǎn)換成向量的形式,由此我們得到一個n維的評分向量,利用歐幾里得公式計算兩個向量之間的距離,距離值越小相似度越高,歐氏公式為:

      余弦相似性:將用戶評分看成一個n維的向量,利用余弦公式計算兩個用戶向量夾角余弦值,值越大兩個用戶就越相似,余弦公式為:

      相關(guān)相似性:利用Pearson相關(guān)系數(shù)計算兩個讀者之間的相似程度。

      3)基于用戶個性化協(xié)同過濾推薦算法:根據(jù)高校的實際情況和需求,應(yīng)運(yùn)而生了一種基于用戶背景的個性化推薦方法。一般情況下,用戶多會借閱本專業(yè)的相關(guān)書籍,所以在進(jìn)行推薦的過程中可以重點考慮相關(guān)專業(yè)同學(xué)的借閱記錄,將他們借閱過的書籍進(jìn)行重點推薦。

      3 基于個性化的協(xié)同過濾推薦算法

      3.1 圖書初始評分

      每天圖書館會有大量的新書上線,這些新書由于之前沒有人借閱,需要為這些圖書人為的劃分類別和設(shè)置評分初值,根據(jù)《中圖法》可以將圖書劃分成不同的22個大類。

      3.2 計算用戶對每一類別圖書的偏好

      根據(jù)用戶的借閱歷史和歷史評分,結(jié)合之前的圖書分類數(shù)據(jù),計算用戶對一類書籍的總評分。用戶借閱不同類別書籍的數(shù)量不同,可以反映用戶對某類書籍的喜愛程度,為此我們?yōu)橛脩粢言u價類別賦予不同的權(quán)重值:。為某類別圖書借閱統(tǒng)計次數(shù),為所有借閱圖書的總次數(shù)。由此我們可以計算出用戶對該類圖書的評分,評分公式為:

      表示讀者a對類別書籍的評分,i屬于類別的圖書,是用戶對類別圖書的總評分。

      3.3 根據(jù)用戶偏好,計算用戶相似度

      上一步我們得到了用戶對圖書類別的評分,根據(jù)這個評分,使用皮爾遜相關(guān)系數(shù)算法計算用戶之間的相似度,找出用戶的近鄰集合U。皮爾遜相關(guān)性公式為:

      M為用戶a和b的共同評分項,和分別為用戶a和用戶b的平均評分,利用圖書類別計算用戶間的相似度可以大大減少計算量。根據(jù)上式我們得到用戶之間的相似度,依據(jù)相似度大小進(jìn)行排序,選取前N個用戶作為用戶a的鄰居集合U。

      3.4 預(yù)測用戶對其他書籍的評分產(chǎn)生推薦

      我們根據(jù)用戶的近鄰集U可以產(chǎn)生圖書推薦列表,為了使推薦列表更準(zhǔn)確,我們引入讀者相似度的影響因子??紤]到實際情況,影響因子的主要有用戶專業(yè)、職位和以往評分準(zhǔn)確度這三個方面。

      1)專業(yè):

      眾所周知,相同專業(yè)的學(xué)生對書的需求是相似的,所有相同專業(yè)學(xué)生的借閱書籍對推薦影響較大(),影響因子表達(dá)式如下:

      2)職位

      學(xué)校內(nèi)老師、研究生和大學(xué)生是借書的主力軍。不同職位的人對圖書好壞的判讀力是不同的,因此老師對圖書推薦的推薦影響力應(yīng)該最大。下表中的,,呈現(xiàn)逐漸遞減關(guān)系:

      3)歷史評分準(zhǔn)確度

      不同用戶有不同的評分習(xí)慣,對圖書評分的標(biāo)準(zhǔn)不同,為了確保推薦的準(zhǔn)確度,我們引入第三個影響因子。如果用戶評分越接近平均分則用戶評分越準(zhǔn)確,影響因子也就越大,影響因子計算公式為:

      其中S為用戶評分圖書集,為用戶對圖書i的評分,為圖書的平均評分,max和min分別為圖書i獲得評分的最大值和最小值。

      綜上所述,用戶的綜合評分影響因子表達(dá)式為:

      用戶對某本圖書的預(yù)測評分公式為:

      n為屬于U集合的用戶數(shù)量,和分別為用戶a和用戶b的平均評分,為用戶b對j圖書的評分。

      由用戶對某本圖書的預(yù)測評分公式,我們得到用戶對推薦列表內(nèi)每本圖書的預(yù)測評分,根據(jù)實際情況,我們選擇前N本圖書進(jìn)行推薦。

      4 結(jié)束語

      隨著科技的發(fā)展,推薦系統(tǒng)在我國得到廣泛使用,圖書推薦系統(tǒng)也逐漸進(jìn)入學(xué)生的學(xué)習(xí)生活。根據(jù)高校的實際情況,我們提出了一種改進(jìn)的圖書推薦系統(tǒng),引入影響因子概念,提高推薦準(zhǔn)確度。使學(xué)生在面對海量的數(shù)據(jù)時可用更方便地找到符合自己的學(xué)習(xí)資源。

      參考文獻(xiàn):

      [1] 劉建國, 周濤, 汪秉宏. 個性化推薦系統(tǒng)的研究進(jìn)展[J]. 自然科學(xué)研究進(jìn)展, 2009, 19(1): 1-15.

      [2] 張怡文, 岳麗華, 張義飛. 基于共同用戶和相似標(biāo)簽的好友推薦方法[J]. 計算機(jī)應(yīng)用, 2013, 33(8); 2273-2275.

      [3] 呂果, 李法運(yùn). 基于改進(jìn)協(xié)同過濾的移動個性化推薦服務(wù)研究[J]. 情報探索, 2014(20): 101-105.

      [4] 楊濤, 曹樹金. 圖書館用戶的個性化服務(wù)需求實證研究[J]. 大學(xué)圖書館學(xué)報, 2011(2): 76-85.

      [5] 許文青, 林雙平. 融合熱門度因子基于標(biāo)簽的個性化圖書推薦算法[J]. 圖書情報研究,2015(3): 82-86.

      [6] Koren Y. Factor in the neighbors: scalable and accurate collaborative filtering[J]. ACM Transactions on Knowledge Discovery from Data, 2010, 4(1): 24.

      猜你喜歡
      推薦系統(tǒng)影響因子
      數(shù)據(jù)挖掘在選課推薦中的研究
      軟件(2016年4期)2017-01-20 10:09:33
      基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
      個性化推薦系統(tǒng)關(guān)鍵算法探討
      農(nóng)作物病蟲害氣象環(huán)境影響因子分析
      淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
      手機(jī)閱讀平臺用戶體驗影響因子分析
      目的論視角下旅游英語的語言特色對漢譯旅游文本的啟示
      科技視界(2016年23期)2016-11-04 13:29:09
      關(guān)于協(xié)同過濾推薦算法的研究文獻(xiàn)綜述
      商(2016年29期)2016-10-29 15:22:08
      云霧物理生長過程及其影響因子的虛擬仿真實驗
      考試周刊(2016年50期)2016-07-12 23:09:38
      UGC標(biāo)簽推薦系統(tǒng)的一種新的標(biāo)簽清理方法
      商(2016年15期)2016-06-17 17:39:50
      容城县| 伊金霍洛旗| 嘉善县| 永靖县| 巩义市| 陕西省| 德昌县| 新兴县| 和政县| 贡山| 益阳市| 彭水| 荥经县| 民丰县| 临朐县| 南靖县| 永登县| 阿拉善盟| 宿州市| 佛山市| 景德镇市| 金寨县| 松溪县| 阿荣旗| 绥滨县| 赤水市| 嘉祥县| 民权县| 威信县| 天津市| 潞西市| 海原县| 英山县| 道孚县| 明星| 泉州市| 秭归县| 连云港市| 广德县| 鄯善县| 扶余县|