• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      融合時間因素的協(xié)同過濾圖書推薦算法

      2021-07-17 19:16:51張小雷孫剛彭余輝
      阜陽職業(yè)技術學院學報 2021年2期
      關鍵詞:物品圖書協(xié)同

      張小雷 孫剛 彭余輝

      摘? 要:隨著互聯(lián)網的遍及以及圖書資源的高速更新?lián)Q代,用戶對圖書的需求變得越來越大,傳統(tǒng)的推薦算法已經無法滿足用戶及時準確尋找所喜歡的圖書的需求。讀者的閱讀習慣會隨時間變化而變化。在協(xié)同過濾圖書推薦算法中融入時間因素,在計算用戶和物品相似度中增加時間衰減函數(shù)可以解決讀者找書難的問題。實驗證明,在協(xié)同過濾圖書推薦算法中融入時間因素,可以提升推薦的精準率。

      關鍵字:協(xié)同過濾;圖書推薦;時間因素;精準率

      中圖分類號:G250.7? ? ? ? ? 文獻標識碼:A? ? ? ? ? 文章編號:1672-4437(2021)02-0051-04

      如今,隨著線上和線下大量圖書的出現(xiàn),人們越來越難以尋找自己想要的圖書。當讀者想要讀一本書的時候,傳統(tǒng)的做法是去圖書館、書店等線下通過管理員查找或自己尋找,或者是去圖書網站線上搜索,有時候讀者花費了時間還不一定找得到。圖書推薦的出現(xiàn)可以解決讀者這方面的問題,可以為不同的讀者進行專屬推薦,滿足其快速且有針對性的查找需求,增加圖書閱讀率和銷量。

      協(xié)同過濾圖書推薦算法通過挖掘讀者或圖書的歷史信息進行推薦,能為讀者提供有效的推薦。隨著時間的推移,讀者的興趣度、圖書的流行度、社會群體的興趣度等都會發(fā)生變化,這個時候如果還按之前進行推薦的話,必然會影響推薦的準確率。在基于協(xié)同過濾的推薦算法中融合時間因素,能夠有效地反映最近讀者或圖書的變化情況,為讀者提供更加實時的推薦,提高推薦效率。

      1基于協(xié)同過濾的推薦算法

      1.1協(xié)同過濾算法思想

      關于協(xié)同過濾,一個經典的例子是:我們想看一本書但不知道看哪一本,這個時候我們通常會咨詢周圍的人,當我們發(fā)現(xiàn)某個人和我們興趣相似的時候,我們通常會接受他的推薦,這就是其核心思想。協(xié)同過濾算法主要包括基于用戶的協(xié)同過濾(UserCF)算法和基于物品的協(xié)同過濾(ItemCF)算法兩種[1]。

      1.2協(xié)同過濾算法工作流程

      算法流程如圖1所示:

      1.3基于協(xié)同過濾的推薦算法研究現(xiàn)狀

      1.3.1面臨的問題

      面臨的主要問題有:(1)冷啟動問題。由于之前無行為,新用戶或新物品進入,不能很好推薦。(2)稀疏性問題。用戶一般主動給予的評價較少,在用戶評分矩陣中出現(xiàn)很多0值,不能很好地計算相似度,影響推薦精度。(3)擴展性問題。商業(yè)網站用戶和物品數(shù)量龐大,推薦算法計算時間和空間都很龐大,在巨量數(shù)據(jù)面前,很難做到實時推薦。

      1.3.2研究現(xiàn)狀

      國內外很多學者對傳統(tǒng)協(xié)同過濾算法出現(xiàn)的問題進行了多種改良。對于用戶或物品冷啟動問題,可以引導用戶表達屬性或注冊信息,通過給物品打標簽分析其屬性來解決,也可以直接通過排行榜推薦熱門產品來解決。如付文靜提出的RC-DFM模型,把評論和內容進行加權融合,緩解了數(shù)據(jù)的稀疏性,與此同時推薦的準確度也提高了[2],但是當數(shù)據(jù)集比較大的時候,這種模型的推薦效率會因為時間的增加而降低。王輝等人針對冷啟動問題進行研究,把項目的屬性和用戶的評分結合起來來預測評分[3],給用戶進行推薦,但是當新用戶來的時候很難進行推薦。楊武等人將基于內容的推薦算法和基于協(xié)同過濾的推薦算法相融合[4],提高了推薦的準確率。以上推薦算法可以提高推薦的精確度,但對于需求量寬泛的用戶來說,遠遠無法滿足。在“長尾理論”的支持下,大量的不流行的商品的銷售量幾乎與流行商品的銷售量相同,在袁煦聰?shù)难芯恐?,提出了算法item-CF-IIF,通過懲罰熱門商品并且優(yōu)化排序待推薦的物品,能夠提高推薦的準確度,同時用戶的體驗也較好[5]。

      2融合時間因素的協(xié)同過濾圖書推薦算法

      2.1推薦算法中的時間效應

      日常生活中隨處可見時間效應,時間效應對推薦的影響比較大[6]。在圖書推薦領域,讀者的閱讀習慣隨著時間推移會發(fā)生變化,主要有以下三個方面:一是個人興趣度隨時間變化而變化。比如讀者在小時候喜歡讀兒童讀物,長大之后則對兒童讀物不感興趣。二是圖書的流行度會隨時間變化而變化。有的圖書剛開始出版的時候很熱門,讀者也很多,但隨著熱度的下降就會變得不再很流行。三是社會群體興趣度隨時間變化而變化。比如隨著推薦技術的發(fā)展,讀者更容易找到自己想要的圖書,從而整體上讀者對圖書的評分呈上升趨勢。

      在圖書推薦算法中融合時間因素更能反映讀者的近期偏好,為讀者提供更有針對性的推薦。

      2.2融合時間因素的協(xié)同過濾圖書推薦算法流程

      算法流程如圖2所示:

      2.3增加時間衰減函數(shù)的相似度計算方法

      在協(xié)同過濾算法中融合時間因素包括在基于用戶的協(xié)同過濾(UserCF)算法中融合時間因素構造的協(xié)同過濾(TF-UserCF)算法和基于物品的協(xié)同過濾(ItemCF)算法中融合時間因素構造的協(xié)同過濾(TF- ItemCF)算法[7]兩種。這兩種算法在相似度計算中增加衰減函數(shù)的計算方法分別如下。

      2.3.1 TF-UserCF算法相似度計算方法

      UserCF算法先找“相似用戶”再找“相似用戶所喜歡的物品”,相似度計算采用余弦相似度計算方法[8],公式為:

      和表示用戶和用戶產生過行為的物品集合。

      在冷門物品上有交互更能表示用戶相似,所以在公式中加入對熱門物品的懲罰項[8],用戶相似度公式修改為:

      表示產生過行為的所有用戶個數(shù)。

      越是最近的行為越能表示用戶當前興趣,所以在計算用戶相似度時加入時間衰減函數(shù),公式如下:

      公式中為時間衰減函數(shù),形式為:

      式中,為時間衰減因子,表示用戶與物品產生交互的時間,表示用戶與物品產生交互的時間。

      影響大的是當前評分,加上時間衰減函數(shù),最終用戶對物品的偏好程度如下:

      其中表達式為:

      式中,表示當前時間,表示用戶與物品產生交互的時間。

      2.3.2 TF-ItemCF算法相似度計算方法

      ItemCF算法的主要思想是:先找到“相似物品”,再把相似物品推薦給用戶。相似度計算公式為:

      式中和表示與物品和物品產生過行為的用戶集合。

      行為較多用戶貢獻較少,降低其權重,改進為:

      )表示用戶 的評分物品集合。

      在式中增加時間衰減因子函數(shù),改進為:

      式中為時間衰減函數(shù)。

      加上函數(shù),最終公式為:

      式中,的表達式為:

      式中,表示當前時間。

      3實驗結果與分析

      3.1 實驗數(shù)據(jù)分析

      實驗使用python語言編程對算法進行實現(xiàn),使用Book-Crossing數(shù)據(jù)集,它包含了278858個用戶對271379本圖書的1149780個評分數(shù)據(jù)[9]。通過python代碼查看用戶評分統(tǒng)計可以看出評分范圍是0-10分。其中評分前三的人數(shù)統(tǒng)計中評分為0分的用戶最多,達716109人,其次是評分為8分的人數(shù),達103736人,第三位評分為10分的人數(shù),達78610人。評分統(tǒng)計中評分為1分的人數(shù)最少,只有1770人。

      3.2 實驗評價標準

      本次實驗中將80%的實驗數(shù)據(jù)作為訓練數(shù)據(jù),20%作為測試數(shù)據(jù)。通過精準率(Precision)對實驗結果進行評價,Precision表示在預測用戶是否喜歡時,正確預測用戶喜歡的商品的比例,計算公式如下:

      3.3實驗結果分析

      3.3.1不同K值下的UserCF算法和ItemCF算法的Precision比較

      結果如圖3所示。從圖3可以看出,隨著K值的不斷增加,UserCF算法的Precision先不斷增加后趨于平穩(wěn),ItemCF算法的Precision先不斷增加再下降??傮w而言,隨著K值的增加,UserCF算法的Precision高于ItemCF算法的Precision。

      3.3.2不同K值下的UserCF算法和TF-UserCF算法的Precision比較

      結果如圖4所示。從圖4可以看出,基于用戶的協(xié)同過濾算法中融入時間因素構造的TF-UserCF算法和UserCF算法比較,在不同K值下,TF-UserCF算法的Precision要高于UserCF算法的Precision,但優(yōu)勢不明顯。所以在基于用戶的協(xié)同過濾算法中融入時間因素構造的算法的精準率有所提高,但效果不明顯。

      3.3.3 不同K值下的ItemCF算法和TF-ItemCF算法的Precision比較

      結果如圖5所示。從圖5可以看出,基于物品的協(xié)同過濾算法中融入時間因素構造的TF-ItemCF算法和ItemCF算法相比較,在不同K值下,TF-ItemCF算法的Precision明顯優(yōu)于ItemCF算法。所以在基于物品的協(xié)同過濾算法中融入時間因素構造的算法精確率明顯提高。

      以上通過在協(xié)同過濾算法中融入時間因素來進行圖書推薦,依此來解決隨著時間的推移讀者的興趣遷移問題。通過實驗證明在協(xié)同過濾算法中融入時間因素可以提升圖書推薦的精準率,提高圖書推薦的質量。但在緩解數(shù)據(jù)稀疏性方面沒有提高,在后續(xù)算法中要加以改良,以不斷提高圖書推薦質量。

      參考文獻:

      [1]趙偉,林楠,韓英,等.一種改進的K-means聚類的協(xié)同過濾算法[J]. 安徽大學學報(自然科學版),2016(02):32-36.

      [2]付文靜.基于評論和內容深度融合的跨域推薦問題研究[D].濟南:山東大學,2019.

      [3]王輝,姜丹,徐海鷗.基于用戶評分和項目屬性的稀疏矩陣預測研究[J].電腦知識與技術,2019(02):273-275.

      [4]楊武,唐瑞,盧玲.基于內容的推薦與協(xié)同過濾融合的新聞推薦方法[J].計算機應用,2016,36(02):414-418.

      [5]袁煦聰.基于長尾理論的物品協(xié)同過濾推薦算法研究[D].淮南:安徽理工大學,2019.

      [6]孫艷.基于協(xié)同過濾的圖書推薦算法研究[D].鎮(zhèn)江:江蘇大學,2015.

      [7]趙向宇.TopN協(xié)同過濾推薦技術研究[D].北京:北京理工大學,2014.

      [8]劉恒友.基于時間效應的推薦算法研究[D].哈爾濱:哈爾濱工業(yè)大學,2013.

      [9]李默,梁永全.基于標簽和關聯(lián)規(guī)則挖掘的圖書組合推薦系統(tǒng)模型研究[J].計算機應用研究,2014(08):156-159.

      猜你喜歡
      物品圖書協(xié)同
      稱物品
      “雙十一”,你搶到了想要的物品嗎?
      蜀道難:車與路的協(xié)同進化
      科學大眾(2020年23期)2021-01-18 03:09:08
      圖書推薦
      南風(2020年22期)2020-09-15 07:47:08
      誰動了凡·高的物品
      歡迎來到圖書借閱角
      “四化”協(xié)同才有出路
      汽車觀察(2019年2期)2019-03-15 06:00:50
      班里有個圖書角
      三醫(yī)聯(lián)動 協(xié)同創(chuàng)新
      找物品
      靖江市| 林州市| 丰台区| 泗洪县| 岚皋县| 裕民县| 永福县| 清水县| 余江县| 江口县| 疏附县| 娄烦县| 新晃| 五常市| 沙洋县| 白城市| 东莞市| 格尔木市| 克拉玛依市| 乐昌市| 穆棱市| 广水市| 铜川市| 岑巩县| 新津县| 荥阳市| 日喀则市| 武功县| 平舆县| 金沙县| 博罗县| 通江县| 含山县| 安义县| 三都| 那坡县| 临湘市| 平远县| 韶关市| 若尔盖县| 崇州市|