• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于用戶的協(xié)同過濾推薦算法的研究及Python 實現(xiàn)

      2020-04-02 06:28:22
      魅力中國 2020年52期

      (佛山科學技術學院數(shù)學與大數(shù)據(jù)院系,廣東 佛山 528000)

      在5G 時代下,各種設備,各行各業(yè)都將不可避免地與互聯(lián)網(wǎng)相連,這帶來了生活的極大便利,但同時也將帶來比現(xiàn)階段更加海量的數(shù)據(jù),于是如何更加有效地處理數(shù)據(jù)便顯得更加重要。在這樣的背景之下,各種各樣的推薦技術便越發(fā)被人們所重視,如電子商務領域,推薦算法便是其不可或缺的一部分。

      通過對推薦系統(tǒng)相關論文的大量研讀,發(fā)現(xiàn)現(xiàn)在已有眾多基于不同原理的推薦算法,其中,協(xié)同過濾算法最具代表性,其大致可分為基于用戶、基于物品與基于模型三類。但隨著如今應用系統(tǒng)結構的復雜化,用戶的擴增,數(shù)據(jù)的海量增加,協(xié)同過濾算法越來越面臨著挑戰(zhàn)。

      在上述背景下,本文展開對基于用戶的協(xié)同過濾算法的研究并利用Python 對算法進行代碼的簡單實現(xiàn)。

      一、協(xié)同過濾推薦算法

      協(xié)同過濾算法一般通過輸入m 個用戶列表,n 個物品列表,每個用戶已評價的物品評分等數(shù)據(jù),構建用戶-物品評分矩陣,并提取矩陣數(shù)據(jù)通過以下三步計算進行推薦:

      1.相似度(similarity)計算,得出相似用戶(或物品)列表;

      2.吸引力(prediction)計算,得出目標用戶對未購買物品的預測評分;

      3.推薦(recommendation)計算,得出對目標用戶吸引力最大的前k 個物品,并向其推薦。

      其基本工作原理如圖一。

      二、用戶相似度計算

      用戶間的相似度計算是基于用戶的協(xié)同過濾推薦算法的關鍵步驟之一,其采用的計算方法影響算法的推薦精度。

      Similarity 計算: 提取矩陣中user1,user2,user3,user4 四個用戶對所有物品的評分,構建四條評分向量,向量間的相似度就是用戶間的相似度。(計算向量間相似度時,兩個用戶之間評分物品必須相同)

      計算用戶相似度的公式如下:

      其中,Wuv 表示用戶u 與v 的相似度,i 表示用戶u 與用戶v 都高評分的物品集合,N(i)表示對i有高評分的用戶數(shù),N(u)、N(v)分別表示用戶u與用戶v高評分的物品集合。

      三、吸引力預測

      預測用戶未購買物品對其的吸引力,這也是算法的關鍵步驟之一。

      Prediction 計算:對用戶u,在用戶相似度中找到與其相似度最高的k 個用戶,遍歷他們高評分的物品,并計算出用戶u 對每個物品的感興趣程度。

      計算用戶u 對物品i 的興趣程度的公式如下:其中S(u,k),表示與用戶相似度最高的K 個用戶。

      四、評測指標

      將用戶評分數(shù)據(jù)均勻分布,隨機劃分成M 份,挑選一份作為測試集,將剩下M-1份作為訓練集,為防止評測指標過擬合,共進行次M 實驗,每次使用不同的測試集,最后將M 次實驗的評測指標的平均值作為最終評測指標。

      1.召回率:反映包含在最終推薦列表中用戶-物品記錄的比例。其計算公式如下。

      其中,R(u)表示向用戶u 推薦n 個物品,T(u)表示用戶u 在測試集上感興趣的物品集合。

      2.準確率:反映最終推薦列表中發(fā)生過的用戶-物品評分記錄的比例。其計算公式如下。

      3.覆蓋率:反映算法發(fā)掘推薦物品的能力。其計算公式如下。

      其中,分子部分表示實驗中所有能被推薦給用戶的物品數(shù)目(集合去重),分母表示數(shù)據(jù)集中所有物品的數(shù)目。

      五、算法代碼

      在以上關于基于用戶的協(xié)同過濾推薦算法原理研究下,我們通過Python 將算法進行實現(xiàn),并代入數(shù)據(jù)進行測試,進一步證明本文算法原理的正確性,圖二,圖三為部分代碼展示:

      算法運行結果如圖四:

      六、結語

      本文介紹了基于用戶的協(xié)同過濾推薦算法的原理,并給出了相應的用戶相似度計算公式與吸引力預測公式,同時介紹了各評測指標及計算公式,最后用Python 將算法進行了代碼實現(xiàn)并代數(shù)據(jù)進行了測試。通過這些推薦算法,可以有效分析大數(shù)據(jù)時代下的海量數(shù)據(jù),并將其應用至電子商務、社交媒體、視頻網(wǎng)站、信息管理等各個領域。

      个旧市| 南陵县| 普安县| 乾安县| 宣武区| 友谊县| 资兴市| 铅山县| 临湘市| 梁平县| 绵阳市| 龙里县| 宜君县| 玉门市| 原阳县| 休宁县| 临海市| 灵宝市| 东台市| 五河县| 华池县| 博爱县| 潍坊市| 尚志市| 漳州市| 石台县| 锡林浩特市| 唐海县| 安顺市| 电白县| 肥西县| 安化县| 历史| 封开县| 临安市| 隆德县| 饶平县| 沧州市| 宁津县| 吴忠市| 轮台县|