• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于協(xié)同過濾個性化推薦算法的綜述

      2015-05-30 04:00:10韓瑞
      2015年51期
      關(guān)鍵詞:協(xié)同過濾

      韓瑞

      摘 要:互聯(lián)網(wǎng)的發(fā)展是呈爆炸式的,無論是用戶數(shù)量還是信息數(shù)量。現(xiàn)在的時代是大數(shù)據(jù)時代,這個時代的問題已經(jīng)不是苦于沒有數(shù)據(jù),沒有信息的時代。而是在這么多的數(shù)據(jù)中找到有用的數(shù)據(jù),挖掘潛在的信息的時代。個性化推薦,本質(zhì)上來說,是為了解決信息的超載問題。當(dāng)一個用戶搜索一個產(chǎn)品或者一條信息,如何在茫茫信息海中提供給用戶的商品恰是用戶感興趣的,可以幫助用戶減少不必要的時間去篩選用戶不感興趣的東西。本文主要介紹在眾多推薦算法中最常見的協(xié)同過濾的研究現(xiàn)狀,推薦算法,優(yōu)缺點等問題。通過簡單的例子讓大家明白協(xié)同過濾的主要思想。

      關(guān)鍵詞:協(xié)同過濾;基于用戶;基于物品;相似程度

      一、協(xié)同過濾推薦的研究現(xiàn)狀

      首先了解一下推薦系統(tǒng),比較普遍認(rèn)可的定義是Resnick和Varian在1997年[1]提出的:“它是利用電子商務(wù)網(wǎng)站向客戶提供商品信息和建議,幫助用戶決定購買什么產(chǎn)品,模擬銷售人員幫助客戶完成購買過程?!倍鴧f(xié)同過濾是推薦系統(tǒng)中最常見也是最廣泛應(yīng)用的推薦方法。Grundy書籍推薦系統(tǒng)[2]是公認(rèn)的第一個對協(xié)同過濾應(yīng)用的系統(tǒng)。還有Tapes-try郵件處理系統(tǒng)[3],Ringo[4]等。Sarwar等[5]提出的利用夾角余弦來計算產(chǎn)品的相似程度。Chen和Cheng[5]通過觀察不同產(chǎn)品在用戶的列表次序來計算用戶與用戶的相似程度.而Yang和Gu[7]利用建立用戶的興趣點來計算用戶與用戶間的相似程度。

      二、協(xié)同過濾推薦的主要思想

      協(xié)同過濾推薦的思路可以說是來源于生活。通過在生活中購買產(chǎn)品你會發(fā)現(xiàn)一些有趣的現(xiàn)象。比如說,人們總是更傾向于相信來自熟人的推薦,在你的朋友圈內(nèi),很多朋友都在使用同一種產(chǎn)品,那么你就也會很大程度有意的選擇此產(chǎn)品。另外就是,在你對某種產(chǎn)品感興趣時,當(dāng)你發(fā)現(xiàn)有和你感興趣的這種產(chǎn)品類似的產(chǎn)品,與此同時,其他購買者對這種產(chǎn)品的體驗良好,那么你也很可能會購買這種商品。協(xié)同過濾的主要思想可以分成兩個部分:一是通過分析用戶以往的購買或者選擇信息,來計算用戶之間的相似程度,通過相似程度高的用戶可以說是近鄰對一個產(chǎn)品或信息的偏好來預(yù)測目標(biāo)用戶的對此產(chǎn)品或信息的偏好程度。二是通過分析對用戶以往對某類產(chǎn)品的評價情況來預(yù)測該用戶對此類中新產(chǎn)品的偏好程度,及計算以往評價過的產(chǎn)品與要推薦產(chǎn)品間的相似度。

      協(xié)同過濾推薦主要有兩種,一個是基于User的,另一個是基于iterm的。

      1、基于用戶的方法主要是尋找與目標(biāo)用戶相似的用戶,認(rèn)為有相似偏好的用戶可能對某個產(chǎn)品或信息有相似的評價。通過利用相似近鄰的偏好程度來進(jìn)行對目標(biāo)用戶的評價的預(yù)測。比如說有三部電影《饑餓游戲》《千與千尋》《分手大師》。A下載了《饑餓游戲》,播完了《千與千尋》,沒播完《分手大師》。B多次觀看《饑餓游戲》,播完《千與千尋》,沒看《分手大師》。C下載了《分手大師》,沒看《饑餓游戲》,沒播完《千與千尋》。那么可以看出來A與B很相似,那么再出現(xiàn)一個電影《變形金剛》,A是多次觀看,那么應(yīng)該把變形金剛推薦給B而不是C。關(guān)于這個用戶之間相似程度的計算,可以通過對電影的評分機制進(jìn)行量化,然后利用夾角余弦來計算用戶之間的相似程度。設(shè)用戶i和用戶j在n維對象的空間上的評分向量為i,j,那么計算cos(i,j)的公式為:

      cos(i,j)=i·j|i|*|j|

      若兩個用戶的夾角余弦值相近,則可認(rèn)為他們是相似用戶。

      關(guān)于相似程度的計算還可以通過皮爾森相關(guān)系數(shù)和修正余弦函數(shù)相似性等很多方法。

      2、基于物品的方法主要首先是計算物品與物品之間的相似程度,然后結(jié)合用戶以前的購買評價過的物品或選擇行為,最后對用戶進(jìn)行某種新物品的推薦。比如說A喜歡看《分歧者》,《復(fù)仇者聯(lián)盟》,《超體》。然后有兩部電影《何以笙簫默》和《敢死隊》。可以很明顯的看出可以向A推薦《敢死隊》?;谖锲返南到y(tǒng)過濾在計算物品的相似度時,也是可以通過評分量化,很多時候也是可以加入tag技術(shù),對物品打標(biāo)簽,做標(biāo)簽矩陣。比如A喜歡的電影中《分歧者》是有動作,愛情,科幻三個標(biāo)簽,每個標(biāo)簽的權(quán)重不一樣可以按0到1之間的分值設(shè)定。然后同理其他電影,最后通過量化計算相似度發(fā)現(xiàn)《敢死隊》更符合推薦。關(guān)于tag矩陣也可以是0-1矩陣。關(guān)于計算相似程度與(1)中提到過的方法類似。

      三、協(xié)同過濾推薦的優(yōu)缺點

      協(xié)同過濾的優(yōu)點有:

      1、可以進(jìn)行過濾復(fù)雜性的,機器難以進(jìn)行提取有效自由文本的信息,如音樂,圖像等藝術(shù)類信息。

      2、相對容易給用戶制造驚喜。與基于內(nèi)容的推薦不同,推薦給用戶的物品內(nèi)容可能是用戶不太熟悉的內(nèi)容,很可能發(fā)現(xiàn)用戶潛在的喜好但用戶本身卻沒有意識到的。

      3、用戶的不斷增加,協(xié)同過濾推薦系統(tǒng)的性能也會增高。

      協(xié)同過濾的缺點:

      協(xié)同過濾推薦算法的典型缺點就是稀疏性問題和冷啟動問題。冷啟動問題就是,當(dāng)有新用戶進(jìn)入時,由于沒有歷史行為數(shù)據(jù)而無法對其偏好進(jìn)行判斷,因此對其進(jìn)行推薦。同樣當(dāng)有新物品進(jìn)入系統(tǒng)時,由于沒有用戶對其評價過,它就得不到推薦。

      四、總結(jié)

      個性化推薦服務(wù)實質(zhì)就是有效率有針對性的解決大量數(shù)據(jù)的問題,推薦算法在一定程度上實現(xiàn)了這個問題,可是現(xiàn)實生活中,并不是一個算法,而是好幾種類型的推薦算法混合運算,最后得出的推薦結(jié)果才能比較令人滿意,也會比單一算法精確很多。關(guān)于推薦系統(tǒng)性能的評價指標(biāo)最典型是精確度和推薦效率這兩個指標(biāo)。其中衡量精確度可以是平均平方誤差,平均絕對誤差和標(biāo)準(zhǔn)平局誤差等。個性化推薦沒必要非得追求完全精確,因為本身推薦的內(nèi)容就無法保證用戶百分之百的感興趣,但是還是要努力不斷追求精確度,這樣才能發(fā)揮其自身解決超載問題,給用戶提供感興趣物品或信息的價值。網(wǎng)易云音樂作為音樂行業(yè)的后起之秀,在個性化推薦方面做的相當(dāng)不錯,很多用戶反應(yīng)網(wǎng)易云音樂的個性化推薦總是給人驚喜,雖然網(wǎng)易沒有在這方面給出過多的介紹,但是不難看出,他們公司非常注重這個方面的功能板塊。因此對這個時代而言,不僅僅是對電子商務(wù)方面,個性化推薦的價值以及意義都是非常重要的。(作者單位:河北大學(xué))

      參考文獻(xiàn):

      [1] Resinick P,Varian H R.Recommender systems[J].Communications of the ACM,1997,40(3):56-58.

      [2] Rich E.User modeling via stereotypes.Cognitive Science,1979,3(4):329—354.

      [3] Goldberg D,Nichols D,Oki BM,et al.Using collaborative filtering to weave an information tapestry.Comm ACM,1992,35(12):61—70.

      [4] Shardanand U,Maes P.Social information filtering:Algorithms for automating`Word of Mouth'.Proc Conf Human Factors in Computing Systems Denver,1995:210—217.

      [5] Sarwar B,Karypis G,Konstan J,et al.Item-based collaborative filtering recommendation algorithms.Proc 10th Int' l WWW Conf,Hong Kong,2001:1—5.

      [6] Chen YL,Cheng LC.A novel collaborative filtering approach for recommending ranked items.Expert Systems with Applications,2008,34(4):2396—2405.

      [7] Yang MH,Gu ZM.Personalized recommendation based on partial similarity of interests.Advanced Data Mining and Applications Proceedings,2006,4093:509—516.

      猜你喜歡
      協(xié)同過濾
      基于用戶評分和項目類偏好的協(xié)同過濾推薦算法
      基于用戶相似度加權(quán)的Slope One算法
      軟件(2016年4期)2017-01-20 09:44:28
      圖書推薦算法綜述
      改進(jìn)的協(xié)同過濾推薦算法
      基于鏈?zhǔn)酱鎯Y(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實現(xiàn)
      基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
      基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
      混合推薦算法在電影推薦中的研究與評述
      關(guān)于協(xié)同過濾推薦算法的研究文獻(xiàn)綜述
      商(2016年29期)2016-10-29 15:22:08
      基于混合信任模型的協(xié)同過濾推薦算法
      泾阳县| 湘乡市| 遂昌县| 惠来县| 房产| 通渭县| 塔河县| 同仁县| 峡江县| 定边县| 江阴市| 浦北县| 体育| 海盐县| 尼勒克县| 巴彦淖尔市| 蒙山县| 夏河县| 隆安县| 荣昌县| 太白县| 玉田县| 黄石市| 丁青县| 西乌| 高雄市| 英吉沙县| 元朗区| 斗六市| 东乡族自治县| 峡江县| 高陵县| 三穗县| 仁怀市| 灵川县| 平顶山市| 于都县| 阿巴嘎旗| 秀山| 长宁县| 鸡东县|