• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種混合式協(xié)作過濾服務(wù)推薦算法

      2011-09-25 05:55:46
      通信技術(shù) 2011年7期
      關(guān)鍵詞:相似性雙向協(xié)作

      張 圣

      (南京工業(yè)大學(xué) 電子與信息科學(xué)學(xué)院,江蘇 南京 210009)

      0 引言

      隨著電子商務(wù)的飛速發(fā)展,用戶得到的服務(wù)類型也在不斷豐富,既有傳統(tǒng)的實物交易,也有音樂、電影等各種類型的服務(wù)[1]。在此過程中,用戶找到自己所需的個性化服務(wù)對象難度增大,服務(wù)提供商還要考慮以怎樣的方式提供服務(wù)供用戶選擇,服務(wù)推薦作為解決這一問題的有效手段應(yīng)運而生[2]。

      協(xié)作過濾推薦是當(dāng)前被廣泛被采用服務(wù)推薦算法,然而基于這種協(xié)作過濾的服務(wù)推薦技術(shù)存在無法雙向推薦的局限性[3]。

      現(xiàn)提出了一種新的基于混合式協(xié)作過濾的雙向服務(wù)推薦算法,同時考慮用戶之間和服務(wù)之間的相似度,為用戶和服務(wù)提供商產(chǎn)生雙向推薦。實驗結(jié)果表明該算法可以有效地解決傳統(tǒng)協(xié)作過濾算法無法產(chǎn)生雙向推薦的不足,顯著提高推薦系統(tǒng)的推薦量。

      1 傳統(tǒng)協(xié)作過濾推薦算法

      傳統(tǒng)協(xié)作過濾算法基于一種假設(shè):如果用戶對某些服務(wù)的評分結(jié)果相似,那么其它服務(wù)的評分結(jié)果也較為相似。通過統(tǒng)計若干目標(biāo)用戶的最近鄰居,利用最近鄰居的評分來預(yù)測目標(biāo)用戶的評分,從而產(chǎn)生推薦[4]。

      用戶的評分?jǐn)?shù)據(jù)可以由一個集合m×n階矩陣R來表達(dá),m行代表m個用戶,n列代表n個項目,第i行第j列的元素Rij代表用戶i對項目j的評分,如表1的矩陣所示。

      然后通過傳統(tǒng)的相似性度量方法如余弦相似性[5]來計算用戶i和其它所有用戶之間的相似度,通過對這些相似度進(jìn)行排序,找出與用戶i最相似的k個最近鄰集合,最后通過設(shè)定的預(yù)測評分公式對k個最近鄰集合中項目的評分進(jìn)行計算,得到預(yù)測的用戶i的評分?jǐn)?shù)據(jù)。

      傳統(tǒng)協(xié)作過濾算法隨著用戶及服務(wù)的增大性能降低快,有人提出了結(jié)合用戶間相似性和項目間相似性進(jìn)行混合式協(xié)作過濾[6],這里進(jìn)一步優(yōu)化了混合式協(xié)作過濾算法,通過計算用戶、項目和全局平均評分偏差的加權(quán)來同時得到用戶、項目的預(yù)測評分,從而產(chǎn)生更高質(zhì)量的推薦。

      表1 用戶項目評分矩陣

      2 混合式協(xié)作過濾推薦算法

      混合式協(xié)作過濾推薦算法的輸入是用戶-項目評分矩陣,用戶集合U和項目集合I構(gòu)成一個m×n階矩陣R(m,n),其第a行第j列元素表示用戶a對項目j的評分向量,描述了用戶a對項目j的評分,如果用戶a未對項目j評分,則將其評分向量設(shè)為0。

      任取用戶 a∈U,將 a在評分矩陣 R(m,n)中對應(yīng)的第 a行元素的集合記為La,將集合La中不為0元素的項目集合記為Ia即用戶a已經(jīng)評分的項目集合。同樣,項目j(j∈I)在評分矩陣R(m,n)中對應(yīng)的第j列元素記為Cj,將集合Cj中不為0元素的用戶集合記為Uj即項目j評分的用戶集合。

      2.1 相似性度量方法

      相似性度量方法采用皮爾遜相關(guān)系數(shù)計算用戶之間和項目之間的相似度,用戶u和用戶a的相似度如式(1)所示:

      其中Iua表示用戶u和用戶a共同評分項目的集合,即Iua=Iu∩Ia,Lu和La分別表示Lu和La的平均值向量。由(1),sim(u,a)的范圍在區(qū)間[-1,1]之間,當(dāng)sim(u,a)∈[-1,0]時,用戶u和用戶a不相似;當(dāng)sim(u,a)∈(0,1]時,sim(u,a)越接近于1用戶u和用戶a的相似度越高。同理,項目i和項目j的相似度采用同一公式,不再贅述。

      為了解決用戶u和a共同評分的項目集合Iua較小時,u和 a的相似度應(yīng)當(dāng)較小但是公式(1)計算出的相似度可能很大的問題,在式(1)的計算結(jié)果sim(u,a)上添加權(quán)重,式(2)給出調(diào)整后的用戶u 和用戶a的相似度:

      其中|Iu∩Ia|和|Iu∪Ia|分別表示用戶 u評分項目和用戶 a評分項目的交集和并集中元素的個數(shù)。當(dāng)評分交集Iua較小時,|Iu∩Ia|較小,用戶u和用戶a的相似度sim'(u,a)就較小。項目i和項目j的相似度同理。

      2.2 預(yù)測值計算方法

      由公式(2)可以計算出用戶u和其他用戶的相似度,將其從大到小排序,前k個用戶就是u的k-最近鄰集合[7]T(u)。在T(u)中將相似度不大于0時近鄰用戶去掉,得到集合N(u),如式(3)所示:

      同理計算項目i的k-最近鄰集合N(i)

      混合式協(xié)作過濾推薦算法通過預(yù)測在線用戶u對未評分項目i的評分,將預(yù)測評分高的項目推薦給該用戶,將用戶u對項目i的預(yù)測評分向量記為P(u,i)。這里提出一種新的預(yù)測評分向量計算方法,通過全局平均評分向量μ、用戶u對μ的偏差、項目i對μ的偏差三者的加權(quán)和來得出P(u,i)。

      全局平均評分向量μ是評分矩陣R(m,n)所有元素的平均值向量,如式(4)所示:

      用戶u對μ的偏差記為D(u),根據(jù)用戶u的k-最近鄰集合,如式(5)所示:

      項目i對μ的偏差D(i)計算同D(u)。

      為了調(diào)整基于用戶的預(yù)測和基于項目的預(yù)測的依賴度[8]引入?yún)?shù)λ(0≤λ≤1)調(diào)整權(quán)重,P(u,i)如式(6)所示:

      P(u,i) 描述了用戶項目u對i諸方面屬性的預(yù)測評分,面向用戶和服務(wù)提供商進(jìn)行雙向推薦即為在線用戶u推薦最有可能感興趣的N個服務(wù),同時為服務(wù)提供商i推薦最有可能對其感興趣的M個在線用戶。

      3 實驗結(jié)果及分析

      3.1 實驗數(shù)據(jù)集

      采用MovieLens(接收用戶對電影的評分并提供相應(yīng)的電影推薦列表)站點提供的數(shù)據(jù)集(http://movielens.umn.edu/)。在該數(shù)據(jù)庫中選擇8 000條評分?jǐn)?shù)據(jù)作為實驗數(shù)據(jù)集,包含200個用戶和800部電影,每個用戶至少對20部電影進(jìn)行了評分。

      3.2 實驗度量標(biāo)準(zhǔn)

      采用平均絕對偏差(MAE,Mean Absolute Error)作為統(tǒng)計精度度量方法:設(shè)預(yù)測的用戶評分的集合為{b1,b2,…,bN},對應(yīng)的實際用戶評分集合為{p1,p2,…,pN},則平均絕對誤差MAE的定義如式(7)所示:

      MAE通過計算用戶的預(yù)測評分?jǐn)?shù)據(jù)和用戶的實際評分?jǐn)?shù)據(jù)之間的偏差來度量預(yù)測的準(zhǔn)確程度。MAE越小,推薦的質(zhì)量越高。

      3.3 K最近鄰不同條件下的實驗及分析

      如圖1所示,在K最近鄰實驗實驗條件下,混合式協(xié)作過濾的雙向服務(wù)推薦算法均具有最小的 MAE.由于綜合考慮了用戶和項目之間的相似性,同時考慮了多種評分偏差,因此與傳統(tǒng)的協(xié)作過濾推薦算法相比,顯著地提高推薦系統(tǒng)的推薦質(zhì)量。

      圖1 兩種算法對比

      4 結(jié)語

      這里在分析傳統(tǒng)協(xié)作過濾推薦算法的不足之后,提出了一種基于混合式協(xié)作過濾的雙向服務(wù)推薦算法,這種算法由于同時考慮了用戶間相似性和項目間相似性,能夠同時為用戶和服務(wù)提供商進(jìn)行雙向的推薦,同時綜合考慮了用戶、項目、全局之間的評分偏差。實驗結(jié)果表明,該算法不但能進(jìn)行雙向推薦,而且有效的提高了推薦質(zhì)量。

      [1] 趙攀,雷文,周剛. 基于電子商務(wù)背景的智能挖掘技術(shù)及其應(yīng)用研究[J]. 通信技術(shù), 2009,42(08):76-78.

      [2] 韓家煒. 數(shù)據(jù)挖掘:概念與技術(shù)[M]. 北京:機械工業(yè)出版社,2004:137-147.

      [3] 李嵐. 數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J]. 通信技術(shù), 2007,40(08): 74-76.

      [4] 歐立奇. 協(xié)同過濾在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D]. 西安:西北大學(xué),2005.

      [5] MA H, KING I, LYU M R. Effective Missing Data Prediction for Collaborative Filtering[M]. USA:ACM, 2007:39-46.

      [6] Sung Ho Ha. Helping Online Customers Decide through Web Personalization[J]. IEEE Intelligent Systems, 2002(10-11):34-43.

      [7] 趙亮, 胡乃靜. 個性化推薦算法設(shè)計[J]. 計算機研究與發(fā)展,2002,39(08):986-991.

      [8] 肖冬榮, 楊磊. 基于遺傳算法的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘[J]. 通信技術(shù),2010, 43(01): 205-207.

      猜你喜歡
      相似性雙向協(xié)作
      雙向度的成長與自我實現(xiàn)
      出版人(2022年11期)2022-11-15 04:30:18
      一類上三角算子矩陣的相似性與酉相似性
      淺析當(dāng)代中西方繪畫的相似性
      河北畫報(2020年8期)2020-10-27 02:54:20
      團結(jié)協(xié)作成功易
      協(xié)作
      讀者(2017年14期)2017-06-27 12:27:06
      低滲透黏土中氯離子彌散作用離心模擬相似性
      一種軟開關(guān)的交錯并聯(lián)Buck/Boost雙向DC/DC變換器
      協(xié)作
      讀寫算(下)(2016年9期)2016-02-27 08:46:31
      一種工作頻率可變的雙向DC-DC變換器
      可與您并肩協(xié)作的UR3
      民县| 常宁市| 红安县| 濉溪县| 昌平区| 亚东县| 休宁县| 科技| 德江县| 合肥市| 墨玉县| 四会市| 白银市| 临安市| 宝兴县| 呼和浩特市| 科尔| 梁山县| 东乌珠穆沁旗| 曲松县| 高台县| 苍南县| 富川| 额尔古纳市| 朝阳县| 鄂托克前旗| 溧水县| 贵定县| 卢湾区| 甘孜县| 忻州市| 禹州市| 嘉善县| 台安县| 江陵县| 滦平县| 桂平市| 闸北区| 廉江市| 达尔| 旬邑县|