• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      融合上下文信息的社會(huì)網(wǎng)絡(luò)推薦系統(tǒng)

      2016-01-18 00:29:45李慧,馬小平,胡云
      智能系統(tǒng)學(xué)報(bào) 2015年2期
      關(guān)鍵詞:協(xié)同過(guò)濾社會(huì)網(wǎng)絡(luò)信息

      網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20150302.1106.007.html

      融合上下文信息的社會(huì)網(wǎng)絡(luò)推薦系統(tǒng)

      李慧1,2,馬小平1,胡云2,施珺2

      (1.中國(guó)礦業(yè)大學(xué) 信電學(xué)院,江蘇 徐州 221008; 2. 淮海工學(xué)院 計(jì)算機(jī)工程學(xué)院,江蘇 連云港 222005)

      摘要:上下文環(huán)境和社會(huì)網(wǎng)絡(luò)信息已經(jīng)成為推薦系統(tǒng)所需的重要信息來(lái)源,在推薦系統(tǒng)中融入這些信息將進(jìn)一步改進(jìn)推薦系統(tǒng)的精度和用戶滿意度。為了提高用戶對(duì)推薦系統(tǒng)的滿意度,提出一種融入上下文信息與社交網(wǎng)絡(luò)信息的個(gè)性化推薦系統(tǒng)CS。該算法應(yīng)用隨機(jī)決策樹(shù)劃分原始的用戶-商品評(píng)分矩陣來(lái)進(jìn)行上下文信息的處理,使得具有相似上下文信息的評(píng)分被分為一組。隨后應(yīng)用矩陣因式分解來(lái)預(yù)測(cè)用戶對(duì)未評(píng)分項(xiàng)的預(yù)測(cè)。為了整合社交網(wǎng)絡(luò)信息,在考慮上下文信息的環(huán)境下提出了一種融入社會(huì)網(wǎng)絡(luò)關(guān)系的增強(qiáng)推薦模型,使用一種基于信任度的皮爾遜相關(guān)系數(shù)來(lái)衡量用戶的相似度。在真實(shí)的實(shí)驗(yàn)數(shù)據(jù)集上進(jìn)行驗(yàn)證,表明CS系統(tǒng)推薦較傳統(tǒng)的基于上下文的和基于社會(huì)網(wǎng)絡(luò)的推薦算法在性能上和推薦性能上有了很大的改善。

      關(guān)鍵詞:上下文;信息;社會(huì)網(wǎng)絡(luò);矩陣因式分解:推薦;協(xié)同過(guò)濾

      DOI:10.3969/j.issn.1673-4785.201406017

      中圖分類號(hào):TP391文獻(xiàn)標(biāo)志碼:A

      收稿日期:2014-06-11. 網(wǎng)絡(luò)出版日期:2015-03-02.

      基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(61403156,61403155);江蘇省高校自然科學(xué)基金資助項(xiàng)目(13KJB520002,14KJB520005).

      作者簡(jiǎn)介:

      中文引用格式:李慧,馬小平,胡云,等. 融合上下文信息的社會(huì)網(wǎng)絡(luò)推薦系統(tǒng)[J]. 智能系統(tǒng)學(xué)報(bào), 2015, 10(2): 293-300.

      英文引用格式:LI Hui, MA Xiaoping, HU Yun, et al. Social network recommendaton system mixing contex information[J]. CAAI Transactions on Intelligent Systems, 2015, 10(2): 293-300.

      Social network recommendaton system mixing contex information

      LI Hui1,2, MA Xiaoping1, HU Yun2, SHI Jun2

      (1. School of Information & Electrical Engineering, China University of Mining & Technology, Xuzhou 221008, China; 2. Department of Computer Science, Huaihai Institute of Technology, Lianyungang 222005, China)

      Abstract:Contexts and social network information is valuable information for building an accurate recommender system. The merging of such information could further improve accuracy of the system and user satisfaction. This paper proposes the context and social (CS) network, which is novel context-aware recommender system incorporating elaborately processed social network information, in order to increase the user satisfaction on the recommendation system. The contextual information happens by applying random decision trees to partition the original user-item-rating matrix such that the ratings with similar contexts are together. The matrix factorization functionality is to predict missing preference of a user for an item using the partitioned matrix. An enhanced recommendation model aided by social relationships considering the context information is proposed. A trust-based Pearson Correlation Coefficient is proposed to measure user similarity. Real datasets based experiments showed that CS enhances its performance compared with traditional recommendation algorithms based on context and social networks.

      Keywords:context; information; social network; matrix factorization; recommendation; collaborative filtering

      通信作者:李慧. E-mail:shufanzs@126.com.

      社交網(wǎng)絡(luò)服務(wù)是 Web 2.0 應(yīng)用中的重要一類。這種系統(tǒng)幫助用戶在互聯(lián)網(wǎng)上與現(xiàn)實(shí)中的好友保持聯(lián)絡(luò)、分享內(nèi)容等。然而隨著社交網(wǎng)絡(luò)的使用人數(shù)增加,用戶分享的數(shù)據(jù)也不斷上升,信息過(guò)載的問(wèn)題也隨之出現(xiàn)。另外,社交網(wǎng)絡(luò)第1次提供了豐富的真實(shí)世界中人們的社交信息,利用這些信息的研究在各個(gè)學(xué)科中也不斷出現(xiàn)。對(duì)于推薦系統(tǒng)來(lái)說(shuō),如何利用社交網(wǎng)絡(luò)所提供的這些信息,進(jìn)行更精確地推薦,成為一個(gè)重要研究方向[1-2]。大部分推薦系統(tǒng)都采用協(xié)同過(guò)濾技術(shù),它通過(guò)分析用戶對(duì)相似項(xiàng)目以往的評(píng)分記錄或相似用戶對(duì)項(xiàng)目的評(píng)分模式來(lái)預(yù)測(cè)用戶對(duì)某未知項(xiàng)目的評(píng)分。雖然協(xié)同過(guò)濾技術(shù)已成為解決推薦問(wèn)題的標(biāo)準(zhǔn)方法,但傳統(tǒng)的推薦系統(tǒng)只利用相關(guān)用戶或相關(guān)商品的評(píng)分?jǐn)?shù)據(jù)進(jìn)行推薦,而并未考慮任何其他的信息。但當(dāng)分析的信息量不斷增大時(shí),傳統(tǒng)的推薦算法就會(huì)遇到諸多挑戰(zhàn),如數(shù)據(jù)稀疏問(wèn)題、低質(zhì)量的推薦以及信息源的不均衡性。

      推薦系統(tǒng)通過(guò)識(shí)別和預(yù)測(cè)用戶偏好,提供個(gè)性化服務(wù),是緩解“信息過(guò)載”問(wèn)題的重要手段之一。上下文感知計(jì)算是指系統(tǒng)能發(fā)現(xiàn)并有效利用上下文信息進(jìn)行計(jì)算的一種計(jì)算模式,已經(jīng)廣泛應(yīng)用于許多領(lǐng)域[3-4]。上下文感知推薦系統(tǒng)通過(guò)將上下文信息引入推薦系統(tǒng),成為一個(gè)剛剛興起的領(lǐng)域,還有許多問(wèn)題等待解決,如上下文用戶偏好提取、高維數(shù)據(jù)稀疏性問(wèn)題等[5]。

      本文提出了一個(gè)新穎的融入上下文信息與社會(huì)網(wǎng)絡(luò)信息的推薦系統(tǒng)——CS推薦算法,該系統(tǒng)首先抽取出與用戶興趣相關(guān)的上下文信息,然后應(yīng)用隨機(jī)決策樹(shù)算法分解用戶—項(xiàng)目評(píng)分矩陣,最終生成的用戶—項(xiàng)目評(píng)分子矩陣(即決策樹(shù)的葉子節(jié)點(diǎn))包含了相似的評(píng)分。在產(chǎn)生的子矩陣中應(yīng)用了矩陣因式分解技術(shù)進(jìn)行用戶對(duì)某一缺失項(xiàng)的評(píng)分預(yù)測(cè)。基于矩陣因式分解模型,本文還引進(jìn)社會(huì)規(guī)范術(shù)語(yǔ)來(lái)改善推薦系統(tǒng)質(zhì)量。為了衡量用戶之間的相似程序,本文使用了上下文相關(guān)的皮爾遜相關(guān)系數(shù)來(lái)計(jì)算用戶相似度。最后通過(guò)在2個(gè)真實(shí)的數(shù)據(jù)集上驗(yàn)證CS推薦系統(tǒng)的有效性。

      1相關(guān)工作

      目前,社會(huì)化推薦算法大都集中在如何利用用戶間的社會(huì)關(guān)系來(lái)提高推薦的準(zhǔn)確率。Yang等在文獻(xiàn)[6]中認(rèn)為用戶間的信任關(guān)系強(qiáng)度并不是唯一的,而是受到其所處的朋友圈的影響,在不同的朋友圈中,用戶間的信任關(guān)系也是不同的。他們通過(guò)給用戶的朋友賦予不同的權(quán)重來(lái)對(duì)用戶間的信任關(guān)系進(jìn)行建模,并提出了一種基于朋友圈的社會(huì)化推薦算法。Noel等[7]針對(duì)社會(huì)化推薦算法在計(jì)算用戶相似性時(shí)沒(méi)有考慮到用戶本身的特征、不能直接對(duì)用戶間信息傳播建模,不能反映用戶間只有部分興趣相同的問(wèn)題,給出了一種將多種目標(biāo)函數(shù)融合在一起的方法,并在矩陣分解的框架下進(jìn)行求解。

      然而,目前大部分社會(huì)網(wǎng)絡(luò)推薦模型在度量2個(gè)用戶的相似性時(shí),基本都忽視了上下文信息。比如,即使一個(gè)用戶和其朋友的品味極其相似,她對(duì)一部電影的評(píng)價(jià)可能還受其他因素影響(比如,她在看電影時(shí)候的情緒和陪她看電影的人)。因此近期的研究開(kāi)始關(guān)注社交網(wǎng)絡(luò)中的上下文信息。文獻(xiàn)[8]提出了將用戶和項(xiàng)目進(jìn)行群組的方法,在協(xié)同過(guò)濾算法中利用了這些子群信息(一種上下文信息)來(lái)提高用推薦系統(tǒng)的質(zhì)量。Liu等[9]利用推薦對(duì)象的屬性上下文信息來(lái)對(duì)它們之間的關(guān)聯(lián)關(guān)系進(jìn)行度量,并通過(guò)估計(jì)出的關(guān)聯(lián)關(guān)系信息來(lái)改善推薦的效果。文獻(xiàn)[10]提出了將社會(huì)網(wǎng)絡(luò)上下文信息(個(gè)人表現(xiàn)和交際影響)整合到一個(gè)矩陣分解模型中。但是,這樣的上下文信息僅僅與社交關(guān)系有關(guān),大量的非社交的上下文信息卻被忽視了。相反,本文提出的CS算法運(yùn)用機(jī)器學(xué)習(xí)技術(shù)和矩陣分解技術(shù),不僅包含了大量的上下文信息,而且對(duì)上下文信息沒(méi)有限定信息類型:上下文信息被顯式地應(yīng)用到矩陣劃分中。基于信任度的皮爾遜相關(guān)系數(shù)提高了計(jì)算用戶相似度的準(zhǔn)確性。

      2CS推薦系統(tǒng)

      2.1預(yù)備知識(shí)

      2.1.1相關(guān)概念

      傳統(tǒng)的推薦系統(tǒng)通常只考慮用戶—項(xiàng)目評(píng)分矩陣來(lái)進(jìn)行推薦。然而,在許多系統(tǒng)中,可以通過(guò)豐富的上下文信息來(lái)為推薦系統(tǒng)提供新的信息維度。本文把上下文信息分為2類:1)靜態(tài)上下文,它描述用戶的特性,例如年齡、性別、會(huì)員身份、角色等,或者是一種商品、種類、價(jià)錢、物理特性等;2)動(dòng)態(tài)上下文,是一種與等級(jí)相關(guān)的即時(shí)信息(例如當(dāng)一個(gè)用戶評(píng)價(jià)一個(gè)產(chǎn)品時(shí),他的心情和位置信息)。另一方面,在線社交網(wǎng)絡(luò)也帶來(lái)一些其他資源,通過(guò)分析這些資源一個(gè)用戶的喜好可以由與他有相同品味的朋友推斷出。因此,本文試圖系統(tǒng)地融合上下文信息和社交網(wǎng)絡(luò)信息來(lái)改善推薦性能。

      圖1 用戶—項(xiàng)目評(píng)分矩陣分割過(guò)程 Fig.1 Illustration for division

      在社會(huì)網(wǎng)絡(luò)中將用戶信息及用戶之間的關(guān)系可以抽象表示為有向帶權(quán)值的社會(huì)網(wǎng)絡(luò)圖的形式: G=(V,E,C) 。其中,V表示節(jié)點(diǎn)集合,每個(gè)節(jié)點(diǎn)代表網(wǎng)絡(luò)中的用戶個(gè)體; E 表示邊的集合,表示2個(gè)個(gè)體之間存在的關(guān)系;C={cuv}表示邊的權(quán)重值,此值越大表示信任程度越大,本文將其定義為用戶間的信任度。由于信任關(guān)系不是對(duì)稱的,所以圖中的邊是有向的,網(wǎng)絡(luò)圖為有向圖。

      2.1.2矩陣因式分解

      矩陣因式分解的目的是將一個(gè)矩陣分解成2個(gè)以上的矩陣,使得將矩陣因子相乘后可以重構(gòu)或者近似原始矩陣。在推薦問(wèn)題中,一個(gè)矩陣因式分解模型是將用戶—項(xiàng)目評(píng)分矩陣R,R∈Rm×n(m是用戶數(shù)量,n是項(xiàng)目數(shù)量)分解成一個(gè)用戶特征矩陣U,U∈Rm×l和一個(gè)項(xiàng)目特征矩陣V,V∈Rl×n。

      R≈UTV

      (1)

      為了計(jì)算R,考慮到用戶—項(xiàng)目評(píng)分矩陣的稀疏性,定義了以下的目標(biāo)函數(shù),即使預(yù)測(cè)評(píng)分與用戶實(shí)際評(píng)分的誤差最小化:

      (2)

      式中:Ii,j為一個(gè)指示變量,即如果用戶i對(duì)商品j進(jìn)行了打分,則Ii,j為1,否則為0。另外,為了避免過(guò)度擬合,在公式中加入了規(guī)范化系數(shù),即

      (3)

      式3可以通過(guò)2種方式解得:1)隨機(jī)梯度算法(SGD),通過(guò)迭代更新潛在用戶特征因子和潛在項(xiàng)目特征因子;2)交替最小二乘算法(ALS),通過(guò)修正矩陣U(或者V)以優(yōu)化V(或者U),并且輪轉(zhuǎn)迭代。

      2.2上下文感知的推薦模型

      本節(jié)首先介紹一下如何結(jié)合上下文信息來(lái)提高推薦系統(tǒng)的推薦準(zhǔn)確度,在此暫不考慮社會(huì)關(guān)系。為了有效結(jié)合不同的上下文信息,使用一種具有較高學(xué)習(xí)精度的隨機(jī)決策樹(shù)算法。該算法的目標(biāo)是對(duì)原始即用戶—項(xiàng)目評(píng)分矩陣R使用隨機(jī)劃分策略將相似用戶或相似項(xiàng)目的評(píng)分劃分到樹(shù)的同一結(jié)點(diǎn)中,即將具有相似上下文的評(píng)分劃分在一個(gè)組內(nèi)。由于是在相似的上下文中產(chǎn)生,因此在相同組里的評(píng)分將會(huì)比在原始評(píng)分矩陣中的評(píng)分具有更高的相關(guān)性,有助于提高推測(cè)缺失值的準(zhǔn)確性。

      對(duì)每個(gè)決策樹(shù)中的每一個(gè)結(jié)點(diǎn),利用式(2)對(duì)評(píng)分矩陣R進(jìn)行基本的矩陣因式分解。經(jīng)過(guò)分解之后,分別得到用戶潛在特征向量與項(xiàng)目潛在特征向量(如圖1(b))。用戶特征因子表明了用戶在一些潛在主題上的興趣分布,而項(xiàng)目特征因子代表了與這些主題相關(guān)的項(xiàng)目成員。為了劃分評(píng)分矩陣R,選擇了一個(gè)潛在特征(如圖1(b) U的第2列)和隨機(jī)選取了一個(gè)分割值(本例中假設(shè)選擇的分割值為0.4)。設(shè)定之后,則當(dāng)前的評(píng)分矩陣被劃分為2部分,如圖1(c)所示。在本例中,根據(jù)U中第2個(gè)潛在特征向量和隨機(jī)選定的分割值,評(píng)分矩陣被從第2行和第3行之間分割成了2部分。由于第1個(gè)和第2個(gè)用戶的潛在特征值比較相似,因此他們給出的評(píng)分被決策樹(shù)劃分到同一個(gè)結(jié)點(diǎn)中。

      在為每個(gè)上下文信息構(gòu)建決策樹(shù)時(shí),在樹(shù)的每一層,算法都會(huì)從上下文信息集合C中隨機(jī)選擇一個(gè)上下文信息cr來(lái)劃分評(píng)分矩陣(見(jiàn)圖2)。具體來(lái)說(shuō),評(píng)分矩陣是根據(jù)cr的值進(jìn)行劃分的。例如,如果假設(shè)上下文信息cr是一周時(shí)間,則評(píng)分矩陣可以根據(jù)每一天(即從周一到周六,工作日或者周末)來(lái)進(jìn)行有意義的劃分。另一方面,如果cr的值沒(méi)有任何語(yǔ)義信息,則首先要對(duì)每一個(gè)評(píng)分cr進(jìn)行標(biāo)準(zhǔn)化到某一特定區(qū)間(如[0,1]),然后選擇一個(gè)隨機(jī)的閾值(如∈[0, 1])來(lái)劃分評(píng)分。一旦在樹(shù)中的某一層上完成了評(píng)分劃分,則隨機(jī)選取的上下文信息cr就會(huì)從上下文信息集合中被刪除:C=C/cr,從而保證了一個(gè)上下文信息在一條路徑上只被操作一次。

      圖2 隨機(jī)決策樹(shù)劃分過(guò)程 Fig.2 Main partition flow of random decision tree

      (4)

      (5)

      最終,將所有決策樹(shù)得到的預(yù)測(cè)組合起來(lái)就可以得到對(duì)Rm的最終預(yù)測(cè)得分。

      (6)

      式中:T為決策樹(shù)的數(shù)量。通過(guò)組合不同決策樹(shù)獲得的多個(gè)預(yù)測(cè)得分,所有上下文信息被完全整合,產(chǎn)生了個(gè)性化和準(zhǔn)確的上下文感知推薦系統(tǒng)。此外通過(guò)刪除較少聯(lián)系的(考慮到上下文信息)評(píng)分,生成的子矩陣比原始的評(píng)分矩陣要小很多,這將在很大程度上減少算法的計(jì)算復(fù)雜度。影響算法復(fù)雜度的一個(gè)重要因素是決策樹(shù)的數(shù)量。在后續(xù)的實(shí)驗(yàn)部分驗(yàn)證了其實(shí)只要少部分樹(shù)就可以獲得高質(zhì)量的推薦,從而說(shuō)明了本文所提出方法的實(shí)用性。

      2.3融合社會(huì)網(wǎng)絡(luò)關(guān)系的增強(qiáng)模型

      在2.2節(jié)提出的上下文感知推薦模型的基礎(chǔ)上,本節(jié)將社交網(wǎng)絡(luò)信息加入到推薦中以改善推薦質(zhì)量。這種模型的假設(shè)前提與現(xiàn)實(shí)非常相符:在現(xiàn)實(shí)生活中,當(dāng)用戶在決定是否購(gòu)買一個(gè)產(chǎn)品時(shí)往往會(huì)參考與自己有相似品味與興趣的朋友所給出的建議。通過(guò)結(jié)合多個(gè)朋友的意見(jiàn),用戶最終會(huì)做出明智的選擇。

      盡管朋友能夠提供有用的信息來(lái)幫助推薦系統(tǒng)為用戶做出高質(zhì)量的推薦,但現(xiàn)有的研究大部分都是在利用社會(huì)網(wǎng)絡(luò)中所有的可用信息進(jìn)行推薦,沒(méi)有對(duì)這些信息進(jìn)行細(xì)致地過(guò)濾;或者并沒(méi)有深入地調(diào)查怎樣精確計(jì)算用戶之間的品味相似性。為了解決這些問(wèn)題,本文引進(jìn)一個(gè)新的社會(huì)規(guī)范化系數(shù)來(lái)對(duì)用戶和他朋友之間的品味差異進(jìn)行約束。在真實(shí)生活中,一個(gè)用戶可能會(huì)有成百上千個(gè)朋友,因此同等對(duì)待朋友(或者朋友所給出的推薦信息)是沒(méi)有意義的,因?yàn)槠渲械囊恍┡笥芽赡芘c用戶具有非常相似的品味,而與另一些朋友可能擁有完全不同的品味。為了解決這種社會(huì)網(wǎng)絡(luò)中品味差異性問(wèn)題,本文引入了社會(huì)規(guī)范化系數(shù),在推薦系統(tǒng)中考慮了用戶與其朋友之間的品味相似性:

      (7)

      式中:α是控制社會(huì)規(guī)范化范圍的常量。S(j,f)表示基于以往評(píng)分模式計(jì)算出的用戶uj與朋友uf之間的品味相似性。相似性分值較高表明uj和uf有著非常相似的品味,分值越低表明uj和uf有不同品味。

      從式(7)中可以看出,融合社交網(wǎng)絡(luò)信息的有效方法是通過(guò)研究用戶與朋友之間的相似性來(lái)精確衡量每個(gè)朋友的觀點(diǎn),這種相似性可以通過(guò)他們以往的評(píng)分模式來(lái)推測(cè),比如可以從他們共同評(píng)價(jià)過(guò)的商品的特性進(jìn)行推測(cè)?,F(xiàn)有許多相似性計(jì)算方法,其中皮爾遜相關(guān)系數(shù)已被證明比其他方法(如向量空間相似性)具有更高的精確性。因此本文也使用皮爾遜相關(guān)系數(shù)來(lái)衡量uj與其朋友uf的相似性。

      (8)

      (9)

      經(jīng)典的相似性計(jì)算方法僅僅利用了評(píng)分的值,并未考慮用戶之間的信任關(guān)系。為了進(jìn)一步改善相似性計(jì)算的精確度,本文使用一種基于信任度的皮爾遜相關(guān)系數(shù)來(lái)計(jì)算用戶之間的相似度:

      (10)

      (11)

      (12)

      (13)

      式中:γ代表學(xué)習(xí)率。迭代的數(shù)量對(duì)推薦效率的影響將在實(shí)驗(yàn)部分進(jìn)行驗(yàn)證。

      3實(shí)驗(yàn)評(píng)估

      3.1實(shí)驗(yàn)方法

      3.1.1數(shù)據(jù)集

      豆瓣網(wǎng)(www.douban.com)是中國(guó)最大的社交平臺(tái)之一,許多人在這里分享對(duì)書(shū)、電影、音樂(lè)的評(píng)價(jià)。每個(gè)用戶可以對(duì)書(shū)、電影、音樂(lè)進(jìn)行評(píng)級(jí)(從一星到五星),表達(dá)他們對(duì)這些產(chǎn)品的喜好。在社交網(wǎng)絡(luò)中如果某用戶的評(píng)論被認(rèn)為是有趣且有用的,則他就可能被其他用戶所跟隨。表1列出了數(shù)據(jù)集的統(tǒng)計(jì)數(shù)據(jù)。

      表1 豆辨網(wǎng)的統(tǒng)計(jì)數(shù)據(jù)

      選擇豆瓣的數(shù)據(jù)因?yàn)樗粌H包含了相關(guān)的時(shí)間/數(shù)據(jù)和其他可推斷的上下文信息,而且還包含了社會(huì)網(wǎng)絡(luò)信息,因此非常適合用于評(píng)估應(yīng)用了多種類型信息的CS算法的性能。從豆瓣數(shù)據(jù)集中,隨機(jī)選擇80%的評(píng)價(jià)來(lái)訓(xùn)練推薦模型,使用剩下的20%比較它們的性能。

      3.1.2比較對(duì)象

      本文將CS推薦系統(tǒng)和目前主流的幾種推薦方法進(jìn)行了對(duì)比實(shí)驗(yàn):傳統(tǒng)的基于上下文感知推薦系統(tǒng)RPMF[14]、基于社會(huì)網(wǎng)絡(luò)的推薦系統(tǒng)SoReg[11]、應(yīng)用基本的矩陣分解模型構(gòu)建的推薦系統(tǒng)BMF[12]。

      與所有的上下文推薦系統(tǒng)相似,從數(shù)據(jù)集中可獲得的上下文化信息中選取了5種類型的上下文信息:1)小時(shí)信息,即用戶給出評(píng)分的時(shí)刻;2)日期信息,即用戶給出評(píng)分的日期;3)當(dāng)一個(gè)評(píng)價(jià)被給出的時(shí)候,對(duì)目標(biāo)商品產(chǎn)生“期待”的數(shù)量;4)當(dāng)目標(biāo)用戶評(píng)價(jià)一個(gè)特定商品時(shí),其所給出評(píng)分的平均值;5)目標(biāo)商品所屬的類別。

      3.1.3 度量標(biāo)準(zhǔn)

      實(shí)驗(yàn)選取在推薦系統(tǒng)評(píng)價(jià)中經(jīng)常使用的2個(gè)度量標(biāo)準(zhǔn)來(lái)比較不同推薦模型的性能:平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)。式(14)和(15)分別給出兩者的定義:

      (14)

      (15)

      3.2實(shí)驗(yàn)結(jié)論

      首先使用豆瓣網(wǎng)數(shù)據(jù)集來(lái)說(shuō)明CS算法中不同參數(shù)值的選取對(duì)推薦性能的影響。經(jīng)過(guò)交叉驗(yàn)證之后得到規(guī)則化常量λ=0.1。圖3給出了當(dāng)數(shù)據(jù)集的不同子集(如書(shū)數(shù)據(jù)、電影數(shù)據(jù)、音樂(lè)數(shù)據(jù))被應(yīng)用時(shí),CS推薦模型的性能如何隨著參數(shù)值α的變化而變化,參數(shù)α決定了有多少社會(huì)網(wǎng)絡(luò)信息量被整合進(jìn)CS推薦模型中(見(jiàn)式11)。實(shí)驗(yàn)中設(shè)置在求解矩陣因式分解模型中潛在特征向量的維數(shù)為10,迭代求解次數(shù)為20。后續(xù)實(shí)驗(yàn)會(huì)給出這些變量的變化如何影響基于矩陣因式分解的推薦模型的性能。從圖3可以看出隨著α值的增大,MAE和RMSE的值首先減少,接下來(lái)當(dāng)?shù)竭_(dá)一定閾值時(shí)(大約在α=0.1處)其值變得相對(duì)穩(wěn)定(只是輕微下降)。因此可能得出社交網(wǎng)絡(luò)信息可以有效改善推薦質(zhì)量的結(jié)論,并且α=0.001是一個(gè)合適的閾值來(lái)很好地平衡用戶—項(xiàng)目評(píng)分矩陣和社交網(wǎng)絡(luò)信息。

      (a) MAE實(shí)驗(yàn)結(jié)果

      (b) RMSE實(shí)驗(yàn)結(jié)果 圖3 參數(shù)α的影響(λ=0.1,維數(shù)=10,迭代次數(shù)=20) Fig.3 Impact of α(λ=0.1, dimensionality=10,iteration=20)

      接下來(lái),驗(yàn)證上下文信息數(shù)量對(duì)推薦性能的影響。這一點(diǎn)可以通過(guò)控制決策樹(shù)的高度來(lái)實(shí)現(xiàn)。也就是說(shuō),如果設(shè)樹(shù)的高度為1,則只有一種類型的上下文信息在樹(shù)的劃分時(shí)被使用;如果設(shè)樹(shù)的高度為4,表示所有的上下文信息都被應(yīng)用到推薦系統(tǒng)中來(lái)。圖4給出了不同數(shù)量上下文信息的實(shí)驗(yàn)結(jié)果。

      從圖4中可以看出在所有情況下,上下文信息越多則會(huì)產(chǎn)生越高的推薦精度,即MAE和RMSE的值越小。實(shí)驗(yàn)結(jié)果表明上下文信息很大程度上改善了推薦系統(tǒng)的性能,另一方面,從實(shí)驗(yàn)結(jié)果中可以看出本文所選取的上下文信息是非常有用的。

      (a) MAE實(shí)驗(yàn)結(jié)果

      (b) RMSE實(shí)驗(yàn)結(jié)果 圖4 上下文信息數(shù)量的影響(λ=0.1,維數(shù)=10,迭代次數(shù)=20) Fig.4 Impact of number of contextual information(λ=0.1,dimensionality=10,iteration=20)

      最后,將CS推薦系統(tǒng)和其他推薦系統(tǒng)的性能在豆瓣網(wǎng)數(shù)據(jù)集上做對(duì)比實(shí)驗(yàn)。在做對(duì)比實(shí)驗(yàn)之前,需要決定2個(gè)重要的參數(shù)的取值,即潛在特征向量的維度和基于矩陣因式分解模型的迭代次數(shù)。首先固定迭代次數(shù)為10,觀察潛在特征向量在不同維度下的MAE取值,如表1所示。發(fā)現(xiàn)隨著維度的增加MAE的值在減少,這意味著隨著維度的增加將會(huì)產(chǎn)生更高的推薦。但是當(dāng)維度增加到大約10時(shí),推薦質(zhì)量的改進(jìn)甚小。因此在實(shí)驗(yàn)中,為推薦算法的潛在特征向量維度設(shè)置為10。同理,本文為所有基于矩陣因式分解模型的迭代次數(shù)設(shè)置為20,因?yàn)楦嗟牡螖?shù)并沒(méi)有降低MAE 的值,反而會(huì)產(chǎn)生更高的開(kāi)銷。

      參數(shù)一量確定,下面就分別使用書(shū)數(shù)據(jù)、電影數(shù)據(jù)、音樂(lè)數(shù)據(jù)和整個(gè)豆瓣網(wǎng)數(shù)據(jù)來(lái)比較不同推薦模型的推薦性能。表2給出了對(duì)比結(jié)果。從圖5可以看出, 本文提出的CS推薦模型所有的實(shí)驗(yàn)數(shù)據(jù)中都比其他推薦模型更加精確。所有基于矩陣因式分解的推薦模型都明顯優(yōu)于傳統(tǒng)的基于項(xiàng)目和基于用戶的協(xié)同過(guò)濾算法,這表明了矩陣因式分解技術(shù)在推薦領(lǐng)域的優(yōu)勢(shì)。實(shí)驗(yàn)結(jié)果也表明綜合考慮上下文信息和社會(huì)網(wǎng)絡(luò)信息比只考慮某一種信息類型的推薦模型(如SoReg 和RPMF)具有更高的推薦質(zhì)量。

      表2 向量維度與迭代次數(shù)對(duì)推薦質(zhì)量的影響(MAE)

      (a) MAE實(shí)驗(yàn)結(jié)果

      (b) RMSE實(shí)驗(yàn)結(jié)果 圖5 不同推薦模型的性能比較 Fig.5 Performance comparison for various model

      4結(jié)束語(yǔ)

      本文提出的CS算法是一個(gè)將上下文信息和社交網(wǎng)絡(luò)信息相結(jié)合推薦算法,大大提高了推薦質(zhì)量。該算法首先使用隨機(jī)決策樹(shù)算法基于不同的上下文信息對(duì)原始用戶評(píng)分矩陣進(jìn)行劃分。劃分后生成的子矩陣中包含相似上下文的評(píng)分,因此彼此間具有更大的影響。矩陣因式分解技術(shù)被應(yīng)用到子矩陣中用來(lái)預(yù)測(cè)缺失評(píng)分。為了有效聯(lián)合社會(huì)網(wǎng)絡(luò)信息,CS算法引進(jìn)額外的社會(huì)規(guī)則術(shù)語(yǔ)通過(guò)學(xué)習(xí)他朋友的品味來(lái)推斷用戶對(duì)一個(gè)項(xiàng)目的喜好。為了識(shí)別有相似品味的朋友,提出了一個(gè)基于上下文信息的皮爾遜系數(shù)來(lái)衡量用戶與朋友的相似性。在2個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行的驗(yàn)證,實(shí)驗(yàn)結(jié)果表明CS推薦算法明顯優(yōu)于傳統(tǒng)的基于上下文信息和基于社交網(wǎng)絡(luò)的推薦模型。

      參考文獻(xiàn):

      [1]ZHAO Du, FU Xiaolong. Scalable and explainable friend recommendation in campus social network system[J]. Frontier and Future Development of Information Technology in Medicine and Education, 2014, 269(1): 457-466.

      [2]CHEN Cheng, MAO Chengjie, TANG Yong. Personalized recommendation based on implicit social network of researchers[J]. Pervasive Computing and the Networked World, 2013, 7719(10): 97-107.

      [3]ZHONG Erheng, FAN Wei, YANG Qiang. Contextual collaborative filtering via hierarchical matrix factorization[C]//Proceedings of the Siam Internatiohnal Conference on Data Mining. Texas, USA , 2012: 744-755.

      [4]RENDLE S, GANTNER Z, FREUDENTHALER C. Fast context-aware recommendations with factorization machines[C]//Proceedings of the 34th International ACM SIGIR Conference. Beijing, China, 2011: 230-241.

      [5]BALTRUNAS L, LUDWIG B, RICCI F. Matrix factorization techniques for context aware recommendation[C]//Proceedings of the Fifth ACM Conference on Recommender Systems. Chicago, USA, 2011: 301-304.

      [6]YANG Xiwang, STECK H, LIU Yong. Circle-based recommendation in online social networks[C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Beijing, China, 2012: 1267-1275.

      [7]NOEL J, SANNER S, TRAN K. New objective functions for social collaborative filtering[C]//Proceedings of the 21th International Conference on World Wide Web. Lyon, France, 2012: 859-868.

      [8]XU Bin, BU Jiajun, CHEN Chun. An exploration of improving collaborative recommender systems via user-item subgroups[C]//Proceedings of the 21st International Conference on World Wide Web. Lyon, France, 2012: 21-31.

      [9]LIU Qiang, WANG Chengwei, XU Congfu. A modified PMF model incorporating implicit item associations[C]//Proceedings of the International Conference on Tools with Artificial Intelligence. Athens, Greece, 2012: 7-9.

      [10]JIANG Ming, CUI Peng, LIU Rui. Social contextual recommendation[C]//Proceedings of the 21st ACM International Conference on Information and Knowledge Management. Maui, USA, 2012: 566-578.

      [11]MA Hao, ZHOU Dengyong, LIU Chao. Recommender systems with social regularization[C]//Proceedings of the Fourth ACM International Conference on Web Search And Data Mining. Hong Kong, China, 2011: 287-296.

      [12]MA Hao, YANG Haixuan, LYU M R. Sorec: social recommendation using probabilistic matrix factorization[C]//Proceedings of the 17th ACM Conference on Information and Knowledge Management. [S.l.], USA, 2008: 931-940.

      李慧,女,1979年生,講師,博士研究生,主要研究方向?yàn)橹悄苄畔⑻幚怼⑸鐣?huì)網(wǎng)絡(luò)分析、計(jì)算機(jī)技術(shù)及應(yīng)用。主持并完成江蘇省自然科學(xué)基金1項(xiàng),參與國(guó)家自然科學(xué)基金2項(xiàng),出版專著1部,發(fā)表學(xué)術(shù)論文20余篇。

      馬小平,男,1961年生,教授,博士,主要研究方向?yàn)榭刂评碚摷皯?yīng)用、計(jì)算機(jī)技術(shù)及應(yīng)用。主持并完成多項(xiàng)科研項(xiàng)目,其中國(guó)家“863”項(xiàng)目1項(xiàng)、國(guó)家自然科學(xué)基金項(xiàng)目2項(xiàng)、江蘇省自然科學(xué)基金項(xiàng)目3項(xiàng)、江蘇省高?;A(chǔ)研究項(xiàng)目2項(xiàng)、大型企業(yè)橫向科研項(xiàng)目20余項(xiàng)。

      胡云,女,1978年生,副教授,主要研究方向?yàn)閺?fù)雜網(wǎng)絡(luò)分析理論及應(yīng)用、數(shù)據(jù)挖掘、多Agent系統(tǒng)。主持并完成科研項(xiàng)目多項(xiàng),其中國(guó)家自然科學(xué)基金項(xiàng)目1項(xiàng),江蘇省自然科學(xué)基金項(xiàng)目1項(xiàng),參與出版專著1部,發(fā)表學(xué)術(shù)論文10余篇。

      2015中國(guó)計(jì)算機(jī)視覺(jué)大會(huì)(CCF CCCV)

      CCF Chinese Conference on Computer Vision 2015

      中國(guó)計(jì)算機(jī)視覺(jué)大會(huì)(CCF Chinese Conference on Computer Vision,CCF CCCV)是由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,CCF計(jì)算機(jī)視覺(jué)專業(yè)委員會(huì)協(xié)辦的計(jì)算機(jī)視覺(jué)領(lǐng)域盛會(huì)。該系列會(huì)議每2年舉行一次,是國(guó)內(nèi)計(jì)算機(jī)視覺(jué)領(lǐng)域最主要的學(xué)術(shù)活動(dòng),旨在為從事計(jì)算機(jī)視覺(jué)領(lǐng)域的學(xué)生、老師和工業(yè)界研究人員提供一個(gè)學(xué)科互動(dòng)交流平臺(tái),促進(jìn)領(lǐng)域內(nèi)的學(xué)術(shù)交流以及學(xué)術(shù)界與工業(yè)界之間的交流,提高國(guó)內(nèi)視覺(jué)領(lǐng)域的研究水平。大會(huì)將邀請(qǐng)多位知名專家學(xué)者做主題報(bào)告,分享計(jì)算機(jī)視覺(jué)領(lǐng)域最新最熱的理論和方法,使與會(huì)者接觸到學(xué)科最前沿的研究工作和團(tuán)隊(duì),使得研究人員分享計(jì)算機(jī)視覺(jué)領(lǐng)域的研究成果、創(chuàng)新思想、最新研究進(jìn)展。

      2015年中國(guó)計(jì)算機(jī)學(xué)會(huì)中國(guó)計(jì)算機(jī)視覺(jué)大會(huì)(CCCV2015)將于2015年9月18~20日在陜西省西安市舉行,由西安電子科技大學(xué)計(jì)算機(jī)學(xué)院、電子工程學(xué)院和綜合業(yè)務(wù)網(wǎng)理論及關(guān)鍵技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室聯(lián)合承辦。本次會(huì)議將匯聚從事計(jì)算機(jī)視覺(jué)理論與應(yīng)用研究的人員,廣泛開(kāi)展學(xué)術(shù)交流,研討發(fā)展戰(zhàn)略,共同促進(jìn)計(jì)算機(jī)視覺(jué)相關(guān)理論、技術(shù)及應(yīng)用的發(fā)展。

      組織機(jī)構(gòu)

      指導(dǎo)委員會(huì)

      譚鐵牛 中科院自動(dòng)化所查紅彬 北京大學(xué)

      陳熙霖 中科院計(jì)算所賴劍煌 中山大學(xué)

      王濤 愛(ài)奇藝公司王亮 中科院自動(dòng)化所

      大會(huì)主席

      譚鐵牛 中科院自動(dòng)化所高新波 西安電子科技大學(xué)

      程序委員會(huì)主席

      查紅彬 北京大學(xué)陳熙霖 中科院計(jì)算所

      王亮 中科院自動(dòng)化所苗啟廣 西安電子科技大學(xué)計(jì)算機(jī)學(xué)院

      猜你喜歡
      協(xié)同過(guò)濾社會(huì)網(wǎng)絡(luò)信息
      訂閱信息
      中華手工(2017年2期)2017-06-06 23:00:31
      城市新移民社會(huì)適應(yīng)與社會(huì)網(wǎng)絡(luò)協(xié)同模擬框架研究
      基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過(guò)濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
      基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過(guò)濾推薦算法研究
      基于協(xié)同過(guò)濾算法的個(gè)性化圖書(shū)推薦系統(tǒng)研究
      大數(shù)據(jù)時(shí)代社會(huì)區(qū)域創(chuàng)新網(wǎng)絡(luò)學(xué)習(xí)與能力建構(gòu)
      旅游目的地合作中網(wǎng)絡(luò)治理模式研究
      混合推薦算法在電影推薦中的研究與評(píng)述
      企業(yè)管理中社會(huì)網(wǎng)絡(luò)的運(yùn)用及相關(guān)問(wèn)題闡述
      展會(huì)信息
      包头市| 岐山县| 互助| 海城市| 抚远县| 瓦房店市| 凭祥市| 定襄县| 五华县| 东丰县| 新郑市| 高平市| 宾川县| 南宫市| 新民市| 临朐县| 乐山市| 上林县| 集贤县| 河东区| 克什克腾旗| 柏乡县| 祁阳县| 东港市| 西城区| 广安市| 筠连县| 宽城| 九龙坡区| 布拖县| 辽中县| 天门市| 沈丘县| 龙游县| 通城县| 宜阳县| 沧源| 潼南县| 民丰县| 三门峡市| 郎溪县|