• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于非負(fù)矩陣分解的群組推薦算法*

      2022-05-27 02:05:46賈俊杰姚葉旺陳旺虎
      計算機(jī)工程與科學(xué) 2022年5期
      關(guān)鍵詞:群組組內(nèi)準(zhǔn)確率

      賈俊杰,姚葉旺,陳旺虎

      (西北師范大學(xué)計算機(jī)科學(xué)與工程學(xué)院,甘肅 蘭州 730070)

      1 引言

      網(wǎng)絡(luò)信息的爆炸增長,導(dǎo)致人們在選擇心儀的商品或服務(wù)時極易陷入“信息過載”的窘境。推薦系統(tǒng)作為緩解信息過載問題的重要手段,得到廣大學(xué)者的研究[1]。該技術(shù)通過對用戶大量歷史行為數(shù)據(jù)進(jìn)行深度挖掘,分析出不同用戶的偏好與需求,實現(xiàn)向用戶精準(zhǔn)推送[2]。傳統(tǒng)的個性化推薦系統(tǒng)采用協(xié)同過濾[3]和矩陣分解[4]等手段,在單個用戶的預(yù)測評分和推薦方面取得巨大成功,被廣泛應(yīng)用于電子商務(wù)、音樂和新聞等領(lǐng)域。

      隨著交通工具和媒介技術(shù)的不斷革新,人們之間的交往變得越來越簡單、頻繁,用戶的消費或娛樂行為也越來越傾向于以群組的形式進(jìn)行,如旅游、聚餐等。多人參與便會產(chǎn)生分歧和沖突,群組更是如此,針對同樣的商品,群組內(nèi)的不同成員往往有不同的意見與喜好。在此情況下,傳統(tǒng)的個性化推薦系統(tǒng)無法解決群體內(nèi)部的偏好沖突問題,群組推薦系統(tǒng)[5]便應(yīng)運而生。

      群組推薦系統(tǒng)的目標(biāo)是向多用戶組成的群組進(jìn)行推薦,其核心是提取并融合組內(nèi)不同成員之間的偏好,最大程度地緩解偏好沖突,建立群組模型。目前主流的融合策略有均值策略AVG(AVeraGe strategy)[6]、最小痛苦策略LM(Least Misery strategy)[7]、最開心策略MP(Most Pleasure strategy)[8]、最受尊敬者策略[9]、痛苦避免均值策略[10]和基于以上傳統(tǒng)策略的加權(quán)結(jié)合方法[11,12]等。但是,傳統(tǒng)策略往往存在各種弊端,如均值策略僅僅把組內(nèi)各成員的評分均值作為群組評分進(jìn)行偏好建模,雖然執(zhí)行簡單,但忽視了成員的貢獻(xiàn)度,群組偏好易被貢獻(xiàn)度較低的成員擾亂;最小痛苦策略和最開心策略簡單選取組內(nèi)的最低或最高評分作為群組評分,忽視了組內(nèi)大部分人的喜好,容易帶來不公平性問題;最受尊敬者策略以某一成員偏好代表整體,有失偏頗;痛苦避免均值策略通過對超過痛苦閾值的評分求取均值建立群組模型,可以在一定程度上避免惡意評分的干擾,但痛苦閾值的選取需視情況而定,且該策略沒有考慮群體成員的整體偏差。

      本文在此基礎(chǔ)上,提出一種基于非負(fù)矩陣分解的群組推薦算法GRBNMF(a Group Recommendation algorithm Based on Non-negative Matrix Factorization)。通過K-Means聚類發(fā)現(xiàn)群組,對群組內(nèi)用戶評分矩陣,利用非負(fù)矩陣分解得到用戶矩陣和項目矩陣。計算項目矩陣中各項目在不同隱含類別下的隸屬度和用戶矩陣中各成員在不同隱含類別上的專業(yè)度,并結(jié)合隸屬度和專業(yè)度得到各成員針對不同項目評分的貢獻(xiàn)度,依據(jù)成員貢獻(xiàn)度對成員偏好加權(quán)融合得到群組偏好,由此產(chǎn)生群組推薦列表。相比于傳統(tǒng)融合策略,本文算法根據(jù)群組中專家成員對整個群組偏好的影響,降低了普通成員對融合結(jié)果的干擾。

      本文主要貢獻(xiàn)如下:

      (1)提出了一種群組偏好建模方法,該方法從群組成員對隱含項目類別的專業(yè)度出發(fā),通過非負(fù)矩陣分解獲取組內(nèi)成員在每個項目上的貢獻(xiàn)度,以此為依據(jù)構(gòu)建群組偏好模型;

      (2)提出了一種基于非負(fù)矩陣分解的群組推薦算法,該算法可以避免非專家成員對融合結(jié)果的干擾,解決了一般的群組推薦問題。

      2 相關(guān)工作

      近年來,有許多學(xué)者對群組推薦系統(tǒng)進(jìn)行了深入研究,這些工作的重心基本都是圍繞在群組成員的偏好融合方面。

      在偏好融合的過程中,根據(jù)群組建模發(fā)生的時間不同,可將偏好融合分為模型融合和推薦融合,如圖1所示。

      Figure 1 Schematic diagram of two aggregation methods圖1 2種融合方法示意圖

      模型融合先對成員偏好進(jìn)行融合構(gòu)建群組偏好模型,可根據(jù)群組模型生成推薦列表;推薦融合是先對群組成員進(jìn)行個性化推薦,再融合成員個人的推薦結(jié)果得到群組推薦結(jié)果。2種融合方法的優(yōu)劣不能一概而論,但其缺點都較為明顯,模型融合易受評分稀疏性的影響,推薦融合則忽略了群組之間的交互,因為個人行為易受群體影響[13]。

      在融合策略方面的研究中,陳君同等[11]針對旅游組推薦提出一種滿意度平衡策略,該策略在融合過程中結(jié)合均值策略和最小痛苦策略,提升了群體成員的推薦滿意度。陶永才等[12]提出一種混合融合策略,在分歧閾值的兩側(cè)分別采用最受尊敬者策略和均值策略完成偏好融合,但閾值的選取往往需視情況而定。針對組內(nèi)成員的評分預(yù)測,鄭偉等[14]認(rèn)為在同一群組中用戶的未知偏好會受到組內(nèi)其他成員的影響,基于此提出了一種偏好預(yù)測算法,但該算法時間復(fù)雜度較高。Wang等[15]結(jié)合信任社交網(wǎng)絡(luò)對群體成員的偏好進(jìn)行修正,但通常情況下信任度難以獲取,因此該方法并不易于實施。

      自從矩陣分解模型在Netflix Prize大賽上一鳴驚人之后[16],人們紛紛展開了將矩陣分解應(yīng)用于推薦系統(tǒng)的研究。到目前為止,矩陣分解模型已經(jīng)在個性化推薦系統(tǒng)上取得傲人成績,但將其應(yīng)用于群組推薦的算法卻寥若晨星。王海艷等[17]受潛在因子模型與狀態(tài)空間模型啟發(fā),提出一種基于動態(tài)卷積概率矩陣分解的群組推薦方法,該方法在潛在因子模型下可以充分挖掘用戶與服務(wù)的隱含關(guān)系,幫助生成潛在群組,提高推薦質(zhì)量。王剛等[18]將群組成員間的關(guān)系加入聯(lián)合概率矩陣分解,提高了群組推薦的準(zhǔn)確率。Ortega等[19]在傳統(tǒng)矩陣分解基礎(chǔ)上,通過計算群組成員對項目的評分?jǐn)?shù)量和評分一致性為候選項目添加權(quán)重,再通過融合項目權(quán)重進(jìn)行組推薦。Zhang等[20]在考慮了項目的自然屬性以及用戶興趣會隨時間發(fā)生動態(tài)變化的基礎(chǔ)上,提出一種按項目加權(quán)的矩陣分解模型,通過將該模型與時效函數(shù)相結(jié)合,提升了群組推薦系統(tǒng)的查全率與查準(zhǔn)率。由此可見,矩陣分解模型在群組推薦系統(tǒng)上依然可以發(fā)揮其獨特的優(yōu)勢[17-20]。但是,傳統(tǒng)矩陣分解因為受到初始值和更新方法的顯著影響,無法保證獲得一個穩(wěn)定的解,因此也無法建立一個穩(wěn)定且唯一的群組偏好模型[21]。在Lee等[22]提出非負(fù)矩陣分解模型之后,因該模型實現(xiàn)上的簡便性,分解形式和分解結(jié)果的可解釋性,在計算機(jī)視覺和數(shù)據(jù)挖掘等方面得到廣泛應(yīng)用。Wang等[21]利用可分離非負(fù)矩陣分解在全局空間上挖掘群組成員的貢獻(xiàn)度,并依據(jù)成員貢獻(xiàn)度對成員評分進(jìn)行加權(quán)融合建立群組偏好模型。該方法在一定程度上緩解了組內(nèi)矛盾,但其在偏好融合過程中對用戶知識背景和項目固有屬性(即隱含類別)之間的關(guān)系欠缺考慮。

      基于以上研究啟發(fā),本文考慮從隱含項目類別入手,利用非負(fù)矩陣分解分析成員專業(yè)度,嘗試緩解非專業(yè)成員對融合結(jié)果的影響,以期建立準(zhǔn)確率更高的群組偏好模型,實現(xiàn)高效的群組推薦。

      3 相關(guān)技術(shù)

      3.1 非負(fù)矩陣分解

      矩陣分解將高維用戶項目評分矩陣Rm×n分解為2個低維用戶矩陣Um×k和項目矩陣Vk×n,其中用戶矩陣表示用戶對k個隱含項目類別的偏好程度,項目矩陣表示項目在k個隱含項目類別上的隸屬程度。通過2個特征矩陣相乘完成對原評分矩陣的擬合,并在擬合過程中對特征矩陣進(jìn)行不斷更新。矩陣分解可以表示如式(1)所示:

      Rm×n≈Um×kVk×n

      (1)

      其中,Rm×n表示原用戶項目評分矩陣;Um×k表示用戶特征矩陣;Vk×n表示項目特征矩陣;m和n分別表示用戶和項目的數(shù)量,k為隱含項目類別數(shù)量。

      非負(fù)矩陣分解NMF(Non-negative Matrix Factorization)在矩陣分解的基礎(chǔ)上對特征矩陣加上非負(fù)的約束條件,即同時要求:U和V中元素不小于0。

      這種非負(fù)性的約束會導(dǎo)致相應(yīng)描述在一定程度上的稀疏性,但稀疏性的表述已被證明是介于完全分布式和單一活躍分量的描述間的一種有效數(shù)據(jù)描述形式,并且這種稀疏性的描述能使對數(shù)據(jù)的解釋變得方便(少量活躍的分量使數(shù)據(jù)的組成方式變得清晰)與合理(在評分中不可能存在負(fù)值)[23]。

      為使式(1)最大程度地逼近原評分矩陣,建立的目標(biāo)函數(shù)如式(2)所示:

      (2)

      其中,ri,j表示原評分矩陣中的元素值,β為正則項系數(shù)。

      根據(jù)Lee等[24]提出的乘性迭代規(guī)則求解目標(biāo)函數(shù),最終得到的迭代式如式(3)和式(4)所示:

      (3)

      (4)

      3.2 群組推薦系統(tǒng)

      當(dāng)前,群組推薦系統(tǒng)還沒有統(tǒng)一的形式化定義,本文從群組推薦的一般步驟出發(fā)對其進(jìn)行簡單闡述。

      定義1群組G是由若干有偏好意愿的用戶組成的集合,G={ui|0

      定義2群組偏好profileG,i=∑uu∈Gωu,iprofileu,i,其中profileG,i表示群組G對項目ii的偏好,通常以評分表示;profileu,i表示成員uu對項目ii的偏好;ωu,i是群組G中成員uu在項目ii上的權(quán)重,不同的權(quán)重可以代表不同的偏好融合策略。如ωu,i≡1/|G|時,上式可以表示均值策略;而當(dāng)評分最低的成員權(quán)重為1,其他成員權(quán)重為0時,上式可以表示最小痛苦策略。

      定義3Top-N組推薦:群組推薦系統(tǒng)一般將候選項目集中前N個偏好得分最高的項目推薦給群組,候選項目集一般為未被所有成員消費的項目集合。對于給定的群組G,可從候選項目集I中得到一個群組推薦列表IG,如式(5)所示:

      |IG|=N,?ii,ij∈I,

      s.t.profileG,i≥profileG,j,ii∈IG,ij?IG

      (5)

      且IG中的項目按照群組偏好降序排列。

      4 GRBNMF算法步驟與示例

      4.1 群組發(fā)現(xiàn)

      在群組推薦系統(tǒng)中,推薦結(jié)果的好壞不僅依賴于偏好融合策略的設(shè)計,而且在很大程度上受到組內(nèi)相似度的影響。一般而言,組內(nèi)相似度越高,群組的偏好沖突就越小,對推薦結(jié)果的整體滿意度也就越高。而相對地,組內(nèi)相似度越低,說明組內(nèi)成員的興趣愛好大相徑庭,正所謂眾口難調(diào),在此情況下,群組對推薦結(jié)果的滿意度往往也比較低。因此,發(fā)現(xiàn)內(nèi)部更為相似的群組對提高推薦結(jié)果的滿意度有著至關(guān)重要的作用。

      K-Means聚類算法因其實現(xiàn)簡單、收斂速度快的優(yōu)勢,成為最常用的聚類算法之一。本文根據(jù)文獻(xiàn)[25],以用戶評分向量之間的Pearson相關(guān)系數(shù)為度量,采用K-Means對評分?jǐn)?shù)據(jù)集中的用戶進(jìn)行多次聚類,生成大小不一的多個群組。Pearson相關(guān)系數(shù)的計算公式如式(6)所示:

      sim(uu,uv)=

      (6)

      通常,評分?jǐn)?shù)據(jù)集中用戶數(shù)量遠(yuǎn)少于項目數(shù)量,因此一般的評分?jǐn)?shù)據(jù)集往往稀疏度都非常高,同時Pearson相關(guān)系數(shù)的計算非常依賴共同評分項。為緩解評分稀疏對用戶聚類結(jié)果的影響,在對用戶聚類之前先對項目聚類,使相似項目位于同一個簇中。之后,計算用戶對每個項目簇的評分均值作為用戶的評分向量,減少用戶的空白評分,使Pearson相關(guān)系數(shù)的計算更加準(zhǔn)確。最后,對用戶進(jìn)行聚類產(chǎn)生群組。由于一個用戶可以屬于多個群組,反復(fù)執(zhí)行聚類過程產(chǎn)生大量群組。假設(shè)原評分?jǐn)?shù)據(jù)如表1所示。

      Table 1 Rating table表1 評分表

      先對表1中項目進(jìn)行聚類,假設(shè)項目聚類結(jié)果為S1={i1,i2,i3,i4,i5}和S2={i6,i7,i8,i9,i10}。然后對各項目簇的評分取均值可實現(xiàn)用戶評分向量的降維,如用戶u1降維后的評分向量就是[3.2,1.4]。在此基礎(chǔ)上對用戶聚類,假設(shè)表1產(chǎn)生G1={u1,u2,u3,u4}和G2={u5,u6,u7,u8}2個群組。算法的具體描述如算法1所示。

      算法1群組發(fā)現(xiàn)算法

      輸入:評分矩陣Rm×n,項目種類p,群組數(shù)量q。

      輸出:q個群組。

      步驟1K-Means(items);//items為R中的所有項目

      步驟2 Foruuinusers://users為R中的所有用戶

      步驟3ru=[avg(rcluster1),avg(rcluster2),…,avg(rclusterp)];/*clusterp為項目聚類后第p個項目簇*/

      步驟4 EndFor;

      步驟5K-Means(users);//對降維后的用戶進(jìn)行聚類

      步驟6 Returnqgroups。

      4.2 群組偏好建模

      在實際生活中,一個項目通常具有多個屬性,如一部電影,它可以屬于某個年代,也可以屬于某幾種類型。在群組決策的過程中,針對不同的項目屬性,成員之間的話語權(quán)往往各不相同。一般情況下,對于項目所涉屬性具有較多專業(yè)背景知識的成員話語權(quán)更高,在決策過程中的貢獻(xiàn)度也更高,決策結(jié)果也常傾向于此。通常,用戶專業(yè)程度與其興趣度成正比,而用戶興趣度常以用戶特征矩陣中的偏好值表示。

      本文算法通過分析群組成員對隱含項目類別的專業(yè)程度,使偏好融合的結(jié)果傾向于更為專業(yè)的成員。通過預(yù)測評分矩陣對原評分矩陣中的空值填充得到填充評分矩陣,針對成員專業(yè)背景知識對群組偏好的影響,通過項目矩陣計算項目在各隱含項目類別下的隸屬度,并結(jié)合各成員在用戶矩陣計算得到的各隱含類別上的專業(yè)度,形成成員在各項目上進(jìn)行偏好融合的貢獻(xiàn)度,根據(jù)成員貢獻(xiàn)度對成員偏好加權(quán)融合得到群組偏好。

      通過表1所得群組G1={u1,u2,u3,u4}作為示例進(jìn)行演示,利用NMF建立群組偏好模型的步驟如下所示:

      步驟1填充評分矩陣。

      對于一個給定群組G,設(shè)其評分矩陣為RG∈R|G|×n,如式(7)所示:

      (7)

      其中,|G|表示群組規(guī)模,n表示項目數(shù)量,ri,j表示成員ui對項目ij的評分。

      對RG進(jìn)行非負(fù)矩陣分解得到用戶矩陣UG∈R|G|×k和項目矩陣VG∈Rk×n,分別如式(8)和式(9)所示:

      (8)

      (9)

      其中,k為隱含項目類別數(shù)量,且k≤|G|?n;ui,x表示成員ui對隱含項目類別x的偏好值;ix,j表示項目ij在隱含類別x上的屬性值。

      則對群組G1有:

      (10)

      設(shè)k=2,對RG 1分解可得(四舍五入保留2位小數(shù)):

      (11)

      (12)

      (13)

      (14)

      經(jīng)上述步驟可得G1的填充評分矩陣RFG 1如式(15)所示:

      (15)

      步驟2計算項目隸屬度和成員專業(yè)度。

      通過項目矩陣可計算項目ij在隱含項目類別x下的隸屬度iweight(j,x),如式(16)所示:

      (16)

      上述矩陣VG1中,i1在2個隱含項目類別下的值分別為2.28和0.16,計算得到總屬性值為2.44,之后可得iweight(1,1)=2.28/2.44=0.93,iweight(1,2)=0.07。

      項目的屬性權(quán)重面向的是隱含項目類別,與之不同是,成員專業(yè)度的權(quán)值計算面向的是群組。因此,可通過用戶矩陣得到成員ui對于隱含項目類別x在群組G中的專業(yè)度uweight(i,x),如式(17)所示:

      (17)

      例如,在矩陣UG1中,4位成員在隱含項目類別1上的總偏好值為1.84+0.17+1.24+2.55=5.8,可計算得到uweight(1,1)=1.84/5.8=0.32。

      步驟3得出成員貢獻(xiàn)度矩陣。

      以上可得項目隸屬度矩陣VW∈Rk×n和成員專業(yè)度矩陣UW∈R|G|×k分別如式(18)和式(19)所示:

      (18)

      (19)

      在矩陣VW中,每一列表示項目在不同隱含類別(屬性)下的隸屬度;在矩陣UW中,每一行表示群組成員對于不同隱含項目類別在群組中的專業(yè)度。因此,通過UW和VW2個矩陣點積可得群組成員對于不同項目在群組中所占權(quán)重,以此表示各成員在不同項目上偏好融合時的貢獻(xiàn)度,即:

      UIW=UW·VW=

      (20)

      其中,weight(i,j)表示群組G中成員ui對于項目ij在偏好融合時的貢獻(xiàn)度。

      對群組G1,通過步驟3可得項目隸屬度矩陣VWG1和成員專業(yè)度矩陣UWG1,分別如式(21)和式(22)所示:

      VWG1=

      (21)

      (22)

      通過式(21)和式(22)中2個矩陣可得成員貢獻(xiàn)度矩陣(四舍五入保留2位小數(shù)),如式(23)所示:

      UIWG1=

      (23)

      步驟4群組偏好。

      此時,將G中所有成員對項目ij填充后的評分與其貢獻(xiàn)度相乘的結(jié)果進(jìn)行累加,得到群組G對項目ij的評分rG,j,即群組偏好,如式(24)所示:

      (24)

      如計算群組G1對項目i1的評分,如式(25)所示:

      rG1,1=0.31×5+0.06×0.82+

      0.22×4+0.41×5=4.53

      (25)

      根據(jù)式(24),在計算G對候選項目評分的過程中即可建立群組偏好模型。

      4.3 群組推薦

      通過上述方法完成群組建模之后,便可在群組偏好中選取前N個評分最高的項目進(jìn)行推薦。本文所提GRBNMF算法的框架圖如圖2所示。

      Figure 2 Framework diagram of GRBNMF algorithm圖2 GRBNMF算法框架圖

      在第1階段,通過K-Means算法對用戶聚類發(fā)現(xiàn)潛在群組;在第2階段中,采用NMF模型對群組評分矩陣進(jìn)行分解,從成員知識背景和項目固有屬性之間的關(guān)系出發(fā),獲得了群組成員對不同項目的貢獻(xiàn)度,依據(jù)成員貢獻(xiàn)度構(gòu)建了群組偏好模型;在第3階段,通過群組模型生成了Top-N推薦列表。

      本文算法(GRBNMF)的具體描述如算法2所示。

      算法2GRBNMF算法

      輸入:群組G的評分矩陣RG,隱含項目類別數(shù)量k,候選項目集I,推薦數(shù)量N。

      輸出:Top-N推薦列表。

      步驟1NMF(RG);

      步驟2RFG←U·V;//對RG中的空值賦值

      步驟3UW←U,VW←V;

      步驟4UIW=UW·VW;

      步驟5 ForiiinI:

      步驟6rG,i=∑uu∈Gweight(u,i)·rfu,i;

      步驟7 Endfor;

      步驟8sortedrG,iby descending order;

      步驟9selectNhighest items;

      步驟10ReturnTop-Nlist。

      5 實驗與結(jié)果分析

      5.1 數(shù)據(jù)集介紹

      本文使用MovieLens公開電影評分?jǐn)?shù)據(jù)集進(jìn)行實驗驗證,它分為多個版本,本文實驗所使用的ML-100K數(shù)據(jù)集信息如表2所示,其它的信息還包含每個電影的標(biāo)簽、每個用戶的職業(yè)、年齡、郵編等個人信息。本文在實驗中將數(shù)據(jù)集按照8∶2的比例分為訓(xùn)練集和測試集,將算法在訓(xùn)練集上進(jìn)行訓(xùn)練,訓(xùn)練完成之后在測試集上進(jìn)行驗證。

      Table 2 ML-100K data set information表2 ML-100K數(shù)據(jù)集信息

      5.2 評價指標(biāo)

      (1)推薦準(zhǔn)確率。

      歸一化折損累計增益nDCG(normalized Discounted Cumulative Gain)是評價推薦系統(tǒng)的常用指標(biāo),被廣泛用于衡量群組推薦的準(zhǔn)確率。每個用戶的nDCG的計算如式(26)和式(27)所示:

      (26)

      (27)

      其中,DCG@N表示用戶對推薦列表中N個項目的真實評分與其在列表中相對位置的滿意程度,reli表示用戶對推薦列表中排名第i的項目的評分。IDCG@N是最好情況下的DCG@N的值,即推薦列表對于用戶個人而言是按照評分降序進(jìn)行排列的。

      nDCG@N由DCG@N和IDCG@N的比值得來,其取值在0~1,且nDCG@N越大,說明用戶對推薦列表的滿意度越高,推薦效果越好。實驗中計算群組內(nèi)每個成員的nDCG@N的值,以均值表示群組的nDCG@N值。

      (2)推薦列表多樣性。

      推薦列表的多樣性是指推薦列表內(nèi)的項目在種類或類型上彼此不同,多樣性越高,說明推薦列表的質(zhì)量越高,推薦效果越好。本文使用Jaccard距離來計算推薦列表多樣性,具體如式(28)和式(29)所示:

      (28)

      (29)

      其中,distanceJac(ij,il)表示兩者之間Jaccard距離,ijgenre表示項目ij包含的類型。

      5.3 實驗設(shè)置與結(jié)果分析

      群組推薦的結(jié)果受群組特征的影響,群組特征主要包括群組規(guī)模(group size)和組內(nèi)相似度(intra-group similarity)[26]。群組規(guī)模表示組內(nèi)成員個數(shù),組內(nèi)相似度指群組中任意2個用戶相似度的最小值[26]。本文首先從群組特征的2個方面出發(fā),針對均值策略AVG[6]、最小痛苦策略LM[7]、最開心策略MP[8]以及Ortega等[19]提出的WBF(Weighted Before Factorization)算法,驗證本文GRBNMF算法的可行性。

      同時,為探究項目隸屬度和成員專業(yè)度對本文算法的影響,在對比實驗中設(shè)置基于成員專業(yè)度MPro(Member Professional degree)的方法,該方法忽略項目的多元屬性,并將其歸為隸屬度最大的一類,針對該類別下成員專業(yè)度進(jìn)行偏好融合生成群組推薦列表。忽略成員專業(yè)度的偏好融合方法即為均值策略。

      此外,在研究不同算法在不同群組規(guī)模下的推薦性能時,針對群組的產(chǎn)生方式,設(shè)置2類由不同方法發(fā)現(xiàn)的群組,即本文群組發(fā)現(xiàn)算法產(chǎn)生的群組(group size-Simi)和隨機(jī)產(chǎn)生的群組(group size-Rand),以評估群組發(fā)現(xiàn)算法對群組推薦效果的影響情況。

      最后,因為本文算法基于非負(fù)矩陣分解,所以在驗證算法在不同群組特征下的可行性之后,探究不同k值對算法的影響也是非常必要的。

      5.3.1 群組規(guī)模

      為研究不同算法在不同群組規(guī)模下的推薦性能和群組發(fā)現(xiàn)算法對推薦效果的影響,從由群組發(fā)現(xiàn)算法產(chǎn)生的群組和隨機(jī)產(chǎn)生的群組中隨機(jī)選擇不同規(guī)模的群組進(jìn)行實驗。選取群組規(guī)模從5開始,間隔為5,直到30為止。實驗中推薦列表長度N取10,正則項系數(shù)β為0.005,矩陣分解最大迭代次數(shù)設(shè)置為1 000,k值隨群組規(guī)模改變,但所有算法都是基于同一個分解結(jié)果,因此并不影響。

      (1)推薦準(zhǔn)確率。

      根據(jù)圖3得到的實驗結(jié)果,橫向來看,在由群組發(fā)現(xiàn)算法產(chǎn)生的群組中,本文算法除了在群組規(guī)模為10和30時推薦準(zhǔn)確率略低之外,在其他情況下均明顯高于其他對比算法。尤其在群組規(guī)模為20時,本文算法推薦準(zhǔn)確率較均值策略提高6%,較最小痛苦策略則提高了9.2%。在由隨機(jī)產(chǎn)生的群組中,本文算法在推薦準(zhǔn)確率方面普遍優(yōu)于其他算法,這是因為隨機(jī)產(chǎn)生的群組組內(nèi)相似度普遍較低,內(nèi)部偏好沖突較大,而本文算法通過選取專家成員緩解了內(nèi)部沖突,使推薦準(zhǔn)確率保持在較為穩(wěn)定的水平。而推薦準(zhǔn)確率總體呈現(xiàn)一種先上升后下降的趨勢,這是因為在選擇群組規(guī)模時沒有考慮組內(nèi)相似度。從縱向觀察可知,推薦準(zhǔn)確率受組內(nèi)相似度的影響較大,這也從側(cè)面表明群組推薦的效果受群組發(fā)現(xiàn)算法的影響顯著。

      Figure 3 Accuracy rate under different group sizes圖3 不同群組規(guī)模下的推薦準(zhǔn)確率

      (2)推薦列表多樣性。

      推薦列表多樣性通常與準(zhǔn)確率負(fù)相關(guān),從圖4的實驗結(jié)果可以看出,本文算法在準(zhǔn)確率明顯高于其他算法的情況下,多樣性常介于其他算法之間。在群組規(guī)模為15時,本文算法在準(zhǔn)確率高于其他算法的情況下,多樣性也高于其他算法。這是因為本文算法能夠充分分析成員偏好及其貢獻(xiàn)度,使得每位成員喜歡的項目都有可能被推薦。在群組規(guī)模為10時,本文算法在犧牲較低準(zhǔn)確度的情況下,換來了多樣性的極大提升。

      Figure 4 Diversity under different group sizes圖4 不同群組規(guī)模下的推薦多樣性

      結(jié)合圖3和圖4來看,本文算法能夠在不同的群組規(guī)模下發(fā)揮較好的推薦性能。最開心策略在上述實驗中表現(xiàn)較差,這是因為在選擇不同的群組規(guī)模時無法保證組內(nèi)相似度的一致性,而組內(nèi)相似度也會對推薦結(jié)果造成一定的影響。

      5.3.2 組內(nèi)相似度

      為了探究組內(nèi)相似度對推薦結(jié)果的影響并從多方面衡量本文算法的優(yōu)劣性,設(shè)置相似度閾值為0.4,將相似度低于此閾值的群組設(shè)為低相似度群組,高于的則記為高相似度群組,群組規(guī)模固定為12,其余參數(shù)與上文一致,進(jìn)行如下對比實驗。

      (1)推薦準(zhǔn)確率。

      從圖5的實驗結(jié)果可看出,本文算法無論在高相似度群組還是在低相似度群組中都有著較高的推薦準(zhǔn)確率。尤其在組內(nèi)相似度較低時,本文算法的推薦準(zhǔn)確率高于基于成員專業(yè)度的算法10%,高于WBF 7%,高于均值策略和最小痛苦策略13%和25%,有著較為穩(wěn)定的發(fā)揮。這是因為本文算法從隱含項目類別對群組成員的知識背景進(jìn)行了詳細(xì)分析,使得群組模型在專家成員的影響之下更為準(zhǔn)確??傮w來看,推薦準(zhǔn)確率與組內(nèi)相似度之間呈現(xiàn)一種正相關(guān),組內(nèi)相似度越高,推薦準(zhǔn)確率就越高。

      Figure 5 Accuracy rate under different intra-group similarities圖5 不同組內(nèi)相似度下的推薦準(zhǔn)確率

      另外,結(jié)合圖5和圖3b來看,即使是在圖5的低相似度群組中,推薦列表準(zhǔn)確率依舊顯著高于圖3b中群組的推薦列表準(zhǔn)確率。這說明由群組發(fā)現(xiàn)算法得到的即便是低相似度群組,其組內(nèi)相似度依舊顯著高于隨機(jī)產(chǎn)生的群組,這也從側(cè)面反映了本文群組發(fā)現(xiàn)算法對潛在群組的挖掘能力。

      (2)推薦列表多樣性。

      從圖6的實驗結(jié)果來看,本文算法在組內(nèi)相似度較低時,推薦列表多樣性是最低的,相較于基于成員專業(yè)度的算法、WBF方法、均值策略和最小痛苦策略分別低了5.3%,2.6%,2.7%和12%,但這些與準(zhǔn)確率的提升相比顯得微不足道。在組內(nèi)相似度較高時,本文算法的推薦列表多樣性介于其他算法之間,且表現(xiàn)較好。

      Figure 6 Diversity under different intra-group similarities圖6 不同組內(nèi)相似度下的推薦多樣性

      總結(jié)圖5和圖6的實驗結(jié)果可以看出,本文算法在組內(nèi)相似度低和高時都可以發(fā)揮出色的推薦性能。

      5.3.3k值

      非負(fù)矩陣分解模型要求k的取值要小于或等于矩陣維度,因此,為了更好地觀察k值對本文算法的影響,選取規(guī)模較大的群組進(jìn)行多次實驗。在實驗中選擇群組規(guī)模為50的10個群組,獲取每個群組在對應(yīng)k值下的推薦準(zhǔn)確率,以均值表示不同算法在該k值下的推薦準(zhǔn)確率。由于WBF基于傳統(tǒng)矩陣分解,所以不在本次實驗范圍之內(nèi)。推薦數(shù)量N取10,非負(fù)矩陣分解參數(shù)與上文保持一致,實驗結(jié)果如圖7所示。

      Figure 7 Accuracy rate under different k values圖7 不同k值下的推薦準(zhǔn)確率

      從實驗結(jié)果中可以看到,本文算法受k值影響較大,這是因為如果k值選取不當(dāng),會使成員貢獻(xiàn)度計算失真,進(jìn)而使群組模型偏差較大,降低推薦質(zhì)量。從圖7中可以看到,均值策略幾乎不受k值影響,這是因為均值策略將所有成員貢獻(xiàn)度視為一致,從而擺脫了參數(shù)k的影響,其曲線略微波動是因為在不同的k值下得到的預(yù)測評分不同。但可以看到的是,在k值為[5,20]時,本文算法推薦準(zhǔn)確率呈上升趨勢且高于其他算法,尤其在k值為20時,準(zhǔn)確率大幅高于其他算法,這是因為候選項目類別約為20種。因而可得,當(dāng)k值較為準(zhǔn)確時,本文算法可以展現(xiàn)出色的推薦性能。

      6 結(jié)束語

      本文提出了一種基于非負(fù)矩陣分解的群組推薦算法,該算法從成員知識背景和項目固有屬性之間的關(guān)系出發(fā),利用非負(fù)矩陣分解深入分析了群組中各成員在偏好融合時的貢獻(xiàn)度,建立了更加準(zhǔn)確的群組偏好模型。之后,依據(jù)群組偏好模型產(chǎn)生了推薦列表。在MovieLens數(shù)據(jù)集上的實驗結(jié)果表明了本文算法的有效性。

      盡管本文利用非負(fù)矩陣分解可以有效分析成員貢獻(xiàn)度,提高推薦性能,但通過矩陣分解得到的預(yù)測評分無法體現(xiàn)群組成員之間的交互和影響,如何將成員之間的交互加入矩陣分解模型,進(jìn)一步提高群組推薦的準(zhǔn)確率,將會是下一步研究目標(biāo)。

      猜你喜歡
      群組組內(nèi)準(zhǔn)確率
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
      健康之家(2021年19期)2021-05-23 11:17:39
      不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
      2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
      用心說題 提高效率 培養(yǎng)能力
      關(guān)系圖特征在敏感群組挖掘中的應(yīng)用研究
      電子測試(2018年14期)2018-09-26 06:04:10
      高速公路車牌識別標(biāo)識站準(zhǔn)確率驗證法
      基于統(tǒng)計模型的空間群組目標(biāo)空間位置計算研究
      合作學(xué)習(xí)組內(nèi)交流討論時間的遵循原則
      合作學(xué)習(xí)“組內(nèi)交流討論時間”注意問題
      合作學(xué)習(xí)組內(nèi)交流討論時間探究
      施秉县| 邻水| 龙山县| 乌兰浩特市| 应用必备| 永修县| 西畴县| 柏乡县| 乐清市| 荔波县| 湟中县| 榆树市| 泰安市| 叙永县| 玉门市| 山西省| 简阳市| 福泉市| 凤凰县| 东乌珠穆沁旗| 横峰县| 海盐县| 五莲县| 苍南县| 耿马| 博野县| 芮城县| 修水县| 运城市| 娱乐| 隆子县| 井冈山市| 宁陵县| 邢台市| 澄迈县| 高邮市| 渭南市| 崇仁县| 鹿泉市| 贵州省| 泰顺县|