鄭馨怡,張宇山
(廣東財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,廣東 廣州 510320)
隨著智能手機(jī)等電子產(chǎn)品的普及,網(wǎng)絡(luò)用戶基數(shù)每年不斷擴(kuò)大,在互聯(lián)網(wǎng)上為用戶推薦符合用戶偏好項(xiàng)目的推薦系統(tǒng)不在少數(shù)。推薦系統(tǒng)通過分析用戶的歷史數(shù)據(jù),為用戶推薦可能符合用戶個(gè)人喜好的項(xiàng)目。有研究指出,推薦多樣性和用戶滿意度之間有著顯著的相關(guān)性,推薦列表的多樣性對(duì)用戶感知有著積極且重要的影響[1]。由此,一個(gè)優(yōu)秀的推薦系統(tǒng)應(yīng)該不僅關(guān)注推薦結(jié)果的準(zhǔn)確性,還應(yīng)該提供多樣的推薦選擇,以滿足用戶的個(gè)性化需求并提升用戶體驗(yàn)。
推薦多樣性可以體現(xiàn)在個(gè)體多樣性和整體多樣性兩個(gè)方面。個(gè)體多樣性從單個(gè)用戶的角度衡量推薦的多樣性,個(gè)體多樣性高意味著系統(tǒng)給用戶推薦一些彼此相似度很低但是符合用戶偏好的項(xiàng)目。整體多樣性則是從整個(gè)推薦系統(tǒng)角度衡量推薦的多樣性,整體多樣性高意味著所有用戶的推薦結(jié)果集合中會(huì)覆蓋更多不同的項(xiàng)目。有研究顯示,由于模型或者是數(shù)據(jù)的原因,導(dǎo)致推薦系統(tǒng)會(huì)放大項(xiàng)目流行度偏差,表現(xiàn)為推薦系統(tǒng)會(huì)將流行度高的項(xiàng)目?jī)?yōu)先推薦給用戶[2]。整體多樣性偏低,就意味著推薦系統(tǒng)總是給用戶推薦更為流行的項(xiàng)目,而忽略長(zhǎng)尾項(xiàng)目。當(dāng)用戶的TOP-K 推薦列表里都占據(jù)著流行度高的項(xiàng)目時(shí),用戶之間的推薦列表就會(huì)越來越相似,通過推薦反饋循環(huán)導(dǎo)致用戶行為同質(zhì)化,該循環(huán)會(huì)進(jìn)一步被更多的循環(huán)放大。同質(zhì)化既發(fā)生在種群水平上(所有用戶的行為更相似),也發(fā)生在個(gè)體水平上(每個(gè)用戶的行為更像它最近的鄰居)[3]。這種同質(zhì)化不僅容易造成用戶的審美疲勞、瀏覽體驗(yàn)感下降,而且還會(huì)導(dǎo)致模型泛化能力下降,推薦結(jié)果變得越來越不可靠。因此,推薦列表中總覆蓋率高并不意味著用戶個(gè)人推薦列表的多樣性也很豐富[4]。
為了改善個(gè)性化推薦效果,本文受到Abdollahpouri等[5]研究的啟發(fā),從項(xiàng)目的流行度切入,提出一種重排序模型(Personalized Re-ranking,PR),目標(biāo)在于提升用戶TOP-K推薦列表多樣性,并向用戶推薦更多的新穎性項(xiàng)目。該模型在基線推薦模型的基礎(chǔ)上,將項(xiàng)目按流行度降序排列,然后在用戶的候選項(xiàng)目集中引入項(xiàng)目流行度和用戶偏好組成的補(bǔ)償分?jǐn)?shù)部分對(duì)項(xiàng)目重新排序,并通過調(diào)節(jié)補(bǔ)償分?jǐn)?shù)的大小以控制用戶最終TOP-K推薦列表新穎項(xiàng)目的比例,達(dá)到提高用戶個(gè)性化推薦列表多樣性的效果。本文主要工作包括:①提出一種重排序模型PR:該模型旨在改善個(gè)性化推薦系統(tǒng)的效果,提升用戶的TOP-K推薦列表的多樣性,并向用戶推薦更多的新穎項(xiàng)目;②從項(xiàng)目流行度切入:PR 模型根據(jù)項(xiàng)目流行度進(jìn)行重排序,通過降序排列項(xiàng)目流行度,提高低流行度項(xiàng)目被推薦的機(jī)會(huì);③改進(jìn)用戶推薦列表的多樣性:PR 模型通過調(diào)節(jié)補(bǔ)償分?jǐn)?shù)以控制用戶最終TOP-K推薦列表中新穎項(xiàng)目的比例;④評(píng)估推薦結(jié)果的整體多樣性和個(gè)體多樣性,探討在提高用戶個(gè)性化多樣性的同時(shí),對(duì)推薦系統(tǒng)整體多樣性的影響程度。
推薦的多樣性可能對(duì)用戶產(chǎn)生長(zhǎng)期影響。例如,在音樂項(xiàng)目的曝光量已經(jīng)被證明有能力減少用戶對(duì)未知或者不熟悉文化的刻板印象和偏見的前提下,Porcaro 等[6]使用縱向?qū)嶒?yàn)得出結(jié)論:暴露于特定水平的音樂推薦多樣性可能會(huì)對(duì)聽眾的聽歌偏好產(chǎn)生長(zhǎng)期影響,并且推薦多樣性對(duì)于用戶探究新穎項(xiàng)目的好奇心也會(huì)有一定影響。
在整體多樣性研究方面,胡春華等[7]考慮用戶的實(shí)時(shí)性和多樣性需求,提出能夠有效挖掘用戶潛在興趣的實(shí)時(shí)多樣性推薦算法。有研究指出[8-10],提升整體多樣性也被稱為長(zhǎng)尾推薦,其目標(biāo)是通過增加長(zhǎng)尾項(xiàng)目的推薦比例,提供更廣泛的選擇和個(gè)性化的推薦體驗(yàn),以滿足用戶的多樣性需求。然而,這些推薦方法都是優(yōu)先考慮整個(gè)推薦系統(tǒng)的多樣性,而忽略了評(píng)估用戶的個(gè)性化列表多樣性。為了提供更好的用戶體驗(yàn),推薦系統(tǒng)需要在追求整體多樣性的同時(shí),確保個(gè)性化列表中的推薦項(xiàng)目能夠盡可能地滿足用戶的個(gè)性化需求和多樣性偏好[11]。
在個(gè)體多樣性研究方面,Ziegler 等[12]使用最大邊際相關(guān)性(Maximal Marginal Relevance,MMR)重排序模型以優(yōu)化推薦結(jié)果,認(rèn)為用戶滿意度優(yōu)先于推薦準(zhǔn)確度,推薦準(zhǔn)確度雖然是一個(gè)模型的重要度量標(biāo)準(zhǔn),但是它們無法捕捉到用戶的滿意度特征。Adomavicius 等[13]提出將初始推薦列表與混合重排結(jié)果相結(jié)合的方法,該方法中的混合重排步驟將項(xiàng)目按照流行度從最低到最高進(jìn)行排序,即推薦給用戶不那么受歡迎的項(xiàng)目,并且將預(yù)測(cè)評(píng)分從最低到最高對(duì)項(xiàng)目進(jìn)行反向預(yù)測(cè)評(píng)分排序,即推薦給用戶非高度相關(guān)的預(yù)測(cè)項(xiàng)目。Ashkan 等[14]提出一種推薦列表多樣化方法(Diversity-Weighted Utility Maximization,DUM),該方法利用貪婪策略平衡準(zhǔn)確性和多樣性,使得模型可以最大化項(xiàng)目效用。Liu 等[15]等提出一種公平感知的重排序算法(Fairness-Aware Re-Ranking,F(xiàn)AR)以平衡排名質(zhì)量和供應(yīng)商的公平性,使得來自不同供應(yīng)商的商品有公平的機(jī)會(huì)被推薦。Pei 等[16]提出一個(gè)個(gè)性化的重新排序模型,通過直接使用現(xiàn)有的排序特征向量?jī)?yōu)化整個(gè)推薦列表。Gao等[17]將MMR 模型進(jìn)行改進(jìn),通過在推薦過程中注入隨機(jī)性和多樣性以推廣用戶的興趣,并避免過度個(gè)性化。上述研究在多樣性評(píng)估和用戶滿意度等方面提供了不同的解決方案,但還未從項(xiàng)目流行度的角度切入去研究問題,本文提出的模型不僅能夠滿足用戶的個(gè)性化需求,還能夠兼顧項(xiàng)目的流行度。這種綜合考慮可以幫助推薦系統(tǒng)平衡個(gè)性化推薦和流行度推薦之間的權(quán)衡,既不會(huì)過于偏向熱門項(xiàng)目,也不會(huì)忽視用戶的興趣和偏好。
假設(shè)在一個(gè)推薦任務(wù)中,用戶集合為U={u1,u2,…,uN},|U| 為用戶集合大??;項(xiàng)目集合為I={i1,i2,…,iM},|I|為項(xiàng)目集合大?。籶opulɑrity(i)為項(xiàng)目點(diǎn)擊數(shù)。
通過基線模型得到的用戶u的初始推薦列表為Ru,用戶u對(duì)項(xiàng)目i的初始預(yù)測(cè)分?jǐn)?shù)為Ru,i,Ru,i∈Ru;經(jīng)過重排以后用戶的推薦列表為R*u,用戶對(duì)項(xiàng)目的預(yù)測(cè)分?jǐn)?shù)為。
本文將簡(jiǎn)單介紹Abdollahpouri 等[8]提出的重排序模型。Binary xQuAD 模型不依賴于項(xiàng)目特征,只依賴于項(xiàng)目流行度。補(bǔ)償分?jǐn)?shù)部分是根據(jù)每個(gè)用戶對(duì)長(zhǎng)尾項(xiàng)目的歷史興趣以確定其大小。具體模型為:
其中,λ∈[0,1),為超參數(shù),用來調(diào)節(jié)最終列表的多樣性補(bǔ)償分?jǐn)?shù)大小。H表示熱門項(xiàng)目集合,L表示長(zhǎng)尾項(xiàng)目集合,S是最終排序列表。p(d|u)是用戶歷史評(píng)分項(xiàng)目中屬于類別d的比率,用于衡量不同用戶對(duì)頭部或者長(zhǎng)尾項(xiàng)目的偏好。p(i|d)為指示函數(shù):
在使用Binary xQuAD 模型時(shí),用戶偏好被進(jìn)一步放大,推薦的項(xiàng)目都是滿足用戶興趣的頭部和長(zhǎng)尾項(xiàng)目。這時(shí),推薦的整體多樣性增加,但是用戶個(gè)人的推薦列表中都是相似類型的項(xiàng)目,意味著新穎性的增加可能沒有意義。例如,電子商務(wù)平臺(tái)的推薦任務(wù)總是會(huì)避免向一個(gè)用戶推薦與用戶已經(jīng)購買過的項(xiàng)目屬于同類型的項(xiàng)目。再例如,用戶在視頻網(wǎng)站上觀看了《復(fù)仇者聯(lián)盟》這部電影,進(jìn)而網(wǎng)站推薦給用戶同樣受歡迎的《復(fù)仇者聯(lián)盟2》《復(fù)仇者聯(lián)盟3》等一系列同類電影。從推薦結(jié)果看,推薦準(zhǔn)確度相對(duì)高,覆蓋項(xiàng)目也多,但是用戶不一定滿意這些推薦,即推薦列表中總覆蓋率高并不意味著用戶個(gè)人推薦列表的多樣性也很豐富[13]。相反,推薦給用戶符合其偏好,但流行度相對(duì)較低的電影可能會(huì)激發(fā)用戶好奇心,提升用戶的潛在點(diǎn)擊率。
根據(jù)上述Binary xQuAD 模型,本文同樣針對(duì)項(xiàng)目流行度提出一種新的個(gè)性化重排序(Personalized Re-ranking,PR)模型,旨在保證推薦精度的同時(shí),降低用戶列表內(nèi)的項(xiàng)目相似度。
首先將項(xiàng)目按照流行度進(jìn)行劃分。如圖1 所示,將項(xiàng)目按照點(diǎn)擊數(shù)降序排列,并進(jìn)一步劃分為熱門項(xiàng)目(Head item)、長(zhǎng)尾項(xiàng)目(Longtail item)和冷啟動(dòng)項(xiàng)目(Cold-start item)。由于冷啟動(dòng)項(xiàng)目與用戶的交互記錄太少,模型的預(yù)測(cè)分?jǐn)?shù)不能很好地代表用戶的潛在偏好,這些冷啟動(dòng)項(xiàng)目更應(yīng)該使用基于內(nèi)容和混合的推薦技術(shù)[5],于是模型只針對(duì)熱門和長(zhǎng)尾項(xiàng)目進(jìn)行優(yōu)化。
Fig.1 Item popularity distribution圖1 項(xiàng)目流行度分布
接著,PR 模型將按以下標(biāo)準(zhǔn)對(duì)項(xiàng)目初始得分進(jìn)行重新排序:
其中,p(i|u)為基線模型預(yù)測(cè)用戶u對(duì)項(xiàng)目i的偏好分?jǐn)?shù),代表了推薦準(zhǔn)確度,也代表用戶的潛在偏好。式(3)的后半部分代表多樣性補(bǔ)償。λ∈[0,1),為超參數(shù),用來調(diào)節(jié)最終列表的多樣性補(bǔ)償分?jǐn)?shù)大小。參照Abdollahpouri等[8]的方法,p(i|d)同為指示函數(shù)。
對(duì)于流行度相差較大的項(xiàng)目,例如第一個(gè)頭部項(xiàng)目和最后一個(gè)長(zhǎng)尾項(xiàng)目,兩者的也會(huì)變得相差很大。為了縮小他們之間的流行度差距,將項(xiàng)目的放大:
其中,ɑ滿足以下條件:。
PR 模型的補(bǔ)償分?jǐn)?shù)部分不僅考慮用戶偏好,還更多地考慮項(xiàng)目流行度。根據(jù)式(4),可以在每一次推薦中將不同的長(zhǎng)尾項(xiàng)目同時(shí)推薦給不同的用戶,從而增加推薦的新穎性,給予用戶發(fā)掘新穎項(xiàng)目的機(jī)會(huì)。使得PR 模型能夠更全面地考慮用戶個(gè)性化需求和項(xiàng)目流行度,提供多樣化的推薦結(jié)果。
輸入:用戶u;項(xiàng)目集合I;項(xiàng)目流行度集合populɑrity(I);類別d;推薦列表長(zhǎng)度K。
輸出:目標(biāo)用戶u的TOP-K推薦列表。
Step1:根據(jù)式(4)計(jì)算項(xiàng)目i的,i∈I。
Step2:使用基線模型預(yù)測(cè)用戶u在項(xiàng)目集合I中所有未評(píng)分項(xiàng)目的評(píng)分值,未評(píng)分項(xiàng)目的集合記為,評(píng)分值集合記為按照Ru降序排列。
Step4:根據(jù)式(3)計(jì)算項(xiàng)目i更新后的預(yù)測(cè)評(píng)分,并按照評(píng)分值降序排列,取TOP-K個(gè)項(xiàng)目作為用戶u的最終推薦結(jié)果R*u。
本實(shí)驗(yàn)選擇的第一個(gè)數(shù)據(jù)集是Movielens-1M 數(shù)據(jù)集[18],這是一個(gè)電影數(shù)據(jù)集。此數(shù)據(jù)集中包含用戶個(gè)人基礎(chǔ)信息、電影基礎(chǔ)信息以及用戶對(duì)電影的評(píng)分?jǐn)?shù)據(jù)。數(shù)據(jù)集包含6 040 個(gè)用戶、3 952 部電影、1 000 209 條評(píng)分?jǐn)?shù)據(jù),數(shù)據(jù)稠密度為4.47%。將評(píng)分?jǐn)?shù)據(jù)中從未被用戶評(píng)分過的項(xiàng)目剔除,還剩下3 706 個(gè)項(xiàng)目。首先將數(shù)據(jù)集中評(píng)分次數(shù)小于20 次的項(xiàng)目劃分為冷啟動(dòng)項(xiàng)目,其次按照帕累托原理,將占據(jù)剩余評(píng)分總數(shù)80%的項(xiàng)目劃分為熱門項(xiàng)目,剩下的項(xiàng)目歸類為長(zhǎng)尾項(xiàng)目[5]。按照上述劃分方式,可以得到612 個(gè)熱門項(xiàng)目,評(píng)分次數(shù)均大于506;2 432 個(gè)長(zhǎng)尾項(xiàng)目;931 個(gè)冷啟動(dòng)項(xiàng)目。本實(shí)驗(yàn)選擇的第二個(gè)數(shù)據(jù)集是FilmTrust 數(shù)據(jù)集[19],此數(shù)據(jù)集包含用戶對(duì)電影的評(píng)分?jǐn)?shù)據(jù)和用戶之間的社交信息。在評(píng)分?jǐn)?shù)據(jù)中,共有1 508 個(gè)用戶,2 071 個(gè)項(xiàng)目,35 497 條評(píng)分?jǐn)?shù)據(jù),數(shù)據(jù)稠密度為1.14%。將此數(shù)據(jù)集與Movielens-1M 數(shù)據(jù)集進(jìn)行同樣的劃分,得到36 個(gè)熱門項(xiàng)目,評(píng)分次數(shù)均大于448;50 個(gè)長(zhǎng)尾項(xiàng)目;1 985個(gè)冷啟動(dòng)項(xiàng)目。
對(duì)數(shù)據(jù)進(jìn)行8∶2 劃分,其中80%作為訓(xùn)練集,20%作為測(cè)試集。實(shí)驗(yàn)使用5 折交叉驗(yàn)證,選擇ItemCF 作為基線模型,將本文提出的方法與MMR 進(jìn)行比較。在MMR 中,候選項(xiàng)目集的大小為100,PR 和MMR 的最終的TOP-K列表長(zhǎng)度為10。
實(shí)驗(yàn)采用歸一化折損累計(jì)增益(Normalized Discounted Cumulative Gain,NDCG)、列表內(nèi)多樣性(Intra-List Similarity,ILS)、推薦新穎度(Novelty)、整體多樣性(Aggregate Diversity,Agg_Div)4個(gè)指標(biāo)對(duì)結(jié)果進(jìn)行評(píng)估。
3.2.1 NDCG
該指標(biāo)常用于評(píng)估推薦系統(tǒng)的TOP-K排序質(zhì)量[17],其值越大表示推薦結(jié)果越好。NDCG 來自一個(gè)排序列表內(nèi)所有項(xiàng)目的相關(guān)分?jǐn)?shù)。CG 表示對(duì)列表TOP-K項(xiàng)目的相關(guān)性得分總和,計(jì)算公式為:
其中,rel(i)表示為項(xiàng)目i的相關(guān)性得分。
在此基礎(chǔ)上,若進(jìn)一步考慮項(xiàng)目所處的排序位置,讓排名靠前的項(xiàng)目增益更高,排名靠后的項(xiàng)目得分進(jìn)行折損,得到DCG:
下一步,考慮理想化的項(xiàng)目排序位置得分信息時(shí),即按照rel(i)進(jìn)行降序排序的最好列表位置得分,可以得到IDCG:
其中,|REL|表示理想化的項(xiàng)目排序得分信息,即當(dāng)結(jié)果按相關(guān)性降序排序時(shí),取TOP-K個(gè)結(jié)果所組成的集合。
最后,NDCG 是將其歸一化處理,使得可以比較不同列表上的排名質(zhì)量。
3.2.2 ILS
該指標(biāo)反映單個(gè)用戶推薦列表的多樣性程度[12,20-21]。列表內(nèi)的多樣性反映了單個(gè)用戶推薦列表的整體多樣性程度,當(dāng)推薦列表中項(xiàng)目的類別越多樣化時(shí),ILS 的值越小,即ILS的值越低,個(gè)體多樣性越好。ILS的計(jì)算公式為:
其中,i和j是用戶u推薦列表R*u中的項(xiàng)目。
3.2.3 Novelty
該指標(biāo)可以被分為基于流行度和基于距離兩種[22]。本實(shí)驗(yàn)使用基于流行度(Popularity-Based Item Novelty)的計(jì)算方式,當(dāng)Novelty 的值越低,說明新穎度越高,即列表中出現(xiàn)了越多用戶從未瀏覽過的項(xiàng)目。Novelty 的計(jì)算公式如下:
其中,由于物品的流行度呈長(zhǎng)尾分布,因而取對(duì)數(shù)使得平均值更穩(wěn)定。
3.2.4 Agg_Div
該指標(biāo)用于衡量所有用戶的推薦列表中唯一推薦項(xiàng)的比例[8,12],其值越高,說明整體多樣性越好。Agg_Div 的計(jì)算公式為:
首先,觀察Movielens-1M 數(shù)據(jù)集和FilmTrust 數(shù)據(jù)集在不同λ取值下的NDCG 變化,實(shí)驗(yàn)結(jié)果如圖2所示。
Fig.2 Experimental results of NDCG indicators圖2 NDCG指標(biāo)實(shí)驗(yàn)結(jié)果
根據(jù)不同的λ取值所得的推薦結(jié)果,在Movielens-1M 數(shù)據(jù)集中,PR 模型推薦質(zhì)量在λ=0.6 之后快速下降,MMR 模型的推薦質(zhì)量在λ=0.2 之后開始下降。為了確保推薦質(zhì)量的下降程度在可接受范圍內(nèi),同時(shí)提高推薦結(jié)果多樣性和新穎性,PR 模型選擇λ=0.6、MMR 模型選擇λ=0.2 進(jìn)行下一步實(shí)驗(yàn)。同理,F(xiàn)ilmTrust 數(shù)據(jù)集中PR模型選擇λ=0.7、MMR 模型選擇λ=0.7 進(jìn)行下一步實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果見表1。
Table 1 Experimental results表1 實(shí)驗(yàn)結(jié)果
表1 的實(shí)驗(yàn)結(jié)果中,**表示其結(jié)果沒有通過顯著性檢驗(yàn),關(guān)于隨機(jī)性與基線算法的差異不具有統(tǒng)計(jì)學(xué)意義(Wilcoxon p < 0.05)。表中評(píng)價(jià)指標(biāo)旁的向上箭頭表示較大的值更好,向下箭頭表示較小的值更好。
在推薦系統(tǒng)中,提升個(gè)體多樣性可能會(huì)犧牲整體多樣性。原因在于,為了提供多樣的推薦結(jié)果,系統(tǒng)可能傾向于推薦一些流行度高的項(xiàng)目,而忽視了個(gè)體的特定興趣和偏好。本文提出的PR 模型目標(biāo)在于提升個(gè)體多樣性,而其在Movielens-1M 數(shù)據(jù)集結(jié)果顯示,增加25.24%個(gè)體多樣性的同時(shí)會(huì)損壞1.85%的整體多樣性;在FilmTrust 數(shù)據(jù)集上的結(jié)果顯示,增加13.70%個(gè)體多樣性的同時(shí)會(huì)損壞1.70%的整體多樣性。以上結(jié)果表明,在損失少量整體多樣性的情況下,可以大幅度提高用戶推薦列表的個(gè)體多樣性,在列表中增加很多不同類型的項(xiàng)目,降低推薦列表中的項(xiàng)目與用戶歷史瀏覽項(xiàng)目的相似程度。
在Movielens-1M 數(shù)據(jù)集中,PR 模型在NDCG 指標(biāo)下降3.10%的情況下,ILS 和Novelty 指標(biāo)分別降低了37.85%和1.08%,而MMR 模型的ILS 和Novelty 指標(biāo)不降反增,個(gè)性化推薦效果沒有得到改善。同理,PR 模型在FilmTrust 數(shù)據(jù)集中,在NDCG 指標(biāo)下降17.20%的情況下,ILS 和Novelty 指標(biāo)分別降低13.70%和1.77%,兩個(gè)多樣性度量指標(biāo)下降幅度均比MMR 模型大,在指標(biāo)結(jié)果上具備明顯優(yōu)勢(shì)。說明本文提出的PR 模型能夠有效提高個(gè)體多樣性和推薦新穎性,在改善用戶個(gè)性化推薦列表的同時(shí)保持一定的推薦質(zhì)量,并有效降低推薦列表的流行度,改善熱門項(xiàng)目反復(fù)推薦給不同的用戶而導(dǎo)致推薦效果不顯著的問題。即想要增加推薦的個(gè)體多樣性和新穎性,PR 模型的表現(xiàn)均比MMR 模型好。
綜上分析,本文提出的PR 模型對(duì)推薦結(jié)果的NDCG影響在可接受范圍內(nèi)時(shí),能夠提高推薦結(jié)果的個(gè)體多樣性。因此,PR 模型可以運(yùn)用于推薦同質(zhì)化的情況,有利于提升用戶個(gè)性化列表內(nèi)的多樣性,提升推薦效果。
本文針對(duì)推薦系統(tǒng)的個(gè)性化多樣性問題,提出引入項(xiàng)目流行度,通過調(diào)節(jié)補(bǔ)償分?jǐn)?shù)的大小控制用戶最終TOP-K推薦列表中新穎項(xiàng)目比例的重排序模型,并在公開數(shù)據(jù)集上通過實(shí)驗(yàn)驗(yàn)證了模型的有效性。在未來工作中,可以進(jìn)一步完善該模型的理論驗(yàn)證,并在更廣泛的數(shù)據(jù)集和場(chǎng)景中進(jìn)行應(yīng)用和推廣,不斷提升個(gè)性化推薦系統(tǒng)的效用,并持續(xù)優(yōu)化用戶體驗(yàn)。