范奧哲 何利力
摘 要:針對(duì)傳統(tǒng)協(xié)同過濾推薦算法在大數(shù)據(jù)環(huán)境下存在數(shù)據(jù)稀疏性及計(jì)算復(fù)雜性等問題,提出一種雙向聚類協(xié)同過濾推薦算法。該算法首先從用戶維度和項(xiàng)目維度兩個(gè)方向分別進(jìn)行屬性聚類,然后在目標(biāo)用戶和目標(biāo)項(xiàng)目所在類簇中分別使用改進(jìn)后的相似度計(jì)算方法進(jìn)行協(xié)同過濾推薦,最后通過平衡因子綜合預(yù)測(cè)評(píng)分并形成最終推薦列表。在MovieLens公開數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明,該算法(DCF)相比傳統(tǒng)協(xié)同過濾推薦算法(TCF)、基于用戶聚類的協(xié)同過濾推薦算法(UCF)以及基于項(xiàng)目聚類的協(xié)同過濾推薦算法(ICF),在平均絕對(duì)誤差上分別降低了16%、8.1%、7.5%,有效提高了推薦精度。
關(guān)鍵詞:協(xié)同過濾推薦算法;數(shù)據(jù)稀疏性;聚類;推薦系統(tǒng)
DOI:10. 11907/rjdk. 191963 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
中圖分類號(hào):TP312文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2020)005-0078-05
0 引言
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,各種信息呈爆炸式增長(zhǎng),人類進(jìn)入信息超載時(shí)代。面對(duì)海量信息,如何從中找到自己想要的內(nèi)容成為一個(gè)亟需解決的問題。目前人們可通過搜索引擎尋找自己感興趣的內(nèi)容,從一定程度上解決了信息超載問題,但搜索引擎仍不能完全滿足人們的個(gè)性化需求,存在較大局限性,因此推薦系統(tǒng)[1]應(yīng)運(yùn)而生。推薦系統(tǒng)作為一種有效的信息過濾手段,是解決信息超載問題及實(shí)現(xiàn)個(gè)性化推薦的重要方式。
推薦系統(tǒng)的核心內(nèi)容是推薦算法,常用推薦算法有基于協(xié)同過濾的推薦算法、基于內(nèi)容的推薦算法與混合推薦算法[2-3]。其中協(xié)同過濾(Collaborative-Filtering,CF)推薦算法應(yīng)用最為廣泛,根據(jù)用戶歷史行為信息即可完成推薦。協(xié)同過濾推薦算法根據(jù)對(duì)象不同可分為兩類:基于用戶或基于項(xiàng)目的協(xié)同過濾[4]。其中,基于用戶的協(xié)同過濾是通過尋找目標(biāo)用戶的相似用戶,將相似用戶的相關(guān)喜好推薦給目標(biāo)用戶;基于項(xiàng)目的協(xié)同過濾是通過計(jì)算項(xiàng)目間的相似度,將相似項(xiàng)目推薦給喜歡當(dāng)前項(xiàng)目的用戶[5]。其共同特點(diǎn)是計(jì)算用戶或項(xiàng)目之間的相似度,因此相似度計(jì)算在協(xié)同過濾推薦中起著至關(guān)重要的作用。但是隨著大數(shù)據(jù)時(shí)代的到來,傳統(tǒng)協(xié)同過濾推薦算法難以解決大數(shù)據(jù)環(huán)境帶來的數(shù)據(jù)稀疏性、計(jì)算復(fù)雜性等問題[6]。
針對(duì)以上問題,研究人員提出了一系列解決方案。例如,胡朝舉[7]、許智宏等[8]將基于用戶的模糊聚類應(yīng)用到協(xié)同過濾推薦算法中,將用戶劃分到不同用戶簇中,使同一簇中用戶相似度最高,并在同一簇中進(jìn)行協(xié)同過濾推薦。聚類的引入降低了數(shù)據(jù)稀疏性和計(jì)算復(fù)雜性,并提高了推薦精度;張林等[9]將基于項(xiàng)目的聚類思想引入?yún)f(xié)同過濾推薦算法中,充分挖掘用戶對(duì)項(xiàng)目類的興趣度以及項(xiàng)目在類中的權(quán)重關(guān)系,提高了推薦效果。然而,以上基于聚類的協(xié)同過濾推薦算法都只考慮了用戶屬性或項(xiàng)目屬性單方面聚類對(duì)推薦的影響,而沒有同時(shí)考慮用戶屬性和項(xiàng)目屬性雙向聚類對(duì)推薦結(jié)果的影響。還有一些學(xué)者為提高推薦精度,將研究方向放在對(duì)相似度的改進(jìn)上。如任看看等[10]對(duì)Jaccard相似性進(jìn)行改進(jìn),在相似度計(jì)算中充分考慮共同評(píng)分項(xiàng)與所有評(píng)分項(xiàng)之間的關(guān)系,以及用戶評(píng)分差異對(duì)相似度計(jì)算的影響,最終得到較為精確的推薦結(jié)果;孟俊才等[11]在相似度計(jì)算中提出平均分懲罰機(jī)制和共同評(píng)分項(xiàng)懲罰機(jī)制,對(duì)缺失的項(xiàng)目評(píng)分進(jìn)行計(jì)算,提高了推薦準(zhǔn)確性。但在傳統(tǒng)相似度計(jì)算方法中,通常只考慮評(píng)分值或評(píng)分項(xiàng)單方面對(duì)相似度計(jì)算造成的影響,該方式顯然是片面的,無法準(zhǔn)確描述出其之間的相似關(guān)系。因此,本文首先對(duì)用戶屬性和項(xiàng)目屬性分別進(jìn)行聚類分析,然后在相應(yīng)類簇中使用改進(jìn)后的相似度計(jì)算方法對(duì)二者分別進(jìn)行預(yù)測(cè)評(píng)分,最后通過平衡因子綜合預(yù)測(cè)評(píng)分,并形成最終推薦列表。實(shí)驗(yàn)結(jié)果表明,該算法降低了數(shù)據(jù)稀疏性和計(jì)算復(fù)雜性,并提高了推薦精度。
1 傳統(tǒng)協(xié)同過濾推薦算法
傳統(tǒng)協(xié)同過濾推薦算法[12]是指根據(jù)數(shù)據(jù)集構(gòu)建用戶—項(xiàng)目評(píng)分矩陣,計(jì)算目標(biāo)用戶與其他用戶之間的相似度,并根據(jù)相似度尋找最近鄰居集合,最終為目標(biāo)用戶預(yù)測(cè)評(píng)分產(chǎn)生推薦列表的過程。其實(shí)現(xiàn)過程可分為如下3個(gè)步驟:
1.1 用戶—項(xiàng)目評(píng)分矩陣構(gòu)建
根據(jù)用戶對(duì)項(xiàng)目的評(píng)分信息能夠構(gòu)建出用戶—項(xiàng)目評(píng)分矩陣[Rm×n],如表1所示。其中m行、n列分別表示用戶數(shù)和項(xiàng)目數(shù),矩陣值[Rm×n]表示某個(gè)用戶對(duì)某項(xiàng)目的評(píng)分值,評(píng)分值通常與評(píng)分項(xiàng)目類別有關(guān)。例如在電影推薦中,評(píng)分值通常用整數(shù)表示,范圍是1~5分,當(dāng)沒有評(píng)分信息時(shí)用0填充。
1.2 尋找最近鄰居
尋找最近鄰居是指通過計(jì)算用戶或項(xiàng)目之間的相似度,選取與目標(biāo)用戶相似度最大的N個(gè)用戶作為目標(biāo)用戶的最近鄰居。其中相似度計(jì)算是協(xié)同過濾算法最核心的內(nèi)容,目前廣泛使用的相似度計(jì)算方法有余弦相似性、Jaccard相似性、Pearson相似性,其中最常用的是Jaccard相似性和Pearson相似性[13]。
Jaccard相似性:Jaccard相似性通常表示為樣本集合中公共部分在所有樣本集合中所占比重,在推薦算法中兩個(gè)用戶的相似度計(jì)算公式如式(1)所示。
1.3 預(yù)測(cè)評(píng)分產(chǎn)生推薦
根據(jù)前面得到鄰居用戶對(duì)目標(biāo)項(xiàng)目的評(píng)分,預(yù)測(cè)目標(biāo)用戶對(duì)該項(xiàng)目的評(píng)分值,產(chǎn)生最終推薦列表。其計(jì)算公式如式(3)所示。
其中,[Pu,i]表示目標(biāo)用戶[u]對(duì)項(xiàng)目[i]的預(yù)測(cè)評(píng)分值,[Ru]、[Rv]表示用戶[u]、[v]對(duì)項(xiàng)目的平均評(píng)分值,[Rv,i]表示目標(biāo)用戶[u]最近鄰居集中用戶[v]對(duì)項(xiàng)目[i]的評(píng)分,[N]表示目標(biāo)用戶最近鄰居的用戶個(gè)數(shù)。
通過以上對(duì)傳統(tǒng)協(xié)同過濾推薦算法的分析可知,相似度計(jì)算在推薦過程中起著至關(guān)重要的作用,并且傳統(tǒng)協(xié)同過濾推薦算法中并沒有考慮用戶屬性和項(xiàng)目屬性聚類對(duì)相似度計(jì)算的影響。因此,本文提出一種基于用戶屬性和項(xiàng)目屬性雙向聚類及改進(jìn)相似度計(jì)算的協(xié)同過濾推薦算法。
2 雙向聚類協(xié)同過濾推薦算法
2.1 基于用戶與項(xiàng)目的屬性聚類
在大數(shù)據(jù)背景下,由于用戶對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù)過少,導(dǎo)致用戶—項(xiàng)目評(píng)分矩陣過于稀疏,從而影響了用戶或項(xiàng)目相似度計(jì)算的精確度。同時(shí)隨著用戶和項(xiàng)目規(guī)模的不斷擴(kuò)大,其計(jì)算復(fù)雜度也在不斷增加,對(duì)于具有m個(gè)用戶、n個(gè)項(xiàng)目的用戶—項(xiàng)目評(píng)分矩陣而言,傳統(tǒng)協(xié)同過濾推薦算法的時(shí)間復(fù)雜度為[O(n*m*m)][14]。因此,為了降低數(shù)據(jù)稀疏性與計(jì)算復(fù)雜性,利用聚類技術(shù)對(duì)原始數(shù)據(jù)進(jìn)行聚類預(yù)處理是優(yōu)化推薦結(jié)果的常用策略之一。通過聚類技術(shù)將用戶和項(xiàng)目根據(jù)屬性信息分別聚類到若干個(gè)類簇中,使得同一類簇中的用戶或項(xiàng)目相似度最高,而不同類簇中的相似度最低,從而將最近鄰居選擇縮小到對(duì)應(yīng)類簇中,降低相似度計(jì)算的復(fù)雜性。
針對(duì)用戶屬性和項(xiàng)目屬性,在進(jìn)行聚類前,需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。例如在用戶屬性中考慮年齡、性別、職業(yè)等,將年齡定義為數(shù)值類型表示,性別用0或1分別表示女性或男性,職業(yè)定義為標(biāo)稱型數(shù)據(jù),使用數(shù)值標(biāo)號(hào)的形式進(jìn)行標(biāo)準(zhǔn)化[15]。通過該形式的預(yù)處理,可得到用戶屬性表達(dá)形式為User={23,1,11},即年齡為23歲從事軟件開發(fā)的男性。同理可得項(xiàng)目屬性標(biāo)準(zhǔn)化處理后的表達(dá)形式。
傳統(tǒng)基于用戶或基于項(xiàng)目聚類的協(xié)同過濾推薦算法,僅從某個(gè)方向進(jìn)行單向聚類,在一定程度上降低了數(shù)據(jù)稀疏性對(duì)相似度計(jì)算的影響,但這種考慮是不夠全面的。為了解決這一問題,本文提出基于雙向的屬性聚類分析,分別從用戶維度和項(xiàng)目維度兩個(gè)方向進(jìn)行屬性聚類,然后分別進(jìn)行協(xié)同過濾推薦,從而進(jìn)一步提高推薦精準(zhǔn)度。本文采用使用廣泛且計(jì)算簡(jiǎn)單的K-means聚類算法,分別從用戶和項(xiàng)目?jī)蓚€(gè)維度進(jìn)行聚類。K-means聚類[15]基本思想是首先在數(shù)據(jù)源中選擇K個(gè)點(diǎn)作為初始聚類中心,然后計(jì)算數(shù)據(jù)源中其它點(diǎn)到所有初始聚類中心的距離,將距離近的用戶劃分到對(duì)應(yīng)簇中,計(jì)算簇中所有元素平均值作為當(dāng)前簇新的聚類中心,如此迭代,直到所有簇的聚類中心不再變化,輸出聚類后的結(jié)果。該算法時(shí)間復(fù)雜度為[O(m*k*t)],其中m代表數(shù)據(jù)源中的元素個(gè)數(shù),k代表聚類中心個(gè)數(shù),t代表迭代次數(shù)[15]?;谟脩舻腒-means聚類算法流程如圖1所示,同理可得基于項(xiàng)目的K-means聚類。
2.2 相似度計(jì)算方法改進(jìn)
由于相似度計(jì)算在推薦算法中的核心地位,其計(jì)算準(zhǔn)確性將直接影響推薦質(zhì)量。傳統(tǒng)Pearson相似性是根據(jù)兩個(gè)用戶共同評(píng)分項(xiàng)目的集合計(jì)算不同用戶之間的差異[16-17],在計(jì)算兩個(gè)用戶相似度時(shí)忽略了平均值差異,并且沒有考慮用戶對(duì)一些相同項(xiàng)目評(píng)分所占比重對(duì)相似度計(jì)算的影響,從而影響了最終推薦結(jié)果。例如用戶A、B共同購(gòu)買了10件商品,但他們沒有給出相似評(píng)分,用戶A、C共同購(gòu)買了3件商品,但他們給出了相同或相似評(píng)分。通過Pearson相似性計(jì)算,A、B之間的相似度小于A、C之間的相似度,而事實(shí)上A、B的相似度明顯大于A、C的相似度,在需求比較嚴(yán)謹(jǐn)?shù)那闆r下應(yīng)該避免此類問題產(chǎn)生。傳統(tǒng)Jaccard相似性主要根據(jù)用戶共同評(píng)分項(xiàng)目在所有評(píng)分項(xiàng)目中所占比重計(jì)算相似度,并沒有考慮用戶實(shí)際評(píng)分值對(duì)相似度計(jì)算的影響。
2.3 預(yù)測(cè)評(píng)分產(chǎn)生推薦
通過改進(jìn)相似度計(jì)算,得到目標(biāo)用戶的最近鄰居集合,并據(jù)此預(yù)測(cè)目標(biāo)用戶對(duì)未評(píng)分項(xiàng)的評(píng)分,最后進(jìn)行個(gè)性化推薦。利用上述改進(jìn)的相似度計(jì)算方法,本文將綜合用戶和項(xiàng)目?jī)蓚€(gè)維度的協(xié)同過濾,在兩個(gè)方向進(jìn)行預(yù)測(cè)評(píng)分,然后通過平衡因子綜合預(yù)測(cè)評(píng)分,形成最終推薦列表,如式(6)所示。
其中,[Pu]表示在用戶維度進(jìn)行K-means聚類后的預(yù)測(cè)評(píng)分,[Pi]表示在項(xiàng)目維度進(jìn)行K-means聚類后的預(yù)測(cè)評(píng)分,[λ(0<λ<1)]為平衡因子,通過上式可得到綜合的預(yù)測(cè)評(píng)分[P]。該公式具體含義是從用戶和項(xiàng)目?jī)蓚€(gè)方向進(jìn)行預(yù)測(cè)評(píng)分,然后加權(quán)求和,通過動(dòng)態(tài)調(diào)整[λ]的值,以平衡用戶和項(xiàng)目?jī)蓚€(gè)方向?qū)︻A(yù)測(cè)評(píng)分的影響。通過上式可知,當(dāng)[λ]=1時(shí),變?yōu)閷?duì)用戶維度單項(xiàng)聚類的協(xié)同過濾推薦,當(dāng)[λ]=0時(shí),變?yōu)閷?duì)項(xiàng)目維度單項(xiàng)聚類的協(xié)同過濾推薦。實(shí)際應(yīng)用中應(yīng)該動(dòng)態(tài)調(diào)整[λ]的值,同時(shí)考慮兩個(gè)維度的預(yù)測(cè)值,使綜合預(yù)測(cè)評(píng)分獲得最優(yōu)解,最終產(chǎn)生精準(zhǔn)推薦。
2.4 改進(jìn)后算法描述
本文提出一種基于雙向聚類的協(xié)同過濾推薦算法,具體過程如下:首先通過用戶歷史行為數(shù)據(jù)構(gòu)建用戶—項(xiàng)目評(píng)分矩陣,其次從用戶和項(xiàng)目?jī)蓚€(gè)維度分別使用K-means聚類算法進(jìn)行用戶聚類和項(xiàng)目聚類,然后使用改進(jìn)的相似度計(jì)算方法分別計(jì)算兩個(gè)維度的預(yù)測(cè)評(píng)分,最后通過平衡因子動(dòng)態(tài)調(diào)整綜合預(yù)測(cè)評(píng)分,并產(chǎn)生推薦列表。具體推薦流程如圖2所示。
3 實(shí)驗(yàn)與分析
3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)估指標(biāo)
本文采用美國(guó)明尼蘇達(dá)大學(xué)GroupLens實(shí)驗(yàn)室收集整理的MovieLens公開電影評(píng)分?jǐn)?shù)據(jù)集,該數(shù)據(jù)集包含了用戶屬性信息、電影屬性信息、用戶對(duì)電影評(píng)分信息等。實(shí)驗(yàn)所用評(píng)分信息包含943名用戶對(duì)1 682部電影產(chǎn)生的100 000條評(píng)分記錄,其中每位用戶至少對(duì)其中20部電影進(jìn)行了打分,評(píng)分范圍為1~5分,評(píng)分越高表示用戶對(duì)該電影喜愛程度越高。為驗(yàn)證本文算法的優(yōu)越性,將訓(xùn)練集和測(cè)試集比例設(shè)為4∶1,進(jìn)行交叉重復(fù)實(shí)驗(yàn),訓(xùn)練集用于訓(xùn)練算法中的相關(guān)參數(shù),測(cè)試集用于驗(yàn)證算法準(zhǔn)確性。
在推薦系統(tǒng)中評(píng)價(jià)推薦結(jié)果的指標(biāo)有多種,其中廣泛使用的是平均絕對(duì)誤差MAE(Mean AbsoluteError),其是通過計(jì)算預(yù)測(cè)值與實(shí)際值之間的平均絕對(duì)誤差得到的,平均絕對(duì)誤差的值越小,表示推薦結(jié)果越好[18-20]。若用戶預(yù)測(cè)評(píng)分集合為[p={p1,p2,?,pn}],用戶實(shí)際評(píng)分集合為[q={q1,][q2,?,qn}],則MAE表達(dá)式如式(7)所示。
3.2 實(shí)驗(yàn)方案與結(jié)果分析
本文通過3個(gè)實(shí)驗(yàn)方案驗(yàn)證提出算法的優(yōu)越性,通過前兩個(gè)實(shí)驗(yàn)動(dòng)態(tài)調(diào)整聚類中心K和平衡因子[λ],使其達(dá)到最佳推薦效果。在最佳參數(shù)條件下,驗(yàn)證本文算法相比傳統(tǒng)協(xié)同過濾推薦算法的優(yōu)越性。
實(shí)驗(yàn)1:在基于用戶或基于項(xiàng)目的K-means聚類協(xié)同過濾推薦算法中,選用不同K值產(chǎn)生的聚類效果是不一樣的,最終導(dǎo)致推薦結(jié)果也不同。為了驗(yàn)證不同K值對(duì)推薦結(jié)果的影響,本文通過實(shí)驗(yàn)動(dòng)態(tài)調(diào)整K值,選擇最佳參數(shù)。實(shí)驗(yàn)結(jié)果如圖3、圖4所示。
通過實(shí)驗(yàn)可以看出,聚類中心K的選擇對(duì)推薦結(jié)果有著直接影響,過多或過少的聚類數(shù)目都會(huì)引起MAE值升高。從圖中可以看到,當(dāng)K=10時(shí),基于用戶聚類的協(xié)同過濾推薦達(dá)到最佳效果,當(dāng)K=30時(shí),基于項(xiàng)目聚類的協(xié)同過濾推薦達(dá)到最佳效果。
實(shí)驗(yàn)2:平衡因子是確定基于用戶和項(xiàng)目雙向聚類預(yù)測(cè)評(píng)分,綜合獲取最終推薦的重要因素。因此,本文選取[λ]為0.1~0.9之間的數(shù)值,通過綜合評(píng)估獲取最佳參數(shù)。實(shí)驗(yàn)中選取的聚類數(shù)目分別為K=10和K=30,最終得到的實(shí)驗(yàn)結(jié)果如圖5所示。
通過以上實(shí)驗(yàn)可以看到,當(dāng)[λ]=0.4時(shí)MAE值最小,此時(shí)協(xié)同過濾推薦達(dá)到最佳效果,因此將[λ]的值設(shè)為0.4。
實(shí)驗(yàn)3:為了驗(yàn)證雙向聚類協(xié)同過濾推薦算法的精準(zhǔn)度,將本文算法命名為DCF,與其它3種算法進(jìn)行對(duì)比實(shí)驗(yàn)。3種算法分別為傳統(tǒng)協(xié)同過濾推薦算法TCF、基于用戶聚類的改進(jìn)相似度協(xié)同過濾推薦算法UCF、基于項(xiàng)目聚類的改進(jìn)相似度協(xié)同過濾推薦算法ICF,實(shí)驗(yàn)結(jié)果如圖6所示。
通過以上實(shí)驗(yàn)可以看出,本文提出算法的MAE值在全局范圍內(nèi)明顯小于其它3種協(xié)同過濾推薦算法,其中傳統(tǒng)協(xié)同過濾推薦算法的MAE值最大,而基于用戶或基于項(xiàng)目聚類的改進(jìn)相似度協(xié)同過濾推薦算法MAE值略小,其兩者之間相差不大。在數(shù)值方面,基于雙向聚類的協(xié)同過濾推薦算法相比傳統(tǒng)協(xié)同過濾推薦算法的平均絕對(duì)誤差降低了16%,相比基于用戶聚類的協(xié)同過濾推薦算法降低了8.1%,相比基于項(xiàng)目聚類的協(xié)同過濾推薦算法降低了7.5%,從而證明了本文提出雙向聚類協(xié)同過濾推薦算法的準(zhǔn)確性。
4 結(jié)語
針對(duì)傳統(tǒng)協(xié)同過濾推薦算法在大數(shù)據(jù)環(huán)境下存在的數(shù)據(jù)稀疏性、計(jì)算復(fù)雜性等問題,提出一種基于雙向聚類的協(xié)同過濾推薦算法。該算法首先從用戶維度和項(xiàng)目維度兩個(gè)方向分別進(jìn)行屬性聚類,然后利用改進(jìn)的相似度計(jì)算方法分別產(chǎn)生各自的預(yù)測(cè)評(píng)分,通過平衡因子綜合預(yù)測(cè)評(píng)分形成最終推薦列表。最后通過實(shí)驗(yàn)得出,本文提出的推薦算法相比傳統(tǒng)協(xié)同過濾推薦算法的平均絕對(duì)誤差降低了16%,提高了推薦精度。然而,該算法雖然在很大程度上提高了推薦精度,但仍然存在一定提升空間,后續(xù)研究還可以考慮其它聚類算法對(duì)推薦結(jié)果的影響等。
參考文獻(xiàn):
[1] SCHAFER J B,KONSTAN J A,RIEDL J. Recommender systems in E-Commerce[C]. In:ACM Conference on Electronic Commerce(EC99),1999:158-166.
[2] 黃立威,江碧濤,呂守業(yè),等. 基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 計(jì)算機(jī)學(xué)報(bào),2018,41(7):1619-1647.
[3] 孫輝,馬躍,楊海波,等. 一種相似度改進(jìn)的用戶聚類協(xié)同過濾推薦算法[J]. 小型微型計(jì)算機(jī)系統(tǒng),2014,35(9):1967-1970.
[4] 王鵬,王晶晶,俞能海. 基于核方法的User-Based協(xié)同過濾推薦算法[J]. 計(jì)算機(jī)研究與發(fā)展,2013,50(7):1444-1451.
[5] 關(guān)志芳,孟海東. 融合用戶聚類與項(xiàng)目聚類的加權(quán)Slope One算法[J]. 控制工程,2018,25(7):1297-1302.
[6] 楊豐瑞,鄭云俊,張昌. 結(jié)合概率矩陣分解的混合型推薦算法[J]. 計(jì)算機(jī)應(yīng)用,2018,38(3):644-649.
[7] 胡朝舉,孫克逆. 基于用戶模糊聚類的個(gè)性化推薦研究[J]. 軟件導(dǎo)刊,2018,17(2):31-34.
[8] 許智宏,田雨,閆文杰,等. 基于模糊聚類和改進(jìn)混合蛙跳的協(xié)同過濾推薦[J]. 計(jì)算機(jī)應(yīng)用研究,2018,35(10):2908-2911.
[9] 張林,王曉東,姚宇. 基于項(xiàng)目聚類和時(shí)間因素改進(jìn)的推薦算法[J]. 計(jì)算機(jī)應(yīng)用,2016,36(S2):235-238.
[10] 任看看,錢雪忠. 協(xié)同過濾算法中的用戶相似性度量方法研究[J]. 計(jì)算機(jī)工程,2015,41(8):18-22,31.
[11] 孟俊才,李存志. 基于改進(jìn)相似度計(jì)算方法的協(xié)同過濾算法[J]. 電子技術(shù)與軟件工程,2018(24):151-152.
[12] 王巧,謝穎華,于世彩. 結(jié)合用戶聚類和項(xiàng)目類型的協(xié)同過濾算法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用,2016,25(12):132-137.
[13] 黃正. 面向數(shù)據(jù)稀疏的協(xié)同過濾推薦算法研究與優(yōu)化[D]. 廣州:華南理工大學(xué),2012.
[14] 項(xiàng)亮. 推薦系統(tǒng)實(shí)戰(zhàn)[M]. 北京:人民郵電出版社,2012.
[15] 申晉祥,鮑美英. 基于用戶聚類與項(xiàng)目劃分的優(yōu)化推薦算法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(6):159-164.
[16] 于金霞,臧利明,王俊峰,等. 一種改進(jìn)相似度的協(xié)同過濾算法[J]. 河南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2019,38(2):116-121.
[17] 李榮,李明奇,郭文強(qiáng). 基于改進(jìn)相似度的協(xié)同過濾算法研究[J]. ?計(jì)算機(jī)科學(xué),2016,43(12): 206-208,240
[18] WEI Z. Optimization collaborative filtering recommendation algorithm based on ratings consistent[C]. The Institute of Electrical and Electronics Engineers,IEEE Beijing,2016:1055-1058.
[19] PAPAGELIS M,PLEXOUSAKIS D. Qualitative analysis of user- based and item-based prediction algorithms for recommendation agents[J]. Engineering Applications of Artificial Intelligence,2005, 18(7):781-789.
[20] 翁小蘭,王志堅(jiān). 協(xié)同過濾推薦算法研究進(jìn)展[J]. 計(jì)算機(jī)工程與應(yīng)用,2018,54(1):25-31.
(責(zé)任編輯:黃 ?。?/p>