周蘭鳳,麻雙克,付正,張晴
(上海應(yīng)用技術(shù)大學(xué)計(jì)算機(jī)科學(xué)與信息工程學(xué)院,上海201418)
基于復(fù)雜屬性商品的混合協(xié)同過(guò)濾推薦模型
周蘭鳳,麻雙克,付正,張晴
(上海應(yīng)用技術(shù)大學(xué)計(jì)算機(jī)科學(xué)與信息工程學(xué)院,上海201418)
協(xié)同過(guò)濾作為應(yīng)用最廣、研究最多的推薦算法,但依舊面臨數(shù)據(jù)稀疏性、冷啟動(dòng)、數(shù)據(jù)質(zhì)量差等固有問(wèn)題,同時(shí)也鮮有研究者從實(shí)用角度基于商品性價(jià)比方面提高預(yù)測(cè)精確度.為此,本文綜合考慮用戶主觀評(píng)分和商品客觀評(píng)分,并在此基礎(chǔ)上結(jié)合情境預(yù)過(guò)濾、社會(huì)網(wǎng)絡(luò)理論以及專家意見(jiàn)提出了一種混合協(xié)同過(guò)濾推薦模型,在一定程度上緩解了上述缺點(diǎn).并通過(guò)真實(shí)網(wǎng)上汽車(chē)銷(xiāo)售數(shù)據(jù)實(shí)驗(yàn),表明該模型相對(duì)傳統(tǒng)協(xié)同過(guò)濾具有更高的預(yù)測(cè)精度,更適用于具有復(fù)雜屬性的商品.
協(xié)同過(guò)濾;情境;復(fù)雜屬性;個(gè)性化推薦
電子商務(wù)的發(fā)展,使得協(xié)同過(guò)濾推薦迅速應(yīng)用于信息過(guò)濾和信息推薦系統(tǒng)中,并成為該領(lǐng)域的研究熱點(diǎn),主要根據(jù)用戶的相似性來(lái)產(chǎn)生推薦[1].隨著電子商務(wù)服務(wù)范圍的擴(kuò)大,項(xiàng)目評(píng)分的維度急劇增大且用戶歷史數(shù)據(jù)呈極端稀疏性.基于此,研究者提出了大量的解決方案,像基于關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)[2]、聚類(lèi)[3]、貝葉斯網(wǎng)絡(luò)[4]、時(shí)序[5]基于用戶相似度的推薦;基于標(biāo)簽[6-7]、分類(lèi)[8],但是,這些研究均基于用戶之間的相似度作推薦,沒(méi)有考慮商品性價(jià)比問(wèn)題,同時(shí),也沒(méi)有考慮用戶惡意評(píng)分給推薦準(zhǔn)確度帶來(lái)的影響.因此,如何排除用戶惡意評(píng)分影響,盡量向目標(biāo)用戶推薦符合其興趣的高性價(jià)比商品成為電子商務(wù)市場(chǎng)亟待解決的問(wèn)題之一.
基于此,本文提出一種基于復(fù)雜屬性商品的混合協(xié)同過(guò)濾推薦模型,該模型通過(guò)情景分類(lèi)解決用戶數(shù)據(jù)的極度稀疏性,綜合考慮用戶對(duì)商品的屬性評(píng)分和商品屬性客觀評(píng)分,在盡量體現(xiàn)用戶偏好的基礎(chǔ)上克服網(wǎng)絡(luò)水軍的惡意評(píng)分,同時(shí)模型通過(guò)社會(huì)網(wǎng)絡(luò)理論和專家意見(jiàn)來(lái)克服傳統(tǒng)計(jì)算用戶相似度不能向用戶推薦高性價(jià)比商品的弊端.
協(xié)同過(guò)濾推薦是目前應(yīng)用比較廣,研究比較多的算法之一,也被稱為社會(huì)過(guò)濾,其基本思想認(rèn)為:具有相似興趣、愛(ài)好的用戶,也具有相似的信息、商品需求.主要分為基于用戶和基于項(xiàng)目?jī)深?lèi).前者認(rèn)為若兩個(gè)用戶的愛(ài)好相似,則其目標(biāo)評(píng)分也應(yīng)該相似,后者認(rèn)為用戶過(guò)去喜歡的商品和現(xiàn)在喜歡的商品類(lèi)似.
因此,其通過(guò)計(jì)算用戶或商品評(píng)分之間的相似性,尋找最近鄰居,然后綜合鄰居評(píng)分得到預(yù)測(cè)評(píng)分,進(jìn)而為目標(biāo)用戶提供推薦,其推薦的個(gè)性化程度比較高.也正是因?yàn)槿绱?協(xié)同過(guò)濾從用戶瀏覽、購(gòu)買(mǎi)、評(píng)分等歷史信息中分析用戶的偏好,不需要用戶的直接輸入,減少了用戶的負(fù)擔(dān).
其最近鄰的選擇主要有余弦相似度和修正的余弦相似度兩類(lèi).設(shè)評(píng)分項(xiàng)目集合由n個(gè)項(xiàng)目組成,項(xiàng)目c是其中一個(gè),Ri,c表示用戶i對(duì)評(píng)分項(xiàng)目集合中的項(xiàng)目c的評(píng)分,I、J分別表示第I個(gè)和第J個(gè)項(xiàng)目,表示用戶i的所有評(píng)分的均值,則兩種最近鄰的選擇公式為
Lemire和Maclachlan于2005年提出了一種新的算法[9]—–SlopeOne,該算法的優(yōu)點(diǎn)是計(jì)算復(fù)雜度低、精確率比較高,不再基于相似性做預(yù)測(cè),而是利用線性回歸模型做預(yù)測(cè).該算法利用均值來(lái)代替未知項(xiàng)目之間的差異
其中,Ui,j表示同時(shí)對(duì)項(xiàng)目Ii和項(xiàng)目Ij評(píng)分的用戶集合,ui表示用戶u對(duì)項(xiàng)目Ii的評(píng)分, uj表示用戶u對(duì)項(xiàng)目Ij的評(píng)分,|Ui,j|表示同時(shí)對(duì)項(xiàng)目Ii和項(xiàng)目Ij評(píng)分的用戶個(gè)數(shù).devi,j表示項(xiàng)目Ii和項(xiàng)目Ij之間的平均偏差.
在現(xiàn)實(shí)中,商品屬性繁多的商品往往是較為貴重的商品,因此用戶在購(gòu)買(mǎi)之前往往會(huì)交流彼此的心得體會(huì)以及購(gòu)物經(jīng)驗(yàn),這種經(jīng)驗(yàn)交流往往會(huì)對(duì)目標(biāo)用戶商品的選擇,產(chǎn)生直接或間接的影響[10],然而傳統(tǒng)的協(xié)同過(guò)濾往往是過(guò)于強(qiáng)調(diào)用戶間興趣的相似性,而忽視了用戶特征以及商品屬性對(duì)用戶選擇的影響.
為解決該問(wèn)題,Yuan等[11]和Ding等[12]認(rèn)為社會(huì)網(wǎng)絡(luò)可以用來(lái)描述用戶間的交互行為;鄧曉懿等[13]提出了基于情境聚類(lèi)和用戶評(píng)級(jí)的協(xié)同過(guò)濾推薦模型,通過(guò)引入情境因素和用戶評(píng)級(jí)有效地解決了數(shù)據(jù)稀疏性和評(píng)分?jǐn)?shù)據(jù)高維化的問(wèn)題;Ma等[14]提出了一種結(jié)合項(xiàng)目評(píng)分和用戶評(píng)分的混合推薦算法來(lái)緩解矩陣的稀疏性.
盡管這些研究其結(jié)果性能均優(yōu)于傳統(tǒng)的協(xié)同過(guò)濾算法.但是,由于基于用戶的協(xié)同過(guò)濾算法僅僅是根據(jù)用戶相似度進(jìn)行推薦的,就比較容易產(chǎn)生“特殊化”的問(wèn)題,也就是說(shuō),僅僅是考慮了用戶間的關(guān)系,沒(méi)有考慮用戶評(píng)分的準(zhǔn)確性,即沒(méi)有考慮用戶是不是隨意寫(xiě)的評(píng)分,或者是不是“網(wǎng)絡(luò)水軍”.
針對(duì)以上問(wèn)題,本文在對(duì)情境因素進(jìn)行分類(lèi)的基礎(chǔ)上,提出了一個(gè)基于用戶評(píng)級(jí)的協(xié)同過(guò)濾推薦算法,模型基本框架如圖1所示.模型首先利用用戶注冊(cè)獲得用戶的愛(ài)好和部分情境信息,構(gòu)建用戶愛(ài)好矩陣,以解決協(xié)同過(guò)濾推薦算法所面臨的冷啟動(dòng)問(wèn)題;其次利用情境信息和傳統(tǒng)分類(lèi)對(duì)用戶愛(ài)好矩陣進(jìn)行分類(lèi),以減小計(jì)算量;再次,引入社會(huì)網(wǎng)絡(luò)和建立評(píng)級(jí)模型以解決稀疏性問(wèn)題并分析用戶間的愛(ài)好關(guān)系,找到相似性最高的N個(gè)用戶及其評(píng)價(jià)的K個(gè)商品;最后利用“專家意見(jiàn)”對(duì)K個(gè)商品進(jìn)行篩選,選出性能最好的商品.這里的“愛(ài)好”或者“偏好”是指用戶對(duì)已購(gòu)買(mǎi)商品或者理想商品各個(gè)屬性的評(píng)分.
圖1 模型基本框架Fig.1 The basic framework of the model
本文將情境因素分為兩種:用戶情境和環(huán)境情境.用戶情境包括用戶的年齡、職業(yè)和性別,用三元組表示,如公式(4)所示,其中,年齡集合分為6個(gè)年齡段,即20歲以下、21–25歲、26–30歲、30–40歲、40–50歲、50歲以上;性別集合由0和1構(gòu)成,分別代表男性和女性;職業(yè)分為20種不同類(lèi)型,如工人、推銷(xiāo)員、分析師、學(xué)生等等.具體公式為
環(huán)境情境則包括價(jià)格、目的、地點(diǎn)、時(shí)間等4種屬性,如公式(5)所示,具體類(lèi)別則需根據(jù)實(shí)際數(shù)據(jù)進(jìn)行量化.最后,根據(jù)情境因素將用戶劃分為不同類(lèi)別,以使相同類(lèi)別內(nèi)用戶具有較高相似度.具體公式為
首先,根據(jù)用戶評(píng)分?jǐn)?shù)據(jù)和該商品客觀評(píng)分?jǐn)?shù)據(jù)構(gòu)建用戶、商品矩陣,用以描述用戶、商品之間的關(guān)系,并作為數(shù)據(jù)預(yù)處理的基礎(chǔ)矩陣;其中,客觀評(píng)分來(lái)自于所有購(gòu)買(mǎi)客戶的綜合評(píng)價(jià)所得,能夠比較真實(shí)地反映商品的各個(gè)屬性.
設(shè)用戶集合為U={ui|i=1,2,…,m},用戶對(duì)某一商品的各個(gè)屬性的主觀評(píng)分集合為I={uij|j=1,2,…,n},商品各個(gè)屬性客觀評(píng)分集合為C={cij|j=1,2,…,n},前8列代表用戶對(duì)已購(gòu)買(mǎi)商品8個(gè)屬性的評(píng)分,后8列代表該品牌商品8個(gè)屬性的客觀評(píng)分,如表1所示.
其次,通過(guò)一個(gè)權(quán)值α來(lái)控制用戶對(duì)商品各個(gè)屬性的主觀評(píng)分和汽車(chē)各個(gè)屬性的客觀評(píng)分的重要程度,最終用戶ui對(duì)商品各個(gè)屬性評(píng)分ij的計(jì)算公式為
在實(shí)際購(gòu)買(mǎi)商品時(shí),可能某一個(gè)單純的偏好,就能使用戶決心購(gòu)買(mǎi)某件產(chǎn)品,其他的偏好作用并不大,本文暫時(shí)稱之為“孤立偏好”.為此,根據(jù)目標(biāo)用戶偏好評(píng)分對(duì)偏好進(jìn)行排序,排序后,刪除偏好順序和目標(biāo)用戶不一致的用戶,排序后為矩陣U1,如表2所示.然后,為表示用戶對(duì)該項(xiàng)評(píng)分是否滿意,將各個(gè)用戶的偏好評(píng)分減去評(píng)分均值,大于等于0的作為1,代表用戶對(duì)此偏好程度嚴(yán)重,小于0的作為0,表示偏好程度一般.矩陣U2如表3所示,其中當(dāng)ij時(shí),uij/0表示用戶ui和用戶uj同時(shí)具有某些偏好,uij=0表示用戶ui和用戶uj沒(méi)有共同的偏好;當(dāng)i=j時(shí),默認(rèn)uij=0,即不計(jì)算單個(gè)用戶偏好的數(shù)量.最后,為表現(xiàn)用戶之間擁有共同偏好的數(shù)量,根據(jù)公式(7)建立用戶偏好關(guān)系矩陣,如表4所示,其中, u13=u31=3表示用戶u1和用戶u3擁有相同偏好3項(xiàng)(i2,i6,i7),但是用戶u1具有偏好5項(xiàng)(i2,i6,i7,i5,i8),用戶u3具有偏好3項(xiàng)(i2,i6,i7),兩者擁有的偏好數(shù)目不同;相應(yīng)地,用戶的等級(jí)應(yīng)該也有所不同.因此,矩陣U4仍然無(wú)法較好地反映用戶偏好之間的真實(shí)關(guān)系,需要進(jìn)一步對(duì)矩陣U4做相應(yīng)處理,使其不僅能反映出用戶具有相同偏好的數(shù)目,還能反映出用戶偏好之間的等級(jí)差異.
因此,本文在矩陣U4的基礎(chǔ)上做了標(biāo)準(zhǔn)化處理:在U4中,uij表示被用戶ui和用戶uj所擁有的相同偏好的數(shù)量,用戶ui的偏好數(shù)為m為用戶總數(shù),那么標(biāo)準(zhǔn)化用戶偏好關(guān)系矩陣U5可定義為
這里
表1 用戶、商品矩陣Tab.1 User-item matrix
表2 用戶、偏好客觀評(píng)分排序矩陣Tab.2 User,preference objective scoring matrix
表3 用戶偏好關(guān)系矩陣Tab.3 User,preference objective scoring presort matrix
表4 用戶偏好關(guān)系矩陣Tab.4 User,preferencerelation matrix
如表5所示,可以發(fā)現(xiàn)u13=3/8,u31=3/6,顯然u13u31,其中,分子表示用戶之間擁有共同偏好的數(shù)量,分母表示不同用戶偏好之間的差異.
表5 標(biāo)準(zhǔn)化用戶偏好關(guān)系矩陣Tab.5 Standared user,preference relation matrix
在得到標(biāo)準(zhǔn)化偏好用戶關(guān)系矩陣U5后,為了對(duì)傳統(tǒng)的相似性度量方法進(jìn)行改進(jìn),本文使用社會(huì)網(wǎng)絡(luò)理論,通過(guò)建立用戶偏好評(píng)級(jí)模型來(lái)分析用戶間的關(guān)系.
由于用戶偏好關(guān)系圖G可用于描述各個(gè)用戶偏好之間的關(guān)系[15],在矩陣U5基礎(chǔ)上生成一個(gè)具有權(quán)重的有向圖G=(U,L),如圖2所示,其中U={ui|i=1,2,…,m}代表用戶偏好,為所有節(jié)點(diǎn)的集合;L={Ii|i=1,2,…,n}代表用戶之間的偏好關(guān)系,為所有有向邊的集合.
圖2 用戶偏好關(guān)系圖Fig.2 The fi gure of user preference relation
設(shè)ui和uj分別為兩個(gè)節(jié)點(diǎn);Outweight(uj)表示從節(jié)點(diǎn)uj向外的鏈接數(shù)目;B(ui)表示連接到節(jié)點(diǎn)ui的節(jié)點(diǎn)集合;U R(ui)表示節(jié)點(diǎn)ui的PageRank值;d是一個(gè)衰減系數(shù),大于0且小于1的值,一般為0.8左右,表示這個(gè)節(jié)點(diǎn)PageRank值的80%分配到所連接的節(jié)點(diǎn)中,另外的20%被分配到所有的節(jié)點(diǎn)中;m表示節(jié)點(diǎn)的總數(shù).
因?yàn)樗泄?jié)點(diǎn)的PageRank的初始值都是未知的,所以我們以均值作為其初始值,即1/m,利用上述公式進(jìn)行計(jì)算,然后將得到的值再次帶入進(jìn)行計(jì)算,如此反復(fù),直到值最終收斂于一個(gè)比較固定的數(shù),即用戶偏好級(jí)別.
在上一節(jié),已經(jīng)求出目標(biāo)用戶偏好的最近鄰集合,根據(jù)傳統(tǒng)的協(xié)同過(guò)濾推薦算法,需要利用相似度最高的用戶的評(píng)分為目標(biāo)用戶為評(píng)分項(xiàng)目預(yù)測(cè)評(píng)分.由于數(shù)據(jù)的稀疏性,本算法不再對(duì)其進(jìn)行預(yù)評(píng)分,而是利用公式(3)求出用戶之間的相似性,繼而選擇相似度最高的前N個(gè)商品通過(guò)預(yù)定好的意見(jiàn)做進(jìn)一步處理,代替預(yù)評(píng)分;這里的意見(jiàn)由人工指定,目的在于尋找具有最高性價(jià)比產(chǎn)品.
本文采用網(wǎng)上車(chē)市的網(wǎng)友評(píng)價(jià)及參數(shù)配置數(shù)據(jù),數(shù)據(jù)集通過(guò)自制爬蟲(chóng)程序獲得,包括13個(gè)級(jí)別及每個(gè)級(jí)別關(guān)注度排名前10的汽車(chē)品牌參數(shù)信息,以及6 320條網(wǎng)友信息數(shù)據(jù).網(wǎng)友信息包含兩部分:情境信息和用戶評(píng)分信息.情境信息包括購(gòu)買(mǎi)車(chē)系、裸車(chē)購(gòu)買(mǎi)價(jià)、購(gòu)買(mǎi)時(shí)間、購(gòu)買(mǎi)地點(diǎn)、購(gòu)車(chē)目的,由于數(shù)據(jù)總量較少,本實(shí)驗(yàn)僅采用價(jià)格和購(gòu)車(chē)目的作為情境因素.用戶評(píng)分信息和汽車(chē)客觀評(píng)分信息一樣,包括空間、動(dòng)力、操作、油耗、舒適性、外觀、內(nèi)飾、性價(jià)比,用戶評(píng)分分值為1–5,分值越高,表示用戶越滿意.
專家意見(jiàn)主要考慮發(fā)動(dòng)機(jī)性能和整車(chē)性能,發(fā)動(dòng)機(jī)性能暫定為,排量相同情況下,油耗越低越好;整車(chē)質(zhì)量根據(jù)廠家給的保修規(guī)則來(lái)判定,保修年限或里程越長(zhǎng),則認(rèn)為其質(zhì)量越可靠.
算法性能從兩方面進(jìn)行檢驗(yàn),一方面將基于準(zhǔn)確率進(jìn)行評(píng)價(jià),因?yàn)橹挥蟹诸?lèi)準(zhǔn)確度可用于分類(lèi)問(wèn)題中;另一方面利用傳統(tǒng)的平均絕對(duì)誤差(Mean Absolute Error,MAE)來(lái)衡量用戶預(yù)測(cè)評(píng)分和真實(shí)評(píng)分之間的差異.
分類(lèi)準(zhǔn)確度適用于0–1系統(tǒng),即用戶對(duì)該項(xiàng)目喜歡還是不喜歡、推薦結(jié)果是否正確,將預(yù)測(cè)過(guò)程假想為用戶做決策的過(guò)程.本文使用精確度(Precision)衡量,公式為
其中,Ru是推薦結(jié)果集,Tu是真實(shí)結(jié)果集,結(jié)果集指的是汽車(chē)級(jí)別、車(chē)廂結(jié)構(gòu)、驅(qū)動(dòng)方式、變速箱形式等4種.
評(píng)分絕對(duì)誤差用MAE計(jì)算,公式為
其中,pij表示第i個(gè)推薦車(chē)型第j個(gè)屬性的預(yù)測(cè)評(píng)分,qij表示第i個(gè)用戶對(duì)歷史購(gòu)買(mǎi)車(chē)型的第j個(gè)屬性的客觀評(píng)分,num表示測(cè)試集大小,k表示用戶屬性個(gè)數(shù).
作為對(duì)比,本文選取常用的基于用戶的協(xié)同過(guò)濾推薦,即利用目標(biāo)用戶注冊(cè)的偏好信息和其余用戶偏好評(píng)分信息,一起構(gòu)建用戶項(xiàng)目評(píng)分矩陣,找目標(biāo)用戶最相似的車(chē)型,然后根據(jù)最終推薦車(chē)型信息和評(píng)分,將其最終結(jié)果和本算法推薦的結(jié)果分別計(jì)算Precision和MAE.如圖3、圖4所示,結(jié)果通過(guò)計(jì)算10名目標(biāo)用戶的均值得出,橫坐標(biāo)表示用戶數(shù)量的多少,豎坐標(biāo)分別表示Precision和MAE.
圖3中,可以看出,隨著用戶偏好評(píng)分?jǐn)?shù)量的增多,兩種推薦算法精確度都在逐漸上升,但是基于汽車(chē)銷(xiāo)售的個(gè)性化推薦,算法始終表現(xiàn)出明顯優(yōu)勢(shì).圖4中,也可看出,基于汽車(chē)銷(xiāo)售的個(gè)性化推薦,算法在評(píng)分上相比傳統(tǒng)的協(xié)同過(guò)濾也要精確很多,具有一定的優(yōu)勢(shì).
針對(duì)傳統(tǒng)協(xié)同過(guò)濾算法應(yīng)用于復(fù)雜屬性商品推薦存在的問(wèn)題,提出一種基于復(fù)雜屬性商品的混合協(xié)同過(guò)濾推薦模型,通過(guò)結(jié)合用戶主觀評(píng)分和商品客觀評(píng)分,在盡量反映用戶偏好的基礎(chǔ)上得出一個(gè)混合評(píng)分,并以此混合評(píng)分作為依據(jù),進(jìn)行數(shù)據(jù)處理;在提高推薦準(zhǔn)確度方面,通過(guò)專家意見(jiàn)提高商品性價(jià)比,以此來(lái)提高用戶的滿意度.實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)協(xié)同過(guò)濾推薦相比,該模型在平均絕對(duì)誤差(MAE)和精確度(Precision)均具有較高優(yōu)勢(shì).因此,本模型相對(duì)傳統(tǒng)協(xié)同過(guò)濾有效地提高了預(yù)測(cè)精度,更適合于復(fù)雜商品屬性推薦.未來(lái)的研究工作將結(jié)合社交網(wǎng)絡(luò)進(jìn)一步提高預(yù)測(cè)精度.
圖3 精確度Fig.3 Precision
圖4 平均絕對(duì)誤差Fig.4 Mean absolute error
[1]許海玲,吳瀟,李曉東.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報(bào),2009,20(2):350-362.
[2]張鋒,常會(huì)友.使用BP神經(jīng)網(wǎng)絡(luò)緩解協(xié)同過(guò)濾推薦算法的稀疏性問(wèn)題[J].計(jì)算機(jī)研究與發(fā)展,2006,43(4):667-672.
[3]王輝,高利軍,王聽(tīng)忠.個(gè)性化服務(wù)中基于用戶聚類(lèi)的協(xié)同過(guò)濾推薦[J].計(jì)算機(jī)應(yīng)用,2007,27(5):1225-1227.
[4]ZIEGLER C N,MCNEE S,KONSTAN J,et al.Improving recommendation lists through topic diversif i cation[C]//Proceedings of the 14th International World Wide Web Conference.2005:22-32.
[5]陳曦,成韻姿.一種優(yōu)化組合相似度的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)工程與科學(xué),2017,39(1):180-187.
[6]郭彩云,王會(huì)進(jìn).改進(jìn)的基于標(biāo)簽的協(xié)同過(guò)濾算法[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(8):56-61.
[7]宋偉偉,楊德剛,鄭敏.基于時(shí)間加權(quán)標(biāo)簽的協(xié)同過(guò)濾推薦算法研究[J].重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,33(5): 113-120.
[8]孫楠軍,劉天時(shí).基于項(xiàng)目分類(lèi)和用戶群體興趣的協(xié)同過(guò)濾算法[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(10):128-131.
[9]LEMIRE D,MACLACHLAN A.Slope one predictors for online rating-based collaborative f i ltering[C]//Proceedings of the SIAM Data Mining(SDM’05).2005:21-23.
[10]LIU F,LEE H J.Use of social network information to enhance collaborative f i ltering performance[J].Expert Systems with Applications,2010,37(7):4772-4778.
[11]YUAN W,GUAN D,LEE Y,et al.Improved trust-aware recommender system using small worldness of trust networks[J].Knowledge Based Systems,2010,23(3):232-238.
[12]DING L,STEIL D,DIXON B,et al.A relation context oriented approach to identify strong ties in social networks[J].Knowledge-Based Systems,2011,24(8):1187-1195.
[13]鄧曉懿,金淳,韓慶平,等.基于情境聚類(lèi)和用戶評(píng)級(jí)的協(xié)同過(guò)濾推薦模型[J].系統(tǒng)工程理論與實(shí)踐,2013,33(11):2945-2953.
[14]MA H,KING I,LYU M R.Ef f ective missing data prediction for collaborative f i ltering[C]//Sigir Proceedings of Annual International ACM Sigir Conference on Research&Development 2007:39-46.
[15]LI Y M,LAI C Y,CHEN C W.Discovering inf l uencers for marketing in the blogosphere[J].Information Sciences, 2011,181(23):5143-5157.
[16]YUAN W W,GUAN D H,LEE Y K,et al.Improved trust-aware recommender system using small-worldness of trust networks[J].Knowledge Based Systems,2010,23(3):232-238.
[17]ARASU A,CHO J,GARCIA-MOLINA H,et al.Searching the Web[J].ACM Transactions on Internet Technology,2001(1):2-43.
(責(zé)任編輯:李藝)
A hybrid collaborative f i ltering recommendation model based on complex attribute of goods
ZHOU Lan-feng,MA Shuang-ke,FU Zheng,ZHANG Qing
(School of Computer Science and Information Engineering,Shanghai Institute of Technology, Shanghai 201418,China)
Collaborative f i ltering as the most widely used,the most recommendation algorithm,the shortcomings inherent in the data sparse,cold startpoor data quality and others,and few studies based on commodity price to improve the prediction accuracy.At the same time,facing the full e-commerce market network Navy,the ratings and reviews also indirectly led to the predict a decline in accuracy.Therefore,this paper comprehensive consideration of the user subjective ratings and objective product score,and on this basis,combined with situation pre f i ltering,social network theory and expert opinions put forward a hybrid collaborative f i ltering recommendation model,to some extent alleviate the above shortcomings.And through experiment with real online car sales data,the model has higher forecast accuracy than the traditional collaborative f i ltering,and is more suitable for the commodity with complex attributes.
collaborative f i ltering;context;complex attribute;personalized recommendation
TP399
A
10.3969/j.issn.1000-5641.2017.05.014
1000-5641(2017)05-0154-08
2017-06-19
國(guó)家自然科學(xué)基金(41671402)
周蘭鳳,女,副教授,研究方向?yàn)槿斯ぶ悄芗按髷?shù)據(jù).E-mail:lfzhou@sit.edu.cn.
張晴,女,講師,研究方向?yàn)閳D像處理.E-mail:zhangqing0329@gmail.com.