丁小煥 彭甫镕 王瓊 陸建峰
摘 要:針對三元組數(shù)據(jù)內(nèi)在關(guān)聯(lián)性復(fù)雜的特點,提出了基于平行因子分解(PARAFAC)的協(xié)同聚類推薦算法。該算法利用PARAFAC算法對張量進(jìn)行分解,挖掘多維數(shù)據(jù)實體之間的相關(guān)聯(lián)系和潛在主題。首先,利用PARAFAC分解算法對三元組張量數(shù)據(jù)進(jìn)行聚類;然后,基于協(xié)同聚類算法提出了三種不同方案的推薦模型,并通過實驗對三種方案進(jìn)行了比較,得到了最優(yōu)的推薦模型;最后,將提出的協(xié)同聚類模型與基于高階奇異值分解(HOSVD)的推薦模型進(jìn)行比較。在last.fm數(shù)據(jù)集上,PARAFAC協(xié)同聚類算法比HOSVD張量分解算法在召回率和精確度上平均提高了9.8個百分點和3.7個百分點,在delicious數(shù)據(jù)集上平均提高了11.6個百分點和3.9個百分點。實驗結(jié)果表明所提算法能更有效地挖掘出張量中的潛在信息和內(nèi)在聯(lián)系,實現(xiàn)高準(zhǔn)確率和高召回率的推薦。
關(guān)鍵詞:標(biāo)簽;張量分解;協(xié)同聚類;推薦系統(tǒng);平行因子分解
中圖分類號: TP311.1TP391 文獻(xiàn)標(biāo)志碼:A英文標(biāo)題