高 華(大連藝術(shù)學院,遼寧 大連 116600)
?
一種電子商務協(xié)同過濾推薦算法
高 華
(大連藝術(shù)學院,遼寧 大連 116600)
摘 要:依據(jù)當前社會發(fā)展趨勢及電子商務發(fā)展要求,設計了一種以用戶偏好挖掘為基礎(chǔ)的電子商務協(xié)同過濾推薦算法。此算法將用戶隱性及顯性偏好知識,運用用戶偏好挖掘技術(shù)進行深入挖掘剖析,促進以用戶偏好知識的智能推薦及最近鄰居社區(qū)的構(gòu)建得以實現(xiàn)。從本次研究的實驗結(jié)果顯示,此種算法在預期效果上比較理想,對于協(xié)同過濾推薦的準確性和質(zhì)量具有顯著提升效果。
關(guān)鍵詞:用戶偏好挖掘;電子商務;協(xié)同過濾推薦算法
首先,用戶相似度計算。張堯等[1]通過運用AVD方法,對用戶的評分數(shù)據(jù)特征進行降維處理,對不同用戶之間所具有的潛在語義予以獲取,并以此為基礎(chǔ),計算用戶的相似度,運用此種方法,對協(xié)同過濾推薦系統(tǒng)的處理準確性及效率給與提升;扈中凱等[2]提出以知識處理機制為基礎(chǔ)的用戶相似度計算,對定性知識轉(zhuǎn)換及表示采用云模型予以完成,針對傳統(tǒng)用戶相似度計算方法方面所存在的不足進行解決,促使以云模型為基礎(chǔ)的協(xié)同過濾推薦的實現(xiàn)。其次,用戶信任計算。楊芳等[3]提出以信任為基礎(chǔ)的協(xié)同過濾推薦方法,開展推薦服務主要依據(jù)用戶之間所存在的一種信任關(guān)系,以此達到推薦服務的效率及質(zhì)量的不斷提升。最后,用戶偏好計算分析。方耀寧等提出以多目標優(yōu)化雙聚類為基礎(chǔ)的協(xié)同過濾方法,通過將用戶注冊時所填寫信息進行深入分析,對用戶的具體需求及偏好予以獲取,以此為基礎(chǔ)采取具有針對性的項目推薦活動。以用戶偏好為基礎(chǔ)的協(xié)同過濾推薦方法,不僅可以依據(jù)用戶所存在的實際需求及偏好,將與之相適應的商品及資源向用戶進行提供,其為在互聯(lián)網(wǎng)使用當中所存在的信息過載問題給與了很好的技術(shù)保證及輔助支撐。但是推薦系統(tǒng)所常使用的用戶偏好信息大的黃匡,多數(shù)均為針對用戶的顯性偏好所設置,比如用戶所進行的投票及評分等內(nèi)容,然而針對用戶所存在的隱性的相關(guān)偏好信息卻沒有予以考慮,諸如用戶的購買動機及在商品頁面所停留的時間等;與此同時,伴隨時間的推動以及用戶在具體認知上的不斷變動,用戶所存在的偏好信息也會發(fā)生改變,因此,這就需要充分運用推薦系統(tǒng),對用戶可能產(chǎn)生的需求變化進行相應的預測。對用戶的偏好信息進行更為深層次的剖析,特別是那些所存在的隱性信息及可能變遷的信息,對用戶需求及偏好進行及時掌握,以此達到推薦系統(tǒng)效率及服務質(zhì)量的不斷提升。
2.1用戶偏好挖掘
(1)顯性偏好知識的挖掘。針對挖掘顯性偏好知識,當用戶對一些網(wǎng)頁進行瀏覽時,其將用戶的評論信息及文本信息等作為挖掘?qū)ο螅槐疚尼槍τ脩麸@性偏好信息相應的挖掘和分析,主要采用K-means聚類算法予以完成,對用戶所具有的偏好知識類簇給與獲取??蓪⒂脩麸@性偏好信息進行采集,對其實施數(shù)據(jù)預處理,當處理完畢后,將所形成的文本文檔集進行設置,本次研究對用戶顯性偏好知識挖掘主要步驟如下:對初始類簇進行構(gòu)建,將在D當中的全部文檔,均將其作為單個初始用戶相應的偏好類別形式;然后將任意類別相應的差別方面的相似度),(jiccsim給與計算,將所設定的閥值ε給與利用,優(yōu)化和合并初始類簇,即獲取對最大相似度類別當 max>ε時,可以合并ci和cj,并將新類別ck=ci∪cj給與最終形成;當 max<ε時,那么就將 ci和cj相應的類別進行深入保持,并將D給與新的子類簇進行劃分;然后,將上述當中,所得子類簇C,運用K-means算法,對相應初始聚類中心的種子集給與獲取,將di到si相應相似度sim(di, si)進行計算,然后將di納入至聚類中心si相應類別ci當中,然后可將最終的聚類結(jié)果予以獲取。
(2)隱性偏好知識的挖掘。當用戶對電子商務網(wǎng)站進行瀏覽時,其中所存在的許多動作都能對用戶所存在的偏好給與暗示,比如在實際的Web頁面當中,用戶所進行的點擊量、訪問次數(shù)及停留時間等。本文針對用戶的隱性偏好知識,在具體的相似性方面急性綜合計算,分別采用簇間相似度及序列簇內(nèi)相似度給與完成,采用 K-中心聚集的算法形式,對所存在的單一頁面的用戶偏好知識進行挖掘。然后依據(jù)以往研究經(jīng)驗,對在網(wǎng)絡社交當中,依據(jù)用戶自身所存在的興趣,所設計的相應數(shù)據(jù)挖掘處理方法,將所收集到的用戶自身隱性偏好信息實施相應的處理操作,最終將用戶行為序列集予以獲取,將初始簇數(shù)設置為 k,對行為簇內(nèi)相似度進行計算:
公式當中,ki所代表的是當簇數(shù)為k時,在相應的聚類模式當中,其就是其中的第i個簇,而Sw(ki)所代表的是,在第i個簇內(nèi)的平均相似度。針對簇間及簇內(nèi)相似度的計算來講,其具體的計算公式為:
在公式當中,Sb(ki,kj)所代表的是在行為序列簇i與簇j之間所存在的組間相似度。通過挖掘分析用戶的行為數(shù)據(jù),從中對用戶內(nèi)含的需求及偏好予以獲取,還可根據(jù)用戶所使用的具體界面狀況,依據(jù)瀏覽當中所使用的具體使用及點擊量,預測用戶所可能擁有或存在的偏好變遷,對于用戶還沒有對某些商品進行評價來講,可以根據(jù)用戶以往的評價內(nèi)容及所具有的顯性偏好狀況,對所需要的內(nèi)容進行預測和深入分析,最終便可將用戶的隱性偏好知識予以獲取。
以上述處理方法可知,針對用戶偏好空間矩陣的構(gòu)建,可運用加權(quán)關(guān)鍵詞矢量模型的方法予以完成,即:
公式中,ik所代表的是,在用戶所用偏好當中的第k個偏好類型,而kω所代表的是,用戶在偏好類型當中的第k個。
2.2最近鄰居社區(qū)的形成
針對電子商務協(xié)同過濾推薦來講,其在具體的環(huán)節(jié)方面,對目標用戶相應的最近鄰居給與準確定位,然而通過對用戶之間的相似性進行計算,才能對最近鄰居進行確定,通常情況下比較常用的方法為
(1)Pearson相似性。其所具有的計算公式:
式中,P所代表的是評分項目集合,而商品項目a所具有的評分,采用Ra,u進行表示,而所代表的是平均評分。
(2)余弦相似性。將用戶u和v,根據(jù)n維項目空間當中所存在的位置狀況,設計為m、n,以此,就可將用戶在u和v之間相似性給與表示,即:
修正的余弦相似性。此種相似性,充分考量了不同用戶所存在的各種評分方式給,公式如下:
式中,pv,u所代表的是評分項目集合,而Pu及Pv所代表的是,用戶在具體的u及v之間,所得出的評分過的項目集合,Ra,u所代表的是商品a所存在的的具體評分狀況,所代表的是平均評分。
本文基于修正的余弦相似性,在用戶相似度計算當中將用戶偏好知識融入其中,公式為:
式中,UPSuv所代表的是用戶u和v共同使用的偏好類型集合,UPSu代表的是用戶u的偏好類型集合,而UPSv所代表的是用戶v的相應偏好類型集合,ωi,u所代表的是用戶u在偏好類型 i上相對應的權(quán)值,而ωi,v所代表的是用戶v在相應偏好類型i上所具有的權(quán)值而及對用戶相應u和v相應偏好類型所具有的平均權(quán)值。
在用戶內(nèi)在的空間中,將隨機兩用戶之間相似度給與計算,滿足其在用戶聚類所具有的閥值φ,最終便可在最近鄰居社區(qū)當中,得出相似或者相同的偏好類型。
2.3智能推薦
所謂智能推薦,就是依據(jù)修正的余弦相似性,所建立的最近鄰居社區(qū),將商品項目通過推薦操作改變?yōu)槟繕擞脩簟J紫?,可將等待推薦的目標用戶,采用m給與設置,并將其相似度設為sim。對于搜索目標用戶m最近鄰居用戶來講,可采用用戶偏好空間UPS給與表示,最終將與m相同或相似的最近鄰居集合給與得出,然而對于偏好類型i來講,其UPS1與m之間所存在的相似性sim(m,UPS1)往往最高,以此進行類推。對于UPSmi當中的各個用戶,用戶各個偏好信息可進行相應加權(quán)平均操作,對目標用戶相應需求及偏好進行預測,公式為:
公式當中,ωi,u所代表的是對用戶u相應的偏好類型i的具體權(quán)值,其中,sim(m,u)所代表的是用戶m與u之間所存在的相似度,和所代表的是相應的平均權(quán)值。利用上述公式,將所要預測的需求和偏好最高的相應前n項進行計算,最終向目標用戶將Top-N給與推薦。
本文將用戶偏好挖掘技術(shù),在具體的協(xié)同過濾推薦當中給與有效融入,并以此建立以用戶偏好挖掘為基礎(chǔ),在電子商務中給與運用的協(xié)同過濾推薦算法,針對此算法,與傳統(tǒng)的協(xié)同過濾推薦算法相比較,其最大特點在于對用戶的相似性進行計算過程中,不僅對顯性偏好信息進行計算,而且還對隱性偏好信息進行計算,通過對二者信息的充分挖掘,然后對于用戶存在相似性的偏好知識進行計算,最終促進以用戶偏好知識為基礎(chǔ)的最近鄰居社區(qū)機制的形成,并基于此,針對用戶的實際需求進行相應的智能推薦操作。
參考文獻:
[1]張堯,馮玉強. 數(shù)據(jù)稀疏環(huán)境下基于用戶主題偏好的協(xié)同過濾算法[J]. 運籌與管理,2014(02):145-152.
[2]扈中凱,鄭小林,吳亞峰,等. 基于用戶評論挖掘的產(chǎn)品推薦算法[J]. 浙江大學學報:工學版,2013(08):1475-1485.
[3]楊芳. 電子商務系統(tǒng)協(xié)同過濾推薦算法研究[D]. 天津: 河北工業(yè)大學,2006.
(責任編輯:吳 芳)
中圖分類號:F724.6
文獻標識碼:A
doi:10.3969/j.issn.1672-7304.2016.01.053
文章編號:1672–7304(2016)01–0111–03
作者簡介:高華(1975-),女,遼寧大連人,副教授,研究方向:計算機應用技術(shù)與電子商務。
A collaborative filtering recommendation algorithm e-commerce
GAO Hua
(Dalian Institute of art, Liaoning Dalian 116600)
Abstract:On the basis of the current trend of social development and the requirement of e-commerce development, we design a user preference mining based e-commerce collaborative filtering recommendation algorithm. This algorithm will be user's recessive and dominant knowledge, using the user preferences deeply analyzes mining mining technology, to promote to the user preference knowledge of intelligent recommendation and neighbor community building recently. From the experimental results of this research shows that this algorithm on the expected effect is more ideal, for collaborative filtering recommendation accuracy and quality have a significant boost effect.
Keywords:Mining user preferences; e-commerce; collaborative filtering algorithm