• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于物品的協(xié)同過濾算法對“寧波地鐵go”用戶個(gè)性化推薦系統(tǒng)研究

      2019-07-15 07:02:51曹夏琳周健勇
      物流科技 2019年6期
      關(guān)鍵詞:推薦系統(tǒng)數(shù)據(jù)挖掘

      曹夏琳 周健勇

      摘 ?要:隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,個(gè)性化推薦系統(tǒng)在各個(gè)領(lǐng)域已被廣泛應(yīng)用,電子商務(wù)平臺根據(jù)用戶的歷史數(shù)據(jù),向其推薦感興趣的商品,但如今也存在著推薦商品精確度低,特征提取能力有限,標(biāo)簽本身存在冗余問題等。文章通過基于物品的協(xié)同過濾算法,在用戶群中找到指定用戶的相似鄰居用戶,綜合這些鄰居用戶的行為數(shù)據(jù),再引入物品售價(jià)權(quán)重這一隱氏特征,避免熱門物品對推薦結(jié)果的惡意干擾,改進(jìn)傳統(tǒng)算法,從而推薦更合適的商品。實(shí)驗(yàn)表明該算法對推薦預(yù)測有較好的效果。

      關(guān)鍵詞:數(shù)據(jù)挖掘;推薦系統(tǒng);協(xié)同過濾算法;售價(jià)權(quán)重

      中圖分類號:F713.365.2 ? ?文獻(xiàn)標(biāo)識碼:A

      Abstract: With the continuous development of data mining technology, personalized recommendation system has been widely used in various fields. The E-commerce platform recommends products of interest according to the user's historical data, but now there are also problems of low accuracy in recommending commodities, the feature extraction capability is limited, and the tag itself has redundancy problems. Through the item-based collaborative filtering algorithm. This paper finds similar neighbor users of the specified users in the user group, integrates the behavior data of these neighbor users, and then introduces the hidden feature of the item price weight to avoid malicious interference of the popular items on the recommendation results. Improve traditional algorithms to recommend more suitable products. Experiment shows that the algorithm has a good effect on the recommended prediction.

      Key words: data mining; recommendation system; collaborative filtering algorithm; price weight

      0 ?引 ?言

      隨著信息化技術(shù)的快速發(fā)展,網(wǎng)絡(luò)已經(jīng)在人們學(xué)習(xí)、生活和工作中擔(dān)任著不可或缺的角色,而在信息過載的今天,如何在浩瀚的信息海洋中找到所需信息,已經(jīng)越來越引起人們的關(guān)注。因此,許多學(xué)者致力于研究個(gè)性化推薦系統(tǒng),好的個(gè)性化推薦系統(tǒng)能夠很好地提高用戶體驗(yàn),幫助減少馬太效應(yīng)和長尾效應(yīng),擴(kuò)大產(chǎn)品的盈利。

      現(xiàn)代推薦系統(tǒng)中所使用的技術(shù)[1]主要有基于內(nèi)容推薦、基于關(guān)聯(lián)規(guī)則推薦、基于知識推薦、基于上下文推薦和基于深度學(xué)習(xí)推薦、混合推薦以及協(xié)同過濾。協(xié)同過濾算法是如今應(yīng)用最多、最廣泛的技術(shù),其核心思想是:在預(yù)測用戶喜好時(shí),不僅考慮該用戶的歷史信息,還要結(jié)合其他用戶對該商品的行動,計(jì)算給定用戶(物品)之間的相似性,尋找目標(biāo)用戶(物品)的最近鄰居集合,利用最近鄰居集合中的評分情況來給目標(biāo)用戶推薦相關(guān)內(nèi)容。

      1992年,Xerox PARC研究中心開發(fā)了實(shí)驗(yàn)系統(tǒng)Tapestry[2],該系統(tǒng)首次利用協(xié)同過濾技術(shù),幫助用戶過濾郵件,解決垃圾郵件問題,此后協(xié)同過濾技術(shù)開始被廣泛應(yīng)用。

      2001年,路海明、盧增祥等人[3]將協(xié)同過濾技術(shù)與內(nèi)容相結(jié)合,通過網(wǎng)絡(luò)Bookmark服務(wù),給出了該算法的一個(gè)實(shí)際應(yīng)用系統(tǒng),得到很好的反響。黃光球等人[4]結(jié)合了用戶興趣度和協(xié)同過濾技術(shù)對客戶的個(gè)人興趣進(jìn)行評價(jià),提出了客戶興趣度的商品推薦參考模型,并將此模型應(yīng)用于電子商務(wù)網(wǎng)站的商品推薦,得到了很好的反響。周珊丹等人[5]利用基于用戶的協(xié)同過濾算法,為用戶推薦個(gè)性化文物,提高用戶在博物館中的游覽體驗(yàn)。王冠楠等人[6]使用多維興趣向量刻畫用戶的興趣,利用協(xié)同過濾技術(shù),提高了系統(tǒng)中新聞推薦的專業(yè)度。吳國芳[7]通過對用戶行為進(jìn)行分析建立個(gè)性化Profile,在圖書館資源個(gè)性化推薦中得到了很好的應(yīng)用。

      本文基于協(xié)同過濾算法,分析“寧波地鐵go”用戶的歷史數(shù)據(jù),挖掘出用戶物品間的相關(guān)度,再引入用戶購買權(quán)重這一隱氏特征,綜合分析以此預(yù)測出用戶的消費(fèi)偏好,并向其推送相應(yīng)的商品,此方法能夠很好地避免無關(guān)信息的干擾,解決用戶數(shù)據(jù)不足帶來的推薦不準(zhǔn)確等問題。

      1 ?協(xié)同過濾推薦算法

      協(xié)同過濾推薦算法一般有兩類:基于用戶的協(xié)同過濾推薦和基于物品的協(xié)同過濾推薦。

      1.1 ?基于用戶的協(xié)同過濾算法

      基于用戶的協(xié)同過濾算法的基本思想是以用戶為主體,注重社會屬性,利用用戶對物品的偏好度計(jì)算用戶的鄰居用戶,然后把鄰居用戶的偏好物品推薦給當(dāng)前用戶,算法步驟如下。

      (1)計(jì)算目標(biāo)用戶與其他用戶的相似度,可以使用反差表忽略一部分用戶;

      (2)將相似度從高到低進(jìn)行排列,找到K個(gè)與目標(biāo)用戶最相似的鄰居用戶;

      (3)在鄰居用戶的偏好物品集中,計(jì)算出每一件物品的推薦度;

      (4)根據(jù)每一件物品推薦度的高低向目標(biāo)用戶進(jìn)行推薦。

      這個(gè)算法實(shí)現(xiàn)起來比較簡單,但在實(shí)際應(yīng)用中也存在一些問題,比如當(dāng)前大多數(shù)人喜歡的物品對你來說卻毫無意義,或者一些實(shí)用性很強(qiáng)的物品,如新華字典、各種工具書等,在你想要買文學(xué)書的時(shí)候,可能沒有必要推薦給你,導(dǎo)致推薦物品的個(gè)性化較低。

      1.2 ?基于物品的協(xié)同過濾算法

      基于物品的協(xié)同過濾算法和基于用戶的協(xié)同過濾算法很相似,核心思想是給用戶推薦他們之前喜歡的物品的相似物品。從物品本身出發(fā),基于用戶的歷史行為數(shù)據(jù)找到某一物品的相似物品,然后利用最近鄰居物品來預(yù)測當(dāng)前用戶對鄰居物品的偏好程度,從而將偏好度高的物品推薦給目標(biāo)用戶。算法流程如圖1所示。

      這兩種算法各有優(yōu)勢,實(shí)際情況下,對于“寧波地鐵go”公眾號用戶來說,目前用戶的歷史數(shù)據(jù)量有限,相似用戶的可參考性價(jià)值不高,與其向用戶推薦毫無意義的物品,以物品內(nèi)在的聯(lián)系為原則的推薦更加適合現(xiàn)在的平臺情況。

      2 ?算法實(shí)現(xiàn)

      2.1 ?收集用戶歷史偏好

      在“寧波地鐵go”平臺的用戶歷史商城數(shù)據(jù)包括用戶ID、物品名稱、購買數(shù)量、物品售價(jià),本文將物品售價(jià)作為對某種物品偏好程度的衡量依據(jù),根據(jù)用戶ID、物品名稱、購買數(shù)量這三種數(shù)據(jù)生成初始矩陣X,作為基于物品的協(xié)同過濾算法的初始輸入數(shù)據(jù)。建立好數(shù)據(jù)模型之后,對初始矩陣X進(jìn)行矩陣相乘,用來對物品售價(jià)矩陣L賦權(quán),得到最終矩陣M。在平臺所獲取的用戶數(shù)據(jù)來看,各種物品的售價(jià)差距不小,根據(jù)大多數(shù)用戶的消費(fèi)心理,售價(jià)小又實(shí)用的物品往往很受大家歡迎,而這類物品會對推薦結(jié)果產(chǎn)生很大的干擾,從而造成推薦結(jié)果不準(zhǔn)確,這時(shí)物品的售價(jià)會在一定程度上反映偏好程度,售價(jià)高的物品用戶仍然購買就說明對這一物品的喜愛程度很高,所以引入這一物品售價(jià)權(quán)重會使推薦結(jié)果更準(zhǔn)確。圖2為算法的流程圖。

      2.2 ?計(jì)算相似度

      基于物品的協(xié)同過濾算法首先要計(jì)算物品之間的相似度,傳統(tǒng)的方法有余弦相似度計(jì)算、皮爾遜相關(guān)系數(shù)計(jì)算等。

      (1)余弦相似度計(jì)算

      3.4 ?結(jié)果分析

      本文把傳統(tǒng)算法與引入售價(jià)權(quán)重后的改進(jìn)算法進(jìn)行對比,并使用MAE和APC評估其性能,首先售價(jià)權(quán)重對于整個(gè)系統(tǒng)的影響較大,因此需要事先確定一個(gè)最佳的售價(jià)權(quán)重以讓整個(gè)系統(tǒng)性能最佳,實(shí)驗(yàn)結(jié)果如圖3所示。

      從圖3可看出,當(dāng)售價(jià)權(quán)重為0.4時(shí)的平均絕對誤差最小,因此以0.4為最佳售價(jià)權(quán)重,改進(jìn)傳統(tǒng)的基于物品的協(xié)同過濾算法,得到的部分推薦結(jié)果如表4所示。

      在其他參數(shù)相同的情況下,把售價(jià)權(quán)重為0.4時(shí)的改進(jìn)算法與傳統(tǒng)算法進(jìn)行比較,所得推薦結(jié)果與實(shí)際興趣物品集比較,并用MAE與APC兩個(gè)指標(biāo)來衡量,結(jié)果如圖4、圖5所示。

      由圖4可知,隨著鄰居數(shù)量的增加,傳統(tǒng)基于物品的協(xié)同過濾算法與引入售價(jià)權(quán)重后的改進(jìn)算法的MAE都逐漸減小到最小值后逐漸增加,并趨于平穩(wěn),當(dāng)鄰居數(shù)量為20時(shí),兩種算法的MAE都達(dá)到最小值,此時(shí)推薦系統(tǒng)的準(zhǔn)確度最高,并且改進(jìn)后的算法的MAE總體上都要小于傳統(tǒng)算法。從圖5可看出,改進(jìn)后算法的平均覆蓋率要高于傳統(tǒng)算法,說明引入售價(jià)權(quán)重能夠提高整個(gè)系統(tǒng)預(yù)測的覆蓋率,從如今的消費(fèi)者購物心理來看,售價(jià)這一變量確實(shí)在很大程度上能反應(yīng)某些物品的熱門度,單價(jià)低的物品銷量高說明其熱門度很高,但如果單價(jià)高的物品銷量仍然很高就更能說明用戶對其興趣度很高,若以此特性來對用戶進(jìn)行精準(zhǔn)營銷,一定能增強(qiáng)用戶的粘性,挖掘長尾物品,提高平臺的利潤。

      4 ?結(jié)束語

      本文在傳統(tǒng)基于物品的協(xié)同過濾算法上引入售價(jià)權(quán)重這一隱氏特征,減少了熱門物品對推薦結(jié)果的惡意干擾,實(shí)驗(yàn)結(jié)果表明改進(jìn)后的算法的平均絕對誤差和平均預(yù)測覆蓋率均優(yōu)于傳統(tǒng)算法,在推薦精確度上有所提升。在實(shí)際應(yīng)用中,對于供應(yīng)商有很大意義,不僅對用戶的喜好有所了解,給用戶選擇購物商品時(shí)帶來方便,隨著積累的用戶數(shù)據(jù)量越來越大,可搭建類似DMP(Data Management Platform)數(shù)據(jù)管理平臺,把分散的多方數(shù)據(jù)進(jìn)行整合納入統(tǒng)一的技術(shù)平臺,并對這些數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和細(xì)分,結(jié)合用戶畫像,供應(yīng)商可以制定精準(zhǔn)的營銷方案,其經(jīng)濟(jì)利益將尤為可觀。

      參考文獻(xiàn):

      [1] 孫光浩,劉丹青,李夢云. 個(gè)性化推薦算法綜述[J]. 軟件,2017,38(7):70-78.

      [2] ?GOLDBERG D, NICOLS D. Using collaborative filtering to weave an information tapestry[J]. Communications of the ACM, 1992,35(12):61-70.

      [3] 路海明,盧增祥,李衍達(dá). 基于多Agent混合智能實(shí)現(xiàn)個(gè)性化信息推薦[J]. 高技術(shù)通訊,2001(4):28-31.

      [4] 黃光球,靳峰,彭緒友. 基于興趣度的協(xié)同過濾商品推薦系統(tǒng)模型[J]. 微電子學(xué)與計(jì)算機(jī),2005,22(3):5-8.

      [5] 周珊丹,周興社,王海鵬,等. 智能博物館環(huán)境下的個(gè)性化推薦算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2010(19):224-226.

      [6] 王冠楠,陳端兵,傅彥. 新聞推薦的多維興趣模型與傳播分析[J]. 計(jì)算機(jī)科學(xué),2013(11):126-130.

      [7] 吳國芳. 數(shù)字圖書館個(gè)性化知識服務(wù)研究[J]. 計(jì)算機(jī)應(yīng)用與軟件,2014,31(5):93-94,183.

      [8] 孫多. 基于興趣度的聚類協(xié)同過濾推薦系統(tǒng)的設(shè)計(jì)[J]. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版),2007(5):19-22.

      猜你喜歡
      推薦系統(tǒng)數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)挖掘在選課推薦中的研究
      軟件(2016年4期)2017-01-20 10:09:33
      基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
      基于個(gè)性化的協(xié)同過濾圖書推薦算法研究
      個(gè)性化推薦系統(tǒng)關(guān)鍵算法探討
      數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
      淺談Mahout在個(gè)性化推薦系統(tǒng)中的應(yīng)用
      關(guān)于協(xié)同過濾推薦算法的研究文獻(xiàn)綜述
      商(2016年29期)2016-10-29 15:22:08
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      梁河县| 郑州市| 留坝县| 普陀区| 体育| 韶关市| 合川市| 永泰县| 白玉县| 吉木乃县| 玛曲县| 乌审旗| 宁强县| 和硕县| 石渠县| 安阳县| 中阳县| 西畴县| 江都市| 阳原县| 西华县| 洛南县| 来安县| 鄂温| 浦东新区| 酒泉市| 阿城市| 澄迈县| 芮城县| 茶陵县| 沿河| 宣汉县| 壶关县| 兰西县| 定州市| 霍城县| 嵩明县| 乌拉特中旗| 寿阳县| 平谷区| 丹巴县|