• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于用戶行為反饋的用戶興趣模型更新算法

      2017-06-15 18:37:04
      關鍵詞:特征詞新鮮度歷史

      李 強

      (重慶郵電大學 軟件學院,重慶 400065)

      基于用戶行為反饋的用戶興趣模型更新算法

      李 強

      (重慶郵電大學 軟件學院,重慶 400065)

      在個性化推薦系統(tǒng)中,用戶模型是推薦系統(tǒng)的主要依據(jù),模型的好壞直接影響推薦系統(tǒng)的質(zhì)量。但是在實際的應用中,用戶興趣會隨環(huán)境和時間發(fā)生變化,有可能推薦的商品已不滿足用戶當前的興趣需求。本文提出了一種記錄用戶當前興趣模型自我更新的算法,通過對用戶歷史訪問數(shù)據(jù)建立用戶興趣模型,以時間為主線,統(tǒng)計用戶當前興趣。本文以Movielens電影數(shù)據(jù)集為數(shù)據(jù)源,在設計的個人推薦系統(tǒng)中應用基于用戶行為反饋的用戶興趣模型更新算法,有效緩解了用戶興趣偏移的問題,提高了推薦質(zhì)量。

      用戶興趣模型;推薦系統(tǒng);興趣偏移

      隨著互聯(lián)網(wǎng)行業(yè)的井噴式發(fā)展,網(wǎng)上信息量幾何倍數(shù)式爆發(fā)增長。傳統(tǒng)的搜索引擎需要用戶輸入關鍵字來對海量信息進行篩選,用戶快速獲取自己需求的信息變得越來越困難。面對當今“信息過載”[1]的問題,個性化推薦系統(tǒng)[2]應運而生,它是大數(shù)據(jù)時代的產(chǎn)物。相比于傳統(tǒng)的搜索引擎,個性化推薦更人性化,它可以根據(jù)用戶歷史瀏覽行為,挖掘出用戶的興趣[2]偏好,根據(jù)用戶興趣推薦用戶感興趣的信息,從而幫助用戶快速獲取有用的信息資源。但是傳統(tǒng)的推薦算法沒有考慮用戶興趣變化的問題,沒有挖掘用戶當前和長久的興趣,推薦有效性不高。針對以上問題,本文提出了一種記錄用戶當前興趣模型自我更新的算法,以時間為主線,統(tǒng)計用戶長期興趣和記錄用戶近期興趣變化方向,并以此為策略為用戶推薦物品[3]來提高推薦系統(tǒng)的有效性和可靠性。

      1 相關技術

      本文以個性化電影推薦系統(tǒng)為研究對象,以Movielens電影數(shù)據(jù)集為研究數(shù)據(jù),主要研究用戶興趣模型的自我更新問題。

      1.1 用戶興趣模型

      (1)一部電影可以包含多個特征詞,所以電影M可記作:

      M={M1,M2...,Mj,...,Mn},1≤j≤n。

      (1)

      其中:Mj表示電影類型。

      (2)電影類型與訪問次數(shù)關系F為:

      F=(Mj,Kj)。

      (2)

      其中:Kj為單個特征詞被訪問的次數(shù)。

      (3)用戶對單個特征詞的興趣度。

      通過對單個特征詞的出現(xiàn)次數(shù)統(tǒng)計,來衡量用戶對該特征詞的興趣程度。

      定義1 用戶對單個電影特征詞的興趣度(Uinterest):

      Uinterest=Fj,1≤j≤n。

      (3)

      其中:Fj由式(2)可得,n為特征詞的內(nèi)容的總個數(shù)。

      2 引入用戶當前興趣的用戶興趣模型

      2.2 加入用戶當前興趣

      假設用戶最近最多觀看的電影為用戶當前喜歡的電影,很久沒有觀看的為用戶將要遺忘的電影,本文采用類似LRU算法的一種改進方法進行用戶模型更新,把用戶歷史記錄按時間排序,用戶觀看一次電影,就統(tǒng)計該電影的類型,該電影類型在用戶興趣模型中的比重就加1,用戶興趣模型中已經(jīng)存在但不屬于當前觀看的電影類型的其他類型減1,以此來記錄電影類型新鮮度。所以用戶常看的電影類型比重就會升高,代表用戶當前的喜愛程度;同時,用戶很久不看的電影類型就會一直衰減,比重會隨著用戶長時間不訪問一直降低。

      (1)電影類型與當前興趣度關系F′可表示為:

      F′=(Mj,Ci)。

      (4)

      其中:Mj見式(1),Ci為電影類型當前興趣度。

      (2)用戶對單個電影類型的當前興趣度。

      通過對單個特征詞的出現(xiàn)次數(shù)統(tǒng)計,來衡量用戶對該特征詞的興趣程度。

      定義2 用戶對某個電影類型的興趣度(Ufresh)

      (5)

      其中:F′由式(4)可得,n為特征詞的內(nèi)容的總個數(shù)。

      (3)用戶模型U可以表示為:

      (6)

      2.3 當前興趣度算法描述

      用戶最近多次訪問的電影類型最能代表用戶當前的興趣方向,如果長時間沒有觀看的電影類型,就不再代表用戶當前的興趣。最近最常訪問的電影類型當前興趣度升高,很長沒訪問電影類型的當前興趣度不斷降低,所以根據(jù)當前興趣度的大小,可以達到興趣過濾的目的。

      綜上所述,下面算法給出計算用戶興趣新鮮度的過程。

      算法 :Fresh_CB(Vi)//(Vi)為用戶i的歷史觀看電影記錄

      Begin:

      輸入:用戶歷史瀏覽記錄集

      int[]Uinterest; //定義一個用戶興趣模型數(shù)組Uinterest

      int[]Ufresh; //定義一個用戶興趣模型數(shù)組Ufresh

      for(intj=0;j

      Uinterest[j]++; //對用戶歷史興趣度進行統(tǒng)計

      for(intj=0;j

      Ufresh[j]++ ; //當前訪問的興趣類型權值增加

      else if(Uinterest[j]!=0)

      Ufresh[k]-- ;k為不等于j的數(shù)組位置 //當前沒訪問的興趣減弱

      End

      輸出:Ui

      2.3 推薦策略改進

      用戶歷史興趣Kij代表用戶對電影類型的喜愛程度,而當前興趣度Ci代表用戶當前對物品某類型的喜愛程度。根據(jù)式(6),如果兩個物品歷史興趣度一樣,就可以根據(jù)當前興趣度,使用基于內(nèi)容推薦[4]或協(xié)同過濾的推薦[5]算法,推薦用戶當前興趣度高的物品。

      3 實驗結(jié)果分析

      實驗主要對movielens電影數(shù)據(jù)集中7 120位用戶的1 048 577條歷史數(shù)據(jù)做統(tǒng)計。如圖1和圖2所示,為某一用戶的歷史電影觀看歷史類型總和統(tǒng)計和基于LRU算法(Least Recently Used )改進的當前興趣度統(tǒng)計。

      圖1 用戶歷史興趣統(tǒng)計

      圖1是用戶對各電影類型歷史興趣度的統(tǒng)計結(jié)果。根據(jù)式(3)對目標用戶所有歷史觀看電影類型進行累計,把相同的電影類型進行累加,由此可得出用戶喜歡的電影類型為:Sci-Fi>Action=Drama=Thriller。

      圖2 用戶當前興趣度統(tǒng)計

      圖2是用戶對各電影類型的當前興趣度統(tǒng)計結(jié)果。根據(jù)式(5)當前興趣度的計算設計思想是:對用戶最新看的電影類型為正向刺激,相反,沒有看的類型為負面遺忘,如果用戶某一段時間一直觀看某類型的電影,那么在該時間段內(nèi),該類型新鮮度就比較高;同時,其他以前喜歡的電影類型新鮮度會逐漸減低。圖2中,F(xiàn)ilm-Noir>Sci-Fi>Drama>Action=Thriller,F(xiàn)ilm-Noir即為用戶新的興趣方向,Action、Drama、Thriller在傳統(tǒng)基于內(nèi)容方法中所占權重是一樣的,但是按照新鮮度計算,Drama的新鮮度要比Action、Thriller要高,所以推薦Drama類型的電影比Action、Thriller有效性要高。如果用戶繼續(xù)觀看Film-Noir類型相關的電影,F(xiàn)ilm-Noir類型權重會繼續(xù)增強,相反其他類型會逐漸降低;如果用戶對Film-Noir類型是階段性的喜歡,也不會影響長久興趣的改變。所以,通過對用戶歷史記錄計算,可以觀察用戶興趣的變化趨勢,通過用戶當前興趣度挖掘出用戶新的潛在興趣。

      4 結(jié) 語

      人類的自然遺忘是一個漸進的過程,我們可以假設用戶興趣變化也遵從這一規(guī)律,用戶的興趣會隨時間的變化而發(fā)生變化。用戶最近最多訪問的往往可以代表用戶當前的興趣方向,而很久沒有去訪問的,就會逐漸被遺忘。本文對用戶當前興趣類型新鮮度計算設計了一個初步的算法模式,但是遺忘的速度也是有快慢的,會隨著時間的增加逐漸增強。所以在后續(xù)的研究工作中可以根據(jù)時間計算遺忘下降比例速率,來更好地計算用戶對特征屬性歷史興趣度和當前興趣度。

      [1] 曾春,吳瀟,周立柱.個性化服務技術綜述[J].軟件學報,2009,20(22):350-363.

      [2] Will H,Larry S,Mark R,et al.Recommending and Evaluating Choices in a Virtual Community of Use[C]//Proc of CHI,1995:194-201.

      [3] GregLinden B S,Jeremy Y.Amazon.com Recommendations:Item-to-Item Collaborative Filtering[J].IEEE Internet Computing,2003,7(1):76-80.

      [4] 曹毅,賀衛(wèi)紅.基于內(nèi)容過濾的電子商務推薦系統(tǒng)研究[J].計算機技術與發(fā)展,2009,19(6):182-185.

      [5] Goldberg D,Nichols D,Oki B M,et al.Using Collaborative Filtering to weave an information Tapestry[J].Communications of the ACM,1992,35(12):61-70.

      Updating Algorithm of User Interest Model Based on User Behavior Feedback

      LI Qiang

      (Chongqing University of Posts and Telecommunications,Chongqing 400065, China)

      In the personalized recommendation system, the user model is the main basis of the recommended system, the model directly affects the quality of the recommended system. However, in practical applications, the user interest will change with the environment and time, it is possible to recommend the goods do not meet the user′s current interest needs. This paper presents an algorithm to record the user′s current interest model self-renewal. By setting the user interest model to the user historical access data, the time is the main line, and the user′s current interest is counted. In this paper, the Movielens film data set is used as the data source, and the user interest model updating algorithm based on user behavior feedback is applied in the design of the personal recommendation system, which effectively alleviates the problem of user interest offset and improves the recommendation quality.

      user interest model; recommendation system; interest offset

      2017-03-07

      李強(1988-),男,江蘇徐州人,在讀碩士研究生,主要從事數(shù)據(jù)挖掘方面的研究.

      10.3969/i.issn.1674-5403.2017.02.020

      TP31

      A

      1674-5403(2017)02-0075-04

      猜你喜歡
      特征詞新鮮度歷史
      基于改進TFIDF算法的郵件分類技術
      產(chǎn)品評論文本中特征詞提取及其關聯(lián)模型構(gòu)建與應用
      新歷史
      全體育(2016年4期)2016-11-02 18:57:28
      歷史上的6月
      歷史上的八個月
      歷史上的4月
      面向文本分類的特征詞選取方法研究與改進
      基于TTI的冷鮮羊肉新鮮度研究
      不同新鮮度金槍魚肉蒸煮品質(zhì)的研究
      幾種魚體新鮮度快速檢測方法的研究進展
      通许县| 饶阳县| 凤山县| 上犹县| 团风县| 内丘县| 翁源县| 永年县| 清丰县| 五原县| 宁远县| 柳林县| 浠水县| 九江市| 新兴县| 商城县| 雅安市| 南雄市| 射阳县| 从化市| 福泉市| 湾仔区| 宾阳县| 峨眉山市| 台湾省| 肃宁县| 永泰县| 永城市| 三门峡市| 昂仁县| 彭州市| 阳朔县| 柯坪县| 措美县| 东阳市| 拜泉县| 黄骅市| 新河县| 青河县| 遵义市| 海阳市|