• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于內容的互聯(lián)網推薦算法

      2017-04-22 12:31:33吳佳芬
      科教導刊·電子版 2016年36期
      關鍵詞:推薦算法推薦系統(tǒng)互聯(lián)網

      吳佳芬

      摘 要 本文介紹了網絡推薦的算法思想、幫助讀者了解這個研究領域。在介紹了推薦系統(tǒng)的概念和定義之后,重點介紹了基于內容的互聯(lián)網推薦算法。

      關鍵詞 推薦系統(tǒng) 推薦算法 互聯(lián)網

      中圖分類號:TP391.3 文獻標識碼:A

      1推薦系統(tǒng)概念

      互聯(lián)網規(guī)模和覆蓋面的迅速增長帶來了信息超載問題。過量信息的呈現(xiàn)使得用戶付出過高的代價來搜索對自己有用的信息,從而降低了信息使用的效率。推薦系統(tǒng)作為一種信息過濾的重要手段,是當前解決信息超載問題非常有潛力的方法。推薦系統(tǒng)與以搜索引擎為代表的信息檢索系統(tǒng)最大的區(qū)別在于:(1)搜索注重結果之間的關系和排序,推薦則還研究用戶模型和用戶的喜好,基于社會網絡進行個性化的計算;(2)搜索的進行由用戶主導,包括輸入查詢詞和選擇結果,結果不好用戶會修改查詢再次搜索,而推薦系統(tǒng)是由系統(tǒng)主導用戶的瀏覽順序,引導用戶發(fā)現(xiàn)需要的結果。

      推薦系統(tǒng)的定義較多,目前被廣泛引用的推薦系統(tǒng)的非形式化概念是Resnick和Varian給出的:“它是利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什么產品,模擬銷售人員幫助客戶完成購買過程”。

      推薦系統(tǒng)有3個重要的模塊:用戶建模模塊、推薦對象建模模塊、推薦算法模塊。推薦系統(tǒng)把用戶模型中興趣需求信息和推薦對象模型中的特征信息匹配,同時使用相應的推薦算法進行計算篩選,找到用戶可能感興趣的推薦對象,然后推薦給用戶。

      2效用矩陣

      在推薦系統(tǒng)應用當中,存在兩類元素,一類稱為用戶,另一類稱為項。用戶會偏愛某些項,這些偏好信息必須要從數(shù)據(jù)中梳理出來。數(shù)據(jù)本身會表示成一個效用矩陣,該矩陣中每個用戶-項所對應的元素值代表的是當前用戶對當前項的喜好程度。這些喜好程度值來自一個有序集合,比如1~5的整數(shù)集合,這些整數(shù)代表用戶對項的評級。假設該矩陣是稀疏的,即大部分元素都未知。一個未知的評級也暗示著人們對當前用戶對當前項的喜好信息還不清楚。推薦系統(tǒng)的目標是預測效用矩陣的空白元素。

      3基于內容的推薦

      基于內容的推薦方法根據(jù)用戶已經選擇的對象,從推薦對象中選擇其他特征相似的對象作為推薦結果。這一推薦策略首先提取推薦對象的內容特征,和用戶模型中的用戶興趣偏好匹配,匹配度較高的推薦對象就可以作為推薦結果推薦給用戶。

      3.1文檔集的處理

      對于文檔對象內容特征(content(s))的選取常用的做法是使用TF-IDF值。另一方面,用戶的興趣偏好模型userprofile(c)取決于所用機器學習方法,常用的有決策樹、貝葉斯分類算法、基于向量的表示方法等。結合對象內容特征和用戶興趣偏好模型,計算二者之間的相似性是該推薦策略中的一個關鍵部分,如下所示就是計算該相似性的一個函數(shù):

      其中score的計算方法有很多種,例如使用最簡單的向量夾角余弦的距離計算方法,按所得值的大小排序,將最靠前的若干個對象作為結果呈現(xiàn)給用戶。

      3.2基于Tag的特征獲取

      基于內容的推薦策略的關鍵就是用戶模型描述和推薦對象內容特征描述。目前對文本內容進行特征提取方法比較成熟,如瀏覽頁面的推薦、新聞推薦等。但當前網上的多媒體信息大量涌現(xiàn),而對這些多媒體數(shù)據(jù)進行特征提取還有待技術支持。以圖像數(shù)據(jù)為例,圖像的問題在于它們的數(shù)據(jù)通常由像素數(shù)組構成,而這些數(shù)據(jù)無法給出任何有關它們特征的信息。人們可以計算像素的簡單屬性,比如整幅圖像中紅色的平均數(shù)據(jù),但很少會有用戶去查找紅色圖像或對紅色圖像有特別的愛好。

      通過邀請用戶采用詞語或短語對圖像進行標記,則可以從這些標記中獲得有關圖像特征的信息。因此,某個紅色為主的圖像可能被標記為“Tiananmen Square”,而另一個圖像被標記為“sunset at Malibu”。這兩者之間的區(qū)別很難通過已有的圖像分析程序來發(fā)現(xiàn)。

      幾乎任意數(shù)據(jù)都可以基于其標簽來發(fā)現(xiàn)特征。一個最早的試圖標記大量數(shù)據(jù)的網站是del.icio.us,它邀請用戶來標記Web網頁,該網站后來被雅虎收購。這種標記的目的是支持一種新的可用的搜索方式,即當用戶輸入標簽集合作為搜索查詢時,系統(tǒng)會返回采用這些標簽來標記的Web網頁,在推薦系統(tǒng)中也可以使用這些標簽。如果系統(tǒng)發(fā)現(xiàn)用戶檢索或收藏包含某個標簽集合的很多網頁,系統(tǒng)就可以將其他包含同樣標簽的網頁推薦給他。

      參考文獻

      [1] 許海玲,吳瀟,李曉東,閻保平,互聯(lián)網推薦系統(tǒng)比較研究[J].軟件學報,2009:350-362.

      [2] P.Resnick,H.R.Varian,Recommender systems,Commun.ACM,40(1997):56-58.

      [3] G.Adomavicius,A.Tuzhilin, Toward the next generation of recommender systems:a survey of the state-of-the-art and possible extensions, Knowledge and Data Engineering, IEEE Transactions on,17 (2005):734-749.

      猜你喜歡
      推薦算法推薦系統(tǒng)互聯(lián)網
      基于用戶偏好的信任網絡隨機游走推薦模型
      基于相似傳播和情景聚類的網絡協(xié)同過濾推薦算法研究
      基于個性化的協(xié)同過濾圖書推薦算法研究
      社交網絡推薦系統(tǒng)
      個性化推薦系統(tǒng)關鍵算法探討
      混合推薦算法在電影推薦中的研究與評述
      淺談Mahout在個性化推薦系統(tǒng)中的應用
      一種改進的基于位置的推薦算法
      軟件導刊(2016年9期)2016-11-07 17:58:16
      從“數(shù)據(jù)新聞”看當前互聯(lián)網新聞信息傳播生態(tài)
      今傳媒(2016年9期)2016-10-15 22:06:04
      互聯(lián)網背景下大學生創(chuàng)新創(chuàng)業(yè)訓練項目的實施
      考試周刊(2016年79期)2016-10-13 23:23:28
      深泽县| 洞头县| 宜春市| 扎赉特旗| 望江县| 灯塔市| 乌海市| 商水县| 荣昌县| 福建省| 隆回县| 库尔勒市| 陕西省| 临高县| 清涧县| 额尔古纳市| 个旧市| 临汾市| 北辰区| 英吉沙县| 当阳市| 项城市| 军事| 罗甸县| 财经| 井研县| 迭部县| 巩留县| 神农架林区| 普兰店市| 沧源| 婺源县| 铁力市| 清河县| 开平市| 丽水市| 专栏| 原阳县| 洛扎县| 那坡县| 兴隆县|