• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      用戶信任和項目偏好融合的協(xié)同過濾算法研究

      2019-09-10 03:50:36楊俊芳
      科海故事博覽·中旬刊 2019年4期
      關鍵詞:模糊聚類信息融合協(xié)同過濾

      摘 ?要 ?電子商務的快速發(fā)展為企業(yè)帶來了新的契機,同時由于網(wǎng)站物品種類的增多,基數(shù)變得龐大,尋求需求物品信息變得麻煩且費時。電子商務中對用戶商品的推薦就是利用資源信息進行整合過后向用戶推薦的過程。協(xié)同過濾算法的優(yōu)越性使它成為目前最成功的方法。Memory-based協(xié)同過濾算法有User-based以及Item-based兩種協(xié)同過濾算法。在實際的電子商務中,用戶對商品的使用或者評分評價總量不超過所有總量的百分之一,其影響了“用戶-項目評分數(shù)據(jù)集”的缺失,影響了推薦精度,對此本文針對用戶信任以及項目偏好的融合進行了協(xié)同過濾算法的研究。

      關鍵詞 ?協(xié)同過濾 ?信息融合 ?推薦系統(tǒng) ?模糊聚類

      引言:

      Memory-based協(xié)同過濾算法最核心的要點就是用戶對某一商品的評價。系統(tǒng)通過數(shù)據(jù)的整合統(tǒng)計對用戶進行分組,在研究中稱之為鄰居,他們的偏好和目標用戶偏好之間具有較高的一致性。這種評價數(shù)據(jù)由于商品的總占比很低而造成了稀疏性,因此引起了用戶組合定位的不精準。Item-based系統(tǒng)過濾算法的缺陷是因為只能通過用戶已購買商品進行推薦,用戶的興趣無法提前挖掘,進行“跨類型”推薦[1]。

      一、協(xié)同過濾相關工作

      不管是User-based還是Item-based,兩者都是利用了用戶對商品評價的數(shù)據(jù)來對目標用戶實現(xiàn)目標推薦。其中User-based算法在進行運算時并沒有充分進行興趣與購買商品關系的調(diào)整。Item-based算法則沒有充分做好鄰居的興趣項目與目標用戶之間關系的調(diào)整[2]。

      本文針對用戶信任和項目偏好相融合的協(xié)同過濾算法的研究整合了User-based以及Item-based的基本算法理論。結合了模糊聚類算法,利用相關算法實現(xiàn)相近項目以及用戶之間的類聚[3]。

      這種評價的數(shù)據(jù)算法在電子商務中體現(xiàn)為通過以往用戶群對某一種商品進行評價來使目標用戶對該商品關注點進行預測的過濾過程。通過矩陣R(m,n)來體現(xiàn)該數(shù)據(jù),用戶以及項目在該矩陣中分別用行列表示;也可以利用行向量R來表示“用戶-項目”評分數(shù)據(jù)R=[u1,u2,……,um]T,UK=[RK1,RK2,……,RKn]T,k=1,2,……,m或者列向量R=[t1,t2,……,tn],tl=[R1l,R2l,……,Rml],l=1,2,……,n。其中表示某用戶UK對某項目tl的評分。

      User-based算法,就是依據(jù)最接近的鄰居對商品的評價數(shù)據(jù)進行目標客戶的商品推薦過程。這種算法最中心的要點就是尋找一個精準的鄰居集(鄰集的選擇可以使用K近鄰法和閾值的設立,后者要注意在進行閾值設立的過程中應嚴格控制好數(shù)值的高低,太高或者太低會造成項目的缺少和無篩選意義)。相似鄰居查找準確度以及效率定位了User-based算法的有效性。鄰居相似度度量計算中的相關性計量sim(x,y)表示為

      其中Rxs和Rys分別代表用戶x和用戶y對項目s的評分;Rx和Ry表示用戶x、y對項目的平均評分;Sxy表示用戶x、y的交集。

      沒有進行評分評價的項目預測表達式如下:

      其中x、p、lu分別表示項目、用戶、相似用戶數(shù)。

      “Item-based協(xié)同過濾算法”與“User-based協(xié)同過濾算法”的要點具有一定的相似性,其中只是對“歷史評分數(shù)據(jù)集”的相識度計算進行了“用戶相似度”的替換。

      項目進行相似度計算過后相似項目集選取的公式如下

      評分Pus中u、s、lt、sim(s,d)表示預測用戶,未平項目,相識項目數(shù),項目相似度。

      協(xié)同過濾的算法過程如圖2-3

      協(xié)同過濾的過程中,矩陣m×n目的是進行相似用戶的尋找,如果對某一種商品越有興趣,在矩陣中體現(xiàn)為評價分數(shù)越高,在進行推薦前要進行預測以及最終的推薦。如果用戶沒有進行商品集合,但是在相同商品的學者用戶中對物品集合有著較高的評價,就會按照預測評分對目標用戶進行相應推薦。

      二、用戶信任和項目偏好相融合的協(xié)同過濾算法

      要充分實現(xiàn)用戶信任以及項目偏好之間互相通過的協(xié)同過濾算法的最基本思想就是用戶進行商品評價數(shù)據(jù)以及商品屬性的充分利用來實現(xiàn)目標用戶的商品推薦。項目協(xié)同過濾法的評分數(shù)據(jù)極為稀疏,相似用戶的集合難以準確定位[4]。

      研究過程主要分為三步:第一步,模糊聚類,對象是用戶對商品的評價數(shù)集;第二步,進行沒有評價項目的初始預測,并且將預測的數(shù)據(jù)填充于評分數(shù)據(jù)集中;第三步,通過計算所擁有的數(shù)據(jù),算出相似用戶集,完成所有項目的評分以及預測評分。

      (一)未評分項目的初始預測

      把評分數(shù)據(jù)接近的項目進行一個簇的聚集叫做聚類分析,在一個簇中利用協(xié)同過濾法進行沒有評分項目的用戶預測評分,通過該手段可以降低評分數(shù)據(jù)稀疏性和計算維度[5]。

      第一步,把“模糊c-均值算法”運用到用戶對商品評價數(shù)據(jù)的矩陣R中,并進行劃分,R1,R2,R3,……,Rc,其中R1∪R2∪R3……∪Rg=R,Ri∩Rj=φ。

      第二步,進行ua和Ruata所屬類的查找,如果Ruata∈Ri,,則Ri中的項目可以作為沒有評分項目的鄰居。

      第三步,在類似Ri中利用相關相似性作為度量函數(shù)的計算,未評分項目ta與鄰居項目tb相似度關系為:

      第四步,進行ua對ta的評分P的預測以及評價數(shù)據(jù)矩陣的填充,P的表達式為:

      (二)未評分項目的評分預測

      進行預測填充的用戶對商品評價數(shù)據(jù)矩陣通過模糊c-均值聚類法進行興趣相近的用戶分配,利用簇中的相關用戶進行商品的預測評價[6]。具體計算步驟如下:

      第一步,使用模糊c-均值算法與用戶對商品評價數(shù)據(jù)矩陣A中,將其分為g類:A1,A2,A3,A4,……,Ag,其中A1∪A2∪A3……∪Ag=A,Ai∩Aj=φ。

      第二步進行Ua鄰居的確定,Ua∈Ai則Ai中的用戶即為Ua的鄰居。

      第三步,計算Ua的與Ua的一致程度,查找Ai中目標用戶與其他用戶在初始評分數(shù)矩陣中項目并集S,其中沒有進行評分的項目通過(一)中步驟進行填充,在S中利用相關相似性度量的方法進行相似度計算。

      第四步,在Ai中,將沒有進行評價的項目實現(xiàn)預測評分。

      三、實驗以及結果分析

      利用Minnesota GroupLens Research的MovieLens數(shù)據(jù)集進行了一個實驗,在MovieLens數(shù)據(jù)集中對200個用戶的800部電影評分數(shù)據(jù)進行截取,然后進行訓練集和測試集的劃分,其比例為0.8,并在所測試的對象中選擇五個評價作為透明。

      采用MEA(Mean Absolute Error)來進行上述幾種算法的科學性和準確性測量,最終得到的MAE值的大小表明了對應算法效果的優(yōu)劣與推薦商品精準性的高低。測試集中項目評分和用戶的MAE表示為

      該式子中Pxs、Rxs、L分別代表用戶x對項目s的評分值預測、x對s的實際評分、測試集合基數(shù)。

      實驗將基于“用戶的協(xié)同過濾算法”、“用戶聚類的協(xié)同過濾算法”進行協(xié)同參照,計算出每個絕對值偏差MAE,通過MAE比較來進行推薦算法的質(zhì)量比較。最終的實驗結果為:“用戶的協(xié)同過濾算法”、“用戶聚類的協(xié)同過濾算法”MAE分別為0.7824、0.8205,而融合了用戶以及項目信息的協(xié)同過濾法MAE為0.7621。該實驗結果表明在三種方法中本文所探究的計算方法所算出的MAE最小,同時也驗證了該種算法所進行推薦商品的質(zhì)量最高。

      四、結束語

      我們通過研究發(fā)現(xiàn),基于用戶的協(xié)同算法的計算的復雜度是遠高于基于條目的復雜度,所以在不同的使用場景我們需要根據(jù)產(chǎn)品和用戶需求,以及使用環(huán)境來選擇合適的算法。

      基于用戶信任和項目偏好相融合的協(xié)同過濾算法擁有自己強大的優(yōu)勢,首先我們可以看出利用用戶相似度矩陣給出的推薦一般在多樣性上都是會有比較好的結果,但是用戶的收藏不一定相似,其實這樣反而給用戶的收藏補充了新的內(nèi)容,這樣可能也會存在一些沒有用的噪聲,但是他也能給用戶帶來不一樣的驚喜。 基于用戶信任和項目偏好相融合的協(xié)同過濾算法也有自己明顯的缺點,當我們把他運用到大規(guī)模的系統(tǒng)中的時候,系統(tǒng)的計算量會明顯劇增,非常大,對硬件要求比較高。同事用戶沒有新的內(nèi)容收藏,這個時候就不會有先的內(nèi)容推薦。如果用戶相似度比較小,這時為用戶計算相似用戶難度就比較大,這也是基于用戶信任和項目偏好相融合的協(xié)同過濾算法的缺點。

      在基于用戶信任和項目偏好相融合的協(xié)同過濾算法中,充分進行了用戶對商品評價數(shù)據(jù)相關信息的利用,極大程度地降低了數(shù)據(jù)的稀疏性,提高了項目預算結構的精準性。同時引入了模糊聚類的算法思想,減小了維度以及計算量,提高了預算速率。該方法在用戶信任、相似性以及屬性多個方面進行了傳統(tǒng)算法的改進,相關的實驗結果也給予了肯定,但是評分時間的納入、云散復雜度的減小依然需要進一步探討和研究。

      參考文獻:

      [1]王艷. 融合信任關系的協(xié)同過濾算法改進研究[D]. 北京交通大學, 2017.

      [2]楊秀梅, 孫詠, 王丹妮,等. 融合用戶信任模型的協(xié)同過濾推薦算法[J]. 計算機系統(tǒng)應用, 2016, 25(7):165-170.

      [3]何明, 孫望, 肖潤,等. 一種融合聚類與用戶興趣偏好的協(xié)同過濾推薦算法[J]. 計算機科學, 2017, 44(b11):391-396.

      [4]鄭潔, 錢育蓉, 楊興耀,等. 基于信任和項目偏好的協(xié)調(diào)過濾算法[J]. 計算機應用, 2016, 36(10):2784-2788.

      [5]朱愛云, 任曉軍. 基于社會信任和隱式項目的協(xié)同過濾推薦算法的研究[J]. 現(xiàn)代計算機(專業(yè)版), 2018(5).

      [6]王明佳, 韓景倜. 基于用戶對項目屬性偏好的協(xié)同過濾算法[J]. 計算機工程與應用, 2017, 53(6):106-110.

      作者簡介:楊俊芳,對外經(jīng)濟貿(mào)易大學高級研修班。

      猜你喜歡
      模糊聚類信息融合協(xié)同過濾
      大數(shù)據(jù)背景下的信號處理分析
      多傳感器圖像融合技術
      基于鏈式存儲結構的協(xié)同過濾推薦算法設計與實現(xiàn)
      軟件導刊(2016年11期)2016-12-22 21:40:40
      基于相似傳播和情景聚類的網(wǎng)絡協(xié)同過濾推薦算法研究
      大數(shù)據(jù)環(huán)境下基于多維信息融合的高校教學評價
      亞太教育(2016年35期)2016-12-21 20:08:33
      一種無人飛艇高度傳感器信息融合方法
      基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
      混合推薦算法在電影推薦中的研究與評述
      基于MATLAB回采巷道圍巖分類可視化系統(tǒng)開發(fā)及應用
      模糊聚類在區(qū)域環(huán)境質(zhì)量評價中的運用
      卓资县| 酒泉市| 玉环县| 山丹县| 蒙阴县| 贵定县| 景泰县| 峨眉山市| 泰顺县| 谢通门县| 武穴市| 清苑县| 达拉特旗| 温泉县| 吉木萨尔县| 怀仁县| 乐至县| 子洲县| 永福县| 铜陵市| 阿拉善盟| 兰考县| 达日县| 芜湖市| 富民县| 祁门县| 昭通市| 昌平区| 万载县| 富平县| 包头市| 湘西| 聂拉木县| 通渭县| 漳平市| 沧州市| 施秉县| 云浮市| 文水县| 齐齐哈尔市| 建湖县|