• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      多階段推薦算法在校園交易平臺中的應(yīng)用研究

      2021-05-12 07:08:56張若萱馬嘉駿張釗銘吳夢歌潘韻竹劉海龍
      信息記錄材料 2021年3期
      關(guān)鍵詞:冷啟動交易平臺物品

      張若萱,董 晨,馬嘉駿,張釗銘,吳夢歌,潘韻竹,劉海龍

      (天津理工大學(xué)計算機科學(xué)與工程學(xué)院 天津 300384)

      1 引言

      大學(xué)校園交易平臺為學(xué)生學(xué)習(xí)、生活帶來便利,建立大學(xué)校園交易平臺成為新的應(yīng)用需求,但面對海量商品,如何快速、精準(zhǔn)的為買家匹配到心儀商品,推薦算法成為關(guān)鍵。本文針對校園交易不同階段使用多階段推薦算法,實現(xiàn)個性化商品推薦。第一階段用戶和商品數(shù)量少,基于用戶注冊信息,使用XGBoost算法實現(xiàn)商品推薦。第二階段用戶和商品數(shù)量較大,采用基于物品和用戶的協(xié)同過濾實現(xiàn)個性化商品推薦。第三階段隨著交易增多和交流圈建立,信息與數(shù)據(jù)變得更為龐大,文本型數(shù)據(jù)較多,加入自然語言處理算法,使商品推薦更加精確高效。

      2 多階段推薦算法設(shè)計

      多階段推薦算法流程見圖1。

      圖1 多階段推薦算法流程

      2.1 第一階段推薦算法設(shè)計

      這一階段處于交易平臺的起步,用戶和商品數(shù)據(jù)較少,需要解決用戶冷啟動,物品冷啟動,系統(tǒng)冷啟動問題[1]。為了提高商品推薦的準(zhǔn)確度,基于注冊用戶的信息和興趣標(biāo)簽訓(xùn)練決策樹模型,設(shè)計初步的用戶畫像。使用XGBoost算法對數(shù)據(jù)集進(jìn)行預(yù)測,Boosting是一種非常有效的集成學(xué)習(xí)算法,采用Boosting算法將弱分類器轉(zhuǎn)化為強分類器,解決各類冷啟動問題,流程如下。

      (1)初始化模型為常數(shù)

      (2)計算錯誤率

      (3)計算αm= log((1-errm) /errm)

      根據(jù)迭代結(jié)果,輸出用戶和商品關(guān)系矩陣,矩陣元素(用0,1表示)表示此用戶是否會對該產(chǎn)品感興趣。

      2.2 第二階段推薦算法設(shè)計

      第二階段交易平臺中用戶和商品數(shù)據(jù)量較大,采用基于物品的協(xié)同過濾和基于用戶的協(xié)同過濾算法實現(xiàn)商品推薦。

      2.2.1 基于物品的協(xié)同過濾算法

      在交易平臺中,很多學(xué)生會多次購買具有相似特征的商品,根據(jù)這一特點,采用基于物品的協(xié)同過濾算法進(jìn)行推薦[2]。

      (1)相似度計算

      為了減小活躍用戶對結(jié)果的影響,考慮IUF(即用戶活躍度對數(shù)的倒數(shù)),這時認(rèn)為活躍用戶對物品相似度的貢獻(xiàn)應(yīng)該小于不活躍用戶。

      為方便計算和訓(xùn)練,進(jìn)一步將相似度矩陣歸一化:

      (2)根據(jù)預(yù)測值計算

      根據(jù)以下公式:

      pu,j表示u對物品j的興趣,N(u)表示用戶喜歡的物品集合,S(j,k)表示和物品j最相似的K個物品集合(j是這個集合中的某一個物品),Wji表示物品j和物品i的相似度,rui表示用戶u對物品i的興趣(對于隱反饋數(shù)據(jù)集,如果用戶u對物品i有過行為,rui都等于1。

      2.2.2 基于用戶的協(xié)同過濾算法

      大學(xué)校園中很多學(xué)生偏好相同,會出現(xiàn)購買商品相似度較高的情況。基于這一特點,采用基于用戶的協(xié)同過濾算法能夠較好地實現(xiàn)精準(zhǔn)推薦。

      (1)發(fā)現(xiàn)興趣相似的用戶

      通常用Jaccard公式或者余弦相似度計算兩個用戶之間的相似度。設(shè)N(u)為用戶u喜歡的物品集合,N(v)為用戶v喜歡的物品集合,Jaccard公式:

      余弦相似度:

      通過建立“物品-用戶”倒排表,可計算出兩個用戶之間的相似度。

      (2)推薦商品

      (3)輸出推薦結(jié)果

      將以上兩個推薦算法結(jié)果進(jìn)行加權(quán)評分,得到用戶偏好的商品列表并排名,直接進(jìn)行推薦。

      2.3 第三階段推薦算法設(shè)計

      隨著交易圈的擴大,平臺用戶數(shù)量和商品信息量驟增,文本數(shù)據(jù)較多,為發(fā)揮文本數(shù)據(jù)作用,使預(yù)測更加準(zhǔn)確,引入自然語言處理詞袋模型和TF-IDF算法。

      (1)詞袋模型

      使用詞袋模型表示文本,將文本轉(zhuǎn)化為文檔中單詞出現(xiàn)次數(shù)的矩陣,主要步驟如下:

      1)文本分詞:使用jieba分詞器將文本數(shù)據(jù)分詞。

      2)構(gòu)建詞匯表:將文本語料庫中的所有單詞進(jìn)行標(biāo)號,存儲在本地數(shù)據(jù)庫中,并建立索引加快查找速度。

      3)詞向量表示:每個單詞都表示為一個n維向量,在詞匯索引位置為1,其他為0。

      4)統(tǒng)計頻次:統(tǒng)計每個文本中單詞出現(xiàn)的頻次,用向量的形式表示文本關(guān)鍵字。

      (2)運用TF-IDF算法評估關(guān)鍵字

      在得到文本的向量表示后,希望將文檔中出現(xiàn)頻繁卻不是關(guān)鍵字的詞語權(quán)重降低,采用TF-IDF算法,即:

      (3)訓(xùn)練模型

      此時可以采用第二階段設(shè)計方法,在訓(xùn)練數(shù)據(jù)集中加入處理后的文本關(guān)鍵字,比如用戶評論,交友圈的文本內(nèi)容,得到更為準(zhǔn)確的商品推薦結(jié)果。

      3 結(jié)論

      本實驗主要基于交易平臺中的3000名用戶數(shù)據(jù)進(jìn)行測試,分別使用協(xié)同過濾算法和多階段推薦算法進(jìn)行商品推薦,如果用戶對推薦結(jié)果滿意則打分1,不滿意打分0,將打分總數(shù)/打分人數(shù)計算準(zhǔn)確率,圖2為推薦結(jié)果準(zhǔn)確率比較。

      圖2 推薦算法準(zhǔn)確率比較

      從圖2可以看出,在平臺交易的不同階段,使用多階段推薦算法,準(zhǔn)確率都比僅使用協(xié)同過濾算法高,表明多階段推薦算法更適合校園交易流程。

      猜你喜歡
      冷啟動交易平臺物品
      輕型汽油車實際行駛排放試驗中冷啟動排放的評估
      稱物品
      基于學(xué)習(xí)興趣的冷啟動推薦模型
      客聯(lián)(2021年2期)2021-09-10 07:22:44
      公共資源交易平臺構(gòu)建及體制機制創(chuàng)新
      “雙十一”,你搶到了想要的物品嗎?
      誰動了凡·高的物品
      環(huán)太湖藝術(shù)品交易平臺上線
      基于Android的C2C交易平臺關(guān)鍵技術(shù)研究
      找物品
      交易平臺應(yīng)兼顧效率和公平
      博罗县| 巧家县| 石嘴山市| 青岛市| 商水县| 会宁县| 富源县| 托克逊县| 瓦房店市| 奉新县| 班玛县| 扎赉特旗| 阜南县| 那曲县| 盘锦市| 故城县| 林口县| 东兴市| 分宜县| 桓仁| 洛宁县| 盐亭县| 温宿县| 吐鲁番市| 望江县| 涿州市| 蓬安县| 合江县| 新田县| 正蓝旗| 乳源| 黄龙县| 苗栗市| 饶平县| 汪清县| 黄冈市| 景泰县| 尼木县| 徐汇区| 凤城市| 北海市|