• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      混合推薦算法在電商相關(guān)領(lǐng)域的應(yīng)用研究

      2024-01-24 14:36:59黃玉盛祝迎春
      電腦知識與技術(shù) 2023年34期
      關(guān)鍵詞:知識圖譜神經(jīng)網(wǎng)絡(luò)

      黃玉盛 祝迎春

      摘要:隨著5G移動通信技術(shù)、虛擬現(xiàn)實和增強現(xiàn)實等技術(shù)的應(yīng)用與普及,電商相關(guān)領(lǐng)域中傳統(tǒng)的單一推薦算法在應(yīng)對日益增長的結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)、多源數(shù)據(jù)的融合和用戶需求多樣等方面逐漸顯露出不足之處。結(jié)合電商相關(guān)領(lǐng)域的現(xiàn)有特點與難點來進行推薦算法的選擇和優(yōu)化改進,混合推薦算法應(yīng)運而生。首先,分析了傳統(tǒng)單個基于二部圖網(wǎng)絡(luò)的、基于知識圖譜的和基于神經(jīng)網(wǎng)絡(luò)推薦算法的特征和優(yōu)缺點;其次,總結(jié)梳理了以上三種類型的混合推薦算法在電商相關(guān)領(lǐng)域的研究現(xiàn)狀;最后,指出混合推薦算法在電商相關(guān)領(lǐng)域應(yīng)用中遇到的困境、不足和未來應(yīng)用研究方向,以期為混合推薦算法在電商相關(guān)領(lǐng)域的深入應(yīng)用提供有力支持。

      關(guān)鍵詞:混合推薦算法;電商相關(guān)領(lǐng)域;二部圖網(wǎng)絡(luò);知識圖譜;神經(jīng)網(wǎng)絡(luò)

      中圖分類號:TP391.3? ? ? 文獻標識碼:A

      文章編號:1009-3044(2023)34-0004-05

      開放科學(xué)(資源服務(wù))標識碼(OSID) :

      0 引言

      近年來,隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展、疫情影響和線下門店成本高等原因,電商直播憑借互動性強、投入成本低和用戶觀看粘性強等特點,讓持續(xù)低迷的傳統(tǒng)電商相關(guān)領(lǐng)域重新燃起了“戰(zhàn)火”,一躍成為蓬勃發(fā)展的行業(yè)。在國家相關(guān)電商相關(guān)領(lǐng)域政策的加持下,電商直播成為新的電商熱點。與此同時,電商相關(guān)領(lǐng)域也面臨著一個重要的挑戰(zhàn),即消費者往往難以從眾多商品中選擇到最適合自己的商品,以實現(xiàn)精準地推薦商品,這也是行業(yè)上俗稱的“信息過載”,而個性化推薦被認為是解決信息過載問題的最有效方法之一。

      個性化推薦算法已在各個行業(yè)得到廣泛應(yīng)用,尤其是在電商領(lǐng)域發(fā)展迅速,如在提升用戶體驗、增加銷量等方面展現(xiàn)出巨大潛力。研究表明個性化推薦算法幫助電商平臺推薦的產(chǎn)品更符合個體用戶的需求、喜好,從而提升購買體驗。傳統(tǒng)的商品推薦算法往往只考慮了用戶的歷史行為,忽略了其他因素對用戶行為的影響,導(dǎo)致推薦的結(jié)果缺乏個性化和多樣性。針對電商相關(guān)領(lǐng)域的特性和推薦難題,混合推薦算法結(jié)合多種算法的優(yōu)點,綜合考慮多種因素對用戶行為的影響,使推薦結(jié)果更加準確、個性化和多樣化。本文針對混合推薦算法在電商相關(guān)領(lǐng)域中的應(yīng)用研究進行梳理和總結(jié),對已有的推薦算法模型、特點和應(yīng)用優(yōu)勢進行探討,進一步梳理分析電商相關(guān)領(lǐng)域中混合推薦算法應(yīng)用遇到的問題,以及解決這些問題的方法和探討未來發(fā)展方向。

      1 個性化推薦算法

      隨著互聯(lián)網(wǎng)技術(shù)的持續(xù)進步,信息技術(shù)領(lǐng)域出現(xiàn)了許多通過計算機傳輸信息的應(yīng)用形式,如電子郵件、個人網(wǎng)站和在線論壇等。用戶很難在眾多的數(shù)據(jù)中精確而快速地獲取滿足自身需求的內(nèi)容,迫切需要一種技術(shù)能夠幫助自己精準地獲取信息。1992年施樂公司的Goldberg等人提出一種融合協(xié)同過濾思想的推薦系統(tǒng),并將其用于垃圾郵件過濾。2001年Amazon最早將推薦系統(tǒng)引入電商相關(guān)領(lǐng)域平臺,并帶來銷售額的大幅度提升,產(chǎn)生了“啤酒與尿不濕”的著名案例。2006年,Netflix在其網(wǎng)站上舉辦了一個推薦算法競賽,目的是鼓勵研究人員發(fā)現(xiàn)更好的算法來提升Netflix的推薦效果。競賽吸引了來自世界各地的研究人員,推動了推薦算法的發(fā)展。隨著在線平臺的廣泛應(yīng)用和電子商務(wù)的快速發(fā)展,推薦系統(tǒng)的普及程度迅速提高,推動了針對書籍、電影、服裝等領(lǐng)域的特定推薦系統(tǒng)的成長。

      目前,隨著“短視頻平臺+直播”成為流量吸引的風(fēng)口,以及第五代移動通信技術(shù)、虛擬現(xiàn)實以及增強現(xiàn)實等技術(shù)的進一步發(fā)展,能夠增強互動性,使內(nèi)容展示更加豐富,這將成為未來電子商務(wù)的新常態(tài)。個性化推薦算法的優(yōu)化升級已成為必然趨勢,不僅可以向用戶提供精準且多樣化的推薦服務(wù),還有助于進一步縮短電商相關(guān)平臺與用戶之間的距離。因此,需要深入研究個性化推薦算法,并不斷加強理論和實際的聯(lián)系,為用戶提供良好應(yīng)用體驗。通過對現(xiàn)有的推薦算法進行梳理分析,本文對基于二部圖網(wǎng)絡(luò)的、基于知識圖譜的和基于神經(jīng)網(wǎng)絡(luò)的推薦算法進行介紹。

      1.1 基于二部圖網(wǎng)絡(luò)的推薦算法

      基于二部圖的推薦算法是Aggarwal于1999年率先提出的,其特點將用戶與物品看作二部圖網(wǎng)絡(luò)中的節(jié)點,且可以用一個無權(quán)無向的二部網(wǎng)絡(luò)G(U,O,E)表示。該二部網(wǎng)絡(luò)的功能是描述用戶和物品之間的關(guān)系的,其中U、O和E分別為用戶集、物品集和用戶行為的集合。其主要思想是通過用戶和物品之間的選擇關(guān)系建立用戶-物品的二部圖模型,然后利用資源分配等算法為用戶提供個性化的推薦[1]。例如協(xié)同過濾算法(Collaborative Filtering,CF) 、質(zhì)量擴散算法(Mass Diffusion,MD) 和熱傳導(dǎo)算法(Heat Conduction,HC) 。

      CF算法是最早、最流行且應(yīng)用最廣泛的推薦算法,其基本思想是“物以類聚,人以群分”的群體智慧理念。簡單來說,利用與目標用戶有相同興趣和愛好的用戶的偏好來進行推薦。其主要分為兩類:基于用戶的協(xié)同過濾(User-based CollaboratIve Filtering,UCF) 和基于物品的協(xié)同過濾(Item-based Collaborative Filtering,ICF) ,這兩種算法的區(qū)別在于計算相似度矩陣的參考對象不同。UCF是以用戶為中心,計算用戶之間的相似度。ICF是以物品為中心,計算物品與物品之間的相似性,通過尋找目標用戶購買過的類似物品并推薦給用戶。在計算用戶與用戶或物品與物品之間的相似性矩陣時,常用的相似性計算方法有余弦相似度和Jaccard相似系數(shù)。

      CF算法在實踐中被廣泛使用,具有良好的推薦效果。其優(yōu)點是具有推薦準確度高、良好的擴展性且不需要物品的特征屬性,完全依靠用戶的行為數(shù)據(jù)。然而,由于其完全依賴用戶行為數(shù)據(jù),導(dǎo)致冷啟動問題(新產(chǎn)品或新用戶沒有足夠的行為數(shù)據(jù))和因用戶行為稀疏而導(dǎo)致的相似度矩陣稀疏。

      MD算法采用了物質(zhì)流動的思想。將初始能量給目標用戶選擇的物品節(jié)點,然后根據(jù)物品選擇關(guān)系將物品節(jié)點的能量平均分配給選擇了該物品的用戶節(jié)點,再根據(jù)用戶節(jié)點的能量除以用戶節(jié)點的度的規(guī)則,將用戶節(jié)點上的能量傳回物品節(jié)點。經(jīng)過兩次能量的傳遞,每個物品節(jié)點上都有相應(yīng)的能量。HC算法與MD算法類似。兩者都給被目標用戶選中的物品節(jié)點分配一個初始能量,但能量傳遞時的規(guī)則和資源分配方法不同。

      基于二部圖的推薦算法是一種常見的推薦算法,它將用戶和物品看作兩個獨立的節(jié)點集合,通過構(gòu)建二部圖模型來預(yù)測用戶對物品的評分和偏好,可以不受推薦類型的限制,而且魯棒性強、算法易實現(xiàn)且計算過程不復(fù)雜等優(yōu)點。由于其過于依賴用戶與物品的選擇關(guān)系,即用戶的行為數(shù)據(jù),因此無法很好地解決冷啟動和數(shù)據(jù)稀疏等問題。

      1.2 基于知識圖譜的推薦算法

      2012年,谷歌公司提出了“知識圖譜”(Knowledge Graph) 的概念,其初衷是以更智能的形式展現(xiàn)搜索引擎的返回結(jié)果,提升用戶體驗。知識圖譜是一種解釋實體之間關(guān)系的語義網(wǎng)絡(luò),以結(jié)構(gòu)化的三元組形式描述現(xiàn)實世界中的事物及其相互關(guān)系,已廣泛應(yīng)用于語義搜索、問答、推薦和文本理解與生成等方面。<雷軍,創(chuàng)辦,小米>是一個知識三元組,“雷軍”“小米”是現(xiàn)實世界中的兩個實體,在知識圖譜中表現(xiàn)為兩個節(jié)點,“創(chuàng)辦”是它們兩個之間的關(guān)系。知識圖譜中的節(jié)點和邊是多對多的關(guān)系,該特點使得知識圖譜中的三元組不僅可以表示實體之間的關(guān)系,也可以存儲知識實體的屬性。

      根據(jù)應(yīng)用知識圖譜的不同形式,分為基于嵌入的方法、基于路徑的方法和混合的方法?;谇度氲闹R圖譜核心思想是利用知識表示模型學(xué)習(xí)到知識圖譜中實體以及關(guān)系的向量表示,并通過這種帶有語義信息的向量表示去擴充原有的用戶與物品的交互信息,進而提高推薦性能[2]?;诼窂降闹R圖譜核心思想是通過挖掘知識圖譜中用戶以及物品之間的路徑關(guān)系來探索知識圖譜實體間的連通性去完成推薦[3]?;旌系姆椒ㄊ侵笇⒒谇度氲姆椒ê突诼窂降姆椒ńY(jié)合起來,以提高知識圖譜的構(gòu)建效率和準確性。基于嵌入的方法通常能夠捕獲實體和關(guān)系的潛在語義信息,而基于路徑的方法則能夠利用知識圖譜中的結(jié)構(gòu)信息?;旌戏椒ㄔ噲D結(jié)合這兩種信息,從而獲得更為準確和魯棒的知識圖譜表示。因此,引入知識圖譜可以為推薦系統(tǒng)帶來三個方面的好處,一是緩解用戶行為的稀疏性;二是豐富的物品屬性,從而學(xué)習(xí)到更全面的物品表示,提升推薦的準確性;三是利用知識圖譜的語義關(guān)系,給出推薦的原因,使推薦結(jié)果具有可解釋性。目前,基于知識圖譜的推薦算法研究仍面臨一些挑戰(zhàn):一是如何有效建模知識圖譜的復(fù)雜結(jié)構(gòu)特征;二是如何捕捉知識圖譜多跳復(fù)雜推理路徑中的語義;三是如何將外部知識有效注入推薦模型中;四是如何處理跨領(lǐng)域知識的推薦;五是如何處理海量知識圖譜的推理和計算。

      1.3 基于神經(jīng)網(wǎng)絡(luò)的推薦算法

      神經(jīng)網(wǎng)絡(luò)是一種由多個神經(jīng)元節(jié)點相互連接而成的計算模型,其基本原理是對輸入數(shù)據(jù)的非線性變換來提取特征,通過多層的全連接層將這些特征進行建模和學(xué)習(xí),挖掘用戶的興趣和偏好特征,根據(jù)這些特征進行個性化推薦。同時,神經(jīng)網(wǎng)絡(luò)可以處理復(fù)雜和動態(tài)的推薦任務(wù),并具有良好的泛化能力。常見的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN) 、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN) 和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN) 等。DNN將用戶和物品的多種特征(如文本、圖像、點擊歷史等)融合到一個統(tǒng)一的稠密向量中,這有助于捕捉用戶和物品之間的復(fù)雜交互關(guān)系,從而獲取用戶的特定興趣提高推薦的相關(guān)性。CNN通過卷積層和池化層來提取數(shù)據(jù)的空間和時間特征,再通過全連接層進行分類或預(yù)測。卷積層通過局部連接和權(quán)重共享的方式,有效地捕捉輸入數(shù)據(jù)中的局部模式和特征,而池化層則用于減小特征圖的尺寸,并保留關(guān)鍵的特征。CNN能夠自動學(xué)習(xí)圖像的特征表示,具有平移不變性和局部連接性等特點,能夠處理大規(guī)模的圖像數(shù)據(jù)集,提高分類和檢測的準確性。因此,其在圖像分類、目標檢測和圖像生成等任務(wù)中表現(xiàn)出色。RNN通過引入循環(huán)結(jié)構(gòu),能夠處理可變長度的序列數(shù)據(jù),并且能夠捕捉序列中的長期依賴關(guān)系。因此,其在許多序列處理任務(wù)中都有廣泛的應(yīng)用,如語言模型、機器翻譯、語音識別、時間序列預(yù)測等領(lǐng)域。RNN的每個時間步的隱藏狀態(tài)會根據(jù)輸入和前一個時間步的隱藏狀態(tài)進行更新,從而實現(xiàn)信息的傳遞和保存,并通過學(xué)習(xí)隱藏狀態(tài)的演化過程,實現(xiàn)對時間序列數(shù)據(jù)進行建模和預(yù)測。而深度學(xué)習(xí)作為神經(jīng)網(wǎng)絡(luò)的一個分支,它使用多層神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)數(shù)據(jù)的深層次特征,由于其強大的建模能力和靈活性,已經(jīng)在許多領(lǐng)域取得了顯著的成果,包括語音識別、圖像處理和自然語言處理等。

      基于神經(jīng)網(wǎng)絡(luò)的推薦算法的架構(gòu)通常由三層組成:輸入層、隱藏層和輸出層。輸入層將用戶在一組物品上的歷史行為作為輸入,如評級、點擊或購買。隱蔽層負責處理這些信息并學(xué)習(xí)數(shù)據(jù)中的基本模式。輸出層為每個物品產(chǎn)生一個預(yù)測的評級,用于為用戶產(chǎn)生推薦。

      神經(jīng)元定義如下:

      [y=fi=0n-1wixi+b]

      公式中,計算輸入[xi]和權(quán)重[wi]的加權(quán)和[wixi](也成為激活值)。此外,[xi]是輸入數(shù)據(jù)的數(shù)值或其他神經(jīng)元的輸出(如果神經(jīng)元是神經(jīng)網(wǎng)絡(luò)中的一部分)。權(quán)重[wi]是表示輸入強度或神經(jīng)元之間連接強度的數(shù)值,權(quán)重b是一個稱為偏置的特殊值,其輸入始終為1。使用加權(quán)和的結(jié)果作為激活函數(shù)f的輸入,激活函數(shù)也成為傳遞函數(shù)。激活函數(shù)有很多類型,但都必須滿足非線性這一必要條件,如Sigmoid函數(shù)、Tanh函數(shù)和ReLu函數(shù)等。

      1.4 混合推薦算法

      為了解決推薦系統(tǒng)中準確性-多樣性不能同時兼顧、數(shù)據(jù)稀疏和冷啟動等問題,眾多的混合算法應(yīng)運而生。這些算法采用多種推薦算法相互融合的方式,以達到最優(yōu)的推薦效果。根據(jù)多種推薦算法的混合方式,分為加權(quán)式、變換式和合并式。其中,加權(quán)式是指分配給推薦算法不同的權(quán)重,將推薦結(jié)果進行加權(quán)混合,得到最終的推薦列表,且權(quán)重不唯一,會隨著推薦結(jié)果或應(yīng)用場景等有所調(diào)整。變換式是指根據(jù)不同的應(yīng)用場景,使用不同的推薦算法,如由UCF切換到ICF。合并式將多個推薦算法的推薦列表合并成一個大的推薦列表推薦給用戶,由用戶自行選擇,使大的推薦列表更具有多樣性?;旌贤扑]系統(tǒng)的核心思想與集成學(xué)習(xí)算法類似,通過整合多個推薦算法,充分利用各個算法的優(yōu)勢,可以顯著降低系統(tǒng)性誤差(方差),提升推薦系統(tǒng)的綜合性能。隨著技術(shù)的不斷進步和推薦場景的多樣化,混合推薦算法將繼續(xù)發(fā)展,并在實際應(yīng)用中發(fā)揮更大的作用。

      2 電商相關(guān)領(lǐng)域中的混合推薦算法應(yīng)用

      隨著信息技術(shù)的迭代升級、大數(shù)據(jù)時代的到來和深度學(xué)習(xí)相關(guān)技術(shù)的蓬勃發(fā)展,傳統(tǒng)的單一推薦算法在應(yīng)對日益增長的數(shù)據(jù)和用戶需求方面逐漸顯露出不足之處,電商的推薦系統(tǒng)需要結(jié)合電商相關(guān)領(lǐng)域的特征來進行進一步的推薦算法的選擇和優(yōu)化設(shè)計。以下從基于協(xié)同過濾、知識圖譜和神經(jīng)網(wǎng)絡(luò)推薦三個方面詳細介紹面向電商相關(guān)領(lǐng)域混合推薦算法應(yīng)用。

      2.1 電商相關(guān)領(lǐng)域中基于協(xié)同過濾的混合推薦算法

      隨著社交媒體、移動設(shè)備和物聯(lián)網(wǎng)的廣泛應(yīng)用,用戶生成的數(shù)據(jù)變得越來越豐富和多樣化。推薦算法不僅分析處理用戶的行為數(shù)據(jù),還要處理結(jié)合用戶的社交關(guān)系、地理位置、短視頻和文本內(nèi)容等多種數(shù)據(jù),為了解決以上問題,基于協(xié)同過濾算法通過結(jié)合深度學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)等技術(shù),克服傳統(tǒng)協(xié)同過濾算法在數(shù)據(jù)稀疏性和冷啟動問題上的局限性,提高推薦的準確性和個性化程度。上海攜程旅游網(wǎng)絡(luò)技術(shù)有限公司董鑫[4]等人提出了一種混合的協(xié)同過濾模型,結(jié)合了深度學(xué)習(xí)技術(shù),通過從評分矩陣和輔助信息中學(xué)習(xí)到的用戶和物品的潛在因素,實現(xiàn)協(xié)同過濾和輔助信息的有效利用。王香蒙[5]等人提出了一種基于圖神經(jīng)網(wǎng)絡(luò)的協(xié)同過濾推薦算法(Causal Neural Graph Collaborative Filtering,CNGCF) ,將節(jié)點之間的因果關(guān)系注入基于圖協(xié)同過濾的圖表示學(xué)習(xí)中,從而明確對目標節(jié)點的鄰節(jié)點的因果影響進行編碼。這種方法能夠識別偽相關(guān)性,并揭示用戶偏好的根本原因。何向南[6]等人提出了神經(jīng)網(wǎng)絡(luò)的協(xié)同過濾(Neural Collaborative Filtering,NCF) ,該算法使用多層感知機來建模用戶和物品之間的非線性關(guān)系,將用戶和物品的特征通過全連接層映射到隱含空間,并通過內(nèi)積或外積運算來計算用戶對物品的興趣,提高了推薦系統(tǒng)的準確性和效果。

      2.2 電商相關(guān)領(lǐng)域中基于知識圖譜的混合推薦算法

      基于嵌入的方法忽略了知識圖譜的信息連通性,缺少可解釋性,而基于路徑的方法可以為推薦的結(jié)果提供可解釋性,混合的方法將基于嵌入的方法與基于路徑的方法相結(jié)合,充分挖掘兩方面的信息,保證混合的方法具有解釋推薦過程的能力,具備可解釋性,并成為當前的研究的一個熱點。王宏偉[7]等人提出了一種基于知識圖譜的深度學(xué)習(xí)模型水波網(wǎng)絡(luò)(RippleNet) ,是第一個有效將基于嵌入與基于路徑的知識圖譜結(jié)合起來的模型。它利用物品的知識圖譜數(shù)據(jù)一層一層地向外擴散后提取節(jié)點,然后聚合嵌入,每一層的物品會影響到在它之后的所有層,并且越往外對結(jié)果的影響就越小,像水波一樣。該算法能夠有效地捕捉用戶和物品之間的復(fù)雜關(guān)系,并成為現(xiàn)在最熱門的知識圖譜推薦算法之一。杜彥輝[8]等人提出了一種基于知識圖譜的個性化推薦模型——NRH(Node2vec-side and RippleNet Hybrid Model) 模型。該模型采用了基于協(xié)同過濾和知識圖譜的混合推薦方法,通過使用Node2vec-side進行物品畫像建模,探索物品之間的潛在關(guān)聯(lián)關(guān)系,并將用戶畫像劃分為靜態(tài)歷史畫像和動態(tài)偏好畫像,可以用于解決傳統(tǒng)用戶畫像更新的本地化問題。郭慶宇[9]等人系統(tǒng)性地介紹了知識圖譜的概念和構(gòu)建方法,總結(jié)已有的知識圖譜推薦系統(tǒng)研究,并對其進行了分類。同時,歸納了知識圖譜在動態(tài)推薦、跨領(lǐng)域推薦、多任務(wù)學(xué)習(xí)和用戶輔助信息等方面的研究應(yīng)用和挑戰(zhàn)。

      2.3 電商相關(guān)領(lǐng)域中基于神經(jīng)網(wǎng)絡(luò)的混合推薦算法

      由于傳統(tǒng)的推薦算法在面對大規(guī)模和復(fù)雜的數(shù)據(jù)時,往往存在準確性不高、個性化程度不夠等問題。而深度學(xué)習(xí)作為神經(jīng)網(wǎng)絡(luò)的重要分支,其通過構(gòu)建深層次的神經(jīng)網(wǎng)絡(luò)模型,可以學(xué)習(xí)到更抽象、更高級的特征表示,進一步提升了神經(jīng)網(wǎng)絡(luò)的性能。在推薦系統(tǒng)中,單獨使用神經(jīng)網(wǎng)絡(luò)可能存在一些挑戰(zhàn),如數(shù)據(jù)稀疏性、冷啟動問題和解釋性等問題。為了克服這些問題,將神經(jīng)網(wǎng)絡(luò)與其他推薦算法相結(jié)合,充分發(fā)揮它們各自的優(yōu)勢,從而提高推薦的準確性和個性化程度成為趨勢。張帥[10]等人提出了一種基于深度學(xué)習(xí)的推薦模型VLC-AR(Viewer’s Watching Behavior and Live streaming Content change for Anchor Recommendation) ,其由兩個主要組成部分組成:一是基于長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM) 的觀眾行為預(yù)測模型,用于預(yù)測觀眾的下一步行為,例如繼續(xù)觀看、暫停觀看或跳過視頻等。該模型利用觀眾的歷史觀看記錄以及當前觀看視頻的交互信息來進行預(yù)測,并通過反向傳播算法(Back Propagation,BP) 進行訓(xùn)練。第二個部分是基于CNN的實時視頻內(nèi)容模型,用于捕捉主播實時視頻內(nèi)容的特征。該模型利用卷積神經(jīng)網(wǎng)絡(luò)來提取視頻幀的空間特征,并通過反向傳播算法進行訓(xùn)練。VLC-AR模型將這兩個部分整合在一起,通過將觀眾的行為和實時視頻內(nèi)容特征進行聯(lián)合編碼,實現(xiàn)對用戶觀看行為和內(nèi)容變化的準確預(yù)測,從而提供更個性化和精準的主播推薦服務(wù)。吳方照[11]等人構(gòu)建了一個名為MIND規(guī)模龐大的新聞推薦數(shù)據(jù)集,并在這個數(shù)據(jù)集上進行了大量實驗。新聞推薦的性能在很大程度上依賴于新聞內(nèi)容理解和用戶興趣建模的質(zhì)量。有效的文本表示方法和預(yù)先訓(xùn)練好的語言模型等自然語言處理和機器學(xué)習(xí)技術(shù)可以有效地提高新聞推薦的性能。

      3 電商相關(guān)領(lǐng)域中混合推薦算法存在的問題

      隨著電商相關(guān)領(lǐng)域行業(yè)的發(fā)展,混合推薦算法逐漸成為電商相關(guān)領(lǐng)域平臺中的重要組成部分?;旌贤扑]算法通過綜合考慮用戶的歷史行為、興趣偏好和商品屬性等多個因素,為用戶提供個性化的推薦服務(wù),從而增加用戶粘性和銷售額。然而,混合推薦算法在應(yīng)用中仍然面臨著一些問題,如數(shù)據(jù)質(zhì)量參差不齊、用戶隱私安全堪憂、算法偏見和冷啟動等。

      3.1 數(shù)據(jù)質(zhì)量參差不齊

      首先,電商相關(guān)領(lǐng)域數(shù)據(jù)質(zhì)量問題是影響混合推薦算法效果的重要因素之一。電商相關(guān)領(lǐng)域平臺涉及大量的商品和用戶數(shù)據(jù),這些數(shù)據(jù)的質(zhì)量直接影響著推薦算法的準確性和效果。常見的如以下幾點:

      1) 數(shù)據(jù)缺失與冗余:用戶與商品之間的交互數(shù)據(jù)較少或者用戶沒有提供足夠的信息,導(dǎo)致數(shù)據(jù)缺失;同時,電商相關(guān)領(lǐng)域平臺中可能存在大量的重復(fù)數(shù)據(jù),如同一商品的多個圖片、多個描述等。

      2) 數(shù)據(jù)偏差:由于數(shù)據(jù)來源的多樣性,電商相關(guān)領(lǐng)域平臺中的數(shù)據(jù)往往不夠一致。例如商品名稱、商品描述和商品分類等信息可能會因為數(shù)據(jù)來源不同而存在偏差的情況。

      3) 數(shù)據(jù)噪聲:在電商相關(guān)領(lǐng)域平臺中,一些用戶行為數(shù)據(jù)可能是虛假的或者注水的,例如,惡意刷單、惡意評價與標簽錯誤等。

      4) 多源數(shù)據(jù)融合的問題:在混合推薦算法中,需要將來自不同數(shù)據(jù)源或多種類型的數(shù)據(jù)進行融合。不同來源的數(shù)據(jù)可能存在格式不一致、缺失值、噪聲等問題,這些問題會對推薦算法的訓(xùn)練和預(yù)測產(chǎn)生負面影響。

      對于前3點問題電商相關(guān)領(lǐng)域平臺需要加強對數(shù)據(jù)的清洗和預(yù)處理工作,確保數(shù)據(jù)的質(zhì)量和一致性。而針對第4點,常見的多源數(shù)據(jù)融合方法是直接將多種類型數(shù)據(jù)(通常表示成特征向量)進行拼接或求和。這類方法操作簡單,易于實施,但大多數(shù)情況下無法取得令人滿意的效果,甚至在某些特定情況下的準確性還不如直接基于用戶物品評分數(shù)據(jù)做推薦的準確率高。

      3.2 用戶隱私安全堪憂

      隨著電商相關(guān)領(lǐng)域平臺的用戶數(shù)量不斷增加,用戶隱私安全問題也變得越來越重要。在混合推薦算法中,需要從用戶的行為數(shù)據(jù)中提取用戶的偏好和習(xí)慣,這就涉及用戶隱私的保護問題。傳統(tǒng)的推薦算法中,用戶行為數(shù)據(jù)通常會發(fā)送到服務(wù)器進行處理,這會帶來一些用戶隱私泄漏的風(fēng)險。2018年,國內(nèi)某快遞公司發(fā)生了信息泄露事件,超過10億條快遞數(shù)據(jù)在網(wǎng)上兜售,包括姓名、手機號和家庭住址等。因此,如何在保證用戶隱私不被泄露給推薦系統(tǒng)以及任何第三方的前提下,收集和挖掘用戶數(shù)據(jù)的價值是大數(shù)據(jù)時代值得研究的問題。

      為了保護用戶的隱私,2016年由谷歌提出的一個名為聯(lián)邦學(xué)習(xí)的機器學(xué)習(xí)方法,被廣泛應(yīng)用于推薦系統(tǒng)中。聯(lián)邦學(xué)習(xí)是一種分布式機器學(xué)習(xí)的方法,它通過在本地設(shè)備上進行模型訓(xùn)練,并在不泄露數(shù)據(jù)的情況下將模型參數(shù)聚合到中央服務(wù)器上,從而保護用戶隱私。在聯(lián)邦學(xué)習(xí)中,用戶的隱私數(shù)據(jù)不會離開本地設(shè)備,這有效地保護了用戶的隱私。聯(lián)邦學(xué)習(xí)可以有效地解決用戶隱私泄漏的問題,但也存在一些問題,如計算代價、通信開銷、隱私泄露和模型的安全性難以保證等。

      3.3 算法偏見

      算法偏見是指推薦算法在推薦商品時,受到一些非正常因素的影響,導(dǎo)致推薦的準確性和公正性受到影響。主要包括:特征偏見或流行度偏見、統(tǒng)計公平性、遵從偏見和長期公平性等。特征偏見是主要關(guān)注監(jiān)督學(xué)習(xí)過于依賴預(yù)定的敏感特征帶來的不公平問題,如放大“性別”與“電影類別”之間的聯(lián)系;流行度偏見是指在推薦商品時,推薦算法可能會受到商品的熱度、銷量和廣告費用等因素的影響,從而導(dǎo)致熱門商品被過度推薦,而一些冷門商品則被忽視;統(tǒng)計公平性是關(guān)注一個或一組用戶得到的推薦結(jié)果與用戶興趣的分布是否一致,如一個小組內(nèi)90%喜歡喝咖啡,10%的人喝茶,那么推薦結(jié)果就是90%是咖啡,10%是茶;遵從偏見是指用戶容易受到其他用戶意見的影響,傾向于放棄個人獨特興趣而保持與大多數(shù)人意見的一致,如羊群效應(yīng);長期公平性是指需要考慮長期且動態(tài)的環(huán)境下如何保證推薦的公平性,如物品的流行度是隨著時間變化的[12]。

      混合推薦算法是通過結(jié)合多個推薦算法來提高準確度和推薦效果的,但是這些推薦算法本身可能存在偏見,從而導(dǎo)致混合推薦算法的偏見。為了解決算法偏見問題,采用一些算法技術(shù)來檢測和消除算法的偏見,如基于約束規(guī)劃的算法,基于主成分分析(Principal Component Analysis,PCA) 的算法和用戶反饋機制來糾正算法偏見,但仍需要大量的實驗與探索。

      3.4 冷啟動

      冷啟動指當一個新用戶或者一個新商品進入電商相關(guān)領(lǐng)域平臺時,由于缺乏歷史數(shù)據(jù),推薦算法無法準確地預(yù)測用戶的偏好和行為。冷啟動可以分為兩類:用戶冷啟動和物品冷啟動。用戶冷啟動指的是當一個新用戶加入系統(tǒng)時,由于缺乏其歷史行為數(shù)據(jù),推薦系統(tǒng)無法準確地了解其興趣和偏好,從而無法提供個性化推薦。物品冷啟動則指的是當一個新的物品加入系統(tǒng)時,由于缺乏與該物品相關(guān)的歷史數(shù)據(jù),推薦系統(tǒng)無法有效地為用戶推薦該物品。大多數(shù)過于依賴于用戶和物品的歷史交互數(shù)據(jù)的推薦算法,如協(xié)同過濾,都會遇到冷啟動的問題。該問題會降低推薦算法的覆蓋率和用戶的滿意度。為了解決推薦算法的冷啟動問題,研究者們提出了許多方法。例如,提出了基于內(nèi)容的推薦、基于內(nèi)容的推薦和協(xié)同過濾的混合推薦方法。針對用戶冷啟動采用的“千人一面”的方式推薦熱門物品,或利用附加信息與專家標注進行推薦。隨著技術(shù)的不斷發(fā)展,深度學(xué)習(xí)、社交網(wǎng)絡(luò)和因果推理等方法被采納,用于挖掘用戶和物品的深度屬性,從而輔助系統(tǒng)借鑒其他相關(guān)任務(wù)或領(lǐng)域的經(jīng)驗來應(yīng)對冷啟動問題。

      4 總結(jié)

      目前,在電商相關(guān)領(lǐng)域中的混合推薦算法近年來取得了顯著的進展,尤其隨著神經(jīng)網(wǎng)絡(luò)算法的提出,深度學(xué)習(xí)混合推薦算法通過引入更多的商品特征信息,嘗試建模傳統(tǒng)算法無法處理的數(shù)據(jù)類型,引入更多的商品特征信息提升推薦算法的效果。其中,傳統(tǒng)的協(xié)同過濾算法與神經(jīng)網(wǎng)絡(luò)的結(jié)合、基于知識圖譜的混合推薦算法成為當下研究的熱點。現(xiàn)有的電商相關(guān)領(lǐng)域中的混合推薦算法擁有了不錯的推薦效果,但仍面臨著一些問題,如多源數(shù)據(jù)融合的問題、用戶隱私安全問題和算法偏見等問題沒有得到較好的解決。未來,電商相關(guān)領(lǐng)域中的混合推薦算法可以聚焦于自動選擇最優(yōu)算法、自適應(yīng)調(diào)整算法權(quán)重以及實時混合推薦算法等方面,以進一步提高推薦的準確性和個性化程度。

      參考文獻:

      [1] 黃玉盛.基于協(xié)方差的個性化推薦算法研究[D].成都:成都理工大學(xué),2020.

      [2] LIU C,LI L,YAO X L,et al.A survey of recommendation algorithms based on knowledge graph embedding[C]//2019 IEEE International Conference on Computer Science and Educational Informatization (CSEI).IEEE,2019:168-171.

      [3] WANG H W,ZHANG F Z,WANG J L,et al.Exploring high-order user preference on the knowledge graph for recommender systems[J].ACM Transactions on Information Systems,37(3):32.

      [4] DONG X,YU L,WU Z H,et al.A hybrid collaborative filtering model with deep structure for recommender systems[C]//Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence.ACM,2017:1309-1315.

      [5] WANG X, LI Q, YU D, et al. Neural graph collaborative filtering[C]//Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval,2019:165-174.

      [6] HE X N,LIAO L Z,ZHANG H W,et al.Neural collaborative filtering[C]//Proceedings of the 26th International Conference on World Wide Web.Perth Australia.Republic and Canton of Geneva,Switzerland:International World Wide Web Conferences Steering Committee,2017.

      [7] WANG H W,ZHANG F Z,WANG J L,et al.RippleNet:propagating user preferences on the knowledge graph for recommender systems[J].ACM, 2018.

      [8] NI W K,DU Y H,MA X B,et al.Research on hybrid recommendation model for personalized recommendation scenarios[J].Applied Sciences,2023,13(13):7903.

      [9] GUO Q, ZHUANG F, QIN C, et al. A Survey on Knowledge Graph-Based Recommender Systems[J].IEEE Transactions on Knowledge and Data Engineering,2020,50(7):937-954.

      [10] ZHANG S,LIU H Y,MEI L,et al.Predicting viewer’s watching behavior and live streaming content change for anchor recommendation[J].Applied Intelligence,2022,52(3):2480-2495.

      [11] WU F Z,QIAO Y,CHEN J H,et al.MIND:a large-scale dataset for news recommendation[C]//ACL,2020:3597-3606.

      [12] 李東勝,練建勛,張樂,等.推薦系統(tǒng):前沿與實踐[M].北京:電子工業(yè)出版社,2022.

      【通聯(lián)編輯:王 力】

      猜你喜歡
      知識圖譜神經(jīng)網(wǎng)絡(luò)
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      國內(nèi)圖書館嵌入式服務(wù)研究主題分析
      國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢
      近十五年我國小學(xué)英語教學(xué)研究的熱點、問題及對策
      基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
      智富時代(2016年12期)2016-12-01 16:28:41
      基于知識圖譜的智慧教育研究熱點與趨勢分析
      從《ET&S》與《電化教育研究》對比分析中管窺教育技術(shù)發(fā)展
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
      重型機械(2016年1期)2016-03-01 03:42:04
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
      辽宁省| 中方县| 武川县| 大城县| 天水市| 张家口市| 弋阳县| 保德县| 四会市| 盈江县| 扶余县| 永新县| 永宁县| 滦平县| 砀山县| 怀仁县| 微山县| 百色市| 威海市| 高尔夫| 连州市| 朔州市| 宜宾县| 依安县| 色达县| 天台县| 比如县| 光泽县| 罗平县| 军事| 砀山县| 宁乡县| 囊谦县| 丹东市| 奉化市| 长寿区| 日喀则市| 康保县| 白城市| 金昌市| 惠东县|