沈曉鵬 趙明 劉善智
摘要:短視頻推薦是推薦系統(tǒng)中的一個重要領(lǐng)域,其目標(biāo)是根據(jù)用戶的興趣和偏好,為用戶推薦個性化的短視頻內(nèi)容,該研究具有重要的理論和實踐意義。該文旨在對短視頻推薦方法進行綜述和研究,通過分析比較不同推薦方法,深入探討和研究不同方法的優(yōu)缺點,進行模型優(yōu)化與設(shè)計。該研究可以為短視頻推薦系統(tǒng)的設(shè)計和優(yōu)化提供指導(dǎo)和參考,為短視頻推薦系統(tǒng)的改進和優(yōu)化提供有力支持,提高用戶的滿意度和體驗。
關(guān)鍵詞:短視頻;推薦系統(tǒng);深度學(xué)習(xí)
中圖分類號:TP37? ? ? ? 文獻標(biāo)識碼:A
文章編號:1009-3044(2023)34-0116-03
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
1 前言
1.1 背景介紹
隨著移動互聯(lián)網(wǎng)的普及和社交媒體平臺的興起,短視頻已經(jīng)成為人們?nèi)粘I畋夭豢缮俚慕M成部分。短視頻以其簡短、直觀和生動的特點吸引了廣大用戶的關(guān)注,用戶通過短視頻可以輕松獲取豐富的信息和娛樂內(nèi)容。然而,由于短視頻數(shù)量龐大且類別繁多,用戶往往面臨巨大的選擇困難,推薦系統(tǒng)由此成為幫助用戶發(fā)現(xiàn)和獲取感興趣內(nèi)容的重要工具。
短視頻推薦是推薦系統(tǒng)中的一個重要領(lǐng)域,其目標(biāo)是根據(jù)用戶的興趣和偏好,為用戶推薦個性化的短視頻內(nèi)容。然而短視頻推薦系統(tǒng)依然有不少挑戰(zhàn)。首先,短視頻以其時效性和多樣性的特點,導(dǎo)致用戶的興趣和偏好頻繁變化,從而系統(tǒng)需要有及時性和適應(yīng)性的特殊需求。其次,短視頻的內(nèi)容多樣化,包括音樂、影視、娛樂、教育等不同領(lǐng)域的內(nèi)容,如何準(zhǔn)確地理解和區(qū)分視頻的內(nèi)容特點,成了一個關(guān)鍵問題。最后,用戶對于短視頻的喜好具有一定的主觀性和個體差異,傳統(tǒng)的推薦方法往往無法滿足用戶的個性化需求。
1.2 研究目的及意義
通過研究不同的短視頻推薦方法與模型,可以促進推薦系統(tǒng)研究進展,探索更加高效、準(zhǔn)確和用戶滿意的推薦算法和模型,為其他推薦任務(wù)和領(lǐng)域的研究提供一定的借鑒。研究短視頻推薦方法與模型可以幫助內(nèi)容提供者更好地了解用戶需求和喜好,為用戶提供個性化的短視頻推薦服務(wù),從而推動短視頻產(chǎn)業(yè)的發(fā)展。因此,短視頻推薦方法與模型的研究具有重要意義。
2 基于深度學(xué)習(xí)的推薦方法
2.1 深度神經(jīng)網(wǎng)絡(luò)架構(gòu)
基于深度學(xué)習(xí)的推薦方法通常使用深度神經(jīng)網(wǎng)絡(luò)進行建模和預(yù)測[1]。主要模型有多層感知器、矩陣分解神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等。在這里,著重分析卷積神經(jīng)網(wǎng)絡(luò)推薦方法。
深度學(xué)習(xí)網(wǎng)絡(luò)采用了一種三層結(jié)構(gòu),包括輸入層、隱藏層和輸出層。其中,多層感知器為具有多個隱藏層的網(wǎng)絡(luò)。每個隱藏層的輸出作為下一個隱藏層的輸入,每一層都在表達一種中間特征[2]。通過輸入數(shù)據(jù)集特征和反復(fù)迭代,網(wǎng)絡(luò)結(jié)構(gòu)逐步獲得更加抽象的高層特征,從而能夠發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
深度學(xué)習(xí)根據(jù)研究內(nèi)容劃分,主要分為卷積神經(jīng)網(wǎng)絡(luò)(CNN) 、自編碼神經(jīng)網(wǎng)絡(luò)(AEN) 、深度置信網(wǎng)絡(luò)(DBN)三類方法[3]。以上三類方法中,在當(dāng)今視頻推薦系統(tǒng)中,卷積神經(jīng)網(wǎng)絡(luò)算法最為常見。
卷積神經(jīng)網(wǎng)絡(luò)CNN可以提取出用戶和物品的局部特征,進而捕捉它們之間的關(guān)系。CNN在處理圖像[4]、文本和序列等數(shù)據(jù)時具有優(yōu)秀的表達能力。實際應(yīng)用中還有其他各式各樣的深度學(xué)習(xí)模型,根據(jù)具體的推薦任務(wù)和數(shù)據(jù)特點,可以選擇最合適的深度神經(jīng)網(wǎng)絡(luò)來建立推薦模型。
2.2 模型訓(xùn)練和評估
對于模型訓(xùn)練,首先需要準(zhǔn)備好訓(xùn)練和測試所需的數(shù)據(jù)。這包括用戶的歷史行為數(shù)據(jù)、物品的屬性信息以及用戶和物品之間的交互數(shù)據(jù)等。隨后,根據(jù)具體的推薦任務(wù)和數(shù)據(jù)特點,選擇適合的深度學(xué)習(xí)模型架構(gòu)。使用準(zhǔn)備好的數(shù)據(jù)集,將其劃分為訓(xùn)練集和驗證集。然后,使用訓(xùn)練集訓(xùn)練。
對于模型評估,使用驗證集對訓(xùn)練好的模型進行評估。常用的評估指標(biāo)包括準(zhǔn)確率(Precision) 、召回率(Recall) 、F1-score等[5]。根據(jù)評估結(jié)果,可以進行模型的調(diào)整和優(yōu)化。在模型訓(xùn)練和驗證完成后,可以使用訓(xùn)練好的模型對新的用戶和物品進行推薦預(yù)測,根據(jù)用戶的特征和歷史行為預(yù)測可能感興趣的物品。
3 推薦方法的評估與模型優(yōu)化
3.1 新的短視頻推薦模型構(gòu)想
3.1.1 算法設(shè)計和思路
設(shè)計一個新的短視頻推薦模型可以從多個方面考慮和設(shè)計,首先需要收集和整理短視頻的數(shù)據(jù)集,包括視頻的特征信息(如時長、分類標(biāo)簽)、用戶的行為數(shù)據(jù)(如觀看歷史、喜歡、評論等)以及其他可能有關(guān)的數(shù)據(jù)(如用戶畫像信息)。就不同情況來分析,對于視頻和用戶的特征信息[6],可以進行特征工程,提取一些有用的特征。
3.1.2 新模型設(shè)計
針對短視頻推薦的準(zhǔn)確性和實時性不夠的問題上,這里結(jié)合神經(jīng)網(wǎng)絡(luò)推薦模型的優(yōu)點,使用融合卷積神經(jīng)網(wǎng)絡(luò)CNN的個性化短視頻推薦方法,引入注意力機制,提升推薦系統(tǒng)的準(zhǔn)確性。
CBAM是一種輕量級的卷積注意力模塊,在注意力機制中起關(guān)鍵作用。它同時結(jié)合了通道注意力和空間注意力,可以學(xué)習(xí)全局和特定特征,并更準(zhǔn)確地關(guān)注不同特征。在推薦系統(tǒng)中,CBAM的引入可以提升特征提取能力,幫助模型更好地理解用戶和商品之間的關(guān)系,從而提高預(yù)測準(zhǔn)確性。通過提高模型的解釋性和特征提取能力,CBAM可以增強推薦系統(tǒng)對用戶興趣和行為的理解能力,進而提升推薦準(zhǔn)確度。
引入注意力機制的CNN模型是一種引入了輕量級的卷積注意力模塊,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(CNN) 的深度學(xué)習(xí)模型,基于CBAM的CNN推薦系統(tǒng)模型以下簡稱為CBN(CBAM-based Neural Network) 模型。在CNN之后,用全局平均池化計算每個通道的權(quán)重,并使用兩個密集層對權(quán)重進行更新和擴展。通過使用Sigmoid激活函數(shù)將權(quán)重限制在[0,1]范圍內(nèi),并將其與原始特征相乘,通過比較通道之間的重要性來加權(quán)特征。通過比較空間位置之間的重要性來加權(quán)特征。設(shè)計方案如圖1所示。
CBN模型首先使用卷積和池化操作從用戶和商品的信息中提取特征,然后將用戶特征向量和商品特征向量拼接在一起。接著,CBN模型將該特征向量輸入CBAM模塊中,以學(xué)習(xí)用戶和商品特征的通道和空間關(guān)系。最后,CBN模型使用全連接層來推理用戶與商品之間的關(guān)聯(lián)度,預(yù)測用戶對商品的評分。
按照兩種模型原理,在理論上CNN模型通過引入CBAM模塊,能夠增強模型對于用戶和商品特征的建模能力,尤其是可以自適應(yīng)地控制不同特征的權(quán)重,以便更好地捕捉不同特征之間的依賴性。同時,CBN模型可以使用CBAM模塊來分析模型的決策過程,提高模型的解釋性。
3.2 模型實驗和對比分析
3.2.1 實驗數(shù)據(jù)集設(shè)計
在這項研究中,選擇了Netflix Prize Dataset數(shù)據(jù)集作為實驗主數(shù)據(jù)集,另外使用了MovieLens數(shù)據(jù)集大量用戶對電影的評價信息以及TikTok數(shù)據(jù)集中的短視頻數(shù)據(jù)。此數(shù)據(jù)集一共包含了2 120 000多個視頻,篩選了目前最火的3種不同的視頻類別,每個視頻都被分成了多個幀,每幀的圖像分辨率為112×112。為了提升實驗的有效性,特意分割選取代表性的3種數(shù)據(jù)集,分別是電影類、游戲類、音樂類,且數(shù)據(jù)集中包含實驗需要的評分?jǐn)?shù)據(jù),具體如表1所示。
3.2.2 評價指標(biāo)
實驗的最終目的是驗證模型的有效性和優(yōu)越性,本實驗主要以離線評估的方法從模型對比、基于評分準(zhǔn)確度和基于預(yù)測準(zhǔn)確度方面分別對提出的CBN模型進行對比和分析[7]。其中,基于評分準(zhǔn)確度評價采用的評價指標(biāo)包括平均絕對誤差MAE和均方根誤差RMSE,精度、召回率、F1值等作為評測方法。
3.2.3 實驗與分析
3.2.3.1 橫向?qū)Ρ?/p>
為了評估CBN模型的改進效果,通過模型比較分析的方式,在具有代表性的推薦模型中擇優(yōu)選擇三種模型開展對比,所參考的衡量參數(shù)為模型中是否采用了評論數(shù)據(jù)、深度學(xué)習(xí)技術(shù)以及注意力機制等。
通過對比,LAD、NARRE、NeuMF及本文提出的CBN模型都能兼顧神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法,但本文提出的CBN模型在考慮評論數(shù)據(jù)的同時,能夠引入注意力機制,實現(xiàn)更好的評論數(shù)據(jù)的融合。除此之外,本文把提出的CBN以上三個模型,在準(zhǔn)備的實驗數(shù)據(jù)集中分別進行MSE實驗與分析,從而驗證CBN模型的優(yōu)越性。
另外,從數(shù)據(jù)集中隨機選擇數(shù)據(jù)進行對比,進行RMSE和MAE分析,本文提出的CBN模型無論從RMSE還是MAE數(shù)值上分析,效果均比傳統(tǒng)的LAD、NARRE等推薦模型具有優(yōu)勢。
3.2.3.2 縱向?qū)Ρ?/p>
對于新的短視頻推薦模型的實驗和結(jié)果分析,首先進行數(shù)據(jù)集選擇和預(yù)處理,其次使用數(shù)據(jù)集進行模型的訓(xùn)練和評估。根據(jù)推薦系統(tǒng)的特點,選擇合適的評估指標(biāo)來衡量推薦模型的性能,常用的指標(biāo)包括準(zhǔn)確率、F1值、AUC等。最后,分析評估指標(biāo)的結(jié)果,了解推薦模型的性能,根據(jù)實驗結(jié)果進行模型的調(diào)優(yōu)。本研究將實驗數(shù)據(jù)集隨機分為訓(xùn)練集和測試集,實驗結(jié)果如表2所示。
從表2可以看出,本研究提出的算法在Netflix Prize Dataset數(shù)據(jù)集上取得了不錯的性能,精度為0.8070,F(xiàn)1-score為0.7538,AUC為0.8247,說明該算法具有一定的推薦準(zhǔn)確性。CNN模型通過引入CBAM模塊,能夠增強模型對于用戶和商品特征的建模能力,尤其是可以自適應(yīng)地控制不同特征的權(quán)重,以便更好地捕捉不同特征之間的依賴性。同時,CBN模型可以使用CBAM模塊來分析模型的決策過程,提高模型的解釋性。
通過以上實驗和分析,可以深入了解新的短視頻推薦模型的性能和效果,幫助優(yōu)化算法和改進推薦系統(tǒng),提供更好的推薦服務(wù)。
4 結(jié)論
4.1 短視頻推薦方法在實際應(yīng)用中的潛在價值
短視頻推薦方法在實際應(yīng)用中有很大的潛在價值。通過短視頻推薦方法,能夠根據(jù)用戶的興趣和偏好,為其提供更加個性化的推薦內(nèi)容,可以幫助用戶節(jié)省瀏覽時間,提高用戶滿意度。短視頻推薦方法能夠根據(jù)用戶的行為和歷史記錄,智能地將精彩的短視頻推薦給用戶,這有助于提高短視頻的曝光度和播放量,幫助視頻創(chuàng)作者獲得更多的曝光和關(guān)注。短視頻推薦方法可以將廣告內(nèi)容推薦給用戶,增加點擊率。個性化短視頻推薦能夠滿足用戶的多樣化需求,提供更多感興趣的內(nèi)容,從而增加用戶對平臺的黏性和留存率。通過短視頻推薦方法,平臺可以收集用戶的行為數(shù)據(jù)和反饋信息。這些數(shù)據(jù)可以用于用戶畫像的建立、用戶興趣的分析以及市場趨勢的洞察等,為平臺的運營決策提供參考。需要注意的是,短視頻推薦方法也面臨一些挑戰(zhàn),如數(shù)據(jù)稀疏性、冷啟動問題、算法解釋性等。但隨著技術(shù)的不斷發(fā)展,這些問題有望得到更好的解決,釋放出更大的潛在價值。
4.2 未來研究方向和挑戰(zhàn)
隨著技術(shù)的進步和應(yīng)用場景的不斷推進,短視頻推薦方法將有更大的發(fā)展空間和潛力,但未來短視頻推薦方法的研究也面臨很多挑戰(zhàn)。在短視頻推薦中,一方面,用戶個人隱私的保護和數(shù)據(jù)安全是一個重要問題,未來的研究應(yīng)關(guān)注如何在保護用戶隱私的同時,提高推薦的效果。另外,隨著短視頻平臺的發(fā)展和用戶行為的多樣性,短視頻推薦也需要考慮不同平臺之間的推薦問題,進行跨平臺的個性化推薦。短視頻平臺具有強烈的社交屬性,用戶之間的關(guān)系對于推薦效果的影響不容忽視。未來的研究可以探索如何利用社交關(guān)系來提高短視頻推薦的準(zhǔn)確性和用戶滿意度。
參考文獻:
[1] MONDAL R,SRIVASTAVA P.Fuzzy utility matrix-based intelligent decision-making model and its application to diet recommendation system for metabolic disorder patients[J].International Journal of Fuzzy System Applications,2022,11(1):1-22.
[2] 王強.基于時空軌跡的快件送達時間預(yù)測方法研究[D].北京:北京交通大學(xué),2021.
[3] 張潤蓮,張瑞,武小年,等.基于混合相似度和差分隱私的協(xié)同過濾推薦算法[J].計算機應(yīng)用研究,2021,38(8):2334-2339.
[4] 高宸,李勇,金德鵬.基于圖神經(jīng)網(wǎng)絡(luò)的視頻推薦系統(tǒng)[J].中興通訊技術(shù),2021,27(1):27-32.
[5] WU F Y,LYU C,LIU Y.A personalized recommendation system for multi-modal transportation systems[J].Multimodal Transportation,2022,1(2):100016.
[6] 彭宇,寧慧,張汝波.基于改進的LFM算法的短視頻推薦系統(tǒng)的研究與實現(xiàn)[J].應(yīng)用科技,2022,49(3):64-68.
[7] 劉端陽.基于深度觀看興趣網(wǎng)絡(luò)的視頻推薦系統(tǒng)設(shè)計與實現(xiàn)[D].北京:北京郵電大學(xué),2021.
【通聯(lián)編輯:代影】