短視頻推薦方法與模型研究

2024-01-24 10:58:15沈曉鵬趙明劉善智

電腦知識與技術(shù) 2023年34期

沈曉鵬趙明劉善智

摘要：短視頻推薦是推薦系統(tǒng)中的一個重要領(lǐng)域，其目標(biāo)是根據(jù)用戶的興趣和偏好，為用戶推薦個性化的短視頻內(nèi)容，該研究具有重要的理論和實踐意義。該文旨在對短視頻推薦方法進行綜述和研究，通過分析比較不同推薦方法，深入探討和研究不同方法的優(yōu)缺點，進行模型優(yōu)化與設(shè)計。該研究可以為短視頻推薦系統(tǒng)的設(shè)計和優(yōu)化提供指導(dǎo)和參考，為短視頻推薦系統(tǒng)的改進和優(yōu)化提供有力支持，提高用戶的滿意度和體驗。

關(guān)鍵詞：短視頻；推薦系統(tǒng)；深度學(xué)習(xí)

中圖分類號：TP37? ? ? ? 文獻標(biāo)識碼：A

文章編號：1009-3044（2023）34-0116-03

開放科學(xué)（資源服務(wù)）標(biāo)識碼（OSID）

1 前言

1.1 背景介紹

隨著移動互聯(lián)網(wǎng)的普及和社交媒體平臺的興起，短視頻已經(jīng)成為人們?nèi)粘Ｉ畋夭豢缮俚慕M成部分。短視頻以其簡短、直觀和生動的特點吸引了廣大用戶的關(guān)注，用戶通過短視頻可以輕松獲取豐富的信息和娛樂內(nèi)容。然而，由于短視頻數(shù)量龐大且類別繁多，用戶往往面臨巨大的選擇困難，推薦系統(tǒng)由此成為幫助用戶發(fā)現(xiàn)和獲取感興趣內(nèi)容的重要工具。

短視頻推薦是推薦系統(tǒng)中的一個重要領(lǐng)域，其目標(biāo)是根據(jù)用戶的興趣和偏好，為用戶推薦個性化的短視頻內(nèi)容。然而短視頻推薦系統(tǒng)依然有不少挑戰(zhàn)。首先，短視頻以其時效性和多樣性的特點，導(dǎo)致用戶的興趣和偏好頻繁變化，從而系統(tǒng)需要有及時性和適應(yīng)性的特殊需求。其次，短視頻的內(nèi)容多樣化，包括音樂、影視、娛樂、教育等不同領(lǐng)域的內(nèi)容，如何準(zhǔn)確地理解和區(qū)分視頻的內(nèi)容特點，成了一個關(guān)鍵問題。最后，用戶對于短視頻的喜好具有一定的主觀性和個體差異，傳統(tǒng)的推薦方法往往無法滿足用戶的個性化需求。

1.2 研究目的及意義

通過研究不同的短視頻推薦方法與模型，可以促進推薦系統(tǒng)研究進展，探索更加高效、準(zhǔn)確和用戶滿意的推薦算法和模型，為其他推薦任務(wù)和領(lǐng)域的研究提供一定的借鑒。研究短視頻推薦方法與模型可以幫助內(nèi)容提供者更好地了解用戶需求和喜好，為用戶提供個性化的短視頻推薦服務(wù)，從而推動短視頻產(chǎn)業(yè)的發(fā)展。因此，短視頻推薦方法與模型的研究具有重要意義。

2 基于深度學(xué)習(xí)的推薦方法

2.1 深度神經(jīng)網(wǎng)絡(luò)架構(gòu)

基于深度學(xué)習(xí)的推薦方法通常使用深度神經(jīng)網(wǎng)絡(luò)進行建模和預(yù)測[1]。主要模型有多層感知器、矩陣分解神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等。在這里，著重分析卷積神經(jīng)網(wǎng)絡(luò)推薦方法。

深度學(xué)習(xí)網(wǎng)絡(luò)采用了一種三層結(jié)構(gòu)，包括輸入層、隱藏層和輸出層。其中，多層感知器為具有多個隱藏層的網(wǎng)絡(luò)。每個隱藏層的輸出作為下一個隱藏層的輸入，每一層都在表達一種中間特征[2]。通過輸入數(shù)據(jù)集特征和反復(fù)迭代，網(wǎng)絡(luò)結(jié)構(gòu)逐步獲得更加抽象的高層特征，從而能夠發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

深度學(xué)習(xí)根據(jù)研究內(nèi)容劃分，主要分為卷積神經(jīng)網(wǎng)絡(luò)（CNN）、自編碼神經(jīng)網(wǎng)絡(luò)（AEN）、深度置信網(wǎng)絡(luò)（DBN）三類方法[3]。以上三類方法中，在當(dāng)今視頻推薦系統(tǒng)中，卷積神經(jīng)網(wǎng)絡(luò)算法最為常見。

卷積神經(jīng)網(wǎng)絡(luò)CNN可以提取出用戶和物品的局部特征，進而捕捉它們之間的關(guān)系。CNN在處理圖像[4]、文本和序列等數(shù)據(jù)時具有優(yōu)秀的表達能力。實際應(yīng)用中還有其他各式各樣的深度學(xué)習(xí)模型，根據(jù)具體的推薦任務(wù)和數(shù)據(jù)特點，可以選擇最合適的深度神經(jīng)網(wǎng)絡(luò)來建立推薦模型。

2.2 模型訓(xùn)練和評估

對于模型訓(xùn)練，首先需要準(zhǔn)備好訓(xùn)練和測試所需的數(shù)據(jù)。這包括用戶的歷史行為數(shù)據(jù)、物品的屬性信息以及用戶和物品之間的交互數(shù)據(jù)等。隨后，根據(jù)具體的推薦任務(wù)和數(shù)據(jù)特點，選擇適合的深度學(xué)習(xí)模型架構(gòu)。使用準(zhǔn)備好的數(shù)據(jù)集，將其劃分為訓(xùn)練集和驗證集。然后，使用訓(xùn)練集訓(xùn)練。

對于模型評估，使用驗證集對訓(xùn)練好的模型進行評估。常用的評估指標(biāo)包括準(zhǔn)確率（Precision）、召回率（Recall）、F1-score等[5]。根據(jù)評估結(jié)果，可以進行模型的調(diào)整和優(yōu)化。在模型訓(xùn)練和驗證完成后，可以使用訓(xùn)練好的模型對新的用戶和物品進行推薦預(yù)測，根據(jù)用戶的特征和歷史行為預(yù)測可能感興趣的物品。

3 推薦方法的評估與模型優(yōu)化

3.1 新的短視頻推薦模型構(gòu)想

3.1.1 算法設(shè)計和思路

設(shè)計一個新的短視頻推薦模型可以從多個方面考慮和設(shè)計，首先需要收集和整理短視頻的數(shù)據(jù)集，包括視頻的特征信息（如時長、分類標(biāo)簽）、用戶的行為數(shù)據(jù)（如觀看歷史、喜歡、評論等）以及其他可能有關(guān)的數(shù)據(jù)（如用戶畫像信息）。就不同情況來分析，對于視頻和用戶的特征信息[6]，可以進行特征工程，提取一些有用的特征。

3.1.2 新模型設(shè)計

針對短視頻推薦的準(zhǔn)確性和實時性不夠的問題上，這里結(jié)合神經(jīng)網(wǎng)絡(luò)推薦模型的優(yōu)點，使用融合卷積神經(jīng)網(wǎng)絡(luò)CNN的個性化短視頻推薦方法，引入注意力機制，提升推薦系統(tǒng)的準(zhǔn)確性。

CBAM是一種輕量級的卷積注意力模塊，在注意力機制中起關(guān)鍵作用。它同時結(jié)合了通道注意力和空間注意力，可以學(xué)習(xí)全局和特定特征，并更準(zhǔn)確地關(guān)注不同特征。在推薦系統(tǒng)中，CBAM的引入可以提升特征提取能力，幫助模型更好地理解用戶和商品之間的關(guān)系，從而提高預(yù)測準(zhǔn)確性。通過提高模型的解釋性和特征提取能力，CBAM可以增強推薦系統(tǒng)對用戶興趣和行為的理解能力，進而提升推薦準(zhǔn)確度。

引入注意力機制的CNN模型是一種引入了輕量級的卷積注意力模塊，結(jié)合卷積神經(jīng)網(wǎng)絡(luò)（CNN）的深度學(xué)習(xí)模型，基于CBAM的CNN推薦系統(tǒng)模型以下簡稱為CBN（CBAM-based Neural Network）模型。在CNN之后，用全局平均池化計算每個通道的權(quán)重，并使用兩個密集層對權(quán)重進行更新和擴展。通過使用Sigmoid激活函數(shù)將權(quán)重限制在[0，1]范圍內(nèi)，并將其與原始特征相乘，通過比較通道之間的重要性來加權(quán)特征。通過比較空間位置之間的重要性來加權(quán)特征。設(shè)計方案如圖1所示。

CBN模型首先使用卷積和池化操作從用戶和商品的信息中提取特征，然后將用戶特征向量和商品特征向量拼接在一起。接著，CBN模型將該特征向量輸入CBAM模塊中，以學(xué)習(xí)用戶和商品特征的通道和空間關(guān)系。最后，CBN模型使用全連接層來推理用戶與商品之間的關(guān)聯(lián)度，預(yù)測用戶對商品的評分。

按照兩種模型原理，在理論上CNN模型通過引入CBAM模塊，能夠增強模型對于用戶和商品特征的建模能力，尤其是可以自適應(yīng)地控制不同特征的權(quán)重，以便更好地捕捉不同特征之間的依賴性。同時，CBN模型可以使用CBAM模塊來分析模型的決策過程，提高模型的解釋性。

3.2 模型實驗和對比分析

3.2.1 實驗數(shù)據(jù)集設(shè)計

在這項研究中，選擇了Netflix Prize Dataset數(shù)據(jù)集作為實驗主數(shù)據(jù)集，另外使用了MovieLens數(shù)據(jù)集大量用戶對電影的評價信息以及TikTok數(shù)據(jù)集中的短視頻數(shù)據(jù)。此數(shù)據(jù)集一共包含了2 120 000多個視頻，篩選了目前最火的3種不同的視頻類別，每個視頻都被分成了多個幀，每幀的圖像分辨率為112×112。為了提升實驗的有效性，特意分割選取代表性的3種數(shù)據(jù)集，分別是電影類、游戲類、音樂類，且數(shù)據(jù)集中包含實驗需要的評分?jǐn)?shù)據(jù)，具體如表1所示。

3.2.2 評價指標(biāo)

實驗的最終目的是驗證模型的有效性和優(yōu)越性，本實驗主要以離線評估的方法從模型對比、基于評分準(zhǔn)確度和基于預(yù)測準(zhǔn)確度方面分別對提出的CBN模型進行對比和分析[7]。其中，基于評分準(zhǔn)確度評價采用的評價指標(biāo)包括平均絕對誤差MAE和均方根誤差RMSE，精度、召回率、F1值等作為評測方法。

3.2.3 實驗與分析

3.2.3.1 橫向?qū)Ρ?/p>

為了評估CBN模型的改進效果，通過模型比較分析的方式，在具有代表性的推薦模型中擇優(yōu)選擇三種模型開展對比，所參考的衡量參數(shù)為模型中是否采用了評論數(shù)據(jù)、深度學(xué)習(xí)技術(shù)以及注意力機制等。

通過對比，LAD、NARRE、NeuMF及本文提出的CBN模型都能兼顧神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法，但本文提出的CBN模型在考慮評論數(shù)據(jù)的同時，能夠引入注意力機制，實現(xiàn)更好的評論數(shù)據(jù)的融合。除此之外，本文把提出的CBN以上三個模型，在準(zhǔn)備的實驗數(shù)據(jù)集中分別進行MSE實驗與分析，從而驗證CBN模型的優(yōu)越性。

另外，從數(shù)據(jù)集中隨機選擇數(shù)據(jù)進行對比，進行RMSE和MAE分析，本文提出的CBN模型無論從RMSE還是MAE數(shù)值上分析，效果均比傳統(tǒng)的LAD、NARRE等推薦模型具有優(yōu)勢。

3.2.3.2 縱向?qū)Ρ?/p>

對于新的短視頻推薦模型的實驗和結(jié)果分析，首先進行數(shù)據(jù)集選擇和預(yù)處理，其次使用數(shù)據(jù)集進行模型的訓(xùn)練和評估。根據(jù)推薦系統(tǒng)的特點，選擇合適的評估指標(biāo)來衡量推薦模型的性能，常用的指標(biāo)包括準(zhǔn)確率、F1值、AUC等。最后，分析評估指標(biāo)的結(jié)果，了解推薦模型的性能，根據(jù)實驗結(jié)果進行模型的調(diào)優(yōu)。本研究將實驗數(shù)據(jù)集隨機分為訓(xùn)練集和測試集，實驗結(jié)果如表2所示。

從表2可以看出，本研究提出的算法在Netflix Prize Dataset數(shù)據(jù)集上取得了不錯的性能，精度為0.8070，F(xiàn)1-score為0.7538，AUC為0.8247，說明該算法具有一定的推薦準(zhǔn)確性。CNN模型通過引入CBAM模塊，能夠增強模型對于用戶和商品特征的建模能力，尤其是可以自適應(yīng)地控制不同特征的權(quán)重，以便更好地捕捉不同特征之間的依賴性。同時，CBN模型可以使用CBAM模塊來分析模型的決策過程，提高模型的解釋性。

通過以上實驗和分析，可以深入了解新的短視頻推薦模型的性能和效果，幫助優(yōu)化算法和改進推薦系統(tǒng)，提供更好的推薦服務(wù)。

4 結(jié)論

4.1 短視頻推薦方法在實際應(yīng)用中的潛在價值

短視頻推薦方法在實際應(yīng)用中有很大的潛在價值。通過短視頻推薦方法，能夠根據(jù)用戶的興趣和偏好，為其提供更加個性化的推薦內(nèi)容，可以幫助用戶節(jié)省瀏覽時間，提高用戶滿意度。短視頻推薦方法能夠根據(jù)用戶的行為和歷史記錄，智能地將精彩的短視頻推薦給用戶，這有助于提高短視頻的曝光度和播放量，幫助視頻創(chuàng)作者獲得更多的曝光和關(guān)注。短視頻推薦方法可以將廣告內(nèi)容推薦給用戶，增加點擊率。個性化短視頻推薦能夠滿足用戶的多樣化需求，提供更多感興趣的內(nèi)容，從而增加用戶對平臺的黏性和留存率。通過短視頻推薦方法，平臺可以收集用戶的行為數(shù)據(jù)和反饋信息。這些數(shù)據(jù)可以用于用戶畫像的建立、用戶興趣的分析以及市場趨勢的洞察等，為平臺的運營決策提供參考。需要注意的是，短視頻推薦方法也面臨一些挑戰(zhàn)，如數(shù)據(jù)稀疏性、冷啟動問題、算法解釋性等。但隨著技術(shù)的不斷發(fā)展，這些問題有望得到更好的解決，釋放出更大的潛在價值。

4.2 未來研究方向和挑戰(zhàn)

隨著技術(shù)的進步和應(yīng)用場景的不斷推進，短視頻推薦方法將有更大的發(fā)展空間和潛力，但未來短視頻推薦方法的研究也面臨很多挑戰(zhàn)。在短視頻推薦中，一方面，用戶個人隱私的保護和數(shù)據(jù)安全是一個重要問題，未來的研究應(yīng)關(guān)注如何在保護用戶隱私的同時，提高推薦的效果。另外，隨著短視頻平臺的發(fā)展和用戶行為的多樣性，短視頻推薦也需要考慮不同平臺之間的推薦問題，進行跨平臺的個性化推薦。短視頻平臺具有強烈的社交屬性，用戶之間的關(guān)系對于推薦效果的影響不容忽視。未來的研究可以探索如何利用社交關(guān)系來提高短視頻推薦的準(zhǔn)確性和用戶滿意度。

參考文獻：

[1] MONDAL R，SRIVASTAVA P.Fuzzy utility matrix-based intelligent decision-making model and its application to diet recommendation system for metabolic disorder patients[J].International Journal of Fuzzy System Applications，2022，11（1）：1-22.

[2] 王強.基于時空軌跡的快件送達時間預(yù)測方法研究[D].北京：北京交通大學(xué)，2021.

[3] 張潤蓮，張瑞，武小年，等.基于混合相似度和差分隱私的協(xié)同過濾推薦算法[J].計算機應(yīng)用研究，2021，38（8）：2334-2339.

[4] 高宸，李勇，金德鵬.基于圖神經(jīng)網(wǎng)絡(luò)的視頻推薦系統(tǒng)[J].中興通訊技術(shù)，2021，27（1）：27-32.

[5] WU F Y，LYU C，LIU Y.A personalized recommendation system for multi-modal transportation systems[J].Multimodal Transportation，2022，1（2）：100016.

[6] 彭宇，寧慧，張汝波.基于改進的LFM算法的短視頻推薦系統(tǒng)的研究與實現(xiàn)[J].應(yīng)用科技，2022，49（3）：64-68.

[7] 劉端陽.基于深度觀看興趣網(wǎng)絡(luò)的視頻推薦系統(tǒng)設(shè)計與實現(xiàn)[D].北京：北京郵電大學(xué)，2021.

【通聯(lián)編輯：代影】

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

短視頻推薦方法與模型研究