• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于抖音平臺的在線短視頻流行度建模研究

      2021-10-13 04:51:34鐘志豪肖井華王笑塵
      電子科技大學學報 2021年5期
      關鍵詞:閾值曲線情感

      鐘志豪,肖井華,吳 曄,王笑塵

      (1.北京郵電大學理學院 北京海淀區(qū) 100876;2.北京師范大學新聞傳播學院 北京海淀區(qū) 100875;3.北京郵電大學移動互聯網安全技術國家工程實驗室 北京海淀區(qū) 100876)

      隨著新媒體技術的快速發(fā)展,社會信息傳播形式由文本信息為主轉變?yōu)槲谋?、視頻多模態(tài)傳播。當前,15 秒短視頻更符合大眾“碎片化”的時間管理習慣,已成為網絡視頻傳播的主要方式之一。截至2020 年3 月,中國短視頻用戶規(guī)模達7.73億,占網絡視頻用戶的85.6%[1]。截至2020 年第一季度,短視頻平臺“抖音”(Tik Tok)在全球范圍內的累計總下載量突破20 億次[2]??梢姡桃曨l用戶量日益攀升,呈現出蓬勃發(fā)展的態(tài)勢。

      短視頻傳播具有諸多新特點,如傳播以推薦機制為主、傳播速度快、傳播效果由視頻的內容所決定以及弱化了用戶身份和等級的影響[3]。這些特點使得短視頻傳播流行度的演變機制不同于傳統(tǒng)視頻,且在系統(tǒng)的推動下傳播規(guī)模更大。因此,研究短視頻的傳播規(guī)律有助于揭示短視頻傳播過程中流行度的演變機制,從而更有效地控制信息傳播。

      目前針對網絡信息傳播的研究主要集中在文本信息的傳播規(guī)律上,借助經典的傳染病傳播模型研究社交網絡中的信息傳播過程[4]。如文獻[5]基于SIR(susceptible infected recovered)模型構建了在線社交網絡謠言傳播的動力學模型;文獻[6-8]利用經典SIR 或SIS(susceptible infacted susceptible)模型研究社交網絡中的信息傳播過程。在信息傳播時變模式的分析方面,文獻[9]提出一種Spike-M 模型來研究一條新聞信息在傳播過程中受歡迎程度的上升和下降模式,為實際數據中出現的多種時變模式提供了一個統(tǒng)一的模型框架。文獻[10]研究了在線內容的多種時間模式,以及內容的受歡迎程度如何隨著時間的推移而增長或消退。

      針對視頻傳播的研究主要集中在探索口口相傳及首頁推薦對視頻傳播的綜合影響,并通過構建相應的視頻傳播模型來揭示視頻流行度的演化模式。文獻[11]根據騰訊視頻的數據,綜合考慮了口口相傳以及首頁推薦這兩個傳播途徑,建立了視頻傳播的動力學模型。文獻[12]根據人人網數據,專注于研究視頻受歡迎度的分布和演變,并建立了一個簡單模型來模擬在線社交網絡中視頻的用戶請求過程。文獻[13]基于一個由用戶瀏覽行為形成的視圖傳播模型來探究如何通過YOUTUBE 的推薦系統(tǒng)來提升人氣,探索視頻之間是如何相互影響的。文獻[14]通過視圖計數跟蹤的方法對視頻的推薦系統(tǒng)進行研究,提出了一個基于擴展流行模型的框架,通過擬合所采集的騰訊視頻的視頻瀏覽計數追蹤數據,量化和解釋了直接推薦和口碑推薦這兩種推薦機制。

      此外,研究表明用戶情感會影響信息傳播的過程[15-18],但此類研究主要還集中于文本信息傳播及長視頻傳播中。

      可見,目前針對短視頻傳播的研究還很缺乏,尤其是用戶行為如何影響短視頻傳播仍然未知,而該問題對揭示短視頻傳播規(guī)律至關重要。因此,本文分析了在線短視頻的傳播模式,并探索用戶點贊行為和評論與短視頻播放量的相關性。此外,本文基于短視頻的傳播特征和已有的視頻傳播模型,構建了在線短視頻的點贊?傳播動力學模型,并借助模型探索不同參數對短視頻播放量演變趨勢的影響。

      1 數據收集與分析

      1.1 數據的收集

      本文選擇抖音短視頻平臺作為研究對象。為了探索在線短視頻的大規(guī)模傳播機制,本文選擇了9 個粉絲量在一千萬以上的活躍用戶(包括新華社、人民日報、河南廣播電視臺民生頻道、中國日報、浙有正能量、央視新聞、解放軍新聞傳播中心融媒體、中國長安網、中國青年報)所發(fā)布的短視頻進行研究。視頻內容主要涉及新聞領域。對這9 個活躍用戶的賬號進行監(jiān)測,每隔5min 采集其所發(fā)布短視頻的評論量、點贊量及播放量,最終得到這9 個活躍用戶在2019 年11 月11 日?12 月8 日期間發(fā)布的短視頻數據。其中,針對每個短視頻,采集的數據示例如表1 所示。

      表1 每隔5min 所采集的某個短視頻相關數據的示例

      此外,為了研究用戶的評論情感傾向對短視頻播放量的影響,本文也采集了所監(jiān)控短視頻的評論數據,每一條評論數據由評論用戶ID、用戶性別、評論時間和評論內容所組成。

      1.2 短視頻傳播模式分析

      本文所研究的抖音平臺中,短視頻的傳播基于“流量池”的疊加推薦算法,即在流量池中表現較好的短視頻會進入疊加推薦的行列,從而能夠獲得更多的播放量和點贊量[19],圖1 展示了抖音平臺對短視頻進行推薦的全過程。由于每個短視頻在流量池推薦算法中被推薦的次數不同,導致短視頻之間的流行度演化模式存在一定差異。接下來將基于抖音平臺的實際數據對短視頻傳播過程中的流行度演化模式進行研究。

      圖1 抖音平臺推薦過程示例圖

      通過對實際數據的研究,本文發(fā)現抖音平臺中短視頻的播放量累計曲線存在多種時變模式。根據曲線斜率的變化情況,將時變模式粗略分為兩類:1)僅存在單次長時間緩慢增長——先是快速增長,之后伴隨一個長時間的緩慢增長階段,稱作單梯度曲線(圖2a);2)存在多個長時間緩慢增長的階段,稱為多梯度曲線(圖2b)。經過統(tǒng)計分析,兩類曲線在整個數據集中的占比分別為88%和10.5%。

      圖2 短視頻累計播放量的兩個典型傳播模式

      不同的播放量累計時變模式的產生主要由抖音平臺的推薦機制所致。由于不同短視頻被推薦的次數以及在流量池中達到再推薦的過程的差異性使得存在多種時變模式,本文將分別說明不同時變模式的特點及其產生的原因。

      1)單梯度播放量累計曲線

      對于單梯度播放量累計曲線,本文對其局部增長模式進行了研究。圖2a 為用戶“人民日報”于2019 年11 月28 日發(fā)布的某條視頻,播放量達到3 千萬以上,方框內為時間取值范圍[8500,11 500]的累計播放量的局部曲線。發(fā)現其局部增長曲線也存在多次快速增長的情況,這說明系統(tǒng)也對單梯度曲線進行了多次推薦,但由于其在較短時間內就達到了系統(tǒng)再次推薦的標準,因此整體曲線僅呈現出一個較長時間的緩慢增長階段。

      2)多梯度播放量累計曲線

      圖2b 為用戶“新華社”于2019 年11 月12 日發(fā)布的某條視頻,播放量達到160 萬以上。發(fā)現多梯度播放量累計曲線在傳播過程中存在需要一定時間的積累才可達到進入下一推薦流量池要求的過程,所以存在多次長時間緩慢增長的階段,因此整體曲線呈現出多個梯度疊加的增長趨勢。

      2 評論情感強度、點贊量與播放量的相關性分析

      2.1 評論情感傾向分析

      本文采用百度AI 開放平臺[20]中基于情感詞典的情感分析方法對評論數據進行情感分析。針對短視頻的每一條評論,該方法可給出評論情感所屬正負傾向的概率以及分類結果。模型根據得到的正負傾向概率的相對大小,對評論情感進行分類?;诎俣華I 平臺判定的某個短視頻評論的情感傾向示例如表2 所示。其中,分類結果中0 表示負向情感,1 表示中性,2 表示正向情感。

      表2 某短視頻評論的情感分析結果示例

      2.2 評論情感與播放量的相關性

      為了直觀表示解釋變量與被解釋變量的依存關系及方向,本文利用SPSS 中的斯皮爾曼雙變量雙邊簡單相關系數對變量間的相關關系進行測量。

      在本文中,正向(負向)情感強度指,單個視頻中帶有正向(負向)情感的評論在該視頻全部評論中的占比。首先,本文以監(jiān)測的所有短視頻為研究對象,分析其播放量與評論情感強度的相關性,發(fā)現兩者在0.01 級別上顯著相關,如表3 所示;播放量與正向情感強度呈負相關(相關系數?0.140),與負向情感強度呈正相關(相關系數0.143),即負向情感評論占比高的短視頻播放量也會相對較高。

      表3 斯皮爾曼相關性分析

      進一步,分別分析了每個活躍用戶所發(fā)布的短視頻的播放量和情感強度的相關性,9 個活躍用戶的相關系數分布如圖3 所示。發(fā)現對于不同的視頻發(fā)布用戶,評論情感強度與播放量的相關系數差異較大,其與用戶偏向性有關。根據短視頻的內容進行劃分,以用戶發(fā)布視頻中正向視頻的占比作為用戶偏向性。以用戶“人民日報”為例,用戶偏向性為93%,負向評論情感與播放量相關系數為0.080,反之,“新華社”的用戶偏向性為77%,負向評論情感與播放量相關系數為0.25。即用戶偏向性高時,整體的正向評論占比高,所發(fā)布的短視頻之間評論差異性低,導致評論情感與播放量的相關系數小。

      圖3 評論情感與播放量的相關性

      因此,對短視頻評論進行情感分析發(fā)現,播放量與評論情感顯著相關且相關系數受用戶偏向性影響。其中,對于傾向于發(fā)布正能量的用戶,評論情感強度與播放量的相關性較小,反之,對于傾向于發(fā)布易引發(fā)負向情感的用戶,兩者相關性較大,且評論負向情感強度大的短視頻播放量也會相對大。

      2.3 點贊量與播放量的關系

      本文分析了點贊量、評論量、轉發(fā)量與播放量的相關性,發(fā)現相比于評論量、轉發(fā)量(見表3),點贊量與播放量呈強正相關(相關系數0.937)。

      為進一步探索兩者之間的關系,本文借助傳輸熵[21],研究了點贊量與播放量的相互作用。對于兩個時間序列X、Y,X對Y的作用可利用傳輸熵計算如下:

      如果X對Y的凈作用強度的結果為正值,則說明序列X驅動序列Y;結果為負值,則Y處于驅動位置。

      基于短視頻數據集,以每個短視頻的點贊量時間序列X和播放量時間序列Y作為研究對象。利用式(1)計算后,發(fā)現TX,Y>0,說明點贊量和播放量之間存在相互作用關系。經過分析點贊量對播放量的凈作用強度分布如圖4 所示,其中X表示點贊量時間序列,Y表示播放量時間序列,表示以X作為驅動因素,即點贊量驅動播放量。發(fā)現點贊量驅動播放量的短視頻占比約為70%,即大部分情況下,點贊量對于播放量是處于驅動地位的。

      圖4 點贊量與播放量的凈作用強度分布

      2.4 評論情感與點贊率的關系

      此外,本文分析了評論情感與點贊率的相關性。在分析評論情感與點贊率的相關性中,情感強度越大,則表征評論情感偏向越明顯。因此,選取數據集中評論情感偏向性大的數據進行分組,以情感強度0.6 作為閾值,將負向情感強度0.6 以上以及正向情感強度0.6 以上的短視頻分為兩組。分別對這兩個數據集中短視頻的點贊率和情感強度進行分析,發(fā)現對于負向情感組,點贊率和負向情感強度之間的相關系數為0.260;對于正向情感組,點贊率和正向情感之間的相關系數為0.343??梢姡u論情感強度與點贊率之間存在顯著相關關系(見表3)。

      因此,基于點贊量對播放量的驅動特征,考慮將點贊率引入短視頻傳播模型的構建中;與此同時,基于點贊率與評論情感的相關性,通過引入點贊率,也可以間接反映情感傾向對播放量的影響。

      3 點贊?傳播動力學模型的構建

      3.1 抖音短視頻播放量演化模型

      本文考慮了系統(tǒng)推薦以及粉絲觀看這兩個傳播途徑[11];同時,基于第二部分的相關性分析,本文將點贊行為引入模型構建中,假設當短視頻點贊量達到一定閾值后即被推薦入下一個流量池(如圖5所示),從而構建了短視頻的點贊?傳播動力學模型來刻畫短視頻播放量的演變模式。

      圖5 短視頻進入下一推薦階段的過程

      在短視頻的傳播過程中,對于系統(tǒng)推薦部分,假設t時刻其處于系統(tǒng)推薦的第i階段,其中流量池中的用戶以恒定速率b對短視頻進行觀看,假定短視頻進入第i推薦階段的時間為Ti,可得到第i階段流量池變化速率如下:

      式中,Si(t)表示t時刻第i階段流量池的未推薦人數。

      對于粉絲觀看部分,假定粉絲以速率 β對視頻進行觀看,得到t時刻未觀看粉絲人數f(t)的變化速率如下:

      初始時刻f(0)=αN,其中 α代表觀看該短視頻的潛在粉絲用戶占總粉絲用戶的比例,N為用戶總粉絲量,即 αN為觀看該短視頻的粉絲總數。

      由式(3~4)以及點贊率qi得到播放量以及點贊量變化速率如下:

      式中,I(t)、x(t)分別表示t時刻的累計播放量和累計點贊量。

      假設每個階段進入下一階段的點贊量閾值為Di,時間閾值為Ki,Ti為進入第i階段推薦的時間,從i到i+1階段點贊量x(t)需要滿足下列條件:

      由于在點贊量達到條件時,推薦進入下一階段。假設i階段流量池總推薦人數為Ri,得到第i階段實際推薦人數Ai:

      由Si(0)=Ri,i階段實際推薦人數為Ai,對式(3)求導,推出動力學模型中的累計推薦人數Ct:

      由f(0)=αN,對式(4)求導,推出動力學模型中的累計粉絲觀看人數Ft:

      由式(10~11)得到t時刻的累計觀看人數為:

      3.2 模型的擬合及參數影響

      利用式(12)對實際數據(用戶“浙有正能量”所發(fā)布的兩個不同播放量時變模式的短視頻數據)進行復現,得到了很好的吻合,結果如圖6 所示。其中圖6a 為2019 年11 月21 日發(fā)布的視頻,播放量達150 萬,對其第一次推薦過程進行擬合的結果:系統(tǒng)推薦速率b=0.0061,粉絲觀看數f(0)=8.83 萬人;圖6b 為2019 年12 月3 日發(fā)布的視頻,播放量達200 萬,多梯度播放量累計曲線的擬合結果:系統(tǒng)推薦速率b1=0.1078,b2=0.0368,粉絲觀看數f(0)=73.68 萬人。圖6a 對完整的播放量累計曲線中第一個梯度進行擬合,發(fā)現模型可以很好地復現一次推薦過程。圖6b 對實際數據中的多梯度播放量曲線進行擬合,通過對數據的觀察得到其轉折點,模型擬合了每一個梯度過程。圖6 的擬合結果說明模型可以很好地反映在線短視頻的傳播過程。

      圖6 模型擬合結果

      短視頻傳播過程中受到多次的系統(tǒng)推薦,本文只討論最多3 次的疊加推薦,且設定3 個流量池分別為R1、R2、R3,其中流量池R1=100,R2=150,R3=200,流量池點贊量閾值Di(i=1,2),時間閾值為Ki(i=1,2)。

      為簡便起見,本文假定傳播過程中每一階段的點贊率相等,即qi=ω。通過探索點贊率 ω對播放量的影響,發(fā)現不同梯度曲線的產生受點贊率的影響。設其他參數不變,粉絲吸引率α=0.08,用戶粉絲數N=10000,推薦速率b=0.05,點贊量閾值D1=11,D2=16,時間閾值K1=350,K2=300。當點贊率較高時,如圖7a 和7c,短視頻的點贊量可快速達到進入下一流量池的閾值,因此短視頻在每一流量池的時間較短,從而播放量呈現快速增長,最后再進入長期緩慢增長的模式,這也反映了實際數據中的第一類模式(如圖2a)。當點贊率較低時,如圖7b 和7d,短視頻的點贊量需要較長時間的積累才可達到點贊量閾值,因此在每一流量池的時間較長,從而傳播過程中存在多次長時間緩慢增長的階段,播放量呈現階段性增長,反映了實際數據中第二類模式(如圖2b)。

      圖7 點贊率ω 對視頻流行度模式的影響

      粉絲吸引率 α對短視頻傳播的影響如圖8 所示。設其他參數不變,用戶粉絲數N=10000,推薦速率b=0.05,點贊率ω=0.10,點贊量閾值D1=11,D2=16,時間閾值K1=300,K2=300。圖8a 中,隨著 α的增大,播放量呈階躍式的增長。這是因為當α較小時(如圖8b),短視頻前期播放量較小,無法進入下一推薦階段;而隨著 α的增加(如圖8c 和8d),短視頻可以得到多次推薦,從而播放量也相應增加。可見初始的粉絲吸引率對短視頻在初期能否進行系統(tǒng)推薦從而傳播開來具有重要的影響。

      圖8 粉絲吸引率α 對視頻傳播的影響

      4 結束語

      為了探索短視頻的傳播機制,本文基于相關性分析以及傳輸熵,發(fā)現點贊量與播放量呈強正相關,且點贊量對播放量有驅動作用;結合短視頻傳播特點和已有的視頻傳播模型,將點贊促進傳播以及多次推薦的特征考慮在內,構建了在線短視頻的點贊?傳播動力學模型。本文還結合短視頻評論以及短視頻播放量,探索評論的用戶情感與播放量之間的關系。后續(xù)的研究可將視頻內容所引發(fā)的情感傾向對播放量的影響考慮在內,進一步完善模型。

      猜你喜歡
      閾值曲線情感
      未來訪談:出版的第二增長曲線在哪里?
      出版人(2022年8期)2022-08-23 03:36:50
      如何在情感中自我成長,保持獨立
      幸福曲線
      英語文摘(2020年6期)2020-09-21 09:30:40
      沿平坦凸曲線Hilbert變換的L2有界性
      失落的情感
      北極光(2019年12期)2020-01-18 06:22:10
      情感
      小波閾值去噪在深小孔鉆削聲發(fā)射信號處理中的應用
      基于自適應閾值和連通域的隧道裂縫提取
      如何在情感中自我成長,保持獨立
      比值遙感蝕變信息提取及閾值確定(插圖)
      河北遙感(2017年2期)2017-08-07 14:49:00
      颍上县| 伊川县| 安多县| 青浦区| 清新县| 天全县| 宝山区| 民和| 江永县| 阳春市| 宽甸| 应用必备| 锦屏县| 韶关市| 通海县| 南宫市| 逊克县| 兴和县| 大方县| 拜泉县| 和田县| 岳普湖县| 道真| 丰县| 壤塘县| 石楼县| 湟源县| 兴化市| 四子王旗| 偃师市| 关岭| 汨罗市| 葫芦岛市| 昭通市| 灵丘县| 万载县| 寻甸| 建瓯市| 苏尼特右旗| 富川| 东丽区|