• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向視頻彈幕的網(wǎng)絡(luò)輿情事件監(jiān)測研究*

      2022-03-07 08:01:00黃立赫石映昕
      情報雜志 2022年2期
      關(guān)鍵詞:彈幕輿情情感

      黃立赫 石映昕

      (1.西北工業(yè)大學(xué)馬克思主義學(xué)院 西安 710129;2.華北水利水電大學(xué)馬克思主義學(xué)院 河南 鄭州 450046)

      伴隨著社會性網(wǎng)絡(luò)的快速發(fā)展,用戶生成內(nèi)容(User Generated Content,UGC)已成為眾多社交平臺的顯著特征[1]。以嗶哩嗶哩,優(yōu)酷等為代表的視頻分享平臺逐漸演化成資源共享、情感表達(dá)、社交分享的信息載體。視頻彈幕作為一種日漸流行的在線評論形式,包含大量的視頻標(biāo)簽語義信息[2]。不同于以娛樂化標(biāo)引為主要特征的主題類型視頻彈幕,網(wǎng)絡(luò)輿情事件的視頻彈幕往往包含大量的社會標(biāo)引(Social tagging),網(wǎng)民通過發(fā)布、評論等行為,表達(dá)針對社會熱點事件的情感傾向?;谏鐣?biāo)引的視頻彈幕不僅成為網(wǎng)民在線吐槽的欲望傳感器,更成為視頻觀眾情感波動的前哨站。與通用的普通短文本分析不同的是,視頻彈幕所具有的實時交互性與臨場在線性等特點,使得面向視頻彈幕的文本分析能夠精準(zhǔn)捕捉用戶的交互行為與情感傾向在時間分布上的顯著差異,動態(tài)追蹤視頻彈幕中的話題遷移,感知事件漂移的輿情走向,對預(yù)警網(wǎng)絡(luò)輿情危機(jī),繪制可視化的事理圖譜等具有重要的研究價值。

      網(wǎng)絡(luò)輿情事件的發(fā)展在時間維上具有平滑性,表現(xiàn)為舊話題的消亡或新話題的產(chǎn)生或抑制。類似地,用戶的評論情感也會隨之演化,產(chǎn)生情感極性與情感強(qiáng)度的調(diào)整。本文在視頻彈幕情感計算的基礎(chǔ)上,引入彈幕遷移指數(shù),旨在量化網(wǎng)絡(luò)輿情事件的預(yù)警監(jiān)測指標(biāo),通過計算不同時間序列下話題權(quán)重與情感強(qiáng)度變化,繪制遷移指數(shù)動態(tài)曲線,實現(xiàn)網(wǎng)絡(luò)輿情事件監(jiān)測的路徑分析。

      1 相關(guān)理論研究

      目前針對網(wǎng)絡(luò)輿情事件的文本主題建模主要可分為聚類分析和主題分析兩類。聚類分析模型通過計算文檔間的相似距離,實現(xiàn)文檔主題的識別,主要包括聚類算法[3]、TF-IDF算法[4]、關(guān)聯(lián)規(guī)則挖掘[5]等。主題模型(Topic Model)主要通過識別文本集合潛在的語義結(jié)構(gòu),抽取文本主題。LDA(Latent Dirichlet Allocation)主題模型[6]基于詞袋原理,將文本的語義表示從高維詞空間降到低維主題空間,建立基于概率模型的三層貝葉斯網(wǎng)絡(luò),已成為最受矚目的研究理論。然而,LDA主題模型的性能受文本長度的影響,且未充分考慮詞之間的位置關(guān)系,因而無法有效抽取短文本主題。為此,Yan[7]提出BTM(Biterm Topic Model)雙詞主題模型,該模型通過抽取文檔中的雙詞,建立主題混合分布,改善了因文檔過短而出現(xiàn)的特征矩陣稀疏的問題。

      文本情感分析依據(jù)情感的粒度信息,可分為詞語級、句子級、篇章級。詞語級的情感分析是文本情感分析的基礎(chǔ),該類研究主要可分為基于無監(jiān)督的情感詞典方法以及基于有監(jiān)督的機(jī)器學(xué)習(xí)方法。句子級的情感分析通常在詞語級分析的基礎(chǔ)上,增加文檔上下文關(guān)聯(lián)、情感位置判斷、句法分析等要素,實現(xiàn)主觀句情感分類。篇章級通常將文檔視為單一評論對象,忽略不同對象間的情感評論差異,因而整體情感識別精度較低。此外,依據(jù)研究內(nèi)容的不同,文本情感分析也可分為主客觀分類[8]、情感極性分析[9]以及多情感分類[10]。

      綜上所述,當(dāng)前學(xué)者對于網(wǎng)絡(luò)輿情事件的話題漂移研究,多集中于事件的主題識別與情感的演化分析,缺乏能夠量化的方法識別網(wǎng)絡(luò)輿情事件的情感變化關(guān)鍵時間窗口。此外,研究多側(cè)重網(wǎng)絡(luò)輿情事件的文本分析,利用視頻彈幕進(jìn)行用戶情感分析尚不多見。因此,本文針對以上不足,研究了視頻彈幕社區(qū)中用戶情感在時間維上的演化特征,通過引入彈幕遷移指數(shù)概念,從話題內(nèi)容與用戶情感的角度,實現(xiàn)了話題與情感的協(xié)同分析。模型研究思路如圖1所示。

      圖1 視頻彈幕監(jiān)測分析模型

      2 視頻彈幕主題與情感建模

      2.1彈幕主題識別本文采用BTM主題模型進(jìn)行主題識別,該模型假設(shè)詞對間的語義相關(guān)性與其在相同文本中共現(xiàn)的次數(shù)成正比,通過構(gòu)建主題混合分布,實現(xiàn)“雙詞對-主題-語料文本”三層Bayes概率建模。若網(wǎng)絡(luò)輿情事件的視頻文本數(shù)為M,包含的主題數(shù)為K,詞對數(shù)為|B|,BTM模型假設(shè)視頻文本話題詞的先驗分布為Dirichlet分布,即θz=Dirichlet(α),φw|z=Dirichlet(β),語料庫的生成過程描述如下:a.抽取主題z下的詞分布;b.抽取文檔i的主題分布;c.抽取主題z~Multi(θ),并從主題z中抽取共現(xiàn)詞對b=(wi,wj),wi,wj~Multi(φz)。重復(fù)上述過程,最終構(gòu)建完整的視頻彈幕語料庫。BTM模型參數(shù)具體含義見表1。

      表1 BTM主題模型的參數(shù)

      2.2彈幕情感計算彈幕文本中的情感計算需要在情感極性判斷的基礎(chǔ)上,實現(xiàn)句子級的多粒度情感分析。本文借鑒鄭飏飏等[10]創(chuàng)建彈幕情感詞典的思想,以7分類情感指標(biāo)作為情感維度,將彈幕文本的情感粒度分為樂、好、怒、哀、懼、惡、驚等細(xì)分維度。此外,針對彈幕語言的特點,首先建立彈幕顏文字詞典,再基于情感詞匯本體庫[11]、常用副詞表[12]以及否定詞表[13],建立多維情感詞典,最后計算彈幕語句的綜合情感強(qiáng)度。

      2.2.1 顏文字詞典的構(gòu)建 視頻彈幕作為一種融合用戶在線評論文本的新型視頻形式,包含大量觀眾對視頻內(nèi)容的觀點評價與情感傾向[14]。顏文字作為一種新的網(wǎng)絡(luò)熱詞形式,在多語言符號的基礎(chǔ)上逐漸演化成包含多種字符與圖案集的亞文化語言,廣泛存在于各大視頻彈幕網(wǎng)站中。顏文字詞典構(gòu)建過程如下:a.首先經(jīng)分詞、去停用詞、詞性標(biāo)注等預(yù)處理后,從實驗數(shù)據(jù)集中,隨機(jī)抽取一定數(shù)量的顏文字,進(jìn)行人工情感標(biāo)注,建立顏文字種子情感分類表,并參照文獻(xiàn)[15]建立情感分類樹,進(jìn)行情感強(qiáng)度標(biāo)注,結(jié)果如表2所示。b.利用公式1依次計算新的顏文字與表2中的種子詞之間的互信息值,選取最大互信息值所含有的種子情感,作為其最終的情感類別。

      表2 顏文字種子情感分類表(部分)

      (1)

      其中,P(wnew,wseed)表示wnew與wseed同時出現(xiàn)在文本D中的概率;P(wnew),P(wseed)分別表示wnew,wseed單獨(dú)出現(xiàn)的概率。通過動態(tài)遍歷情感分類樹中包含新顏文字的語句情感強(qiáng)度,綜合判斷句子級的情感值。假設(shè)顏文字詞典的正向情感集合為Wpos(包含“樂”“好”等情感維度),負(fù)向情感集合為Wneg(包含“怒”“哀”“懼”“惡”“驚”等情感維度),則含有新顏文字wnew的句子綜合情感強(qiáng)度Semoji(wi),計算如公式2所示。

      (2)

      其中,|Wpos|與|Wneg|分別表示正向情感集合與負(fù)向情感集合所含的顏文字?jǐn)?shù)。

      2.2.2 多維情感詞典的構(gòu)建 將顏文字詞典與情感詞典相結(jié)合,能夠?qū)崿F(xiàn)多元化的情感發(fā)現(xiàn)。本文依據(jù)大連理工大學(xué)構(gòu)建的情感詞匯本體庫,抽取彈幕語句的情感詞,并結(jié)合否定詞表與程度副詞表,構(gòu)建面向視頻彈幕文本的多維情感詞典,具體流程如下:首先通過標(biāo)注彈幕文本的詞性,篩選出具有情感信息的形容詞、嘆詞和動詞,并將抽取出的情感詞歸類到七元情感維度中,并確定否定詞對彈幕情感遷移的影響,情感分類映射關(guān)系如表3所示。經(jīng)否定詞修飾后的彈幕本文情感值計算,如公式3所示,其中n表示否定詞的個數(shù)。

      表3 含有否定詞的情感分類映射關(guān)系表

      注:正向情感(好,樂)經(jīng)過奇數(shù)次修飾后,情感態(tài)勢轉(zhuǎn)變成負(fù)向情感,其中強(qiáng)度較高的樂(0.4-0.5),好(0.4-0.5)映射成“怒”情感。負(fù)向情感“懼”“衰”“驚”經(jīng)過修飾后,表現(xiàn)為無情感,其中“怒”“惡”則轉(zhuǎn)換成不同程度的“好”情感

      (3)

      文本的情感識別還需要考慮程度副詞對情感強(qiáng)度的影響,為此,將經(jīng)過程度副詞修飾的情感強(qiáng)度定義為公式4所示,其中,|adv|表示程度副詞的修飾強(qiáng)度。

      Sadv(wi)=|adv|*s(wi)

      (4)

      同一條彈幕的情感值由其所包含的所有顏文字以及情感詞共同決定,通過對不同類別的情感維度進(jìn)行線性求和,最終得到彈幕的綜合情感值,計算如公式5所示。當(dāng)某類情感維度取得最大值時,可將其視為某條彈幕主題的情感。

      (5)

      其中,Semoji(wi)表示彈幕文本的顏文字情感強(qiáng)度,S(wi)表示經(jīng)過否定詞與程度副詞修飾后的情感強(qiáng)度,k表示一條彈幕中屬于相同情感維度的顏文字與情感詞的總數(shù)。

      3 彈幕遷移指數(shù)構(gòu)建

      新媒體環(huán)境下,部分網(wǎng)絡(luò)輿情事件在演變成熱點事件之前,首先是以視頻的形式在自媒體中廣泛傳播[16]。研究如何及時有效地感知事件的主題變化,準(zhǔn)確預(yù)測輿情的演化走向,對提高網(wǎng)絡(luò)生態(tài)環(huán)境的預(yù)警與監(jiān)控能力具有重要的現(xiàn)實意義。視頻彈幕作為二次元時代流行的視頻互動模式,包含大量的用戶評論以及情感評價信息。彈幕遷移指數(shù)作為監(jiān)控視頻彈幕事態(tài)變化的重要指標(biāo),能夠動態(tài)感知網(wǎng)絡(luò)輿情事件的輿情危機(jī),繪制事件的生命周期節(jié)點,達(dá)到動態(tài)感知情感變化的目的。本文認(rèn)為彈幕遷移指數(shù)不僅要體現(xiàn)話題內(nèi)容的語義改變,更要突出話題情感的動態(tài)變化。因此,彈幕遷移指數(shù)由話題遷移指數(shù)與情感遷移指數(shù)兩個分指標(biāo)共同決定。

      3.1話題遷移指數(shù)話題遷移指數(shù)主要從話題內(nèi)容的關(guān)鍵詞權(quán)重以及視頻興趣熱度的變化角度,刻畫網(wǎng)絡(luò)輿情事件話題遷移,具體構(gòu)建過程如下:首先由BTM主題模型得到主題-詞分布以及文檔-主題分布,再基于TF-IDF算法計算不同關(guān)鍵詞的權(quán)重,同時結(jié)合視頻彈幕熱度分析,通過點擊量,彈幕量,播放量等信息,計算時間序列下彈幕的熱度指數(shù)。最后,綜合上述指數(shù)特征分量,得到能夠反映彈幕話題遷移特征的指數(shù)信息。

      3.1.1 最優(yōu)話題數(shù)與話題關(guān)鍵詞權(quán)重計算 話題遷移指數(shù)通過對比相鄰時間片內(nèi)的主題變化,并結(jié)合話題特征詞權(quán)重與話題興趣熱度特征,實現(xiàn)話題遷移的路徑表示。不同時間序列下的最優(yōu)話題數(shù)是影響話題權(quán)重總和的關(guān)鍵參數(shù)。困惑度(Perplexity)是用來衡量BTM模型最優(yōu)話題數(shù)的重要指標(biāo),困惑度越小,模型的性能越優(yōu),相應(yīng)的主題數(shù)取到最優(yōu)值[17]。

      依據(jù)“二八原則”,從每個數(shù)據(jù)集中隨機(jī)抽取80%的數(shù)據(jù)作為訓(xùn)練集,20%數(shù)據(jù)作為測試集,經(jīng)過多次迭代測試。實際操作發(fā)現(xiàn),不同測試集的實驗數(shù)據(jù)對模型困惑度取值的影響較大。因此,最終采用十折交叉驗證法,將數(shù)據(jù)集隨機(jī)分成十份,其中九份作為訓(xùn)練集,一份作為測試集,進(jìn)行十次交叉測試,選取十次操作的平均值作為最終結(jié)果(如圖2所示)。由圖2可知,當(dāng)話題數(shù)K為25時,曲線出現(xiàn)較為明顯的拐點,且話題數(shù)量逐漸收斂。

      圖2 十折交叉后的模型困惑度曲線圖

      為了進(jìn)一步描述話題的內(nèi)在語義信息,探究情感極性與情感強(qiáng)度的內(nèi)在聯(lián)系。本文采用TF-IDF模型計算話題的特征詞權(quán)重,建立話題特征詞的詞頻權(quán)重矩陣,刻畫不同特征詞對話題的重要程度。假設(shè)t時刻視頻彈幕含有s個話題,則此時其話題權(quán)重可用公式6計算。其中,tfidfij表示t時刻第i個話題所含的第j個特征詞的tfidf值,s為話題數(shù),p為話題所含的特征詞數(shù)。

      (6)

      3.1.2 興趣熱度計算 興趣熱度體現(xiàn)了網(wǎng)絡(luò)輿情事件的傳播速度與傳播走向,能夠為預(yù)測其是否會轉(zhuǎn)化成網(wǎng)絡(luò)熱點事件提供必要的數(shù)據(jù)參考。因此,本文通過獲取視頻彈幕的點贊數(shù)、收藏數(shù)、分享量、彈幕數(shù)以及播放量,建立多指標(biāo)的視頻興趣熱度評價模型,具體流程如下:首先,對上述指標(biāo)進(jìn)行歸一化和百分化處理,再通過層次分析法確定不同指標(biāo)的權(quán)重,使用1-9標(biāo)度方法確定判斷矩陣的元素aij,然后采用合積法求解判斷矩陣的特征值與特征向量,構(gòu)建指標(biāo)體系。為了確定指標(biāo)分配權(quán)重的合理性,需要進(jìn)行判斷矩陣的一致性檢驗,具體過程如下:a.分別計算一致性指標(biāo)CI與隨機(jī)一致性指標(biāo)RI,再得到一致性比率CR。當(dāng)CR<0.10時,認(rèn)為判斷矩陣的一致性是合理的,否則需要修正判斷矩陣;b.將通過一致性檢驗的判斷矩陣進(jìn)行層次加權(quán),最終得到如表4所示的興趣熱度指標(biāo)權(quán)重表。

      (7)

      表4 興趣熱度指標(biāo)權(quán)重分配表

      3.1.3 話題遷移指數(shù)構(gòu)建 話題遷移指數(shù)(Topic Drift Index, TDI)結(jié)合話題的關(guān)鍵詞權(quán)重與視頻興趣熱度指數(shù),依據(jù)不同時間測度下網(wǎng)絡(luò)輿情事件的話題tf-idf詞頻權(quán)重與興趣熱度的變化量,從話題內(nèi)容角度判斷網(wǎng)絡(luò)輿情事件是否存在主題漂移傾向。話題遷移指數(shù)計算如公式8所示。

      (8)

      3.2情感遷移指數(shù)情感遷移指數(shù)(Sentiment Drift Index, SDI)主要依據(jù)時間維下不同主題的情感值變化,體現(xiàn)網(wǎng)絡(luò)輿情事件在不同生命周期內(nèi)的情感波動,從情感變化的角度實現(xiàn)網(wǎng)絡(luò)輿情的測度分析?;?.2節(jié)的論述,情感遷移指數(shù)計算如公式9所示。其中,S(w)t1,S(w)t2分別表示t1,t2時視頻彈幕的綜合情感值。

      (9)

      3.3彈幕遷移指數(shù)彈幕遷移指數(shù)作為監(jiān)測網(wǎng)絡(luò)輿情事件的重要指標(biāo),能夠較為準(zhǔn)確地感知引起網(wǎng)絡(luò)輿情動態(tài)變化的重要話題與時間窗口信息。本文綜合考慮網(wǎng)絡(luò)輿情事件的兩個核心要素:話題特征與情感特征,聯(lián)合建模話題遷移指數(shù)與情感遷移指數(shù),最終得到彈幕遷移指數(shù)(Bullet-screen Drift Index),計算如公式10所示。其中,δ1,δ2分別表示話題遷移指數(shù)、情感遷移指數(shù)在彈幕遷移指數(shù)中的比重。若情感遷移指數(shù)為負(fù)數(shù),則表示其情感轉(zhuǎn)為負(fù)向情感,此時將其絕對值代入公式10,并標(biāo)注該彈幕遷移指數(shù)為負(fù)值。

      BDI=δ1TDI+δ2SDI

      (10)

      4 實驗結(jié)果與分析

      4.1數(shù)據(jù)來源與預(yù)處理本文以“章瑩穎事件”作為研究對象,使用八爪魚爬取bilibili和愛奇藝視頻網(wǎng)站的視頻彈幕數(shù)據(jù),驗證網(wǎng)絡(luò)輿情事件的彈幕遷移指數(shù)在輿情分析中的合理性??紤]到視頻時間跨度較長且彈幕密度與時間段存在較大關(guān)聯(lián),事件范圍設(shè)定在2017年6月13日-2020年10月28日,并設(shè)置時間窗口為6個月,將數(shù)據(jù)集劃分成6個子集,采集字段包括視頻發(fā)布日期、視頻數(shù)、點贊數(shù)、收藏數(shù)、分享量、彈幕數(shù)、播放量等,共獲取有效彈幕文本2 702 243條,采集結(jié)果如表5所示。

      表5 視頻彈幕數(shù)據(jù)分布

      為了驗證彈幕遷移指數(shù)對網(wǎng)絡(luò)輿情事件的預(yù)測效果,依據(jù)百度指數(shù),以“章瑩穎案”為搜索關(guān)鍵詞,繪制熱度指數(shù)曲線,如圖3所示。由圖3可知,該事件的輿情傳播呈現(xiàn)“雙峰”特征,依據(jù)賈亞敏[18]提出的輿情周期劃分方法對“章瑩穎案”進(jìn)行劃分,首次爆發(fā)時間段為2017.6.5-7.24,爆發(fā)主因是章瑩穎案情公布,涉事方就其下落展開激烈討論;首次衰退期為2017.7.25-2017.8.18,該時期隨著案情的持續(xù),警方陸續(xù)發(fā)布案件信息,基本鎖定嫌疑人;擴(kuò)散期為2017.8.19-2019.6.24,該時期以案件定性,受害家屬情感慰藉以及尋找章瑩穎為主線;增長期為2019.6.25-2019.8.20,起因是案件進(jìn)入審判程序,遺體位置以及美國死刑制度引發(fā)熱議。

      圖3 “章瑩穎案”百度熱度指數(shù)曲線

      4.2參數(shù)分析話題遷移指數(shù)由主題權(quán)重值與興趣熱度值決定,需要確定調(diào)節(jié)參數(shù)α,β的取值。以5號窗口所含的彈幕為實驗對象,實驗過程如下:首先依據(jù)困惑度,計算該窗口下視頻彈幕所含的最優(yōu)主題數(shù),并分別計算該視頻的興趣熱度。然后將所含主題數(shù)相近的視頻歸為一類,觀測其興趣熱度的變化情況。經(jīng)比較得出:“章瑩穎事件”中主題數(shù)較少的視頻彈幕,往往傾向于描述該事件的案件信息、受害方情感等內(nèi)容,興趣熱度值相對較高。因此,測定得出:當(dāng)主題數(shù)小于5時,該視頻的興趣熱度參數(shù)β=0.75,α=0.25,此時,話題遷移指數(shù)較能客觀反映事件的熱點主題變化情況。當(dāng)主題數(shù)不小于5時,該視頻的興趣熱度參數(shù)β=α=0.5。

      彈幕遷移指數(shù)主要由話題遷移指數(shù)與情感遷移指數(shù)構(gòu)成,不同指數(shù)間的參數(shù)權(quán)重會影響最終的實驗結(jié)果。通常視頻彈幕的情感會隨著視頻主題內(nèi)容的變化而逐漸演化,在主題內(nèi)容沒有發(fā)生變化的條件下,視頻觀眾在相鄰時間片內(nèi)的情感變化程度較小。因此,為確定話題遷移指數(shù)參數(shù)δ1與情感遷移指數(shù)參數(shù)δ2的取值,實驗過程如下:首先選取包含彈幕數(shù)最多的5號窗口文本,以“月”為單位,將其所含的視頻劃分成6個子窗口文本。然后利用2.1節(jié)的彈幕主題識別方法,抽取不同時間窗口下彈幕文本所含的主題。選取主題延續(xù)周期較長的主題(至少在3個時間窗口內(nèi)均存在),并將其加入候選主題集。再依據(jù)2.2節(jié)彈幕情感計算過程,分別計算上述主題的情感強(qiáng)度,得到如表6所示的主題情感結(jié)果。

      表6 5號窗口文本的部分主題-情感計算結(jié)果(部分)

      通過賦值多個情感遷移指數(shù)參數(shù)δ2,計算候選主題集中每個主題在相鄰時間片下彈幕遷移指數(shù)間的平均相關(guān)系數(shù),實驗結(jié)果如圖4所示。由圖4可知,當(dāng)因子δ2=0.45時,平均相關(guān)系數(shù)取到最大,對情感遷移指數(shù)參數(shù)的賦值最合理。

      圖4 相鄰時間片下情感值間的相關(guān)系數(shù)分析

      4.3實驗結(jié)果分析基于BTM模型進(jìn)行主題提取,設(shè)定關(guān)鍵詞數(shù)為30,利用TF-IDF算法計算每個主題下的關(guān)鍵詞權(quán)重,以窗口1中主題權(quán)值排名前5的主題為例,結(jié)果如表7所示。由表7可知,該時間窗口下存在多個主題共存,主題內(nèi)容側(cè)重描述事件的不同要素,且不同主題所含的關(guān)鍵詞權(quán)重具有較大差異,表明不同主題權(quán)重在語義層面上具有明顯差異。

      表7 “章瑩穎事件”主題識別結(jié)果

      采用表4分配的彈幕興趣熱度權(quán)重,計算不同時間窗口下視頻彈幕的主題興趣熱度,以窗口1中興趣熱度排名前5的視頻彈幕為例,計算結(jié)果如表8所示。考慮到同一個視頻中彈幕文本可能含有多個主題,所以以時間節(jié)點為計量周期,將興趣熱度視為該時段內(nèi)視頻彈幕所包含所有主題的熱度值。

      表8 “章瑩穎事件”興趣熱度指數(shù)

      以窗口1所包含的45個視頻彈幕為例,以視頻發(fā)布的時間作為依據(jù),共劃分為5個統(tǒng)計節(jié)點(每個時段含有9個視頻),結(jié)果如表9所示。分析表9可知,在主題權(quán)重增加的情況下,話題遷移指數(shù)可能會因為興趣熱度的提高,而出現(xiàn)下降的情況(如序號2、3所示)。此外,興趣熱度與話題遷移指數(shù)的變化方向基本一致,體現(xiàn)了興趣熱度在監(jiān)測網(wǎng)絡(luò)輿情事件的傳播偏向方面具有一定的參考意義。

      表9 “章瑩穎事件”話題遷移指數(shù)

      基于2.2節(jié)構(gòu)建的多維情感詞典,計算視頻彈幕的情感類別與情感強(qiáng)度,具體流程如下:首先選取不同階段中視頻彈幕所含權(quán)重最大的主題,選取情感強(qiáng)度最大的數(shù)值作為該視頻的最終情感值,并按照7維情感分類法確定視頻彈幕的情感分類,表10是編號為2的視頻彈幕中,主題權(quán)重最大的主題4的部分彈幕情感識別結(jié)果。主題4的主要內(nèi)容是警方公布審訊嫌疑人的過程,由表10可知,觀眾表達(dá)了針對該主題不同方面的情感訴求,在情感類別與情感強(qiáng)度上均具有顯著差異,其中“怒”“惡”兩種負(fù)面情感在整體上較為突出,且情感強(qiáng)度較高。圖5是不同時間窗口內(nèi)主題權(quán)重top3的情感分析結(jié)果,圖5中僅列出每個主題中情感強(qiáng)度最高的三個情感類別。由圖5可知,“章瑩穎事件”的主題情感在事件生命周期內(nèi)整體波動較平穩(wěn),情感類別整體以“怒”和“惡”為主線,具體來說,事件發(fā)展初期,“惡”和“怒”情感強(qiáng)度達(dá)到局部峰值,原因是網(wǎng)民對克里斯滕森堅稱無罪的行為,表達(dá)了強(qiáng)烈的憎惡與憤怒(TopicⅠ-2、TopicⅠ-3)。在事件爆發(fā)階段,“怒”情感強(qiáng)度達(dá)到整個生命周期的最大值,起因是FBI基本確認(rèn)章瑩穎死亡和章瑩穎家屬表達(dá)嚴(yán)懲疑犯的訴求(TopicⅡ-2、TopicⅡ-4),網(wǎng)民的“怒”情感進(jìn)一步釋放。在事件衰退與擴(kuò)散期,各種不同類型的情感分布比例相對均衡,表現(xiàn)為“怒”“哀”“驚”情感交替出現(xiàn),網(wǎng)民的整體情感類別強(qiáng)度逐漸平穩(wěn)且均有不同程度的弱化,網(wǎng)民關(guān)注焦點轉(zhuǎn)向?qū)ふ沂础⑿@安全等事件主題(TopicⅢ-1、TopicⅣ-1),情感強(qiáng)度較弱的原因主要是民眾對章瑩穎家屬表達(dá)了同情與支持等正情感,同時對美國校園安全隱患表達(dá)了擔(dān)憂,從而抵消了部分正情感。在二次爆發(fā)階段,“怒”情感強(qiáng)度再次達(dá)到局部峰值,起因是案件進(jìn)入量刑階段,民眾對判決結(jié)果表達(dá)強(qiáng)烈不滿(TopicⅤ-1、TopicⅤ-2),輿情危機(jī)再次出現(xiàn)。在事件衰退期,輿情走向再次發(fā)生變化,逐漸表現(xiàn)為較低強(qiáng)度的“懼”與“衰”,原因是民眾對司法部門無法尋找遺體的失望,以及對海外人生安全問題的擔(dān)心。

      圖5 各事件窗口內(nèi)情感分析結(jié)果

      表10 視頻彈幕2中主題4的彈幕情感識別結(jié)果(部分)

      計算不同時間窗口下多個視頻彈幕的情感值,得到“章瑩穎事件”的情感漂移指數(shù),以窗口1為例,按照表9的時間節(jié)點劃分方法,情感遷移指數(shù)結(jié)果如表11所示。由表11可知,不同窗口內(nèi),伴隨著主題的演化,其情感類別與情感強(qiáng)度均發(fā)生了明顯的變化,情感遷移指數(shù)變化幅度較大,最高達(dá)到16.3%。

      以話題遷移指數(shù)與情感遷移指數(shù)為基礎(chǔ)(表9和表11),計算該事件的彈幕遷移指數(shù),其中參數(shù)δ1,δ2分別0.55,0.45,結(jié)果如表12所示。由表12可知,該窗口內(nèi),彈幕遷移指數(shù)整體變動幅度較大,如從序號3到4時,彈幕遷移指數(shù)由-5.4%迅速下降到-23.9%,經(jīng)分析發(fā)現(xiàn),該階段事件主題由尋找章瑩穎轉(zhuǎn)變成警方確定嫌疑人,以及嫌疑人背景介紹,情感遷移指數(shù)也急劇下降到-56.3%,輿情轉(zhuǎn)為高強(qiáng)度負(fù)向情感,此時應(yīng)及時提供情緒疏導(dǎo)機(jī)制,避免輿情演化成網(wǎng)絡(luò)暴力。

      表11 情感遷移指數(shù)

      表12 彈幕遷移指數(shù)

      4.4模型驗證為了驗證彈幕遷移指數(shù)監(jiān)控網(wǎng)絡(luò)輿情事件的可行性,本文以圖3“章瑩穎案”百度熱度指數(shù)曲線為對照,通過繪制其關(guān)鍵時間節(jié)點的熱度指數(shù)曲線,與視頻彈幕指數(shù)變化曲線進(jìn)行對比分析,結(jié)果如圖6所示。此外,為了探討視頻彈幕指數(shù)變化的誘因,在相同時間窗口內(nèi)繪制情感遷移指數(shù)與話題遷移指數(shù)的演化曲線,結(jié)果如圖7所示。

      圖6 “章瑩穎事件”百度熱度指數(shù)與視頻彈幕指數(shù)曲線對比

      圖7 “章瑩穎事件”情感遷移指數(shù)與話題遷移指數(shù)曲線

      以視頻為傳播媒介的網(wǎng)絡(luò)輿情事件,伴隨著其彈幕遷移指數(shù)(BDI)的變化,逐漸演變成輿情熱點事件。分析圖6可知以下結(jié)論:a.百度指數(shù)與BDI整體走勢基本一致,具體表現(xiàn)在二者均出現(xiàn)了兩次較大程度的上升,BDI首次上漲時間為2017.6.19-6.25,數(shù)值迅速上升至45.1%,而百度指數(shù)也在一周之內(nèi)上升到135,748的峰值水平。BDI二次峰值出現(xiàn)在2019.7.15-7.21(數(shù)值為45.4%),以此同時,百度指數(shù)達(dá)到局部峰值125,518,表明該階段輿情出現(xiàn)二次爆發(fā)。b.在事件生命周期內(nèi),BDI的變化拐點先于百度指數(shù),表明BDI對網(wǎng)絡(luò)熱點事件的輿情預(yù)警能力較強(qiáng)。

      此外,事件在衰退期與擴(kuò)散期的輿情傳播通常較平穩(wěn),此階段可能因新的事件轉(zhuǎn)折點而出現(xiàn)輿情危機(jī)復(fù)發(fā)。BDI能夠聯(lián)合建模情感遷移指數(shù)(SDI)與話題遷移指數(shù)(TDI),實現(xiàn)話題語義層面的情感分析。由圖6,7可知:a.當(dāng)BDI出現(xiàn)持續(xù)的負(fù)向漂移時,利用SDI與TDI的演化走勢能夠進(jìn)行話題情感追蹤,此時SDI與TDI表現(xiàn)為局部的指數(shù)漂移。具體來說,若SDI發(fā)生負(fù)向漂移且TDI沒有發(fā)生顯著變化(如圖7中2017.9.9-9.10),網(wǎng)絡(luò)輿情事件在短期內(nèi)演化成網(wǎng)絡(luò)輿情危機(jī)的可能性較大,此時網(wǎng)絡(luò)監(jiān)管部門應(yīng)及時介入,控制輿情走向;若TDI發(fā)生負(fù)向漂移且SDI沒有發(fā)生顯著變化(如圖7中2017.10.2-10.8),此時需查明輿情事件的主題權(quán)重變化趨勢,對于主題權(quán)重變化較大的話題內(nèi)容,其演化成新的熱點話題概率較高,此時需要防范復(fù)發(fā)的話題情感危機(jī)。b.SDI與TDI可能同時出現(xiàn)逆向變化,抵消BDI的變化,此時應(yīng)進(jìn)一步追蹤TDI的興趣熱度,當(dāng)其在短期內(nèi)出現(xiàn)大幅度上升時,可能出現(xiàn)以下兩種情況:網(wǎng)絡(luò)熱點事件演變成多個子事件,興趣熱度的上升是因為網(wǎng)民關(guān)注的話題焦點數(shù)的增加;網(wǎng)絡(luò)熱點事件的主題權(quán)重變化不大,此時興趣熱度的上升可能是由于網(wǎng)絡(luò)暴力、網(wǎng)絡(luò)謠言等外部因素誘導(dǎo)所出現(xiàn)的“輿情失語”,此時需要進(jìn)行必要的輿情干預(yù),讓網(wǎng)絡(luò)熱點事件回歸其原有的演化狀態(tài)。

      基于上述實驗結(jié)果,可以從以下方面改進(jìn)網(wǎng)絡(luò)輿情事件的在線管控能力,首先,針對網(wǎng)絡(luò)輿情的內(nèi)在演化機(jī)理,需要將網(wǎng)絡(luò)事件的主題特征與網(wǎng)民群體的情感特征相結(jié)合,充分發(fā)揮多層級網(wǎng)絡(luò)大V、視頻UP主等意見領(lǐng)袖的輿情影響力,把控輿情傳播方向。其次,結(jié)合網(wǎng)絡(luò)輿情的外在表現(xiàn)特征,分析彈幕遷移指數(shù),定位輿情演化的重要轉(zhuǎn)折點,通過信息公開,危機(jī)研判等手段,構(gòu)建協(xié)同聯(lián)動的輿情風(fēng)險的演化機(jī)制。此外,為了有效防范網(wǎng)絡(luò)事件的輿情危機(jī)復(fù)發(fā),通過繪制輿情事件的路徑演化曲線,提高對高強(qiáng)度負(fù)面情感的預(yù)判分析能力,建立健全負(fù)面情感輿情干預(yù)機(jī)制。

      5 總 結(jié)

      本文通過對視頻彈幕進(jìn)行話題情感識別,把話題遷移指數(shù)與情感遷移指數(shù)引入網(wǎng)絡(luò)熱點事件的分析中,提出了一種基于彈幕遷移指數(shù)的事件監(jiān)測模型,該模型基于BTM主題模型抽取視頻彈幕的話題信息,通過構(gòu)建包含顏文字的情感詞典,實現(xiàn)視頻彈幕的情感分析,最終基于話題遷移指數(shù)與情感遷移指數(shù)實現(xiàn)彈幕遷移指數(shù)的構(gòu)建,實現(xiàn)網(wǎng)絡(luò)輿情事件的在線監(jiān)測。實驗結(jié)果驗證了該模型在視頻情感分析中具有良好的性能。

      猜你喜歡
      彈幕輿情情感
      彈幕
      HOLLOW COMFORT
      漢語世界(2021年2期)2021-04-13 02:36:18
      如何在情感中自我成長,保持獨(dú)立
      “彈幕”防御大師
      失落的情感
      北極光(2019年12期)2020-01-18 06:22:10
      情感
      一大撥彈幕正在向你襲來……
      如何在情感中自我成長,保持獨(dú)立
      輿情
      中國民政(2016年16期)2016-09-19 02:16:48
      輿情
      中國民政(2016年10期)2016-06-05 09:04:16
      平昌县| 株洲市| 开封县| 乌兰浩特市| 当阳市| 西充县| 颍上县| 贡觉县| 望谟县| 昭平县| 长乐市| 五常市| 呼和浩特市| 河源市| 莱芜市| 公主岭市| 宜章县| 雷波县| 咸宁市| 高要市| 新绛县| 元谋县| 延安市| 大荔县| 丹巴县| 通江县| 通河县| 浏阳市| 上蔡县| 高要市| 滦平县| 凯里市| 兴山县| 广汉市| 郧西县| 万年县| 喀喇| 霍山县| 长寿区| 泊头市| 昆山市|