• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      融合表情符號動態(tài)特征的輿情分析研究

      2021-08-06 20:52李楠張羽卉
      現(xiàn)代情報 2021年8期
      關(guān)鍵詞:情感分析表情符號網(wǎng)絡輿情

      李楠 張羽卉

      摘?要:[目的/意義]表情符號在網(wǎng)絡輿情分析中的作用和價值逐漸顯現(xiàn),然而復雜網(wǎng)絡環(huán)境下表情符號呈現(xiàn)出語境依賴、情感極性多元化等動態(tài)化特征,對于表情符號動態(tài)變化規(guī)律的研究不僅有利于豐富對表情符號使用規(guī)律的認識,更有助于提升輿情分析的準確度和有效性。[方法/過程]本文通過對微博評論中表情符號使用分布、情感異化等的多角度分析,挖掘表情符號的動態(tài)變化規(guī)律并在此基礎(chǔ)上建立融合表情符號動態(tài)特征的網(wǎng)絡輿情傾向分析模型。[結(jié)果/結(jié)論]實驗證明:表情符號分布特征和情感變化規(guī)律具有顯著的主題相關(guān)性、極性相關(guān)性及情感異化等動態(tài)特征,將其引入網(wǎng)絡輿情分析能有效提升情感分析的識別精度。

      關(guān)鍵詞:表情符號;網(wǎng)絡輿情;情感分析;動態(tài)特征;微博評論;輿情傾向分析

      DOI:10.3969/j.issn.1008-0821.2021.08.010

      〔中圖分類號〕G206;TP391?〔文獻標識碼〕A?〔文章編號〕1008-0821(2021)08-0098-11

      An?Analysis?of?Web?Opinion?Combining?the?Dynamic?Characteristics?of?Emoji

      Li?Nan?Zhang?Yuhui

      (Institute?of?information?science?and?technology?information,East?China?University?of?Science?and

      Technology,Shanghai?200237,China)

      Abstract:[Purpose/Significance]The?value?of?emoji?in?the?analysis?of?network?public?opinion?gradually?appear,but?emoji?in?complex?network?environment?presents?dynamic?characteristics?such?as?context?dependence?and?emotional?polarity?diversification.The?study?of?the?dynamic?change?law?of?emoji?is?not?only?helpful?to?enrich?the?understanding?of?the?use?of?emoji,but?also?to?improve?the?accuracy?and?effectiveness?of?public?opinion?analysis.[Method/Process]Based?on?the?multi-angle?analysis?of?emoji?usage?distribution?and?emotion?change?in?Weibo?comments,this?paper?excavates?the?dynamic?change?law?of?emoji?and?establishes?the?web?public?opinion?tendency?analysis?model?which?integrates?the?dynamic?characteristics?of?emoji.[Result/Conclusion]The?comparative?experiment?of?Weibo?public?opinion?tendency?analysis?based?on?emoji?shows?that?the?regular?change?of?emoji?expression?emotion?has?a?positive?effect?on?the?analysis?of?public?opinion?tendency,and?the?introduction?of?emoji?dynamic?characteristics?can?effectively?improve?the?recognition?accuracy?of?emotion?analysis.

      Key?words:emoji;web?opinion;emotion?analysis;dynamic?characteristics;Weibo?comments;analysis?of?tendency?of?public?opinion

      相比于文本語言,表情符號能夠承載更多的情緒特征,傳達豐富的語義信息,其符號化的溝通方式不僅豐富了網(wǎng)絡語言,改變了人們的表達習慣和交流方式,也逐漸成為研究者們分析社交媒體觀點、情感的重要特征之一。然而在不同類型語境中表情符號表達的情感并不是一成不變的,例如[微笑]表情,可以表示欣慰、認同等積極含義(例如:歡迎回家,你們辛苦了),也會被引申為失望、憤怒等消極負面含義(例如:“看了只想生氣”),這種情感的動態(tài)變化給網(wǎng)絡輿情的傾向分析帶來了不確定性。由此,本文以表情符號為研究對象,深入分析其在網(wǎng)絡輿情情感表達中所發(fā)揮的重要作用,梳理表情符號的使用規(guī)律并提取相應的動態(tài)特征,探索其在輿情分析中的作用機理和應用效果,為已有網(wǎng)絡輿情分析提供新的研究思路和方法借鑒。

      1?相關(guān)研究

      隨著對表情符號認識的深入,越來越多的研究開始將表情符號這類含有重要情感線索的信息引入情感分析。目前相關(guān)研究主要采用情感詞典和機器學習兩種實現(xiàn)方法,其中,基于情感詞典的研究更多關(guān)注情感詞庫的構(gòu)建為文本情感分析提供輔助支撐,例如郭賢偉等[1]將使用頻率較高、帶情緒色彩的部分表情符號按照大連理工大學情感詞匯本體庫的7大類情緒進行標注分類以提高微博評論情緒分類的精準度;基于機器學習的研究則立足于通過海量的網(wǎng)絡語料訓練情感分類器,例如Le?T?A等[2]將表情符號標注成對等詞嵌入到機器學習模型,張茜等[3]則將表情符號融入LDA模型,提高對褒貶態(tài)度的辨識能力,陳亞茹等[4]證明了融合表情符號的自注意力機制和BiGRU深度學習網(wǎng)絡模型能夠有效地提高情感分類的準確率。研究均證實了表情符號在情感分析中的有效表現(xiàn),然而基于情感詞典的現(xiàn)有研究大多賦予表情符號固有的情感屬性,忽略了表情符號使用過程中其情感變化及不確定性。此外,網(wǎng)絡短文本由于包含的信息量小,語義特征比較匱乏,常用的向量空間模型的方法并不適用,所以基于機器學習的實現(xiàn)方法也存在一定的局限性。因此,通過挖掘表情符號的使用規(guī)律及動態(tài)特征進一步優(yōu)化情感挖掘方法,成為短文本語境下輿情分析研究的新路徑。

      事實上,隨著表情符號的廣泛應用,學界早已開始關(guān)注網(wǎng)絡輿情中表情符號使用所呈現(xiàn)出的規(guī)律及變化。Lu?X等[5]基于388萬位智能手機用戶的使用情況,分析表情符號的使用頻次,發(fā)現(xiàn)了高頻使用的表情符號,第一位為,其次為;也有學者發(fā)現(xiàn)用戶經(jīng)常使用一個以上的表情符號來表達情緒,利用表情符號的共現(xiàn)規(guī)律有助于理解表情符號是如何在社交媒體帖子中使用的以及它們在社交媒體帖子中的意義,Illendula?A等[6]基于1.47億條包含表情符號的推文建立了表情符號共現(xiàn)網(wǎng)絡。與此同時,研究發(fā)現(xiàn)不同性別群體、不同年齡群體、不同文化背景等[7-8]多方因素的影響會導致對表情符號的理解和使用產(chǎn)生差異,例如張小凡[9]發(fā)現(xiàn),女性比男性更偏愛使用表情符號來替換純文本的表達,袁凱歌[10]研究發(fā)現(xiàn),在大學生群體中表情符號的使用頻率卻不存在顯著性別差異,研究者看待問題的角度決定了其對影響因素的分析。也有研究開始從語義的角度出發(fā),將表情符號看作語言系統(tǒng)的一部分,將語境等看作是表情符號使用發(fā)生變化的因素,例如劉學太等[11]發(fā)現(xiàn)同一個表情符號在不同會話背景下會表達不同情感,并列出了其中差異最具代表性的“[微笑]”和“[再見]”表情。

      表情符號使用的不確定性以及情感變化的動態(tài)特征使得基于表情符號的輿情分析研究面臨新的問題:表情符號的情感變化呈現(xiàn)哪些規(guī)律性特征?如何將表情符號的動態(tài)特征有效融入情感分析的應用場景?只有解決這些問題,才能真正發(fā)揮表情符號在網(wǎng)絡輿情分析中的價值和作用。因此,本文聚焦表情符號情感變化現(xiàn)象,在歸納總結(jié)表情符號使用規(guī)律的基礎(chǔ)上提取表情符號的動態(tài)特征,建立動態(tài)視角下的輿情傾向分析模型,為網(wǎng)絡輿情監(jiān)測提供更加有效的解決方案。

      2?表情符號的使用規(guī)律分析

      研究選取新浪微博的評論數(shù)據(jù)為樣本,基于“微博熱門分類”欄目選擇不同類型話題的評論數(shù)據(jù)以盡可能全面地反映表情符號相關(guān)特征,并對話題進行了進一步的分類標注,將社會實時發(fā)生的事件定為社會性事件;將綜藝、明星等相關(guān)事件定位娛樂性事件;將引導人們投票、發(fā)表觀點進行探討的熱點話題定為探討類事件,同時也關(guān)注到話題本身的正負面性質(zhì),如“社會正面/負面”“娛樂正面/負面”“探討類”等。共收集6萬多條語料,其中社會類話題語料占到58%,娛樂類語料占到32%,探討類語料約10%,有約1/3的語料中包含表情符號,如表1所示。

      2.1?表情符號在不同分類語料中的分布特征

      統(tǒng)計表情符號的出現(xiàn)頻次可以發(fā)現(xiàn),高頻出現(xiàn)的表情符號僅占全部的10%左右,其分布符合齊普夫定律,與文本的詞頻分布規(guī)律一致。對高頻表情符號進一步歸納則可以發(fā)現(xiàn)語料中出現(xiàn)的全部294種表情符號中有32種表情符號的使用量占到了使用總量的80%,因此這部分高頻表情符號也成為本研究的重點關(guān)注對象。表2列舉了部分高頻表情符號,根據(jù)微博系統(tǒng)給出的標注含義,結(jié)合大連理工大學情感詞匯本體庫獲得表情符號的原生情感極性。

      對比分析表情符號在不同分類語料中的統(tǒng)計分布規(guī)律,能夠發(fā)現(xiàn)其使用情況與出現(xiàn)語境具有一定的相關(guān)性。

      首先,在特定主題類型語境中存在相對固定的高頻表情符號,如圖1所示,探討類語境中常出現(xiàn)的高頻表情符號有[允悲]、[Doge]、[淚]、[二哈]、[微笑]等,而在娛樂類語境中常出現(xiàn)[心]、[打Call]、[Doge]、[允悲]、[微笑]等,在社會類語境中[蠟燭]、[心]、[淚]、[Good]、[贊]等出現(xiàn)頻次更高。部分表情符號在不同主題語境的分布呈現(xiàn)反向差異,主題相關(guān)性明顯,比如:出現(xiàn)在探討類和娛樂類主題語境中的分布概率不到0.1%,而在社會類主題語境中的分布概率超過12%,表明該表情符號傾向于出現(xiàn)在社會類主題語境中,類似具有特定主題分布傾向的還有傾向于出現(xiàn)在娛樂類主題語境中。

      依據(jù)話題性質(zhì)將社會正面和娛樂正面類語料分為積極語境,社會負面和娛樂負面類語料分為消極語境,探討類語料則分為中性語境,可以發(fā)現(xiàn)在不同極性語境中表情符號的極性相關(guān)性也同樣顯著,如圖2所示,本身具有積極正面或是消極負面原生感情色彩的表情符號,大多數(shù)分布具有明顯的極性傾向,例如、、等原生情感極性為積極的表情符號出現(xiàn)在積極語境中的概率明顯大于其出現(xiàn)在消極和中性語境中,等原生情感極性為消極的表情符號出現(xiàn)在消極語境中的概率明顯大于其出現(xiàn)在積極和中性語境中。

      2.2?表情符號跨語境的情感異化分析

      在分析過程中筆者發(fā)現(xiàn)了一種常見現(xiàn)象,許多通用的表情符號會同時出現(xiàn)在多種不同語境,深入解讀表情符號的情感傾向能夠發(fā)現(xiàn)其在不同的語境下發(fā)生了情感異化,比如原生情感極性為積極的[太開心]表情符號在一些負面話題下會從開心、認同等積極情感引申為憤怒、無語等消極情感,例如:“太可了!!”和“原來我手機這么卡是他們都急著搶著監(jiān)控我???”,這種情感異化現(xiàn)象成為表情符號情感極性不穩(wěn)定的重要體現(xiàn),如果在輿情分析過程中對這些表情符號的情感極性特征進行固化,很明顯會導致分析偏差。

      為了進一步揭示表情符號的情感異化規(guī)律,在對話題語句進行人工極性標注的基礎(chǔ)上分析表情符號的跨語境分布規(guī)律,如圖3所示。統(tǒng)計結(jié)果顯示,在294種表情符號中,有138種表情符號只出現(xiàn)在單一極性的語境下,占比46%,而這些表情符號大多本身出現(xiàn)的頻次較低;超過半數(shù)的表情符號出現(xiàn)在兩種或兩種以上的極性語境中表達相應情感,其中有117種表情符號同時在積極和消極語境中出現(xiàn),分別有103種和96種表情符號同時出現(xiàn)在消極、中性語境或積極、中性語境中,還有約30%的表情符號同時在3種極性語境中出現(xiàn)。對高頻出現(xiàn)的32種常用表情符號進行堆積分析,發(fā)現(xiàn)盡管一部分表情符號能穩(wěn)定出現(xiàn)在單一極性語境,但仍有相當比例的表情符號其情感具有不確定性,稱之為情感模糊性,如圖4所示,既有類似或等穩(wěn)定表達積極或消極情感的表情符號,也有等頻繁跨語境發(fā)生情感異化的表情符號。

      3?基于動態(tài)特征的輿情傾向分析模型

      3.1?表情符號的動態(tài)特征提取

      通過對表情符號使用規(guī)律的分析發(fā)現(xiàn),表情符號的分布特征和情感變化規(guī)律與網(wǎng)絡輿情的語境具有一定的相關(guān)性。受語境影響,表情符號呈現(xiàn)一定的主題相關(guān)性和極性相關(guān)性;而從跨語境分布的角度,表情符號的情感異化現(xiàn)象也需要將情感的穩(wěn)定性因素納入情感分析的考慮范圍。這些規(guī)律性特征的引入能有效地改進靜態(tài)情感特征運用的局限性,融入表情符號的動態(tài)特征成為優(yōu)化輿情分析模型、提升情感分析效果的切入點。

      據(jù)此,本文提出表情符號的情感穩(wěn)定度概念,用于定量描述表情符號在不同語境下的情感穩(wěn)定性,同時受話題語境的主題相關(guān)度、極性相關(guān)度以及情感異化程度等多種變量的影響。具體定義如下:

      1)主題相關(guān)度反映表情符號對語境主題的依賴程度。對表情符號wi在主題Sm下的分布概率P(wi|Sm)進行標準化處理,記為(wi|Sm);鑒于(wi|Sm)在不同主題之間的差值越大,表情符號wi對主題Sm的相關(guān)度越高,因此通過(wi|Sm)之間的差值反映表情符號的主題相關(guān)度,記為RS。本研究將主題語境概括為3大類,即社會類、娛樂類以及探討類,后續(xù)可進一步細分,計算方法如下:

      2)極性相關(guān)度反映表情符號對語境極性的依賴程度。(wi|Cm)是表情符號wi在極性Cm語境下的分布概率P(wi|Cm)的標準化形式,同理,通過(wi|Cm)之間的差值反映表情符號的極性相關(guān)度,記為RC。計算方法如下:

      3)情感異化程度反映表情符號情感發(fā)生異化的可能性,本文通過表情符號表達積極、消極、中性情感變化的概率統(tǒng)計來體現(xiàn)其情感異化程度。表情符號wi表達某類情感類別Em的概率P(wi|Em)通過其在不同極性語句中的分布特征反映,將最大概率情感類別設為初始情感類別,則表情符號表達其他情感類別的概率可看作其情感異化概率V,計算公式見式(5)。

      4)情感穩(wěn)定度反映表情符號表達情感的穩(wěn)定性,與主題相關(guān)度和極性相關(guān)度正相關(guān),與情感異化概率負相關(guān)。即:表情符號的主題相關(guān)度越高,其情感穩(wěn)定度越高,該表情符號極易在特定主題語境中出現(xiàn);極性相關(guān)度越高,情感穩(wěn)定度越高,該表情符號極易在特定極性語境中出現(xiàn);情感異化程度越高,情感穩(wěn)定度越差,該表情符號更容易出現(xiàn)在不同語境下發(fā)生情感極性的漂移。據(jù)此,將3個變量標準化后進行加權(quán)組合獲得表情符號wi的情感穩(wěn)定度ρ,見式(6):

      3.2?基于動態(tài)特征的輿情傾向分析模型定義

      將表情符號的動態(tài)特征引入輿情傾向性分析研究以更加準確地理解所要表達的情感和意圖,借助情感穩(wěn)定性度量實現(xiàn)動態(tài)視角下的情感傾向分析,模型框架如圖5所示,具體包括:數(shù)據(jù)預處理、情感穩(wěn)定性度量、情感詞典動態(tài)擴充、情感傾向判定以及結(jié)果分析5個模塊。

      數(shù)據(jù)預處理模塊包括對語料進行必要的數(shù)據(jù)清洗以及表情符號識別等操作。微博語料集中表情符號具有其特定的格式,例如表情符號的代碼存儲格式為:,可利用正則表達式匹配識別表情符號。

      表情符號的情感穩(wěn)定性度量模塊依據(jù)3.1節(jié)動態(tài)特征提取方法計算主題相關(guān)度RS、極性相關(guān)度RC以及情感異化概率V,對各變量進行標準化后加權(quán)計算。表情符號的情感穩(wěn)定度受情感異化程度影響較大,因此參數(shù)α、β值的設定相比γ值偏小。

      情感詞典動態(tài)擴充模塊主要通過增加共現(xiàn)情感詞的方式,消除低穩(wěn)定度表情符號所產(chǎn)生的不確定性影響。其情感詞典由基礎(chǔ)情感詞典和拓展情感詞典兩部分構(gòu)成:基礎(chǔ)情感詞典可選用已有的情感詞匯知識庫作為支撐,例如本研究主要選用大連理工大學情感詞匯本體庫,該庫建立了7種基礎(chǔ)情感分類(樂/好/怒/哀/懼/惡/驚)以及5個強度等級(1、3、5、7、9);拓展情感詞典則包括網(wǎng)絡流行用語、針對具體事件的專業(yè)評價詞匯等,主要由人工建立情感類別及強度等級標注。

      基于表情符號動態(tài)特征的情感傾向判定將表情符號的情感穩(wěn)定性作為輿情分析的重要考慮因素。對于高情感穩(wěn)定度的表情符號,因其能穩(wěn)定地傳達特定情感,可弱化文本特征的影響,因此只需依據(jù)其穩(wěn)定情感對所在語境進行情感分析,本研究將表情符號的初始情感類別(即P(wi|Em)最大時所表達的情感類別)設為這類表情符號穩(wěn)定表達的情感類別;而對于低情感穩(wěn)定度的表情符號則通過提取必要的文本或語境特征并建立關(guān)聯(lián),借助與表情符號共同出現(xiàn)的關(guān)鍵情感詞進行情感傾向性判定。

      在結(jié)果分析階段,仍采用傳統(tǒng)的性能評價指標精確率P、召回率R和調(diào)和平均值F,通過建立如表3所示的混淆矩陣進行評價,其中Xij表示真實值為i的數(shù)據(jù)被識別為j的情況。

      3.3?具體實現(xiàn)步驟

      在獲得表情符號情感穩(wěn)定度的基礎(chǔ)上,借助閾值區(qū)分高情感穩(wěn)定度的表情符號和低情感穩(wěn)定度的表情符號,前者可直接依據(jù)其初始情感極性特征進行傾向分析,后者則需要進一步結(jié)合共現(xiàn)情感詞特征,主要實現(xiàn)步驟如下:

      輸入:包含表情符號的語料集T={t1,t2,…,tm}、表情符號的情感穩(wěn)定度及初始情感類別、情感穩(wěn)定度閾值、情感詞典。

      Step1:獲取任意評論ti中的表情符號W={W1,W2,…,Wn},如果n>1,選取情感穩(wěn)定度值最高的表情符號wi,如果n=1則選取該表情符號作為wi。

      Step2:獲得表情符號wi的初始情感類別,如果表情符號wi的情感穩(wěn)定度大于閾值,語料ti的情感傾向則為該表情符號wi的初始情感類別,跳轉(zhuǎn)至Step4;如果表情符號wi的情感穩(wěn)定度小于等于閾值,進行Step3。

      Step3:對ti分詞,將分詞結(jié)果與情感詞典中的詞語進行匹配,如果表情符號wi的初始情感類別為消極,則將匹配到表達怒、哀、懼、惡、驚情感詞語的ti判定為消極,沒有匹配到消極情感詞的判定為中性;如果表情符號wi的初始情感類別非消極,則將匹配到表達怒、哀、懼、惡、驚情感詞語的ti判定為消極,沒有匹配到消極情感詞的語料情感傾向判定為wi的初始情感類別。

      Step4:重復Step1、Step2、Step3,直至對所有語料集判定結(jié)束。

      輸出:情感分類結(jié)果Z。

      4?實驗與結(jié)果分析

      實驗數(shù)據(jù)選自表2包含32個高頻表情符號的微博評論數(shù)據(jù)。為驗證上文動態(tài)特征模型的有效性,基于以上數(shù)據(jù),分別基于純文本特征(實驗組A)、結(jié)合表情符號固定情感屬性特征(實驗組B)以及結(jié)合表情符號動態(tài)特征(實驗組C)開展情感傾向分析對比實驗。對照組A、B均基于相同情感詞典進行情感值計算,綜合考慮程度副詞、否定詞、句式(判斷是否為感嘆句或反問句)、表情符號等特征進行加權(quán)累計后進行情感傾向判定。如表4所示,3組對照實驗的識別效果存在明顯差距。

      4.1?總體分析

      實驗組A的整體調(diào)和均值F為48%,而實驗組B和C分別為60%和87%,其中實驗組B相比于實驗組A的識別性能提升了12%。由于考慮了表情符號的情感屬性特征,實驗組B對積極情感傾向和消極情感傾向的識別效果得到大幅度提升,對積極情感傾向的召回率由原先的59%提升至89%,而對消極情感傾向的召回率也提升了38%。例如“香港是中國的香港”類似的簡單短文本語料,在實驗組A從簡短的純文本內(nèi)容中無法辨識出積極或消極的情感,但在實驗組B中則能夠借助表情符號實現(xiàn)對語料情感傾向的判定,充分說明了表情符號特征相較于文本特征在輿情傾向分析的應用場景下同樣具有重要的指示作用。

      融入表情符號動態(tài)特征的實驗組C相比于對照組B,也在不同分類情感傾向的識別效果上具有較為明顯的提升,尤其對中性情感傾向的辨識性能提升更為顯著,這種性能的提升與情感動態(tài)特征的引入密不可分。事實上,對表情符號穩(wěn)定性因素的考量使得在情感傾向判定的過程中增強對表情符號特征的運用成為可能,也是識別性能提升的根本原因。一方面,高情感穩(wěn)定性的表情符號在實際語料中占有相當比例,這部分表情符號通常出現(xiàn)在某種極性的語境下,但其一旦在不同語境下出現(xiàn),其情感傾向判定的指向性可能會與語境文本特征不一致,從而產(chǎn)生一定的困擾,這種情況下表情符號特征在情感分析中的指示作用就需要得到強化,否則就極易導致誤判。例如“于災害中逆向行走”在實驗組B中會由于“災害”一詞與“”的情感累計值等于0被判定為中性,而在動態(tài)特征的實驗組C中,由于優(yōu)先考慮了表情符號的情感穩(wěn)定性因素(該表情符號為積極的情感穩(wěn)定度為0.916),因此將本語料判定為積極,與其實際語境傾向更加符合。而另一方面,低情感穩(wěn)定性的表情符號會給固定情感屬性特征模型帶來極大的負面影響,由于表情符號的靜態(tài)情感特征忽略了情感傾向的不穩(wěn)定性,識別過程中這類表情符號一旦出現(xiàn),很明顯會出現(xiàn)非常大的偏差,而在動態(tài)特征模型中通過將表情符號的初始情感類別和所在的語境特征(共現(xiàn)情感詞)相結(jié)合則可以達到提高識別準確度的效果。此外,動態(tài)特征模型還對隱式特征的識別具有很好的效果,例如反諷句“優(yōu)秀的反面教材”,盡管“優(yōu)秀”“反面”等詞與“”共現(xiàn),但在動態(tài)特征模型中,語料的情感傾向仍能夠被準確地判定為消極。

      4.2?語境適用性分析

      為了進一步考察動態(tài)特征模型對于不同類型語境的適用性,實驗又將語料根據(jù)主題和極性劃分為如表5所示的3組,均采用表情符號動態(tài)特征的輿情分析模型進行實驗。實驗結(jié)果如表6所示,顯示出該模型在不同分類語料都獲得較為理想的應用效果,3組實驗的調(diào)和均值F均超過85%,對積極情感傾向的各識別精度均在94%以上,且在不同主題語境、不同語境極性的混合語料③中的識別效果達到87%,由此動態(tài)特征模型在不同類型的語境下均表現(xiàn)出比較穩(wěn)定的識別性能。

      4.3?情感穩(wěn)定度的有效性分析

      根據(jù)前期數(shù)據(jù)統(tǒng)計分析可以獲得主題相關(guān)度高、極性相關(guān)度高、情感異化程度低的表情符號,比如:(對社會類語境的依賴度高)、(對娛

      樂類語境的依賴度高)等表情符號的主題相關(guān)度較高;(對積極語境的依賴度高)、(對消極語境的依賴度高)等表情符號的極性相關(guān)度較高;(初始情感類別為積極情感)、(初始情感類別為消極情感)等表情符號的異化程度不明顯。其表情符號的情感穩(wěn)定性可通過對參數(shù)進行適當調(diào)節(jié)獲得,實驗中α、β設置為18,γ、θ設置為34,獲得初始計算結(jié)果如表7所示。根據(jù)數(shù)據(jù)結(jié)果,設置0.7為閾值,將表情符號分為高情感穩(wěn)定度和低情感穩(wěn)定度兩類,可以發(fā)現(xiàn)部分表情符號如等主題相關(guān)度和極性相關(guān)度高、情感異化程度低,因此其情感穩(wěn)定度高,而類似等表情符號不僅情感異化現(xiàn)象顯著,而且主題相關(guān)度和極性相關(guān)度也相對較低,因此其情感穩(wěn)定度低。同時,也發(fā)現(xiàn)部分表情符號的初始情感類別與原生情感極性并不相同,例如[微笑],原生情感極性為積極,表示欣慰、禮貌等積極情感,然而本文統(tǒng)計到其大部分情況都會出現(xiàn)在消極語句中表示嘲諷、失望等消極負面情感。

      基于數(shù)理統(tǒng)計方法得出的情感穩(wěn)定度指標能夠真實有效地反映表情符號的情感穩(wěn)定性,成為情感動態(tài)特征的重要指征。語料③中包含各表情符號語料的判定正確率如表8所示,可以發(fā)現(xiàn)包含高情感穩(wěn)定度表情符號語料的識別正確率大多在90%以上,包含低穩(wěn)定度表情符號語料的識別正確率大多在80%以上。包含高情感穩(wěn)定度表情符號整體語料識別性能在94%左右,以為例,識別的正確率在99%左右,包含該表情符號的語料有約2?400條,然而僅有13條語料判斷失誤(部分語料如圖6所示);相比于包含高情感穩(wěn)定度表情符號的語料弱化了文本特征,低情感穩(wěn)定度表情符號則需通過共現(xiàn)的文本特征加以輔助進行判斷,包含這類表情符號整體語料的識別性能在84%左右,如圖7所示,以為例,通過部分語料中存在的消極情感詞匯加以輔助對語料按照3.3節(jié)具體實現(xiàn)步驟進行判定。

      5?總結(jié)與展望

      本文重點關(guān)注了表情符號這一特殊的情感語言,通過差異化語境下的數(shù)據(jù)分析,揭示出表情符號分布特征和情感變化規(guī)律的語境依賴特性,并將其呈現(xiàn)的主題相關(guān)性、極性相關(guān)性以及情感異化等動態(tài)規(guī)律特征化,提出了表情符號的情感穩(wěn)定性度量方法。實驗結(jié)果表明,將表情符號的動態(tài)特征引入輿情傾向分析能夠?qū)崿F(xiàn)更加精準的情感計算,在不同語境下均具有穩(wěn)定的適用性,應用于網(wǎng)絡輿情研究能顯著提升分析性能。但在實際應用過程中也有諸多問題值得深入探討,一方面,對于表情符號表達情感語義的分析應充分考慮其模糊性的影響,建立其與語境特征的關(guān)聯(lián)分析思維,如借助文本等語境特征彌補低情感穩(wěn)定度表情符號出現(xiàn)帶來的不確定性等;另一方面,則需要充分發(fā)揮表情符號對情感分析應用的積極作用,充分融入不同類型情感符號的差異化特征,如積極引入高情感穩(wěn)定度的表情符號特征等。本研究只針對部分高頻表情符號開展實驗,后續(xù)將進一步擴大研究范圍,將更多的符號特征納入分析框架,進一步提升輿情分析的精準度和有效性。

      參考文獻

      [1]郭賢偉,賴華,余正濤,等.融合情緒知識的案件微博評論情緒分類[J].計算機學報,2021,44(3):564-578.

      [2]Le?T?A,Moeljadi?D,Miura?Y,et?al.Sentiment?Analysis?for?Low?Resource?Languages:A?Study?on?Informal?Indonesian?Tweets[C]//The?12th?Workshop?on?Asian?Language?Resources,2016:123-131.

      [3]張茜,張士兵,任福繼,等.基于主題模型的微博評論方面觀點褒貶態(tài)度挖掘[J].中文信息學報,2019,33(6):116-123,140.

      [4]陳亞茹,陳世平.融合自注意力機制和BiGRU網(wǎng)絡的微博情感分析模型[J].小型微型計算機系統(tǒng),2020,41(8):1590-1595.

      [5]Lu?X,Ai?W,Liu?X?Z,et?al.Learning?from?the?Ubiquitous?Language:an?Empirical?Analysis?of?Emoji?Usage?of?Smartphone?Users[C]//Proceedings?of?the?2016?ACM?International?Joint?Conference?on?Pervasive?and?Ubiquitous?Computing,2016:770-780.

      [6]Illendula?A,Yedulla?M?R.Learning?Emoji?Embeddings?using?Emoji?Co-occurrence?Network?Graph[C]//Computing?Research?Repository,2018:1-9.

      [7]匡文波,邱水梅.大學生的微信表情使用行為研究[J].國際新聞界,2017,39(12):123-137.

      [8]劉麗群,劉璽辰.表情符號使用動機及其在不同人際關(guān)系中對使用行為的影響——基于混合研究方法[J].現(xiàn)代傳播(中國傳媒大學學報),2020,42(8):88-94.

      [9]張小凡.社會語言學視閾下的微信聊天語言研究[D].天津:天津師范大學,2018.

      [10]袁凱歌.即時通信中情緒的感知與表達:情緒圖標的影響[D].武漢:華中師范大學,2014.

      [11]劉學太,巴志超,李陽,等.社交媒體群體性信息交流過程中表情符號使用差異與語義研究——以微信群為例[J].現(xiàn)代情報,2019,39(10):3-14.

      (責任編輯:陳?媛)

      猜你喜歡
      情感分析表情符號網(wǎng)絡輿情
      世界表情符號日
      基于詞典與機器學習的中文微博情感分析
      在線評論情感屬性的動態(tài)變化
      “互聯(lián)網(wǎng)+”背景下高校平安校園建設研究
      淺析網(wǎng)絡輿情治理
      基于社會穩(wěn)定視角的網(wǎng)絡輿情預警機制構(gòu)建的思考
      突發(fā)事件網(wǎng)絡輿情的演化規(guī)律與監(jiān)控
      表情符號玩上癮 時尚愛嘗鮮
      卓资县| 延安市| 温泉县| 睢宁县| 长宁县| 德庆县| 虞城县| 巴彦淖尔市| 江川县| 盘锦市| 姜堰市| 沂南县| 进贤县| 丹阳市| 门源| 乌鲁木齐县| 邢台县| 宣武区| 神农架林区| 阿城市| 昌平区| 克什克腾旗| 桐庐县| 比如县| 渑池县| 阜平县| 临颍县| 平武县| 凉山| 吉安县| 电白县| 留坝县| 原平市| 峨眉山市| 安平县| 朝阳区| 塘沽区| 平凉市| 手游| 连平县| 来宾市|