• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      社交媒體平臺中健康報道標(biāo)題對公眾情緒影響研究
      ——以人民日報微信公眾號為例

      2022-05-12 13:43:34張學(xué)波
      傳媒論壇 2022年3期
      關(guān)鍵詞:分詞詞典分類器

      張學(xué)波 王 卿

      當(dāng)前,社交媒體平臺中表達(dá)的情緒對國內(nèi)主流媒體、輿情生態(tài)和和諧社會倡導(dǎo)的主流文化具有重要影響作用。研究民眾的情緒可以揭示人們的生活狀態(tài)、生活訴求以及對民生健康的看法與意見,為政府?dāng)M定衛(wèi)生、健康等方面的相關(guān)政策提供實際建議。本研究致力于收集分析人民日報微信客戶端健康專欄的標(biāo)題情緒,可有效獲知公眾對于這些健康議題信息的需求情況,挖掘出受眾對哪些健康議題關(guān)切,有利于為人民日報微信公眾號或者是其他健康類微信公眾號提供議題方面的借鑒。也有利于滿足公眾對健康報道、醫(yī)療衛(wèi)生信息的需求,消除有關(guān)健康問題公開的不確定性,提高公眾的安全和滿足感,有助于豐富大眾傳媒對健康傳播的報道、受眾和效果方面的研究,有助于重新審視媒體對于公眾情緒的影響。

      一、問題緣起及文獻(xiàn)綜述

      情緒表現(xiàn)為對外部刺激的各種心理和生理反應(yīng),例如恐慌,興奮和憤怒。情感分析是通過編寫代碼自動確定文本中包含的情緒狀態(tài),對于掌握公眾的輿情狀態(tài)和人們的訴求的實際意義十分關(guān)鍵。

      在此方面,國外相關(guān)的研究起步較早,范圍較廣泛,它主要涉及初步的情感傾向分析、更進(jìn)一步的文本提取和多種情感的分類、情感分析相關(guān)的字典和語料庫建設(shè)等,其中情緒詞典和語料庫構(gòu)建是基礎(chǔ)。情感詞典和機器學(xué)習(xí)是文本情感分析的兩種主要的操作方法。最早出現(xiàn)的是基于情緒詞典的方法,主要是指在已經(jīng)經(jīng)過人工構(gòu)建的情緒詞典的基礎(chǔ)上,利用詞典中每個詞語的情緒標(biāo)簽對待分類文本的情緒類別進(jìn)行標(biāo)注。Paltoglou(2012)以LIWC情緒詞典做參照,扒取了推特、我的空間和Digg等網(wǎng)絡(luò)平臺的文本,制訂出了一系列的計算規(guī)則來處理句子中的情緒詞,當(dāng)情緒詞被不同的詞修飾時或者情緒詞本身的樣式發(fā)生變化時,那么相應(yīng)的計算規(guī)則也會發(fā)生變化[1]。結(jié)果表明,他們提出的公式和規(guī)則得出的情感分析的效果皆比單純靠機器學(xué)習(xí)分析出的效果好。此種方法的效果缺點在于人工構(gòu)建的情緒詞典無法完全覆蓋所研究的文本,并且當(dāng)文本中出現(xiàn)的情緒詞較為隱晦時,研究者也不易標(biāo)注。Mohammad(2011)通過Word Net、Affective Norms 和NRC 三個詞典,進(jìn)一步設(shè)計計算規(guī)則,進(jìn)行情緒分析,結(jié)果表明,相比于n-gram,情感詞庫對多個不同專業(yè)和領(lǐng)域的文本分析效果更佳[2]。

      國內(nèi)許多文獻(xiàn)對微博中的微內(nèi)容進(jìn)行文本情感分析,對本研究內(nèi)容的劃分具有重要的借鑒意義。封麗(2018)主要對微博中有關(guān)柴靜《穹頂之下》紀(jì)錄片的評論進(jìn)行了情感計算,以正負(fù)中性三種對微博主體中的表情和文本情感極性計分,正向表情表示為1,負(fù)向表情表示為-1,中立向表情表示為0。她還注意到與表情、文本不同的是微博情感詞通常有“十分”“稍微”“沒有”等程度副詞,這些詞語也對情感表達(dá)具有特殊作用。最后得出對柴靜及其紀(jì)錄片存在的負(fù)面情感傾向主要有以下幾類:①純粹不安好心湊熱鬧;②只從個人好惡出發(fā),不喜歡柴靜則不認(rèn)同《穹頂之下》;③從柴靜立場、經(jīng)歷等各方面對其動機進(jìn)行挖掘,然后從陰謀論等方面認(rèn)為柴靜紀(jì)錄片需要得到質(zhì)疑;④《穹頂之下》這部紀(jì)錄片的話語表達(dá)以及拍攝所存在一些問題,這篇論文計算情感極性的方法值得本研究借鑒[3]。在文本情感分析方法剛剛興盛之時,就已有學(xué)者將其與社會網(wǎng)絡(luò)分析法相結(jié)合對霧霾輿情進(jìn)行了研究,四川大學(xué)何躍、朱婷婷(2018)通過對新浪微博進(jìn)行扒取以及聚類,進(jìn)一步找出具有代表性的微博繪制網(wǎng)絡(luò)圖,展示出整個情感傳播網(wǎng)絡(luò)的子群、中心度等指標(biāo)[4],這說明情感分析可以和社會網(wǎng)絡(luò)分析進(jìn)行結(jié)合,對本研究指明了方向。

      情感詞典和機器學(xué)習(xí)是目前文本情感分析所涉及的兩種主要的方法,其中構(gòu)建情感詞典的作用最為基礎(chǔ)。目前通過人工構(gòu)建的中文情感詞典主要有譚松波酒店評論、臺灣大學(xué)情感語料庫、Hownet情感詞袋、BoSon語義情感詞庫等。本研究采用情感詞典的方法進(jìn)行分析,主要借鑒BoSon語義情感詞庫和Hownet情感詞袋,目的是分析人民日報微信公眾號健康專欄的總體情感傾向,計算出標(biāo)題和評論的情緒值,并探討標(biāo)題情緒值、評論情緒值、點贊量以及評論量兩兩間的數(shù)據(jù)關(guān)系。

      二、文本分詞及情感詞典選用構(gòu)建

      本研究選用Python3.6環(huán)境,統(tǒng)一使用“utf-8”格式編碼?!胺衷~”即將一個整句按照詞性分成不同的部分,要想進(jìn)行自然語言處理,就必須得使用較為精確的分詞工具對文本中的語句進(jìn)行切割。目前學(xué)界也出現(xiàn)了一些比較成功的有效分詞系統(tǒng),例如庖丁分詞系統(tǒng)、ICTCLAS中文分詞系統(tǒng)以及基于HMM模型的結(jié)巴分詞系統(tǒng)等等,本研究使用結(jié)巴中文分詞系統(tǒng)。情感詞典方面,國內(nèi)已存在著一些具有針對性的情感詞典,例如臺灣大學(xué)語料庫、HowNet語料庫、BoSon語義情感詞典等。由于波森情感詞典主要在Twitter、微博、微信等社交媒體品平臺的基礎(chǔ)上爬取其文本,整合出詞典。故本研究以波森情感語料庫為主體,HowNet及其余詞典為輔,構(gòu)建出本研究所采用的情感詞典。

      三、混淆矩陣構(gòu)建及分類器驗證

      本研究數(shù)據(jù)來自2018年4月至12月的人民日報微信公眾號“健康”專欄的標(biāo)題以及評論,經(jīng)清洗后得到標(biāo)題共822條,評論共8843條。為測試實驗結(jié)果的準(zhǔn)確率,選用4名志愿者對標(biāo)題以及評論進(jìn)行正面和負(fù)面傾向的人工標(biāo)注。經(jīng)人工標(biāo)注后,標(biāo)題共359條為積極情感傾向,463條為消極情感傾向;評論共4907條為積極情感傾向,3936條為消極情感傾向。而機器標(biāo)注結(jié)果為:標(biāo)題共390條為積極情感傾向,432條為消極情感傾向;評論共4936條為積極情感傾向,3907條為消極情感傾向。標(biāo)注后統(tǒng)計結(jié)果如下:

      表1 機器標(biāo)注與人工標(biāo)注對比表

      對情感計算結(jié)果的評估即是指對自然語言處理的結(jié)果進(jìn)行評估,是計算過程中非常重要的一環(huán)。學(xué)界在近幾年評估自然語言處理的結(jié)果時,通常以召回率(R)、精確率(P)、準(zhǔn)確度(A)以及F-measure值(綜合評估指標(biāo))作為評估指標(biāo),而這三項指標(biāo)的計算往往是以人工標(biāo)注的結(jié)果為參照[5]。

      準(zhǔn)確度(A)是指分類器情感分類的準(zhǔn)確度,是正確分類的樣本數(shù)除以樣本總數(shù),分類效果和準(zhǔn)確度成正比。準(zhǔn)確率(P),也稱為“查準(zhǔn)率”,是指分類器的情緒分類的準(zhǔn)確性,分類器正確分類的樣本的數(shù)量與所有正確樣本總量的比率。召回率(R)是指被分類器分類過的數(shù)量可以涵蓋到多少原本的分類數(shù)量。F-measure值是綜合評價指標(biāo),是指當(dāng)P和R指標(biāo)出現(xiàn)矛盾情況時,綜合兩者而得出的指標(biāo)。在計算四個指標(biāo)之前,首先要構(gòu)建混淆矩陣?;煜仃嚢膫€數(shù)值:True Positive (TP)—將正面情感傾向句判斷為正面情感傾向句;True Negative(TN)—將負(fù)面情感傾向句判斷為負(fù)面情感傾向句;False Positive(FP)—將負(fù)面情感傾向句判斷為正面情感傾向句;False Negative (FN)—將正面情感傾向句判斷為負(fù)面情感傾向句。筆者假定人工參照結(jié)果全部正確,以人工標(biāo)注為參照,分別對標(biāo)題和評論分類的正確以及錯誤數(shù)目進(jìn)行統(tǒng)計并構(gòu)建混淆矩陣:

      表2 標(biāo)題混淆矩陣

      表3 評論混淆矩陣

      根據(jù)準(zhǔn)確率(A)計算公式:

      精確率(P)計算公式:Ppositive=

      召回率(R)計算公式:

      以及F-measure計算公式:

      其中λ是一個可以自行設(shè)定的系數(shù),當(dāng)λ大于1時,精確率對F-measure值影響較大,當(dāng)λ小于1時,召回率對Fmeasure值影響較大;當(dāng)λ等于1時,二者對F-measure值具有同樣影響。在本研究中,取λ等于1,則此時F-measure值為F1值。F1值越大,則分類器越好。公式為:

      由表4,可得出結(jié)論:分類器在分析評論時較分析標(biāo)題時更為準(zhǔn)確,尤其是在分析正面情感評論時的精確率比分析正面情感標(biāo)題的精確率高出9.5個百分點,究其原因,是二者表達(dá)方式不同。評論大多為短句,分析較為簡便,而標(biāo)題糅合懸疑、設(shè)問、反問、感嘆等多種表達(dá)方式,不易把握其情感傾向,反觀評論,其正面情感表達(dá)方式大多比較單一,多數(shù)為“感謝小編”“感謝科普”“實用,收藏”云云。綜觀各項數(shù)據(jù),該分類器性能良好,分類較為準(zhǔn)確,分類結(jié)果較為可信。

      表4 情緒值分類器各項評估指標(biāo)

      四、假設(shè)檢驗

      (一)相關(guān)分析

      相關(guān)分析是指分析兩個或多個具有相關(guān)性的元素或變量之間的關(guān)系,以探討二者的密切相關(guān)程度。本研究將標(biāo)題情緒值與評論情緒均值、點贊量以及評論量進(jìn)行相關(guān)分析,以探求其中的顯著性。

      表5 相關(guān)分析結(jié)果表

      由上表可以看到,標(biāo)題情緒值與評論情緒均值之間的相關(guān)系數(shù)為0.322,呈現(xiàn)為中等相關(guān),P值接近于零,表明相關(guān)性在0.01層上顯著。而在標(biāo)題情緒值與點贊量之間,雖然P值等于0.003,表明相關(guān)性是顯著的,但二者皮爾森相關(guān)系數(shù)僅為0.102,呈現(xiàn)為弱相關(guān)關(guān)系。此外,標(biāo)題情緒值與文章評論量之間無顯著相關(guān)關(guān)系。

      (二)回歸分析

      由相關(guān)分析可知,標(biāo)題情緒值與評論情緒均值之間的相關(guān)關(guān)系具有顯著性,故探討二者是否存在顯著的線性回歸方程具備一定的研究意義。本研究采用的是一元線性回歸分析,經(jīng)由SPSS分析之后,結(jié)果如下表。

      表6 Anova表

      由Anova表可看到,模型F統(tǒng)計量為94.846,表明顯著性水平的p值接近為零,說明因變量與自變量的線性關(guān)系明顯。

      表7給出了回歸標(biāo)準(zhǔn)系數(shù)以及顯著性檢驗的P值,可以看到回歸系數(shù)為0.322,P值接近于零,故模型達(dá)到了顯著性水平。由共線性診斷表,可看到特征值VIF不為零,說明不存在多重共線性現(xiàn)象。

      表7 系數(shù)表

      五、研究結(jié)論:

      (一)社交媒體平臺中健康報道的標(biāo)題呈現(xiàn)通俗化、情感化趨勢

      微信是一種即時性社交媒體平臺,由于其具有的及時傳遞、隱秘性的特點,被許多親朋好友所青睞,本研究在對表達(dá)情緒傾向的詞語進(jìn)行分析時發(fā)現(xiàn),恐嚇詞、人稱詞以及數(shù)詞的使用占比較多。其中例如“后果很嚴(yán)重”這類恐嚇詞的使用,會讓人們不得不聯(lián)想到自己的身體狀況,產(chǎn)生杞人憂天的恐懼心理,從而利用此種心理轉(zhuǎn)發(fā)文章,吸引人們的注意力;第一人稱、第二人稱這種人稱詞的使用頻率增多,將會凸顯出標(biāo)題內(nèi)容的口語化、親民性,從而消除文章與讀者的隔閡,更利于情感的傳遞;而例如“萬萬”“千萬”這種數(shù)詞的使用也夸張了原本標(biāo)題的表達(dá)情感,凸顯出一種驚慌之意??傮w上說,通過對標(biāo)題中各類詞語使用情況的內(nèi)容分析,可以得出人民日報微信公眾號標(biāo)題呈現(xiàn)通俗化、情感化趨勢這一結(jié)論。

      (二)社交媒體平臺中健康報道的標(biāo)題中蘊含的情感會顯著地轉(zhuǎn)移至評論者

      本研究通過文本情感分析的方法,主要以波森語義情感詞典和Hownet語料庫為基礎(chǔ),構(gòu)建情感詞典庫。以Python3.6為編程環(huán)境,jieba分詞為分詞工具包,編寫分類器,計算出2018年月到12月人民日報微信公眾號健康專欄的標(biāo)題及其相對應(yīng)評論的情緒值。進(jìn)一步構(gòu)建混淆矩陣,經(jīng)過實驗的評估,該分類器達(dá)到的最高準(zhǔn)確率為86.9%,平均準(zhǔn)確率為85.05%,最高召回率為88.2%,平均召回率為85.05%,分類效果較好。此處分類器的分類結(jié)果表明計算所得的情緒值較為可信,可為下一步探討標(biāo)題情緒值和評論情緒值之間的關(guān)系奠定堅實基礎(chǔ)。

      隨后,將標(biāo)題情緒值和評論情緒均值做假設(shè)檢驗,探討二者的相關(guān)性,結(jié)果表明,二者具有顯著的相關(guān)性,并進(jìn)一步探討其中的因果關(guān)系,可初步得出結(jié)論:在人民日報健康專欄中,文章標(biāo)題情緒可影響文章評論情緒,并且新聞標(biāo)題蘊含的情緒越強烈,評論所蘊含的情緒也越強烈,二者成正相關(guān)關(guān)系。議程設(shè)置理論的第一層是指新聞事件由編輯部轉(zhuǎn)移到公眾之中,第二層是新聞事件的屬性轉(zhuǎn)移到公眾中,通過對標(biāo)題情緒值和評論情緒值之間關(guān)系的假設(shè)檢驗,可以創(chuàng)新性地驗證“屬性議程設(shè)置”理論。

      猜你喜歡
      分詞詞典分類器
      米沃什詞典
      文苑(2019年24期)2020-01-06 12:06:50
      結(jié)巴分詞在詞云中的應(yīng)用
      智富時代(2019年6期)2019-07-24 10:33:16
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      評《現(xiàn)代漢語詞典》(第6版)
      詞典例證翻譯標(biāo)準(zhǔn)探索
      值得重視的分詞的特殊用法
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
      基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
      高考分詞作狀語考點歸納與疑難解析
      万山特区| 邵阳市| 阳新县| 百色市| 宁蒗| 阳春市| 苗栗市| 河西区| 固原市| 都兰县| 宜君县| 西充县| 行唐县| 曲水县| 门源| 扶余县| 乡城县| 兴义市| 长宁区| 普兰县| 收藏| 当涂县| 涟源市| 来凤县| 黔江区| 蓬溪县| 绵阳市| 湘乡市| 和林格尔县| 郸城县| 临江市| 青河县| 佛山市| 余江县| 文成县| 巩留县| 牟定县| 绥阳县| 新宁县| 漳平市| 尚志市|