陳凌 宋衍欣
摘 要:[目的/意義]近年來,由于微博等社交媒體的活躍,其在事件時空建模的潛在用途受到了廣泛關(guān)注。在新媒體環(huán)境下研究用戶情感可以分析用戶情感的演變,將會幫助有關(guān)部門采取針對性的措施控制輿情。[方法/過程]本文構(gòu)建了一種用于分析用戶情緒上下文的長短期記憶模型(LSTM),對網(wǎng)絡(luò)輿情用戶情感傾向性和公眾情感趨勢進(jìn)行分析與預(yù)測。[結(jié)果/結(jié)論]以新浪微博中,臺風(fēng)“利奇馬”事件的相關(guān)推文為研究對象,通過多層次時間序列分析,驗證社交媒體在自然災(zāi)害之前、期間和之后所扮演的角色;繼而通過剖析用戶情感演化規(guī)律,力圖為合理控制輿情信息傳播提出相應(yīng)建議。
關(guān)鍵詞:LSTM模型;情感分析;臺風(fēng)“利奇馬”;新浪微博
Abstract:[Purpose/Significance]In recent years,due to the activeness of social media such as Weibo,its potential use in event space-time modeling has received widespread attention.Studying user sentiment in the new media environment can analyze the evolution of user sentiment and will help relevant departments take targeted measures to control public opinion.[Method/Process]This paper built a long-short-term memory model(LSTM)for analyzing the users emotional context,and analyzed and predicts the online public opinion users emotional tendency and public emotional trend.[Results/Conclusion]Taking the relevant tweets of the Typhoon“Lichma”incident on Sina Weibo as the research object,through multi-level time series analysis,verified the role of social media before,during and after natural disasters;By analysing the evolution of users emotions,they tried to put forward corresponding suggestions for the reasonable control of the spread of public opinion information.
Key words:LSTM model;sentiment analysis;super typhoon“Lekima”;Sina Weibo
隨著互聯(lián)網(wǎng)的發(fā)展,越來越多的用戶喜歡在社交媒體上發(fā)表自己的觀點,分享生活中的小事,以及諸如人物、事件、產(chǎn)品等有價值的評論信息。這些評論信息表達(dá)了人們的各種情感色彩和情感傾向性,如喜、怒、哀、樂、批評以及贊揚(yáng)等,因此網(wǎng)絡(luò)產(chǎn)生了大量的由用戶發(fā)布的主觀性文本。由于主觀性文本應(yīng)用價值的廣泛性,情感分析近年來引起了很多研究人員的興趣。
文本情感分析(Sentiment Analysis)又稱意見挖掘,是指利用自然語言處理和文本挖掘技術(shù),對帶有情感色彩的主觀性文本進(jìn)行分析、處理和抽取的過程[1]。簡而言之,是對帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過程,情感分析主要可以分為基于詞典的分類方法和基于機(jī)器學(xué)習(xí)的方法。最早從事情感分析研究的Pang等將文本的N元語法(N-Gram)和詞性(POS)等作為情感特征,使用有監(jiān)督的機(jī)器學(xué)習(xí)的方法將電影評論分為正向和負(fù)向兩類。結(jié)果顯示支持向量機(jī)在幾種分類方法中效果最好,分類準(zhǔn)確率達(dá)到80%[2]。長短期記憶網(wǎng)絡(luò)LSTM(Long Short-Term Memory)是一種時間遞歸神經(jīng)網(wǎng)絡(luò),適合于處理和預(yù)測時間序列中間隔和延遲相對較長的重要事件,它成功地克服了原遞歸神經(jīng)網(wǎng)絡(luò)的缺陷,成為目前最流行的遞歸神經(jīng)網(wǎng)絡(luò)[3],在語音識別、NLP等領(lǐng)域取得了良好的效果。
本文將采用長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)作為情感分析模型,對近期發(fā)生的重大突發(fā)事件進(jìn)行網(wǎng)絡(luò)輿情用戶情感分析,并構(gòu)建了一種用于分析用戶情緒上下文的LSTM模型,對模型的有效性進(jìn)行了一系列的評價,發(fā)現(xiàn)LSTM在句子表示方面表現(xiàn)較好,并將情感方面和極性的推理過程進(jìn)行建模,關(guān)注目標(biāo)表達(dá)中情感突出的部分,并生成對文本情感更準(zhǔn)確的表示。從龐大嘈雜的微博流中識別出與災(zāi)害相關(guān)的微博信息,對所有與災(zāi)害相關(guān)的微博情緒進(jìn)行分類識別。將長短期記憶神經(jīng)網(wǎng)絡(luò)模型引入微博情感分析階段,探索與災(zāi)害相關(guān)的情緒有關(guān)的信息,并關(guān)注輿情生態(tài)系統(tǒng)下的用戶負(fù)面情緒,以期為輿情生態(tài)系統(tǒng)的治理提供及時有效的幫助,加強(qiáng)輿情災(zāi)害管理能力。
1 分析用戶情緒上下文的LSTM模型構(gòu)建與實現(xiàn)
1.1 數(shù)據(jù)準(zhǔn)備
本文中選取臺風(fēng)“利奇馬”事件為例。2019年8月4日,第九號臺風(fēng)“利奇馬”誕生于西北太平洋洋面上,經(jīng)過3天的海上“流浪”,成長為超強(qiáng)臺風(fēng)并加速了靠近我國的步伐。10日凌晨,“利奇馬”以超強(qiáng)臺風(fēng)姿態(tài)登陸浙江,中心附近最大風(fēng)力16級(52米/秒),在浙江停滯20小時后,穿過江蘇移入黃海,成為滯留浙江時間最長的超強(qiáng)臺風(fēng)。11日夜間,再次登陸山東,中心附近最大風(fēng)力9級(23米/秒,熱帶風(fēng)暴級),迅速穿過山東半島后進(jìn)入渤海,繼續(xù)它的海上流浪。自登陸以來,它共在陸地停留44個小時,是個相當(dāng)長壽的臺風(fēng)。超強(qiáng)臺風(fēng)“利奇馬”兩次登陸我國,兩次入海,最終在渤海緩緩結(jié)束一生。它登陸強(qiáng)度強(qiáng)、陸地滯留時間長、降雨強(qiáng)度大且極端性顯著、大風(fēng)影響范圍廣且持續(xù)時間長,使華東及環(huán)渤海等地遭受嚴(yán)重風(fēng)雨影響,浙江、安徽、江蘇、山東等地均出現(xiàn)不同程度的城鄉(xiāng)積澇、中小河流洪水、山洪和滑坡等災(zāi)害。
因其造成的影響巨大,因此我們選取了事件發(fā)生前后2019年8月4日至8月18日之間微博用戶發(fā)表的數(shù)據(jù)信息,此時間段在政府微博和微博大V的轉(zhuǎn)發(fā)評論等多方面因素的影響下,網(wǎng)民討論和轉(zhuǎn)發(fā)活躍度極高,部分讀取數(shù)據(jù)如表1所示。為了提取這些信息,本文基于keras框架開發(fā)了Python腳本,爬取到20 258條數(shù)據(jù),包括發(fā)表用戶、時間、轉(zhuǎn)發(fā)量以及評論數(shù)等數(shù)據(jù)信息。
1.2 數(shù)據(jù)預(yù)處理
數(shù)據(jù)爬取完畢后,共得到20 258條相關(guān)評論信息。對這些信息進(jìn)行繁體字簡化、刪除垃圾廣告、無效評論等數(shù)據(jù)清洗工作,最后得到20 038條有效數(shù)據(jù),使用結(jié)巴分詞,去除停用詞等。預(yù)處理包括以下內(nèi)容:1)所有HTML標(biāo)簽,使用“Beautiful Soup”Python庫刪除標(biāo)點符號。2)此外,數(shù)字和鏈接分別由標(biāo)簽NUM和LINK代替。3)使用結(jié)巴分詞刪除停用詞。4)每個單詞的詞形還原。
單詞嵌入的起源可以追溯到1986年,稱為Hinton提出的分布式表示。通過詞嵌入模型以無監(jiān)督學(xué)習(xí)方式得到作為文本特征的詞向量,可避免人工設(shè)計特征的缺點[4]。單詞嵌入能夠?qū)卧~更改為低維實數(shù)向量,并允許我們基于余弦方法發(fā)現(xiàn)單詞的相似性。Mikolov T等[5]在他的研究中提出了CBOW和Skip-gram。它不僅可以簡化復(fù)雜性并縮短計算時間,還可以將數(shù)萬億個單詞轉(zhuǎn)換為單詞嵌入。詞袋模型(Bag-of-words)模型是信息檢索領(lǐng)域常用的文檔表示方法。單詞嵌入技術(shù)是目前將文本表示為數(shù)字向量的最佳技術(shù)之一。它是一種習(xí)得的表示法,在這種表示法中,具有相似含義的單詞被賦予相似的表示法。因此,本文使用BOW將文本向量化,之后基于Onehot提取文本特征。最后,將每個單詞映射到向量,對于一個文檔,我們得到一個N維向量序列,作為LSTM遞歸神經(jīng)網(wǎng)絡(luò)的輸入。
1.3 模型構(gòu)建
眾公民作為社會的傳感器,是分析災(zāi)害管理情緒的重要因素。社交媒體信息的傳播總是比官方新聞報道更深入、更快。但是,社交媒體信息更難處理,社交媒體是一種獨特的災(zāi)害事件信息??梢姡榫w分析為傳統(tǒng)的調(diào)查方法解釋公眾對自然災(zāi)害的意見提供了一種實用的方法。
因此本文將數(shù)據(jù)集包括兩個類別:
積極的
消極的
我們使用人工標(biāo)注驗證集數(shù)據(jù)作為本文數(shù)據(jù)集的預(yù)培訓(xùn)。具體來說就是我們將模型中第一次驗證的數(shù)據(jù)擬合到第二個驗證數(shù)據(jù)的預(yù)培訓(xùn)中,然后將第二個驗證數(shù)據(jù)擬合到同一個模型中。這種預(yù)培訓(xùn)是為了檢驗,在獨立情緒分析數(shù)據(jù)上進(jìn)行預(yù)培訓(xùn)是否有用,即使標(biāo)簽不匹配。
本文使用人工標(biāo)注的微博語料數(shù)據(jù)集,其中正向和負(fù)向評論各20 000條,我們將其分成訓(xùn)練集和驗證集。之后將預(yù)先訓(xùn)練好的字向量輸入到長短期記憶神經(jīng)網(wǎng)絡(luò)中,得到的準(zhǔn)確率為95%。LSTM是一種時間遞歸神經(jīng)網(wǎng)絡(luò),是RNN用于解決消失梯度問題的方法。RNN的基本結(jié)構(gòu)如圖1所示,其中(a)是簡單的RNN,(b)是LSTM網(wǎng)絡(luò)。LSTM僅使用一個LSTM網(wǎng)絡(luò)以形成單詞的上下文表示。最后一個隱藏的向量用作句子表示,并輸入Softmax函數(shù)來估計每個情感標(biāo)簽的概率。
在實驗中,我們在遞歸神經(jīng)網(wǎng)絡(luò)(RNN)中使用LSTM模型來模擬微博評論的觀點趨勢。首先,我們需要通過詞袋模型將語料庫更改為嵌入詞。之后,我們根據(jù)正面和負(fù)面訓(xùn)練建立預(yù)測模型。表2顯示了語料庫的分布情況??梢钥闯觯褂酶?0 000條正向和負(fù)向訓(xùn)練分類器,使用20 000條正向和負(fù)向測試建立的模型。深度學(xué)習(xí)情感分析的實驗結(jié)果達(dá)到了85%的準(zhǔn)確率。
我們在基于LSTM神經(jīng)網(wǎng)絡(luò)模型上進(jìn)行了一系列實驗。我們使用相同的訓(xùn)練數(shù)據(jù)集(見表2)共有9 640條評論。分類是使用另一個包含2 785條評論的數(shù)據(jù)集獨立進(jìn)行的,這些評論在培訓(xùn)期間沒有使用。因此,為了不使用基于模型的不同數(shù)量的訓(xùn)練周期,我們決定使用一個固定的數(shù)字—10,隨著訓(xùn)練時間的延長,損失值并沒有顯著提高。
1.4 模型實現(xiàn)
情緒分析的主要目的是通過確定主觀性、極性(正負(fù))和極性的程度,然后對主題進(jìn)行分類,從而量化文本中潛在情緒的強(qiáng)度。情感分析依賴于語言資源的使用,為每個詞賦值。然后,機(jī)器學(xué)習(xí)技術(shù)通過允許計算機(jī)根據(jù)可用數(shù)據(jù)對行為建模來確定文本主體的情感[6]。下面的數(shù)字直觀地反映了在正面和負(fù)面評論中出現(xiàn)頻率最高的詞語,通過分析圖2和圖3,我們可以看到,有些詞可以清楚地識別出兩極分化的情緒。然而,這并不適用于許多其他單詞,這些單詞有時甚至包含在具有完全相反含義的評論中。因此,僅僅根據(jù)某些詞語的出現(xiàn)與否對評論進(jìn)行簡單的分類是不夠的,這時需要機(jī)器學(xué)習(xí)技術(shù)(如本文使用的技術(shù))來分析詞語之間的關(guān)系。
基于詞云,生成情緒文本可視化,如圖4、圖5所示。從圖4中我們可以看出,救災(zāi)、山東、浙江、救援、安全等詞被用來表示用戶非常關(guān)注臺風(fēng)的進(jìn)程。一線、志愿者、香港等詞則表達(dá)了對臺風(fēng)
受災(zāi)地區(qū)和鄰近地區(qū)的關(guān)注和關(guān)心。圖5顯示的是臺風(fēng)“利奇馬”事件中的負(fù)面情緒詞語,像出現(xiàn)頻次較高的像損失、受災(zāi)、暴雨、死亡等詞大多數(shù)用來表述臺風(fēng)來臨時的恐懼和對生活環(huán)境的擔(dān)心。除了對臺風(fēng)的關(guān)注和對生活環(huán)境的擔(dān)心外,我們還發(fā)現(xiàn)了一些有趣的模式,例如,所挖掘的句子結(jié)構(gòu)包括“正在…”、“希望…”和“祝?!钡韧ǔS糜诒磉_(dá)期望和愿望,例如“危險”這樣的附加問句是對這一事件的強(qiáng)烈不滿。這些研究發(fā)現(xiàn),情感分析為用戶更好地理解公眾意見的語義提供了一種有效的方法。
根據(jù)實驗結(jié)果得到的情感狀態(tài)分布如圖6所示,可以看出,臺風(fēng)來臨前后公眾對臺風(fēng)的情緒,大多是負(fù)面情緒,表示對受災(zāi)地區(qū)和人民的擔(dān)心;當(dāng)?shù)鼐用駥Τ鲂?、生活環(huán)境的擔(dān)憂;以及對地標(biāo)性建筑毀壞的唏噓。關(guān)注公眾的負(fù)面情緒有助于及時有效地引導(dǎo)輿情朝良好的方向發(fā)展。
臺風(fēng)來臨前后,公眾對臺風(fēng)的關(guān)注程度也是不同的。從發(fā)帖量(見圖7)可以看出,8月4日,第9號臺風(fēng)“利奇馬”在菲律賓以東洋面生成,于6日加強(qiáng)為強(qiáng)熱帶風(fēng)暴級,各類媒體開始報道“臺風(fēng)即將來臨”,并請“各單位做好防范準(zhǔn)備”,公眾這時對臺風(fēng)事件關(guān)注度較低;8月10日凌晨,臺風(fēng)登陸浙江中北部,受此影響,8月11日,“利奇馬”攜帶大量水汽北上,山東和江蘇將成為大暴雨的核心區(qū)域,多處鐵路出現(xiàn)列車停運狀況,公眾關(guān)注度開始上升,并達(dá)到第一個小高峰;8月12日到14日,北方的一股冷空氣正好和臺風(fēng)“利奇馬”迎頭相撞,環(huán)渤海區(qū)域的京津冀和遼東半島,山東半島暴雨如注。8月13日,中央氣象臺發(fā)布消息稱,“利奇馬”減弱為熱帶低壓,并于當(dāng)日14時停止編號。8月14日,公眾的發(fā)文量達(dá)到最高點,超出之前的發(fā)文量10倍之多,根據(jù)8月14日的情緒強(qiáng)度,多數(shù)微博用戶表達(dá)了負(fù)面情緒。這是因為用戶可能會在臺風(fēng)過后在微博上討論與災(zāi)難有關(guān)的其他問題,例如新聞機(jī)構(gòu)和普通用戶在微博上討論了臺風(fēng)對當(dāng)?shù)鼐用竦牟焕绊?。隨著時間的推移,人們表達(dá)了復(fù)雜的情緒(包括積極的和消極的);一些人在微博上談?wù)撆_風(fēng)的后果,而另一些人則對當(dāng)?shù)卣椭驹刚叩幕顒颖硎究傮w滿意,他們能夠為當(dāng)?shù)厝嗣窕I集資金,為他們提供食物和水等等。8月15日后發(fā)帖量逐步減少,說明公眾情緒得到平復(fù),各方單位應(yīng)對有效,到8月18日,公眾關(guān)注度又達(dá)到了一個高點,這時的公眾大多關(guān)注在臺風(fēng)引起的各種生活上的不便,感慨生活,希望災(zāi)后生活便利。從情感分析結(jié)果來看,從災(zāi)害發(fā)生到結(jié)束期間,公眾的負(fù)面情緒不斷擴(kuò)散,而且占超過一半的比重,因此我們應(yīng)重點關(guān)注災(zāi)害期間公眾的負(fù)面情緒。
2 結(jié)果與建議
社會化媒體用戶在進(jìn)行評論時的情緒狀態(tài)往往受突發(fā)公共事件驅(qū)動,許多研究發(fā)現(xiàn)在不同突發(fā)事件中民眾表達(dá)的情緒具有差異,開始重點分析事件特性與情緒類型之間的關(guān)聯(lián)[7]。在研究中發(fā)現(xiàn)在可預(yù)見性和可控性都比較強(qiáng)的危機(jī)情境下,社交媒體用戶主要表達(dá)憤怒情緒;在可預(yù)見但不可控的危機(jī)情境下主要表達(dá)悲傷情緒;在不可預(yù)見且不可控的情境中恐懼情緒占據(jù)主導(dǎo),在可預(yù)見性低但可控性強(qiáng)的危機(jī)情境下主要體現(xiàn)焦慮情緒。
網(wǎng)民負(fù)面情感在網(wǎng)絡(luò)輿情事件發(fā)展過程中有著至關(guān)重要的影響[8],若不加以調(diào)節(jié),任其發(fā)展,不僅可能引發(fā)新的輿情事件,甚至激起現(xiàn)實社會更極端的群體行為[9],如埃及、摩洛哥、烏克蘭等國家的顏色革命。突發(fā)事件發(fā)生后,很多人會不明真相,因而個人輿論觀點嚴(yán)重受到網(wǎng)絡(luò)中其他人的感情色彩的影響而表現(xiàn)一定的傾向性[10],因此平復(fù)民眾負(fù)面情緒是應(yīng)急管理的重要工作,對民眾負(fù)面情緒實時監(jiān)控預(yù)警是防止衍生群體事件發(fā)生的關(guān)鍵[11]。從上文的分析結(jié)果中,我們可以看出,在災(zāi)害發(fā)生前后,公眾的負(fù)面情緒占絕大部分,而且對社會安全,生活環(huán)境與周圍人的生命健康尤其擔(dān)憂。圖8顯示了負(fù)面情緒博文的分布情況,可以看出對周邊生活環(huán)境和周圍人的擔(dān)憂占絕大部分,其次是對于災(zāi)后救援工作的關(guān)注,同時也有很多人因為災(zāi)害的來臨,對政府公信力和社會業(yè)界的救援工作產(chǎn)生了質(zhì)疑,這些負(fù)面情緒如果不能得到很好的控制,很可能會影響政府災(zāi)害救助工作和經(jīng)濟(jì)社會的穩(wěn)定。
通過新浪微博搜索API進(jìn)行收集,并對災(zāi)后公眾行為和響應(yīng)數(shù)據(jù)進(jìn)行匯總分析。我們對臺風(fēng)“利奇馬”期間微博上的用戶發(fā)帖進(jìn)行了情感分析,并將這些情緒可視化。我們展示了用戶的情緒是如何變化的,災(zāi)害發(fā)生時公眾的情感發(fā)生了怎樣的變化,以及負(fù)面情緒波動。對來用戶推文進(jìn)行識別,并對最常出現(xiàn)的詞匯進(jìn)行排名。結(jié)果表明,這些數(shù)據(jù)揭示了在危機(jī)事件期間用戶組的興趣、需求和關(guān)注的重要信息。從微博發(fā)布內(nèi)容數(shù)量的時間變化可以看出,隨著時間的推移,公眾的注意力發(fā)生了轉(zhuǎn)移,有助于理解危機(jī)期間的公眾行為和反應(yīng)。最后,在整個觀察期間進(jìn)行情感分析。
隨著信息普及、環(huán)境意識和媒介素養(yǎng)的強(qiáng)化,公民既是日趨理性的環(huán)境保護(hù)者又是意見和情緒的表達(dá)者。情感分析的一個重要結(jié)果是由于災(zāi)難性事件,人們更容易表達(dá)消極的態(tài)度,這時候需要引導(dǎo)公眾以更積極的情緒看待對地方政府的作為和志愿服務(wù)活動。負(fù)面情緒的大肆傳播不利于政府形象的建立,政府應(yīng)該從以下幾個方面努力:堅持公信力,即公共機(jī)構(gòu)應(yīng)該時刻尊重公眾的知情權(quán)和表達(dá)權(quán),公正公開地傳播真實有效的信息,獲得公眾的信任和信心;更加理性對待環(huán)境群體性事件中的網(wǎng)絡(luò)輿情,不應(yīng)將網(wǎng)民情緒表達(dá)進(jìn)行過度解讀;充分尊重公民參與公共事務(wù)的權(quán)利。
既然網(wǎng)絡(luò)輿情信息的不可控性的確對于社會信息發(fā)展形勢具有一定的負(fù)面干預(yù)作用。那么政府機(jī)關(guān)便應(yīng)該盡量在網(wǎng)絡(luò)輿情形成前,對網(wǎng)絡(luò)中的不良信息加以控制和抵制[12]。在群體性事件爆發(fā)時,政府、相關(guān)機(jī)構(gòu)和企業(yè)要因地制宜地進(jìn)行危機(jī)傳播管理,認(rèn)真聽取公眾建議,積極落實措施和政策,保持信息渠道暢通,提供信息咨詢服務(wù)和政策支持;強(qiáng)化新媒體在輿論引導(dǎo)中的作用。運用新媒體對熱點事件及時公布,強(qiáng)化公正公開透明的信息管理,引導(dǎo)合法有效的輿情抗?fàn)帯?/p>
3 總 結(jié)
網(wǎng)絡(luò)輿情生態(tài)是一個復(fù)雜多變的社會生態(tài)系統(tǒng),系統(tǒng)內(nèi)輿情主體因素、輿情客體因素及輿情環(huán)境因素相互影響、相互作用、相互制約,發(fā)生著多維度、多層次、立體化的互動。健康的輿情生態(tài)系統(tǒng)應(yīng)該是特定網(wǎng)絡(luò)輿情各構(gòu)成要素間、網(wǎng)絡(luò)輿情間、網(wǎng)絡(luò)輿情與外部環(huán)境間相互關(guān)聯(lián)制約而達(dá)到的一種具有相對平衡的結(jié)構(gòu)狀態(tài)的復(fù)雜系統(tǒng)[13]。社交媒體作為輿情生態(tài)系統(tǒng)中的重要組成要素,通過對其合理監(jiān)督和控制能夠有效提高輿情生態(tài)系統(tǒng)平衡指數(shù)。
基于輿情生態(tài)系統(tǒng),利用情緒分析來發(fā)現(xiàn)大型非結(jié)構(gòu)化數(shù)據(jù)集的極性已成為自然語言處理研究領(lǐng)域的熱點,我們發(fā)現(xiàn)社交媒體是圍繞災(zāi)難事件的豐富數(shù)據(jù)來源。越來越多的人在災(zāi)難發(fā)生之前、期間和之后使用社交媒體來描述他們的經(jīng)歷、表達(dá)他們的需求,并與其他受影響的人交流。這種在線討論模式是一個豐富的信息寶庫,如果及時有效地采取相應(yīng)措施,可能有效地控制輿情的散播并對災(zāi)害應(yīng)對起到積極作用。由于社交媒體的性質(zhì),信息貢獻(xiàn)者不再是旁觀者。識別用戶的情緒變化,有助于了解災(zāi)難期間大型社交媒體信息傳播的情感類別,并能更好地為應(yīng)急管理人員以最快的方式接觸最廣泛的受眾提供最佳決策。
筆者將在后續(xù)的研究中收集更多來自其他類型的具有更大影響的災(zāi)難(如颶風(fēng)、海嘯)的數(shù)據(jù),并測試頻繁使用的詞匯、發(fā)布內(nèi)容的時間變化和用戶情緒。這一新的方向?qū)⒂兄诟玫亓私馕C(jī)情況下的公眾情緒,并幫助應(yīng)急管理人員采取必要的措施控制災(zāi)害輿情。另外集成更復(fù)雜的模型或設(shè)計新的模型來改進(jìn)情緒分類以及細(xì)粒度的情緒檢測將是非常有必要的,并且可以關(guān)注地理地圖情緒分析如何在災(zāi)難中發(fā)揮不同作用的,了解情緒波動如何影響在災(zāi)難事件期間社交媒體上的信息,并以此傳遞對緊急響應(yīng)人員和地面人員有用的信息。
參考文獻(xiàn)
[1]Deng S,Sinha A P,Zhao H.Adapting Sentiment Lexicons to Domain-specific Social Media Texts[J].Decision Support Systems,2017,94:65-76.
[2]Davidov D,Tsur O,Rappoport A.Enhanced Sentiment Learning Using Twitter Hashtags and Smileys;Proceedings of the Proceedings of the 23rd International Conference on Computational Linguistics:Posters,F(xiàn),2010[C]//Association for Computational Linguistics.
[3]Hochreiter S,Schmidhuber J.Long Short-term Memory[J].Neural Computation,1997,9(8):1735-80.
[4]Collobert R,Weston J,Bottou L,et al.Natural Language Processing(Almost)from Scratch[J].Journal of Machine Learning Research,2011,12(8):2493-537.
[5]Mikolov T,Chen K,Corrado G,et al.Efficient Estimation of Word Representations in Vector Space[J].arXiv Preprint arXiv:13013781,2013.
[6]Hijazi M H A,Libin L,Alfred R,et al.Bias Aware Lexicon-based Sentiment Analysis of Malay Dialect on Social Media Data:A Study on the Sabah Language;Proceedings of the 2016 2nd International Conference on Science in Information Technology(ICSITech),F(xiàn),2016[C]//IEEE.
[7]唐雪梅,朱利麗.社會化媒體情緒化信息傳播研究的理論述評[J].現(xiàn)代情報,2019,39(3):115-121.
[8]Choi Y,Lin Y-H.Consumer Responses to Mattel Product Recalls Posted on Online Bulletin Boards:Exploring Two Types of Emotion[J].Journal of Public Relations Research,2009,21(2):198-207.
[9]李勇,蔡夢思,鄒凱,等.社交網(wǎng)絡(luò)用戶線上線下情感傳播差異及影響因素分析——以“成都女司機(jī)被打”事件為例[J].情報雜志,2016,35(6):80-5.
[10]王雪猛,王玉平.基于情感傾向分析的突發(fā)事件網(wǎng)絡(luò)輿情預(yù)警研究[J].西南科技大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2016,33(1):63-6.
[11]劉志明,劉魯.面向突發(fā)事件的民眾負(fù)面情緒生命周期模型[J].管理工程學(xué)報,2013,(1):15-21.
[12]段亞楠.群體性突發(fā)事件的網(wǎng)絡(luò)輿情問題及政府治理策略[J].湖北函授大學(xué)學(xué)報,2018,31(18):114-5.
[13]李昊青,蘭月新,張鵬,等.網(wǎng)絡(luò)輿情生態(tài)系統(tǒng)的失衡與優(yōu)化策略研究[J].現(xiàn)代情報,2017,37(4):20-6.
(責(zé)任編輯:郭沫含)