• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于情感分析的突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型仿真

      2021-10-21 17:50:49牟冬梅靳春妍邵琦
      現(xiàn)代情報(bào) 2021年10期
      關(guān)鍵詞:公共衛(wèi)生輿情預(yù)測(cè)

      牟冬梅 靳春妍 邵琦

      DOI:10 3969/j.issn.1008-0821.2021.10.007

      [中圖分類號(hào)]G202 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1008—0821(2021)10—0059—08

      社交網(wǎng)絡(luò)的重要載體“三微一端”承載了公眾情感表達(dá)及輿論傳播的重要功能。由于突發(fā)公共衛(wèi)生事件涉及公眾的健康和生命安全問(wèn)題,公眾對(duì)此類信息更為敏感、關(guān)注度更高,所以在突發(fā)公共衛(wèi)生事件發(fā)生后,真假難辨的信息極易加劇公眾的恐慌形成持續(xù)發(fā)酵的網(wǎng)絡(luò)輿情。近年來(lái),突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情頻頻發(fā)生,突發(fā)公共衛(wèi)生事件也成為網(wǎng)絡(luò)輿情研究的焦點(diǎn)之一。

      網(wǎng)絡(luò)輿情研究的關(guān)注對(duì)象通常為公共事件領(lǐng)域的新聞及其評(píng)論以及電子商務(wù)領(lǐng)域的產(chǎn)品或服務(wù)評(píng)論,其主要研究?jī)?nèi)容是對(duì)關(guān)注對(duì)象的文本內(nèi)容、行為屬性、形成機(jī)理、傳播規(guī)律等進(jìn)行深入分析。輿情預(yù)測(cè)是實(shí)現(xiàn)網(wǎng)絡(luò)輿情監(jiān)控的重要環(huán)節(jié),對(duì)于網(wǎng)絡(luò)輿情分析具有重要的意義,也是網(wǎng)絡(luò)輿情領(lǐng)域的重要組成部分。網(wǎng)絡(luò)輿情在大量的網(wǎng)絡(luò)數(shù)據(jù)之中具有延續(xù)性、交互性和演化性,有一定的可預(yù)測(cè)性。網(wǎng)絡(luò)輿情在短時(shí)間內(nèi)會(huì)大規(guī)模、快速地?cái)U(kuò)散,從風(fēng)險(xiǎn)的社會(huì)放大理論看,如果突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情處理不當(dāng),容易誘發(fā)民眾的不良情緒,導(dǎo)致漣漪效應(yīng),引爆輿情危機(jī)。建立合適的預(yù)測(cè)模型來(lái)仿真網(wǎng)絡(luò)輿情的熱度,相關(guān)部門就可以盡快掌握社情民意,及時(shí)發(fā)現(xiàn)工作中存在的不足和對(duì)問(wèn)題矛盾出現(xiàn)的影響,對(duì)負(fù)面聲音進(jìn)行正確引導(dǎo),這對(duì)于政府相關(guān)部門有效監(jiān)管網(wǎng)絡(luò)輿情、維護(hù)社會(huì)穩(wěn)定具有一定的重要意義。突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情的發(fā)生,往往是因?yàn)楣妼?duì)輿情趨勢(shì)的未知而造成恐慌蔓延,安全感缺失更加重公眾的焦慮恐慌情緒,用戶在網(wǎng)絡(luò)平臺(tái)上通過(guò)情感詞充分表達(dá)自身的情感,又由于網(wǎng)絡(luò)輿情的否定多于肯定,激情壓倒理性的特征,負(fù)面的情感推動(dòng)輿情不斷發(fā)酵,加劇了突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情的監(jiān)管難度。

      因此,本研究將情感因素引入網(wǎng)絡(luò)輿情熱度預(yù)測(cè)依據(jù)之中,針對(duì)突發(fā)公共衛(wèi)生事件構(gòu)建網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型并進(jìn)行仿真。研究將解決以下兩個(gè)問(wèn)題:①構(gòu)建基于情感分析的突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型,以期優(yōu)化突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度的預(yù)測(cè)效果;②在理論模型的指導(dǎo)下,以“×××疫苗造假”事件為例進(jìn)行模型仿真,驗(yàn)證理論模型的有效性和可行性,評(píng)價(jià)加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)效果。

      1相關(guān)研究

      目前,國(guó)內(nèi)外學(xué)者對(duì)網(wǎng)絡(luò)輿情預(yù)測(cè)的研究大多采用的是時(shí)間序列分析或者灰色理論。輿情預(yù)測(cè)與時(shí)間序列分析相結(jié)合的研究方法,一種是利用歷史網(wǎng)絡(luò)輿情熱度來(lái)進(jìn)行網(wǎng)絡(luò)輿情預(yù)測(cè),歷史網(wǎng)絡(luò)輿情熱度的測(cè)量多選擇百度指數(shù)、發(fā)文量等;另一種是針對(duì)網(wǎng)民的各類情感傾向性伴隨時(shí)間的轉(zhuǎn)移所發(fā)生的變化來(lái)進(jìn)行研究的。梳理輿情預(yù)測(cè)與灰色理論相結(jié)合的研究成果發(fā)現(xiàn),一種是僅通過(guò)輿情方面的單一觀測(cè)值來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)輿情的預(yù)測(cè)研究;另一種是利用多種網(wǎng)絡(luò)輿情觀測(cè)值來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)輿情的預(yù)測(cè)研究。張和平等選用百度指數(shù)作為輿情熱度的衡量指標(biāo),利用馬爾可夫修正灰色模型的預(yù)測(cè)結(jié)果。王寧等分別以微指數(shù)、百度指數(shù)、頭條指數(shù)作為事件熱度的衡量指標(biāo),運(yùn)用灰色模型實(shí)現(xiàn)預(yù)測(cè)并運(yùn)用灰色關(guān)聯(lián)分析方法提出網(wǎng)絡(luò)輿情事件分級(jí)方案,還有學(xué)者選取多個(gè)指標(biāo)數(shù)據(jù)建立多因素灰色模型,并利用BP神經(jīng)網(wǎng)絡(luò)對(duì)多因素灰色模型的預(yù)測(cè)殘差進(jìn)行修正,實(shí)現(xiàn)網(wǎng)絡(luò)輿情的精確預(yù)測(cè)。

      網(wǎng)絡(luò)輿情預(yù)測(cè)的方法還包括Logistic模型、模糊綜合評(píng)價(jià)法、馬爾科夫鏈、BP神經(jīng)網(wǎng)絡(luò)、組合預(yù)測(cè)等。有學(xué)者基于灰色關(guān)聯(lián)度方法構(gòu)建網(wǎng)絡(luò)輿情熱度模型,并在此基礎(chǔ)上構(gòu)建多維度Logistic模型對(duì)各個(gè)媒體平臺(tái)輿情信息開(kāi)展預(yù)測(cè)。Chen X G等采用粗糙集理論篩選輿情指標(biāo)體系,通過(guò)層次分析法確定指標(biāo)權(quán)重,引入模糊綜合評(píng)價(jià)法預(yù)測(cè)和評(píng)估輿情發(fā)展趨勢(shì)。劉勘等采用馬爾科夫鏈對(duì)網(wǎng)絡(luò)輿情熱度進(jìn)行預(yù)測(cè),結(jié)果表明,建模方法和預(yù)測(cè)算法是有效的。曾子明等在構(gòu)建微博輿情熱度評(píng)價(jià)指標(biāo)體系的基礎(chǔ)之上,建立了基于BP神經(jīng)網(wǎng)絡(luò)的突發(fā)傳染病輿情熱度趨勢(shì)預(yù)測(cè)模型。還有學(xué)者將常用的Logistic模型、指數(shù)平滑法模型和灰色模型結(jié)合在一起,通過(guò)層次分析法進(jìn)行權(quán)重賦值后得到最優(yōu)化網(wǎng)絡(luò)輿情數(shù)據(jù)的預(yù)測(cè)值。

      對(duì)近年來(lái)國(guó)內(nèi)外相關(guān)文獻(xiàn)進(jìn)行梳理,發(fā)現(xiàn)目前國(guó)內(nèi)外學(xué)者的網(wǎng)絡(luò)輿情預(yù)測(cè)研究尚處于探索階段,已有的輿情預(yù)測(cè)研究多采用時(shí)間序列分析或者是灰色理論來(lái)實(shí)現(xiàn)研究目的。網(wǎng)絡(luò)輿情熱度預(yù)測(cè)是網(wǎng)絡(luò)輿情預(yù)測(cè)的子類。網(wǎng)絡(luò)輿情預(yù)測(cè)不僅包括網(wǎng)絡(luò)輿情熱度預(yù)測(cè),還包括話題演化預(yù)測(cè)、觀點(diǎn)預(yù)測(cè)等。在網(wǎng)絡(luò)輿情熱度預(yù)測(cè)的相關(guān)研究中,鮮有研究人員在網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型仿真中引入情感因素。鑒于突發(fā)公共衛(wèi)生事件的影響力大、危害程度高、更容易使網(wǎng)絡(luò)輿情發(fā)酵,結(jié)合上文所述,考慮到網(wǎng)民情感對(duì)網(wǎng)絡(luò)輿情傳播的影響作用,納入情感因素不僅能夠從理論上優(yōu)化輿情熱度預(yù)測(cè)模型的精準(zhǔn)度,也具有一定的現(xiàn)實(shí)意義,為輿情應(yīng)對(duì)及監(jiān)測(cè)提供管控依據(jù)。因此,本研究將情感因素引入網(wǎng)絡(luò)輿情熱度預(yù)測(cè)之中,針對(duì)突發(fā)公共衛(wèi)生事件,實(shí)現(xiàn)基于情感分析的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型仿真。

      2突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型的構(gòu)建

      本研究提出的基于情感分析的突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型包括數(shù)據(jù)處理層、情感分析層、熱度預(yù)測(cè)層3個(gè)層級(jí),各層級(jí)之間逐層遞進(jìn),基于數(shù)據(jù)預(yù)處理獲得文本數(shù)據(jù)的結(jié)構(gòu)化語(yǔ)料集,基于多特征融合的情感分析方法獲得情感傾向,基于多元時(shí)間序列分析進(jìn)行輿情熱度預(yù)測(cè)。數(shù)據(jù)的預(yù)處理部分包括數(shù)據(jù)清洗、按時(shí)間排序、分詞、去停用詞4個(gè)步驟,從而獲得結(jié)構(gòu)化的語(yǔ)料集。將數(shù)據(jù)處理層的結(jié)構(gòu)化數(shù)據(jù)作為情感分析層的輸入數(shù)據(jù),情感分析層采用多特征融合情感分析方法,獲得詞典特征、表情特征、向量特征后融合成為情感分類特征,再利用機(jī)器分類算法得到情感傾向作為情感分析結(jié)果。在熱度預(yù)測(cè)層,將情感值及原創(chuàng)博文量、轉(zhuǎn)發(fā)量、評(píng)論量作為相關(guān)因素,百度指數(shù)作為輸出序列,利用LSTM實(shí)現(xiàn)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)。所構(gòu)建的理論模型如圖1所示。

      2.1數(shù)據(jù)處理層

      數(shù)據(jù)的預(yù)處理是突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型的基礎(chǔ),對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理可以將以自然語(yǔ)言書寫的博文轉(zhuǎn)化為方便機(jī)器學(xué)習(xí)方法識(shí)別的形式,同時(shí)也利于后續(xù)各類時(shí)間序列數(shù)據(jù)的建立。本研究所構(gòu)建的突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型的預(yù)處理部分包括以下步驟:①數(shù)據(jù)清洗環(huán)節(jié)包括刪除非原創(chuàng)的微博數(shù)據(jù)和博文噪聲,博文噪聲是指網(wǎng)址鏈接、標(biāo)簽、特殊符號(hào)(“$”“#”“@”……)等;②將所有的原創(chuàng)微博數(shù)據(jù)按照時(shí)間進(jìn)行排序;③使用Jieba分詞腳本對(duì)原創(chuàng)博文進(jìn)行分詞;④對(duì)原創(chuàng)博文去停用詞。

      2.2情感分析層

      本研究的創(chuàng)新點(diǎn)就是在突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)中加入情感傾向,因此情感分析方法的有效性對(duì)網(wǎng)絡(luò)輿情熱度預(yù)測(cè)來(lái)說(shuō)必不可少。而《融入表情特征的網(wǎng)絡(luò)輿情情感分析方法研究》一文中所提出的網(wǎng)絡(luò)輿情情感分析方法是對(duì)以往方法的改良,所以本研究在突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型中的情感分析部分采用了融入表情特征的網(wǎng)絡(luò)輿情情感分析方法。該輿情情感分析方法是在詞典特征和向量特征的基礎(chǔ)之上融入表情特征,通過(guò)表情特征對(duì)情感的濃縮表達(dá)提升輿情表述中潛在情感的挖掘能力。在關(guān)注單一文本信息的同時(shí)還考慮了重要的情感線索——表情符號(hào)所具有的強(qiáng)烈情感表達(dá)能力對(duì)于情感傾向判斷的影響,而且避免了文字表述與表情符號(hào)的情感歧義問(wèn)題,提高了網(wǎng)絡(luò)輿情情感分析效果。

      融入表情特征的網(wǎng)絡(luò)輿情情感分析方法分3個(gè)步驟:①抽取文本的情感詞、修飾詞、語(yǔ)氣詞和標(biāo)點(diǎn)符號(hào),按照一定的規(guī)則進(jìn)行組合計(jì)算來(lái)提取詞典特征;在構(gòu)建表情符號(hào)集的基礎(chǔ)上,考慮積極表情、消極表情、中性表情的數(shù)量來(lái)獲取表情特征;選擇Doc2vec作為提取向量特征的手段;②將詞典特征、表情特征、向量特征進(jìn)行融合,得到情感分類特征;③將情感分類特征作為分類器的輸入,獲得文本的情感分析結(jié)果。本研究利用融入表情特征的網(wǎng)絡(luò)輿情情感分析方法獲得所有原創(chuàng)微博數(shù)據(jù)的情感分析結(jié)果后,把情感分析結(jié)果作為輿情熱度預(yù)測(cè)部分中情感值的來(lái)源。

      2.3熱度預(yù)測(cè)層

      屈啟興等、陳福集等、曾子明等研究者在進(jìn)行網(wǎng)絡(luò)輿情預(yù)測(cè)時(shí)都把博文量、轉(zhuǎn)發(fā)量、評(píng)論量作為輿情熱度的影響因素,研究者們普遍認(rèn)為民眾對(duì)于網(wǎng)絡(luò)輿情的關(guān)注程度可以通過(guò)發(fā)文、評(píng)論與轉(zhuǎn)載等方式來(lái)體現(xiàn),原創(chuàng)博文量可以測(cè)度話題的曝光度,轉(zhuǎn)發(fā)量、評(píng)論量則是從受眾視角來(lái)反映輿情熱度。情感傾向作為社會(huì)屬性的一種,對(duì)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情的傳播有重要的影響作用,所以本研究也考慮了原創(chuàng)博文量、轉(zhuǎn)發(fā)量、評(píng)論量,并在此基礎(chǔ)上加入情感值來(lái)作為輿情熱度的相關(guān)因素。百度指數(shù)是統(tǒng)計(jì)網(wǎng)民在百度上針對(duì)關(guān)鍵詞的搜索量,通過(guò)科學(xué)分析并計(jì)算關(guān)鍵詞在百度上搜索量的加權(quán)而獲得,反映網(wǎng)民的主動(dòng)搜索量和某一類事件受網(wǎng)民的關(guān)注程度,由于其在搜索引擎產(chǎn)品中極高的市場(chǎng)占有率及數(shù)據(jù)的可獲得性,受到學(xué)者們的廣泛關(guān)注。因此,本研究選取百度指數(shù)作為網(wǎng)絡(luò)輿情熱度的衡量指標(biāo)。

      多元時(shí)間序列分析指對(duì)多變量時(shí)間序列的研究,是一種將多元回歸分析與時(shí)間序列分析相結(jié)合的方法。LSTM屬于多元時(shí)間序列分析的一種實(shí)現(xiàn)方式,它是RNN的變體,內(nèi)部更為復(fù)雜,能夠處理長(zhǎng)時(shí)依賴問(wèn)題,其相比于RNN主要進(jìn)行了兩個(gè)改進(jìn):一是在記憶狀態(tài)的基礎(chǔ)上加入了新的內(nèi)部狀態(tài)——單元狀態(tài),讓它來(lái)儲(chǔ)存較長(zhǎng)時(shí)期的記憶;二是引入了門限機(jī)制來(lái)控制信息流動(dòng)。也就是說(shuō),LSTM的結(jié)構(gòu)中不但包含了RNN中所涉及的隱含層單元之間的外循環(huán),而且包含了神經(jīng)元內(nèi)部的自循環(huán)。針對(duì)序列數(shù)據(jù)而言,LSTM的優(yōu)勢(shì)在于一方面可以提高模型的收斂速度;另一方面由于門限機(jī)制的存在可以促使模型避免局部最優(yōu)朝正確的方向進(jìn)行收斂,因此適用于序列數(shù)據(jù)的分類、處理和預(yù)測(cè)。所以,選擇LSTM來(lái)實(shí)現(xiàn)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度的預(yù)測(cè)。

      LSTM內(nèi)部隱含層由“遺忘門”“輸入門”“輸出門”和記憶單元構(gòu)成,使用“門”來(lái)有選擇地控制信息的流動(dòng)。當(dāng)前時(shí)刻的輸入數(shù)據(jù)xt和上一時(shí)刻隱含層的輸出ht-1依次流向“遺忘門”“輸入門”和“輸出門”,通過(guò)使用激活函數(shù)將數(shù)據(jù)映射到0~1得到隱含層的輸出ht。“遺忘門”的表達(dá)式見(jiàn)式(1),“輸入門”的表達(dá)式見(jiàn)式(2),“輸出門”的表達(dá)式見(jiàn)式(3)。

      3實(shí)驗(yàn)及結(jié)果分析

      3.1數(shù)據(jù)預(yù)處理

      在百度指數(shù)官網(wǎng)獲取某突發(fā)公共衛(wèi)生事件“×××疫苗造假”2018年7月15日—2018年10月31日的百度指數(shù),形成百度指數(shù)時(shí)間序列作為預(yù)測(cè)模型的輸出序列。以新浪微博作為網(wǎng)絡(luò)輿情數(shù)據(jù)的獲取渠道,利用Python自編網(wǎng)絡(luò)爬蟲得到新浪微博上該事件2018年7月15日—2018年10月31日的相關(guān)微博,部分原始數(shù)據(jù)如圖2所示。獲得的原始數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)清洗、按時(shí)間排序、分詞、去停用詞的預(yù)處理后,剩余87860條原創(chuàng)博文。計(jì)算該事件對(duì)應(yīng)時(shí)間段內(nèi)的原創(chuàng)博文量、轉(zhuǎn)發(fā)量、評(píng)論量分別形成原創(chuàng)博文量時(shí)間序列、轉(zhuǎn)發(fā)量時(shí)間序列、評(píng)論量時(shí)間序列。

      3.2網(wǎng)絡(luò)輿情情感分析

      詞典特征規(guī)則模板的輸入為微博文本集合M,輸出為每條文本的詞典特征。詞典特征的具體構(gòu)建方式包括如下步驟:

      1)讀取文本數(shù)據(jù),對(duì)每條文本進(jìn)行分句。

      2)查找每個(gè)分句中的詞語(yǔ),若該詞在積極詞典中出現(xiàn),則賦值為“+1”,若在消極詞典中出現(xiàn),則賦值為“-1”,沒(méi)有出現(xiàn),則賦值為“0”。

      3)在程度級(jí)別詞詞典、否定詞詞典中比對(duì)修飾詞,若在情感詞前出現(xiàn)則賦予對(duì)應(yīng)的權(quán)值。

      4)在語(yǔ)氣詞詞典中比對(duì)語(yǔ)氣詞,若出現(xiàn)則賦予相應(yīng)的權(quán)值,沒(méi)有出現(xiàn)則賦值為“0”。

      5)標(biāo)點(diǎn)符號(hào)按照標(biāo)點(diǎn)符號(hào)詞典給予對(duì)應(yīng)的權(quán)值。

      6)將情感詞和修飾詞的分?jǐn)?shù)相乘,再對(duì)句子中依存關(guān)系的分?jǐn)?shù)進(jìn)行累加,然后乘以語(yǔ)氣詞和標(biāo)點(diǎn)符號(hào)的權(quán)值。累加各分句的情感傾向分?jǐn)?shù),最終得到該博文的詞典特征,記為SCOl'e,如式(4)所示。

      其中,n是微博文本集合M中某個(gè)博文包含的分句數(shù),m是句子包含的依存關(guān)系數(shù),basescore是情感詞的基本分值(+1、-1或0),modifiers是句i的程度詞權(quán)重或否定詞權(quán)值,mood是語(yǔ)氣詞權(quán)值,punctuation是標(biāo)點(diǎn)符號(hào)權(quán)值。

      以人工選擇的方式篩選新浪微博平臺(tái)的169個(gè)常用表情符號(hào),構(gòu)建表情符號(hào)集。將篩選后的表情符號(hào)劃分為積極、消極、中性3種類型。表情特征使用三維特征[e1,e2,e3]表示,3個(gè)維度從左到右分別對(duì)應(yīng)積極表情個(gè)數(shù)、消極表情個(gè)數(shù)、中性表情個(gè)數(shù)。

      Doc2vec包括Distributed Memory(DM)、Dis-tributed Bag-of-Words(DBOW)兩種方式。由于DBOW在訓(xùn)練中只需要存儲(chǔ)Softmax參數(shù),更加節(jié)省存儲(chǔ)空間。所以,選擇DBOW作為獲得向量特征的方式。利用Python中的Gensim庫(kù)提取向量特征,經(jīng)過(guò)反復(fù)試驗(yàn),維度設(shè)置為200維時(shí)效果最佳。

      相關(guān)領(lǐng)域的現(xiàn)有研究中大多使用拼接的方式實(shí)現(xiàn)多特征融合,所以本研究亦采用拼接的方式將詞典特征、表情特征、向量特征融合后得到情感分類特征,情感分類特征=[詞典特征+表情特征+向量特征]。選擇One-Versus-One SVM作為分類方法,核函數(shù)選用高斯核函數(shù)來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)輿情的情感三分類。

      情感分析方法的有效性為網(wǎng)絡(luò)輿情熱度預(yù)測(cè)的順利開(kāi)展奠定基礎(chǔ)。經(jīng)過(guò)上述過(guò)程,得到尚未進(jìn)行情感標(biāo)注的79860條原創(chuàng)博文的情感分析結(jié)果。接著在對(duì)應(yīng)時(shí)間段內(nèi)對(duì)原創(chuàng)博文的情感傾向取絕對(duì)值后進(jìn)行累加得到情感值,形成情感值時(shí)間序列,用情感值來(lái)代表對(duì)應(yīng)時(shí)間段微博網(wǎng)民對(duì)該事件的整體情感傾向。

      3.3網(wǎng)絡(luò)輿情熱度預(yù)測(cè)

      3.3.1序列平穩(wěn)性檢查及評(píng)價(jià)指標(biāo)

      研究采用多元時(shí)間序列分析方法進(jìn)行輿情熱度的預(yù)測(cè),多元時(shí)間序列分析的各個(gè)時(shí)間序列必須滿足以下兩個(gè)條件之一:①輸入序列和輸出序列均平穩(wěn);②雖然序列非平穩(wěn),但是具有協(xié)整關(guān)系。平穩(wěn)序列必須滿足3點(diǎn)要求:第一個(gè)要求為整體序列的均值保持不變,是一個(gè)與時(shí)間無(wú)關(guān)的常數(shù)。即隨時(shí)間的發(fā)展,數(shù)據(jù)在均值范圍內(nèi)上下波動(dòng);第二個(gè)要求是方差與時(shí)間無(wú)關(guān)。即意味著數(shù)據(jù)在圍繞均值上下波動(dòng)的范圍是相同的;第三個(gè)要求是協(xié)方差只與時(shí)間間隔相關(guān),而與具體的時(shí)間點(diǎn)無(wú)關(guān)。即數(shù)據(jù)隨著時(shí)間波動(dòng)的兩個(gè)波峰或者波谷之間的距離是相等的。序列的平穩(wěn)性檢查包括時(shí)序圖檢驗(yàn)、偏相關(guān)函數(shù)圖與自相關(guān)函數(shù)圖檢驗(yàn)、單位根檢驗(yàn)3種方式,單位根檢驗(yàn)又可分為DF檢驗(yàn)、ADF檢驗(yàn)、PP檢驗(yàn)。協(xié)整檢驗(yàn)方法包括EG檢驗(yàn)和Johansen檢驗(yàn)。本研究選用被廣泛使用的ADF檢驗(yàn)對(duì)序列數(shù)據(jù)的平穩(wěn)性進(jìn)行檢查,通過(guò)Eviews軟件來(lái)實(shí)現(xiàn)。若Eviews軟件的結(jié)果中P值小于0.05且t值為負(fù)值,則該時(shí)間序列為平穩(wěn)時(shí)間序列數(shù)據(jù)。

      根據(jù)本研究的數(shù)據(jù)量按照8:2劃分訓(xùn)練集和測(cè)試集。為了評(píng)價(jià)模型的擬合效果,以及方便將預(yù)測(cè)結(jié)果與現(xiàn)實(shí)數(shù)據(jù)做量化比較,本文引入了兩種評(píng)價(jià)指標(biāo),分別是均方根誤差(Root Mean Square Er-roy,RMSE)和平均絕對(duì)百分比誤差(Mean Abso-lute Percentage Error,MAPE)。RMSE指的是預(yù)測(cè)值與真實(shí)值偏差的平方與觀測(cè)次數(shù)N比值的平方根,其計(jì)算方式見(jiàn)式(5)。MAPE指的是偏差與真實(shí)值比值的平均絕對(duì)值百分?jǐn)?shù),其計(jì)算方式見(jiàn)式(6)。同種誤差的誤差值越小就表示預(yù)測(cè)值與真實(shí)值的差值越小,模型的預(yù)測(cè)效果越好。

      分別對(duì)百度指數(shù)時(shí)間序列、原創(chuàng)博文量時(shí)間序列、轉(zhuǎn)發(fā)量時(shí)間序列、評(píng)論量時(shí)間序列和情感值時(shí)間序列進(jìn)行平穩(wěn)性檢查,ADF檢驗(yàn)的結(jié)果如表1所示。如表1所示,百度指數(shù)時(shí)間序列、原創(chuàng)博文量時(shí)間序列、轉(zhuǎn)發(fā)量時(shí)間序列、評(píng)論量時(shí)間序列和情感值時(shí)間序列的p值都小于0.05且1%、5%、10%置信區(qū)間均為負(fù)值,因此這5個(gè)序列都是平穩(wěn)時(shí)間序列數(shù)據(jù)。

      3.3.2預(yù)測(cè)模型仿真結(jié)果

      對(duì)經(jīng)過(guò)平穩(wěn)性檢驗(yàn)后的各個(gè)時(shí)間序列數(shù)據(jù)進(jìn)行Min-max標(biāo)準(zhǔn)化方式處理后,采用LSTM進(jìn)行多元時(shí)間序列分析,從而實(shí)現(xiàn)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)。在時(shí)間窗口的選擇方面,部分進(jìn)行網(wǎng)絡(luò)輿情預(yù)測(cè)研究的學(xué)者們選擇的最長(zhǎng)滯后范圍為4~6天。因此,本研究的時(shí)間窗口選擇為滯后1~5天。圖3展示了滯后1天時(shí)的真實(shí)值與預(yù)測(cè)值,圖4展示了滯后2天時(shí)的真實(shí)值與預(yù)測(cè)值,圖5展示了滯后3天時(shí)的真實(shí)值與預(yù)測(cè)值,圖6展示了滯后4天時(shí)的真實(shí)值與預(yù)測(cè)值,圖7展示了滯后5天時(shí)的真實(shí)值與預(yù)測(cè)值。

      網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型仿真結(jié)果的RMSE和MAPE如表2所示。表2顯示,滯后1天時(shí),加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型RMSE為270.413、MAPE為0.163,均低于未加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型;滯后2天時(shí),加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型RMSE為289.440、MAPE為0.169,均低于未加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型;滯后3天時(shí),加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型RMSE為285.601、MAPE為n 174,均低于未加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型;滯后4天時(shí),加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型RMSE為283.762、MAPE為0.175,均低于未加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型;滯后5天時(shí),加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型RMSE為223.089、MAPE為0.150,均低于未加人情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型??梢?jiàn),無(wú)論時(shí)間窗口選擇的滯后天數(shù)是哪種情況,加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型效果優(yōu)于未加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型,且時(shí)間窗口選擇的滯后天數(shù)為5天時(shí)加入情感值的網(wǎng)絡(luò)輿情熱度預(yù)測(cè)效果最好。因此,將情感因素引入突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)之中可以顯著提高其預(yù)測(cè)效果。

      4結(jié)論與展望

      本研究的目的是突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè),而較少有研究人員將網(wǎng)民情感引入網(wǎng)絡(luò)輿情熱度預(yù)測(cè)之中,因此確立了基于情感分析進(jìn)行突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)的研究主題。在研究設(shè)計(jì)中,以大多數(shù)學(xué)者選用的百度指數(shù)作為網(wǎng)絡(luò)輿情熱度衡量指標(biāo),在考慮了網(wǎng)絡(luò)用戶的原創(chuàng)博文量、轉(zhuǎn)發(fā)量、評(píng)論量等網(wǎng)絡(luò)輿情熱度相關(guān)因素之外,增加情感因素,利用多個(gè)指標(biāo)更為全面地實(shí)現(xiàn)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)。獲得情感傾向時(shí),采用了融入表情特征的網(wǎng)絡(luò)輿情情感分析方法。本研究的模型仿真結(jié)果也顯示了情感因素對(duì)于突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)的重要性。

      本研究提出了基于情感分析的突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型,并選取某一突發(fā)公共衛(wèi)生事件的新浪微博數(shù)據(jù)進(jìn)行預(yù)測(cè)模型仿真。雖然在研究思路和方法上有了一些創(chuàng)新性,但由于時(shí)間因素以及現(xiàn)實(shí)條件的限制,研究仍然存在著一定的不足之處:僅選擇了單一突發(fā)公共衛(wèi)生事件。未來(lái)可選擇更多的突發(fā)公共衛(wèi)生事件進(jìn)行實(shí)證研究,以驗(yàn)證基于情感分析的突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型的普適性。

      基于情感分析的突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情熱度預(yù)測(cè)模型為輿情監(jiān)管部門的工作提供了新思路。網(wǎng)民通過(guò)網(wǎng)絡(luò)針對(duì)突發(fā)公共衛(wèi)生事件發(fā)表自己觀點(diǎn)的過(guò)程中產(chǎn)生大量具有感情色彩的文本信息,體現(xiàn)出的情感傾向展現(xiàn)網(wǎng)民所持的態(tài)度。突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情的監(jiān)管中,要考慮到網(wǎng)民情感對(duì)網(wǎng)絡(luò)輿情傳播的影響作用,充分了解網(wǎng)民的態(tài)度和意見(jiàn),將情感因素納入網(wǎng)絡(luò)輿情熱度預(yù)測(cè)依據(jù)之中。同時(shí)也要注意網(wǎng)民情感的疏導(dǎo),定位網(wǎng)民負(fù)面情緒的根源,及時(shí)準(zhǔn)確地發(fā)布事件相關(guān)的各種信息,以公開(kāi)透明的方式解答網(wǎng)民的質(zhì)疑,消除焦慮與恐慌,避免引爆輿情危機(jī)。

      (責(zé)任編輯:孫國(guó)雷)

      猜你喜歡
      公共衛(wèi)生輿情預(yù)測(cè)
      無(wú)可預(yù)測(cè)
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預(yù)測(cè)卷(A卷)
      選修2-2期中考試預(yù)測(cè)卷(B卷)
      《首都公共衛(wèi)生》征訂啟事
      《首都公共衛(wèi)生》征訂征稿簡(jiǎn)則
      不必預(yù)測(cè)未來(lái),只需把握現(xiàn)在
      輿情
      輿情
      輿情
      公共衛(wèi)生服務(wù)怎加強(qiáng)
      贺兰县| 兰考县| 灯塔市| 新民市| 崇信县| 滁州市| 墨竹工卡县| 隆化县| 衡南县| 石泉县| 广平县| 西吉县| 寻甸| 临澧县| 芒康县| 涿州市| 贺州市| 类乌齐县| 维西| 新巴尔虎左旗| 昭苏县| 内乡县| 岳阳市| 漠河县| 吉林市| 垦利县| 通辽市| 晋江市| 南康市| 揭西县| 元朗区| 万年县| 岚皋县| 浏阳市| 永平县| 塔河县| 永兴县| 抚顺县| 满洲里市| 舒城县| 太仆寺旗|