蘭月新 張麗巍 王華偉 趙麗娟 段海鵬
關鍵詞:網(wǎng)絡輿情;風險監(jiān)測;異常感知;常態(tài)模型;風險計算
1現(xiàn)狀分析
網(wǎng)絡社會,網(wǎng)民通過互聯(lián)網(wǎng)發(fā)表觀點形成輿情已成為常態(tài)。然而,無論是破壞網(wǎng)絡秩序的網(wǎng)絡水軍和網(wǎng)絡推手,還是污染網(wǎng)絡環(huán)境的信息異化和網(wǎng)絡謠言,都嚴重阻礙民意表達,使得網(wǎng)絡輿情風險激增。明者遠見于未萌,智者避危于無形,如何在海量輿情數(shù)據(jù)中快速監(jiān)測風險隱患,提前開展風險防控,是政府治理輿情的關鍵問題。
網(wǎng)絡輿情作為具有中國特色的研究領域,國內網(wǎng)絡輿情風險研究在研究視角上,主要集中于新聞學與傳播學、情報學、管理學等學科視角;在研究方法上,主要采用系統(tǒng)動力學、復雜網(wǎng)絡、統(tǒng)計建模、自然語言處理等技術方法;在研究主題上,如圖1所示,主要集中于以下3個方面。
1)網(wǎng)絡輿情風險演化及其挖掘研究(#0,#3)。主要研究風險演化機理,應用數(shù)據(jù)挖掘、語義識別、文本挖掘、情感分析等方法開展風險挖掘。例如應用系統(tǒng)動力學研究輿情風險形成及干預策略,并開展仿真研究風險演化機理[1];基于風險感知的心理測量學派理論,結合微博輿情數(shù)據(jù)統(tǒng)計,使用信息傳播模型的計算方法,為爭議性科技事件建立信息傳播模型,并開展實證研究[2];分析融媒體時代網(wǎng)絡輿情的特點,探討網(wǎng)絡輿情的潛在風險,并提出基于語義識別構建網(wǎng)絡輿情風險挖掘策略[3]。
2)網(wǎng)絡輿情風險管理研究(#2,#4,#5)。主要涉及風險評估、預警、防范、治理等內容,其中風險評估或者預警研究大多采用“評估指標+評估方法”的模式展開,AHP、ANP、灰色模糊評價、模糊綜合評價、BP神經(jīng)網(wǎng)絡、投影尋蹤模型、灰色統(tǒng)計分析、等級全息建模等成為評估或者預警的主要研究方法。例如依據(jù)網(wǎng)絡輿情演化理論,圍繞震災網(wǎng)絡輿情的物理屬性和社會屬性提出震災網(wǎng)絡輿情風險監(jiān)測指標體系,并在輿情監(jiān)測指標構建基礎上提出基于加速遺傳算法的BP神經(jīng)網(wǎng)絡風險評估方法[4];將4種不同的投影尋蹤模型引入突發(fā)事件網(wǎng)絡輿情風險評價研究中,針對有教師值、無教師值和有單指標評價標準的輿情風險評價問題,分別采用兩種投影尋蹤模型進行實證研究,拓展了輿情風險評價的新方法[5];將現(xiàn)代風險管理理論與方法融入輿情、輿論理論并進行拓展,將統(tǒng)計方法與定性研究相結合,提出將輿情風險管理著力點前置到引導網(wǎng)民情緒和心理[6]。
3)網(wǎng)絡輿情傳播風險研究(#1,#6,#7)。主要涉及傳播主體、傳播平臺、傳播路徑、信息傳播異化等蘊含的風險。例如結合實際的社交網(wǎng)絡使用行為,在分析社交網(wǎng)絡輿情傳播模式的基礎上,構建了社交網(wǎng)絡輿情傳播模型,分析影響傳播概率的主要因素,建立了以信息風險感知為主的傳播概率的數(shù)學模型[7];通過對案例微博文本進行分析,探討風險議題的形成、轉向和消解以及情緒在風險議題傳播中的作用機制[8];定性分析大數(shù)據(jù)環(huán)境下網(wǎng)絡輿情信息異化機理,將網(wǎng)絡輿情演化機理模型拓展為信息異化控制模型,并在此基礎上通過數(shù)值仿真研究政府控制信息異化的分類問題[9]。
網(wǎng)絡輿情風險屬于小概率問題,已有研究往往通過歷史案例中的風險信息或者數(shù)據(jù)建構風險集開展風險監(jiān)測,屬于“按圖索驥”式風險監(jiān)測方法,適用于解決已標注風險問題,但考慮到目前網(wǎng)絡輿情風險呈現(xiàn)突發(fā)、頻發(fā)、并發(fā)、多發(fā)態(tài)勢,嚴重破壞輿論生態(tài)環(huán)境,未標注的新生風險挖掘研究尚缺乏深度的理論研究和科學準確的分析方法,成為政府治理輿情亟需解決的問題。
2網(wǎng)絡輿情風險監(jiān)測機理
常規(guī)的網(wǎng)絡輿情監(jiān)測與網(wǎng)絡輿情風險監(jiān)測差異較大,前者是面向互聯(lián)網(wǎng)平臺的全網(wǎng)監(jiān)測,而后者則是在全網(wǎng)監(jiān)測數(shù)據(jù)的基礎上過濾風險,所以網(wǎng)絡輿情風險監(jiān)測方法成為關鍵。考慮到網(wǎng)絡輿情風險屬于小概率問題,解決已標注風險問題屬于正向監(jiān)測方法,即以小概率思維應對小概率問題,面對未標注的新生風險,本文探索以大概率思維應對小概率問題,通過歷史案例中正常數(shù)據(jù)構建多維度輿情傳播規(guī)律模型并據(jù)此過濾風險,屬于“執(zhí)常應變”式風險監(jiān)測方法。該方法既能實現(xiàn)風險過濾,又可開展常態(tài)輿情分析,屬于一體化研究,故本文主要采用此方法開展網(wǎng)絡輿情風險監(jiān)測。
未知與不確定,是風險的核心特征,也是網(wǎng)絡輿情風險監(jiān)測的難點,解決未知與不確定是網(wǎng)絡輿情風險監(jiān)測的關鍵,如圖2所示。①風險多變,以不變應萬變。網(wǎng)絡輿情傳播的核心要素是網(wǎng)絡輿情風險的直接作用點。網(wǎng)絡輿情風險雖不確定,但其作用點卻是確定的,所以網(wǎng)絡輿情風險監(jiān)測問題可轉化為網(wǎng)絡輿情傳播要素數(shù)據(jù)監(jiān)測問題。②風險未萌,必有異常之兆。風險作用于網(wǎng)絡輿情,必有異常征兆,可將網(wǎng)絡輿情風險監(jiān)測問題轉化為網(wǎng)絡輿情數(shù)據(jù)異常監(jiān)測問題,變未知為已知。所以,網(wǎng)絡輿情風險監(jiān)測問題可轉化為數(shù)據(jù)驅動的網(wǎng)絡輿情傳播核心要素的異常數(shù)據(jù)監(jiān)測問題。
3面向風險監(jiān)測的網(wǎng)絡輿情異常感知方法
異常者,異于常也,所以按照“通變以知常,執(zhí)常以應變”的思想,解決網(wǎng)絡輿情異常監(jiān)測問題的步驟為:①確定網(wǎng)絡輿情傳播核心要素,及時監(jiān)測網(wǎng)絡平臺獲取數(shù)據(jù);②基于歷史數(shù)據(jù),以網(wǎng)絡輿情傳播核心要素為變量,構建演化規(guī)律模型;③基于核心要素演化規(guī)律模型,研究網(wǎng)絡輿情傳播核心要素異常數(shù)據(jù)過濾;④基于異常感知結果的風險預警。
3.1網(wǎng)絡輿情傳播核心要素
整理國內學者對網(wǎng)絡輿情的定義[10-15]并繪制詞云圖,可以得出描述網(wǎng)絡輿情的主要關鍵詞為社會、事件、網(wǎng)絡、公眾、民眾、信息、情感、情緒、態(tài)度等,本文據(jù)此提煉網(wǎng)絡輿情傳播核心要素為輿情主體、輿情信息和網(wǎng)民情感,構建網(wǎng)絡輿情傳播核心要素集為:
1)輿情主體(S)。輿情主體包括普通網(wǎng)民和引導主體,其中前者數(shù)量較大,但輿情引導能力很小;后者主要包括媒體、政府、網(wǎng)絡大V等具有輿情引導能力的網(wǎng)絡用戶,數(shù)量較小,但輿情引導能力極大。
2)輿情信息(x)。輿情信息主要包括發(fā)文主體、發(fā)布時間、發(fā)布內容、轉發(fā)、評論、點贊、發(fā)文網(wǎng)址等信息指標。
3)網(wǎng)民情感(E)。網(wǎng)民情感分類有基于粗粒度分類的二分法(積極和消極)、三分法(正面、中性和負面)和基于細粒度分類的四分法(憤怒、厭惡、高興、悲傷)、七分法(憤怒、厭惡、恐懼、高興、喜好、悲傷、驚訝)等。
3.2網(wǎng)絡輿情傳播核心要素演化規(guī)律建模
網(wǎng)絡輿情演化遵循信息生命周期理論,經(jīng)歷潛伏期、擴散期、消退期等階段,因此可以用描述生物萌芽、增長、消亡的生長過程的生態(tài)模型來研究網(wǎng)絡輿情傳播過程,本文選擇Logistic模型作為網(wǎng)絡輿情常態(tài)傳播過程中核心要素演化的基礎模型。
3.3網(wǎng)絡輿情傳播核心要素異常數(shù)據(jù)監(jiān)測
3.3.1監(jiān)測思路
網(wǎng)絡輿情常態(tài)傳播過程中,網(wǎng)絡輿情傳播核心要素對應數(shù)據(jù)與演化規(guī)律符合程度較高,即用網(wǎng)絡輿情數(shù)據(jù)擬合時,實際數(shù)據(jù)與模型數(shù)據(jù)吻合程度較高,并且隨著動態(tài)數(shù)據(jù)的融入,吻合程度會小幅度降低;當網(wǎng)絡輿情傳播出現(xiàn)異常情況時,其直接表現(xiàn)是網(wǎng)絡輿情傳播核心要素出現(xiàn)一系列異常數(shù)據(jù),這就導致部分網(wǎng)絡輿情傳播核心要素數(shù)據(jù)逐漸偏離演化規(guī)律,即用網(wǎng)絡輿情數(shù)據(jù)擬合時,實際數(shù)據(jù)與模型數(shù)據(jù)吻合程度會明顯降低,并且隨著動態(tài)數(shù)據(jù)的融入,吻合程度會大幅度降低?;诖?,本文選擇網(wǎng)絡輿情實際數(shù)據(jù)與模型數(shù)據(jù)的吻合程度作為監(jiān)測網(wǎng)絡輿情傳播核心要素異?,F(xiàn)象的判別指標,建構數(shù)據(jù)驅動的網(wǎng)絡輿情傳播核心要素異常數(shù)據(jù)監(jiān)測方法,如圖4所示,為風險預警提供數(shù)據(jù)支撐。
3.3.2監(jiān)測方法
網(wǎng)絡輿情異常數(shù)據(jù)監(jiān)測思路中主要步驟是數(shù)據(jù)驅動的演化模型參數(shù)確定過程(擬合數(shù)據(jù)),為保證擬合精度,本文選擇差分回歸法開展數(shù)據(jù)擬合,擬合程度系數(shù)R2(可決系數(shù))作為判別異常的關鍵指標,具體思路如圖5所示。
3.4異常感知驅動的網(wǎng)絡輿情風險預警
構建網(wǎng)絡輿情傳播核心要素指標集H={S,xi,Ei},計算指標集中指標權重形成權重集T(H)={T(S),T(xi),T(Ei)},以第一個異常數(shù)據(jù)點為時間起點,按照異常數(shù)據(jù)出現(xiàn)的時間順序,構建異常指標序列(H1,H2,…,Hn),定義t時刻網(wǎng)絡輿情風險概率為:
4實證研究
4.1數(shù)據(jù)來源
選取2018年重慶公交車墜江事件輿情作為本文實證研究案例,通過爬蟲獲取該事件微博數(shù)據(jù)179046條,每條微博屬性為發(fā)文時間、發(fā)文博主、發(fā)文內容、轉發(fā)數(shù)、評論數(shù)等,監(jiān)測時段為2018年10月28日10時45分—2018年11月2日19時59分,如圖6所示。該事件初始輿情時間為2018年10月28日10時,初期輿情圍繞公交車墜江原因以及事故救援等主題展開,2018年11月2日10時,該事件墜江原因曝光,輿情發(fā)生反轉,出現(xiàn)輿情異常現(xiàn)象,基于此,本文實證研究分為兩個階段:①常態(tài)輿情建模階段:該階段主要建構常態(tài)模型,為異常監(jiān)測提供模型基礎,主要驗證常態(tài)模型建構合理性;②異常數(shù)據(jù)建模與風險預警階段:該階段基于常態(tài)模型開展異常數(shù)據(jù)過濾并對此開展風險計算,主要驗證異常監(jiān)測敏銳程度。
4.2常態(tài)建模
選擇2018年10月28日10時—31日7時的數(shù)據(jù)作為建模數(shù)據(jù),獲取常態(tài)模型建模變量數(shù)據(jù)發(fā)文主體數(shù)量、輿情信息發(fā)布數(shù)量、轉發(fā)數(shù)量、評論數(shù)量等,并通過文本分析開展情感分析,獲取3類情感信息數(shù)量。在此基礎上,針對3類常態(tài)模型開展數(shù)據(jù)擬合,確定模型參數(shù)。
4.3異常數(shù)據(jù)建模與風險預警
首先,為方便監(jiān)測異常數(shù)據(jù),本文將可決系數(shù)R2的差分作為監(jiān)測指標,當可決系數(shù)絕對差分值R2≥0.02時,判定為數(shù)據(jù)異常(異常為1,反之為0);其次,網(wǎng)絡輿情傳播核心要素指標集包括發(fā)文主體、發(fā)布信息、中性情感、負面情感、正面情感5個指標且指標權重相等。在常態(tài)建模基礎上,逐步融入新數(shù)據(jù)(2018年10月31日8時為起點),通過數(shù)據(jù)擬合計算各個網(wǎng)絡輿情傳播核心要素模型對應的可決系數(shù)R2的差分數(shù)據(jù),監(jiān)測異常數(shù)據(jù)并計算風險值,如圖7所示。
觀察圖像發(fā)現(xiàn):2018年10月31日23時之后,僅中性情感指標出現(xiàn)3次異常(t=16;t=24;t=25),導致風險值達到49%;2018年11月2日10時(t=50),5個指標均出現(xiàn)異常,風險值增至83%,此后的11時至13時(t=51;t=52;t=53),5個指標大部分仍處于異常狀態(tài),風險值增至99%。對比該案例實際情況,在11月2日10時17分,公交車墜江原因微博發(fā)布,輿情出現(xiàn)反轉,這與異常監(jiān)測的時間點吻合,故說明本文提出的異常數(shù)據(jù)感知思路可以為風險監(jiān)測提供依據(jù)。
5結論
本文在明晰網(wǎng)絡輿情風險監(jiān)測機理的基礎上,研究了一類網(wǎng)絡輿情異常感知方法,為網(wǎng)絡輿情風險監(jiān)測自動化、智能化提供研究思路,也可為網(wǎng)絡輿情風險治理理論提供方法支撐,最后通過實證研究驗證方法可行性,得出以下結論:
1)本文基于常態(tài)模型監(jiān)測異常數(shù)據(jù),本質是以大概率思維解決問題,可提升輿情數(shù)據(jù)利用效率,且在兼顧異常監(jiān)測的同時,可根據(jù)常態(tài)模型開展輿情傳播深度分析,實現(xiàn)“深度分析+異常監(jiān)測”一體化。但考慮到網(wǎng)絡輿情事件具有較強的多樣性和不確定性,本文提出的網(wǎng)絡輿情傳播核心要素指標集和網(wǎng)絡輿情演化常態(tài)模型庫的完整性有待進一步提升。
2)本文提出的網(wǎng)絡輿情異常感知方法,在獲取輿情監(jiān)測數(shù)據(jù)后,需要進行的步驟主要有:情感計算、變量提取、數(shù)據(jù)擬合和風險計算,將4個步驟涉及的模型轉化為算法可為輿情風險自動化計算提供支撐,但情感計算步驟的效能會直接影響異常監(jiān)測的實時性,所以情感計算宜采用粗粒度劃分方法,在節(jié)省計算時間的同時保障識別精度。
3)本文針對歷史網(wǎng)絡輿情事件進行事后分析,主要驗證模型和方法的可行性,而在網(wǎng)絡輿情實際工作中,即在大樣本實時網(wǎng)絡輿情數(shù)據(jù)環(huán)境下,需要有明確的監(jiān)測對象,保障建模數(shù)據(jù)完整,進而提升建模精度,所以對于突發(fā)事件誘發(fā)的網(wǎng)絡輿情異常監(jiān)測效果會更加明顯,而對網(wǎng)絡話題誘發(fā)的網(wǎng)絡輿情來說,需要溯源數(shù)據(jù),保障監(jiān)測數(shù)據(jù)完整性。
4)本文探索以大概率思維應對小概率問題,為解決未標注的新生風險提供解決思路,而在網(wǎng)絡輿情風險監(jiān)測實際工作中,需要將多種風險監(jiān)測方法組合使用,提升監(jiān)測精度。
3837500338272