李一銘 徐緒堪 王普查
(1.河海大學商學院 常州 213022;2.河海大學統(tǒng)計與數(shù)據(jù)科學研究所 常州 213022;3.常州市工業(yè)大數(shù)據(jù)挖掘與知識管理重點實驗室 常州 213022)
當前我國處于社會轉(zhuǎn)型的關鍵時期,致災因子高度集中,突發(fā)事件頻發(fā),例如:SARS危機、“8·12”天津港爆炸事故、“6·22”杭州保姆縱火案、2020年的新冠肺炎疫情事件。突發(fā)事件涉及的數(shù)據(jù)呈現(xiàn)容量大、流動快、形態(tài)多以及價值密度低的特點[1],為突發(fā)事件的快速響應帶來巨大挑戰(zhàn)。隨著網(wǎng)絡的快速發(fā)展,數(shù)據(jù)增速變快,利用效率低下,大量的不可信數(shù)據(jù)因而滋生,影響著突發(fā)事件的發(fā)展進程,輿情數(shù)據(jù)的漣漪式傳播,不僅會加重原事件帶來的后果,甚至會產(chǎn)生一系列的衍生事件,造成對社會的二次影響。
優(yōu)質(zhì)的應急情報服務需要保證數(shù)據(jù)的可信度,因此,本文面向重大突發(fā)事件,構(gòu)建了基于高斯過程分類的網(wǎng)絡輿情可信度評估模型。通過追溯數(shù)據(jù)源計算全局可信度,識別謠言信息,防止因數(shù)據(jù)失實輿情失控給社會造成嚴重的損失,并以政府數(shù)據(jù)共享、公共價值最大化為導向,輿情可信度評估為數(shù)據(jù)支撐,融合政務新媒體等要素,提出多元協(xié)同的突發(fā)事件網(wǎng)絡輿情引導機制,為提升突發(fā)事件響應過程中的情報感知能力提供新思路。
1.1政務微博輿情研究述評隨著“互聯(lián)網(wǎng)+政務服務”的有效推進,政務新媒體在突發(fā)事件響應中發(fā)揮了重要的輿論引導作用。唐夢斐等[2]以“上海外灘踩踏事件”為研究對象,引入影響力和影響效果兩個指標,分析了政務微博在突發(fā)事件辟謠過程中存在的問題。王國華等[3]針對“深圳山體滑坡”突發(fā)事件,借助社會網(wǎng)絡分析法,探討了政務微博引導輿情走向的聯(lián)動效應規(guī)律。翟冉冉等[4]為研究政府在網(wǎng)絡輿情應對中的有效回應方式,從各類突發(fā)公共事件情境出發(fā),對政務微博的回應內(nèi)容進行了編碼,分析其特征規(guī)律。陳娟等[5]基于政務微博的內(nèi)容和文本特征,構(gòu)建了傳播效果回歸模型,謠言類型、內(nèi)容長度、信息情感傾向等顯著影響著政務微博的辟謠傳播效果。張雪梅等[6]引入道格拉斯生產(chǎn)函數(shù)和DEA模型,對政務微博輿情數(shù)據(jù)傳播效率評價指標體系的投入、產(chǎn)出指標進行投影分析,研究政務微博傳播效率較低的原因。馮小東等[7]從個體參與政務微博傳播的微觀視角出發(fā),給出了一種基于文本挖掘的度量方法,發(fā)現(xiàn)公眾興趣和社會信任是影響政務微博傳播效果的重要因素。沈霄等[8]研究了近三年政務微博蹭熱點的案例,針對政務微博如何有效利用熱點現(xiàn)象,從情感偏向、語言風格、內(nèi)容屬性、立場傾向四維度進行深入剖析。姜景等[9]比較了政務微博和政務抖音信息發(fā)布和傳播的特征和差異,提出在應對突發(fā)事件的輿情時,政務微博和政務抖音應實現(xiàn)矩陣互補、雙微聯(lián)動。鄧喆等[10]從疫情響應、議題設置、傳播效果、網(wǎng)絡交互四個角度,對比了政務微博在疫情防控期間輿論引導的內(nèi)容特征,探究政務微博的和聲共振模式,聯(lián)合發(fā)聲、協(xié)同響應可增強政務微博的矩陣效應。
1.2網(wǎng)絡輿情可信度評估述評近年來,網(wǎng)絡輿情數(shù)據(jù)的可信度評估獲得了國內(nèi)外學者越來越多的關注,研究的視角集中于輿情來源的可信度、傳播渠道的可信度,信息內(nèi)容的可信度[11-12]。輿情數(shù)據(jù)的可信度評估模型主要基于機器學習、統(tǒng)計分析。滕婕等[13]考慮個體的異質(zhì)性,構(gòu)建了基于Multi-Agent的信任識別模型,在網(wǎng)絡輿情事件爆發(fā)時,對信息主體進行有效的信任識別。張子良等[14]針對數(shù)據(jù)傳播路徑中信息缺失的問題,應用數(shù)據(jù)溯源技術,結(jié)合傳播路徑的用戶可信度,構(gòu)建了PROV評估模型,有效量化微博的可信度。王芳等[15]基于信息生態(tài)學視角,引入謠言真實度參數(shù),研究了公共危機謠言與正面信息交互時的真實度衡量問題。A.Farasat等[16]基于社交網(wǎng)絡中的數(shù)據(jù)傳播路徑,提出了融合多源數(shù)據(jù)的數(shù)據(jù)質(zhì)量計算方法。況湘玲等[17]考慮輿情傳播過程對信任權(quán)值的影響,構(gòu)建了多社團復雜信任網(wǎng)絡,量化了信任值動態(tài)演化的過程。李明等[18]在知識內(nèi)容、知識來源、用戶特征的三個基礎維度上,增加了知識反饋、主觀感知等維度,完善了突發(fā)事件環(huán)境下知識可信度的評估指標。李保珍等[19]引入貝葉斯推理模型,對網(wǎng)絡信息內(nèi)容的可信度進行了定量測度。孫鵬等[20]通過結(jié)構(gòu)化分解多媒體情報內(nèi)容,融合文本、圖像、音頻等數(shù)據(jù)形式,構(gòu)建了面向視頻情報內(nèi)容可信度評估的量化模型,為不同結(jié)構(gòu)的輿情數(shù)據(jù)可信度衡量提供了新的研究思路。曾子明等[21]將LDA主題模型與隨機森林相結(jié)合,挖掘文本的深層次語義信息,結(jié)合用戶可信度和微博影響力特征,較為準確的識別了霧霾事件的謠言數(shù)據(jù)。
綜上所述,政務微博是政府實現(xiàn)精準服務和輿情引導的重要工具,在突發(fā)事件的響應過程中,政務微博及時的數(shù)據(jù)共享,不僅可以有效疏解網(wǎng)民的負面情緒,降低事件演化態(tài)勢惡化的可能性,還可以釋放微博信息的潛在公共價值,提升政府的公信力。目前,輿情數(shù)據(jù)可信度研究側(cè)重于信息可信度的影響因素分析、可信度指標體系的完善,學者們常常將數(shù)據(jù)的信度評估轉(zhuǎn)化為分類問題,并不斷優(yōu)化創(chuàng)新分類模型,但模型的準確率和效率還有待提高,大多模型只是識別是否為謠言數(shù)據(jù),未能直觀的衡量和比較數(shù)據(jù)的可信任程度?;诖?,本文提取突發(fā)事件輿情數(shù)據(jù)的關鍵詞特征、數(shù)據(jù)源特征,引入高斯過程分類模型,衡量突發(fā)事件多源數(shù)據(jù)的可信程度,快速感知異常數(shù)據(jù),并面向政務微博,以精準防控為導向,提出多元主體協(xié)同的輿情引導機制,減少謠言的滋生,推進“互聯(lián)網(wǎng)+政務服務”。
2.1方法選擇高斯過程是基于貝葉斯原理和統(tǒng)計學的機器學習方法,具有容易實現(xiàn),超參數(shù)自適應獲取、輸出的結(jié)果具有概率意義等優(yōu)點,多用于遙感、工業(yè)領域[22]。針對突發(fā)事件涉及的數(shù)據(jù)非線性、高維多源、難以預估的特點,高斯過程分類模型具有較強的適應性[23]。輸入數(shù)據(jù)、數(shù)據(jù)源特征的各類指標,應用基于高斯過程原理的分類算法,GPC算法(Gaussian Process Classification),可有效識別可信度低的數(shù)據(jù),輸出概率值衡量數(shù)據(jù)的可信任度。
高斯過程分類的思想是基于函數(shù)空間角度,定義高斯過程用以描述函數(shù)分布,并進行貝葉斯推理。根據(jù)輸入的訓練數(shù)據(jù)集,通過映射函數(shù),將自變量映射到高維函數(shù)空間,最后輸出自變量屬于某類標簽的概率值。
2.2基于高斯過程分類的數(shù)據(jù)可信度評估模型考慮關鍵節(jié)點的突發(fā)事件可信度評估模型構(gòu)建步驟共分為七步:a.確定突發(fā)事件的熱度話題,構(gòu)建可信度評估的指標體系,通過網(wǎng)絡爬蟲,實時獲取目標數(shù)據(jù)。b.提取數(shù)據(jù)特征,包括主題詞、數(shù)據(jù)的影響力。提取數(shù)據(jù)源特征,即數(shù)據(jù)源的可信度衡量指標。c.對數(shù)據(jù)進行標準化處理,劃分訓練集、測試集。d.設置初始參數(shù)、選擇合適的核函數(shù),建立高斯過程分類模型進行評估。e.計算測試數(shù)據(jù)的可信度概率值,識別謠言數(shù)據(jù)。f.輸出數(shù)據(jù)的全局可信度衡量值。g.關鍵節(jié)點識別,監(jiān)測可信度較低的數(shù)據(jù)大量涌現(xiàn)的節(jié)點。具體算法流程如圖1所示:
圖1 基于高斯過程分類的數(shù)據(jù)可信度評估流程
2.2.1 提取特征向量
a.構(gòu)建數(shù)據(jù)、數(shù)據(jù)源特征指標?;谛吕宋⒉┑臄?shù)據(jù)環(huán)境,構(gòu)建數(shù)據(jù)、數(shù)據(jù)源的特征指標體系。數(shù)據(jù)特征向量包括兩大指標,主題分布和數(shù)據(jù)影響力,數(shù)據(jù)源的特征向量主要是衡量數(shù)據(jù)源的專業(yè)度、活躍情況。具體如表1所示:
表1 特征指標
b.實時獲取目標數(shù)據(jù)??紤]到數(shù)據(jù)獲取對象、方式、頻度等對數(shù)據(jù)可信度有著一定的影響,以細化數(shù)據(jù)需求為導向,借助網(wǎng)絡數(shù)據(jù)采集技術和工具,有效的獲取目標數(shù)據(jù)。在微博環(huán)境中,確定需要采集的突發(fā)事件話題,使用網(wǎng)絡爬蟲軟件,爬取話題下的實時微博數(shù)據(jù)。一級指標中,主題分布指標由發(fā)布微博的文本內(nèi)容決定,數(shù)據(jù)源可依賴性指標數(shù)據(jù)刻畫了微博用戶的信任特征,短時間內(nèi)不會有大幅度的變化,因此,考慮爬取數(shù)據(jù)的時間維度,主題分布和數(shù)據(jù)源可依賴性兩大指標的數(shù)據(jù)獲取采用周期性的方式,頻度為每小時更新一次,但數(shù)據(jù)影響力指標中,微博數(shù)據(jù)的轉(zhuǎn)發(fā)數(shù)、評論數(shù)、點贊數(shù)、傳播熱度和評論態(tài)度需要實時監(jiān)測,以能夠及時預警網(wǎng)絡輿情演化過程的異常節(jié)點,數(shù)據(jù)影響力指標的數(shù)據(jù)獲取采取云采集的方式,工作狀態(tài)為24小時*60min,設置數(shù)據(jù)采集頻度為每分鐘更新一次。
c.處理數(shù)據(jù),提取特征向量。將爬取的突發(fā)事件網(wǎng)絡輿情數(shù)據(jù)進行預處理,刪除重復、無關數(shù)據(jù),去除停用詞,進行文本分詞。針對可信度評估的二級指標中,提取主題詞特征時,使用LDA文檔主題模型,將微博文本數(shù)據(jù)中出現(xiàn)的最高頻率的關鍵詞作為該文本的主題。提取數(shù)據(jù)影響力特征時,微博數(shù)據(jù)的轉(zhuǎn)發(fā)數(shù)、評論數(shù)、點贊數(shù)由網(wǎng)絡爬蟲直接爬取獲得,數(shù)據(jù)的創(chuàng)作類型由人工辨別并提取,評論態(tài)度的特征提取需要對微博下的評論內(nèi)容進行情感分析,借助自然語言處理工具包平臺,輸入評論的文本內(nèi)容,對態(tài)度傾向進行分類,確定情感態(tài)度。微博數(shù)據(jù)源的是否認證、認證類型、微博總數(shù)、關注數(shù)、粉絲數(shù)由網(wǎng)絡爬蟲直接爬取獲得。
綜合數(shù)據(jù)特征指標和數(shù)據(jù)源特征指標,進行標準化處理。默認情況下,按均值為0,方差為1的形式進行標準化。將所有的特征指標轉(zhuǎn)化為矩陣形式,將可信度設為向量形式。
2.2.2 計算全局可信度 高斯過程是任意有限隨機變量的集合,且這任意有限隨機變量均服從高斯分布。設數(shù)據(jù)和數(shù)據(jù)源的特征指標X和可信度y之間的潛在函數(shù)f(x)的先驗分布為高斯分布,則可得公式(1),其中,使用極大似然法可估計正定協(xié)方差函數(shù)的超參數(shù)θ,k表示對稱且正定的m階協(xié)方差矩陣,Kij=k(xi,xj,θ),k(*)為由θ決定的正定協(xié)方差函數(shù)。
p(f|X,θ)=N(0,k)
(1)
訓練樣本集為DataTrain={(xm,ym)|m=1,2,…n},輸入數(shù)據(jù)集為X=[x1,x2,…xμ]T,輸出集合為y=[y1,y2,…yμ]T,潛在函數(shù)值fm=f(xm)。類標簽y為獨立分布,基于高斯過程原理的二分類,樣本數(shù)據(jù)x屬于類標簽y的概率值表示為公式(2)。
p(ym|fm)=Sig(ymfm)
(2)
其中,Sig()為高斯過程分類的響應函數(shù),可將輸出值轉(zhuǎn)換為屬于某類標簽的概率值,基于此,可得到似然函數(shù),如公式(3)。
(3)
由貝葉斯原理可得預測值的后驗概率計算公式,如公式(4)。
(4)
將測試數(shù)據(jù)DataPred代入公式(4),得到對應的預測值的后驗概率值,如公式(5)。其中,Xpred表示測試的數(shù)據(jù),fpred表示測試數(shù)據(jù)DataPred的潛在函數(shù)值。
(5)
最后,計算預測值fpred所對應的分類預測概率值,如公式(6)。其中,ypred為測試數(shù)據(jù)的可信度。
(6)
2.2.3 識別關鍵節(jié)點 根據(jù)李綱等[24]提出的大數(shù)據(jù)可信度度量方法,可得以下定義。
定義1 數(shù)據(jù)源:指在大數(shù)據(jù)環(huán)境下的數(shù)據(jù)提供者。
定義2 數(shù)據(jù):由多個屬性構(gòu)成,記作:data={d1,d2,…dn}。
定義3 可信網(wǎng)絡:由數(shù)據(jù)源實體以及鏈接數(shù)據(jù)源之間的有向鏈路組成的網(wǎng)絡。
網(wǎng)絡輿情監(jiān)測區(qū)間的分層可信網(wǎng)絡演化如圖2所示,其中,W={W1,W2,…Wn}為可信度子網(wǎng)集合,可信數(shù)據(jù)與謠言數(shù)據(jù)的交互傳播,形成不同時刻節(jié)點下的可信度子網(wǎng)。Tn時刻數(shù)據(jù)的可信度網(wǎng)絡如圖3所示,輿情數(shù)據(jù)的可信度衡量中,除了與本身的數(shù)據(jù)特征指標有關,還與發(fā)布數(shù)據(jù)的數(shù)據(jù)源有著直接關聯(lián),在各個有著關聯(lián)關系的數(shù)據(jù)源之中,數(shù)據(jù)通過有向的鏈路進行傳播,形成了一個分層可信網(wǎng)絡。
圖2 可信網(wǎng)絡演化過程
圖3 輿情數(shù)據(jù)傳遞網(wǎng)絡
在突發(fā)事件輿論爆發(fā)的關鍵節(jié)點,存在著放大效應,且極易滋生大量謠言數(shù)據(jù),常有大量的營銷賬號、網(wǎng)絡水軍,迅速傳播謠言數(shù)據(jù),制造可信假象,惡意引導普通用戶的情緒,引發(fā)輿情爆點,為防止關鍵節(jié)點的失控,基于可信網(wǎng)絡,考慮可信數(shù)據(jù)和謠言數(shù)據(jù)的交互,通過監(jiān)測可信度較低數(shù)據(jù)的濃度來識別輿情演化的異常節(jié)點。
2020年初,全球范圍內(nèi)爆發(fā)了新型冠狀病毒肺炎,事發(fā)突然,疫情快速蔓延。國內(nèi)各地快速啟動一級響應,世界衛(wèi)生組織將新型肺炎疫情評為國際關注的突發(fā)公共衛(wèi)生事件。本文選取新型肺炎疫情事件驗證建立的數(shù)據(jù)可信度評估模型,具有一定代表性,能為突發(fā)事件的高效響應提供支撐。
3.1數(shù)據(jù)來源從網(wǎng)頁版新浪微博中爬取圍繞“新冠肺炎”話題下,2020年1月20日至2月15日發(fā)布的微博,采集了2 486條數(shù)據(jù),包括微博的文本內(nèi)容、評論文內(nèi)容,轉(zhuǎn)發(fā)數(shù)、評論數(shù)、點贊數(shù),微博的發(fā)表時間,發(fā)表微博的用戶昵稱,用戶是否認證,用戶關注數(shù)、粉絲數(shù)、該用戶已發(fā)微博的總量。
3.2數(shù)據(jù)和數(shù)據(jù)源特征向量篩選刪除2 486條微博數(shù)據(jù)中的重復數(shù)據(jù)、無關數(shù)據(jù),根據(jù)構(gòu)建的數(shù)據(jù)、數(shù)據(jù)源特征指標整理有效數(shù)據(jù),最后得1 000條有效數(shù)據(jù)?;赗語言環(huán)境,調(diào)用jiebaR程序包進行分詞,調(diào)用LDA程序包進行主題建模。計算不同主題數(shù)下的困惑度,如圖4所示,根據(jù)困惑度最小原則,選取主題參數(shù)K為8。設置迭代次數(shù)G為5000,文檔中的主題稀疏性超參數(shù)alpha=0.10,主題中的單詞稀疏性超參數(shù)beta=0.02。超參數(shù)alpha、beta與主題參數(shù)相互關聯(lián),一般情況下,alpha的初始取值接近于1/k,根據(jù)輸入的數(shù)據(jù)文檔,通過迭代方法更新超參數(shù)[25]。
圖4 主題困惑度
迭代結(jié)束,可得主題分布結(jié)果,每個主題取前五個關鍵詞,關鍵詞分布比例情況如表2所示:
表2 主題分布
3.3全局可信度值以中央網(wǎng)信辦違法和不良信息舉報中心下的中國互聯(lián)網(wǎng)聯(lián)合辟謠平臺曝光的謠言信息作為謠言識別的基準,將數(shù)據(jù)的70%設為樣本訓練集,數(shù)據(jù)的30%設為測試集。高斯過程模型的類型參數(shù)type設置為分類classification,核函數(shù)設置為徑向基核函數(shù),即kernel=rbfdot,tol參數(shù)為終止條件的容忍度,設置為1e-5,指定cross=5,算法對訓練集執(zhí)行5折交叉驗證來評估模型的質(zhì)量。使用構(gòu)建好的高斯過程分類模型進行預測,選取部分預測結(jié)果展示,并與支持向量機與隨機森林模型的分類結(jié)果作比較,其中,基于支持向量機和隨機森林的兩列中,1代表是可信數(shù)據(jù),-1代表謠言信息。如表3所示:
表3 預測結(jié)果
在高斯過程二分類模型的預測結(jié)果中,概率值低于0.5時,說明數(shù)據(jù)為謠言數(shù)據(jù),概率值大于0.5時,說明數(shù)據(jù)可信??尚哦戎荡笥?.9的數(shù)據(jù)源大部分為得到微博認證的用戶,粉絲數(shù)量大,且發(fā)布微博的轉(zhuǎn)發(fā)數(shù),評論數(shù)、點贊數(shù)也較多。數(shù)據(jù)源的影響力在一定程度上決定著數(shù)據(jù)傳播的廣度,當影響力越大的用戶發(fā)布謠言信息時,謠言數(shù)據(jù)擴散的速度越快,涉及的范圍越廣,更容易導致網(wǎng)絡輿情的失控,造成不可挽回的損失,數(shù)據(jù)可信度評估模型更應對此類數(shù)據(jù)進行有效監(jiān)測。在問題數(shù)據(jù)中,編號123的微博數(shù)據(jù)是由官方認證的賬號發(fā)布的疫情真實信息,用戶的注冊微博的時間較短,微博總數(shù)較少,這類數(shù)據(jù)源雖然具有較高的專業(yè)權(quán)威性,但受關注程度低,傳播熱度低,從而導致模型計算的數(shù)據(jù)信任度低于了可信標準。相比之下,支持向量機、隨機森林這兩種機器學習方法雖然也能對突發(fā)事件的可信數(shù)據(jù)與謠言數(shù)據(jù)分類,但是只是給出了類別,是否為謠言,而高斯過程分類模型可以將預測結(jié)果轉(zhuǎn)化為概率,更能直觀的衡量數(shù)據(jù)的信任度,量化數(shù)據(jù)的可信程度。因此,高斯過程分類模型更適合應用于突發(fā)事件數(shù)據(jù)的可信度衡量,可行度高且能有效監(jiān)測突發(fā)事件輿情數(shù)據(jù)中的失真信息。
選取監(jiān)測區(qū)間的部分數(shù)據(jù),如圖5所示,觀察可信數(shù)據(jù)和謠言數(shù)據(jù)的變化情況,當可信度低于0.5的數(shù)據(jù)大量涌現(xiàn)時,快速感知異常節(jié)點。
圖5 異常節(jié)點監(jiān)測
重大突發(fā)事件情境下,大量的失真數(shù)據(jù)存在于網(wǎng)絡中,尤其是突發(fā)事件演化過程中的關鍵節(jié)點,網(wǎng)絡謠言極易滋生,網(wǎng)民不良情緒的聚積,若不加以思想引領,會導致輿情的爆發(fā),或引發(fā)二次衍生事故等更嚴重的后果。輿情的引導,需要政府的及時有效的回應,政府權(quán)威數(shù)據(jù)的公布,對化解網(wǎng)絡輿情起著關鍵的作用,隨著“互聯(lián)網(wǎng)+政務”的推進,突發(fā)事件的響應更需要政府數(shù)據(jù)的共享與各部門的協(xié)同聯(lián)動。然而,政府在治理網(wǎng)絡輿情中還存在協(xié)同機制缺乏、效率低下、數(shù)據(jù)難以有效共享等問題。作為政務新媒體的“主力軍”,政務微博的互動和時效優(yōu)勢突出,在重大突發(fā)事件的響應中影響更為廣泛[9]。因此,本文以公共價值最大化為導向,構(gòu)建政務微博聯(lián)動響應的網(wǎng)絡引導機制,如圖6所示。
圖6 突發(fā)事件網(wǎng)絡輿情引導機制
圍繞“快速有效”的突發(fā)事件響應目標,從政務創(chuàng)新的視角出發(fā),以公共價值理論、協(xié)同共享理論為理論支撐,為促進政府數(shù)據(jù)的共享,信息資源的公開透明,融合政務新媒體等要素,構(gòu)建多主體協(xié)同的網(wǎng)絡輿情引導機制,引入高斯過程分類等機器學習模型和大數(shù)據(jù)分析方法,以輿情數(shù)據(jù)可信度評估為數(shù)據(jù)支撐,有效辨別網(wǎng)絡謠言,同時,實時監(jiān)測突發(fā)事件的情景演化,預測關鍵節(jié)點,基于微博環(huán)境,判斷情感傾向,通過政務微博發(fā)布權(quán)威信息,及時疏解群眾的負面情緒,防止輿情的爆發(fā)給社會帶來嚴重的影響。
政務微博是政府部門與群眾互動溝通的媒介,及時共享突發(fā)事件的數(shù)據(jù)資源、發(fā)布權(quán)威信息進行辟謠,一方面可以抑制謠言的肆意傳播,另一方面也可以提高政府的公信力,推進輿情管理的精準政務服務。政務微博參與的網(wǎng)絡輿情引導機制強調(diào)的是多元協(xié)同聯(lián)動、信息資源的及時共享。突發(fā)事件發(fā)生后,政務微博除了需要在第一時間作出回應,形成政務微博矩陣式信息傳播,還應保證發(fā)布的微博質(zhì)量,發(fā)揮政務微博的潛在價值。
應急響應是一個不斷及時反饋、多部門協(xié)同聯(lián)動的過程,情報貫穿突發(fā)事件的不同階段,發(fā)揮著重要的決策支撐作用,情報的質(zhì)量決定著應急響應的效果。本文將高斯過程分類引入到突發(fā)事件的數(shù)據(jù)評估中,在突發(fā)事件的情境下,基于高斯過程原理,輸出輿情數(shù)據(jù)的可信概率值,量化輿情數(shù)據(jù)的信任度,動態(tài)識別突發(fā)事件關鍵節(jié)點的謠言數(shù)據(jù),提出政務微博協(xié)同的網(wǎng)絡輿情引導機制,促進政務信息的共享,為突發(fā)事件精準預警和快速響應提供可信度高的數(shù)據(jù)支撐,有效避免事件誤判。下一步研究將側(cè)重探討數(shù)據(jù)傳播路徑中的數(shù)據(jù)源可信度變化,從數(shù)據(jù)溯源全程進行突發(fā)事件的數(shù)據(jù)質(zhì)量控制,促進有價值的應急情報產(chǎn)生,為網(wǎng)絡輿情管理提供更加精準的優(yōu)質(zhì)服務。