• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)模型的輿情情感預(yù)測

      2016-06-13 09:43:38王努努張偉佳
      電子科技 2016年5期
      關(guān)鍵詞:網(wǎng)絡(luò)輿情預(yù)測

      王努努,張偉佳,鈕 亮

      (中國計量學(xué)院 經(jīng)濟與管理學(xué)院,浙江 杭州 310018)

      ?

      基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)模型的輿情情感預(yù)測

      王努努,張偉佳,鈕亮

      (中國計量學(xué)院 經(jīng)濟與管理學(xué)院,浙江 杭州310018)

      摘要針對重大事件網(wǎng)絡(luò)輿情數(shù)量的激增,網(wǎng)絡(luò)輿情安全監(jiān)管和預(yù)警形勢嚴峻的情況,提出一種基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)組合模型的網(wǎng)絡(luò)輿情情感預(yù)測模型,進而對新浪微博上采集的"余姚水災(zāi)事件"進行文本情感值計算,并對其情感變化趨勢進行綜合分析和預(yù)測。預(yù)測結(jié)果表明,也組合預(yù)測方法相對于單一預(yù)測方法具有更高的精度,進而說明該模型在網(wǎng)絡(luò)輿情情感預(yù)測中的應(yīng)用是可行的。

      關(guān)鍵詞網(wǎng)絡(luò)輿情;情感值;組合模型;預(yù)測

      隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)媒體已經(jīng)被公認為是繼報紙、廣播、電視之后的“第四媒體”,成為反映社會輿情的主要載體。網(wǎng)絡(luò)輿情是由于各種事件的共同刺激產(chǎn)生的通過互聯(lián)網(wǎng)傳播的,民眾對于該事件的認知、態(tài)度、情感和行為的傾向[1]。近年來,由于社會突發(fā)事件不斷地增加,網(wǎng)絡(luò)輿情在很大程度上引導(dǎo)著大眾對某一輿論事件的認知。大量學(xué)者開始研究網(wǎng)絡(luò)輿情的傳播及引導(dǎo)機制[2]。如果網(wǎng)絡(luò)輿情突發(fā)事件處理不當(dāng),容易誘發(fā)民眾的不良情緒,引爆輿情危機。面對與日俱增的網(wǎng)絡(luò)輿情事件,如何建立合適的預(yù)測模型,實現(xiàn)對網(wǎng)絡(luò)輿情的預(yù)警并加以適當(dāng)?shù)囊龑?dǎo),對于維護社會穩(wěn)定具有一定的意義。

      對網(wǎng)絡(luò)輿情的建模研究主要是研究評判輿情的指標,在此基礎(chǔ)上通過分析過去和現(xiàn)在值來實現(xiàn)輿情預(yù)警,其中主要用到的方法有灰色預(yù)測方法[3]和時間序列方法[4]等。隨著計算機網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)絡(luò)輿情情感分析引起了越來越多學(xué)者的廣泛關(guān)注和興趣,相關(guān)的研究工作不斷涌現(xiàn),如王青等從輿情熱度、強度、傾度、生長度4個維度構(gòu)建了網(wǎng)絡(luò)輿情監(jiān)測及預(yù)警指標體系[5]。劉雯等以雅安地震為例,將情感分析和時間序列分析共同引入到對災(zāi)害輿情的分析中,在博文情感值計算的基礎(chǔ)上,運用ARIMA時間序列模型,建立不同情感輿情走勢的時間序列模型并進行預(yù)測[6]。ARIMA模型由于簡單性、可行性和靈活性,已經(jīng)成為時間序列分析預(yù)測最常用的一種方法。但是,ARIMA模型中,時間序列變量的未來值被認為是變量過去觀測值和隨機干擾誤差的線性函數(shù)。然而,在實際生活中,輿情的演變受到許多因素制約,這些因素既包含線性關(guān)系又包含非線性規(guī)律。因此,單純采用ARIMA模型對輿情預(yù)測會產(chǎn)生較大的誤差。另一方面,由于神經(jīng)網(wǎng)絡(luò)模型能夠較好地挖掘時間序列的非線性規(guī)律,也有一部分學(xué)者將神經(jīng)網(wǎng)絡(luò)模型運用到輿情預(yù)測中。例如,薛圈圈[7]引入BP神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型,建立指標預(yù)警模型,來定量地評判網(wǎng)絡(luò)輿情的安全態(tài)勢。

      網(wǎng)絡(luò)輿情情感時常受到多種因素的制約,且這些因素之間呈現(xiàn)比較復(fù)雜的關(guān)系,這些關(guān)系既有線性規(guī)律又有非線性的規(guī)律,單純用一種模型進行情感預(yù)測很難同時考慮到線性和非線性變化。本文提出了一種基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)組合模型的輿情情感預(yù)測方法,運用ARIMA模型描述歷史輿情情感數(shù)據(jù)的線性關(guān)系,運用BP神經(jīng)網(wǎng)絡(luò)模擬輿情演變過程中由隨機干擾因素產(chǎn)生的非線性規(guī)律,然后再對兩種建模結(jié)果進行綜合分析,給出實證結(jié)論。最后以新浪微博“余姚水災(zāi)事件”為例進行實證分析,驗證了基于ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)組合模型的輿情情感預(yù)測方法的有效性和可行性。

      1組合模型的構(gòu)建

      1.1ARIMA模型

      ARIMA模型的全稱是差分自回歸移動平均模型(Autoregressive Integrated Moving Average Model),是20世紀70年代博克思(Box)和詹金斯(Jenkins)建立的線性時間序列預(yù)測方法。ARIMA模型的基本原理:把時間序列看做一個隨機過程,用數(shù)學(xué)模型來模擬或描述;如果該模型可以確定,就可用此時間序列的過去值和現(xiàn)值來預(yù)測未來值。其表達式為

      xt=φ1xt-1+φ2xt-2+…+φPxt-P+εt-θ1εt-1-θ2εt-2-…θqεt-q

      (1)

      式中,P和q分別為自回歸階次和移動平均階次;φ1,φ2,…,φP和θ1,θ2,…,θq分別為自回歸系數(shù)和移動平均系數(shù);{εt}是{xt}的隨機誤差項,是相對獨立的白噪聲序列。一般情況下,該模型可以表示成ARIMA(P,D,q),D為差分階次。ARIMA模型的具體建模步驟如下:

      (1)序列平穩(wěn)性檢驗。ARIMA模型法的前提條件是:預(yù)測對象的時間序列是零均值的平穩(wěn)隨機序列。如果序列是非平穩(wěn)的,則對序列進行差分處理;

      (2)模型識別與定階。根據(jù)ARIMA模型自相關(guān)函數(shù)和偏相關(guān)函數(shù)的截尾性質(zhì),進行模型的初步識別。

      表1 模型識別

      初步識別模型之后,根據(jù)AIC準則定階,AIC準則函數(shù)為

      (2)

      (3)

      則k0是最佳的模型階數(shù);

      (3)參數(shù)估計與診斷檢驗。根據(jù)確定模型的階數(shù),參數(shù)估計采用極大似然估計方法。在對模型的初步識別與參數(shù)估計后,檢驗殘差序列是否為白噪聲以判斷模型的適應(yīng)性。若模型殘差通過白噪聲檢驗,可以認為模型是適應(yīng)的;若模型的殘差存在自相關(guān),模型有擬合不足的問題,需進一步改進模型。所以在選擇模型時應(yīng)該反復(fù)試探,這是一個識別——建?!僮R別——再建模的過程;

      (4)模型預(yù)測分析。若模型殘差序列通過白噪聲檢驗,可用該模型預(yù)測。

      1.2BP神經(jīng)網(wǎng)絡(luò)模型

      BP神經(jīng)網(wǎng)絡(luò)的全稱為誤差反向傳播神經(jīng)網(wǎng)絡(luò)(Error Back Propagation),該網(wǎng)絡(luò)的訓(xùn)練特點是信號向前傳遞,從輸入信號至輸入層、隱含層再至輸出層進行逐層傳播計算;若輸出層誤差大于期望誤差,通過誤差的反向傳遞不斷調(diào)整權(quán)值和閾值使誤差趨于極小化,即通過該網(wǎng)絡(luò)的預(yù)測輸出接近于期望輸出[9],從而達到建模的目的。BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)如圖1所示。

      圖1 BP神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)

      圖1中,x1,x2,…,xn是網(wǎng)絡(luò)的輸入值;y1,y2,…,yn是網(wǎng)絡(luò)的期望輸出值;wij和wjk為BP神經(jīng)網(wǎng)絡(luò)權(quán)值。BP神經(jīng)網(wǎng)絡(luò)預(yù)測前首先要通過樣本訓(xùn)練網(wǎng)絡(luò),其訓(xùn)練過程包括以下4部分[10]:

      (1)網(wǎng)絡(luò)初始化、樣本輸入x和期望輸出y。初始化輸入層—隱含層和隱含層—輸出層之間的權(quán)值wij和wjk,隱含層閾值a,輸出層閾值b。輸入訓(xùn)練樣本及期望輸出的預(yù)測值。根據(jù)樣本輸入和期望輸出序列(x,y)確定該網(wǎng)絡(luò)的輸入層和輸出層節(jié)點數(shù)n和M,計算隱含層節(jié)點數(shù)L

      (4)

      其中,i=1,2,…,n,j=1,2,…,l,k=1,2,…,m;

      (2)隱含層和輸出層輸出計算。連接各層的權(quán)值和閾值,由輸入層輸入信號計算隱含層Hj,再由隱含層計算輸出層Ok

      (5)

      (3)誤差計算及權(quán)值、閾值的調(diào)整。根據(jù)預(yù)測輸出Ok和期望輸出y計算預(yù)測誤差ek,并不斷調(diào)整初始設(shè)定的權(quán)值和閾值。

      (6)

      (4)不斷地進行計算的順傳遞與誤差的逆?zhèn)鞑?計算全局誤差e,通過判斷全局誤差是否趨于極小值來判斷訓(xùn)練是否結(jié)束。

      (7)

      1.3組合模型

      由于網(wǎng)絡(luò)輿情情感演變既有線性規(guī)律又有非線性規(guī)律,所以使用單一的模型建模會造成較大的誤差。考慮到ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型各自的特點,可以用ARIMA模型來預(yù)測網(wǎng)絡(luò)輿情情感的線性變化,再用BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測ARIMA模型產(chǎn)生的誤差,即非線性變化的規(guī)律。最后將ARIMA模型的預(yù)測值與BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測值相加得到組合模型的預(yù)測值,組合模型結(jié)構(gòu)如圖2所示。

      圖2 組合模型結(jié)構(gòu)

      2實證分析

      2.1數(shù)據(jù)采集及情感值計算

      本文以新浪微博上發(fā)表的博文為數(shù)據(jù)資源,以“余姚水災(zāi)事件”為例,隨機采集從2013年10月7日18時至10月15日24時的微博數(shù)據(jù)。利用Excel將連續(xù)6 h的數(shù)據(jù)處理成一個時間段并重處理,得到33個時間段16 680條微博正文數(shù)據(jù)。使用Rost CM文本挖掘軟件對33個時間段的微博正文數(shù)據(jù)進行情感值計算,分別取其三均值,得到每一時間段的綜合情感值,形成情感時間序列如表3所示。該綜合情感值可以代表對應(yīng)時間段微博網(wǎng)民對余姚水災(zāi)輿情的整體情感傾向。

      2.2ARIMA模型建立過程

      (2)模型識別與定階。分析序列的自相關(guān)函數(shù)(ACF)和偏相關(guān)函數(shù)(PACF),如圖3所示,初步識別模型。從圖中判斷該序列自相關(guān)和偏相關(guān)函數(shù)皆拖尾,由此確定p>0,q>0。運用AIC準則定階,大量實驗和應(yīng)用表明,當(dāng)序列長度不大時,參數(shù)p和q的值≤3,因此在定階時分別選用p、q值為1,2,3,不同p、q值下AIC的大小如表2所示。當(dāng)p=1,q=1時,AIC值最小,由此初步確定用ARIMA(1,0,1)模型對情感時間序列進行模擬和預(yù)測;

      表2 不同p、q值下AIC值

      圖3 自相關(guān)與偏相關(guān)圖像

      (3)參數(shù)估計與診斷檢驗。根據(jù)確定的ARIMA(1,0,1)模型,采用極大似然估計進行參數(shù)估計,得到φ1=0.795 3,θ1=-1,預(yù)測模型表示為xt=0.053 9+

      0.795 3xt-1+εt-εt-1,其中,εt為當(dāng)期隨機干擾項,在實際模擬和預(yù)測時不予考慮,模型進一步表示為xt=0.053 9+0.795 3xt-1εt-1。

      根據(jù)檢驗殘差序列是否為白噪聲來判斷模型的適應(yīng)性,若不適合,應(yīng)對模型進一步改進。經(jīng)過檢驗,可得殘差的均值的0.084 5,可近似看成殘差序列為零均值;且殘差呈正態(tài)分布,模擬殘差通過白噪聲檢驗,認為模型是適應(yīng)的,可用于后續(xù)預(yù)測;

      (4)ARIMA模型預(yù)測。利用ARIMA(1,0,1)模型對輿情情感進行擬合、預(yù)測,結(jié)果如表3所示。

      2.3BP神經(jīng)網(wǎng)絡(luò)預(yù)測ARIMA誤差過程

      采用ARIMA模型建模預(yù)測網(wǎng)絡(luò)輿情情感,結(jié)果表明預(yù)測值與測試值之間存在較大誤差,因而根據(jù)滾動預(yù)測方法,采用BP神經(jīng)網(wǎng)絡(luò)進一步對ARIMA模型的誤差進行預(yù)測[11]。計算得到的ARIMA模型誤差的時間段為2~33,即BP神經(jīng)網(wǎng)絡(luò)的總樣本量n=32。以下對32個誤差樣本量進行輸入和輸出分組(x,y):(2~4,5)、(5~7,8)、…(29~32,33)。因此BP神經(jīng)網(wǎng)絡(luò)的輸入層節(jié)點數(shù)為3,輸出層節(jié)點數(shù)為1,計算得隱含層節(jié)點數(shù)的范圍為[3,12],對此逐個實驗,發(fā)現(xiàn)當(dāng)隱含層的節(jié)點數(shù)為10時,網(wǎng)絡(luò)性能最佳。將BP網(wǎng)絡(luò)參數(shù)目標誤差設(shè)置為le-6。經(jīng)過13次訓(xùn)練,可達到預(yù)設(shè)目標誤差,預(yù)測結(jié)果如表3所示。

      表3  ARIMA和BP神經(jīng)網(wǎng)絡(luò)組合模型預(yù)測結(jié)果表

      (8)

      結(jié)果如表4所示,考慮到體網(wǎng)絡(luò)輿情情感傾向的時間序列既有線性趨勢,又有非線性趨勢,單一的使用ARIMA模型存在較大誤差,而運用ARIMA和BP神經(jīng)網(wǎng)絡(luò)組合模型運算出的結(jié)果能減小誤差,結(jié)果更接近測試值。

      3結(jié)束語

      (1)針對新浪微博上某一網(wǎng)絡(luò)輿情事件進行數(shù)據(jù)采集與預(yù)處理,運用ROST CM對正文進行情感值計算,形成情感時間序列;

      (2)通過ARIMA模型來預(yù)測輿情情感的線性變化,引入BP神經(jīng)網(wǎng)絡(luò)來預(yù)測其非線性的隨機變化部分,即預(yù)測ARIMA模型的預(yù)測誤差,形成組合預(yù)測模型。該模型能夠同時預(yù)測線性和非線性變化,結(jié)果表明相比于單一模型其具有較高的精確度;

      (3)本文提出的ARIMA和BP神經(jīng)網(wǎng)絡(luò)組合模型能在一定程度上預(yù)測某一輿情事件整體網(wǎng)民言論的情感傾向,預(yù)測結(jié)果有助于政府及時采取應(yīng)對措施。但是網(wǎng)民情感受多種突發(fā)因素的干擾,如真相的出現(xiàn)、事件的轉(zhuǎn)機、意見領(lǐng)袖的惡意煽動等。這些突發(fā)的隨機干擾因素可能會使得預(yù)測結(jié)果與實際情感存在較大的誤差,而這些突發(fā)干擾卻不是人為能夠左右的,因而能夠及時計算出當(dāng)前網(wǎng)民的整體情感傾向?qū)τ谡盐蛰浨樽呦蝻@得尤為重要。

      參考文獻

      [1]曾潤喜.網(wǎng)絡(luò)輿情管控工作機制研究[J].圖書情報工作,2009(18):79-82.

      [2]陳純柱,敖永春.網(wǎng)絡(luò)環(huán)境下高校輿情的傳播及引導(dǎo)機制研究[J].重慶大學(xué)學(xué)報:社會科學(xué)版,2011(2):154-159.

      [3]杜智濤,謝新洲.利用灰色預(yù)測與模式識別方法構(gòu)建網(wǎng)絡(luò)輿情預(yù)測與預(yù)警模型[J].圖書情報工作,2013(15):27-33.

      [4]錢愛玲,瞿彬彬,盧炎生,等.多時間序列關(guān)聯(lián)規(guī)則分析的論壇輿情趨勢預(yù)測[J].南京航空航天大學(xué)學(xué)報,2012(6):904-910.

      [5]王青,成穎,巢乃鵬.網(wǎng)絡(luò)輿情監(jiān)測及預(yù)警指標體系構(gòu)建研究[J].圖書情報工作,2011(8):54-57,111.

      [6]劉雯,高峰,洪凌子.基于情感分析的災(zāi)害網(wǎng)絡(luò)輿情研究——以雅安地震為例[J].圖書情報工作,2013(20):104-110.

      [7]薛圈圈.基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情危機預(yù)警研究[D].南昌:江西財經(jīng)大學(xué),2010.

      [8]Box G E P,Jenkins G M.時間序列分析預(yù)測與控制[M].3版.顧嵐,譯.北京:中國統(tǒng)計出版社,1997.

      [9]徐黎明,王清,陳劍平,等.基于BP神經(jīng)網(wǎng)絡(luò)的泥石流平均流速預(yù)測[J].吉林大學(xué)學(xué)報:地球科學(xué)版,2013(1):186-191.

      [10]史峰,王小川,郁磊,等.Matlab神經(jīng)網(wǎng)絡(luò)30個案例分析[M].北京:北京航空航天大學(xué)出版社,2010.

      [11]雷可為,陳瑛.基于BP神經(jīng)網(wǎng)絡(luò)和ARIMA組合模型的中國入境游客量預(yù)測[J].旅游學(xué)刊,2007(4):20-25.

      Emotion Prediction of Public Sentiment Based on ARIMA and BP Neural Network Model

      WANG Nunu,ZHANG Weijia,NIU Liang

      (College of Economics and Management,China Jiliang University,Hangzhou 310018,China)

      AbstractAs the number of significant events of public opinion surged in recent years,it is extremely serious to keep the security of the Network public opinion and to warn early.Thus,it is important to grasp the trend of public opinion in the macro.This paper presents a network public sentiment forecast based on ARIMA and BP neural network.The emotional value of the text of "the flood incident in Yuyao" on Sina Weibo is calculated.Then the comprehensive analysis and forecast of the trend of emotional change are given.Forecast results show that relative to,method of combined forecasting is more precise than the single forecast method,indicating the application of this model in the emotion forecast of Internet public sentiment is feasible.

      Keywordspublic opinion;emotional value;combined model;forecast

      doi:10.16180/j.cnki.issn1007-7820.2016.05.023

      收稿日期:2015-09-12

      基金項目:2014年度國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃基金資助項目(201410356019);2015年浙江省大學(xué)生科技創(chuàng)新活動計劃暨新苗人才計劃基金資助項目(2015R409005)

      作者簡介:王努努(1994—),女,本科。研究方向:信息管理與數(shù)據(jù)挖掘。

      中圖分類號G206;TP393.08

      文獻標識碼A

      文章編號1007-7820(2016)05-083-05

      猜你喜歡
      網(wǎng)絡(luò)輿情預(yù)測
      無可預(yù)測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預(yù)測卷(A卷)
      選修2-2期中考試預(yù)測卷(B卷)
      選修2—2期中考試預(yù)測卷(A卷)
      不可預(yù)測
      不必預(yù)測未來,只需把握現(xiàn)在
      網(wǎng)絡(luò)輿情事件的引導(dǎo)策略分析
      數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情管理中的研究
      “互聯(lián)網(wǎng)+”背景下高校平安校園建設(shè)研究
      中國市場(2016年38期)2016-11-15 23:42:46
      淺析網(wǎng)絡(luò)輿情治理
      偃师市| 墨江| 乌拉特前旗| 乌苏市| 永州市| 南陵县| 新丰县| 平顺县| 饶平县| 盐边县| 和龙市| 三河市| 新巴尔虎左旗| 西峡县| 呼伦贝尔市| 尚志市| 洪江市| 临夏市| 剑川县| 清涧县| 汤阴县| 东平县| 潜江市| 巴南区| 澜沧| 神木县| 广昌县| 霍州市| 含山县| 黄梅县| 社旗县| 昌邑市| 丰台区| 阳曲县| 依安县| 大化| 翁源县| 宜川县| 彩票| 贵阳市| 大兴区|