鄒進(jìn)貴,肖揚(yáng)宣,張士勇
(1.武漢大學(xué)測(cè)繪學(xué)院,湖北 武漢430079;2.精密工程與工業(yè)測(cè)量國(guó)家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室,湖北武漢430079)
工程設(shè)計(jì)、施工、竣工后的沉降監(jiān)測(cè)與控制極為重要,如果對(duì)軟土地基沉降的預(yù)測(cè)不準(zhǔn)確,則可能導(dǎo)致建筑物的功能失效,甚至造成坍塌等嚴(yán)重事故?,F(xiàn)階段,大多數(shù)組合預(yù)測(cè)方法是通過(guò)權(quán)系數(shù)把若干種不同單一方法加權(quán)組合進(jìn)行預(yù)測(cè),能夠在一定程度上提高預(yù)測(cè)精度。本文對(duì)基于ARIMA-BP神經(jīng)網(wǎng)絡(luò)的3種組合預(yù)測(cè)模型進(jìn)行了研究,并根據(jù)某地基沉降數(shù)據(jù)進(jìn)行了預(yù)測(cè)研究,對(duì)3種方法的預(yù)測(cè)結(jié)果與精度進(jìn)行了分析。
時(shí)間序列分析法是利用數(shù)據(jù)的自相關(guān)性建立相對(duì)最優(yōu)的模型來(lái)分析客觀現(xiàn)象的動(dòng)態(tài)特征[1]。時(shí)間序列分析的目的是認(rèn)識(shí)產(chǎn)生觀測(cè)序列的隨機(jī)機(jī)制,再基于序列歷史數(shù)據(jù),對(duì)序列未來(lái)的可能取值給出預(yù)測(cè)或預(yù)報(bào)[2]。其主要模型為ARIMA(auto regressive integrated moving average)模型。
如果一個(gè)時(shí)間序列 Yt{ }的d次差分Wt=ΔdYt是一個(gè)平穩(wěn)的ARMA過(guò)程,則稱 Yt{}為自回歸滑動(dòng)平均求和模型,記為ARIMA(p,d,q),其中d為差分次數(shù)。
ARIMA模型的通用表達(dá)式為
式中,φ1,φ2,…,φp是自回歸系數(shù);p是自回歸階次,θ1,θ2,…,θq是滑動(dòng)平均系數(shù);q是滑動(dòng)平均階次;et是白噪聲序列,該模型通常表示為ARIMA(p,d,q),其中d為差分階次。
ARIMA模型的建模及預(yù)測(cè)過(guò)程分為以下幾個(gè)步驟。
1)模型識(shí)別:檢驗(yàn)序列的平穩(wěn)性,對(duì)非平穩(wěn)序列進(jìn)行差分處理,再對(duì)模型定階。
2)參數(shù)估計(jì):對(duì)模型φ,θ等系數(shù)進(jìn)行估計(jì)。通常采用最小二乘估計(jì)、極大似然估計(jì)等。
3)模型診斷:進(jìn)行模型適用性檢驗(yàn),分析擬合模型的殘差。
4)預(yù)測(cè):用所得時(shí)間序列模型進(jìn)行預(yù)測(cè)。
BP神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)中使用最多的一種網(wǎng)絡(luò)。BP(back-propagation)是前饋的意思,該網(wǎng)絡(luò)由3層組成:輸入層、隱含層和輸出層[3],如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
3層的節(jié)點(diǎn)個(gè)數(shù)分別記為:N、Q、M。BP神經(jīng)網(wǎng)絡(luò)神經(jīng)元模型[4],如圖2所示。
圖2 神經(jīng)元模型
其中,xj(j=1,2,…,N)為神經(jīng)元 j的輸入信息;wij則為網(wǎng)絡(luò)的連接權(quán)重;ui是輸入信號(hào)和連接權(quán)值內(nèi)積的結(jié)果,是神經(jīng)元i的輸入信號(hào);經(jīng)過(guò)閾值θi的調(diào)整,作為激活函數(shù)的自變量,得到神經(jīng)元的輸出yi。神經(jīng)元的激活函數(shù)常采用Sigmoid函數(shù)
BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程為信號(hào)的正向傳播和學(xué)習(xí)誤差項(xiàng)的反響傳播。信號(hào)正向傳播過(guò)程為:信號(hào)從輸入層進(jìn)入,通過(guò)權(quán)值調(diào)整進(jìn)入隱含層。輸入層和隱含層閾值組合形成隱含層的輸入,再經(jīng)過(guò)激活函數(shù)的輸出。從隱含層到輸出層的過(guò)程類似。
學(xué)習(xí)誤差項(xiàng)反向傳播:網(wǎng)絡(luò)根據(jù)學(xué)習(xí)誤差的大小,重新調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值。權(quán)值重新調(diào)整之后,再進(jìn)行訓(xùn)練樣本的學(xué)習(xí)。如果訓(xùn)練誤差仍沒(méi)有達(dá)到精度要求,則繼續(xù)反向傳播,直到訓(xùn)練誤差達(dá)到要求。
假設(shè) xt{}為有N個(gè)數(shù)據(jù)的序列[5],現(xiàn)有m種預(yù)測(cè)方法,第i種預(yù)測(cè)方法在t時(shí)刻的預(yù)測(cè)值為xit,第i種預(yù)測(cè)方法所占權(quán)重為li,則序列 xt{}在t時(shí)刻的預(yù)測(cè)值^xt滿足式(3)
這是把權(quán)系數(shù)的求解轉(zhuǎn)化為求解一個(gè)最優(yōu)化問(wèn)題,使組合模型的誤差平方和達(dá)到最小。
設(shè)序列 xt{ }在t時(shí)刻的誤差為eit,則可得該模型以下的最優(yōu)化問(wèn)題
假設(shè) xt{}為有N個(gè)數(shù)據(jù)的序列,現(xiàn)有m種單項(xiàng)預(yù)測(cè)方法,第i種預(yù)測(cè)方法在t時(shí)刻的預(yù)測(cè)值為xit,第i種預(yù)測(cè)方法所占權(quán)重為li。設(shè)組合模型在t時(shí)刻的預(yù)測(cè)值為xt,根據(jù)加權(quán)調(diào)和平均數(shù)計(jì)算公式[6]
為便于對(duì)該模型進(jìn)行組合權(quán)系數(shù)的估計(jì),稍微轉(zhuǎn)換式(5)后引入誤差項(xiàng)
可得該模型以下的最優(yōu)化問(wèn)題
由于軟土地基特殊的性質(zhì)[7],其沉降規(guī)律受到多種因素制約,使沉降過(guò)程既包含線性規(guī)律又包含非線性規(guī)律。歷史數(shù)據(jù)中既有線性趨勢(shì),又有非線性趨勢(shì)[8],單獨(dú)使用某一種模型無(wú)法準(zhǔn)確刻畫(huà)其規(guī)律。需要使組合模型不僅可以通過(guò)ARIMA模型有效捕抓到序列間的相關(guān)性,還能通過(guò)BP人工神經(jīng)網(wǎng)絡(luò)模型來(lái)彌補(bǔ)ARIMA模型所無(wú)法刻畫(huà)的序列的非線性關(guān)系。
該絡(luò)組合模型進(jìn)行預(yù)測(cè)有以下幾個(gè)步驟:
1)使用時(shí)間序列分析方法對(duì)序列建立合適的ARIMA模型,并根據(jù)ARIMA模型計(jì)算擬合誤差序列并對(duì)樣本進(jìn)行預(yù)測(cè)。
2)由1)中得到的擬合誤差序列,使用BP神經(jīng)網(wǎng)絡(luò)建模并預(yù)測(cè)ARIMA模型擬合誤差。
3)用2)中得到的擬合誤差的預(yù)測(cè)值對(duì)1)中得到的預(yù)測(cè)值進(jìn)行修正,得到最終組合模型的預(yù)測(cè)值。
某工程地基歷史45期沉降數(shù)據(jù)如表1所示。運(yùn)用3種組合預(yù)測(cè)模型,以前35期數(shù)據(jù)為基礎(chǔ)對(duì)其進(jìn)行未來(lái)10期的預(yù)測(cè),并與實(shí)際值比較,分析各模型的預(yù)測(cè)精度。
表1 地基實(shí)測(cè)沉降數(shù)據(jù) mm
圖3為地基沉降量未經(jīng)差分和經(jīng)一次和兩次差分處理后的時(shí)間序列圖。
圖3 沉降量未經(jīng)差分和差分后序列圖
由圖3(a)可知,需進(jìn)行差分處理。圖3(c)為經(jīng)二次差分后的時(shí)序圖,可見(jiàn)序列基本平穩(wěn),因此確定ARIMA模型差分次數(shù)d=2。
先利用差分后序列的ACF圖和PACF圖進(jìn)行初步判斷,見(jiàn)圖4。
圖4 ACF圖和PACF圖
自相關(guān)和偏自相關(guān)函數(shù)的特征總結(jié)見(jiàn)表2。
表2 ARMA模型ACF和PACF的一般特征
可以看出ACF圖和PACF圖都是拖尾的,可初步判定差分后序列模型為ARMA模型。
輸出差分序列的EACF圖,如圖5所示。
圖5 EACF圖
從圖5可以看出,ARIMA(1,2,1)基本符合原始數(shù)據(jù)序列。
在利用極大似然估計(jì)法進(jìn)行參數(shù)估計(jì)后,進(jìn)行模型診斷,分析殘差的正態(tài)性和自相關(guān)性并進(jìn)行Ljung-Box檢驗(yàn),滿足條件后根據(jù) ARIMA(1,2,1)模型對(duì)原始序列進(jìn)行未來(lái)10期的預(yù)測(cè)。預(yù)測(cè)結(jié)果及其誤差見(jiàn)表3。
采用滾動(dòng)式[9]的預(yù)測(cè)方法來(lái)預(yù)測(cè)其誤差。以1—5期沉降值為網(wǎng)絡(luò)輸入,第6期為網(wǎng)絡(luò)輸出。2—6期預(yù)測(cè)誤差為網(wǎng)絡(luò)輸入,第7期為網(wǎng)絡(luò)輸出。以此類推到29—34期網(wǎng)絡(luò)輸入,35期為網(wǎng)絡(luò)輸出,組成樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練。經(jīng)過(guò)反復(fù)試驗(yàn),選擇隱含層神經(jīng)元個(gè)數(shù)為15。部分Matlab代碼如下
權(quán)值訓(xùn)練算法采用L-M優(yōu)化算法[10],訓(xùn)練次數(shù)設(shè)為1000,訓(xùn)練精度為10-5,學(xué)習(xí)速率為0.01。網(wǎng)絡(luò)經(jīng)過(guò)154次訓(xùn)練到達(dá)最小誤差(見(jiàn)圖6),對(duì)該序列進(jìn)行未來(lái)10期的預(yù)測(cè),其結(jié)果見(jiàn)表3。
設(shè)ARIMA模型預(yù)測(cè)加權(quán)系數(shù)為k1,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)加權(quán)系數(shù)為k2,根據(jù)上文中的理論分別計(jì)算權(quán)系數(shù)。
以誤差平方和最小組合模型計(jì)算得到權(quán)系數(shù)向量為
圖6 BP神經(jīng)網(wǎng)絡(luò)誤差曲線圖
表3 ARIMA和BP神經(jīng)網(wǎng)絡(luò)單項(xiàng)模型預(yù)測(cè)值及誤差mm
以調(diào)和平均組合模型計(jì)算得到權(quán)系數(shù)向量為
根據(jù)權(quán)系數(shù)向量即可計(jì)算以上兩個(gè)組合模型的預(yù)測(cè)值及誤差。
對(duì)序列線性和非線性規(guī)律單獨(dú)描述的組合模型預(yù)測(cè),先利用文中模型對(duì)歷史數(shù)據(jù)的擬合值計(jì)算擬合誤差,再利用BP神經(jīng)網(wǎng)絡(luò)法對(duì)誤差進(jìn)行未來(lái)10期的預(yù)測(cè),方法同上,最后用擬合誤差的預(yù)測(cè)值對(duì)ARIMA預(yù)測(cè)值進(jìn)行修正,得到最終的預(yù)測(cè)值,結(jié)果見(jiàn)表4。
為了對(duì)比3種組合模型的預(yù)測(cè)精度,采用誤差平方和(SSE)、均方誤差(MSE)、平均絕對(duì)誤差(MAE)這幾項(xiàng)誤差指標(biāo)來(lái)度量。
誤差平方和(SSE)
表4 組合模型預(yù)測(cè)結(jié)果mm
均方誤差(MSE)
平均絕對(duì)誤差(MAE)
計(jì)算得到3種組合模型的精度指標(biāo)見(jiàn)表5。
表5 3種組合模型預(yù)測(cè)精度比較
其中組合模型1為誤差平方和最小組合模型,組合模型2為調(diào)和平均組合模型,組合模型3為對(duì)序列線性和非線性規(guī)律單獨(dú)描述的組合模型。
從表5可以看出,由于組合模型1和組合模型2的加權(quán)系數(shù)相差不大,因此精度也差不多,而組合模型3的精度相比之下有較大的提高,因此對(duì)序列線性和非線性規(guī)律單獨(dú)描述的組合模型是相比各種加權(quán)組合模型更為可靠,是一種更有效的預(yù)測(cè)工具。
通過(guò)以上研究,主要得出以下幾個(gè)結(jié)論:
1)誤差平方和最小組合模型和調(diào)和平均組合模型比單一模型預(yù)測(cè)精度高,在一定程度上提高了預(yù)測(cè)的可靠性。
2)對(duì)序列線性和非線性規(guī)律單獨(dú)描述的組合模型,把序列中的線性規(guī)律用時(shí)間序列法預(yù)測(cè),再用BP神經(jīng)網(wǎng)絡(luò)法預(yù)測(cè)非線性規(guī)律的殘差,最后把二者相加得到最終結(jié)果,從根本上提高了預(yù)測(cè)精度,比加權(quán)組合模型預(yù)測(cè)結(jié)果更可靠。
3)由于軟土地基沉降的機(jī)理十分復(fù)雜,受到多種因素的影響,如施工過(guò)程中的預(yù)壓時(shí)間、土體性質(zhì)以及排水條件等,對(duì)沉降量的預(yù)測(cè)無(wú)法達(dá)到絕對(duì)嚴(yán)格的準(zhǔn)確,預(yù)測(cè)結(jié)果仍然需要進(jìn)一步的檢驗(yàn)。
[1]馮春山,吳家春,蔣馥.石油價(jià)格的組合預(yù)測(cè)研究[J].石油大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2004,20(1):12-14.
[2]CRYER JD,CHAN K S.時(shí)間序列分析及應(yīng)用:R語(yǔ)言[M].北京:機(jī)械工業(yè)出版社,2011.
[3]李友坤.BP神經(jīng)網(wǎng)絡(luò)的研究分析及改進(jìn)應(yīng)用[D].淮南:安徽理工大學(xué),2012.
[4]李聰.基于BP神經(jīng)網(wǎng)絡(luò)的股票指數(shù)期貸價(jià)格預(yù)測(cè)[D].青島:青島大學(xué),2012.
[5]鄭鳳霞.基于神經(jīng)網(wǎng)絡(luò)和時(shí)間序列的預(yù)測(cè)方法及其應(yīng)用研究[D].成都:電子科技大學(xué),2012.
[6]陳華友,盛昭瀚,劉春林.調(diào)和平均的組合預(yù)測(cè)方法之性質(zhì)研究[J].系統(tǒng)工程學(xué)報(bào),2004(6):620-624.
[7]李磊.地基沉降預(yù)測(cè)方法分析[D].杭州:浙江大學(xué),2004.
[8]黃聲享,尹暉,蔣征.變形監(jiān)測(cè)數(shù)據(jù)處理[M].武漢:武漢大學(xué)出版社,2003.
[9]雷可為,陳瑛.基于BP神經(jīng)網(wǎng)絡(luò)和ARIMA組合模型的中國(guó)入境游客量預(yù)測(cè)[J].旅游刊,2007,(4):20-25.
[10]李炯城,黃漢雄.神經(jīng)網(wǎng)絡(luò)中LMBP算法收斂速度改進(jìn)的研究[J].計(jì)算機(jī)工程與用,2006,(16):46-50.