王莉娜,姜相奪,蘆玉華
基于時變自回歸模型的非平穩(wěn)數(shù)據(jù)預(yù)測方法研究
王莉娜,姜相奪,蘆玉華
針對現(xiàn)有的自回歸(Autoregressive, AR)模型對非平穩(wěn)數(shù)據(jù)預(yù)測效果不佳的問題,提出了基于時變自回歸(Time-Varying Autoregressive, TVAR)模型的時序預(yù)測方法。針對某型國產(chǎn)飛機發(fā)動機的低壓轉(zhuǎn)速信號,使用TVAR模型分別進行點預(yù)測和區(qū)間預(yù)測,并與AR模型的點預(yù)測結(jié)果進行對比。研究結(jié)果表明,TVAR模型能夠很好地反映非平穩(wěn)數(shù)據(jù)的變化趨勢。在給定置信水平下,TVAR預(yù)測區(qū)間能夠包含真實數(shù)據(jù),因此TVAR模型在時序預(yù)測中具有更好的預(yù)測效果。
時間序列;時變自回歸模型;預(yù)測
近年來,隨著微機、航空、航天、電子、通信金融等領(lǐng)域的發(fā)展,時間序列預(yù)測變得越來越重要,是當前科學研究的熱點之一。目前,我國學者已將時間序列法中的回歸分析法、分解分析法應(yīng)用于故障率預(yù)測,然而回歸分析法需要首先識別目前產(chǎn)品所處階段,分解分析法則需要大量數(shù)據(jù)支撐,不適用于數(shù)據(jù)量少的情況,這兩種方法都存在一定的局限性。時間序列法中的ARMA(Autoregressive Moving Average)模型能較好地解決上述問題,無須識別產(chǎn)品所處階段,所需數(shù)據(jù)量少,且預(yù)測精度較高,便于在線性最小方差意義下進行最佳預(yù)報和控制。研究人員已經(jīng)將ARMA模型應(yīng)用于故障數(shù)預(yù)測、設(shè)備缺陷數(shù)預(yù)測[1][2]。
ARMA模型的兩種特殊情況是AR模型、MA模型等。其中,由于AR模型的結(jié)構(gòu)相對簡單,在某種意義上,AR模型和MA模型及ARMA模型可以相互轉(zhuǎn)化,因此AR模型的應(yīng)用范圍最廣。AR模型的系數(shù)是常數(shù),不能隨著信號的變化而不斷調(diào)整,適用于平穩(wěn)信號,對非平穩(wěn)信號的適用性較差。
TVAR模型是將AR模型的常系數(shù)ai展開為一組基時間函數(shù)的線性組合,模型系數(shù)能夠動態(tài)調(diào)整,可以更好地描述信號的變化,已經(jīng)在模態(tài)識別[3],語音分析[4]及故障診斷[5]等方面成功應(yīng)用。
本文針對TVAR模型在非平穩(wěn)信號處理方面的優(yōu)勢,提出了基于TVAR模型的非平穩(wěn)數(shù)據(jù)預(yù)測方法。
1.1 AR預(yù)測模型簡介
AR模型是一種特殊的隨機線性時不變(LTI)系統(tǒng)離散時間模型。該模型的輸出序列y(n)可以看作是白噪聲e(n)通過有理濾波器得到。對于長度為N的時間序列y(n),其AR模型具有如下形式:
其中,y(n)為第n時刻的采樣值,ai為AR模型的系數(shù),p為模型的階數(shù),e(n)為模型的殘差。
假設(shè)要對長度為N的時間序列y(n)作k步預(yù)測,設(shè)第n時刻的預(yù)測值用y?(n)表示,則第N+k時刻的預(yù)測數(shù)據(jù)有如下形式如公式(2):
1.2 TVAR預(yù)測模型
(1)點預(yù)測
TVAR模型是將AR模型的常系數(shù)ai展開為一組基時間函數(shù)的線性組合,因此該模型能夠根據(jù)信號的變化而不斷地調(diào)整模型的系數(shù),從而能夠更好地描述信號的變化,即對于長度為N的時間序列y(n),TVAR模型用差分方程形式表示如公式(3)、(4):
其中,y(n)為第n時刻的采樣值,ai(n)為時變系數(shù),p為模型的階數(shù),e(n)為模型的殘差,aij為基時間函數(shù)的加權(quán)系數(shù),gj(n)為基時間函數(shù),m為基展開的維數(shù)。
假設(shè)要對長度為N的時間序列y(n)作k步預(yù)測,即使用有限個歷史數(shù)據(jù)y(1),y(2),…,y(N)對第N+k時刻的數(shù)據(jù)y(N+k)作預(yù)測,設(shè)第n時刻的預(yù)測值用y?(n)表示,則第N+k 時刻的預(yù)測數(shù)據(jù)有如下形式如公式(5):
其中,當i≥k時,y?(N+k?i )=y(N+k?i )。
使用文獻[7]所用的前后向估計相結(jié)合的方法估算出系數(shù)aij以后,便可使用公式(4)計算出a?i(N+k)的值,之后利用公式(5)便可計算出第N+k時刻的預(yù)測值y?(N+k)。
在參數(shù)的點估計中,當θ?=θ?(X1,X2,…,Xn)是未知參數(shù)θ的一個估計量時,對于一組樣本值(x1,x2,…,xn)就得到θ的一個估計值θ?=θ?(x1,x2,…,xn)。點估計就是取θ≈θ?,這使得我們對θ的值有了一個明確的數(shù)量概念。但是,點估計值θ?僅僅是未知參數(shù)θ的一個近似值,這種近似值的精確程度或誤差范圍都沒有給出,這是點估計的缺陷,而區(qū)間估計則正好在一定程度上彌補了點估計的這個缺陷[8]。
y(N+k)的第k步預(yù)測由式(5)給出,則第k步預(yù)測的方差由公式(6)給出:
其中如公式(7):
當i>p時,ai(n)=0,σ2為前N時刻的方差。
于是y(N+k)的置信水平為1?α的置信區(qū)間如公式(8):
公式(6)至公式(8)的具體推導(dǎo)過程參見文獻[9]。
為了探討TVAR算法的預(yù)測效果,本文選用某型國產(chǎn)飛機發(fā)動機所采集到的左發(fā)低壓轉(zhuǎn)速NL為預(yù)測對象。選取其中的528個數(shù)據(jù)點,前508個數(shù)據(jù)點作為歷史數(shù)據(jù),后20個數(shù)據(jù)點為待預(yù)測數(shù)據(jù)。模型階數(shù)的選取采用AIC預(yù)報準則[10],TVAR模型選用DCT基時間函數(shù)(Discrete Cosine Transform)[11],基展開維數(shù)為12。
為了更清楚地查看AR模型與TVAR模型的預(yù)測效果,將真實值與預(yù)測值作圖比較。真實的528個數(shù)據(jù)點的波形圖,如圖1所示:
圖1 低壓轉(zhuǎn)速時間序列
由圖1可知,所選取的508個歷史數(shù)據(jù)變化比較大,尤其是在第160個數(shù)據(jù)點和第420個數(shù)據(jù)點時,數(shù)據(jù)下降得比較劇烈,而所需預(yù)測的最后20個數(shù)據(jù)點已經(jīng)趨于平緩。AR模型的預(yù)測結(jié)果,如圖2所示:
(a) Yule-Walker算法
(b)最小二乘與Burg算法圖2 AR模型預(yù)測
AR系數(shù)估計方法包括Yule-Walker算法,最小二乘算法和Burg算法。為了有一個更清晰的比較,將Yule-Walker算法單獨作圖,如圖2(a)所示,從圖中可以看出,使用Yule-Walker算法所預(yù)測的數(shù)據(jù)與真實值存在較大誤差,且圍繞真實值上下波動,并不能體現(xiàn)出后20個點的變化趨勢。圖2(b)為使用Burg算法與最小二乘方法預(yù)測的結(jié)果。從圖中可以看出,最小二乘方法與Burg算法所預(yù)測的數(shù)據(jù)有相似的預(yù)測結(jié)果和相同的變化趨勢,二者的預(yù)測值均圍繞著真實值上下波動,但是預(yù)測的數(shù)據(jù)逐漸發(fā)散,預(yù)測誤差越來越大。由此可見,使用Yule-Walker算法,最小二乘算法和Burg算法等3種方法進行AR模型的系數(shù)估計,所預(yù)測的數(shù)據(jù)并不能很好地反映真實數(shù)據(jù)的變化趨勢,且預(yù)測誤差逐漸增加。
為使用TVAR模型所得到的預(yù)測結(jié)果如圖3所示:
圖3 TVAR模型預(yù)測
從圖中可以看出,TVAR模型的預(yù)測數(shù)據(jù)與真實的低壓轉(zhuǎn)速之間的差別很小,雖然隨著預(yù)測步長的增加,預(yù)測的誤差逐漸增大,但是該模型基本能夠較好地反映真實數(shù)據(jù)的變化趨勢,且預(yù)測誤差也在允許的范圍以內(nèi)。
為了研究預(yù)測值的估計精度與誤差范圍,對第3節(jié)的發(fā)動機低壓轉(zhuǎn)速進行區(qū)間估計。選取α=0.10,即置信水平為90%,查看正態(tài)分布表可知,此時,利用公式(6)至公式(8)計算第k步預(yù)測的真實值y(N+k)的置信區(qū)間,TVAR模型區(qū)間估計的結(jié)果,如圖4所示:
圖4 TVAR模型區(qū)間估計
從圖4可以看出,所預(yù)測的20個真實值全都落在預(yù)測區(qū)間中,然而,隨著預(yù)測步長的增加,預(yù)測的區(qū)間半徑逐漸增大,這是因為由于累積誤差的存在,預(yù)測值與真實值的差距越來越大,為了保證預(yù)測結(jié)果的可靠性,必然得增加預(yù)測區(qū)間的長度,因而預(yù)測的精確度有所降低。
由此可見,對于區(qū)間預(yù)測來說,預(yù)測的可靠度與精確度是相互制約的。在實際應(yīng)用中,常采用一種折中的方案,在使得置信度達到一定要求的前提下,尋找精確度盡可能高的區(qū)間估計。實際上,對于本例來說,由于所預(yù)測的發(fā)動機低壓轉(zhuǎn)速不可能為負值,所以從第3個預(yù)測點開始,預(yù)測下限就已經(jīng)不具有物理意義了。
本文主要研究了TVAR模型在時序預(yù)測方面的應(yīng)用。針對比較常見的預(yù)測類型——點預(yù)測與區(qū)間預(yù)測,分別推導(dǎo)了TVAR預(yù)測模型的公式。通過對某型國產(chǎn)飛機在某次飛行中的發(fā)動機低壓轉(zhuǎn)速的一段數(shù)據(jù),使用TVAR模型與AR模型進行步長為20的點預(yù)測和區(qū)間預(yù)測,結(jié)果表明,對于變化比較大的數(shù)據(jù),AR模型并不能很好地跟蹤信號的變化趨勢,甚至會出現(xiàn)非常大的預(yù)測誤差。而TVAR模型的能夠很好地反映真實數(shù)據(jù)的變化趨勢,且預(yù)測誤差也在允許的范圍以內(nèi)。在給定置信水平下,TVAR預(yù)測區(qū)間能夠包含真實的數(shù)據(jù),因此具有更好的預(yù)測效果。
[1] 李瑞瑩,康銳.基于ARMA模型的故障率預(yù)測方法研究[J].系統(tǒng)工程與電子技術(shù),2008,30(8):1588-1591
[2] 王治華,傅惠民. 廣義時變ARMA序列預(yù)測方法[J]. 航空動力學報,2005,20(5):713-717
[3] 續(xù)秀忠,張志宜,華宏星等.應(yīng)用時變參數(shù)建模方法辨識時變模態(tài)參數(shù)[J].航空學報,2003,24(3):230-233
[4] 朱志宇. 基于高斯粒子濾波器和TVAR模型的語音增強技術(shù)[J].儀器儀表學報,2008,29(9):1903-1907
[5] 熊國良,張龍,陳慧.TVAR在非平穩(wěn)工況轉(zhuǎn)子故障診斷中的應(yīng)用[J].振動、測試與診斷,2007,27(2):108-111
[6] Petre Stoica, Randolph Moses著,吳仁彪,韓萍,馮青,等譯.現(xiàn)代信號譜分析[M].北京,電子工業(yè)出版社,2007
[7] 蘆玉華 ,王仲生,姜洪開.基于改進時變自回歸模型的滾動軸承故障診斷 [J]. 振動與沖擊,2011,30(12):74-77,107
[8] 徐偉,趙選民,師義民,等. 概率論與數(shù)理統(tǒng)計[M]. 西安,西北工業(yè)大學出版社,2005
[9] 王永民,何幼樺,忻莉莉,等. 時變自回歸模型系數(shù)的估計及預(yù)測[J]. 應(yīng)用數(shù)學與計算數(shù)學學報,2007,21(2): 35-41
[10] 楊俊嶺,張長隆,萬建偉. 基于信息量準則的AR模型相關(guān)高斯雜波模擬[J]. 航天電子對抗,2006,22(2):45-48
[11] Kie B.Eom. Analysis of Acoustic Signatures from Moving Vehicles Using Time-Varying Autoregressive models [J]. Multidimensional System and Signal Processing, 1999,10: 357-378
Prediction Research of Non-stationary Data Based on Time-Varying Autoregressive Model
Wang Lina, Jiang Xiangduo, Lu Yuhua
(Experimental Center of Shaanxi Fast Group Company Institute, Xi’an 710119, China)
As the AR(Autoregressive) model has poor prediction effect on non-stationary data, a Time-Varying Autoregressive model is established for timing prediction. Point and interval predictions of the TVAR Model are conducted based on NL data of an aero-engine, and are compared to point prediction of the AR model. The result shows that the TVAR model can reflect the real trend of the data, and the prediction errors are in the allowable range. At a given confidence level, the TVAR prediction interval contains real data, so the TVAR model has better prediction results in the timing projections.
Time Series; Time-Varying Autoregressive Model; Prediction
TP391
A
2014.05.27)
王莉娜(1983-),女,陜西法士特汽車傳動研究院,工程師,碩士,研究方向:機械設(shè)備故障診斷分析,西安,710119
姜相奪(1983-),男,陜西法士特汽車傳動研究院,工程師,學士,研究方向:機械設(shè)備故障診斷分析,西安,710119
蘆玉華(1986-),男,西安華為技術(shù)有限公司,工程師,碩士,研究方向:云計算虛擬化容災(zāi),西安,710075
1007-757X(2014)08-0034-03