沈碩
摘要:時間序列一般會在生產(chǎn)和科學領(lǐng)域當中進行使用。指的是一系列時刻之下獲取到的離散數(shù)字所形成的集合。時間序列可以借助系統(tǒng)當中提供的時間序列數(shù)據(jù),借助參數(shù)估計和曲線擬合法分析之后的趨勢。本文主要介紹了移動平均(MA)、自回歸(AR)等多種模模型,得到預(yù)估參數(shù),為實際問題提供解決思維和方案。
關(guān)鍵詞:道路工程;三維線性;事故率
1 引言
時間序列當中的數(shù)據(jù)具有一定的復(fù)雜性,例如經(jīng)濟領(lǐng)域當中的年產(chǎn)值、產(chǎn)品的市場銷量、產(chǎn)品的價格變動、股票的實時變化、地區(qū)的人口流動、國民收入情況等都能夠形成時間序列,除此之外,鐵路的客流量、自然環(huán)境當中的月降水量、河流數(shù)量、太陽黑子數(shù)等等,也都是以時間序列的形式進行排列。
當前在經(jīng)濟、社會、科學等多個領(lǐng)域當中,依然有很多的時間序列具有缺陷,急需改正和彌補。科學家們在對這些時間序列進行分析的過程當中,也希望能夠掌握相關(guān)現(xiàn)象的浮動規(guī)律,從動態(tài)層面更加了解現(xiàn)象和其他現(xiàn)象之間的聯(lián)系,提高獲取數(shù)據(jù)的準確性,將得到的信息和數(shù)據(jù)應(yīng)用到研究當中,通過預(yù)測來掌握某一現(xiàn)象的未來發(fā)展趨勢。
恩格爾之后對于時間序列的研究分析一直持續(xù)了下來。直到目前,時間序列分析已經(jīng)有了相對成熟、完善的理論架構(gòu),并且隨著互聯(lián)網(wǎng)時代的不斷發(fā)展,這一架構(gòu)逐漸和當代信息技術(shù)、互聯(lián)網(wǎng)技術(shù)相融合,提高分析手段的技術(shù)性。但是這些高技術(shù)分析策略,比如神經(jīng)網(wǎng)絡(luò)等,所涉及的理論知識繁雜,并且當前的應(yīng)用范圍非常小,需要走過很長的發(fā)展道路。所以本文在分析過程當中,僅以基本的時間訓(xùn)練理論為基礎(chǔ),以研究簡單易行的解決方案為最終目標。
2 時間序列的介紹
2.1 何為時間序列
時間序列顧名思義是以時間為排列順序,其變化情況受到時間的影響,在科學、社會、經(jīng)濟等各個領(lǐng)域當中應(yīng)用范圍較廣。在長時間的發(fā)展之后,時間序列當中往往會存在非常龐大的數(shù)據(jù)量。而如何針對這些數(shù)據(jù)展開統(tǒng)計分析,獲取到有價值、有意義的信息,是當前大多用戶都比較關(guān)心的一個問題。
例如針對經(jīng)濟運行發(fā)展過程,假設(shè)運行開始時間為t0,那么可以根據(jù)時間變化將整個過程劃分為Y1,Y2,∧,YT,YT+1,∧,YT+n多個變量展開描述。其中一個隨機變量序列代表一個隨機過程。正常情況下,時間序列數(shù)據(jù)在隨機過程當中表示為Y1,…,YT,指的是時間序列的一種實現(xiàn)方式。對于時間序列展開分析,其實就是通過隨機過程實現(xiàn)掌握相關(guān)的發(fā)展規(guī)律。
從系統(tǒng)意義上看,時間序列就是某一系統(tǒng)在不同時間(地點、條件等)的響應(yīng)。這個定義從系統(tǒng)運行的觀點出發(fā),指出時間序列是按一定順序排列而成的。這里的“一定順序”即可以是時間順序,也可以是具有各種不同意義的物理量,如代表溫度,速度或其它單調(diào)遞增的取值的物理量。
可見,時間序列只強調(diào)順序的重要性,而并非強調(diào)必須按時間序列排序,而且時間序列是所研究系統(tǒng)的歷史行為的客觀記錄。因而它包含著系統(tǒng)結(jié)構(gòu)特征(如周期波動的周期、振幅、趨勢的種類等);揭示其運行規(guī)律,進而用以預(yù)測、控制其未來行為;修正和重新設(shè)計系統(tǒng)(如改變其周期、參數(shù)),使之按照新的結(jié)構(gòu)運行。
2.2 時間序列的研究概況
時間序列分析包含的范圍非常廣泛,并且研究內(nèi)容、研究深度涉及各個領(lǐng)域。對時間序列開展分析主要有以下用途:①對系統(tǒng)整體的闡述。在開展系統(tǒng)的觀測試驗中,采用數(shù)值分析方法對采集到的數(shù)據(jù)進行擬合,實現(xiàn)對系統(tǒng)的闡述。②對系統(tǒng)整體的研判。在開展系統(tǒng)的觀測試驗中,若發(fā)現(xiàn)存在兩個及以上的變量因子時,可以通過因子在一個時間序列中的發(fā)展過程去表述另一個印在時間序列中的發(fā)展變化。③對系統(tǒng)未來變化的預(yù)估。一般而言,想要實現(xiàn)對系統(tǒng)的精準預(yù)測,要建立合理且有效的模型,多采用ARMA模型。④提供決策基礎(chǔ)。通過建立有效的時間序列模型,再調(diào)整變量使得系統(tǒng)整體保持在一定水平線上,若發(fā)現(xiàn)系統(tǒng)整體要偏離水平線時,就要考慮對系統(tǒng)整體進行控制。上世紀初期,現(xiàn)代統(tǒng)計學的蓬勃發(fā)展使得時間序列的研究內(nèi)容進入學者的研究視野之內(nèi),從這一時期直到上世界70年代末期,針對這一問題的研究一直被線性假設(shè)這一研究思路所把控,圍繞這一問題所建立的模型均為線性模型,這一時期的時間序列均為線性時間序列。針對這一類時間序列的研究,截止目前已經(jīng)取得重大突破和進展,成果廣泛。然而,線性時間序列僅僅是時間序列的一類,并且屬于最簡單的一種類型。雖然如此,在半個世紀以來,整個領(lǐng)域研究的最為深入、最為徹底的也是有限參數(shù)的線性時間序列模型,例如眾所周知的LARMA模型。并且,通過實踐驗證,表這類時間序列模型具有一定的可靠度。然而,隨著科學技術(shù)的發(fā)展和研究深度的不斷延伸,線性時間序列模型的缺點愈發(fā)嚴重,應(yīng)用范圍有限,自適應(yīng)性不足。例如,在這類模型中,無法產(chǎn)生具有非對稱周期特征的數(shù)據(jù),產(chǎn)生的數(shù)據(jù)一般是可逆的。在實際使用中,采用這類模型開展研究工作時,對整個系統(tǒng)的預(yù)測并不是基于時間序列當前特征的,預(yù)測優(yōu)良也就無法得到保證。
3 基本ARMA模型
時間序列分析和模型建立過程當中涉及到的主要對象為觀測數(shù)據(jù)系列,在建立模型的過程當中,會在掌握數(shù)據(jù)之間關(guān)聯(lián)性的前提下,借助回歸分析法制定當前時刻和過去時刻之間存在的具體聯(lián)系的模型。
時間序列分析法于1976年正式誕生,最初的基本模型主要有自回歸模型、移動平均模型、以及兩種模型混合的共三種模型,這三個模型都是借助歷史數(shù)據(jù)來展開線性預(yù)測。
在確定隨機成分并建立時序模型的過程當中,一般會使用到的方法為時序建模分析法,
使用該模型應(yīng)用到實際的當中有很多便利之處。該模型是線性模型,所以只需要根據(jù)較少數(shù)量的參數(shù)就能夠獲取到具體的模型,處理步驟較為簡單;并且該模型有一定的理譜密度,和所有的連續(xù)譜密度差距都不大;并且該模型分析數(shù)據(jù)結(jié)構(gòu)和內(nèi)在性質(zhì)更為容易,能夠保證在線性最小方差意義環(huán)境當中所提供的預(yù)報和控制是最合適的。
ARMA模型又分為以下幾種形式:
3.1 自回歸模型(AR:Auto-regressive)
AR(p)模型為p階自回歸,針對該模型進行相關(guān)因素影響作用分析時,只需要使用到時間序列變量當中歷史觀測值這一類數(shù)據(jù)就能夠得到明確的分析結(jié)果,其他條件并不會對分析產(chǎn)生干擾,比如模型變量相互獨立假,除此之外模型還能夠有效解決一般回歸預(yù)測方程當中的自變量選擇、多重共線性問題,表示方式如下:
此時間序列是一個自回歸訓(xùn)練,并且為p階自回歸模型,即AR(p),其中的 具有自回歸特性,為模型當中的待預(yù)測參數(shù),是一個以 隨機項為服從0均值, 方差為正態(tài)分布的白噪聲序列,和 無關(guān)聯(lián)。
3.2 移動平均模型(MA:Moving-Average)
MA(q)模型為q階移動平均模型,借助不同時期的干擾和預(yù)測誤差產(chǎn)生的組合進行預(yù)測,序列當中波動較大的隨機變化對時間序列方向不會產(chǎn)生干擾,具體如下表示:
其具體表示為一個移動平均序列和q階移動平均模型,即MA(q)。其中的 是待預(yù)測的移動平均參數(shù),是一個以 隨機項為服從0均值, 方差為正態(tài)分布的白噪聲序列。
3.3 混合模型(ARMA:Auto-regressive Moving-Average)
ARMA(p,4)具有自回歸性和移動平均性,如果時間序列 是前期值、當前數(shù)值、前期隨機干擾綜合產(chǎn)生的線性函數(shù),那么該模型就是將前面兩種模型進行混合所形成的;其中AR表示自回歸,p表示回歸項;MA表示移動平均,q表示移動平均數(shù),所以該模型具體表現(xiàn)形式為:
此模型當中的時間序列具有自回歸移動平均性,模型以(p,q)階進行建立,即ARMA(p,q)。其中的 具有自回歸性, 具有移動平均性,是模型當中的待預(yù)測參數(shù)。整個序列是以 隨機項為服從0均值, 方差為正態(tài)分布的白噪聲序列。如果q為0,則是AR(p)模型;p為0則是MA(q)模型。
4時間序列模型建立步驟
ARMA模型Box-Jenkins方法為理論基礎(chǔ),建立過程需要反復(fù)執(zhí)行的步驟為:①參數(shù)估計;②假設(shè)檢驗;③模型識別。反復(fù)執(zhí)行這三個步驟,并且通過假設(shè)檢驗來獲取模型當中的時間序列。
其中使用的Box-Jenkins方法理論步驟分為:
(1)平穩(wěn)化
可以將對數(shù)變換和差分變換兩種方法進行綜合使用,令自相關(guān)函數(shù)當中的指數(shù)有所衰減,保證模型的平穩(wěn)性。
(2)識別、估計模型。
根據(jù)上文可知,模型識別過程需要遵守一定的標準,在ACF自相關(guān)、PACF偏自相關(guān)形狀指導(dǎo)下,獲取模型的p、q值,過程當中比較常用的方法為最小二乘法。因為能夠完成此項工作的計量軟件類型較多,所以本文不針對其中的估計方法進行詳細敘述。
(3)診斷
診斷是為了了解被估測模型當中是否為白噪聲殘差序列,如果是則表示該模型刻畫時間序列的準確性較高,如果不是,就需要回到第二個步驟進行重新估算,得到新的模型。診斷是必不可缺的環(huán)節(jié),因為這個過程能夠?qū)r間序列ARMA(p,q)過程、樣本自相關(guān)函數(shù)和偏自相關(guān)函數(shù)識別提供幫助,而且如果p、q都不為0,整個識別過程具有很強的復(fù)雜性,識別過程并不容易,需要借助豐富的技巧和經(jīng)驗推動識別順利進行。
(4)預(yù)測
通過診斷之后得到的模型能夠進行預(yù)測應(yīng)用。
5 ARMA-GJR-M模型參數(shù)估計
對上述模型,記 , , , , , , , , ,那么 為模型ARMA(m,s)-GJR(p,q)-M(k)待估參數(shù)集。
為了得到參數(shù)的后驗密度分布,可以引用以下定理。
ARMA-GJR-M模型的均值方程可寫成如下形式:
這里 對所有i>p成立, 對所有的i>q成立。
構(gòu)建參數(shù)θ的后驗密度函數(shù)為 ,那么在給定ε0的情況下,模型的似然函數(shù)為
其中
參考文獻
[1]許龍,劉志輝,姚俊強,魏歡歡,張圓.基于多變量時間序列CAR模型研究[J].中國農(nóng)村水利水電,2015(06):81-85+90.
[2]陸嘉佳.多變量時間序列模型的參數(shù)估計及其實證檢驗[D].華東師范大學,2008.
[3]呂忠偉,秦建國.多變量時間序列模型識別方法[J].統(tǒng)計與決策,2007(02):129-131.
[4]艾書超.單變量時間序列建模與預(yù)測研究[D].武漢理工大學,2005.
[5]劉麗蘭.時間序列分析在振動系統(tǒng)時變參數(shù)辨識中的應(yīng)用[D].西安理工大學,2005.