吳 婷 蔣陽升 丁 笑 鄭世琦
(1.貴陽職業(yè)技術(shù)學院軌道交通分院,550081,貴陽; 2.西南交通大學交通運輸與物流學院,610031,成都;3.西南交通大學綜合運輸四川省重點實驗室,610031,成都; 4.西南交通大學交通運輸智能化國家地方聯(lián)合工程實驗室,610031,成都∥第一作者,助教)
?
城市軌道交通斷面客流不確定性分析的廣義自回歸條件異方差改進模型*
吳 婷1,2,3,4蔣陽升2,3,4丁 笑2,3,4鄭世琦2,3,4
(1.貴陽職業(yè)技術(shù)學院軌道交通分院,550081,貴陽; 2.西南交通大學交通運輸與物流學院,610031,成都;3.西南交通大學綜合運輸四川省重點實驗室,610031,成都; 4.西南交通大學交通運輸智能化國家地方聯(lián)合工程實驗室,610031,成都∥第一作者,助教)
對比分析指出,城市軌道交通線路斷面客流量變化與道路交通斷面客流量變化具有相似性,但城市軌道交通線路斷面客流時間序列具備特有的尖峰厚尾特性,其變化的敏感程度依賴時空條件,常用于道路領(lǐng)域的廣義自回歸條件異方差(GARCH)模型無法直接用于城市軌道交通領(lǐng)域。基于此,引入廣義誤差分布(GED)虛變量,構(gòu)建改進的GARCH模型,并基于成都地鐵1號線下行斷面客流時間序列數(shù)據(jù),借助EViews和Matlab軟件對改進前后的模型效果進行實證對比分析。結(jié)果表明,改進后的虛變量GARCH模型比原始的GARCH模型具有更好的適用性。
城市軌道交通; 斷面客流; 不確定性; 虛變量; GARCH模型
First-author′s address Rail Transportation Branch,Guiyang Vocational and Technical College,550081,Guiyang,China
城市軌道交通線路斷面客流的預測是軌道交通編制行車工作計劃等運營決策的基礎(chǔ),但其預測精度常常難以保證。造成預測偏差的主要原因在于斷面客流具有時變性,且不同斷面對外部因素影響具有不同的敏感性,即客流變化的敏感程度具有強時空條件的依賴性[1]。因此,為提高線路斷面客流的預測精度,不僅需要掌握城市軌道交通線路斷面客流的平穩(wěn)狀態(tài),即其一階數(shù)字特征,而且更需要掌握斷面客流的不確定性狀態(tài),即其二階數(shù)字特征。它反映了斷面客流時間序列中不可預見的組成成分對客流產(chǎn)生的影響,用來衡量統(tǒng)計時段內(nèi)斷面客流平均狀態(tài)的波動性。對于一階數(shù)字特征分析,文獻[2-6]的工作已經(jīng)比較完善;對于二階數(shù)字特征的分析主要是定性研究[7]。經(jīng)檢索,國內(nèi)外還沒有專門針對城市軌道線路斷面客流不確定性狀態(tài)的量化建模分析。
城市軌道交通線路斷面客流和道路交通流具有相似性,軌道交通各斷面的客流運行情況類似于道路各個路段行駛的車流,因此探討道路交通領(lǐng)域斷面客流的不確定性分析的研究現(xiàn)狀與趨勢,以發(fā)現(xiàn)具有借鑒意義的分析方法,是一種有效的解決思路。
在道路交通領(lǐng)域,文獻[1]使用一階馬爾科夫鏈闡述交通流不確定性變化規(guī)律,基于隨機波動理論(SV)建立速度的不確定性模型。文獻[8]將自回歸滑動平均(ARMA)模型和廣義自回歸條件異方差(GARCH)模型結(jié)合,預測道路車輛行程時間及其不確定性,發(fā)現(xiàn)此模型對于嚴重擁擠路段,預測性能較優(yōu)。文獻[9]發(fā)現(xiàn)運用ARIMA(自回歸積分滑動平均)模型與ARCH(自回歸條件異方差)模型組合預測交通流不確定性性能,要優(yōu)于標準的GARCH模型,其中,ARIMA模型預測高速公路斷面交通流的平均狀態(tài),ARCH模型預測交通流的方差。文獻[10]通過使用卡爾曼濾波方法實時處理GARCH模型,得到預測交通流量不確定性的置信區(qū)間,用同樣方法實時處理SARIMA(季節(jié)性差分自回歸移動平均)模型得到交通流量和速度的平均預測值。此外,文獻[11]通過運用似不相關(guān)回歸(SURE)模型,分別對出行者行程時間和出行者行程時間分布的標準差進行預測后,指出需對不確定性性能作進一步研究。
上述研究都是基于GARCH模型構(gòu)建斷面交通流狀態(tài)不確定性模型,并在此基礎(chǔ)上進行流量預測。這是因為GARCH模型能把序列方差隨時間的變化情況呈現(xiàn)出來。但GARCH模型在城市軌道交通線路斷面客流不確定性分析中不能直接應用,因為城市軌道交通斷面客流與道路交通斷面客流存在著差異,具體表現(xiàn)為:①城市軌道交通更關(guān)注早晚高峰和平峰時段的客流波動情況,以制定不同時段和線路區(qū)間的列車發(fā)車間隔等運營管理策略,城市軌道交通領(lǐng)域的模型需要能夠刻畫斷面客流在時間(所有數(shù)據(jù)集合下的不同子集)和空間(不同斷面)方面的敏感度;②城市軌道交通線路斷面客流具有區(qū)別于道路斷面客流的“尖峰厚尾”特征,文獻[12]也指出采用廣義誤差分布(GED)比正態(tài)分布更符合實際情況,更能提高該模型的擬合效果和預測能力。
基于上述分析,本文擬建立基于GED分布的虛變量GARCH模型,以描述軌道交通線路斷面客流的不確定性波動特征。
[12],GARCH模型形式如下:
yt=xtβ+εt
(1)
(2)
式(1)、(2)中:
yt——一個帶有誤差項的外生變量函數(shù)的均值方程;
xt——外生變量;
α、β——參數(shù)值;
εt——普通最小二乘法殘差;
ht——εt的條件方差;
ω——常數(shù)項(均值);
p,q——模型的階數(shù)。
參考文獻[13],利用廣義誤差分布對GARCH模型進行建模,其概率密度為:
(3)
式中:
x——隨機變量;
v——自由度,也是GED分布參數(shù);
Γ(?)——Gama函數(shù);
λ——尾部厚度參數(shù),且
(4)
該峰度計算公式為:
(5)
式中:
E(X)——樣本均值。
由式(5)可以看出,GED分布的形狀(即峰度)由尾部厚度參數(shù)λ決定,其值的大小直接影響GED分布的尾部厚度。所以,廣義誤差分布是一種綜合的、復雜的分布,能較好地描述時間序列具有非正態(tài)分布的“尖峰厚尾”特征[13]。
2.1 虛變量的定義
本文將模型中能夠被賦予具體數(shù)值的變量稱為定量變量;不能賦予具體數(shù)值的變量稱為定性變量。直接研究定性變量的影響具有一定的難度,因此本文通過設置虛變量將定性變量量化處理,使其和定量變量一樣在模型中得以應用。
2.2 虛變量的設置
通常將虛變量取值為0和1,用D表示。D取值為1(0)時,表示該變量具有(不具有)某種屬性。
2.3 虛變量GARCH模型
(6)
(7)
式中:
ai——q階移動平均模型的系數(shù);
bj——p階自回歸模型的系數(shù);
ωi——反映序列波動的平均水平;
αi——回報系數(shù),通過均值方程中誤差項平方的滯后來反映前期得到的波動性信息;
βi——滯后系數(shù),反映方差對外部沖擊的記憶性。
2.4 基于GED分布的虛變量GARCH模型的運用流程
運用基于GED分布的虛變量GARCH模型進行城市軌道交通線路斷面客流不確定性分析的步驟如下:
(1) 運用EViews軟件計算各斷面對數(shù)差分化的相對客流增長序列的基本統(tǒng)計量,驗證該序列的“尖峰厚尾”特性,明確選取GED分布作為研究基礎(chǔ)的合理性。
(2) 識別時間序列的平穩(wěn)性和自相關(guān)性。如果序列的隨機過程是非平穩(wěn)的,則無法準確地反映該序列的過去和未來。自相關(guān)性檢驗主要是用來衡量不同序列隨時間變化時的相互關(guān)系,通過觀察序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)進行判斷。
(3) 模型類型和階數(shù)的識別,即確認相應ARMA模型中階數(shù)p和q的取值。
(4) 運用對數(shù)極大似然估計得到模型中所有參數(shù)的估計值,并采用對數(shù)似然準則(Log Likelihood準則)、赤池信息準則(AIC準則)和施瓦茨準則(SC準則)進行判斷,當模型的對數(shù)似然值越大,同時AIC值和SC值越小時,說明模型估計越精確。具體技術(shù)流程如圖1所示。
圖1 技術(shù)流程圖
3.1 線路斷面客流增長率基本特征分析
本文隨機選取2013年3月整月平穩(wěn)工作日(周二至周四)全日數(shù)據(jù)對成都市地鐵1號線下行斷面客流進行分析。從地鐵開始運營6:30起,每1 h提取1次數(shù)據(jù),直到當晚23:30停止運營時止。為了對早晚高峰時段進行分析,選取7:00—9:00為早高峰時段,17:00—19:00為晚高峰時段,其余為平峰。本文所指的斷面客流為成都市地鐵1號線16個站間的15個斷面客流。為便于分析說明,1號線第一個斷面升仙湖—火車北站簡寫為S1,第二個斷面簡寫為S2,以此類推。
因為GARCH模型只能運用于平穩(wěn)數(shù)據(jù),而客流具有明顯的高低谷之分,所以本文使用對數(shù)差分化的相對客流增長作為研究對象[1]。采取對數(shù)差分法的對數(shù)變換不僅能將增長曲線轉(zhuǎn)化為線性趨勢,而且進一步消除了序列的非平穩(wěn)性。令Ri,t表示第i斷面第t時間段的客流量,則第i斷面第t時間段的客流對數(shù)增長率Yi,t為Yi,t=lnRi,t-lnRi,t-1。
運用軟件計算斷面客流增長率的基本統(tǒng)計量,結(jié)果見表1。表中Jarque-Bera表示一種正態(tài)性檢驗,Prob表示伴隨概率。
由表1可知:從偏度看,所有客流的偏度系數(shù)均不為零,與正態(tài)分布相比具有明顯的厚尾性;峰度方面,客流的峰度最小值為9.053 7(S15),大于3,相較于正態(tài)分布均具有偏尖峰性,說明所有斷面客流較正態(tài)分布偏離程度更大,出現(xiàn)大起大落的情況比較嚴重。此外,Jarque-Bera統(tǒng)計量的伴隨概率均為0,在95%的置信水平下,拒絕該時間序列為正態(tài)分布的假設。
表1 斷面客流增長率基本統(tǒng)計量
3.2 斷面客流增長率序列的基礎(chǔ)性檢驗
3.2.1 平穩(wěn)性檢驗
單位根(ADF)檢驗結(jié)果如圖2和圖3所示。表中縱坐標表示在不同顯著水平下的臨界值,橫坐標為各斷面的檢驗值。
圖2 各站斷面客流原序列ADF檢驗
圖3 各站斷面客流差分序列ADF檢驗
從圖2和圖3可以看出:各站斷面客流差分序列的ADF檢驗統(tǒng)計量均小于對應1%、5%、10%的臨界值,說明其為平穩(wěn)序列。為便于后續(xù)分析,將所有斷面客流均轉(zhuǎn)化為其對數(shù)差分序列來進行研究。
3.2.2 自相關(guān)檢驗
表2為各斷面客流增長率在不同滯后階數(shù)的自相關(guān)性檢驗結(jié)果表。由表2可知,15個斷面客流的增長率序列在自由度為10、15、20時的Q統(tǒng)計量均大于相應的臨界值18.307、24.996、31.410。說明在95%顯著水平下,拒絕該客流序列沒有自相關(guān)性的原假設,存在顯著的序列自相關(guān)性。
表2 斷面客流增長率自相關(guān)性檢驗結(jié)果
3.3 虛變量GARCH模型實證結(jié)果分析
通過自相關(guān)檢驗中觀察各斷面客流的自相關(guān)(ACF)可知,各斷面滿足低階模型,并經(jīng)反復試算和對比所得參數(shù),最終確定均值模型如表3所列。
表3 各斷面客流和換乘客流對數(shù)增長率均值模型
續(xù)表3
運用軟件Matlab編程實現(xiàn)參數(shù)估計和模型有效性檢驗,結(jié)果如表4、5、6所示。
表4 基于GED分布的虛變量GARCH(1,1)均值方程模型估計結(jié)果
表5 基于GED分布的虛變量GARCH(1,1)方差方程模型估計結(jié)果
表6 虛變量GARCH(1,1)擬合結(jié)果Ljung-Box Q檢驗結(jié)果
由表6可知,所有斷面在不同階數(shù)的統(tǒng)計值均小于對應的臨界值,且相應伴隨概率均大于0.05,表明經(jīng)擬合后的殘差序列不具有相關(guān)性,另外方差方程中ωi、αi和βi值大于0,αi+βi<1,滿足模型的平穩(wěn)性要求,說明該模型正確。
為了說明該模型的優(yōu)越性,本文將原始GARCH模型與虛變量GARCH模型進行對比,鑒于論文篇幅的限制,在此只列出模型評價參數(shù)AIC、SC和對數(shù)似然值,而原始GARCH模型的擬合結(jié)果可參考文獻[14],結(jié)果見表7。
一般對數(shù)似然值越大,模型越精確,而AIC值和SC值則越小越好。從表7可知:所有斷面客流基本是虛變量GARCH模型Log Likelihood值最大,AIC值和SC值最小(僅斷面4的原始GARCH模型的AIC值和SC較小)。雖然在斷面4中,其指標不是最優(yōu),但是其值大小和其他模型相差不大,而該斷面的對數(shù)似然值卻遠大于另兩個模型。所以,可以認定虛變量GARCH模型具有更好的適用性。
表7 GARCH模型和虛變量GARCH模型指標對比
本文建立了基于GED分布的虛變量GARCH模型用于描述城市軌道交通線路早晚高峰和平峰時段不同斷面的客流不確定性波動?;诔啥嫉罔F1號線下行斷面客流數(shù)據(jù)的實證分析表明:改進后的模型能夠更加適應描述城市軌道交通線路斷面客流的尖峰厚尾特性和依賴時空條件的客流波動敏感性。本文研究為今后繼續(xù)討論不同因素對不同斷面的影響程度奠定了基礎(chǔ)。
參考文獻
[1] TSEKERIS T,STATHOPOULOS A.Short-term prediction of urban traffic variability:Stochastic volatility modeling approach [J].Journal of Transportation Engineering,2010(7):606-613.
[2] 羅佳.城市軌道交通換乘站點客流敏感性分析[D].成都:西南交通大學,2014.
[3] 孫松偉.城市軌道交通客流預測模型及方法研究[D].成都:西南交通大學,2008.
[4] 楊冉.城市軌道交通客流預測及運營調(diào)度方法研究[D].北京:北京交通大學,2010.
[5] 袁坤.城際軌道交通客流預測方法研究[D].西安:長安大學,2009.
[6] 吳倩.城市軌道交通客流預測模型研究[D].成都:西南交通大學,2007.
[7] 郭平.城市軌道交通客流特征及預測相關(guān)問題[J].城市軌道交通研究,2010(1):58-62.
[8] SOHN K,KIM D.Statistical model for forecasting link travel time variability [J].Journal of Transportation Engineering,2009,135(7):440-453.
[9] TSEKERIS T,STATHOPOULOS A.Real-time traffic recasting in urban arterial networks [J].Transportation Research Record:Journal of the Transportation Research Board,2006(1964):146-156.
[10] GUO J,WILLIAM B M.Real-time short-term traffic speed level forecasting and uncertainty quantification using layered kalman filters[J].Transportation Research Record,2010(2175):28-37.
[11] MARTCHOUK M,MANNERING F,BULLOCK D.Analysis of freeway travel time variability using Bluetooth detection [J].Journal of Transportation Engineering,2010,137(10):697-704.
[12] 高鐵梅.計量經(jīng)濟分析方法與建模[M].北京:清華大學出版社,2009.
[13] 丁祖琴.基于GED分布GARCH模型的Bayes統(tǒng)計分析[D].上海:華東師范大學,2008.
[14] 吳婷.城市軌道交通斷面客流不確定性研究[D].成都:西南交通大學,2015.
歡迎訂閱《城市軌道交通研究》 服務熱線 021—51030704
Improved GARCH Model in Urban Rail Transit Based on Uncertainty Analysis of Section Passenger Flow
WU Ting, JIANG Yangsheng, DING Xiao, ZHENG Shiqi
The variation of section passenger flow in urban rail transit is similar to that in road traffic through a comparative analysis. But the time series data of the former has peculiar characteristics of high kurtosis and fat tail, its sensitivity of variation depends on space-time condition.therefore,the GARCH model which is usually used in road traffic cannot be implemented directly in urban rail transit.For this reason,dummy variables are introduced to construct an improved GARCH model in this paper.Furthermore,based on the time series data of the downstream section passenger flow on Chengdu metro Line 1,the effects of models before and after improvement are comparative analyzed by using EViews and Matlab.The results show that the improved GARCH model with dummy variables has better applicability than that of the original GARCH model.
urban rail transit; section passenger flow; uncertainty; dummy variable; GARCH (generalized autoregressive conditional heteroskedasticity) model
*國家自然科學基金項目(51108391,71402149)
U 293.13
10.16037/j.1007-869x.2017.05.007
2016-06-24)