胡小敏, 賀園園
(西安交通工程學院,西安 710300)
基于組合模型的鐵路客運量預測
胡小敏, 賀園園
(西安交通工程學院,西安 710300)
為了提高鐵路客運量的預測精度,針對單一鐵路客運量預測模型以及傳統(tǒng)組合預測模型的缺陷,設計了基于組合模型(ARIMA-LSSVM)的鐵路客運量預測方法,采用ARIMA對鐵路客運量的周期性變化特點進行建模預測,從整體上把握鐵路客運量的變化特點,采用LSSVM對鐵路客運量的隨機性變化特點進行預測,采用具體鐵路客運量預測實例對性能進行測試和分析。結(jié)果表明,ARIMA-LSSVM可以準確、全面描述鐵路客運量的變化特點,提高了鐵路客運量的預測準確性,預測結(jié)果可以為鐵路管理者提供有價值信息。
鐵路客運量; 組合預測模型; 最小二乘支持向量機; 自回歸移動平均模型
隨著我國交通事業(yè)的不斷發(fā)展,鐵路客運量不斷增加,鐵路客運量預測結(jié)果可以指導鐵路企業(yè)和管理進制定相應的措施,對于提高經(jīng)營、管理水平具有重要的意義[1]。鐵路客運量受到許多因素影響,如經(jīng)濟、政策、人口數(shù)量等,這些因素之間又相互影響,導致鐵路客運量變化十分復雜,設計性能優(yōu)異的鐵路客運量預測模型成為了鐵路研究領域的一個重要方向[2]。
鐵路客運量具有隨機性、周期性變化特點,而且非平穩(wěn)性相當明顯,難以建立精確的數(shù)學模型[3],當前常根據(jù)鐵路客運量的歷史數(shù)據(jù)進行建模,歷史數(shù)據(jù)隱藏一定變化特征,可以從中發(fā)現(xiàn)鐵路客運量的變化規(guī)律[4]。當前鐵路客運量預測模型主要分為兩類:線性模型和非線性模型[5],線性模型主要有:時間序列方法、回歸分析法[6,7],它們認為鐵路客運量是一種線性的變化趨勢,待確定參數(shù)少,易實現(xiàn),建模效率高,但鐵路客運量不簡單是一種線性變化趨趨勢,同時還具有非線性變化趨勢,因此線性模型的鐵路客運量預測精度低,預測結(jié)果的可信度低,在實際應用中的范圍受限[8]。非線性模型主要有神經(jīng)網(wǎng)絡和支持向量機[9,10],可以對鐵路客運量的非線性變化特點進行建模,但無法對鐵路客運量的線性變化特點進行預測,因此預測結(jié)果也不太可靠。針對單一模型存在的不足,有學者提出了基于組合模型的鐵路客運量預測方法[11,2],如灰色模型和線性回歸、線性回歸和馬爾可夫模型之間的組合,不同模型可以提供更多的鐵路客運量的信息,提高了鐵路客運量的預測效果,但組合模型到底如何進行組合,當前沒有統(tǒng)一理論指導,鐵路客運量的預測結(jié)果有待進一步改善。
自回歸移動平均模型(ARIMA)模型融合了時間序列分析和回歸分析的優(yōu)點,但無法描述非線性數(shù)據(jù)的信息,最小二乘支持向量機(LSSVM)具有良好的非線性擬合能力,針對鐵路客運量的線性和非線性變化特點,提出基于ARIMA-LSSVM的鐵路客運量組合預測模型,并通過具體實驗驗證ARIMA-LSSVM的有效性和可行性。
ARIMA模型是差分運算和ARMA模型的結(jié)合,對于含有非季節(jié)性的時間序列進行建模,可使用ARIMA(p,d,q)模型,可以通過適當?shù)膁階差分運算使序列平穩(wěn),一般形式為式(1)。
(1)
式中:{yt}為平穩(wěn)時間序列;{εt}為白噪聲序列:φi,θj(i=1,2,…,p;j=1,2,…,q)分別是{yt}、{εt}的參數(shù);p為自回歸階數(shù),q為移動平均階數(shù)。
對于訓練樣本集{(xi,yi)},i=1,2,…n,xi∈Rn,yi∈R,xi和yi分別表示樣本輸入和輸出,通過非線性映射函數(shù)φ(·)將樣本映射到高維特征空間,在高維特征空間進行線性回歸,如式(2)。
f(x)=wTφ(x)+b
(2)
式中,ω為權(quán)值向量,b為偏置量。
根據(jù)結(jié)構(gòu)風險最小化原則,式(2)問題求解可以變?yōu)槭?3)。
s.t.yi-wTφ(x)+b=ei
(3)
式中,γ為正規(guī)則化參數(shù);ei為實際值與回歸結(jié)果的誤差。
通過引入拉格朗日乘子將上述約束優(yōu)化問題轉(zhuǎn)變對偶空間優(yōu)化問題,得到式(4)。
(4)
wφ(xi)+b+ξi-yi=0
(5)
根據(jù)Mercer條件,核函數(shù)定義K(xi,xj)=φ(xi)Tφ(xj),LSSVM回歸模型為式(6)。
(6)
選擇RBF函數(shù)作為LSSVM核函數(shù),其定義為式(7)。
(7)
式中,σ為寬度參婁。
最后LSSVM回歸模型為式(8)。
(8)
鐵路客運量受到多種因素影響,具有隨機性、非平穩(wěn)性、周期性等變化特點,單一ARIMA或者LSSVM無法建立高精度的鐵路客運量預測模型。針對ARIMA和LSSVM的缺陷,結(jié)合它們線性和非線性預測優(yōu)點,將它們組合在一起應用于鐵路客運量預測中。ARIMA-LSSVM的鐵路客運量預測原理為:采用ARIMA對鐵路客運量進行建模,描述鐵路客運量的周期性變化特點,然后LSSVM對鐵路客運量進行建模,反映鐵路客運量的隨機性變化特點,最后通過神經(jīng)網(wǎng)絡確定兩者權(quán)值,對它們結(jié)果進行加權(quán)組合得到鐵路客運量的最終測結(jié)果,工作流程如圖1所示。
圖1 ARIMA-SVM的鐵路客運量預測流程
為了測試ARIMA-LSSVM鐵路客運量預測模型的性能,選擇1985~2016年的全國鐵路客運量數(shù)據(jù)作為實驗對象,選擇后20個數(shù)據(jù)作為測試樣本,其它數(shù)據(jù)作為訓練樣本,如圖2所示。
圖2 鐵路客運量數(shù)據(jù)
從圖2可知,鐵路客運量數(shù)據(jù)變化范圍大,對鐵路客運量建模產(chǎn)生不利影響,為此將其歸一化到[0 1]區(qū)間,具體為式(9)。
(9)
式中,x為原始數(shù)據(jù),xmax和xmin為最大和最小的鐵路客運量[14]。
4.2.1 ARIMA模型參數(shù)估計
鐵路客運量的原始自相關函數(shù)(ACF)和偏相關函數(shù)(PACF)如圖3所示,從圖3可以發(fā)現(xiàn),鐵路客運量數(shù)據(jù)之間的相關性很高,需要進行差分處理。1階差分的ACF和PACF,如圖4所示。
圖3 鐵路客運量的原始ACF和PACF
圖4 1階差分后ACF和PACF
1階差分后,鐵路客運量數(shù)比較平穩(wěn),即ARIMA的參數(shù)d=1,最終確定鐵路客運量的ARIMA(3,1,2)。
4.2.2 ARIMA的鐵路客運量預測結(jié)果
采用ARIMA(3,1,2)對鐵路客運量的訓練樣本進行建模,并對測試樣本進行預測,鐵路客運量的預測結(jié)果,如圖5所示。
圖5 ARIMA的鐵路客運量預測結(jié)果
從圖5可以看出,ARIMA可以整上對鐵路客運量的變化趨勢進行描述,但預測偏差比較大,鐵路客運量的有待進一步改善。
采用LSSVM對鐵路客運量的訓練樣本進行建模,并對測試樣本進行預測,鐵路客運量的預測結(jié)果如圖6所示。
從圖6可以看出,LSSVM的預測結(jié)果比ARIMA要好,但仍然多個樣本點的預測偏大,預測結(jié)果不穩(wěn)定,這主要是由于LSSVM只能提供鐵路客運量部分信息,鐵路客運量精度有待提高。
采用BP神經(jīng)網(wǎng)絡確定ARIMA和LSSVM的鐵路客運量預測結(jié)果的權(quán)值,融合得到鐵路客運量最終預測結(jié)果如圖7所示。
圖6 LSSVM的鐵路客運量預測結(jié)果
圖7 ARIMA-LSSVM鐵路客運量的預測結(jié)果
從圖7可知,ARIMA-LSSVM鐵路客運量的預測精度比ARIMA、LSSVM要高,主要是綜合利用了ARIMA和LSSVM優(yōu)勢,更加準確描述鐵路客運量變化趨勢,改善了鐵路客運量預測效果。
為了提高鐵路客運量的預測精度,針對單一模型無法全面描述鐵路客運量變化特點的缺陷,提出了基于ARIMA-LSSVM的鐵路客運量預測方法,并采用具體鐵路客運量預測實例對模型的性能進行測試和分析,結(jié)果表明,ARIMA-LSSVM通過ARIMA對鐵路客運量的周期性變化特點進行建模預測,可以從整體上把握鐵路客運量的變化特點,采用LSSVM對鐵路客運量的隨機性變化特點進行預測,提高了鐵路客運量的預測準確性,預測結(jié)果有助于對鐵路管理者制定相應的措施。
[1] 黃召杰,馮碩. 灰色預測模型在鐵路客流預測中的應用[J]. 交通科技與經(jīng)濟,2014,16(1): 57-60.
[2] 蔡昌俊,姚思建,王梅英,等. 基于乘積 ARIMA 模型的城市軌道交通進出站客流量預測[J]. 北京交通大學學報,2014,38(2): 135-140.
[3] 王文莉,楊俊紅. 基于灰色理論的鐵路客運量預測影響因素優(yōu)化[J]. 微電子學與計算機, 2011, 28(10): 164-167.
[4] 彭珍瑞,孟建軍,祝磊,等 . 基于支持向量機的鐵路客運量預測[J].遼寧工程技術(shù)大學學報:自然科學版,2007,26(2):269-272.
[5] 侯麗敏,馬國峰. 基于灰色線性回歸組合模型鐵路客運量預測[J]. 計算機仿真,2011,28(7): 1-3.
[6] 王卓, 王艷輝, 賈利民, 等.改進的BP神經(jīng)網(wǎng)絡在鐵路客運量時間序列預測中的應用[J]. 中國鐵道科學, 2005, 26(2): 128~131.
[7] 孟歌,伍忠東,Muhammad Waqas Ahmad. FSVR在鐵路趟車客運量預測中的應用[J]. 濟南大學學報(自然科學版), 2015, 29(5): 382-388.
[8] 朱偉,李楠,石超峰. 基于粒子群算法優(yōu)化支持向量機的鐵路客運量預測模型[J]. 商丘師范學院學報, 2013,29(12): 33-34.
[9] 趙清艷,熊茂華. 混沌粒子群優(yōu)化神經(jīng)網(wǎng)絡在鐵路客運量預測中的應用[J]. 計算機應用與軟件, 2013, 30(6): 225-228.
[10] 劉琳玥. 基于PCA-BP 神經(jīng)網(wǎng)絡的鐵路客運量預測模型研究[J]. 綜合運輸,2016, 38(8): 43-48.
[11] 馮冰玉, 鮑學英, 王起才, 董朝陽. 新型組合模型在鐵路客運量預測中的應用[J]. 鐵道標準設計, 2015, 59(12): 6-9.
[12] 李曉東. 基于線性回歸—馬爾可夫模型的鐵路客運量預測[J]. 鐵道運輸與經(jīng)濟,2012, 34(4): 38-41.
[13] 賀曉霞,鮑學英,王起才,董朝陽. 基于GM-周期擴展組合模型的鐵路客運量預測[J]. 鐵道科學與工程學報,2015, 12(3): 685-689.
[14] 褚鵬宇,劉瀾. 基于變權(quán)重組合模型的鐵路客運量短期預測[J]. 計算機工程與應用,2017, 53(4): 228-232.
RailwayPassengerVolumePredictionBasedonHybridModel
Hu Xiaomin, He Yuanyan
(Xi’an Traffic Engineering Institue, Xi’an 710300, China)
According to the defects of passenger traffic volume of railway single prediction model and traditional combination forecasting model, in order to improve the prediction accuracy of railway passenger volume, the combined model (ARIMA-LSSVM), a prediction method for railway passenger volume is designed. The railway passenger volume change periodic characteristics are predicted by ARIMA to grasp the whole railway passenger traffic volume, then the random variation characteristics are predicted by LSSVM for railway passenger volume forecast, at last passenger railway concrete is verified by test and analysis. The prediction results of the model show that the ARIMA-LSSVM model can accurate and comprehensive describe the railway passenger volume. The model improves the prediction accuracy of railway passenger volume, forecast results can help to provide valuable information to the railway management.
Railway passenger volume; Combined forecasting model; Least squares support vector machines; Auto regressive integrating moving average
1007-757X(2017)12-0067-04
胡小敏(1978-),女,渭南人,碩士,講師,研究方向:鐵路客運。
賀園園(1985-),女,西安人,碩士,講師,主要研究方向:地理信息系統(tǒng)。
TP391
A
2017.08.29)