王國賢 范英兵 王鳳玲 謝安琪
(黑河學(xué)院 a.教育科學(xué)學(xué)院;b.理學(xué)院,黑龍江 黑河 164300)
客流量的增加和服務(wù)質(zhì)量的提升對鐵路運(yùn)輸提出更高的要求,鐵路也要經(jīng)歷越來越難的考驗(yàn)。面對建設(shè)趨于成熟的鐵路運(yùn)輸系統(tǒng),我國鐵路客運(yùn)量存在著局限性,特別是在春運(yùn)節(jié)假日等高峰期,出現(xiàn)一票難求、一座難有,人潮如水的現(xiàn)象,鐵路運(yùn)輸?shù)墓┙o缺口難以滿足,也影響了國民的正常出行。因此,需要對鐵路客運(yùn)量進(jìn)行精確的預(yù)測,分析出市場經(jīng)濟(jì)下對鐵路客運(yùn)供給的需求,以及工作的基本要求,有助于鐵路客運(yùn)的發(fā)展。鐵路客運(yùn)量的準(zhǔn)確預(yù)測是旅客的運(yùn)輸組織工作的重要基礎(chǔ)和依據(jù),準(zhǔn)確預(yù)測鐵路客運(yùn)量是鐵路運(yùn)輸企業(yè)面向市場、把握未來的重要保障。
乘積季節(jié)模型 模型[1]
其中季節(jié)自回歸用P表示,Q為非季節(jié)自回歸、移動平均算子的最大滯后階數(shù)用p,q來表示,d為非季節(jié)差分次數(shù),季節(jié)性差分次數(shù)為D。
1.2.1 RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與映射
本文用徑向基函數(shù)作為徑向基神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)激活函數(shù),即空間任意一點(diǎn)到某一中心點(diǎn)c之間的歐氏距離的單調(diào)函數(shù)[2]。
圖1 徑向基神經(jīng)元模型
跟隨權(quán)值和輸入向量之間距離的減少,網(wǎng)絡(luò)輸出開始遞增,當(dāng)輸入向量等于權(quán)值向量,神經(jīng)元輸出為1 時(shí),則達(dá)到最大。其中,神經(jīng)元的靈敏度用閾值b來調(diào)節(jié)。這表明了徑向基網(wǎng)絡(luò)能夠表現(xiàn)出局部逼近的特性,因而RBF 網(wǎng)絡(luò)也被稱為局部感知場網(wǎng)絡(luò)。
屬于前向神經(jīng)網(wǎng)絡(luò)類型之一的RBF神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)結(jié)構(gòu)與多層前向網(wǎng)絡(luò)具有相似性,這種靜態(tài)前向網(wǎng)絡(luò)包含輸入層、隱含層和輸出層三層結(jié)構(gòu)。
其中輸入層是第一層,第一層的節(jié)點(diǎn)數(shù)等于輸入向量的維數(shù),只是起到傳輸信號的作用,并且是由信號源結(jié)點(diǎn)組成。
第二層為隱含層,其單元數(shù)的數(shù)量要根據(jù)所描述的實(shí)際問題才可以確定下來,網(wǎng)絡(luò)的復(fù)雜程度是通過單元個(gè)數(shù)來決定的,輸入層的向量在直接進(jìn)入隱含層各個(gè)神經(jīng)元后在隱層內(nèi)發(fā)生非線性變化,通過權(quán)值連接輸出層。
第三層是輸出層,是對激活函數(shù)(一般采用高斯函數(shù))的參數(shù)進(jìn)行調(diào)整,同時(shí)對輸入模式的作用做出相應(yīng)的響應(yīng),也是對各個(gè)隱含層的輸出量進(jìn)行線性相加。
1.2.2 RBF神經(jīng)網(wǎng)絡(luò)的工作原理及訓(xùn)練準(zhǔn)則
徑向基神經(jīng)網(wǎng)絡(luò)隱含層執(zhí)行的非線性變換一般是不會改變的,而輸入層則會經(jīng)由隱含層被映射到一個(gè)新的向量空間,輸出層對權(quán)值是線性,且在新的向量空間中輸出層會重新進(jìn)行線性組合,當(dāng)確定隱含層的結(jié)點(diǎn)個(gè)數(shù)、其作用函數(shù)類型、聚類的中心等參數(shù)后,采用線性優(yōu)化方法對權(quán)值進(jìn)行學(xué)習(xí),學(xué)習(xí)速度得到了很大的提高,這也是RBF網(wǎng)絡(luò)對自適應(yīng)控制擁有巨大吸引力的原因之一。
RBF神經(jīng)網(wǎng)絡(luò)的構(gòu)造和訓(xùn)練就是映射函數(shù)學(xué)習(xí)的過程,在函數(shù)學(xué)習(xí)過程中確定每個(gè)基函數(shù)的中心、寬度值和權(quán)值大小,最終完成由輸入到輸出的映射過程。本文將采用非線性優(yōu)化方法來確定隱層神經(jīng)元參數(shù)(中心,寬度),具體的算法步驟如下[3]。
(1)將網(wǎng)絡(luò)進(jìn)行初始化。在這里采用K-均值聚類方法,利用隨機(jī)選取的h個(gè)訓(xùn)練樣本來確定聚類中心ci(i=1,2,3……h(huán))。
(2)運(yùn)用鄰規(guī)則方法輸入樣本進(jìn)行分組。輸入樣本的各個(gè)聚類合將依據(jù)xp與ci之間的歐氏距離對xp進(jìn)行分配。
(3)再次調(diào)整對聚類中心。訓(xùn)練樣本的平均值是通過各個(gè)聚類集合計(jì)算得到的,并獲得新的聚類中心ci。RBF網(wǎng)絡(luò)函數(shù)中心最終的基確定是新的聚類中心不再發(fā)生變化,否則返回(1),繼續(xù)重新求解。
(4)求解方差σi
(5)式中,cmax為選取中心之間的最大距離。
(6)計(jì)算隱含層和輸入層之間的權(quán)值。利用最小二乘法可以得到:
基函數(shù)的中心、方差、隱含層到輸入層之間的權(quán)值,可以通過RBF神經(jīng)網(wǎng)絡(luò)自動訓(xùn)練來確定,RBF神經(jīng)網(wǎng)絡(luò)的輸出,可以實(shí)現(xiàn)網(wǎng)絡(luò)無限逼近的效果。
由此可見,RBF網(wǎng)絡(luò)作為一種性能良好的前向神經(jīng)網(wǎng)絡(luò),在網(wǎng)絡(luò)逼近能力、分類學(xué)習(xí)和學(xué)習(xí)速度等方面均比BP神經(jīng)網(wǎng)絡(luò)更占優(yōu)勢,而且RBF人工神經(jīng)網(wǎng)絡(luò)最大的一個(gè)優(yōu)點(diǎn)就是隱含層節(jié)點(diǎn)的數(shù)目是通過網(wǎng)絡(luò)訓(xùn)練過程中自主確定的。
由于鐵路客運(yùn)量具有極強(qiáng)的季節(jié)性特點(diǎn),鐵路客運(yùn)量的線性部分本文首先采用季節(jié)性ARIMA模型來描述。然而,在解釋時(shí)間序列變化過程中,由于季節(jié)性ARIMA模型是利用差分這一純數(shù)學(xué)的方法來提取序列中的線性因素,但不能較好地說明導(dǎo)致時(shí)間序列變化的非線性因素有哪些,因而模型的預(yù)測精度會偏低。用非線性的徑向基神經(jīng)網(wǎng)絡(luò)模型來描述鐵路客運(yùn)量的非線性部分,同時(shí),修正SARIMA模型預(yù)測結(jié)果得出的殘差,從而達(dá)到提高預(yù)測精度的目的。非線性RBF神經(jīng)網(wǎng)絡(luò)通過訓(xùn)練學(xué)習(xí)得出的殘差預(yù)測模型[4],而本文中的ei為預(yù)測SARIMA模型的修正殘差,最終的預(yù)測結(jié)果為yi=at+ei。
本文所獲的數(shù)據(jù)來源于國家統(tǒng)計(jì)局公布的2010年1月至2019年12月全國鐵路客運(yùn)量的月度數(shù)據(jù),如圖2所示。
圖2 2010年1月至2019年12月我國鐵路客運(yùn)量變化趨勢圖
2.2.1 平穩(wěn)性檢驗(yàn)
在原序列的折線圖中,可以看到鐵路客運(yùn)量數(shù)據(jù)是隨著時(shí)間的增加而增加,說明該時(shí)間序列的線性趨勢很明顯;通過對折線圖的觀察可得在經(jīng)過12個(gè)時(shí)間的間隔后會再次呈現(xiàn)出相同的波動規(guī)律,這就表明鐵路客運(yùn)量時(shí)間序列具有很強(qiáng)的周期性,且該周期S=12。
由于鐵路客運(yùn)量時(shí)間序列具有很強(qiáng)的季節(jié)波動性,要消除序列的季節(jié)性和趨勢性,原序列命名為X,對序列X進(jìn)行季節(jié)差分和一階短期差分后記為DSDX,如圖3所示。
圖3 差分序列DSDX序列圖
同時(shí)對差分后進(jìn)行ADF單位根檢驗(yàn),檢驗(yàn)結(jié)果見表1。在t統(tǒng)計(jì)量分別為1%、5%、10%水平下的絕對值均小于ADF檢驗(yàn)的t值,相伴概率P值為0.0000<0.05,由圖3和單位根檢驗(yàn),說明序列DSDX是平穩(wěn)的。
表1 序列DSDX的單位根檢驗(yàn)
2.2.2 模型識別
利用Box-Jenkins的模型識別法,DSDX序列的自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)如下頁圖4所示,自相關(guān)序列在第三期后都趨于0,呈現(xiàn)出一定的拖尾性,偏自相關(guān)序列呈現(xiàn)出一定的拖尾性,初步判定選用ARMA模型。
2.2.3 模型定階和參數(shù)估計(jì)
原序列X經(jīng)過一階季節(jié)差分,基本消除了季節(jié)因素,所以,在這里D=1;序列X的趨勢性在經(jīng)過一階差分也被消除,則d=1。估計(jì)后的結(jié)果,如下頁表2所示。
圖4 序列DSDX的自相關(guān)和偏自相關(guān)圖
表2 模型參數(shù)估計(jì)
其中代表鐵路客運(yùn)量原始序列。
2.2.4 模型檢驗(yàn)
由圖5可以得出,殘差序列的樣本自相關(guān)函數(shù)都在95%的置信區(qū)間內(nèi),計(jì)算出殘差自相關(guān)函數(shù)滿足相應(yīng)的Q統(tǒng)計(jì)量概率值都大于檢驗(yàn)水平5%,表明模型通過了適應(yīng)性檢驗(yàn)。
圖5 殘差自相關(guān)圖
表3 檢驗(yàn)結(jié)果
圖6 擬合效果圖
表4 鐵路客運(yùn)量的相對誤
2.3.1 RBF神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)
RBF神經(jīng)網(wǎng)絡(luò)模型的創(chuàng)建將會采用MATLAB的神經(jīng)網(wǎng)絡(luò)工具箱Net=newrb(P,T,GOAL,SPREAD,MN,DF)來實(shí)現(xiàn)。其中訓(xùn)練樣本 的輸人向量用P來表示,Q為 目標(biāo)向量;GOAL為均方誤差,默認(rèn)為0;SPREAD為徑向基函數(shù)的寬度,SPREAD越大,網(wǎng)絡(luò)的預(yù)測性能越平滑,默認(rèn)為1;MN為神經(jīng)元的最大數(shù)目,默認(rèn)為輸入向量的Q;DF為2次顯示之間所添加的神經(jīng)元的數(shù)目,默認(rèn)為25。
2.3.2 RBF神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果
通過對樣本的訓(xùn)練,得到網(wǎng)絡(luò)訓(xùn)練的輸出值,輸出值與真實(shí)值之間的擬合見表5,由表5可以看出,徑向基神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的輸出值和實(shí)際值之間的相對誤差較小。相對誤差控制在2%以內(nèi),說明該神經(jīng)網(wǎng)絡(luò)可以較好地應(yīng)用于中國鐵路客運(yùn)量的擬合。
表5 鐵路客運(yùn)量的真實(shí)值和預(yù)測值比較
從上面的結(jié)果可以看出,單個(gè)預(yù)測方法的預(yù)測精度并不是很高,首先,需運(yùn)用ARIMA-RBF組合模型對鐵路客運(yùn)量進(jìn)行預(yù)測,利用季節(jié)性ARIMA模型預(yù)測得出殘差,并將殘差作為RBF神經(jīng)網(wǎng)絡(luò)的期望輸出,其次,再用鐵路客運(yùn)量原始數(shù)據(jù)進(jìn)行訓(xùn)練,將訓(xùn)練后的數(shù)據(jù)輸入到RBF神經(jīng)網(wǎng)絡(luò)中,并進(jìn)行學(xué)習(xí)建模,得出預(yù)測殘差序列值;最后,通過MATLAB軟件輸出SARIMA-RBF組合模型的預(yù)測結(jié)果,從下頁圖7的擬合結(jié)果可以看見,預(yù)測值和真實(shí)值幾乎重合,預(yù)測誤差大大降低,而模型的預(yù)測精度得到了提高。
下面對三種模型的預(yù)測結(jié)果和預(yù)測殘差進(jìn)行比較,比較結(jié)果見下頁表6。
圖7 SARIMA-RBF組合模型預(yù)測結(jié)果
表6 三種模型預(yù)測結(jié)果比較
從三個(gè)預(yù)測模型的結(jié)果來看,SARIMA模型的相對誤差是三個(gè)預(yù)測模型中最大的,但相對誤差控制在5%以內(nèi),表明該模型的預(yù)測精度較高。RBF神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度得到了提高,而SARIMA-RBF組合模型結(jié)合了上述兩種模型的優(yōu)點(diǎn),充分利用各項(xiàng)子模型的有效預(yù)測信息,使組合模型的預(yù)測值與鐵路客運(yùn)量數(shù)據(jù)最為接近,相對誤差均低于1%,提高了組合模型的預(yù)測精確度,使預(yù)測結(jié)果更加可靠。并得到2020年1月鐵路客運(yùn)量為31 024.13萬人。
鐵路運(yùn)輸是國內(nèi)運(yùn)輸行業(yè)的重要組成部分,對客運(yùn)量的預(yù)測不僅能夠掌握其發(fā)展趨勢,還能為其制定運(yùn)輸計(jì)劃和線路規(guī)劃提供科學(xué)依據(jù)。SARIMA-RBF組合模型的預(yù)測結(jié)果與實(shí)際值進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明其預(yù)測精度最高,相對誤差不超過1%,能夠準(zhǔn)確地對客運(yùn)量進(jìn)行預(yù)測。由于影響鐵路客運(yùn)量的不確定因素很多,本文只分析了其中的一個(gè)因素,通過3種方法預(yù)測鐵路客運(yùn)量發(fā)展走勢,可知組合預(yù)測大大地提高了預(yù)測精度,達(dá)到了鐵路實(shí)際運(yùn)行精度要求,鐵路客運(yùn)量預(yù)測對未來鐵路客運(yùn)市場的發(fā)展起到了非常重要的指導(dǎo)作用。