時(shí)間序列和神經(jīng)網(wǎng)絡(luò)下我國鐵路客運(yùn)量的預(yù)測研究

2021-06-15 10:28:30王國賢范英兵王鳳玲謝安琪

黑河學(xué)院學(xué)報(bào) 2021年5期

王國賢范英兵王鳳玲謝安琪

(黑河學(xué)院 a.教育科學(xué)學(xué)院；b.理學(xué)院，黑龍江黑河 164300)

客流量的增加和服務(wù)質(zhì)量的提升對鐵路運(yùn)輸提出更高的要求，鐵路也要經(jīng)歷越來越難的考驗(yàn)。面對建設(shè)趨于成熟的鐵路運(yùn)輸系統(tǒng)，我國鐵路客運(yùn)量存在著局限性，特別是在春運(yùn)節(jié)假日等高峰期，出現(xiàn)一票難求、一座難有，人潮如水的現(xiàn)象，鐵路運(yùn)輸?shù)墓┙o缺口難以滿足，也影響了國民的正常出行。因此，需要對鐵路客運(yùn)量進(jìn)行精確的預(yù)測，分析出市場經(jīng)濟(jì)下對鐵路客運(yùn)供給的需求，以及工作的基本要求，有助于鐵路客運(yùn)的發(fā)展。鐵路客運(yùn)量的準(zhǔn)確預(yù)測是旅客的運(yùn)輸組織工作的重要基礎(chǔ)和依據(jù),準(zhǔn)確預(yù)測鐵路客運(yùn)量是鐵路運(yùn)輸企業(yè)面向市場、把握未來的重要保障。

1 SARIMA模型和RBF模型介紹

1.1 SARIMA模型

乘積季節(jié)模型模型[1]

其中季節(jié)自回歸用P表示，Q為非季節(jié)自回歸、移動平均算子的最大滯后階數(shù)用p,q來表示，d為非季節(jié)差分次數(shù)，季節(jié)性差分次數(shù)為D。

1.2 RBF神經(jīng)網(wǎng)絡(luò)模型

1.2.1 RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與映射

本文用徑向基函數(shù)作為徑向基神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)激活函數(shù)，即空間任意一點(diǎn)到某一中心點(diǎn)c之間的歐氏距離的單調(diào)函數(shù)[2]。

圖1 徑向基神經(jīng)元模型

跟隨權(quán)值和輸入向量之間距離的減少，網(wǎng)絡(luò)輸出開始遞增，當(dāng)輸入向量等于權(quán)值向量，神經(jīng)元輸出為1 時(shí)，則達(dá)到最大。其中，神經(jīng)元的靈敏度用閾值b來調(diào)節(jié)。這表明了徑向基網(wǎng)絡(luò)能夠表現(xiàn)出局部逼近的特性，因而RBF 網(wǎng)絡(luò)也被稱為局部感知場網(wǎng)絡(luò)。

屬于前向神經(jīng)網(wǎng)絡(luò)類型之一的RBF神經(jīng)網(wǎng)絡(luò)，其網(wǎng)絡(luò)結(jié)構(gòu)與多層前向網(wǎng)絡(luò)具有相似性，這種靜態(tài)前向網(wǎng)絡(luò)包含輸入層、隱含層和輸出層三層結(jié)構(gòu)。

其中輸入層是第一層，第一層的節(jié)點(diǎn)數(shù)等于輸入向量的維數(shù)，只是起到傳輸信號的作用，并且是由信號源結(jié)點(diǎn)組成。

第二層為隱含層，其單元數(shù)的數(shù)量要根據(jù)所描述的實(shí)際問題才可以確定下來，網(wǎng)絡(luò)的復(fù)雜程度是通過單元個(gè)數(shù)來決定的，輸入層的向量在直接進(jìn)入隱含層各個(gè)神經(jīng)元后在隱層內(nèi)發(fā)生非線性變化，通過權(quán)值連接輸出層。

第三層是輸出層，是對激活函數(shù)(一般采用高斯函數(shù))的參數(shù)進(jìn)行調(diào)整，同時(shí)對輸入模式的作用做出相應(yīng)的響應(yīng)，也是對各個(gè)隱含層的輸出量進(jìn)行線性相加。

1.2.2 RBF神經(jīng)網(wǎng)絡(luò)的工作原理及訓(xùn)練準(zhǔn)則

徑向基神經(jīng)網(wǎng)絡(luò)隱含層執(zhí)行的非線性變換一般是不會改變的，而輸入層則會經(jīng)由隱含層被映射到一個(gè)新的向量空間，輸出層對權(quán)值是線性，且在新的向量空間中輸出層會重新進(jìn)行線性組合，當(dāng)確定隱含層的結(jié)點(diǎn)個(gè)數(shù)、其作用函數(shù)類型、聚類的中心等參數(shù)后，采用線性優(yōu)化方法對權(quán)值進(jìn)行學(xué)習(xí)，學(xué)習(xí)速度得到了很大的提高，這也是RBF網(wǎng)絡(luò)對自適應(yīng)控制擁有巨大吸引力的原因之一。

RBF神經(jīng)網(wǎng)絡(luò)的構(gòu)造和訓(xùn)練就是映射函數(shù)學(xué)習(xí)的過程，在函數(shù)學(xué)習(xí)過程中確定每個(gè)基函數(shù)的中心、寬度值和權(quán)值大小，最終完成由輸入到輸出的映射過程。本文將采用非線性優(yōu)化方法來確定隱層神經(jīng)元參數(shù)(中心，寬度)，具體的算法步驟如下[3]。

(1)將網(wǎng)絡(luò)進(jìn)行初始化。在這里采用K-均值聚類方法，利用隨機(jī)選取的h個(gè)訓(xùn)練樣本來確定聚類中心ci(i=1,2,3……h(huán))。

(2)運(yùn)用鄰規(guī)則方法輸入樣本進(jìn)行分組。輸入樣本的各個(gè)聚類合將依據(jù)xp與ci之間的歐氏距離對xp進(jìn)行分配。

(3)再次調(diào)整對聚類中心。訓(xùn)練樣本的平均值是通過各個(gè)聚類集合計(jì)算得到的，并獲得新的聚類中心ci。RBF網(wǎng)絡(luò)函數(shù)中心最終的基確定是新的聚類中心不再發(fā)生變化，否則返回(1)，繼續(xù)重新求解。

(4)求解方差σi

(5)式中，cmax為選取中心之間的最大距離。

(6)計(jì)算隱含層和輸入層之間的權(quán)值。利用最小二乘法可以得到：

基函數(shù)的中心、方差、隱含層到輸入層之間的權(quán)值，可以通過RBF神經(jīng)網(wǎng)絡(luò)自動訓(xùn)練來確定，RBF神經(jīng)網(wǎng)絡(luò)的輸出，可以實(shí)現(xiàn)網(wǎng)絡(luò)無限逼近的效果。

由此可見，RBF網(wǎng)絡(luò)作為一種性能良好的前向神經(jīng)網(wǎng)絡(luò)，在網(wǎng)絡(luò)逼近能力、分類學(xué)習(xí)和學(xué)習(xí)速度等方面均比BP神經(jīng)網(wǎng)絡(luò)更占優(yōu)勢，而且RBF人工神經(jīng)網(wǎng)絡(luò)最大的一個(gè)優(yōu)點(diǎn)就是隱含層節(jié)點(diǎn)的數(shù)目是通過網(wǎng)絡(luò)訓(xùn)練過程中自主確定的。

1.3 SARIMA-RBF預(yù)測模型

由于鐵路客運(yùn)量具有極強(qiáng)的季節(jié)性特點(diǎn)，鐵路客運(yùn)量的線性部分本文首先采用季節(jié)性ARIMA模型來描述。然而，在解釋時(shí)間序列變化過程中，由于季節(jié)性ARIMA模型是利用差分這一純數(shù)學(xué)的方法來提取序列中的線性因素，但不能較好地說明導(dǎo)致時(shí)間序列變化的非線性因素有哪些，因而模型的預(yù)測精度會偏低。用非線性的徑向基神經(jīng)網(wǎng)絡(luò)模型來描述鐵路客運(yùn)量的非線性部分，同時(shí)，修正SARIMA模型預(yù)測結(jié)果得出的殘差，從而達(dá)到提高預(yù)測精度的目的。非線性RBF神經(jīng)網(wǎng)絡(luò)通過訓(xùn)練學(xué)習(xí)得出的殘差預(yù)測模型[4]，而本文中的ei為預(yù)測SARIMA模型的修正殘差，最終的預(yù)測結(jié)果為yi=at+ei。

2 我國鐵路客運(yùn)量的模型建立及預(yù)測

2.1 數(shù)據(jù)選取

本文所獲的數(shù)據(jù)來源于國家統(tǒng)計(jì)局公布的2010年1月至2019年12月全國鐵路客運(yùn)量的月度數(shù)據(jù)，如圖2所示。

圖2 2010年1月至2019年12月我國鐵路客運(yùn)量變化趨勢圖

2.2 基于SARIMA模型的鐵路客運(yùn)量預(yù)測

2.2.1 平穩(wěn)性檢驗(yàn)

在原序列的折線圖中，可以看到鐵路客運(yùn)量數(shù)據(jù)是隨著時(shí)間的增加而增加，說明該時(shí)間序列的線性趨勢很明顯；通過對折線圖的觀察可得在經(jīng)過12個(gè)時(shí)間的間隔后會再次呈現(xiàn)出相同的波動規(guī)律，這就表明鐵路客運(yùn)量時(shí)間序列具有很強(qiáng)的周期性，且該周期S=12。

由于鐵路客運(yùn)量時(shí)間序列具有很強(qiáng)的季節(jié)波動性，要消除序列的季節(jié)性和趨勢性，原序列命名為X，對序列X進(jìn)行季節(jié)差分和一階短期差分后記為DSDX，如圖3所示。

圖3 差分序列DSDX序列圖

同時(shí)對差分后進(jìn)行ADF單位根檢驗(yàn)，檢驗(yàn)結(jié)果見表1。在t統(tǒng)計(jì)量分別為1%、5%、10%水平下的絕對值均小于ADF檢驗(yàn)的t值，相伴概率P值為0.0000<0.05，由圖3和單位根檢驗(yàn)，說明序列DSDX是平穩(wěn)的。

表1 序列DSDX的單位根檢驗(yàn)

2.2.2 模型識別

利用Box-Jenkins的模型識別法，DSDX序列的自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)如下頁圖4所示，自相關(guān)序列在第三期后都趨于0，呈現(xiàn)出一定的拖尾性，偏自相關(guān)序列呈現(xiàn)出一定的拖尾性，初步判定選用ARMA模型。

2.2.3 模型定階和參數(shù)估計(jì)

原序列X經(jīng)過一階季節(jié)差分，基本消除了季節(jié)因素，所以，在這里D=1；序列X的趨勢性在經(jīng)過一階差分也被消除，則d=1。估計(jì)后的結(jié)果，如下頁表2所示。

圖4 序列DSDX的自相關(guān)和偏自相關(guān)圖

表2 模型參數(shù)估計(jì)

其中代表鐵路客運(yùn)量原始序列。

2.2.4 模型檢驗(yàn)

由圖5可以得出，殘差序列的樣本自相關(guān)函數(shù)都在95%的置信區(qū)間內(nèi)，計(jì)算出殘差自相關(guān)函數(shù)滿足相應(yīng)的Q統(tǒng)計(jì)量概率值都大于檢驗(yàn)水平5%，表明模型通過了適應(yīng)性檢驗(yàn)。

圖5 殘差自相關(guān)圖

表3 檢驗(yàn)結(jié)果

圖6 擬合效果圖

表4 鐵路客運(yùn)量的相對誤

2.3 基于RBF神經(jīng)網(wǎng)絡(luò)模型的客運(yùn)量預(yù)測

2.3.1 RBF神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)

RBF神經(jīng)網(wǎng)絡(luò)模型的創(chuàng)建將會采用MATLAB的神經(jīng)網(wǎng)絡(luò)工具箱Net=newrb(P,T,GOAL,SPREAD,MN,DF)來實(shí)現(xiàn)。其中訓(xùn)練樣本的輸人向量用P來表示，Q為目標(biāo)向量；GOAL為均方誤差，默認(rèn)為0；SPREAD為徑向基函數(shù)的寬度，SPREAD越大，網(wǎng)絡(luò)的預(yù)測性能越平滑，默認(rèn)為1；MN為神經(jīng)元的最大數(shù)目，默認(rèn)為輸入向量的Q；DF為2次顯示之間所添加的神經(jīng)元的數(shù)目，默認(rèn)為25。

2.3.2 RBF神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果

通過對樣本的訓(xùn)練，得到網(wǎng)絡(luò)訓(xùn)練的輸出值，輸出值與真實(shí)值之間的擬合見表5，由表5可以看出，徑向基神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的輸出值和實(shí)際值之間的相對誤差較小。相對誤差控制在2%以內(nèi)，說明該神經(jīng)網(wǎng)絡(luò)可以較好地應(yīng)用于中國鐵路客運(yùn)量的擬合。

表5 鐵路客運(yùn)量的真實(shí)值和預(yù)測值比較

2.4 鐵路客運(yùn)量的SARIMA-RBF預(yù)測模型

從上面的結(jié)果可以看出，單個(gè)預(yù)測方法的預(yù)測精度并不是很高，首先，需運(yùn)用ARIMA-RBF組合模型對鐵路客運(yùn)量進(jìn)行預(yù)測，利用季節(jié)性ARIMA模型預(yù)測得出殘差，并將殘差作為RBF神經(jīng)網(wǎng)絡(luò)的期望輸出，其次，再用鐵路客運(yùn)量原始數(shù)據(jù)進(jìn)行訓(xùn)練，將訓(xùn)練后的數(shù)據(jù)輸入到RBF神經(jīng)網(wǎng)絡(luò)中，并進(jìn)行學(xué)習(xí)建模，得出預(yù)測殘差序列值；最后，通過MATLAB軟件輸出SARIMA-RBF組合模型的預(yù)測結(jié)果，從下頁圖7的擬合結(jié)果可以看見，預(yù)測值和真實(shí)值幾乎重合，預(yù)測誤差大大降低，而模型的預(yù)測精度得到了提高。

2.5 預(yù)測結(jié)果對比分析

下面對三種模型的預(yù)測結(jié)果和預(yù)測殘差進(jìn)行比較，比較結(jié)果見下頁表6。

圖7 SARIMA-RBF組合模型預(yù)測結(jié)果

表6 三種模型預(yù)測結(jié)果比較

從三個(gè)預(yù)測模型的結(jié)果來看，SARIMA模型的相對誤差是三個(gè)預(yù)測模型中最大的，但相對誤差控制在5%以內(nèi)，表明該模型的預(yù)測精度較高。RBF神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度得到了提高，而SARIMA-RBF組合模型結(jié)合了上述兩種模型的優(yōu)點(diǎn)，充分利用各項(xiàng)子模型的有效預(yù)測信息，使組合模型的預(yù)測值與鐵路客運(yùn)量數(shù)據(jù)最為接近，相對誤差均低于1%，提高了組合模型的預(yù)測精確度，使預(yù)測結(jié)果更加可靠。并得到2020年1月鐵路客運(yùn)量為31 024.13萬人。

3 結(jié)論

鐵路運(yùn)輸是國內(nèi)運(yùn)輸行業(yè)的重要組成部分，對客運(yùn)量的預(yù)測不僅能夠掌握其發(fā)展趨勢，還能為其制定運(yùn)輸計(jì)劃和線路規(guī)劃提供科學(xué)依據(jù)。SARIMA-RBF組合模型的預(yù)測結(jié)果與實(shí)際值進(jìn)行比較，實(shí)驗(yàn)結(jié)果表明其預(yù)測精度最高，相對誤差不超過1%，能夠準(zhǔn)確地對客運(yùn)量進(jìn)行預(yù)測。由于影響鐵路客運(yùn)量的不確定因素很多，本文只分析了其中的一個(gè)因素，通過3種方法預(yù)測鐵路客運(yùn)量發(fā)展走勢，可知組合預(yù)測大大地提高了預(yù)測精度，達(dá)到了鐵路實(shí)際運(yùn)行精度要求，鐵路客運(yùn)量預(yù)測對未來鐵路客運(yùn)市場的發(fā)展起到了非常重要的指導(dǎo)作用。