曹 慧,秦江濤
(上海理工大學(xué) 管理學(xué)院,上海 200093)
鐵路貨運(yùn)量在我國(guó)運(yùn)輸行業(yè)的發(fā)展中扮演著重要角色,能夠反映出我國(guó)交通運(yùn)輸行業(yè)現(xiàn)狀及國(guó)民經(jīng)濟(jì)發(fā)展情況,同時(shí)也存在因運(yùn)輸設(shè)備不足而不能滿(mǎn)足貨運(yùn)需求等問(wèn)題,面臨著公路、水路等其他運(yùn)輸方式的競(jìng)爭(zhēng)。鐵路相關(guān)部門(mén)需要制定靈活的運(yùn)輸計(jì)劃,優(yōu)化鐵路運(yùn)輸問(wèn)題改善競(jìng)爭(zhēng)局面,這就需要通過(guò)對(duì)貨運(yùn)量進(jìn)行預(yù)測(cè),掌握一定時(shí)期的貨運(yùn)量以判斷我國(guó)鐵路貨運(yùn)發(fā)展趨勢(shì)和未來(lái)經(jīng)濟(jì)發(fā)展,制定相關(guān)計(jì)劃以解決問(wèn)題。
常用的貨運(yùn)量預(yù)測(cè)方法有很多,比如時(shí)間序列分析、神經(jīng)網(wǎng)絡(luò)方法、灰色預(yù)測(cè)等。時(shí)間序列分析是最常用的分析方法,其中ARIMA 最具代表性,對(duì)線性的數(shù)據(jù)具有較高的擬合度,而對(duì)于非線性的數(shù)據(jù)信息不能進(jìn)行很好的預(yù)測(cè)。通常情況下,時(shí)間序列數(shù)據(jù)包含線性和非線性部分,因此僅通過(guò)ARIMA 模型對(duì)數(shù)據(jù)進(jìn)行線性預(yù)測(cè),得到的結(jié)果往往不能滿(mǎn)足人的需求。BP、RNN、LSTM等神經(jīng)網(wǎng)絡(luò)方法中應(yīng)用較為廣泛的為BP 神經(jīng)網(wǎng)絡(luò),廣泛應(yīng)用于股票、二手房、碳市場(chǎng)等領(lǐng)域,對(duì)于解決非線性時(shí)間序列問(wèn)題具有很好的效果,同時(shí)也具有過(guò)擬合、梯度消失、隱含層的選擇等問(wèn)題?;疑A(yù)測(cè)計(jì)算工作量小、預(yù)測(cè)精度高,但過(guò)于依賴(lài)初始值和背景值。
在上述預(yù)測(cè)方法中,大多數(shù)學(xué)者采用單一模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),比如孫斌等使用ARIMA 模型對(duì)極端事件下貨運(yùn)量進(jìn)行線性預(yù)測(cè),發(fā)現(xiàn)ARIMA 模型貨運(yùn)量的線性部分具有較高的擬合;譚雪針對(duì)貨運(yùn)量具有高度非線性和不確定性的特點(diǎn),運(yùn)用GRU 模型對(duì)數(shù)據(jù)進(jìn)行單步和多步預(yù)測(cè),結(jié)果表明GRU 可較好擬合貨運(yùn)量的非線性特征,但忽略了數(shù)據(jù)的線性特征。傳統(tǒng)單一模型主要是對(duì)于因果關(guān)系和時(shí)間序列模型分析無(wú)法提取較為全面的數(shù)據(jù)信息。隨著研究的深入,學(xué)者們開(kāi)始對(duì)組合模型進(jìn)行研究,例如梁寧等分析貨運(yùn)量與影響因素的非線性關(guān)系,使用GRA確定影響因素的權(quán)重,采用FOA 選擇SVM-mixed 的最優(yōu)參數(shù),提高結(jié)果精確度;耿立艷等提出使用(FOA)算法優(yōu)化選擇混合核LSSVM 參數(shù)并應(yīng)用于貨運(yùn)量預(yù)測(cè),相比使用單一LSSVM,精度得到了提高。在這些組合模型中,常見(jiàn)的是引進(jìn)一種算法優(yōu)化另一種算法的參數(shù)以提高精度,但參數(shù)過(guò)多可能會(huì)導(dǎo)致參數(shù)組合數(shù)量過(guò)多,同時(shí)忽略數(shù)據(jù)本身的線性和非線性的結(jié)構(gòu)特點(diǎn),導(dǎo)致信息提取不全面、結(jié)果不理想。通過(guò)分析可知,鐵路貨運(yùn)量包含線性和非線性部分,本文選取對(duì)線性部分具有較高擬合度的ARIMA 模型和對(duì)非線性部分解決效果較好的BP 模型,并將其組合提出ARIMA -BP 加權(quán)組合模型和ARIMA -BP 殘差優(yōu)化組合模型,將貨運(yùn)量中線性與非線性部分進(jìn)行細(xì)化,充分提取數(shù)據(jù)信息,并應(yīng)用于鐵路貨運(yùn)量研究,進(jìn)行模型對(duì)比分析以探究方法的可行性。
ARIMA(p,d,q)模型即差分自回歸移動(dòng)平均模型,是時(shí)間序列分析方法中常用模型之一。AR 是自回歸,p 為自回歸項(xiàng);MA 為移動(dòng)平均,q 為移動(dòng)平均項(xiàng),d 為時(shí)間序列平穩(wěn)時(shí)所做的差分次數(shù)。此模型是根據(jù)歷史數(shù)據(jù)預(yù)測(cè)未來(lái)數(shù)據(jù),對(duì)數(shù)據(jù)的線性部分進(jìn)行較好擬合,但對(duì)于非線性部分的擬合效果欠佳。一般形式可表示為:
其中,X為當(dāng)前值,μ 為常數(shù)項(xiàng),p 為自回歸項(xiàng),γ是自相關(guān)系數(shù),{ε}是殘差序列,q 是移動(dòng)平均項(xiàng),θ是移動(dòng)平均項(xiàng)系數(shù)。
使用此模型對(duì)鐵路貨運(yùn)量進(jìn)行預(yù)測(cè)的基本程序?yàn)椋孩倥袛嘭涍\(yùn)量數(shù)據(jù)的平穩(wěn)性,通過(guò)對(duì)數(shù)據(jù)作散點(diǎn)圖,自相關(guān)(ACF)和偏自相關(guān)(PACF)函數(shù)圖以及ADF 單位根檢驗(yàn),可知原始數(shù)據(jù)是否平穩(wěn),若原始數(shù)據(jù)不平穩(wěn),對(duì)其進(jìn)行差分;②模型定階,對(duì)ARIMA(p,d,q)模型定階,確定p、d、q 3個(gè)參數(shù)的值,對(duì)貨運(yùn)量的自相關(guān)(ACF)和偏自相關(guān)(PACF)圖進(jìn)行分析,初步判定參數(shù),再根據(jù)信息準(zhǔn)則函數(shù)法AIC 準(zhǔn)則判定最優(yōu)的階數(shù)組合;③進(jìn)行模型擬合,得到模型參數(shù),作殘差檢驗(yàn),判斷是否為白噪聲,進(jìn)行模型預(yù)測(cè)。
上述步驟使用ARIMA 模型對(duì)鐵路貨運(yùn)量進(jìn)行線性部分建模分析,但忽略了貨運(yùn)量非線性部分,對(duì)數(shù)據(jù)信息提取不充分。
BP 神經(jīng)網(wǎng)絡(luò)是一種前饋網(wǎng)絡(luò),BP 神經(jīng)網(wǎng)絡(luò)包括三層,即輸入層、隱含層、輸出層。BP 神經(jīng)網(wǎng)絡(luò)的傳遞過(guò)程主要分為正向傳播和反向傳播,正向傳播是從輸入層開(kāi)始經(jīng)過(guò)隱含層,最后到輸出層;如果輸出結(jié)果沒(méi)有達(dá)到預(yù)期,則進(jìn)行反向傳播,從輸出層開(kāi)始經(jīng)過(guò)隱含層,最后到輸入層,在此過(guò)程中主要使用梯度下降方法,依次調(diào)節(jié)隱含層到輸出層的權(quán)值,以及輸入層到隱含層的權(quán)值,使得預(yù)測(cè)值不斷逼近真實(shí)值。
BP 神經(jīng)網(wǎng)絡(luò)的一般形式如下:
ω
(i
=1,2…N
;j
=1,2…N
)為輸入層和隱含層之間的權(quán)值,ω
(k
=1,2…N
)為隱含層和輸出層的權(quán)值,f和f為神經(jīng)網(wǎng)絡(luò)的激活函數(shù)。BP 神經(jīng)網(wǎng)絡(luò)可以很好地解決數(shù)據(jù)的非線性問(wèn)題,對(duì)于具有線性和非線性特點(diǎn)的鐵路貨運(yùn)量,BP 神經(jīng)網(wǎng)絡(luò)可以彌補(bǔ)ARIMA 建模過(guò)程中所忽略數(shù)據(jù)的非線性信息。
ARIMA 模型和BP 神經(jīng)網(wǎng)絡(luò)都具有各自?xún)?yōu)勢(shì),但應(yīng)用單一模型得到的結(jié)果無(wú)法達(dá)到人們預(yù)期。因此,本文提出利用ARIMA-BP 組合模型對(duì)中國(guó)鐵路貨運(yùn)量進(jìn)行預(yù)測(cè),使兩者優(yōu)勢(shì)互補(bǔ)。分別對(duì)數(shù)據(jù)的線性部分和非線性部分進(jìn)行建模分析,從加權(quán)優(yōu)化和殘差優(yōu)化的角度進(jìn)行組合模型預(yù)測(cè),并應(yīng)用于鐵路貨運(yùn)量預(yù)測(cè)研究。
1.3.1 ARIMA-BP 加權(quán)組合模型
利用ARIMA 和BP 分別對(duì)原始數(shù)據(jù)進(jìn)行預(yù)測(cè),分別得到預(yù)測(cè)值,通過(guò)簡(jiǎn)單加權(quán)法對(duì)單一模型的預(yù)測(cè)值進(jìn)行加權(quán)處理?;舅枷霝閱我荒P皖A(yù)測(cè)結(jié)果誤差的方差越小,說(shuō)明該模型的預(yù)測(cè)精度越高,反之就越低。加權(quán)法的基本過(guò)程為:Y為實(shí)際的時(shí)間數(shù)據(jù)序列,ARIMA 模型得到預(yù)測(cè)值F,BP 模型得到預(yù)測(cè)值F,通過(guò)簡(jiǎn)單加權(quán)預(yù)測(cè)得到的貨運(yùn)量預(yù)測(cè)值F,ω和ω分別為ARIMA 和BP 模型在組合預(yù)測(cè)中的權(quán)重。因此,ARIMA-BP 加權(quán)組合模型的預(yù)測(cè)值可表示為:
1.3.2 ARIMA-BP 殘差優(yōu)化組合模型
殘差優(yōu)化是一種“誤差補(bǔ)償”的思想,第一種模型得到的預(yù)測(cè)值與真實(shí)值的誤差輸入到第二種模型進(jìn)行殘差優(yōu)化,使兩種單一模型充分發(fā)揮各自?xún)?yōu)勢(shì),實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ)。本文將其應(yīng)用于鐵路貨運(yùn)量研究中,假設(shè)鐵路貨運(yùn)量時(shí)間序列為Y,由線性部分與非線性?xún)刹糠纸M成,則ARIMA-BP 殘差優(yōu)化組合模型構(gòu)建步驟如下:
評(píng)價(jià)指標(biāo)使用平均絕對(duì)誤差MAE、平均絕對(duì)百分比誤差MAPE 和均方根誤差RMSE,為衡量模型精度的常用指標(biāo),MAE、MAPE 和RMSE 越小,即誤差越小,模型預(yù)測(cè)精度就越高。每個(gè)指標(biāo)計(jì)算公式如下:
本文選取中國(guó)鐵路貨運(yùn)量1980-2020 年的數(shù)據(jù)進(jìn)行建模分析,數(shù)據(jù)來(lái)源為國(guó)家統(tǒng)計(jì)局中國(guó)統(tǒng)計(jì)年鑒。
2.1.1 數(shù)據(jù)平穩(wěn)性判斷
判斷數(shù)據(jù)平穩(wěn)性,對(duì)鐵路貨運(yùn)量原始數(shù)據(jù)做序列圖,原始序列圖數(shù)據(jù)波動(dòng)較大,是不平穩(wěn)序列。本文選取差分的方法對(duì)其進(jìn)行平穩(wěn)化處理,得到一階差分序列圖P>0.05序列不平穩(wěn),因此進(jìn)行二階差分,序列在零上下波動(dòng),并且進(jìn)行單位根檢驗(yàn)可得t 統(tǒng)計(jì)量的值均小于3個(gè)顯著水平的單位根檢驗(yàn)的臨界值,p 值為0.000 0<0.05,說(shuō)明不存在單位根,是平穩(wěn)序列。
Table 1 Second-order difference ADF test results表1 二階差分ADF 檢驗(yàn)結(jié)果
2.1.2 模型定階
從上文可知,二階差分后序列平穩(wěn),因此d=2。通過(guò)對(duì)序列二階差分的自相關(guān)(ACF)和偏自相關(guān)(PACF)圖進(jìn)行分析可以看出,自相關(guān)和偏自相關(guān)系數(shù)都在二階之后落入置信區(qū)間,因此判定所建模型為ARIMA(2,2,2)。
2.1.3 模型擬合
基于模型ARIMA(2,2,2)對(duì)數(shù)據(jù)進(jìn)行擬合得到模型參數(shù),并且都通過(guò)了顯著性檢驗(yàn),結(jié)果如表2 所示,由此可得ARIMA(2,2,2)模型。
Fig.1 First-order difference ACF and PACF diagrams圖1 一階差分ACF 圖及PACF 圖
Table 2 Parameter estimation results of ARIMA(2,2,2)model表2 ARIMA(2,2,2)模型參數(shù)估計(jì)結(jié)果
2.1.4 殘差檢驗(yàn)
模型可行性判斷還需要進(jìn)行殘差檢驗(yàn),通過(guò)對(duì)殘差的自相關(guān)和偏自相關(guān)檢驗(yàn)發(fā)現(xiàn),p 值都大于0.05,說(shuō)明殘差部分不相關(guān),模型擬合度較好,檢驗(yàn)通過(guò)模型可用于預(yù)測(cè)。
BP 殘差優(yōu)化與上文通過(guò)BP 對(duì)鐵路貨運(yùn)量原始數(shù)據(jù)進(jìn)行建模訓(xùn)練過(guò)程一樣,通過(guò)ARIMA 模型預(yù)測(cè),得到鐵路貨運(yùn)量真實(shí)值與預(yù)測(cè)值的殘差,通過(guò)BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到殘差的預(yù)測(cè)值,將得到的殘差預(yù)測(cè)值與ARIMA 模型預(yù)測(cè)值相加,得到組合模型的預(yù)測(cè)結(jié)果。
4 種模型的預(yù)測(cè)結(jié)果如圖2—圖5 所示。從單一模型看,ARIMA 和BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值與實(shí)際值的變化趨勢(shì)總體保持一致,在2010 年以前預(yù)測(cè)結(jié)果和真實(shí)值擬合精度較高,而在2010 年以后,雖然變化趨勢(shì)一致,但預(yù)測(cè)結(jié)果和真實(shí)值相差較大。圖3 為ARIMA-BP 加權(quán)組合模型的預(yù)測(cè)結(jié)果,其結(jié)果比單一模型更接近真實(shí)值,2010 年以后的預(yù)測(cè)值與真實(shí)值的波動(dòng)程度也較小。從圖4 可以看出,ARIMA-BP 殘差優(yōu)化組合模型相比其他3 種模型整體精度更高,并且2016 年以后的預(yù)測(cè)值和真實(shí)值的曲線幾乎重合。
Fig.2 ARIMA prediction results圖2 ARIMA 預(yù)測(cè)結(jié)果
Fig.3 Prediction results of BP neural network圖3 BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果
Fig.4 ARIMA-BP weighted prediction results圖4 ARIMA -BP 加權(quán)預(yù)測(cè)結(jié)果
Fig.5 Optimized prediction results of ARIMA-BP residuals圖5 ARIMA -BP 殘差優(yōu)化預(yù)測(cè)結(jié)果
根據(jù)表3 比較4 種模型的評(píng)價(jià)指標(biāo),兩種單一模型相比,預(yù)測(cè)結(jié)果相似,但ARIMA 比BP 的3 種評(píng)價(jià)指標(biāo)低224.33、0.05%、500.08;兩個(gè)組合模型和兩個(gè)單一模型相比,組合模型的表現(xiàn)效果都比單一模型的表現(xiàn)效果好;兩個(gè)組合模型相比,ARIMA-BP 殘差優(yōu)化模型預(yù)測(cè)精度最高、誤差較小,MAE MAPE RMSE分別為5135.90、0.0209、8462.49,比另一種加權(quán)組合模型的3 種評(píng)價(jià)指標(biāo)低1 286.04、0.23%、812.77。
整體來(lái)看,4 種模型在鐵路貨運(yùn)量預(yù)測(cè)方面的表現(xiàn)都較好,MAPE 的值都保持在5%以?xún)?nèi),而殘差優(yōu)化的組合模型精度最高、誤差最小。
Table 3 Evaluation indexes of the model表3 模型的評(píng)價(jià)指標(biāo)
本文針對(duì)鐵路貨運(yùn)量的年度歷史數(shù)據(jù)及其本身特點(diǎn),使用時(shí)間序列及神經(jīng)網(wǎng)絡(luò)方法,將ARIMA 模型和BP 神經(jīng)網(wǎng)絡(luò)通過(guò)不同的方式進(jìn)行組合,得到ARIMA-BP 加權(quán)模型和ARIMA-BP 殘差優(yōu)化模型,分別對(duì)鐵路貨運(yùn)量數(shù)據(jù)的線性和非線性部分進(jìn)行建模并與ARIMA 模型和BP 神經(jīng)網(wǎng)絡(luò)傳統(tǒng)單一模型進(jìn)行對(duì)比。試驗(yàn)結(jié)果表明,組合模型結(jié)果優(yōu)于單一模型,并且ARIMA-BP 殘差優(yōu)化模型的預(yù)測(cè)精度最高。
本文重點(diǎn)關(guān)注的是貨運(yùn)量數(shù)據(jù)本身的線性和非線性關(guān)系,但鐵路貨運(yùn)量受到很多因素的影響,比如節(jié)假日、貨運(yùn)價(jià)格等,下一步將相關(guān)影響因素納入模型中,完善模型,進(jìn)一步提高預(yù)測(cè)精度。同時(shí),本文構(gòu)建的模型在鐵路貨運(yùn)量預(yù)測(cè)方面有效,但是對(duì)于其他領(lǐng)域數(shù)據(jù)預(yù)測(cè)的有效性還有待驗(yàn)證。此外,本文設(shè)計(jì)的組合模型由兩個(gè)單一模型構(gòu)成,可以考慮引入其他模型建立新的組合模型,以豐富理論模型,使結(jié)果更加準(zhǔn)確。