馬 力 杭良文 中國鐵路上海局集團有限公司南京東機輛段
在鐵路運輸管理中,各級領導經(jīng)常會要求統(tǒng)計部門提供在未來一段時間內(nèi)運輸指標完成情況預測,以便領導在調整運力、技術改造、新線建設等決策時參考。影響鐵路運輸指標完成情況的因素較多,例如:宏觀經(jīng)濟政策、工業(yè)生產(chǎn)景氣程度、節(jié)假日、天氣變化、春運、學生客流等,這些因素包含長期趨勢影響、季節(jié)性變化、隨機性等變化特點,數(shù)據(jù)變化復雜不能簡單用公式描述。對于運輸數(shù)據(jù)預測擬合,是數(shù)據(jù)分析的重要目的之一,也是運輸數(shù)據(jù)發(fā)展趨勢預測的重要手段。傳統(tǒng)的時間序列數(shù)據(jù)分析模型較多,本文主要針對指數(shù)平滑法模型在擬合鐵路運輸數(shù)據(jù)的作用效果進行研究。
指數(shù)平滑法是分析數(shù)據(jù)的常用方法。主要分為單參數(shù)指數(shù)平滑法、雙參數(shù)指數(shù)平滑法等。本文分別使用兩種方法進行分析。為了更好評價數(shù)據(jù)擬合結果的優(yōu)劣,定義評價指標平均誤差比例、估計標準誤差。
單參數(shù)指數(shù)平滑法是將一段時期的預測值與實際值的線性組合作為i+1期的預測值,其預測模型為:
式中,yi表示第i期的實際值;表示第i期的一次指數(shù)平滑值(預測值);a表示平滑系數(shù)(0<a<1)。
雙參數(shù)指數(shù)平滑法又稱Holt 方法,常見的雙參數(shù)指數(shù)平滑法有加法模型和乘法模型。乘法模型可以看成是在加法模型基礎上取對數(shù),所以乘法模型是加法模型的特殊形式。本文選用加法模型,得到雙參數(shù)指數(shù)平滑法計算公式為:
如圖1所示為南京東機務段2017年-2019年全段機車總走行數(shù)據(jù)變化。機車總走行是反映運輸工作量的基本指標之一,也是反應各類運用機車本務走行公里與輔助走行公里之和的重要數(shù)據(jù)。從圖中可以看出,機車總走行數(shù)據(jù)主要有長期趨勢變化、季節(jié)性周期波動以及隨機性變化的特點。從長期來看,南京東機務段機車總走行公里呈上升趨勢,主要是因為長三角地區(qū)人口居住密集、工業(yè)基礎較好、商品貿(mào)易發(fā)達,受到地方經(jīng)濟輻射,市場需求較大,鐵路線路里程不斷增加,鐵路運輸量不斷增加。運輸數(shù)據(jù)季節(jié)性波動主要體現(xiàn)在每年2 月(春運)、9 月(學生開學季)以及10 月(國慶黃金周)會出現(xiàn)運輸高峰,而在每年4月、6月、11月運輸數(shù)據(jù)則相應較低,進入運輸?shù)?。此外受到市場?jīng)濟波動和國家政策調整的影響(例如:鋼鐵去產(chǎn)能、煤炭減產(chǎn)等),運輸數(shù)據(jù)也存在一定隨機性變化。
圖1 2017年—2019年機車總走行數(shù)據(jù)變化
單參數(shù)指數(shù)平滑法是對時間序列數(shù)據(jù)由近及遠采取具有逐步衰減性質的加權處理。每一期預測值都是上一期實際值與預測值的加權平均。其權數(shù)由近及遠按照幾何級數(shù)的衰減,特點是近期權數(shù)較大,遠期權數(shù)較小。加權系數(shù)符合指數(shù)規(guī)律,又具有平滑數(shù)據(jù)的作用。但是不能區(qū)分長期趨勢和季節(jié)變化,而是將長期趨勢、季節(jié)變化 、隨機變化等因素都看成一個整體進行處理。
使用指數(shù)平滑法時數(shù)據(jù)處理的關鍵是確定一個合適的平滑系數(shù),本文對平滑系數(shù)分別取0.2、0.5、0.8 工況下,分別擬合機車總走行數(shù)據(jù),得到結果如圖2 所示。從圖中可以看出不同指數(shù)平滑系數(shù)下,都能對機車總走行數(shù)據(jù)進行擬合且與實際值間都存在一定誤差。同時,隨著平滑系數(shù)增加,數(shù)據(jù)波動性越弱,數(shù)據(jù)衰減較強。
圖2 不同平滑系數(shù)下單參數(shù)指數(shù)平滑預測值與實際值對比
為了具體分析不同平滑系數(shù)a情況下數(shù)據(jù)擬合的效果,對不同平滑系數(shù)a情況下實際值與預測值間的平均誤差比例、估計標準誤差進行計算,將數(shù)據(jù)匯總得到表1。
表1 不同平滑系數(shù)a下的誤差情況
從表1 可以看出,當平滑系數(shù)a=0.5 時估計標準誤差最小,當平滑系數(shù)a=0.2 時平均誤差比例最小??紤]平均誤差比例是每一期誤差比例的平均數(shù),平均數(shù)易受到極值影響,不如估計標準誤差更具有統(tǒng)計學的穩(wěn)定性。所以認為估計標準誤差小的平滑系數(shù)更佳。如果平滑系數(shù)取值接近1 時,數(shù)據(jù)變化幅度較大適用于時間數(shù)列數(shù)據(jù)變化劇烈的情況,以便很快跟隨其變化。取值接近0 時,則各期數(shù)據(jù)的作用緩慢減弱,呈比較平穩(wěn)的狀態(tài)。而運輸數(shù)據(jù)的變化具有長期趨勢增加、短期波動較大的特點,則不能反應數(shù)據(jù)的波動性。在實際應用中擬合機車總走行數(shù)據(jù),平滑系數(shù)的取值需要反復比較確定,數(shù)值偏大或偏小都會增加估計標準誤差。
通過EXCEL規(guī)劃計算,當平滑系數(shù)取值0.61時平均誤差比例和估計標準誤差分別為0.692%、934.7,此時計算得到的各期預測值與實際觀測值之間的誤差最小,效果最佳。平滑系數(shù)的取值直接影響過去各期數(shù)據(jù)對預測值的作用,當使用單參數(shù)指數(shù)平滑法時近期數(shù)據(jù)作用最大,遠期各數(shù)據(jù)的作用迅速衰減,所以單參數(shù)指數(shù)平滑法適合短期數(shù)據(jù)預測,預測數(shù)據(jù)期數(shù)越多準確性越低。
雙參數(shù)指數(shù)平滑法將數(shù)據(jù)的影響因素分解為“平滑值+趨勢值”,然后通過對數(shù)據(jù)的平滑值和趨勢值分別進行加權處理。由于兩個參數(shù)加權作用,數(shù)據(jù)衰減程度不會較快遞減,避免了單參數(shù)指數(shù)平滑法中近期權數(shù)較大遠期權數(shù)較小情況,強化了數(shù)據(jù)平滑的作用。
使用指數(shù)平滑的關鍵點是:①初始平滑值和趨勢值的確定,②確定兩個合適的平滑系數(shù)a、β。如果確定的平滑值和趨勢值不能很好的代表數(shù)據(jù)特點,后期的數(shù)據(jù)發(fā)展趨勢會偏離實際值。平滑系數(shù)a、β代表后期數(shù)據(jù)的衰減和加權變化,其特點是反應季節(jié)變化和趨勢變化的影響因子在數(shù)據(jù)發(fā)展中所占的加權比例。對于初始平滑值和趨勢值的處理,常規(guī)做法是運用線性方程法確定數(shù)據(jù)的初始平滑值和趨勢值。因為回歸方程的特點就是利用最小二乘法對參數(shù)進行估計,擬合的平滑值和趨勢值保持偏導數(shù)為零的特點。本文也采用回歸方程法確定初始平滑值和趨勢值。而對于平滑系數(shù)a、β 處理,采用枚舉法確定。利用EXCEL 進行規(guī)劃求解,以估計標準誤差最小為主要目標,查找分析最佳的平滑系數(shù)a、β 取值。通過計算發(fā)現(xiàn)當a=0.082,β=0.013 時,此時平均誤差比例和估計標準誤差分別為0.223%、735.89,估計標準誤差達到最小值。雙參數(shù)指數(shù)法預測值和實際值對比結果如圖3所示,預測值過濾了一定的隨機波動,使得數(shù)據(jù)結果更加平滑,同時也能反應出數(shù)據(jù)的季節(jié)變化和長期趨勢變化的特點。
圖3 雙參數(shù)指數(shù)平滑預測值與實際值對比
針對本文涉及的兩種指數(shù)平滑法,分別取估計標準誤差最小時的預測數(shù)據(jù),將主要評價指標對比得到表2。
從表2可以看出雙參數(shù)指數(shù)平滑法預測結果比單參數(shù)指數(shù)平滑法預測結果的誤差更小。單參數(shù)指數(shù)平滑法通過擬合使得數(shù)據(jù)中短期偶然性因素的影響被削弱,從而顯示出數(shù)據(jù)在較長時間的基本發(fā)展趨勢。對預測結果的準確性會隨著期數(shù)增加逐級降低,使得觀察值離預測值時期越久遠權數(shù)變得越小,雙參數(shù)指數(shù)平滑法其基本原理是把具有長期趨勢、季節(jié)性變化的時間序列進行分解,通過數(shù)據(jù)處理可以過濾掉隨機波動的影響。雙參數(shù)指數(shù)平滑法克服了單參數(shù)指數(shù)平滑法不能區(qū)別長期趨勢和循環(huán)變動的缺點,也解決了一個參數(shù)權數(shù)比重逐漸變小的問題。所以從預測結果看雙參數(shù)指數(shù)平滑法比單參數(shù)指數(shù)平滑法更好,更適合鐵路運輸指標預測分析。
表2 單參數(shù)和雙參數(shù)指數(shù)平滑法的誤差情況對比
通過單參數(shù)和雙參數(shù)指數(shù)平滑法模型在預測鐵路運輸數(shù)據(jù)的作用效果進行研究分析,得到的結論有:
(1)指數(shù)平滑法可以過濾數(shù)據(jù)隨機性變化,使得預測數(shù)據(jù)能夠在一定誤差范圍內(nèi)反應周期性(季節(jié)性)和長期趨勢變化特點。
(2)單參數(shù)指數(shù)平滑法在預測數(shù)據(jù)時,數(shù)據(jù)期數(shù)越多衰減越大準確性降低,不適合長期預測。
(3)雙參數(shù)指數(shù)平滑法在預測數(shù)據(jù)時,可以分解平滑值和趨勢值,通過兩個參數(shù)加權作用使數(shù)據(jù)變化更加平滑,降低數(shù)據(jù)衰減帶來的誤差,更貼近實際值。
(4)通過兩種方法對鐵路運輸數(shù)據(jù)的擬合,從誤差結果分析,雙參數(shù)指數(shù)平滑法更適合用于數(shù)據(jù)的預測分析。