郭婷婷,宇世航
基于修正動態(tài)組合模型對公共交通客運量的預測
郭婷婷,宇世航
(齊齊哈爾大學 理學院,黑龍江 齊齊哈爾 161006)
針對公共交通客運量的預測問題,結(jié)合ARIMA、灰色預測以及BP神經(jīng)網(wǎng)絡的優(yōu)勢,采用臨近期的誤差平方和來計算動態(tài)權(quán)重,將突發(fā)事件定義為影響因子,建立了修正動態(tài)加權(quán)組合模型.選取北京市1978—2021年公共交通客運量進行實證分析.實證分析結(jié)果表明,修正動態(tài)加權(quán)組合模型的預測效果比單一模型和固定權(quán)重組合模型更好.
公共交通客運量;修正動態(tài)組合模型;ARIMA模型;灰色預測模型;BP神經(jīng)網(wǎng)絡模型;突發(fā)事件
城市公共交通客運量是城市公共交通規(guī)劃的重要依據(jù),也是確定行車計劃,經(jīng)濟合理地使用車輛,改善提高公共交通質(zhì)量所不可缺少的數(shù)據(jù).城市公共交通是指在城市人民政府確定的區(qū)域內(nèi)的公共汽(電)車(含有軌電車)、城市軌道交通系統(tǒng)和有關(guān)設施.城市公共交通是城市基礎(chǔ)設施的重要組成部分,對城市政治經(jīng)濟、文化教育和科學技術(shù)等方面的發(fā)展影響極大,也是城市建設的一個非常重要的方面.發(fā)展城市交通不僅是緩解城市交通擁堵的有效措施,也是改善城市居住環(huán)境,促進城市可持續(xù)發(fā)展的必然要求.
新冠肺炎疫情對于我國各行各業(yè)都產(chǎn)生了不小的影響,其中公共交通運輸業(yè)也受到了很大的沖擊.公共交通運輸業(yè)屬于國民基礎(chǔ)產(chǎn)業(yè),在社會再生產(chǎn)過程中起到先導性和戰(zhàn)略性作用.對于交通運輸業(yè)來說,建立有效應對突發(fā)狀況的體系,降低突發(fā)事件對交通運輸?shù)挠绊?,保障公共交通運輸?shù)恼_\行至關(guān)重要.因此,在預測客運量的過程中應考慮突發(fā)事件帶來的影響,單純依靠時間序列的預測會導致結(jié)果偏離實際情況.
目前,對于公共交通客運量的預測研究國內(nèi)外學者已經(jīng)進行了大量的工作,但多數(shù)集中于單一模型的研究.文獻[1]使用網(wǎng)絡克里金法估計乘客量,用網(wǎng)絡距離來反映地鐵站只通過地鐵隧道連接的事實.徐文遠[2]等對公共交通客運量的影響因素進行分析,建立ARMA時間序列模型對公交客流量進行擬合和預測.丁聰[3]等基于梯度提升和隨機森林的混合模型對日均客流量進行預測,發(fā)現(xiàn)此模型相較于常規(guī)ARIMA模型和隨機森林模型具有更好的適應性.王瑩[4]等總結(jié)北京地鐵進站客流量的波動規(guī)律,選用季節(jié)時間序列模型對北京地鐵進站客流量進行時間序列建模.盧小蘭[5]等使用Holt-Winters模型和SARIMA模型分別預測鐵路的月度客運量,并構(gòu)建組合預測模型.張健[6]等采用一種時空模型平均方法,有效地降低了由于航空客運量的結(jié)構(gòu)性變化和預測模型不確定性等導致的預測風險,進而做出精準而穩(wěn)定的客運量預測.近年來,組合模型被廣泛地應用于各種預測問題中[7],組合模型能夠結(jié)合單一模型的優(yōu)點,避免其局限性.關(guān)于突發(fā)事件方面,汪志紅[8]基于新冠肺炎疫情對日常生活的影響構(gòu)建了ARIMAX干預模型,模型顯示我國鐵路客運正在緩慢持續(xù)回暖.
為檢驗模型的準確性,使用關(guān)聯(lián)度檢驗法、后驗差比值和小誤差概率檢驗灰色預測模型的效果.
神經(jīng)網(wǎng)絡方法是一種具有高度靈活性的非線性擬合方法,理論上可以擬合任何函數(shù),并且達到非常高的擬合精度[10].BP神經(jīng)網(wǎng)絡是一種按誤差反向傳播(簡稱誤差反傳)訓練的多層前饋網(wǎng)絡,它的基本思想是梯度下降法,利用梯度搜索技術(shù),以期使網(wǎng)絡的實際輸出值和期望輸出值的誤差均方差為最?。?/p>
BP神經(jīng)網(wǎng)絡是在輸入層與輸出層之間增加若干層神經(jīng)元(見圖1),它們與外界沒有直接關(guān)系,但它的狀態(tài)可以改變,從而影響輸入層與輸出層之間的關(guān)系.其過程主要分為2個階段,第1階段是信號的前向傳播,從輸入層經(jīng)過隱含層,最后到達輸出層;第2階段是誤差的反向傳播,從輸出層到隱含層,最后到輸入層,依次調(diào)節(jié)隱含層到輸出層的權(quán)重和偏置,輸入層到隱含層的權(quán)重和偏置.神經(jīng)網(wǎng)絡的擬合過程就是不斷地優(yōu)化連接相應層神經(jīng)元之間的參數(shù).
圖1 BP神經(jīng)網(wǎng)絡結(jié)構(gòu)
為了加快訓練速度,避免陷入局部最小值和改善其他能力,學習算法可采用帶動量的批處理梯度下降法[11].
1.4.2 影響因子新冠肺炎疫情作為突發(fā)公共衛(wèi)生事件,從多個渠道給經(jīng)濟運行帶來負面影響.公共交通客運量能夠直觀地反映出此次突發(fā)事件對于人民生活的影響.
采取線性回歸將新冠疫情對公共交通客運量的影響描述出來,之后對正常情況下的公共交通客運量進行預測,根據(jù)不同月份公共交通客運量的占比,計算出月度公共交通客運量的預測值,通過對比,可以得出新冠疫情對公共交通客運量的影響值,影響值可以用于修正預測模型,更準確地預測突發(fā)事件影響下的公共交通客運量.具體計算公式為
文中使用的1978—2021年北京市公共交通客運量數(shù)據(jù)來源于北京市統(tǒng)計年鑒,新冠肺炎病例數(shù)據(jù)來源于銳思數(shù)據(jù)庫 (www.resset.com).
對數(shù)據(jù)進行預測,利用Forecast中的ARIMA函數(shù)進行預測分析,結(jié)果見圖2,其中1~39期分別為1978—2016年,向后1~3期分別為2017—2019年,其公共交通客運量預測值均為734 953萬人,預測誤差平方和在0.002 6~0.009 6之間,模型預測情況良好.
圖2 ARIMA模型公共交通客運量預測擬合
2014—2018年公共交通客運量的預測值和真實值擬合程度良好(見圖3),公共交通客運量的預測值分別為815 849,741 482,728 763.1,716 262.3,703 975.9萬人.
圖3 GM(1,1)灰色模型公共交通客運量預測擬合
訓練數(shù)據(jù)為1999—2016年的歸一化數(shù)據(jù),預測數(shù)據(jù)為2017—2019年的歸一化數(shù)據(jù),根據(jù)輸入節(jié)點的不同調(diào)整輸入數(shù)據(jù),輸出數(shù)據(jù)為1999—2019年的數(shù)據(jù).采用的BP神經(jīng)網(wǎng)絡學習算法為LM(Leneberg-Marquardt)算法,設定網(wǎng)絡的最大訓練次數(shù)為1 000,學習速率為0.01,訓練目標誤差為0.01.
一般情況下,隱含層節(jié)點數(shù)大于輸入層節(jié)點數(shù),網(wǎng)絡結(jié)構(gòu)的穩(wěn)定性比較好,但當隱含層節(jié)點數(shù)為輸入層節(jié)點數(shù)的4倍以上時,網(wǎng)絡會出現(xiàn)過擬合和穩(wěn)定性變差的情況.當輸入層節(jié)點數(shù)為3,隱含層節(jié)點數(shù)為4時,平均相對誤差最小,為0.004 2,BP神經(jīng)網(wǎng)絡的穩(wěn)定性較好,可以獲得較好的結(jié)果.
使用訓練好的BP神經(jīng)網(wǎng)絡模型對2017—2019年的公共交通客運量進行預測,結(jié)果分別為713 020,709 960,712 160萬人.驗證樣本的平均誤差率為0.00 428,與單個誤差率均小于目標誤差0.01.
3種模型的預測結(jié)果表明,直至2019年,預測的精度都是良好的,但自2020年開始,預測值與真實值的誤差急劇增大(見圖5).這是由于在2020—2021年期間,因為新冠肺炎疫情的影響,公共交通客運量大幅度降低,因此在接下來的預測過程中,應考慮這一突發(fā)事件給公共交通客運量帶來的影響,對模型進行修正.
圖4 BP神經(jīng)網(wǎng)絡訓練集的預測值與實際值
圖5 3種單一模型2020—2021年公共交通客運量的預測值與真實值
表1 前3年的預測誤差平方和
表2 2017—2019年動態(tài)組合模型的權(quán)重
根據(jù)表2計算的動態(tài)權(quán)重系數(shù),得出的動態(tài)組合預測模型為
使用組合模型預測2017—2019年的公共交通客運量,預測結(jié)果及相對誤差見表3.
表3 動態(tài)組合模型公共交通客運量預測結(jié)果及相對誤差
4種模型公共交通客運量的預測值與真實值對比見圖6.
圖6 4種模型的公共交通客運量預測值與真實值
組合模型的相對誤差小于其他3種單一模型的相對誤差,由圖6也可以看出,組合模型的擬合效果優(yōu)于其他3種單一模型,集合了3種模型的優(yōu)點,降低單一模型的局限性.因此選用組合模型預測2020—2021年沒有新冠疫情的情況下可以達到的公共交通客運量,并以此結(jié)果計算對比出新冠疫情對公共交通客運量的影響.
根據(jù)3種模型的預測結(jié)果,計算預測誤差平方和(見表4),確定動態(tài)組合模型的權(quán)重(見表5),利用動態(tài)組合預測模型公式,計算出2020—2021年的公共交通客運量預測值.
表4 3種模型的預測誤差平方和
表5 2020—2021年動態(tài)組合模型的權(quán)重
根據(jù)動態(tài)組合預測模型公式(6),可計算得出2020年和2021年的公共交通客運量預測值分別為717 778.496,722 946.764 6萬人,而實際上2020年和2021年北京市實際公共交通客運量只有411 967,557 708萬人,可見疫情對公共交通的影響巨大.
2.4.2 影響因子研究表明,北京市公共交通客運量受到了疫情的影響,假設其他的影響因素未發(fā)生改變,只考慮新冠疫情對公共交通客運量的影響.使用2020-01—2022-03每月新冠確診新增人數(shù)作為影響因素對公共交通客運量做線性回歸,結(jié)果見表6.
表6 月公共交通客運量線性回歸結(jié)果
注:**表示在1%顯著水平下非常顯著.
由表6可以看出,每月新冠確診新增人數(shù)對月公共交通客運量的線性回歸模型公式為
為了更詳細地反映出新冠疫情對于公共交通客運量的影響情況,以及對預測值進行修正,進一步探討2020—2021年的月度公共交通客運量預測值.由動態(tài)組合模型得出預測值,計算2020—2021年每個月公共交通客運量占當年公共交通客運量的占比的平均值,得出每個月的預測值,從而計算出新冠疫情對公共客運量的影響值,具體結(jié)果為
2021年每月的公共交通客運量預測值以及影響值見表7.
表7 2021年新冠疫情對月公共交通客運量影響
由表7可以看出,在新冠疫情的影響下,2021年的北京市公共交通客運量隨之產(chǎn)生衰減,1月時,本應因春運而上升的公共交通客運量,由于出現(xiàn)大量新增病例,而導致當期公共交通客運量較以往春運期間公共交通客運量出現(xiàn)很大程度的下跌;2~5月,由于新增人數(shù)非常少,公共交通客運量出現(xiàn)了上升趨勢;5~12月國家出臺應對疫情的相應政策,為響應國家號召,人們盡量減少出行,這也導致了公共交通客運量相對以往年份減少較為明顯.
[1] ZHANG D P,WANG X K.Transit ridership estimation with network Kriging:a case study of Second Avenue Subway,NYC[J].Journal of Transport Geography,2014(41):107-115.
[2] 徐文遠,鄧春瑤.公交客運量的時間序列預測模型[J].遼寧工程技術(shù)大學學報(自然科學版),2014,33(12):1715-1720.
[3] 丁聰,倪少權(quán),呂紅霞.基于梯度提升的城市軌道交通客流量預測分析[J].城市軌道交通研究,2018,21(9):60-63.
[4] 王瑩,韓寶明,張琦,等.基于SARIMA模型的北京地鐵進站客流量預測[J].交通運輸系統(tǒng)工程與信息,2015,15(6):205-215.
[5] 盧小蘭,張可心.基于IOWGA算子的鐵路月度客運量的組合預測[J].數(shù)學的實踐與認識,2020,50(6):120-131.
[6] 張健,孫玉瑩,張新雨,等.基于時變模型平均方法的我國航空客運量預測[J].系統(tǒng)工程理論與實踐,2020,40(6):1509-1519.
[7] 孫彩云,劉翔宇.基于動態(tài)組合模型對河北省人均GDP的預測研究[J].數(shù)理統(tǒng)計與管理,2022(5):1-10.
[8] 汪志紅.突發(fā)事件對我國鐵路客運量的干預特征研究[J].鐵道運輸與經(jīng)濟,2022,44(1):44-51.
[9] 楊婉瑩.新冠肺炎對交通運輸業(yè)影響的預測與分析[J].中國市場,2021(27):136-137.
[10] 王方.基于神經(jīng)網(wǎng)絡的2020年奧運會獎牌成績預測[J].統(tǒng)計與決策,2019,35(5):89-91.
[11] 馮樹民,慈玉生.居民出行產(chǎn)生量BP神經(jīng)網(wǎng)絡預測方法[J].哈爾濱工業(yè)大學學報,2010,42(10):1624-1627.
[12] 馮增喜,任慶昌.基于動態(tài)組合殘差修正的預測方法[J].系統(tǒng)工程理論與實踐,2017,37(7):1884-1891.
Forecast of public transport passenger volume based on modified dynamic combination model
GUO Tingting,YU Shihang
(School of Science,Qiqihar University,Qiqihar 161006,China)
Aiming at the forecasting problem of public transport passenger volume,combining the advantages of ARIMA,grey prediction and BP neural network,the dynamic weight is calculated by the sum of the squares of errors in the near period,the modified dynamic weighted combination model is established by defining emergency events as impact factors.The public transport passenger volume of Beijing from 1978 to 2021 is selected for empirical analysis.The empirical analysis results show that the modified dynamic weighted combination model has better prediction effect than the single model and the fixed weight combination model.
public transport passenger volume;modified dynamic combination model;ARIMA model;grey predictive model;Back-propagation neural network model;emergency event
1007-9831(2023)01-0031-07
TP18
A
10.3969/j.issn.1007-9831.2023.01.007
2022-09-09
黑龍江省自然科學基金項目(LH2019A027)
郭婷婷(1998-),女,黑龍江齊齊哈爾人,在讀碩士研究生,從事時間序列分析研究.E-mail:13895966506@163.com
宇世航(1971-),女,黑龍江齊齊哈爾人,教授,博士,從事整值時間序列和復雜數(shù)據(jù)統(tǒng)計推斷研究.E-mail:qqhrysh@163.com