王 忻,李 曄,張思韜,張凌云
(鐵科院(北京)工程咨詢有限公司,北京 100081)
我國城市化正進入高速發(fā)展時期,越來越多的城市建立了城市軌道交通系統(tǒng),并且城市軌道交通在公共交通中的作用越來越顯著,“智慧化”成為城市軌道交通未來的發(fā)展趨勢[1]。而精準的客流預(yù)測是建設(shè)智慧化城市軌道交通的重要前提,能實現(xiàn)高峰客流的提前感知,可為運營期間進行動態(tài)運力調(diào)整提供數(shù)據(jù)基礎(chǔ),進而為城市軌道交通的安全高效運營提供保障[2]。
目前,短時客流預(yù)測主要基于2類模型:傳統(tǒng)統(tǒng)計模型和機器學習模型。傳統(tǒng)統(tǒng)計模型從機理上對線性系統(tǒng)進行刻畫,具有原理簡單、方便計算等優(yōu)點。蔡昌俊等構(gòu)建差分整合移動平均自回歸模型(ARIMA)實現(xiàn)進出站客流的精準預(yù)測[3]。邵必林等在ARIMA模型的基礎(chǔ)上應(yīng)用季節(jié)移動平均自回歸模型(SARIMA)實現(xiàn)客流數(shù)據(jù)線性建模[4]。帥春燕等基于支持向量回歸模型實現(xiàn)站點短時進出站客流預(yù)測[5]。但傳統(tǒng)數(shù)理統(tǒng)計模型存在對實際問題進行簡化和假設(shè)的問題,對于地鐵時序客流重的非線性特征難以刻畫,導(dǎo)致預(yù)測精度不高[6]。因此,隨著計算機技術(shù)的發(fā)展,基于機器學習模型的預(yù)測算法成為目前較為流行的客流預(yù)測算法,對于交通客流復(fù)雜時空特征具有較好的捕獲效果[7]。魏姝瑤等將長短期記憶神經(jīng)網(wǎng)絡(luò)(LSMT)與傳統(tǒng)統(tǒng)計模型結(jié)合提出SARIMA-LSTM模型[8],但是該模型缺少對空間特征的刻畫。Cao等利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)提取空間特征提升了預(yù)測效果[9],但對時間特征刻畫不足。唐繼強等利用圖卷積結(jié)合LSTM進行預(yù)測網(wǎng)絡(luò)搭建,同時考慮了客流的時空特征[10],但僅為圖卷積模塊和LSTM模塊的拼接,并沒實現(xiàn)模型的深度融合。
由于城市軌道交通進出站客流是一個復(fù)雜的非線性系統(tǒng),在時間維度上存在短期波動性以及長期的周期性,同時在空間上由于站點之間的相關(guān)性導(dǎo)致站點客流與站點客流之間具有復(fù)雜的空間相關(guān)性。目前研究忽略了客流之間的相互影響,缺少對站點短時客流之間的時空關(guān)系深入挖掘,無法實現(xiàn)時空特征的深度融合,導(dǎo)致目前短期客流預(yù)測存在精度不高的問題。
綜上所述,本文提出一種基于多層卷積長短期記憶神經(jīng)網(wǎng)絡(luò)(ConvLSTM)的城市軌道交通短時客流預(yù)測模型,充分考慮時序客流的時間特征和站點與站點間的空間特征,實現(xiàn)了時間特征和空間特征的刻畫和融合,相比于現(xiàn)有模型具有更好預(yù)測效果。
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變體,是處理時間序列預(yù)測問題的常用機器學習方法,解決了RNN因為梯度爆炸和梯度消失導(dǎo)致的無法保存長期序列特征的問題[11],如圖1所示。ConvLSTM將LSTM拓展至二維,將LSTM中的一部分全連接過程替換為卷積運算,強化了LSTM無法刻畫的空間特征,可處理多維數(shù)據(jù)的時序預(yù)測問題[12],如圖2所示。
圖1 長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖2 卷積長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
ConvLSMT的計算原理類似于LSTM,具有3種類型的門結(jié)構(gòu):遺忘門、輸入門和輸出門。遺忘門決定應(yīng)丟棄或保留哪些信息,控制前一個隱藏狀態(tài)的信息和當前輸入信息傳遞的保留程度,如式(1)所示:
式(1)中,ft為遺忘門,控制過去輸入信息累積;σ為sigmoid激活函數(shù);Xt為時間t的輸入矩陣序列;Wx為輸入序列的卷積權(quán)重;Ht-1為前一時刻隱藏狀態(tài)單元;Wh為隱藏單元的卷積權(quán)重;Ct-1為前一時刻神經(jīng)元狀態(tài)單元;Wf為遺忘門卷積權(quán)重;bf為遺忘門偏置;*為卷積運算;為哈達瑪積運算。
輸入門用于決定輸入神經(jīng)元狀態(tài)的信息,控制前一層隱藏狀態(tài)的信息和當前輸入的信息傳遞后的信息更新程度,如式(2)所示:
式(2)中,it為輸入門,控制當前輸入信息保留多少;Wi為輸入門卷積權(quán)重;bi為輸入門偏置。
輸出門用來確定下一個隱藏狀態(tài)的值,隱藏狀態(tài)包含了先前輸入的信息,如式(3)所示:
式(3)中,ot為輸出門,控制當前狀態(tài)有多少信息對外可見;Wo為輸出門卷積權(quán)重;bo為輸出門偏置。
最后隱藏狀態(tài)和神經(jīng)元狀態(tài)計算如式(4)~式(6)所示:
式(4)~式(6)中,Ct為神經(jīng)元狀態(tài);為臨時單元;bc為殘差;Ht-1和Ht分別為前一時刻隱藏狀態(tài)和當前時刻隱藏狀態(tài)單元。
本文提出基于多層ConvLSTM的短時預(yù)測模型(M-ConvLSTM),通過ConvLSTM中的卷積操作獲取站點間客流的空間特征以及LSTM機制捕獲時序客流的時間特征,實現(xiàn)對下一時間間隔內(nèi)的路網(wǎng)客流預(yù)測。該方法主要分為2個部分:第1部分通過多層ConvLSTM捕獲路網(wǎng)客流的時空特征;第2部分引入二維卷積對空間特征進一步強化,如圖3所示。
圖3 多層ConvLSTM短時預(yù)測模型
其中,ConvLSTM 3×1×10代表該層采用10個大小為3×1的卷積核的卷積長短期記憶層,Conv2D 3×10代表該層采用3×10的卷積核的卷積層,BN+ReLU為激活層及線性整流。模型輸入為前序的路網(wǎng)進出站量序列Pt,輸出為預(yù)測的路網(wǎng)進出站量pt:
式(7)中,Conv2D為二維卷積;M - ConvLSTM為多層ConvLSTM。
某城市地鐵路網(wǎng)共設(shè)23座車站,運營時間為早6 : 00 — 22 : 00。選用城市2021年6月至12月共7個月的進出站數(shù)據(jù),在進行配對分析之后,得到了相應(yīng)的斷面流量數(shù)據(jù),將工作日與周末、法定節(jié)假日等分別統(tǒng)計,得到4個圖像,分別對應(yīng)工作日上行、工作日下行、節(jié)假日上行、節(jié)假日下行。每張圖片中橫軸代表時間,縱軸代表區(qū)間斷面,如圖4所示。該線路客流在工作日呈現(xiàn)明顯的早晚雙高峰,分別在7 : 30和18 : 00前后;同時,上下行呈現(xiàn)明顯的對稱分布,早晨上行與晚上下行在區(qū)間和客流密度上都呈現(xiàn)出很大的相似性,與工作日一般客流特點一致。節(jié)假日客流整體上大于工作日客流,也呈現(xiàn)了一定的早晚高峰現(xiàn)象,但是其分布更加分散,在全天均有相對高的客流,并且對稱性不如工作日明顯。
圖4 不同時間上下行客流熱度圖
本文采用其2021年8月至9月去除周末及節(jié)假日共44天的30 min粒度自動售票系統(tǒng)(AFC)數(shù)據(jù)進行案例分析,其中前26天為訓練集,之后9天為驗證集,最后9天為測試集。
本文選用平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分比誤差(WMAPE)作為評價指標對預(yù)測精度進行評價,如式(8)~式(10)所示:
為評價本文M-ConvLSTM模型預(yù)測效果,選用多個模型進行對照分析,包括:支持向量回歸(SVR)[13]、LSTM和ConvLSTM,對下一時段路網(wǎng)進站量預(yù)測結(jié)果如表1所示。
表1 各模型預(yù)測結(jié)果對比
由表可知,本文模型在各項評估指標均優(yōu)于基準模型,對比SVR、LSTM和ConvLSTM本文模型在MAE上提升了72.2%、54.1%和18.7%。通過WMAPE指標可看出本文模型相比基準模型分別提升了39.99%、26.65%和5.68%的預(yù)測準確率。說明本文提出的M-ConvLSTM模型在預(yù)測過程中充分捕獲了客流數(shù)據(jù)間的時空特征,具有良好的預(yù)測精度。
為直觀觀察算法預(yù)測效果,以路網(wǎng)中某站為例繪制進站量時序圖,如圖5所示。可觀察到本文模型預(yù)測結(jié)果與實際值高度吻合,預(yù)測值在時序上呈雙峰特征,與現(xiàn)實物理世界規(guī)律一致,且不僅在峰值時段具有較好的擬合效果,在非高峰時段的低谷時段對波動客流量的預(yù)測效果也同樣良好,說明本文模型在時間上具有較強的時間特征捕獲能力。
圖5 M-ConvLSTM預(yù)測結(jié)果與真實值對比
同時,進一步觀察各個站點的預(yù)測WMAPE,如圖6所示??捎^察到本文模型在大部分站點的WMAPE值較低,且在各站點的預(yù)測準確率均高于基準模型,對于所有類型的站點均有較好的預(yù)測精度,說明本文模型通過卷積操作,挖掘到不同站點間的空間關(guān)系,在空間上具有較強的空間特征捕獲能力。
圖6 各站點預(yù)測誤差分布
本文針對城市軌道交通路網(wǎng)短時客流預(yù)測問題,構(gòu)建了基于多層ConvLSTM的短時預(yù)測模型,通過ConvLSTM中的卷積操作獲取站點間客流的空間特征以及LSTM機制捕獲時序客流的時間特征。在某城市地鐵數(shù)據(jù)集上進行案例驗證以及分析,結(jié)果表明本文模型在預(yù)測精度上具有較好效果,能夠充分捕獲路網(wǎng)客流的時空特征。
精準的客流預(yù)測能夠及時有效地預(yù)測未來路網(wǎng)信息,幫助運營部門提前感知高峰客流,為運力的動態(tài)調(diào)整提供數(shù)據(jù)基礎(chǔ),具有較高的研究價值和應(yīng)用價值。未來研究可引入外部因素如天氣、突發(fā)事件等信息,進一步提升模型的泛用性和預(yù)測精度。