張軍芳 杜鵬 房月華 張利民 趙鑫
摘 要:大數(shù)據(jù)背景下傳統(tǒng)的公交到站時(shí)間預(yù)測(cè)方法在預(yù)測(cè)精度和訓(xùn)練速度方面已經(jīng)不能滿足人們的期望。文章以衡水市公交運(yùn)行實(shí)際數(shù)據(jù)為例,運(yùn)用深度學(xué)習(xí)中的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)和人工神經(jīng)網(wǎng)絡(luò)(ANN)混合模型,綜合考慮運(yùn)行時(shí)段、天氣狀況、道路基礎(chǔ)設(shè)施、是否交叉路口、是否高峰路段等因素,對(duì)公交車的到站時(shí)間進(jìn)行預(yù)測(cè)研究,結(jié)果顯示混合模型在預(yù)測(cè)公交車在前一個(gè)站點(diǎn)的??繒r(shí)間和站間的行使時(shí)間方面均具有較高準(zhǔn)確性。
關(guān)鍵詞:長(zhǎng)短時(shí)記憶網(wǎng)絡(luò) 人工神經(jīng)網(wǎng)絡(luò) 預(yù)測(cè) 準(zhǔn)確性
Research on Bus Arrival Time Prediction based on Deep Learning
Zhang Junfang, Du Peng, Fang Yuehua, Zhang Limin, Zhao Xin
Abstract:Under the background of big data, the traditional bus arrival time prediction method cannot meet people's expectations in terms of prediction accuracy and training speed. Taking the actual bus operation data of Hengshui City as an example, this paper uses the hybrid model of long-term and short-term memory network(LSTM)and artificial neural network(ANN)in deep learning to predict the bus arrival time by comprehensively considering the factors such as operation time, weather conditions, road infrastructure, whether there is an intersection and whether there is a peak section. The results show that the hybrid model has high accuracy in predicting the bus stop time at the previous stop and the travel time between stops.
Key words:long-term and short-term memory network, artificial neural network, prediction, accuracy
1 引言
公交到站時(shí)間預(yù)測(cè)是智能公共交通信息服務(wù)系統(tǒng)的重要組成部分,精確的到站時(shí)間能有效緩解站臺(tái)等車乘客的焦慮情緒,讓出行者合理安排出行計(jì)劃。調(diào)查結(jié)果表明,公交乘客根據(jù)預(yù)測(cè)信息合理選擇乘車的時(shí)間,能使乘客節(jié)約63%的等待時(shí)間;而對(duì)于管理者而言,準(zhǔn)確的到站時(shí)間信息是實(shí)現(xiàn)靈活調(diào)度、科學(xué)管理的前提[1]。目前城市公交公司已經(jīng)將到站預(yù)測(cè)運(yùn)用于公交公司的運(yùn)營(yíng)調(diào)度中,然而車輛的到站時(shí)間受實(shí)時(shí)的天氣、交通狀況、交通需求等諸多因素的影響,所以實(shí)時(shí)準(zhǔn)確的公交到站時(shí)間預(yù)測(cè)既是智能公共交通服務(wù)系統(tǒng)的重點(diǎn),又是公交運(yùn)行管理的難點(diǎn)。
目前,國(guó)內(nèi)的公交車輛普遍安裝了車載GPS裝置。國(guó)內(nèi)上海、南京、廣州等一些大城市,在市區(qū)內(nèi)的一些特殊線路候車站點(diǎn)上都安裝了電子停車標(biāo)志,以告知乘客車輛的預(yù)計(jì)到達(dá)時(shí)間。一些互聯(lián)網(wǎng)公司也通過(guò)開(kāi)發(fā)手機(jī)軟件來(lái)發(fā)布實(shí)時(shí)公共交通信息,比較美國(guó)的谷歌地圖,國(guó)內(nèi)的高德地圖,百度地圖等,基本上都配置了公交線路實(shí)時(shí)信息查詢的功能,用戶可以登錄手機(jī)應(yīng)用程序查看市區(qū)內(nèi)的公交線路,公交站點(diǎn)與站點(diǎn)的地圖,以獲得車輛的到達(dá)時(shí)間[1]。
根據(jù)衡水市公交運(yùn)行數(shù)據(jù),結(jié)合公交運(yùn)行與調(diào)度情況,綜合考慮衡水市公交運(yùn)行時(shí)段、天氣狀況、道路基礎(chǔ)設(shè)施、是否交叉路口、是否高峰路段等因素,建立混合模型,預(yù)測(cè)公交運(yùn)行的準(zhǔn)時(shí)性。
2 方法介紹
研究發(fā)現(xiàn),人工神經(jīng)網(wǎng)絡(luò)(ANN)只能記憶短時(shí)期的信息,信息隨著學(xué)習(xí)量的增多或者學(xué)習(xí)周期的增長(zhǎng)將會(huì)導(dǎo)致梯度消失或者梯度爆炸現(xiàn)的發(fā)生象[2,3]。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò) (LSTM)是一種特殊的RNN網(wǎng)絡(luò)模型,由 Hochreiter等人[4]于1997年提出,后期被 Alex Graves進(jìn)行了改進(jìn)和應(yīng)用[3,5],該模型可以記憶長(zhǎng)時(shí)期的規(guī)律,并且有效避免梯度消失現(xiàn)象[3,4]。相對(duì)于RNN網(wǎng)絡(luò)模型,LSTM模型中增加了輸入門(mén)、輸出門(mén)、忘記門(mén)用于控制記憶的序列信息,如圖1所示。記憶塊中有記憶線和輸入輸出線主線,其中,記憶線時(shí)刻完成的運(yùn)算為其前一時(shí)刻的記憶狀態(tài)經(jīng)過(guò)忘記門(mén)狀態(tài)和輸入門(mén)狀態(tài)處理后得到該時(shí)刻記憶線輸出;輸入輸出線的運(yùn)算為在時(shí)刻輸入一組新的變量值,并與前一時(shí)刻隱層輸出狀態(tài)共同通過(guò)輸出門(mén)狀態(tài)的運(yùn)算后,再參考記憶線在該時(shí)刻的輸出,得到隱層的輸出結(jié)果。流程如圖2所示[3]。
3 數(shù)據(jù)處理
3.1 數(shù)據(jù)來(lái)源
本文使用的數(shù)據(jù)來(lái)自衡水市公交公司2020年9月1日至9月20日的數(shù)據(jù),共包含5804條數(shù)據(jù)。數(shù)據(jù)結(jié)構(gòu)如表1所示。
3.2 數(shù)據(jù)預(yù)處理
一般地,時(shí)間切片的最優(yōu)值為5min,所以將一天劃分為190個(gè)時(shí)間切片。在實(shí)際行車過(guò)程中,車輛可能會(huì)遇到突發(fā)事件,因此在統(tǒng)計(jì)的數(shù)據(jù)中存在一些異常數(shù)據(jù),將時(shí)間窗的上限設(shè)置300s,下限設(shè)置為25s,從而過(guò)濾異常數(shù)據(jù)以減少噪聲干擾[6]。
3.3 公交車到站時(shí)間預(yù)測(cè)
一般地,公交車到站時(shí)間可通過(guò)下式進(jìn)行預(yù)測(cè):
式中為k第輛公交車到達(dá)目標(biāo)站點(diǎn)的預(yù)測(cè)時(shí)間;為第k輛公交車到達(dá)前一個(gè)站點(diǎn)的實(shí)際時(shí)間;為第k輛公交車在前一個(gè)站點(diǎn)處的預(yù)測(cè)??繒r(shí)間;為第k輛公交車在前一個(gè)站點(diǎn)到目標(biāo)站點(diǎn)間的預(yù)測(cè)行使時(shí)間。
公交到站時(shí)間預(yù)測(cè)可以轉(zhuǎn)化為:預(yù)測(cè)公交車在前一個(gè)站點(diǎn)的??繒r(shí)間和在站間的行使時(shí)間。
以衡水市實(shí)際公交數(shù)據(jù)為例,運(yùn)用深度學(xué)習(xí)中的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)LSTM和人工神經(jīng)網(wǎng)絡(luò)ANN混合模型對(duì)公交車運(yùn)行時(shí)段、天氣狀況、道路基礎(chǔ)設(shè)施、是否交叉路口、是否路段因素對(duì)公交在前一個(gè)站點(diǎn)的停靠時(shí)間和公交在站間的行使時(shí)間進(jìn)行預(yù)測(cè)[7],結(jié)果顯示預(yù)測(cè)具有較高的精確性,結(jié)果如圖3。
4 結(jié)論
作為智能公共交通系統(tǒng)的重要組成部分,公交到站時(shí)間預(yù)測(cè)為提供實(shí)時(shí)準(zhǔn)確的公交到站時(shí)間可以實(shí)現(xiàn)如下經(jīng)濟(jì)社會(huì)效益:
(1)對(duì)于出行者而言,出行者可以合理的規(guī)劃出行,節(jié)省在站點(diǎn)的等車時(shí)間,緩解出行者等車期間的焦慮情緒;(2)對(duì)于公交企業(yè)而言,提供實(shí)時(shí)準(zhǔn)確的公交到站時(shí)間一方面可以優(yōu)化公交調(diào)度,另一方面有利于多模式交通方式間的協(xié)調(diào);(3)對(duì)于政府而言,可以提高公交吸引率,緩解城市交通擁堵,提升城市形象;(4)從社會(huì)效益方面而言,公交到站時(shí)間預(yù)測(cè)研究會(huì)降低公交車到站時(shí)間的預(yù)測(cè)誤差,推動(dòng)公交服務(wù)類軟件的進(jìn)一步應(yīng)用。
基金項(xiàng)目:
衡水學(xué)院2020年度校級(jí)自然科學(xué)類課題(2020ZR01):基于多源公交數(shù)據(jù)和LSTM的公交到站時(shí)間預(yù)測(cè)研究。
衡水學(xué)院2020年度校級(jí)自然科學(xué)類課題(2020ZR08):高效薄膜硅-晶體硅異質(zhì)結(jié)電池器件結(jié)構(gòu)模擬及產(chǎn)業(yè)化工藝研究。
河北省教育廳資助青年基金項(xiàng)目自然科學(xué)類(QN2020529):基于大數(shù)據(jù)和人工智能的網(wǎng)絡(luò)輿情挖掘及預(yù)測(cè)研究。
參考文獻(xiàn):
[1]葉之放.基于多源公交數(shù)據(jù)和LSTM的公交到站時(shí)間預(yù)測(cè)研究[D].華南理工大學(xué),2019.
[2]FUR,ZHANG Z,LI L.Using LSTM and GRU Neural Network Methods for Traffic Flow Prediction [C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation(YAC).Wuhan:IEEE,2016:324-328.
[3]李高盛,彭玲等.基于LSTM的城市公交車站短時(shí)客流量預(yù)測(cè)研究[J].公路交通科技,2019,36(2):128-132.
[4]HOCHREITERS,SCHMIDHUBERJ.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[5] Graves A.Supervised sequence labeling with recurrent neural networks[M]. Berlin: Springer-Verlag,2012.
[6]張欣環(huán),劉宏杰等.基于時(shí)空特征向量的長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)的城市公交旅行時(shí)間預(yù)測(cè)[J]. 計(jì)算機(jī)應(yīng)用, 2021.3 (41):875-880.
[7]張瑜.基于城市公交軌跡數(shù)據(jù)的車輛到站時(shí)間預(yù)測(cè)算法研究[D].大連海事大學(xué),2020年.