摘要:準(zhǔn)確、有效的交通流預(yù)測(cè)為智能交通系統(tǒng)提供數(shù)據(jù)基礎(chǔ),是實(shí)現(xiàn)道路交通狀況預(yù)測(cè)和交通管控的重要技術(shù)之一。本文提出一種基于時(shí)空特性的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)和長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)相結(jié)合的交通流預(yù)測(cè)模型。首先,對(duì)交通流序列進(jìn)行EMD分解得到具有不同時(shí)間尺度的本征模態(tài)分量,然后,結(jié)合空間特性采用LSTM神經(jīng)網(wǎng)絡(luò)對(duì)交通流進(jìn)行預(yù)測(cè)。通過仿真實(shí)驗(yàn)可得:與傳統(tǒng)的LSTM神經(jīng)網(wǎng)絡(luò)相比,基于時(shí)空特性的EMD-LSTM預(yù)測(cè)模型的均方根誤差分別減少了3.81;平均絕對(duì)誤差分別減少了2.29。
關(guān)鍵詞:短時(shí)交通流預(yù)測(cè);經(jīng)驗(yàn)?zāi)B(tài)分解;時(shí)空特性;長短期記憶單元
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)18-0012-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
隨著人工智能技術(shù)的發(fā)展,新一代智能交通系統(tǒng)提出了更加自主高效、安全智能的道路交通管理體系,短時(shí)交通流的預(yù)測(cè)就是其重要的研究方向之一[1]。準(zhǔn)確、有效的道路短時(shí)交通流預(yù)測(cè)不僅能為新一代智能交通系統(tǒng)提供數(shù)據(jù)基礎(chǔ),還能夠幫助人們規(guī)劃出行路線,緩解交通壓力帶來的道路擁堵等問題。目前,國內(nèi)外學(xué)者對(duì)于短時(shí)交通流預(yù)測(cè)的研究主要分為四種預(yù)測(cè)模型,即基于統(tǒng)計(jì)分析的預(yù)測(cè)模型、非線性理論模型、智能預(yù)測(cè)模型和混合預(yù)測(cè)模型[2]。
第一類,基于統(tǒng)計(jì)分析的預(yù)測(cè)模型主要包括時(shí)間序列法、卡爾曼濾波分析法等。S.Vasantha Kumar和Lelitha Vanajakshi[3]提出一種改進(jìn)的自回歸積分移動(dòng)平均模型(Auto-Regressive In-tegrated Moving Average,ARIMA)根據(jù)不同季節(jié)的數(shù)據(jù)差異進(jìn)行交通流預(yù)測(cè),但是單一的ARIMA方法在處理非線性交通流數(shù)據(jù)時(shí)具有局限性。柳立春等學(xué)者[4]提出的卡爾曼濾波模型應(yīng)用于交通流預(yù)測(cè)取得了顯著效果,但缺點(diǎn)是只適用于實(shí)時(shí)數(shù)據(jù)預(yù)測(cè)。
第二類,非線性理論模型主要依據(jù)交通流數(shù)據(jù)非線性的特點(diǎn)進(jìn)行預(yù)測(cè)研究,常用的非線性理論模型有混沌理論模型等。Attoor Sanju Nair等學(xué)者啪驗(yàn)證了交通參數(shù)的混沌特性,將混沌理論引入了交通流預(yù)測(cè)的模型中。廖榮華、蘭時(shí)勇、劉正熙等學(xué)者[6]通過改進(jìn)混沌時(shí)間序列局域法,分析預(yù)測(cè)了北京市的交通數(shù)據(jù),最終驗(yàn)證了改進(jìn)后的方法預(yù)測(cè)更加準(zhǔn)確。
第三類,智能預(yù)測(cè)模型主要利用機(jī)器學(xué)習(xí)算法對(duì)道路交通流量進(jìn)行預(yù)測(cè)。Osama Mohammed和Jalil Kianfar[7]通過比較深度神經(jīng)網(wǎng)絡(luò)、分布式隨機(jī)森林、梯度提升機(jī)、廣義線性模型四種算法對(duì)短時(shí)交通流的預(yù)測(cè)效果,得出深度神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果更佳。晏臻,于重重,韓璐等[8]提出基于時(shí)空特性的CNN-LSTM模型預(yù)測(cè)交通流,CNN(Convolutional Neural Network.CNN)挖掘數(shù)據(jù)的空間相關(guān)性,LSTM挖掘數(shù)據(jù)的時(shí)序特性,驗(yàn)證了考慮時(shí)空特性方法的有效性。
本文提出一種基于時(shí)空特性的經(jīng)驗(yàn)?zāi)B(tài)分解和長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)合的混合模型對(duì)交通流進(jìn)行預(yù)測(cè),并驗(yàn)證其預(yù)測(cè)效果。
1 基本原理
1.1 經(jīng)驗(yàn)?zāi)B(tài)分解
經(jīng)驗(yàn)?zāi)B(tài)分解( Empuical Mode Decomposition,EMD)[9]是一種自適應(yīng)的數(shù)據(jù)挖掘、時(shí)頻信號(hào)處理方法。該方法的主要思想是根據(jù)被分解信號(hào)自身的時(shí)間尺度特性進(jìn)行信號(hào)分解和處理,最終將原始信號(hào)分解成若干個(gè)本征模函數(shù)(Intrinsic ModeFunction,IMF)和一個(gè)具有信號(hào)平均趨勢(shì)的殘余項(xiàng)。因此,理論上EMD算法適用于任何信號(hào)的分解,尤其在分解和處理非線性、非平穩(wěn)的信號(hào)時(shí),比傳統(tǒng)的小波分解和傅里葉分解表現(xiàn)出明顯的優(yōu)勢(shì)。EMD算法的具體實(shí)現(xiàn)步驟如下:
(1)找到原始信號(hào)序列x(t)所有的局部極大值點(diǎn)和極小值點(diǎn)。根據(jù)三次樣條插值方法將所有的極大值點(diǎn)擬合成上包絡(luò)線U(t),所有的極小值點(diǎn)擬合成下包絡(luò)線/(t),并計(jì)算出上、下包絡(luò)線的平均值,用m,,表示:
m11=1/2[U(f)+L(f)]
(1)
將原始信號(hào)與均值包絡(luò)相減得到第一步分解的新信號(hào),并用h11表示:
h1=x(t)一m1(t)(2)
(2)若h11(t)滿足平均包絡(luò)值為零、并且極值和零值的數(shù)量相差0或1,則h11(t)為一級(jí)IMF分量。否則,對(duì)h11(t)重復(fù)進(jìn)行第(1)步運(yùn)算,直至第k次分解之后的信號(hào)h1k (t)滿足成為IMF分量的條件。一級(jí)IMF分量可以記作c1(t)
1.2 LSTM神經(jīng)網(wǎng)絡(luò)
長短期記憶( Long Shofi-Term Memory,LSTM)結(jié)構(gòu)在原有的輸入門和輸出門的基礎(chǔ)上增加了遺忘門以后,使LSTM能很好地解決“梯度消失”和“梯度爆炸”[10]問題。LSTM不僅對(duì)輸人數(shù)據(jù)具有記憶性,而且學(xué)習(xí)當(dāng)前網(wǎng)絡(luò)結(jié)構(gòu)的權(quán)重,對(duì)于長時(shí)間序列的處理具有較大的優(yōu)勢(shì),被廣泛應(yīng)用于自然語言處理、。
如圖1所示,是一個(gè)LSTM網(wǎng)絡(luò)的展開結(jié)構(gòu)。由于LSTM結(jié)構(gòu)具有“記憶”,當(dāng)前t時(shí)刻的單元狀態(tài)ct由t時(shí)刻的輸入xt和t一1時(shí)刻的單元狀態(tài)ct-1共同決定。ht是t時(shí)刻的隱藏層輸出。LSTM結(jié)構(gòu)由多個(gè)“記憶模塊”(memory cell)組成,每個(gè)cell包含三個(gè)門:輸入門、遺忘門和輸出門。遺忘門:這部分是決定從cell中遺棄哪部分信息。該門會(huì)讀取ht-1,和xt,使用sigmoid函數(shù)輸出一個(gè)在0到1之間的數(shù)值給每個(gè)在cell的上一時(shí)刻狀態(tài)ct-1。其中1表示“完全保留”,0表示“完全舍棄”。輸入門:這部分決定輸入多少信息加入cell中來。實(shí)現(xiàn)這部分需要兩步:第一步,“input gate layer”的sigmoid函數(shù)決定哪些信息需要更新;用tanh函數(shù)生成一個(gè)更新的內(nèi)容c,。第二步,對(duì)cell的狀態(tài)進(jìn)行更新,將ct-1更新為ct。舊的單元狀態(tài)與ft相乘,再和i*ct相加,構(gòu)成新的候選值。候選值隨著每個(gè)狀態(tài)的更新程度而變化。輸出門:這部分運(yùn)用一個(gè)sigmoid函數(shù)來決定cell中被輸出的信息。然后,把單元狀態(tài)通過tanh進(jìn)行處理,得到一個(gè)在一1到1之間的值,再乘以sigmoid的輸出,決定最終輸出的那部分信息。公式7-12反映了“記憶模塊”內(nèi)部的算法流程。
1.3 基于時(shí)空特性的短時(shí)交通流預(yù)測(cè)模型
結(jié)合EMD算法對(duì)非線性、非平穩(wěn)時(shí)序信號(hào)分解處理的優(yōu)勢(shì)和LSTM神經(jīng)網(wǎng)絡(luò)對(duì)長時(shí)間序列學(xué)習(xí)和預(yù)測(cè)的優(yōu)勢(shì),提出了基于時(shí)空相關(guān)性的EMD-LSTM模型對(duì)交通流數(shù)據(jù)進(jìn)行預(yù)測(cè)。該算法既體現(xiàn)了單個(gè)檢測(cè)點(diǎn)交通流數(shù)據(jù)在時(shí)序上受自身歷史數(shù)據(jù)特性影響的時(shí)間相關(guān)性,又體現(xiàn)了不同檢測(cè)點(diǎn)之間交通流數(shù)據(jù)在空間上受道路上下游地理位置影響的空間相關(guān)性。
基于時(shí)空特性的EMD-LSTM算法原理如圖2所示,該算法先對(duì)多個(gè)檢測(cè)器的原始信號(hào)分別進(jìn)行EMD方法分解,將不同檢測(cè)器的同一級(jí)IMF分量組合成新向量,該組合向量同時(shí)具有時(shí)間尺度和空間特性。將組合向量輸入到LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練,通過調(diào)整參數(shù)得出最佳訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu)。然后對(duì)每一個(gè)組合向量進(jìn)行預(yù)測(cè),最終得到某一未來時(shí)間段內(nèi)不同檢測(cè)器同一級(jí)IMF分量的預(yù)測(cè)結(jié)果。再分別將同一檢測(cè)器的每級(jí)IMF分量相加,即可得到所有檢測(cè)器未來時(shí)間段內(nèi)的交通流預(yù)測(cè)結(jié)果。
2 仿真實(shí)驗(yàn)
2.1 數(shù)據(jù)來源
本文以美國加利福尼亞運(yùn)輸部的性能測(cè)量系統(tǒng)( Caltrans-Performance Measurement System,PeMs)數(shù)據(jù)庫的交通流作為數(shù)據(jù)來源。選取2018年6月1日到2018年6月30日標(biāo)號(hào)為110-E的高速公路上9個(gè)連續(xù)檢測(cè)器(編號(hào)依次為VDS717367、VDS717369、VDS717373、VDS717376、VDS717379、VDS717381、VDS717383、VDS717387、VDS718130)的交通流量數(shù)據(jù)作為交通流預(yù)測(cè)研究的數(shù)據(jù)集。抽樣時(shí)間間隔為5min,共約77,760條連續(xù)性數(shù)。對(duì)30天的數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),取前18天的交通流數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),中間6天的交通流數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),后面6天的數(shù)據(jù)作為測(cè)試數(shù)據(jù)。
2.2 實(shí)驗(yàn)環(huán)境
仿真實(shí)驗(yàn)使用的軟硬件平臺(tái)如下表所示:
2.3 算法評(píng)價(jià)指標(biāo)
為了客觀比較不同算法的準(zhǔn)確性,本文采用均方根誤差( Root Mean Squared Error.RMSE)和平均絕對(duì)誤差(Mean Abso-lute Error.MAE)兩個(gè)指標(biāo)來評(píng)價(jià)算法預(yù)測(cè)性能的優(yōu)劣。兩者數(shù)值越小說明預(yù)測(cè)誤差越小,算法的準(zhǔn)確性越高。
3 結(jié)果分析
LSTM神經(jīng)網(wǎng)絡(luò)對(duì)第5個(gè)檢測(cè)器(編號(hào):VDS717379)的交通流數(shù)據(jù)進(jìn)行預(yù)測(cè):網(wǎng)絡(luò)層數(shù)為1,隱含層的單元數(shù)為100,輸出層的單元數(shù)為l,三維輸入,對(duì)交通流的三個(gè)參數(shù)同時(shí)進(jìn)行預(yù)測(cè),初始學(xué)習(xí)速率為0.001,激活函數(shù)為relu、線性函數(shù)為linear,優(yōu)化算法為Adam,迭代次數(shù)為200。
經(jīng)過仿真實(shí)驗(yàn)得到LSTM算法誤差性能指標(biāo)值分別為:RMSE=21.568,MAE=15.678。交通流數(shù)據(jù)預(yù)測(cè)值與真實(shí)值的對(duì)比效果圖如圖3所示,圖中預(yù)測(cè)值曲線與實(shí)際值曲線的擬合效果較差,部分預(yù)測(cè)值比實(shí)際值偏大,局部極值點(diǎn)的預(yù)測(cè)偏差較大。
EMD分解得到8個(gè)IMF分量,所以,時(shí)空EMD-LSTM模型需要8個(gè)單層神經(jīng)網(wǎng)絡(luò);隱含層單元個(gè)數(shù)分別為[70,100,60,200,50,30,30,70],L2正則化方法的系數(shù)大小分別為[0.0001,0.00001,0.0,0.0,0.0,0.0001,0.0001,0.0001],輸出層的單元數(shù)為1,初始學(xué)習(xí)速率為0.001,激活函數(shù)為relu、線性函數(shù)為linear,優(yōu)化算法為Adam,迭代次數(shù)為200。為了提高訓(xùn)練效率,設(shè)置了提前停止。經(jīng)過仿真實(shí)驗(yàn)得到基于時(shí)空特性的EMD-LSTM模型預(yù)測(cè)9個(gè)檢測(cè)器數(shù)據(jù)的誤差指標(biāo)如表2所示:
其中第5個(gè)檢測(cè)器(編號(hào):VDS717379)的誤差指標(biāo)為:RMSE=17.758.MAE=13.388,比LSTM算法分別減小了3.81和2.29。交通流數(shù)據(jù)預(yù)測(cè)值與真實(shí)值的對(duì)比效果圖如圖4所示。與圖3相比,圖4中預(yù)測(cè)曲線與實(shí)際曲線的擬合效果明顯得到了改善,局部極值點(diǎn)處的擬合效果更好,部分波動(dòng)劇烈極值點(diǎn)的預(yù)測(cè)效果更好。
綜上所述,基于時(shí)空特性的EMD-LSTM模型能同時(shí)預(yù)測(cè)多個(gè)檢測(cè)器的交通流數(shù)據(jù),并且預(yù)測(cè)效果優(yōu)于傳統(tǒng)的LSTM算法。
4 結(jié)束語
本文提出的基于時(shí)空特性的EMD-LSTM組合模型對(duì)短時(shí)交通流具有良好的預(yù)測(cè)效果。與傳統(tǒng)的LSTM算法相比,誤差性能指標(biāo)RMSE減少了3.81,MAE減少了2.29;并且該模型能同時(shí)預(yù)測(cè)多個(gè)檢測(cè)器的交通流數(shù)據(jù)。
參考文獻(xiàn):
[1] Javed M A,Zeadally S,Hamida E B.Data analytics for coopera-tive intelligent transport systems[J].Vehicular Communications.2019.15:63-72.
[2]趙宏.翟冬梅,石朝輝.短時(shí)交通流預(yù)測(cè)模型綜述[J].都市快軌交通,2019,32(4):50-54.
[3] Kumar S V,Vanajakshi L.Short-term traffic flow prediction us-ing seasonal ARIMA model with limited input data[J].Europe-an Transport Research Review. 2015,7(3):21.
[4]柳立春.基于卡爾曼濾波的長江武漢大橋段交通流預(yù)報(bào)[D].大連:大連海事大學(xué),2018.
[5] Nair A S,Liu J C,Rilett L.et aI.Non-linear analysis of trafficflow[C]//ITSC.lEEE Intelligent Transportation Systems.Proceed-ings (Cat. No. OITH8585), Oakland. CA. USA. IEEE. 2001:681-685.
[6]廖榮華,蘭時(shí)勇,劉正熙.基于混沌時(shí)間序列局域法的短時(shí)交通流預(yù)測(cè)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2015,25(1):1-5.
[7] Mohammed O.Kianfar J.A machine learning approach to short-term traffic flow prediction:a case study of interstate 64 in Mis-souri[C]//2018 IEEE International Smart Cities Conference(lSC2),September 16-19. 2018. Kansas City, MO, USA. lEEE,2018: 1-25。
[8]晏臻,于重重,韓璐,等.基于CNN+LSTM的短時(shí)交通流量預(yù)測(cè)方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2019,40(9):2620-2624,2659.
[9]關(guān)瑩瑩.基于深度學(xué)習(xí)的ITS短時(shí)交通流量預(yù)測(cè)算法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2019.
[10]楊祎玥,伏潛,萬定生.基于深度循環(huán)神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)模型[J].計(jì)算機(jī)技術(shù)與發(fā)展,2017,27(3):35-38,43.
【通聯(lián)編輯:光文玲】
基金項(xiàng)目:河北省高等學(xué)校科學(xué)技術(shù)研究重點(diǎn)項(xiàng)目( No.ZD2019010)
作者簡介:高小婷(1992-),女,碩士研究生,主要研究方向?yàn)橹悄苄畔⑻幚怼?/p>