吳澍
摘要:為改善交通擁堵情況,提升交通網(wǎng)絡(luò)效率,提出了基于前后文關(guān)聯(lián)的長短期記憶網(wǎng)絡(luò)模型Contextual LSTM。首先,針對長短期記憶網(wǎng)絡(luò)模型面對突發(fā)情況識別不及時(shí)的問題,將輸入和隱藏狀態(tài)建立關(guān)聯(lián)關(guān)系,提升前后時(shí)刻數(shù)據(jù)的關(guān)聯(lián),從而提升模型應(yīng)對突發(fā)情況的能力。此外,采用英國的交通數(shù)據(jù)集對模型進(jìn)行訓(xùn)練與測試,并與傳統(tǒng)LSTM模型、GRU模型進(jìn)行預(yù)測效果對比實(shí)驗(yàn)。驗(yàn)證結(jié)果表明,改進(jìn)后的長短期記憶網(wǎng)絡(luò)模型在交通流數(shù)據(jù)的預(yù)測上更具優(yōu)勢。
關(guān)鍵詞:長短期記憶網(wǎng)絡(luò);交通流預(yù)測;前后文關(guān)聯(lián)
一、前言
據(jù)公安部統(tǒng)計(jì),我國2023年機(jī)動(dòng)車保有量達(dá)4.35億輛。機(jī)動(dòng)車數(shù)量的增長速度已高于基礎(chǔ)設(shè)施完善的速度,交通問題成為城市高質(zhì)量發(fā)展的瓶頸[1]。為解決這一問題,各大城市紛紛采用機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)等科學(xué)技術(shù)研究更高效的智能交通系統(tǒng),從而提升城市運(yùn)行效率[2]。實(shí)時(shí)準(zhǔn)確的交通流數(shù)據(jù)和預(yù)測是智能交通系統(tǒng)的關(guān)鍵。交通規(guī)劃、管理部門可以基于實(shí)時(shí)準(zhǔn)確的交通預(yù)測信息科學(xué),靈活地設(shè)計(jì)道路、部署交通資源、引導(dǎo)交通流量等;出行者則可以選擇合適的出行時(shí)間和工具,避免擁堵的發(fā)生[3]。
交通流預(yù)測的模型可分為三類:統(tǒng)計(jì)方法模型、傳統(tǒng)機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型。相較前兩種模型,深度學(xué)習(xí)模型的優(yōu)點(diǎn)是可以自動(dòng)提取特征、處理復(fù)雜非線性問題、綜合考慮交通流數(shù)據(jù)的歷史規(guī)律性和路網(wǎng)的空間相關(guān)性,精度較高,算法成熟。深度學(xué)習(xí)模型包括卷積神經(jīng)網(wǎng)絡(luò)模型(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)模型(RNN)和長短期記憶網(wǎng)絡(luò)模型(LSTM)。這些模型通過模擬人腦神經(jīng)元連接方式或處理序列數(shù)據(jù)的機(jī)制來進(jìn)行預(yù)測。CNN特別適合處理圖像和序列數(shù)據(jù),通過模擬人眼視覺神經(jīng)的工作方式提取數(shù)據(jù)特征;RNN適用于處理序列數(shù)據(jù),通過在時(shí)間維度上重復(fù)應(yīng)用相同的計(jì)算過程來學(xué)習(xí)序列數(shù)據(jù)的內(nèi)在模式;LSTM是RNN的一種變體,通過引入“記憶單元”來解決RNN處理長序列時(shí)的梯度消失問題,能夠更好地處理長時(shí)間序列的預(yù)測。LSTM模型的復(fù)雜性使得其可解釋性較差,且面對難以量化的外部因素影響,特別是突發(fā)情況時(shí)存在識別不及時(shí)問題,使得交通流預(yù)測受到限制。
本文選擇深度學(xué)習(xí)模型中的應(yīng)用于預(yù)測領(lǐng)域的LSTM模型進(jìn)行交通流預(yù)測的研究,針對LSTM模型面對突發(fā)情況識別不及時(shí)的問題,將模型輸入和隱藏狀態(tài)建立關(guān)聯(lián)關(guān)系,提升前后時(shí)刻數(shù)據(jù)的關(guān)聯(lián),提出Contextual LSTM模型并且通過實(shí)驗(yàn)驗(yàn)證該模型在交通流預(yù)測的優(yōu)勢。
二、LSTM模型的理論基礎(chǔ)
長短期記憶網(wǎng)絡(luò)模型(Long Short-term Memory, LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),通過門控狀態(tài)控制傳輸狀態(tài),記住重要的信息,忘記不重要的信息,解決了梯度消失和爆炸的問題,并且在長序列上有更好的表現(xiàn),更適用于交通流這種長時(shí)間的預(yù)測。
LSTM模型有兩個(gè)傳遞狀態(tài),一個(gè)細(xì)胞狀態(tài)Ct,一個(gè)隱藏狀態(tài)ht,通常細(xì)胞狀態(tài)變化比較緩慢,隱藏狀態(tài)傳遞的過程中變化比較快。xt和yt分別代表輸入和輸出。LSTM模型的數(shù)據(jù)傳遞見圖1。
LSTM模型的內(nèi)部主要有三個(gè)階段:忘記階段、選擇性記憶階段以及輸出階段。對應(yīng)門控電路為遺忘門、輸入門、輸出門。LSTM模型內(nèi)部結(jié)構(gòu)見圖2。
三、Contextual LSTM模型構(gòu)建
經(jīng)典的LSTM雖然處理時(shí)間序列預(yù)測的效果較好,但是對于前后文的關(guān)聯(lián)關(guān)系建立不足,例如,遺忘門、輸入門對上一時(shí)刻記憶細(xì)胞的狀態(tài)感知不足。針對這一問題,本文將前一時(shí)刻記憶細(xì)胞的狀態(tài)作為遺忘門、輸入門的輸入,從而提升前后文的關(guān)聯(lián),Contextual LSTM內(nèi)部結(jié)構(gòu)見圖3。
四、實(shí)驗(yàn)結(jié)果與分析
(一)數(shù)據(jù)來源和實(shí)驗(yàn)環(huán)境
本實(shí)驗(yàn)的數(shù)據(jù)為英國交通網(wǎng)中的3組交通流數(shù)據(jù),時(shí)間跨度分別為2019年4月1日至2019年4月20日、2019年4月21日至2019年5月10日、2019年5月11日至2019年5月31日,數(shù)據(jù)集中相鄰數(shù)據(jù)的時(shí)間間隔為5分鐘,3組數(shù)據(jù)集中的數(shù)據(jù)數(shù)目均為1600組。實(shí)驗(yàn)將數(shù)據(jù)集的前600條數(shù)據(jù)作為訓(xùn)練集,后1000條數(shù)據(jù)作為測試集。
實(shí)驗(yàn)的筆記本電腦型號為Lenovo-G50,Windows 10,64位,CPU型號為Intel (R) Core(TM) i7,采用的IDE為pycharm,編程語言為python,python的版本為3.9.1。
(二)模型評價(jià)指標(biāo)
為全方位評估本文提出的基于前后文關(guān)聯(lián)的長短期記憶網(wǎng)絡(luò)模型的效果,選用平均絕對誤差(MAE)、平均方根誤差(RMSE)、平均絕對百分誤差(MAPE)進(jìn)行預(yù)測評估,三者數(shù)值越低代表模型預(yù)測精度越高、預(yù)測效果越好。
MAE、RMSE、MAPE側(cè)重點(diǎn)有所不同,可以從不同角度評估模型的效果。MAE和RMSE衡量的是真實(shí)值與預(yù)測值偏離的絕對大小情況,需要結(jié)合真實(shí)值的量綱才能判斷差異;MAPE衡量的是偏離的相對大小,即百分率,更容易理解和解讀。相對來說,MAE和MAPE不容易受極端值的影響,而RMSE采用誤差的平方,會(huì)放大預(yù)測誤差,所以對于離群數(shù)據(jù)更敏感,可以突出影響較大的誤差值[4-5]。三者表達(dá)式如下:
(三)預(yù)測結(jié)果與分析
本文采用Contextual LSTM模型對交通流數(shù)據(jù)集進(jìn)行預(yù)測。針對三組數(shù)據(jù)集,分別用傳統(tǒng)LSTM模型、GRU模型,以及本文提出的Contextual LSTM模型對本文的交通流數(shù)據(jù)集進(jìn)行了預(yù)測效果驗(yàn)證。3組數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果見圖4、圖5、圖6。
從預(yù)測效果對比圖可以看出,Contextual LSTM模型的預(yù)測效果最佳,預(yù)測的結(jié)果最貼近于真實(shí)數(shù)據(jù),其次是GRU模型,最后是LSTM模型。除預(yù)測效果對比圖,本文還對三種模型的MAE、RMSE、MAPE數(shù)值進(jìn)行了對比,見表1。
為對比結(jié)果更直觀,本文還繪制了條形統(tǒng)計(jì)圖進(jìn)行對比,見圖7。由圖7、表1,以及預(yù)測效果對比圖可見,Contextual LSTM模型相比于LSTM模型和GRU模型,其預(yù)測誤差最小,預(yù)測精度最高。相比于LSTM模型,Contextual LSTM模型的MAE、RMSE、MAPE 3種指標(biāo)分別優(yōu)化了9.8×10-4、1.73×10-3、9.9×10-4;相比于GRU模型,Contextual LSTM模型的MAE、RMSE、MAPE 3種指標(biāo)分別優(yōu)化了4.3×10-4、1.39×10-3、5.8×10-4。
五、結(jié)語
隨著交通擁堵的頻發(fā),交通數(shù)據(jù)的預(yù)測成為交通路網(wǎng)的研究重點(diǎn)。針對LSTM模型前后文關(guān)聯(lián)關(guān)系不強(qiáng)的問題,本文提出了基于前后文關(guān)聯(lián)的長短期記憶網(wǎng)絡(luò)模型Contextual LSTM,將上一時(shí)刻的記憶細(xì)胞的狀態(tài)反饋給遺忘門和輸入門,將輸入和隱藏狀態(tài)建立關(guān)聯(lián)關(guān)系,提升前后時(shí)刻數(shù)據(jù)的關(guān)聯(lián),從而提升模型應(yīng)對突發(fā)情況的能力。本文首先對Contextual LSTM模型的原理進(jìn)行了具體的分析,然后采用英國交通路網(wǎng)的3組數(shù)據(jù)集對模型進(jìn)行了效果驗(yàn)證,并和傳統(tǒng)LSTM模型以及GRU模型進(jìn)行了預(yù)測效果對比,通過對比展示了Contextual LSTM模型良好的性能,為交通路網(wǎng)中交通流的預(yù)測提供了參考依據(jù)。
參考文獻(xiàn)
[1]李文龍,林思暢,陳翰林,等.一種智慧便捷停車系統(tǒng)設(shè)計(jì)[J]. 中國科技信息,2023(06):99-101.
[2]薛延明,李光輝,齊濤.融合圖小波和注意力機(jī)制的交通流預(yù)測方法[J].計(jì)算機(jī)科學(xué)與探索,2023,17(06):1405-1416.
[3]周邯.基于視頻分析的城市道路短時(shí)交通流預(yù)測[D].重慶:重慶大學(xué),2023.
[4]于海波,王春雨,袁曉蕾,等.基于PCA-SVR的電能計(jì)量裝置誤差評估算法[J].電測與儀表,2020,57(19):140-145.
[5]趙鵬,馬克琪,李紅斌,等.計(jì)及一次電壓波動(dòng)的電壓互感器誤差狀態(tài)在線評估方法[J].高電壓技術(shù),2022,48(03):1042-1051.
責(zé)任編輯:張津平、尚丹