• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      城市交通網(wǎng)格集群的Bi-LSTM的流量預(yù)測

      2023-10-12 16:38:15賈現(xiàn)廣馮超琴蘇治文錢正富宋騰飛劉歡呂英英
      重慶大學(xué)學(xué)報(bào) 2023年9期
      關(guān)鍵詞:交通流量集群聚類

      賈現(xiàn)廣 馮超琴 蘇治文 錢正富 宋騰飛 劉歡 呂英英

      doi:10.11835/j.issn.1000.582X.2023.09.013

      收稿日期:2022-11-09

      網(wǎng)絡(luò)出版日期:2023-07-06

      基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目?(71961012)。

      Foundation:Supported by National Natural Science Foundation of China(71961012).

      作者簡介:賈現(xiàn)廣(1997—),男,副教授,主要從事智能交通與大數(shù)據(jù)方向研究,(E-mail)jxg@kust.edu.cn。

      通信作者:呂英英,女,主要從事智能交通與大數(shù)據(jù)方向研究,(E-mail)20070102@kust.edu.cn。

      摘要:為提升交通流預(yù)測精度,深層次地挖掘交通流數(shù)據(jù)的時(shí)空特征,提出一種基于雙向長短時(shí)記憶網(wǎng)絡(luò)(Bi-LSTM)的城市交通網(wǎng)格集群流量預(yù)測模型。將所獲得的網(wǎng)約車軌跡數(shù)據(jù)集網(wǎng)格化;考慮人為確定集群個(gè)數(shù)對結(jié)果的影響,用貝葉斯信息準(zhǔn)則進(jìn)行參數(shù)估計(jì)確定集群數(shù),利用高斯混合模型對交通狀況相似的網(wǎng)格進(jìn)行聚類得到不同交通網(wǎng)格集群;利用集群內(nèi)部交通網(wǎng)格的輸入時(shí)間序列的相互影響設(shè)計(jì)多對多模型,構(gòu)建Bi-LSTM模型預(yù)測不相交集群上的流量;以經(jīng)典多元線性回歸模型(MLRA)作為對照組進(jìn)行實(shí)驗(yàn)驗(yàn)證,采用平均絕對誤差(MAE)、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)和動(dòng)態(tài)時(shí)間規(guī)整(DTW)這四類評價(jià)指標(biāo)對預(yù)測結(jié)果進(jìn)行綜合評價(jià),驗(yàn)證基于Bi-LSTM模型的城市交通網(wǎng)格集群流量預(yù)測的可行性。實(shí)驗(yàn)結(jié)果表明:MLRA模型和Bi-LSTM模型對城市交通網(wǎng)格集群流量的預(yù)測值小于真實(shí)值,早高峰時(shí)段尤為明顯;各交通網(wǎng)格集群的交通狀態(tài)態(tài)勢相似,集群的簇內(nèi)相關(guān)性較強(qiáng),兩類模型均可實(shí)現(xiàn)較好的流量預(yù)測效果,Bi-LSTM表現(xiàn)更優(yōu);?MLRA和Bi-LSTM預(yù)測模型的精度MAE、RMSE、MAPE分別為3.2011、4.4009、0.3187,3.0687、4.2943、0.3045,Bi-LSTM與MLRA相比,模型精度分別提高了4.14%、2.40%、4.46%,說明所構(gòu)建的Bi-LSTM交通流網(wǎng)格集群流量預(yù)測精度高、誤差低,要優(yōu)于MLRA模型,表現(xiàn)出較好的泛化性能;?MLRA和Bi-LSTM的DTW結(jié)果分別為52938.6356、54815.1055,構(gòu)建的Bi-LSTM模型較MLRA模型各自工作日和節(jié)假日時(shí)間序列相似性DTW結(jié)果提高3.42%,表現(xiàn)出更好的魯棒性。利用城市交通流量的特點(diǎn)和交通軌跡數(shù)據(jù)網(wǎng)格化的優(yōu)點(diǎn),基于Bi-LSTM模型的城市交通網(wǎng)格集群流量預(yù)測與MLRA交通流量預(yù)測模型相比,具有精度高、誤差低的特點(diǎn)。同時(shí),DTW指標(biāo)方面,基于Bi-LSTM對城市交通網(wǎng)格集群流量模型與真實(shí)流量變化趨勢一致,表現(xiàn)出較好的魯棒性。

      關(guān)鍵詞:城市交通;交通流量預(yù)測;Bi-LSTM;交通網(wǎng)格集群;時(shí)空單元?jiǎng)澐?p style="margin-left:21pt">中圖分類號:U491.2 ?????????文獻(xiàn)標(biāo)志碼:A ?????文章編號:1000-582X(2023)09-130-12

      Forecasting for urban traffic grid clusters based on Bi-LSTM

      JIA XianguangaFENG Chaoqina, SU ZhiwenaQIAN Zhengfua, SONG Tengfeia, LIU Huana, LYU Yingyingb

      (a. Faculty of Transportation Engineering;?b. Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, P. R. China)

      Abstract: This study aims to improve the accuracy of traffic prediction and to explore the spatio-temporal characteristics of traffic data in urban areas by proposing a traffic flow prediction model based on Bi-LSTM (Bidirectional Long Short Term Memory) for urban traffic grid clusters. The trajectory dataset of ride-hailing vehicles was gridified, and the Bayesian information criterion was used for parameter estimation to determine the cluster number, with considering the influence of manually determining the number of clusters on the results. The Gaussian mixture model was then employed to cluster grids with similar traffic conditions, resulting in distinct traffic grid clusters. A Multi-to-Multi model was designed by considering the mutual influence of input time series of traffic grids within each cluster. The Bi-LSTM model was established to predict traffic flow in non-overlapping clusters. Experimental validation was conducted using the classical MLRA (multiple linear regression analysis) as a control group, and four performance metrics: MAE(mean absolute error), RMSE(mean squared root error), MAPE(mean absolute percentage error) and DTW (dynamic time warping) were used to comprehensively evaluate the prediction results, confirming the feasibility and superiority of the Bi-LSTM model for city traffic grid cluster flow prediction. The results showed that both MLRA and Bi-LSTM models predicted urban traffic grid cluster traffic values were generally smaller than the real value, with more pronounced discrepancies observed during morning peak hours. Increasing data volume improved the prediction performance of the models. ?Traffic state dynamics within each traffic grid cluster were similar, displaying strong intra-cluster correlation. Both models achieved better traffic prediction results, with Bi-LSTM outperforming MLRA. In terms of model accuracy, the Bi-LSTM model showed improved MAE, RMSE and MAPE(3.068?7, 4.294?3, 0.304?5, respectively) compared to MLRA(3.201?1, 4.400?9, 0.318?7, respectively), representing a 4.14%, 2.40% and 4.46% enhancement, respectively. The constructed Bi-LSTM model exhibited higher accuracy, lower error and better generalization performance. In terms of similarity result evaluation, the DTW results of MLRA and Bi-LSTM were 52?938.635?6 and 54?815.105?5 respectively. The Bi-LSTM model showed better robustness by 3.42% compared to the respective weekday and holiday time series similarity DTW results of the MLRA model. By considering the characteristics of urban traffic flow and leveraging the advantages of gridding traffic trajectory data, the Bi-LSTM-based model for urban traffic grid cluster traffic prediction exhibited high accuracy, low error and superior robustness compared to the MLRA traffic flow prediction model. Meanwhile, in terms of DTW metrics, the Bi-LSTM-based urban traffic grid cluster traffic model captured the real traffic variation trend and demonstrated excellent performance in traffic flow prediction for urban areas.

      Keywords: urban transportation; traffic flow forecasting; Bi-LSTM; traffic grid clusters; spatiotemporal unit division

      智能交通系統(tǒng)(intelligent transport system, ITS)是智慧城市的重要組成部分,可有效解決交通擁堵問題,城市交通流量預(yù)測是ITS的基石,精準(zhǔn)高效的交通流量預(yù)測對緩解交通擁堵具有重要意義[1]。城市交通流量預(yù)測是城市交通管理不可或缺的重要手段,準(zhǔn)確的交通流量預(yù)測可為智能城市規(guī)劃和交通管理提供可靠管理,為擁擠區(qū)域提供預(yù)警確保公共安全,為乘客提供建議方便日常通勤[2]。

      早期交通流量預(yù)測是基于統(tǒng)計(jì)學(xué)模型的方法。Vythoulkas[3]采用卡爾曼濾波模型利用線性系統(tǒng)狀態(tài)方程對交通流量進(jìn)行預(yù)測,Ahmed等[4]將流量預(yù)測轉(zhuǎn)換成時(shí)序預(yù)測提出ARIMA方法(Auto-Regressive integrated moving average)對高速路交通流量進(jìn)行預(yù)測。但基于統(tǒng)計(jì)模型的預(yù)測方法大多為線性模型,隨著交通數(shù)據(jù)的非線性和不確定性增強(qiáng),模型預(yù)測精度逐漸變差,學(xué)者開始利用機(jī)器學(xué)習(xí)對交通流量預(yù)測。Feng等[5]提出具有時(shí)空相關(guān)性的自適應(yīng)多核SVM模型(support vector machine)用于短期交通流量預(yù)測,Lee等[6]提出基于天氣狀況的多元線性回歸分析模型(multiple linear regression analysis,MLRA)用于交通預(yù)測。隨著交通數(shù)據(jù)的數(shù)據(jù)量劇增,交通流量數(shù)據(jù)也呈現(xiàn)出多維度的趨勢,機(jī)器學(xué)習(xí)對于復(fù)雜龐大的連續(xù)數(shù)據(jù)深層次特征的提取日益困難,研究者開始運(yùn)用深度學(xué)習(xí)進(jìn)行交通流量預(yù)測。

      Zhang等[7]對交通數(shù)據(jù)進(jìn)行時(shí)空分析,引入CNN(convolutional neural network)進(jìn)行交通流量預(yù)測,單一模型預(yù)測難免會使數(shù)據(jù)特征信息丟失,將神經(jīng)網(wǎng)絡(luò)拓展延伸形成組合預(yù)測方法,逐漸成為發(fā)展趨勢。Fu等[8]使用LSTM(long short term memory)-GRU(gate recurrent unit)組合模型對交通流量進(jìn)行預(yù)測,Zheng等[9]將注意力機(jī)制引入圖神經(jīng)網(wǎng)絡(luò)用于交通流量預(yù)測?;谏窠?jīng)網(wǎng)絡(luò)創(chuàng)新取得較好預(yù)測效果,但模型復(fù)雜度增加且效率變低。為挖掘深層次特征,Wang等[10]構(gòu)建動(dòng)態(tài)感知系統(tǒng)收集數(shù)據(jù),對交通道路數(shù)據(jù)進(jìn)行AP(affinity propagation)聚類,利用LSTM進(jìn)行交通流量預(yù)測[11],Chiabaut等[12]對高速道路數(shù)據(jù)進(jìn)行高斯混合模型(gaussian mixture model,GMM)聚類得到擁堵圖,運(yùn)用共識學(xué)習(xí)技術(shù)進(jìn)行交通預(yù)測。研究均是基于道路聚類,聚類前并未對道路數(shù)據(jù)進(jìn)行其它處理以得到其隱含的時(shí)空特征。

      針對交通流量數(shù)據(jù)的非線性和不確定性增加、復(fù)雜龐大的連續(xù)數(shù)據(jù)特征難以提取、交通軌跡數(shù)據(jù)的隱含特征提取不充分問題,筆者提出基于深度學(xué)習(xí)的交通流量預(yù)測方法,引入雙向長短時(shí)記憶網(wǎng)絡(luò)模型(bidirectional long short-term memory network, Bi-LSTM),貢獻(xiàn)如下:

      1)網(wǎng)格化處理和交通網(wǎng)格集群建模:通過將交通軌跡數(shù)據(jù)進(jìn)行網(wǎng)格化處理,將復(fù)雜龐大的連續(xù)數(shù)據(jù)轉(zhuǎn)化為網(wǎng)格化的交通網(wǎng)格集群。利用貝葉斯信息準(zhǔn)則(bayesian information criterion, BIC)和GMM模型,將網(wǎng)格化的交通流量數(shù)據(jù)序列分解為若干個(gè)加速度、速度比率、平均停車次數(shù)等相似交通狀況的網(wǎng)格集群,有效提取交通網(wǎng)格集群的時(shí)空特征,深入挖掘路網(wǎng)的時(shí)空關(guān)聯(lián)性。

      2)設(shè)計(jì)多對多模型進(jìn)行序列預(yù)測:全面考慮交通網(wǎng)格之間的相互影響和時(shí)序關(guān)系,設(shè)計(jì)了多對多模型,將分解得到的交通網(wǎng)格集群作為Bi-LSTM的輸入,實(shí)現(xiàn)對網(wǎng)格集群交通流量的序列預(yù)測。

      3)通過使用滴滴蓋亞數(shù)據(jù)開放計(jì)劃的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,基于Bi-LSTM的城市交通網(wǎng)格集群流量預(yù)測具有良好的預(yù)測能力,且優(yōu)于基準(zhǔn)模型。

      1城市交通網(wǎng)格集群的Bi-LSTM流量預(yù)測模型

      基于多對多模型設(shè)計(jì)思想,構(gòu)建Bi-LSTM預(yù)測模型對城市交通流網(wǎng)格集群流量進(jìn)行預(yù)測??紤]輸入的交通網(wǎng)格集群序列遵循正態(tài)分布,為便于計(jì)算,對各個(gè)集群進(jìn)行標(biāo)準(zhǔn)化處理;交通網(wǎng)格集群可用的時(shí)序數(shù)據(jù)可確定2個(gè)網(wǎng)格之間的時(shí)間和空間相關(guān)性,使所輸入數(shù)據(jù)具有較強(qiáng)的時(shí)空關(guān)聯(lián),利用多對多模型設(shè)計(jì)將分解的若干個(gè)交通網(wǎng)格集群作為Bi-LSTM的輸入;根據(jù)預(yù)測精度調(diào)整Bi-LSTM模型相關(guān)參數(shù)權(quán)重,以此預(yù)測n時(shí)刻該交通網(wǎng)格集群每個(gè)網(wǎng)格未來的交通流量。基于Bi-LSTM對城市交通網(wǎng)格集群流量模型預(yù)測框架如圖1所示。

      1.1多對多模型設(shè)計(jì)

      1.1.1 交通傳播

      交通傳播模式是在一個(gè)道路網(wǎng)絡(luò)中特定路段的流量水平所擁有的時(shí)空關(guān)系[13],在空間上的周期性和時(shí)間上的相似性可從歷史數(shù)據(jù)中獲得有價(jià)值信息,進(jìn)而挖掘深層次時(shí)空特征。交通流量在不同交通網(wǎng)格中的傳播隨時(shí)間和空間動(dòng)態(tài)變化,圖2是某集群某日早高峰時(shí)段各空間網(wǎng)格的交通流量圖,橫縱坐標(biāo)表示軌跡數(shù)據(jù)網(wǎng)格化后的空間索引值,從圖2可以看出交通網(wǎng)格(6,34)的交通流量大,周圍其他交通網(wǎng)格的流量越靠近這個(gè)網(wǎng)格流量影響越大,說明這個(gè)交通網(wǎng)格影響著周圍其它交通網(wǎng)格的流量大小。

      1.1.2 多對對模型設(shè)計(jì)

      交通網(wǎng)格可用的時(shí)序數(shù)據(jù)可確定2個(gè)網(wǎng)格之間的時(shí)空相關(guān)性,得到t時(shí)刻當(dāng)前網(wǎng)格的交通流量對其它網(wǎng)格影響。考慮到多對多模型對整個(gè)交通網(wǎng)絡(luò)的交通流量預(yù)測效率更高[11],為挖掘集群內(nèi)各網(wǎng)格的時(shí)空特征,進(jìn)行多對多模型設(shè)計(jì)。多對多模型設(shè)計(jì)思路圖如圖3所示,左圖表示將網(wǎng)格化的交通數(shù)據(jù)進(jìn)行聚類后所得到的某集群,為充分利用每個(gè)網(wǎng)格的時(shí)序數(shù)據(jù)將某集群t = 1,2…n-1個(gè)時(shí)間序列數(shù)據(jù)作為Bi-LSTM模型的輸入,預(yù)測該集群的每個(gè)網(wǎng)格在t=n時(shí)刻的流量。多對多模型設(shè)計(jì)是在被網(wǎng)格化的交通網(wǎng)絡(luò)中,讀取網(wǎng)格的所有集群,將相似交通網(wǎng)格的聚類數(shù)據(jù)輸入Bi-LSTM,預(yù)測n時(shí)刻每個(gè)網(wǎng)格未來的交通流量。

      1.2Bi-LSTM模型框架

      交通流量當(dāng)前狀態(tài)不僅與之前的狀態(tài)有關(guān),還與未來的狀態(tài)有關(guān)。Bi-LSTM具有較強(qiáng)的序列建模能力,可以對交通數(shù)據(jù)的時(shí)間序列特征進(jìn)行建模和預(yù)測,包括小時(shí)、天、周等不同時(shí)間尺度。Bi-LSTM其結(jié)構(gòu)由上下堆疊的2個(gè)單向LSTM組成,輸入在2個(gè)方向流動(dòng)[14],輸入包含預(yù)測時(shí)間前后的時(shí)間序列,可以同時(shí)考慮歷史時(shí)刻和未來時(shí)刻的信息,通過結(jié)合前后時(shí)刻的信息可更好地捕獲交通數(shù)據(jù)的動(dòng)態(tài)變化,較好地預(yù)測流量。在交通流量預(yù)測中,其模型的結(jié)構(gòu)如圖4所示。該網(wǎng)絡(luò)克服了RNN(recurrent neural network, RNN)衰退問題,利用了LSTM可長時(shí)間儲存記憶的優(yōu)點(diǎn)。

      2數(shù)據(jù)說明

      研究的數(shù)據(jù)集來源于滴滴出行設(shè)立的蓋亞數(shù)據(jù)開放計(jì)劃平臺,地理區(qū)域是四川省成都市二環(huán)內(nèi)局部范圍,原始數(shù)據(jù)大小約180 GB,軌跡點(diǎn)采集間隔為2-4 s,時(shí)間區(qū)間是某年11月1日-30日,軌跡數(shù)據(jù)與實(shí)際路段相對應(yīng)。司機(jī)及乘客訂單的隱私信息進(jìn)行了加密脫敏匿名化處理可保證用戶安全。為了使軌跡數(shù)據(jù)更加集中,便于提取時(shí)空特征,對大規(guī)模雜亂軌跡數(shù)據(jù)進(jìn)行清洗、錯(cuò)誤篩查、壓縮等處理,處理前后區(qū)域范圍如圖5所示,(a)表示處理前區(qū)域范圍,(b)表示處理后區(qū)域范圍。從圖看出處理后的區(qū)域范圍更加清晰,數(shù)據(jù)更加集中,便于進(jìn)行時(shí)空網(wǎng)格劃分。

      大規(guī)模軌跡數(shù)據(jù)時(shí)空相關(guān)性較強(qiáng),其時(shí)間數(shù)據(jù)只有一維屬性且具有嚴(yán)格的序列性,空間數(shù)據(jù)具有多維屬性且空間相關(guān)性更復(fù)雜。網(wǎng)格劃分可高效地挖掘數(shù)據(jù)中隱含的時(shí)空特征,對不同類別的時(shí)空數(shù)據(jù)進(jìn)行融合[15]。筆者利用網(wǎng)格劃分方法將研究區(qū)域劃分為棋盤狀的網(wǎng)格以便于提取深層次的交通特征,時(shí)空網(wǎng)格劃分如圖6所示,左圖中若干個(gè)黑色圓圈表示網(wǎng)約車軌跡數(shù)據(jù)點(diǎn)的分布情況,紅色箭頭表示將其歸類到各個(gè)空間網(wǎng)格的過程,右圖表示劃分時(shí)間網(wǎng)格。取空間網(wǎng)格大小為50,時(shí)間窗為600 s,將空間數(shù)據(jù)點(diǎn)映射到各個(gè)網(wǎng)格中,在對定位點(diǎn)進(jìn)行映射的同時(shí)也將矢量的軌跡網(wǎng)格化為網(wǎng)格序列,實(shí)現(xiàn)將軌跡數(shù)據(jù)打散成點(diǎn)坐標(biāo)轉(zhuǎn)化為張量,從而可直接或間接得到每個(gè)網(wǎng)格的索引值以及網(wǎng)格平均加速度、網(wǎng)格浮動(dòng)車流量、網(wǎng)格平均停車次數(shù)等。

      3交通網(wǎng)格集群模型構(gòu)建

      3.1確定最佳組分

      基于Bi-LSTM的城市交通網(wǎng)格集群流量進(jìn)行預(yù)測,確定交通網(wǎng)格的最佳集群數(shù)是進(jìn)行GMM模型聚類的基礎(chǔ)。為避免人為確定最佳集群數(shù)對實(shí)驗(yàn)結(jié)果產(chǎn)生影響,利用BIC進(jìn)行參數(shù)估計(jì)確定交通網(wǎng)格最優(yōu)集群數(shù)k。

      很多參數(shù)估計(jì)問題采用似然函數(shù)作為目標(biāo)函數(shù),當(dāng)訓(xùn)練數(shù)據(jù)集足夠大時(shí),該方法可不斷提高模型的精度,但也會隨著模型復(fù)雜度增加而出現(xiàn)過擬合問題[16]。在模型選擇上,在模型復(fù)雜度與模型對數(shù)據(jù)集描述能力之間尋求最佳平衡,Schwarz提出BIC[17]信息準(zhǔn)則,避免樣本數(shù)量過多導(dǎo)致模型精度過高造成模型復(fù)雜度過高的問題。該準(zhǔn)則如式(5)所示,通過在模型中加入與模型參數(shù)個(gè)數(shù)相關(guān)的懲罰項(xiàng)來避免模型的過擬合。

      BIC傾向于選擇較小的值,而模型參數(shù)的個(gè)數(shù)k過大會導(dǎo)致模型出現(xiàn)過擬合[17]。依據(jù)樣本數(shù)據(jù),?GMM模型參數(shù)個(gè)數(shù)與BIC值關(guān)系如圖7所示。由圖7可知BIC的值在4出現(xiàn)了大轉(zhuǎn)折,7以后雖然BIC的值一直在下降,但下降變緩。同時(shí),k值過大會使BIC值變化不明顯且極易導(dǎo)致模型出現(xiàn)過擬合現(xiàn)象,為使BIC值和k值都相對小,取k值為6。

      3.2構(gòu)建GMM模型

      某種程度上GMM模型是改進(jìn)型的K-means模型。K-means模型的作用是將數(shù)據(jù)收集到方差相等的組中,使組內(nèi)總和最小[18],與其他聚類相比收斂速度快,算法可解釋度較強(qiáng),但K-means存在集群形狀缺乏靈活性和概率集群分配概念的問題,無法將2個(gè)聚類中心相同的類聚類。GMM模型是多個(gè)高斯概率密度函數(shù)的線性組合,其曲線由若干個(gè)單高斯函數(shù)疊加而成,任何一個(gè)復(fù)雜曲線都可用若干個(gè)高斯曲線無限逼近。GMM聚類方法重視數(shù)據(jù)點(diǎn)分布而不僅是數(shù)據(jù)點(diǎn)之間的距離,它是通過選擇成分最大化后驗(yàn)概率來完成聚類,提供的聚類有不同的大小[19]?;跇?gòu)成不同聚類的交通網(wǎng)格集群遵循正態(tài)分布,故此選擇GMM算法。GMM聚類模型如式(6)所示。

      利用K-means迭代獲取最優(yōu)值后將聚類中心點(diǎn)作為GMM的初始值進(jìn)行訓(xùn)練,以避免GMM收斂到局部最優(yōu)解;在GMM聚類時(shí),利用EM算法估算參數(shù)使每個(gè)分量都有自己的通用協(xié)方差矩陣。圖8為交通網(wǎng)格聚類的示意圖,網(wǎng)格id和時(shí)間id表示將交通數(shù)據(jù)網(wǎng)格化后所得到網(wǎng)格時(shí)空索引值,網(wǎng)格id和時(shí)間id構(gòu)成時(shí)空網(wǎng)格,clusters表示集群的類別,其中(48,3),3,C2和(19,15),92,C2屬于同一集群,構(gòu)成了交通網(wǎng)格集群。

      4模型驗(yàn)證

      4.1模型訓(xùn)練

      使用1~24日的數(shù)據(jù)作為練數(shù)據(jù),25~30日的數(shù)據(jù)作為測試數(shù)據(jù),取訓(xùn)練集的15%作為驗(yàn)證集,利用過去1 h的交通流量數(shù)據(jù)(6個(gè)時(shí)間步長)來預(yù)測未來10 min(1個(gè)時(shí)間步長)的交通流量。采用Python語言進(jìn)行編程,該程序使用Keras庫,在AMD Ryzen 7 5800H with Radeon Graphics處理器、16gb內(nèi)存、Window10操作系統(tǒng)和Tensorflow2.0深度學(xué)習(xí)框架上實(shí)現(xiàn)。經(jīng)過GMM聚類后所生成的交通網(wǎng)格集群利用多對多模型輸入Bi-LSTM模型進(jìn)行訓(xùn)練。Bi-LSTM設(shè)計(jì)有6個(gè)隱藏層,前兩層是bi-lstm層,各有64個(gè)神經(jīng)元;第三層有32個(gè)神經(jīng)元;第四層16個(gè)神經(jīng)元;第五層為dropout層,為防止模型過擬合,丟棄率設(shè)為0.2;最后一層為全連接層。LSTM模型學(xué)習(xí)率為0.001,損失函數(shù)使用MSE,反向傳播算法使用Adam優(yōu)化器,激活函數(shù)采用ReLU。由于不同集群的交通狀況不一致,故每批次所訓(xùn)練的樣本數(shù)(batch sizes)、總迭代次數(shù)(epoches)和訓(xùn)練時(shí)間(times)如表1所示。為對模型預(yù)測效果進(jìn)行評價(jià),使用經(jīng)典的多元線性回歸分析(MLRA)模型作為對照組,在同一實(shí)驗(yàn)環(huán)境中進(jìn)行對比實(shí)驗(yàn)驗(yàn)證。

      4.2模型誤差分析

      利用過去1 h的交通數(shù)據(jù)預(yù)測未來10 min的交通流量,圖9為某交通網(wǎng)格集群MLRA模型和Bi-LSTM各自相同工作日早高峰時(shí)段網(wǎng)格流量的預(yù)測結(jié)果圖,其中a為真實(shí)值,b為預(yù)測值,右下角為同一區(qū)域網(wǎng)格的放大圖。

      從圖9可以看出:1)總體來看MLRA模型和Bi-LSTM模型預(yù)測結(jié)果均小于真實(shí)值,可能與早高峰時(shí)段的交通流量大、交通狀況復(fù)雜等因素有關(guān),使2個(gè)模型的預(yù)測值都偏小;2)從局部放大網(wǎng)格圖直觀上發(fā)現(xiàn)每個(gè)網(wǎng)格流量趨勢大體相同,但MLRA模型的流量預(yù)測值較真實(shí)值波動(dòng)大,不穩(wěn)定,Bi-LSTM模型的預(yù)測精度高于MLRA模型。

      模型時(shí)間序列相似性結(jié)果:圖10、圖11表示的是某交通網(wǎng)格集群MLRA模型和Bi-LSTM模型在工作日和節(jié)假日早高峰和平峰時(shí)段時(shí)間序列相似性的結(jié)果,其中a為早高峰(7:00-9:00)、b為平峰(9:00-11:00),縱坐標(biāo)表示流量,橫坐標(biāo)表示時(shí)間步長,一個(gè)時(shí)間步長代表10 min,時(shí)間窗取600 s,42代表早上7:00,48為8:00,以此類推。

      從圖10、圖11可以看出:1)整體來看,MLRA模型和Bi-LSTM模型對于工作日和節(jié)假日的時(shí)間序列相似性結(jié)果,預(yù)測值與實(shí)際交通流量值的流動(dòng)形態(tài)非常接近,說明2個(gè)模型能夠進(jìn)行較好預(yù)測。2個(gè)模型的預(yù)測值大多時(shí)間小于真實(shí)值,早高峰時(shí)段更為明顯,且2個(gè)模型對早高峰的預(yù)測沒有平峰的預(yù)測好,可能與早高峰時(shí)段流量大、交通狀況復(fù)雜等因素有關(guān)。2)在工作日早高峰時(shí)段,MLRA模型和Bi-LSTM模型流量預(yù)測值大多小于真實(shí)值。在7:00-7:30時(shí)間段和8:00-8:10時(shí)間段MLRA模型和Bi-LSTM模型預(yù)測值嚴(yán)重偏離真實(shí)值,但Bi-LSTM更加接近真實(shí)值,其它時(shí)間段2個(gè)模型的預(yù)測值直觀上與MLRA模型更為接近,預(yù)測效果好;3)在節(jié)假日7:10-7:30時(shí)間段,MLRA模型時(shí)間序列相似性結(jié)果的預(yù)測值和實(shí)際值流動(dòng)狀態(tài)相差較大,隨著數(shù)據(jù)增加預(yù)測值和真實(shí)值逐漸接近,表現(xiàn)出較好預(yù)測效果。在多數(shù)時(shí)段Bi-LSTM模型優(yōu)于MLRA模型;4)對于平峰時(shí)段的預(yù)測,MLRA模型和Bi-LSTM模型流量預(yù)測值較為接近真實(shí)值,可能與平峰時(shí)段交通狀況穩(wěn)定有關(guān)。Bi-LSTM模型在工作日和節(jié)假日上午時(shí)段流量的預(yù)測值和真實(shí)值更加接近也更加穩(wěn)定,表現(xiàn)出更好的魯棒性。

      為量化模型預(yù)測結(jié)果,采用經(jīng)典的誤差評價(jià)指標(biāo)[20]平均絕對誤差(mean absolute error,MAE)、均方根誤差(mean squared root error,RMSE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)和動(dòng)態(tài)時(shí)間規(guī)整(dynamic time warping,DTW)對模型結(jié)果進(jìn)行評價(jià)。

      1) MAE:用于評估交通流量預(yù)測值和真實(shí)值的接近程度,其值越小擬合效果越好,

      2) RMSE:該指標(biāo)計(jì)算的是交通流量預(yù)測結(jié)果和真實(shí)值對應(yīng)樣本點(diǎn)誤差的平方根,其值越小說明預(yù)測速度值精度越高,

      3)MAPE:用于測量測試集上平均流量測試值與實(shí)際測試值之間的相對誤差,范圍[0,+∞),MAPE為0%表示完美模型,MAPE大于100 %則表示劣質(zhì)模型,

      4) DTW:用于測量交通流量預(yù)測值和真實(shí)值2個(gè)時(shí)間序列之間的相似性,所得到的距離越小,說明2個(gè)時(shí)間序列越相似。

      不同模型和集群的評價(jià)結(jié)果如表2所示,整體來看,在每個(gè)交通網(wǎng)格集群中,MLRA模型、Bi-LSTM模型對交通流量的預(yù)測都取得了不錯(cuò)效果,這與將網(wǎng)格化的交通流量數(shù)據(jù)通過GMM聚類所得到的一系列交通網(wǎng)格集群有關(guān)。因?yàn)槊總€(gè)交通網(wǎng)格集群內(nèi)部相關(guān)性較強(qiáng),交通狀況極為相似,從而使2個(gè)模型的預(yù)測效果較好,但各自在模型精度以及時(shí)間序列相似性方面存在些許差異。為使MLRA模型、Bi-LSTM模型評價(jià)更直觀,利用不同交通網(wǎng)格集群所占整個(gè)交通網(wǎng)格的權(quán)重方法,使每個(gè)交通網(wǎng)格集群乘以各自的權(quán)重再進(jìn)行疊加,得到如表3所示總的模型評價(jià)結(jié)果。

      模型精度:模型的平均評價(jià)結(jié)果如表3所示,通過表3發(fā)現(xiàn),MLRA、Bi-LSTM的MAE、MSE、MAPE分別為3.201 1、4.400 9、0.318 7,3.068 7、4.294 3、0.304 5。

      1)Bi-LSTM與MLRA相比,MAE降低0.1324,提高4.14%,Bi-LSTM的流量預(yù)測值較為接近真實(shí)值,擬合效果較好;

      2)Bi-LSTM與MLRA相比,RMSE降低0.1066,提高2.42%,Bi-LSTM模型的交通流量預(yù)測結(jié)果和真實(shí)值對應(yīng)樣本點(diǎn)的誤差平方根較小,預(yù)測精度比經(jīng)典MLRA模型流量預(yù)測高,預(yù)測效果較好;

      3)Bi-LSTM與MLRA相比,MAPE降低0.0142,提高4.46%,Bi-LSTM模型的測試集上平均流量測試值與實(shí)際測試值之間的相對誤差小,說明Bi-LSTM模型優(yōu)于MLRA模型。

      DTW結(jié)果:表3中MLRA模型、Bi-LSTM模型時(shí)間序列相似性結(jié)果DTW分別為52938.6356、54815.1055,Bi-LSTM模型較MLRA模型提高3.42%,說明Bi-LSTM的流量預(yù)測值更加接近真實(shí)值,Bi-LSTM優(yōu)于MLRA模型,表現(xiàn)出較好的魯棒性。

      Bi-LSTM模型較經(jīng)典MLRA模型在對交通網(wǎng)格集群進(jìn)行流量預(yù)測時(shí)表現(xiàn)出較好的泛化性和魯棒性,Bi-LSTM在交通流量集群預(yù)測方面比MLRA模型更有優(yōu)勢。

      5結(jié)??語

      在Tensorflow2.0深度學(xué)習(xí)的理論框架下,基于Python語言,利用貝葉斯信息準(zhǔn)則和高斯混合模型,將網(wǎng)格化的交通流量數(shù)據(jù)序列分解為若干個(gè)相似交通狀況的網(wǎng)格集群,設(shè)計(jì)了多對多模型,根據(jù)交通網(wǎng)格可用的時(shí)間序列數(shù)據(jù),構(gòu)建了基于Bi-LSTM交通流量時(shí)間序列預(yù)測框架,借助Keras完成逐層網(wǎng)絡(luò)構(gòu)建和精細(xì)化調(diào)參,實(shí)現(xiàn)基于Bi-LSTM對城市交通網(wǎng)格集群的短時(shí)交通流預(yù)測。Bi-LSTM模型較MLRA模型在MAE、MSE、MAPE方面分別提高了4.14%、2.40%、4.46%,Bi-LSTM模型表現(xiàn)出更好的泛化性能。2個(gè)時(shí)間序列之間相似性表現(xiàn)出的DTW結(jié)果為Bi-LSTM組合預(yù)測模型較MLRA模型提高了3.42%,Bi-LSTM要優(yōu)于MLRA,表現(xiàn)出較好的魯棒性。說明基于Bi-LSTM對城市交通網(wǎng)格集群流量預(yù)測是可行的,具有應(yīng)用于城市交通網(wǎng)格流量預(yù)測的潛力。

      參考文獻(xiàn)

      [1]??劉宜成, 李志鵬, 呂淳樸, 等. 基于動(dòng)態(tài)時(shí)間調(diào)整的時(shí)空圖卷積路網(wǎng)交通流量預(yù)測[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2022, 22(3): 147-157, 178.

      Liu Y C, Li Z P, Lv C P, et al. Network-wide traffic flow prediction research based on DTW algorithm spatial-temporal graph convolution[J]. Journal of Transportation Systems Engineering and Information Technology, 2022, 22(3): 147-157, 178.(in Chinese)

      [2]??Chen C L, Liu Y B, Chen L, et al. Bidirectional spatial-temporal adaptive transformer for urban traffic flow forecasting[J]. IEEE Transactions on Neural Networks and Learning Systems, 2022, PP(99): 1-13.

      [3]??Vythoulkas P. Alternative approaches to short term traffic forecasting for use in driver information systems[J]. Transportation and Traffic Theory, 1993, 12: 485-506.

      [4]??Ahmed M S. Analysis of freeway traffic time series data and their application to incident detection[M]. OKlahoma;The University of Oklahoma, 1979.

      [5]??Feng X X, Ling X Y, Zheng H F, et al. Adaptive multi-kernel SVM with spatial–temporal correlation for short-term traffic flow prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(6): 2001-2013.

      [6]??Lee J W, Hong B, Lee K, et al. A prediction model of traffic congestion using weather data[C]//2015 IEEE International Conference on Data Science and Data Intensive Systems. December 11-13, 2015. Sydney, NSW, Australia:IEEE, 2016: 81-88.

      [7]??Zhang W B, Yu Y H, Qi Y, et al. Short-term traffic flow prediction based on spatio-temporal analysis and CNN deep learning[J]. Transportmetrica a Transport Science, 2019, 15(2): 1688-1711.

      [8]??Fu R, Zhang Z, Li L. Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC). November 11-13, 2016.Wuhan, China:IEEE, 2017: 324-328.

      [9]??Zheng C P, Fan X L, Wang C, et al. GMAN: a graph multi-attention network for traffic prediction[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(1): 1234-1241.

      [10]??Wang Z Y, Thulasiraman P, Thulasiram R. A dynamic traffic awareness system for urban driving[C]//2019 International Conference on Internet of Things (iThings), IEEE Green Computing and Communications (GreenCom), IEEE Cyber, Physical, Social Computing (CPSCom) and IEEE Smart Data (SmartData), July 14-17, 2019.Atlanta, GA, USA: IEEE, 2019: 945-952.

      [11]??Wang Z Y, Thulasiraman P. Foreseeing congestion using LSTM on urban traffic flow clusters[C]//2019 6th International Conference on Systems and Informatics (ICSAI). November 2-4, 2019, Shanghai, China. IEEE, 2020: 768-774.

      [12]??Chiabaut N, Faitout R. Traffic congestion and travel time prediction based on historical congestion maps and identification of consensual days[J]. Transportation Research Part C: Emerging Technologies, 2021, 124: 102920.

      [13]??Long J C, Gao Z Y, Ren H L, et al. Urban traffic congestion propagation and bottleneck identification[J]. Science in China Series F: Information Sciences, 2008, 51(7): 948-964.

      [14]??Chen K H, Jia J P. Network evasion detection with Bi-LSTM model[J]. Journal of Physics: Conference Series, 2019, 1168: 052009.

      [15]??劉志遠(yuǎn), 張文波. 交通大數(shù)據(jù): 理論與方法[M]. 杭州: 浙江大學(xué)出版社, 2020.

      Liu Z Y, Zhang W B. Traffic big data: theory and method[M]. Hangzhou: Zhejiang University Press, 2020.(in Chinese)

      [16]??趙楊璐, 段丹丹, 胡饒敏, 等. 基于EM算法的混合模型中子總體個(gè)數(shù)的研究[J]. 數(shù)理統(tǒng)計(jì)與管理, 2020, 39(1): 35-50.

      Zhao Y L, Duan D D, Hu R M, et al. On the number of components in mixture model based on EM algorithm[J]. Journal of Applied Statistics and Management, 2020, 39(1): 35-50.(in Chinese)

      [17]??Schwarz G. Estimating the dimension of a model[J]. The Annals of Statistics, 1978,6(2): 461-464.

      [18]??Likas A, Vlassis N, Verbeek J J. The global K-means clustering algorithm[J]. Pattern Recognition, 2003, 36(2): 451-461.

      [19]??Reynolds D. Gaussian mixture models[M]. Boston, MA: Springer, 2009: 659-663.

      [20]??王博文, 王景升, 王統(tǒng)一, 等. 基于長短時(shí)記憶網(wǎng)絡(luò)的Encoder-Decoder多步交通流預(yù)測模型[J]. 重慶大學(xué)學(xué)報(bào), 2021, 44(11): 71-80.

      Wang B W, Wang J S, Wang T Y, et al. An encoder-decoder multi-step traffic flow prediction model based on long short-time memory network[J]. Journal of Chongqing University, 2021, 44(11): 71-80.(in Chinese)

      (編輯??侯湘)

      猜你喜歡
      交通流量集群聚類
      海上小型無人機(jī)集群的反制裝備需求與應(yīng)對之策研究
      基于XGBOOST算法的擁堵路段短時(shí)交通流量預(yù)測
      基于GA-BP神經(jīng)網(wǎng)絡(luò)的衡大高速公路日交通流量預(yù)測
      一種無人機(jī)集群發(fā)射回收裝置的控制系統(tǒng)設(shè)計(jì)
      電子制作(2018年11期)2018-08-04 03:25:40
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      Python與Spark集群在收費(fèi)數(shù)據(jù)分析中的應(yīng)用
      勤快又呆萌的集群機(jī)器人
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      基于復(fù)合卡和ETC的交通流量采集研究
      鸡泽县| 柏乡县| 卢氏县| 安塞县| 荣成市| 兴城市| 万安县| 迭部县| 基隆市| 巢湖市| 大兴区| 潜山县| 邯郸县| 文水县| 西乌珠穆沁旗| 那坡县| 淳化县| 禄劝| 昌吉市| 闻喜县| 昌图县| 全州县| 丹东市| 乌海市| 武平县| 依安县| 海兴县| 涿州市| 印江| 师宗县| 大英县| 神农架林区| 上林县| 丰顺县| 宿松县| 宕昌县| 阜康市| 庆安县| 思南县| 无为县| 什邡市|