• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于K-means聚類與PLS回歸模型的交通速度短時(shí)預(yù)測(cè)

      2023-06-23 04:37:36賈秀燕孫秋霞李勍
      關(guān)鍵詞:城市交通

      賈秀燕 孫秋霞 李勍

      摘要:為實(shí)現(xiàn)對(duì)交通流局部特征的有效提取,提高交通速度預(yù)測(cè)模型的可解釋性,提出基于K-means聚類與偏最小二乘(Partial Least Squares,PLS)回歸的交通速度短時(shí)預(yù)測(cè)模型。模型采用時(shí)空相關(guān)矩陣挖掘路網(wǎng)中相鄰路段交通速度之間的關(guān)聯(lián)性,利用K-means聚類算法劃分歷史數(shù)據(jù)集,并選取實(shí)測(cè)出租車GPS數(shù)據(jù)驗(yàn)證模型對(duì)交通速度短時(shí)預(yù)測(cè)的準(zhǔn)確性。實(shí)驗(yàn)結(jié)果表明,與ARIMA、PLS回歸和LSTM模型相比,該模型的預(yù)測(cè)誤差減少了約30%。

      關(guān)鍵詞:城市交通;速度短時(shí)預(yù)測(cè);K-means聚類;偏最小二乘回歸;時(shí)空相關(guān)矩陣

      中圖分類號(hào):U121 文獻(xiàn)標(biāo)志碼:A

      隨著中國(guó)機(jī)動(dòng)化進(jìn)程不斷加快,高峰出行困難成為大中城市所普遍面臨的難題。作為智能交通運(yùn)輸系統(tǒng)的一項(xiàng)重要功能,交通控制與誘導(dǎo)調(diào)控策略的制定主要依賴于交通速度預(yù)測(cè)的結(jié)果。交通速度預(yù)測(cè)按照預(yù)測(cè)時(shí)間窗的長(zhǎng)度通常劃分為長(zhǎng)時(shí)預(yù)測(cè)和短時(shí)預(yù)測(cè),長(zhǎng)時(shí)預(yù)測(cè)的時(shí)間步長(zhǎng)通常以日、月或年計(jì)算,短時(shí)預(yù)測(cè)更傾向于對(duì)交通狀態(tài)的微觀描述,觀測(cè)時(shí)間通常小于15min[1-2]。預(yù)測(cè)短時(shí)交通速度,實(shí)時(shí)評(píng)價(jià)交通狀況,能夠起到疏導(dǎo)交通擁堵、減少環(huán)境污染和駕乘人員等待時(shí)間、提高交通參與者的安全、為駕駛?cè)颂峁┯行С鲂行畔⒎?wù)的作用。國(guó)內(nèi)外學(xué)者利用各學(xué)科領(lǐng)域內(nèi)的知識(shí)開發(fā)了各種用于短時(shí)交通速度預(yù)測(cè)的方法,這些方法大致分為兩大類:經(jīng)典方法和基于深度學(xué)習(xí)的方法。經(jīng)典預(yù)測(cè)方法包括統(tǒng)計(jì)方法和傳統(tǒng)的機(jī)器學(xué)習(xí)方法[3]。統(tǒng)計(jì)方法假設(shè)未來數(shù)據(jù)與歷史數(shù)據(jù)具有相似性,通過建立數(shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)模型對(duì)交通速度分析預(yù)測(cè),而交通速度數(shù)據(jù)具有復(fù)雜的非線性特征,往往不滿足統(tǒng)計(jì)方法的假設(shè),且這些方法多適用于小數(shù)據(jù)集[4-5]。傳統(tǒng)的機(jī)器學(xué)習(xí)模型整體的非線性有限,預(yù)測(cè)效果并不是最佳的[6-8]。深度學(xué)習(xí)的出現(xiàn)使人工智能在交通速度預(yù)測(cè)的潛能得到進(jìn)一步開發(fā)[9-14]。在數(shù)據(jù)集有限的應(yīng)用情景下,深度學(xué)習(xí)模型難以有效的挖掘數(shù)據(jù)的規(guī)律,同時(shí)具有計(jì)算復(fù)雜度高、可解釋性差的缺點(diǎn)。為了實(shí)現(xiàn)交通流量、交通速度、行程時(shí)間的短時(shí)預(yù)測(cè),將多個(gè)模型組合以提升模型預(yù)測(cè)性能[15-17]。模型的組合方式、權(quán)重參數(shù)的確定以及訓(xùn)練數(shù)據(jù)集的平衡問題是組合模型研究中的難點(diǎn)[18-19]。為了克服傳統(tǒng)模型無法有效提取交通速度數(shù)據(jù)非線性特征這一缺點(diǎn),本文聚焦路網(wǎng)交通速度之間關(guān)聯(lián)性的挖掘,建立時(shí)空相關(guān)矩陣,利用K-means聚類算法把相似狀態(tài)的交通速度聚類進(jìn)行建模分析,放大數(shù)據(jù)的局部特征,更準(zhǔn)確地把握交通速度的變化趨勢(shì)。綜合考慮模型的預(yù)測(cè)精度與計(jì)算時(shí)間復(fù)雜度,使模型具有更高的解釋性,選擇偏最小二乘回歸模型作為最終的預(yù)測(cè)模型。

      1 研究方法

      1.1 路網(wǎng)時(shí)空相關(guān)性的挖掘

      為分析相關(guān)路段交通流對(duì)目標(biāo)路段交通流的影響程度,估計(jì)交通流之間的相關(guān)性,而不是直接對(duì)交通流本身進(jìn)行聚類。若城市道路網(wǎng)絡(luò)中某一區(qū)域內(nèi)含有P節(jié)路段,且每一路段上都裝有環(huán)路檢測(cè)器(傳感器)以采集實(shí)時(shí)的交通速度數(shù)據(jù),可以得到P條路段的歷史交通速度數(shù)據(jù)所組成的時(shí)間序列數(shù)據(jù)V=(V1,V2,…,VP),

      2 實(shí)證分析

      2.1 研究區(qū)域概況

      為驗(yàn)證提出模型的有效性,選取青島市西海岸新區(qū)長(zhǎng)江中路作為主要的研究區(qū)域。青島市西海岸新區(qū)長(zhǎng)江路是一條東西走向的主干道,沿線串聯(lián)了新區(qū)的行政、商務(wù)、教育、餐飲、居住功能區(qū),路口較多,交通流密集,尤其是上下班的早晚高峰時(shí)段,人車交織,導(dǎo)致通車效率不高、交通事故頻發(fā),長(zhǎng)江中路路段尤為嚴(yán)重。作為新區(qū)核心位置的主干道,長(zhǎng)江中路的交通服務(wù)品質(zhì)難以滿足日益增長(zhǎng)的社會(huì)需求,成為新區(qū)主要的道路“瓶頸”。

      將青島市西海岸新區(qū)長(zhǎng)江中路作為目標(biāo)道路,為清晰、直觀地觀察各條路段的地理位置,從OpenStreetMap官網(wǎng)下載路網(wǎng)矢量數(shù)據(jù),如圖1所示。研究地點(diǎn)具有典型拓?fù)浣Y(jié)構(gòu),展示了交通流之間不同程度的時(shí)空相關(guān)性,這七條道路雖位于不同的方向,但間接相連,每條道路對(duì)應(yīng)不同的道路名稱,具體對(duì)應(yīng)關(guān)系見表1。

      2.2 數(shù)據(jù)預(yù)處理

      研究數(shù)據(jù)為青島市西海岸新區(qū)長(zhǎng)江中路2017年8月7日至2017年8月20日出租車GPS軌跡數(shù)據(jù),利用Python軟件對(duì)其預(yù)處理,獲得有效數(shù)據(jù)1 752 694條,出租車GPS原始軌跡數(shù)據(jù)示例見表2。

      其中,v(k)為當(dāng)前路段在時(shí)間間隔k內(nèi)的平均速度,vi,n為第n輛出租車在第i個(gè)GPS點(diǎn)處的速度值,i為當(dāng)前路段內(nèi)GPS點(diǎn)的編號(hào),I為當(dāng)前路段內(nèi)所有GPS點(diǎn)的數(shù)量,n是當(dāng)前路段內(nèi)出租車的編號(hào),N為當(dāng)前路段上所有出租車的數(shù)量,Nk是時(shí)間間隔k內(nèi)經(jīng)過當(dāng)前路段的車輛數(shù)。

      為了解西海岸新區(qū)長(zhǎng)江中路交通速度的宏觀特征,基于預(yù)處理后的數(shù)據(jù),利用Python軟件繪制2017年8月7日至8月20日交通速度熱力圖(圖2),交通速度存在明顯的周期性和日相似特征,即不同天的同一時(shí)間段的速度值有著相類似的趨勢(shì)規(guī)律,而同一天的不同時(shí)間段存在著較大的差異。圖2中顏色的深淺代表了交通速度值的大小,顏色越深,速度就越小,代表道路越擁堵,長(zhǎng)江中路8月7日至8月20日的交通流速度數(shù)據(jù)存在明顯的雙峰現(xiàn)象,且出行的早高峰集中于07∶00~08∶30時(shí)間段,晚高峰集中17∶00~19∶00時(shí)間段。

      2.3 構(gòu)建時(shí)空相關(guān)矩陣

      根據(jù)長(zhǎng)江中路早晚高峰時(shí)段的分布狀況,利用式(2)分別計(jì)算長(zhǎng)江中路2017年8月19日8∶30的早高峰時(shí)空相關(guān)矩陣與2017年8月19日19∶00的晚高峰時(shí)空相關(guān)矩陣,時(shí)間延遲d分別設(shè)置為18與24個(gè)時(shí)間間隔,每個(gè)時(shí)間間隔為5 min,相應(yīng)的時(shí)空相關(guān)矩陣熱力圖如圖3所示。

      圖中顏色的深淺代表了目標(biāo)路段R3的交通速度與其他路段交通速度之間相關(guān)性的大小,顏色越深代表相關(guān)性越強(qiáng)。結(jié)果分析發(fā)現(xiàn),早高峰時(shí)段,當(dāng)時(shí)間延遲為0時(shí),路段R3與路段R1、路段R4、路段R5以及路段R7的相關(guān)系數(shù)均為正值,且大于0.5。晚高峰時(shí)段,在時(shí)間延遲為0時(shí),路段R3與路段R1、路段R2以及路段R4(相關(guān)系數(shù)的絕對(duì)值大于0.5。7條路段在不同時(shí)間延遲下相關(guān)系數(shù)的變化趨勢(shì)相似,但在同一時(shí)間延遲下路段之間交通速度的相關(guān)性強(qiáng)度有較大差異。這說明選擇的路段之間存在較強(qiáng)的相關(guān)性,可以通過時(shí)空相關(guān)矩陣的聚類來捕獲交通流之間的時(shí)空相關(guān)的異質(zhì)性。

      2.4 K-means聚類結(jié)果

      為了確定聚類數(shù)目m值,采用方差比準(zhǔn)則(Calinski-Harabaz Index,CHI)評(píng)價(jià)聚類效果,CHI基于數(shù)據(jù)集特性評(píng)估聚類效果,值越大代表聚類的效果越好[16]。CHI值隨m值的變化趨勢(shì)如圖4所示??芍?,m=2時(shí)CHI值取得最大值,說明兩種情況均在劃分為兩簇時(shí)聚類效果最佳,因此將訓(xùn)練數(shù)據(jù)集分為兩簇。

      K-means聚類結(jié)果見表3。可以看出,早、晚高峰時(shí)段的數(shù)據(jù)雖均被劃分為兩簇,但兩簇之間并不完全相同。如路段R1、R3始終在同一簇中,說明路段R3與路段R1的交通狀態(tài)最為相似;而路段R6缺少辦公樓、商場(chǎng)、醫(yī)院等因素吸引人車流入,始終在數(shù)量少的一簇內(nèi)。在不同的高峰時(shí)段,路段R4與路段R5被劃分到了不同的簇中,這可能與路段所處的地理位置、交通流流向以及周邊的興趣點(diǎn)(Point of Interest,POI)屬性相關(guān)。路段R4為城市主干道,西鄰富春江路小學(xué),東鄰青島西海岸新區(qū)中心醫(yī)院,早高峰時(shí)段與相鄰路段的車流來往密切,而路段R5穿過居民區(qū),在晚高峰時(shí)段與相鄰路段的車流關(guān)系密切,說明同一天不同時(shí)間段的交通速度之間存在差異性。

      2.5 基于偏最小二乘算法的短時(shí)交通速度預(yù)測(cè)

      利用K-means聚類算法得到與目標(biāo)路段R3在早晚高峰時(shí)段最相關(guān)的路段,篩選出與目標(biāo)路段的交通速度具有高相關(guān)性的歷史數(shù)據(jù)集,使用更新后的數(shù)據(jù)集構(gòu)建基于偏最小二乘算法的短時(shí)交通速度預(yù)測(cè)模型。由偏最小二乘算法的建模過程可知,只需選取前r個(gè)主成分建立回歸方程就可以達(dá)到較好的預(yù)測(cè)精度,r個(gè)成分的選擇提取可通過進(jìn)行交叉有效性檢驗(yàn)來確認(rèn)[20]。交叉有效性檢驗(yàn)結(jié)果見表4。

      由表4可知,前4個(gè)主成分的交叉有效性均大于0.097 5,但第5個(gè)主成分交叉有效性小于0.097 5,不滿足交叉有效性提取條件,表明該成分不能明顯改善模型的擬合能力,因此,模型只提取前4個(gè)主成分,得到標(biāo)準(zhǔn)化偏最小二乘回歸方程為

      其中,y*zao、y*wan分別為長(zhǎng)江中路在早高峰時(shí)段和晚高峰時(shí)段的預(yù)測(cè)模型。最終預(yù)測(cè)的效果如圖5所示。

      對(duì)比圖5(a)與(b),早高峰時(shí)段交通速度的預(yù)測(cè)值更接近于真實(shí)值,晚高峰時(shí)段的預(yù)測(cè)值誤差略大,說明該模型對(duì)高頻率波動(dòng)的數(shù)據(jù)預(yù)測(cè)精度相對(duì)較差,但預(yù)測(cè)值與真實(shí)值的總體變化趨勢(shì)是一致的。長(zhǎng)江中路交通速度整體較為平緩,早高峰時(shí)段集中在15~25 km/h,晚高峰時(shí)段集中在10~20 km/h,晚高峰速度值低于早高峰,因?yàn)殚L(zhǎng)江中路位于經(jīng)濟(jì)開發(fā)區(qū)中心,商場(chǎng)較多,晚間時(shí)段人口集中,車流密度大。

      2.6 模型評(píng)價(jià)

      其中,yi為交通速度的真實(shí)值;i為模型預(yù)測(cè)值;N為測(cè)試樣本集的個(gè)數(shù)。對(duì)比結(jié)果見表5、表6。

      添加“周”周期并采取對(duì)歷史數(shù)據(jù)集先聚類后預(yù)測(cè)的方法,模型的預(yù)測(cè)精度有了較明顯的改善。與經(jīng)典模型相比,本文提出的基于K-means聚類與PLS回歸預(yù)測(cè)模型的預(yù)測(cè)精度最佳。這說明通過構(gòu)建時(shí)空相關(guān)矩陣并對(duì)其進(jìn)行聚類,篩選出與目標(biāo)路段相關(guān)性最強(qiáng)的路段,更新訓(xùn)練數(shù)據(jù)集,可以提高模型的預(yù)測(cè)精度。相比于LSTM模型,PLS回歸模型具有更高的預(yù)測(cè)精度,且模型的訓(xùn)練時(shí)間更少。這說明PLS回歸模型不僅能夠以量化的方式給出模型提高精度過程,具有更強(qiáng)的解釋性,且模型的計(jì)算復(fù)雜度更低。

      3 結(jié)論

      本文的交通速度短時(shí)預(yù)測(cè)模型通過計(jì)算時(shí)空相關(guān)矩陣挖掘路網(wǎng)中相鄰路段之間交通速度的關(guān)聯(lián)性,利用K-means聚類更新數(shù)據(jù)集,結(jié)合PLS回歸模型預(yù)測(cè)交通速度。本文模型相比于傳統(tǒng)方法具有更高的預(yù)測(cè)精度,模型的預(yù)測(cè)速度和可解釋性也有較大的提升,是一種可行的交通速度短時(shí)預(yù)測(cè)方法。后續(xù)研究中,將考慮組合模型的方式,在模型訓(xùn)練過程中選擇添加其他時(shí)段的交通速度數(shù)據(jù),以增強(qiáng)模型的適用性。

      參考文獻(xiàn)

      [1]VLAHOGIANNI E I, KARLAFTIS M G, GOLIAS J C. Short-term traffic forecasting: Where we are and where we′re going[J]. Transportation Research Part C-Emerging Technologies, 2014, 43(1): 3-19.

      [2]袁健, 范炳全. 交通流短時(shí)預(yù)測(cè)研究進(jìn)展[J]. 城市交通, 2012,10(6):73-79.

      [3]周輝宇, 李瑞敏, 黃安強(qiáng), 等. 基于時(shí)空關(guān)聯(lián)規(guī)則挖掘的城市交通擁堵傳導(dǎo)預(yù)測(cè)[J]. 系統(tǒng)工程理論與實(shí)踐,2022, 42(8): 2210-2224.

      [4]張國(guó)赟, 金輝. 基于改進(jìn)ARIMA模型的城市軌道交通短時(shí)客流預(yù)測(cè)研究[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2022, 39(1): 339-344.

      [5]LI W, WANG J X, FAN R, et al. Short-term traffic state prediction from latent structures: Accuracy vs. efficiency[J]. Transportation Research Part C-Emerging Technologies, 2020, 111: 72-90.

      [6]CHEN R, LIANG C Y, HONG W C, et al. Forecasting holiday daily tourist flow based on seasonal support vector regression with adaptive genetic algorithm[J]. Applied Soft Computing, 2015, 26: 435-443.

      [7]LI Y F, JIANG X, ZHU H, et al. Multiple measures-based chaotic time series for traffic flow prediction based on Bayesian theory[J]. Nonlinear Dynamics, 2016, 85(1):179-194.

      [8]PRIAMBODO B, AHMAD A, KADIR R A. Spatio-temporal K-NN prediction of traffic state based on statistical features in neighboring roads[J]. Journal of Intelligent and Fuzzy Systems, 2021, 40(5): 9059-9072.

      [9]RUMELHART D E, HINTON G E, WILLIAMS R J. Learning representations by back-propagating errors[J]. Nature, 1986, 323: 533-536.

      [10]? SUN Z Y, HU Y J, LI W, et al. Prediction model for short-term traffic flow based on a K-means-gated recurrent unit combination[J]. IET Intelligent Transport Systems, 2022, 16(5): 675-690.

      [11] KANG C L, ZHANG Z Y. Application of LSTM in short-term traffic flow prediction[C]// 2020 IEEE 5th International Conference on Intelligent Transportation Engineering (ICITE). Beijing, 2020: 98-101.

      [12] LI Z Y, GE H X, CHENG R J. Traffic flow prediction based on BILSTM model and data denoising scheme[J]. Chinese Physics B, 2022,31(4):214-223.

      [13] BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[DB/OL].[2022-08-30]. https://arxiv.org/pdf/1312.6203.pdf.

      [14] SHEN G J, HAN X, CHIN K, et al. An attention-based digraph convolution network enabled framework for congestion recognition in three-dimensional road networks[J]. IEEE Transactions on Intelligent Transportation Systems, 2021,23(9): 14413-14426.

      [15] CHENG Z Y, WANG W, LU J, et al. Classifying the traffic state of urban expressways: A machine-learning approach[J]. Transportation Research Part A-Policy and Practice, 2020, 137: 411-428.

      [16] 王旭鵬, 王夢(mèng)靈. 基于相似性聚類的交通流概率組合預(yù)測(cè)模型[J]. 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022, 48(3): 381-387.

      [17] ZHANG Z H, WANG Y P, CHEN P, et al. Probe data-driven travel time forecasting for urban expressways by matching similar spatiotemporal traffic patterns[J]. Transportation Research Part C-Emerging Technologies, 2017, 85: 476-493.

      [18] GUO Y N, YANG H, CHEN M Y, et al. Ensemble prediction-based dynamic robust multi-objective optimization methods[J]. Swarm and Evolutionary Computation, 2019, 48: 156-171.

      [19] YANG L K, GUO Y N, CHENG J, et al. Manifold distance-based over-sampling technique for class imbalance learning[C]// 33rd AAAI Conference on Artificial Intelligence/31st Innovative Applications of Artificial Intelligence Conference/ 9th AAAI Symposium on Educational Advances in Artificial Intelligence. Hawaii, 2019: 10071-10072.

      [20] 王德政, 張益農(nóng), 楊帆. 基于MapReduce的并行PLS過程監(jiān)控算法實(shí)現(xiàn)[J]. 計(jì)算機(jī)工程與應(yīng)用, 2018, 54(24): 61-65+175.

      Short-term Prediction of Traffic Speed Based on K-means Clustering and PLS Regression Model

      JIA Xiu-yan, SUN Qiu-xia, LI Qing

      (College of Mathematics and Systems Science, Shandong University of Science and Technology, Qingdao 266590, China)

      Abstract: To achieve effective extraction of local features of traffic flow and to improve the interpretability of traffic prediction models, a K-means clustering and PLS regression model was proposed to predict short-time traffic speed. The Spatio-temporal correlation matrix was calculated to explore the correlation between the traffic speeds of adjacent road sections in the road network. The K-means clustering algorithm was used to divide the historical data set. The PLS regression model was used to make the predictions. To verify the accuracy of the model for short-time traffic speed prediction, the GPS data of taxis was selected for validation. The experimental results show that the models prediction error is reduced by about 30% compared with the ARIMA, PLS regression, and LSTM models.

      Keywords: urban transportation; short-term speed prediction; K-means clustering; partial least squares regression; spatio-temporal correlation matrix

      收稿日期:2022-09-09

      基金項(xiàng)目:山東省自然科學(xué)基金面上項(xiàng)目(批準(zhǔn)號(hào):ZR2021MF113)資助。

      通信作者:孫秋霞,女,博士,副教授,主要研究方向?yàn)榻煌ù髷?shù)據(jù)分析與建模。E-mail:qiuxiasun@sdust.edu.cn。

      猜你喜歡
      城市交通
      新形勢(shì)下我國(guó)城市交通發(fā)展戰(zhàn)略思考
      老齡化背景下關(guān)于城市交通適老化對(duì)策的思考
      共享單車對(duì)城市交通的影響
      基于城市總體規(guī)劃的城市交通組織優(yōu)化設(shè)計(jì)與實(shí)施研究
      智能城市(2018年8期)2018-07-06 01:12:10
      上海城市交通大數(shù)據(jù)研究與實(shí)踐
      上海公路(2018年1期)2018-06-26 08:37:40
      基于多源異構(gòu)數(shù)據(jù)的城市交通綜合分析與交通病診斷
      基于車聯(lián)網(wǎng)技術(shù)的城市交通優(yōu)化研究
      圍繞城市交通出行,博世打造兼具軟件和服務(wù)的數(shù)字化企業(yè)
      基于城市交通網(wǎng)絡(luò)的歷史街區(qū)單向交通組織優(yōu)化
      契合城市交通需求 推進(jìn)單軌交通發(fā)展
      大同市| 宣威市| 威宁| 普兰店市| 焉耆| 丹棱县| 灌云县| 剑河县| 佛山市| 陵水| 宜君县| 汝南县| 玛纳斯县| 石嘴山市| 稷山县| 佛学| 江津市| 楚雄市| 凤山市| 漾濞| 金乡县| 自贡市| 巴塘县| 准格尔旗| 普兰县| 上蔡县| 金溪县| 宜春市| 化州市| 柳河县| 东光县| 台江县| 塔城市| 蓬溪县| 印江| 黑河市| 安仁县| 新安县| 兴文县| 那坡县| 湾仔区|