• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向區(qū)域交通狀態(tài)預(yù)測(cè)的時(shí)空集成模型

      2021-11-01 15:53:40吳家成王洪鈺肖建力
      關(guān)鍵詞:交通流時(shí)間段云圖

      吳家成,王洪鈺,肖建力

      (上海理工大學(xué), 光電信息與計(jì)算機(jī)工程學(xué)院, 上海 200093)

      在現(xiàn)代智能交通系統(tǒng)中,交通流分析已成為一個(gè)重要的組成部分。在這方面先前已經(jīng)有了大量的研究工作[1-5],而其中值得關(guān)注的是交通指數(shù)云圖這一種創(chuàng)新的宏觀交通流分析方法。交通指數(shù)云圖的靈感來(lái)源于氣象云圖,它關(guān)注的是區(qū)域的宏觀交通狀態(tài),而不是中觀分析中的道路狀態(tài)或微觀分析中的車輛狀態(tài)。在交通指數(shù)云圖中,一張城市路網(wǎng)被劃分為若干網(wǎng)格,每個(gè)網(wǎng)格都可視為一個(gè)小區(qū)域,通過(guò)獲取區(qū)域中所有道路的相關(guān)信息,再利用交通指數(shù)公式就能生成相應(yīng)區(qū)域的交通指數(shù)。交通指數(shù)可以反映區(qū)域的交通狀態(tài),為了可視化的方便,交通指數(shù)在云圖上被映射為不同的顏色,例如,紅色表示一個(gè)區(qū)域是擁堵的,綠色表示一個(gè)區(qū)域是暢通的。完整的交通指數(shù)云圖對(duì)于交通分析很有幫助,然而在某些情況下,由于計(jì)算交通指數(shù)的相關(guān)數(shù)據(jù)的丟失,導(dǎo)致了某些區(qū)域交通指數(shù)的缺失。這些缺失不具有規(guī)律性,從而對(duì)宏觀交通流分析產(chǎn)生了阻礙。因此,本文的目標(biāo)就是從時(shí)間和空間的角度出發(fā),對(duì)區(qū)域交通指數(shù)進(jìn)行預(yù)測(cè)分析。

      交通流分析中的預(yù)測(cè)方法大致可分為兩類:時(shí)間序列分析方法和機(jī)器學(xué)習(xí)方法[6]。 自回歸移動(dòng)平均(ARIMA)模型是時(shí)間序列分析方法的典型代表,它通常用于規(guī)律性的交通流量預(yù)測(cè)[7]。這種類型的模型試圖建立一種數(shù)學(xué)算法,以規(guī)則的時(shí)間間隔解釋一系列過(guò)去的行為,然后將其應(yīng)用于預(yù)測(cè)未來(lái)的值[8-9]。該模型適用于挖掘出交通流在時(shí)間上的變化規(guī)律。

      支持向量機(jī)(SVM)作為一種著名的機(jī)器學(xué)習(xí)方法,具有良好的自學(xué)習(xí)和非線性預(yù)測(cè)能力,在實(shí)時(shí)交通流預(yù)測(cè)中具有顯著的優(yōu)勢(shì)[10-11]。交通流在短時(shí)間內(nèi)可能出現(xiàn)不規(guī)律的變化,而SVM模型正適合捕獲這種變化。除此之外,即使在訓(xùn)練樣本有限的情況下,它仍然可以獲得相對(duì)更好的預(yù)測(cè)結(jié)果。因此,該模型適用于實(shí)時(shí)預(yù)測(cè)系統(tǒng)[12]。

      有關(guān)時(shí)間序列的研究中,ARIMA及其季節(jié)性模型SARIMA已被廣泛用于交通流預(yù)測(cè)中。 例如,Xu等[13]使用ARIMA和Kalman濾波器來(lái)預(yù)測(cè)實(shí)時(shí)道路交通狀態(tài),Luo等[14]提出了一種基于改進(jìn)的SARIMA和遺傳算法的交通流預(yù)測(cè)算法。他們改進(jìn)了原始的ARIMA模型并獲得了令人滿意的結(jié)果,這證明ARIMA模型從時(shí)間的角度出發(fā)的確解決了一些交通預(yù)測(cè)的問(wèn)題。但是,作為一種線性模型,其在處理非線性的問(wèn)題上表現(xiàn)并不好。

      SVM是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的機(jī)器學(xué)習(xí)方法,也屬于非參數(shù)化模型的代表[15]。機(jī)器學(xué)習(xí)方法在交通上的應(yīng)用已經(jīng)越來(lái)越受到學(xué)者的關(guān)注,而SVM模型正是其中表現(xiàn)良好的一種方法[16-17]。SVM的分類模型SVC常被用于車輛的分類檢測(cè)或是道路的交通分析[18-19],而回歸模型SVR常被用于交通流的預(yù)測(cè)分析[20-21]或是交通事故的防范預(yù)警[22-23]。SVM模型之所以得到學(xué)者的關(guān)注,一方面是由于本身的精度較高,另一方面也是因?yàn)槠涮幚斫煌ǚ蔷€性問(wèn)題的能力優(yōu)異。以交通流為例,交通流在一個(gè)短期時(shí)間內(nèi)可能呈現(xiàn)出許多不規(guī)律的變化特性,對(duì)這部分的預(yù)測(cè)也具有難度。傳統(tǒng)線性預(yù)測(cè)模型不僅需要大量的歷史數(shù)據(jù),并且預(yù)測(cè)的效果可能也不盡如人意。相比之下,SVM模型所需的訓(xùn)練數(shù)據(jù)較少,并且在這種短期非線性的預(yù)測(cè)問(wèn)題上效果更好。

      考慮到本文的區(qū)域交通狀態(tài)預(yù)測(cè)不同于現(xiàn)有大量研究中的中微觀交通流預(yù)測(cè),在這種宏觀層面的研究較少,并且區(qū)域的交通狀態(tài)是復(fù)雜的,總體既在時(shí)間上呈現(xiàn)出一定規(guī)律性的變化,局部又在空間上表現(xiàn)出一種不規(guī)律的分布特點(diǎn)。因此,如何定量分析交通狀態(tài)并進(jìn)行狀態(tài)預(yù)測(cè)是本文的核心。受前人研究的啟發(fā),本文在城市交通狀態(tài)指數(shù)的基礎(chǔ)上,同時(shí)從時(shí)間與空間兩個(gè)角度進(jìn)行狀態(tài)預(yù)測(cè),并基于兩者的預(yù)測(cè)結(jié)果,嘗試構(gòu)建出一個(gè)集成模型,進(jìn)一步提高預(yù)測(cè)精度。

      1 交通指數(shù)及交通指數(shù)云圖

      交通指數(shù)TI是衡量一個(gè)區(qū)域交通狀態(tài)的指標(biāo),取決于區(qū)域內(nèi)的路段信息、路網(wǎng)信息以及時(shí)間等因素,其計(jì)算公式為[4]

      式中:Vi為路段的實(shí)際交通流速度;Vfr為路段的自由流速度;li為路段的里程長(zhǎng)度;ki為路段上的車道數(shù);N為路段數(shù);wt為時(shí)間權(quán)重系數(shù),在高峰時(shí)段和非高峰時(shí)段取值不同;T為全天的時(shí)段數(shù);Pr為路網(wǎng)的權(quán)重,取值取決于路網(wǎng)的類型;R為路段類型的數(shù)目。

      單純的交通指數(shù)不能直觀地呈現(xiàn)區(qū)域的交通狀態(tài),因此,需要交通指數(shù)云圖(TICM)這樣的可視化工具。TICM由交通速度云圖改進(jìn)而來(lái)[24],其具體生成步驟如下:

      a. 將整個(gè)城市地圖劃分成若干n×n大 小的網(wǎng)格;

      b. 根據(jù)交通指數(shù)公式計(jì)算各網(wǎng)格的指數(shù)值,值越小表示區(qū)域越擁擠,值越大表示區(qū)域越暢通;

      c. 為了可視化交通指數(shù)值,使用了一系列顏色將指數(shù)值映射到TICM上,例如,綠色表示區(qū)域暢通,黃色表示區(qū)域擁擠,紅色表示區(qū)域堵塞;

      d. 選定劃分?jǐn)?shù)目n和時(shí)間段,就可以獲得最終的TICM。

      TICM中指數(shù)值的缺失大部分是由于某段時(shí)間內(nèi)某些路段原始交通數(shù)據(jù)的缺失導(dǎo)致,通常在時(shí)間上表現(xiàn)為一段10~20 min的數(shù)據(jù)空白,并且在凌晨至中午的時(shí)間段內(nèi)出現(xiàn)的頻率較高;在空間上表現(xiàn)為缺失值的區(qū)域分布零散,夾雜在正常區(qū)域之中。為了從空間角度研究區(qū)域特性,將缺失值的區(qū)域連同其周圍8個(gè)區(qū)域劃分在一起,這樣一個(gè)3×3的大區(qū)域稱之為區(qū)域塊。對(duì)于其他的正常區(qū)域,也可以作這樣的區(qū)域塊劃分,目的是為了之后訓(xùn)練模型的需要。根據(jù)區(qū)域塊的中心區(qū)域是否有指數(shù)值,可以將區(qū)域塊劃分為包含待預(yù)測(cè)區(qū)域的目標(biāo)區(qū)域塊和非目標(biāo)區(qū)域塊,其示例圖如圖1所示。

      圖1 目標(biāo)區(qū)域塊和非目標(biāo)區(qū)域塊示例Fig.1 An example of a target block and a non-target block

      2 方法和模型

      2.1 方法框架

      基于區(qū)域塊劃分和時(shí)空結(jié)合預(yù)測(cè)的思想,構(gòu)建出區(qū)域交通狀態(tài)指數(shù)預(yù)測(cè)的框架,如圖2所示。

      圖2 方法框架圖Fig. 2 Framework of proposed model

      方法框架主要由3個(gè)部分組成:時(shí)間預(yù)測(cè)部分、空間預(yù)測(cè)部分和最終預(yù)測(cè)部分。目標(biāo)區(qū)域塊在時(shí)間和空間預(yù)測(cè)部分的結(jié)果將被輸入到集成模型中,而非目標(biāo)區(qū)域塊的時(shí)空預(yù)測(cè)結(jié)果將被用于訓(xùn)練和學(xué)習(xí)集成模型的參數(shù),兩者共同獲得最終的預(yù)測(cè)結(jié)果。

      在時(shí)間預(yù)測(cè)部分,使用ARIMA模型基于之前的歷史數(shù)據(jù)進(jìn)行預(yù)測(cè)。由于不同區(qū)域的狀態(tài)變化情況都不盡相同,因此,需要對(duì)每個(gè)區(qū)域建立唯一的ARIMA模型。

      在空間預(yù)測(cè)部分,需要挖掘中心區(qū)域與其周圍區(qū)域空間上的關(guān)系。這種空間聯(lián)系不像時(shí)間那樣呈現(xiàn)出一定的規(guī)律性,因此,很難用線性模型加以描述。本文采用SVR模型來(lái)進(jìn)行空間預(yù)測(cè),非目標(biāo)區(qū)域塊的數(shù)據(jù)將作為訓(xùn)練集用來(lái)進(jìn)行SVR模型的訓(xùn)練和參數(shù)學(xué)習(xí)。

      2.2 時(shí)間ARIMA模型與空間SVR模型

      ARIMA模型是描述時(shí)間序列的模型,它由3個(gè)部分組成,分別是自回歸(AR)部分、積分(I)部分和移動(dòng)平均值(MA)部分。 其中,AR部分描述了當(dāng)前值和歷史值之間的關(guān)系,I部分使采樣時(shí)間序列滿足平穩(wěn)性的要求,MA部分描述了模型中誤差的積累[25]。在本文中,假設(shè)區(qū)域在t時(shí)間段交通指數(shù)值的ARIMA預(yù)測(cè)結(jié)果為yt。

      式中:μ為常數(shù)項(xiàng);λi為自相關(guān)系數(shù);yt-i為前i個(gè)時(shí)間段的交通指數(shù)值;p為AR部分的階數(shù);q為MA部分的階數(shù);et為誤差項(xiàng);θi為誤差項(xiàng)的系數(shù)。

      對(duì)于每一個(gè)區(qū)域,都可以通過(guò)式(2)獲得ARIMA的預(yù)測(cè)結(jié)果。在每一個(gè)區(qū)域塊中,本文主要關(guān)注中心區(qū)域的預(yù)測(cè)結(jié)果,并將待預(yù)測(cè)區(qū)域的預(yù)測(cè)值記為,正常區(qū)域的預(yù)測(cè)值記為 。

      SVR模型的空間預(yù)測(cè)主要以區(qū)域塊為單位。假設(shè)第i個(gè)區(qū)域塊的中心區(qū)域的指數(shù)值為yi,周圍8個(gè)鄰近區(qū)域的指數(shù)值可以表示為一個(gè)向量xi={x1,x2,···,x8},那么,所有中心區(qū)域?yàn)檎^(qū)域的區(qū)域塊所組成的模型訓(xùn)練集為

      其中,n為訓(xùn)練集的總個(gè)數(shù)。

      SVR模型的決策函數(shù)

      式中:ω為權(quán)重向量;b為偏差;φ(x)表示將輸入映射到更高維度的非線性映射。

      模型的任務(wù)首先是參數(shù)學(xué)習(xí),即解決如下所示的最優(yōu)化問(wèn)題:

      式中:C為懲罰因子;lε為 ε不敏感損失函數(shù)。

      式中:ε為決策平面到分界面的最大不敏感距離;σ為距離值。

      通過(guò)引入松弛變量 ξi和,式(5)可以改寫為

      直接根據(jù)式(8)的約束條件對(duì)式(7)進(jìn)行求解是很困難的,通常的做法是引入拉格朗日乘子αi和,將問(wèn)題轉(zhuǎn)化為拉格朗日對(duì)偶問(wèn)題。通過(guò)計(jì)算對(duì)偶問(wèn)題的偏導(dǎo)數(shù),可以求得ω的表達(dá)形式為

      將式(9)代入式(4),并且在處理拉格朗日乘數(shù)問(wèn)題的必要條件(KKT條件)下[26],可以得到?jīng)Q策函數(shù)的最終形式:

      式中:K(x,xi)為核函數(shù);b為偏差。

      在本文中選擇了徑向基核函數(shù),它的形式為

      對(duì)于每一個(gè)區(qū)域塊,可以根據(jù)式(10)計(jì)算出中心區(qū)域的空間預(yù)測(cè)結(jié)果,并將待預(yù)測(cè)區(qū)域的預(yù)測(cè)值記為,正常區(qū)域的預(yù)測(cè)值記為。

      2.3 集成模型

      ARIMA模型的預(yù)測(cè)結(jié)果從時(shí)間規(guī)律性上描述了區(qū)域可能的狀態(tài),SVR模型的預(yù)測(cè)結(jié)果從空間非線性的關(guān)系中描述了區(qū)域可能的狀態(tài)。但是,后續(xù)的實(shí)驗(yàn)部分證明,這兩種模型各自的預(yù)測(cè)精度都不是很高,各有其優(yōu)點(diǎn)和缺陷。因此,如何考慮時(shí)空相關(guān)性,以合適的方式將兩者的結(jié)果進(jìn)行組合與優(yōu)化,是構(gòu)建集成模型的關(guān)鍵。

      在本文中,假設(shè)最終預(yù)測(cè)值是時(shí)間預(yù)測(cè)和空間預(yù)測(cè)結(jié)果的線性組合,即賦予時(shí)間和空間各一個(gè)權(quán)重,權(quán)重和為1,以此來(lái)反映時(shí)間和空間對(duì)最終預(yù)測(cè)值的貢獻(xiàn)程度。假設(shè)第k個(gè)目標(biāo)區(qū)域塊中待預(yù)測(cè)區(qū)域的最終預(yù)測(cè)值為,根據(jù)上述假設(shè),可以將它表示為ARIMA模型的預(yù)測(cè)結(jié)果和SVR模型的預(yù)測(cè)結(jié)果的線性組合,

      式中,η為待求解的參數(shù)。

      η是集成模型參數(shù)學(xué)習(xí)的關(guān)鍵。對(duì)于不同的時(shí)間段,η的值通常是不一樣的,它應(yīng)該動(dòng)態(tài)反映時(shí)間和空間預(yù)測(cè)值之間的關(guān)系。

      對(duì)于 η的學(xué)習(xí),如果借鑒交通流分析中速度預(yù)測(cè)的思想,通常的想法是根據(jù)一個(gè)月左右的歷史數(shù)據(jù)訓(xùn)練模型,來(lái)學(xué)習(xí)模型的參數(shù)。但是,交通狀態(tài)指數(shù)是一個(gè)特殊的、具有時(shí)效性的指標(biāo),通常只會(huì)保存幾天左右的歷史記錄,因此,不適合這種參數(shù)學(xué)習(xí)的方式。

      基于交通云圖本身的特點(diǎn),本文提出了一種利用非目標(biāo)區(qū)域塊來(lái)學(xué)習(xí)參數(shù)的自適應(yīng)方法。對(duì)于第i個(gè)非目標(biāo)區(qū)域塊的中心區(qū)域,假設(shè)其最終預(yù)測(cè)值為,那么,它也可以表示為ARIMA模型的預(yù)測(cè)結(jié)果和SVR模型的預(yù)測(cè)結(jié)果的線性組合。

      由于此區(qū)域?yàn)檎^(qū)域,真實(shí)值是已知的,因此,可以判斷預(yù)測(cè)結(jié)果與真實(shí)值之間的偏差。對(duì)于參數(shù)α,可以先假定其值,再通過(guò)偏差進(jìn)行修正,來(lái)找到最優(yōu)值。對(duì)于偏差的衡量,可以選擇相對(duì)誤差Δ,計(jì)算公式為

      為了表示所有非目標(biāo)區(qū)域塊預(yù)測(cè)結(jié)果的偏差情況,計(jì)算相對(duì)誤差的平均值

      式中,n為非目標(biāo)區(qū)域塊的總數(shù)。

      由于非目標(biāo)區(qū)域塊與目標(biāo)區(qū)域塊來(lái)自同一個(gè)交通指數(shù)云圖,它們之間的時(shí)空關(guān)系近似相同,因此,通過(guò)非目標(biāo)區(qū)域塊的預(yù)測(cè)結(jié)果學(xué)習(xí)出最優(yōu)的參數(shù)αool后,可以令式(12)中的 η等于此時(shí)的αool,以獲得待預(yù)測(cè)區(qū)域的最終預(yù)測(cè)結(jié)果。具體的參數(shù)學(xué)習(xí)過(guò)程如算法1所示。

      算法1集成模型的參數(shù)學(xué)習(xí)過(guò)程。

      輸出:參數(shù)η。

      a. 令 α等于0.01;

      c. 令α=α+0.01,如果α<1,返回步驟b,否則進(jìn)入步驟d;

      3 實(shí)驗(yàn)與結(jié)果分析

      3.1 實(shí)驗(yàn)數(shù)據(jù)

      為了評(píng)價(jià)模型的性能,在TICM平臺(tái)上進(jìn)行了實(shí)驗(yàn)。之前提到,時(shí)間上缺失值的產(chǎn)生多出現(xiàn)在凌晨和上午的時(shí)間段。同時(shí),從實(shí)驗(yàn)結(jié)果驗(yàn)證的角度考慮,需要待預(yù)測(cè)區(qū)域有真實(shí)值進(jìn)行對(duì)比。因此,選取了缺失值較少的一天的凌晨至中午時(shí)間段的數(shù)據(jù),時(shí)間跨度為0:00—12:00,數(shù)據(jù)獲取的時(shí)間間隔為10 min,并進(jìn)行了數(shù)據(jù)清洗與預(yù)處理的工作。為了更好地區(qū)分時(shí)段的特性,將整個(gè)時(shí)間劃分為0:00—6:00和6:00—12:00這2個(gè)時(shí)間段,并且假定每個(gè)時(shí)間段最后1 h的數(shù)據(jù)是缺失的。

      在空間方面,所用的TICM以上海市區(qū)為背景,尺寸為48×48大小,共2 304個(gè)區(qū)域。對(duì)TICM進(jìn)行之前所述的區(qū)域塊劃分操作,并剔除異常和無(wú)效數(shù)據(jù)后,總共有211個(gè)區(qū)域塊。將目標(biāo)區(qū)域塊和非目標(biāo)區(qū)域塊以3∶7的比例劃分,共得到64個(gè)目標(biāo)區(qū)域塊和147個(gè)非目標(biāo)區(qū)域塊。

      3.2 評(píng)價(jià)指標(biāo)

      本實(shí)驗(yàn)中,選用預(yù)測(cè)分析中常用的3個(gè)評(píng)價(jià)指標(biāo):平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分率誤差(MAPE),用于評(píng)估時(shí)間預(yù)測(cè)模型、空間預(yù)測(cè)模型和集成模型的性能。評(píng)價(jià)指標(biāo)的值越低,說(shuō)明模型的性能越好[12]。

      式中:為預(yù)測(cè)值;yi為真實(shí)值;n為樣本總數(shù)。

      3.3 實(shí)驗(yàn)過(guò)程和結(jié)果分析

      3.3.1 時(shí)間預(yù)測(cè)部分

      在時(shí)間預(yù)測(cè)部分,需要通過(guò)ARIMA模型預(yù)測(cè)每個(gè)時(shí)間段最后1 h的缺失值。值得注意的是,作為一種基于歷史值的預(yù)測(cè)模型,ARIMA在離真實(shí)歷史值較近的幾個(gè)時(shí)間點(diǎn),預(yù)測(cè)結(jié)果通常是比較好的,但是,模型性能會(huì)隨著時(shí)間的增加而下降。通過(guò)ARIMA預(yù)測(cè)結(jié)果和真實(shí)值的對(duì)比,發(fā)現(xiàn)1 h中前20 min的ARIMA預(yù)測(cè)結(jié)果可近似認(rèn)為達(dá)到了期望水平,但是,之后的結(jié)果則越來(lái)越不理想。因此,實(shí)驗(yàn)部分著重關(guān)注了每個(gè)時(shí)間段中模型表現(xiàn)最差的最后1個(gè)時(shí)間間隔,即5:50—6:00和11:50—12:00。對(duì)于64個(gè)目標(biāo)區(qū)域塊中的待預(yù)測(cè)區(qū)域,ARIMA的預(yù)測(cè)值和真實(shí)值的對(duì)比如圖3所示。

      圖3 ARIMA預(yù)測(cè)值和真實(shí)值的對(duì)比Fig. 3 Comparison between the predicted value of ARIMA and true value

      可以看出,ARIMA模型預(yù)測(cè)值的變化趨勢(shì)與真實(shí)值基本相同,但是,一些地方出現(xiàn)了很大的偏差。這一方面可能是由于某個(gè)時(shí)間交通流的劇烈變化,例如,早高峰,對(duì)模型產(chǎn)生了干擾;另一方面,也是受限于模型本身的學(xué)習(xí)和預(yù)測(cè)能力,導(dǎo)致總體的預(yù)測(cè)精度不高。

      3.3.2 空間預(yù)測(cè)部分

      在空間預(yù)測(cè)部分,需要考慮區(qū)域塊中心區(qū)域與周圍區(qū)域的關(guān)系,對(duì)于SVR模型來(lái)說(shuō),就是目標(biāo)與特征之間的關(guān)系。最直接的方法是將所有周圍區(qū)域都作為特征輸入,但是,結(jié)果證明并不是特征越多越好,特征間可能產(chǎn)生相互干擾,反而降低了模型預(yù)測(cè)的準(zhǔn)確性。

      通過(guò)借鑒現(xiàn)有的相關(guān)研究結(jié)果,使用隨機(jī)森林的方式來(lái)對(duì)模型進(jìn)行特征選擇[27-28]。對(duì)于周圍區(qū)域組成的一個(gè)特征集X={X1,X2,···,X8},通過(guò)隨機(jī)森林方法可以計(jì)算得到各個(gè)特征的重要程度,如表1所示。

      表1 隨機(jī)森林方法得到的特征重要度Tab.1 Feature importance calculated by Random Forest

      可以看到,X2,X4,X5,X7這4個(gè)特征的重要性明顯高于其余4個(gè),因此,可以只將它們作為輸入特征。區(qū)域塊中特征的分布以及特征選擇的示意圖如圖4所示。保留的4個(gè)特征剛好為中心區(qū)域的4個(gè)最近鄰,說(shuō)明了這4個(gè)特征已經(jīng)包含了足夠的信息,再增加特征只會(huì)產(chǎn)生不必要的冗余。

      圖4 用隨機(jī)森林進(jìn)行特征選擇Fig. 4 Feature selection by Random Forest

      經(jīng)過(guò)特征選擇后,使用SVR模型對(duì)待預(yù)測(cè)區(qū)域進(jìn)行預(yù)測(cè),得到的預(yù)測(cè)值和真實(shí)值的對(duì)比如圖5所示??梢钥闯觯琒VR模型的預(yù)測(cè)值變化較為平穩(wěn),但對(duì)于其中的峰值,SVR顯然沒(méi)有捕獲到這種變化。結(jié)合之前ARIMA預(yù)測(cè)的結(jié)果來(lái)看,這些區(qū)域可能產(chǎn)生了指數(shù)值的突變,并且與其周圍區(qū)域的聯(lián)系不是很緊密,因此,用SVR模型很難準(zhǔn)確預(yù)測(cè)。

      圖5 SVR預(yù)測(cè)值和真實(shí)值的對(duì)比Fig.5 Comparison between the predicted value of SVR and true value

      3.3.3 集成模型預(yù)測(cè)部分

      雖然ARIMA模型和SVR模型各自的預(yù)測(cè)結(jié)果都不是很讓人滿意,但從上面的結(jié)果圖中可以看到,兩者的結(jié)果形成了一些互補(bǔ),尤其是對(duì)于幾個(gè)峰值點(diǎn),ARIMA模型對(duì)變化的幅度產(chǎn)生了過(guò)量的預(yù)測(cè),而SVR模型則對(duì)變化的預(yù)測(cè)不足。如果可以找到一種方法來(lái)衡量模型在不同時(shí)刻的表現(xiàn),并設(shè)置合適的權(quán)重系數(shù),那么,這樣構(gòu)建的集成模型應(yīng)該可以有效提升預(yù)測(cè)準(zhǔn)確性。

      基于這樣的思想,在方法部分詳述了集成模型的構(gòu)建過(guò)程。具體地,對(duì)于5:50—6:00和11:50—12:00這2個(gè)時(shí)間段,集成模型參數(shù) α的確定過(guò)程如圖6所示。相應(yīng)地,這2個(gè)時(shí)間段的集成模型可以表示為

      圖6 集成模型參數(shù)確定過(guò)程Fig.6 Parameter determination of the integrated model

      式(19)代表5:50—6:00時(shí)間段的模型,式(20)代表11:50—12:00時(shí)間段的模型??梢钥闯鲈?個(gè)不同的時(shí)間段,模型訓(xùn)練得到的參數(shù)相差很大。

      圖7顯示了集成模型預(yù)測(cè)的值,以及其與ARIMA和SVR以及真實(shí)值進(jìn)行對(duì)比的結(jié)果??梢钥闯觯赡P蛯?duì)真實(shí)值的擬合效果更好,并且對(duì)于一些峰值點(diǎn)也能有更準(zhǔn)確的預(yù)測(cè)效果。評(píng)價(jià)指標(biāo)對(duì)比結(jié)果如表2和表3所示,從指標(biāo)值中可以看出,ARIMA和SVR在2個(gè)不同時(shí)間段的表現(xiàn)確實(shí)相差較大。在5:50—6:00時(shí)間段,ARIMA模型的性能明顯優(yōu)于SVR模型的性能;而在11:50—12:00時(shí)間段,SVR模型的性能明顯優(yōu)于ARIMA模型的性能。

      圖7 3種模型與真實(shí)值對(duì)比結(jié)果Fig. 7 Comparison between the predicted value of three models and true value

      表2 5:50—6:00時(shí)3個(gè)模型的評(píng)價(jià)指標(biāo)值Tab.2 Evaluation indicators of three models during the time period from 5:50 to 6:00

      表3 11:50—12:00時(shí)3個(gè)模型的評(píng)價(jià)指標(biāo)值Tab.3 Evaluation indicators of three models during the time period from 11:50 to 12:00

      上述結(jié)果對(duì)比說(shuō)明了交通流的變化是一個(gè)未知且復(fù)雜的過(guò)程,只從一個(gè)角度,用一種模型進(jìn)行分析,很難得到理想的效果,這就體現(xiàn)了構(gòu)建集成模型的必要性。時(shí)間預(yù)測(cè)模型與空間預(yù)測(cè)模型各有其優(yōu)劣,它們各自的預(yù)測(cè)性能可能受預(yù)測(cè)時(shí)間、早高峰、異常擁堵區(qū)域、模型學(xué)習(xí)過(guò)程等諸多因素影響,并不存在一種模型優(yōu)于另一種的情況。因此,對(duì)于集成模型來(lái)說(shuō),參數(shù)設(shè)置是否合理對(duì)最終結(jié)果有重要影響,否則,得到的結(jié)果甚至?xí)蝗鐔蝹€(gè)時(shí)間或空間模型的結(jié)果。

      需要強(qiáng)調(diào)的是,本文提出的集成模型是一種用于指數(shù)云圖類預(yù)測(cè)問(wèn)題的框架,所用的時(shí)間預(yù)測(cè)模型和空間預(yù)測(cè)模型可根據(jù)實(shí)際情況進(jìn)行選擇,并不局限于文中提到的模型。實(shí)驗(yàn)部分的設(shè)計(jì)也是為了模擬在一個(gè)較壞的情況下各模型間性能的對(duì)比。在實(shí)際情況中出現(xiàn)大范圍指數(shù)值缺失的情況較少,因此,模型的性能也應(yīng)該更好。

      3.4 集成模型參數(shù)對(duì)效果的影響

      集成模型性能好壞的關(guān)鍵在于參數(shù)的確定,如果集成模型的參數(shù)未按照文中提出的自適應(yīng)方法進(jìn)行學(xué)習(xí),而是用經(jīng)驗(yàn)方法人為確定,那么,模型的效果會(huì)顯著下降。表4和表5呈現(xiàn)了評(píng)價(jià)指標(biāo)MAE隨集成模型參數(shù)取值不同對(duì)應(yīng)的結(jié)果。表中前3列的參數(shù)是根據(jù)經(jīng)驗(yàn)選取的,最后1列的參數(shù)是根據(jù)自適應(yīng)方法學(xué)習(xí)得到的??梢钥闯觯鶕?jù)經(jīng)驗(yàn)選取的參數(shù)值對(duì)應(yīng)的MAE都比自適應(yīng)方法得到的大,說(shuō)明在不同的時(shí)間段,自適應(yīng)方法得到的參數(shù)總能取得相對(duì)較好的預(yù)測(cè)結(jié)果。此外,在5:50—6:00時(shí)間段,η=0.75時(shí)的集成模型效果不如ARIMA模型;在11:50—12:00時(shí)間段,η=0.25時(shí)的集成模型效果不如SVR模型。這驗(yàn)證了集成模型的性能受參數(shù)影響很大,經(jīng)驗(yàn)方法得到的參數(shù)可能會(huì)使得集成模型效果不如一維的時(shí)間或空間模型。

      表4 5:50—6:00不同模型參數(shù)對(duì)應(yīng)的MAE值Tab.4 MAE values corresponding to different model parameters during the time period from 5:50 to 6:00

      表5 11:50—12:00不同模型參數(shù)對(duì)應(yīng)的MAE值Tab.5 MAE values corresponding to different model parameters during the time period from 11:50 to 12:00

      4 結(jié) 論

      以交通指數(shù)為基礎(chǔ)進(jìn)行了區(qū)域交通狀態(tài)預(yù)測(cè)研究,將現(xiàn)有的中微觀層面的交通流預(yù)測(cè)方法運(yùn)用到了宏觀層面。通過(guò)從時(shí)間與空間2個(gè)維度進(jìn)行預(yù)測(cè)分析,提出了一種適用于云圖類預(yù)測(cè)問(wèn)題的時(shí)空結(jié)合集成模型框架。在交通指數(shù)云圖上進(jìn)行的實(shí)驗(yàn)表明,單獨(dú)的時(shí)間或空間預(yù)測(cè)模型性能各有其不足,而自適應(yīng)的集成模型彌補(bǔ)了它們的缺陷,并且得到的結(jié)果更為精確。

      本文的研究主要以交通指數(shù)云圖為依據(jù),交通指數(shù)云圖具有原創(chuàng)性,因此,較難找到這方面的實(shí)驗(yàn)對(duì)比方法。在后續(xù)研究中,將圍繞所提出的集成模型框架,將更多的時(shí)間和空間預(yù)測(cè)方法代入,進(jìn)行充分的實(shí)驗(yàn)和對(duì)比分析,以進(jìn)一步闡明集成模型的合理性,并進(jìn)一步提高預(yù)測(cè)結(jié)果的準(zhǔn)確率。

      猜你喜歡
      交通流時(shí)間段云圖
      夏天曬太陽(yáng)防病要注意時(shí)間段
      成都云圖控股股份有限公司
      黃強(qiáng)先生作品《雨后松云圖》
      名家名作(2017年3期)2017-09-15 11:13:37
      發(fā)朋友圈沒(méi)人看是一種怎樣的體驗(yàn)
      意林(2017年8期)2017-05-02 17:40:37
      基于TV-L1分解的紅外云圖超分辨率算法
      交通流隨機(jī)行為的研究進(jìn)展
      路內(nèi)停車對(duì)交通流延誤影響的定量分析
      不同時(shí)間段顱骨修補(bǔ)對(duì)腦血流動(dòng)力學(xué)變化的影響
      云圖青石板
      具有負(fù)壓力的Aw-Rascle交通流的Riemann問(wèn)題
      安义县| 南通市| 莒南县| 宜川县| 环江| 天台县| 诸城市| 胶南市| 清河县| 长寿区| 文昌市| 大冶市| 大连市| 镇远县| 潮州市| 略阳县| 迁安市| 北辰区| 高邮市| 化德县| 博客| 武宣县| 屏南县| 嫩江县| 道孚县| 方山县| 太原市| 石林| 常熟市| 思茅市| 九龙城区| 龙泉市| 汉中市| 启东市| 石渠县| 德化县| 洛南县| 四川省| 珲春市| 宁强县| 灌南县|