馮 寧,郭晟楠,宋 超,朱琪超,萬(wàn)懷宇
1(北京交通大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,北京 100044)
2(交通數(shù)據(jù)分析與挖掘北京市重點(diǎn)實(shí)驗(yàn)室(北京交通大學(xué)),北京 100044)
智能交通系統(tǒng)(ITS)[1]正在大力發(fā)展,交通數(shù)據(jù)預(yù)測(cè)問題是其中的重要組成部分.車流量是反映公路運(yùn)行狀態(tài)的主要參數(shù)之一,如果能夠提前準(zhǔn)確地對(duì)車流量進(jìn)行預(yù)測(cè),事先對(duì)車輛進(jìn)行疏導(dǎo),可以提高路網(wǎng)的運(yùn)行能力和效率,減少交通事故,降低人們的出行時(shí)間和成本,降低環(huán)境污染.
交通流量預(yù)測(cè)是典型的時(shí)空數(shù)據(jù)預(yù)測(cè)問題,不同類別的交通數(shù)據(jù)內(nèi)嵌于連續(xù)空間,并且隨時(shí)間動(dòng)態(tài)變化,因此,有效提取時(shí)空相關(guān)性對(duì)解決這類問題至關(guān)重要.圖1所示為流量數(shù)據(jù)(也可以是車速、車道占用率等其他交通數(shù)據(jù))的時(shí)空相關(guān)性示意圖,時(shí)間維包含 3個(gè)時(shí)間片,空間維的 6個(gè)節(jié)點(diǎn)(A~F)表示公路的網(wǎng)狀結(jié)構(gòu).在空間維上,節(jié)點(diǎn)的交通狀況之間會(huì)相互影響(綠色虛線);時(shí)間維上,某節(jié)點(diǎn)歷史不同時(shí)刻流量會(huì)對(duì)該節(jié)點(diǎn)未來不同時(shí)刻流量產(chǎn)生影響(藍(lán)色虛線);同時(shí),節(jié)點(diǎn)歷史不同時(shí)刻的流量值也會(huì)對(duì)其關(guān)聯(lián)節(jié)點(diǎn)未來不同時(shí)刻的流量產(chǎn)生影響(紅色虛線).可見,交通流量在時(shí)空維度都存在很強(qiáng)的相關(guān)性.而如何從這些復(fù)雜、非線性的時(shí)空數(shù)據(jù)中挖掘出隱含的時(shí)空模式,并對(duì)這些模式進(jìn)行分析從而提取出有價(jià)值的信息,是時(shí)空數(shù)據(jù)挖掘任務(wù)的一項(xiàng)極大挑戰(zhàn).
Fig.1 Spatio-Temporal correlation of traffic flow data圖1 交通流量數(shù)據(jù)的時(shí)空相關(guān)性
隨著交通行業(yè)的發(fā)展,道路上部署了許多攝像頭、傳感器等信息采集設(shè)備,這些設(shè)備擁有獨(dú)特的地理空間位置,不斷采集各類交通數(shù)據(jù),如流量、車速、車道占用率等,積累了大量豐富的帶有地理信息的交通時(shí)間序列數(shù)據(jù),為流量預(yù)測(cè)提供了很好的數(shù)據(jù)基礎(chǔ).目前,已有很多學(xué)者在這類問題上進(jìn)行了大量嘗試.早期的時(shí)間序列預(yù)測(cè)模型只能用于數(shù)據(jù)相對(duì)穩(wěn)定、呈線性變化的預(yù)測(cè)問題,很難適應(yīng)實(shí)際需求.隨后發(fā)展起來的傳統(tǒng)機(jī)器學(xué)習(xí)方法雖然能對(duì)更復(fù)雜的數(shù)據(jù)進(jìn)行建模,但仍然很難同時(shí)考慮交通數(shù)據(jù)的時(shí)空相關(guān)性,而且這類方法的預(yù)測(cè)效果很大程度上依賴于特征工程,這往往需要依賴領(lǐng)域?qū)<业慕?jīng)驗(yàn)和大量的實(shí)驗(yàn).近年來,很多人將深度學(xué)習(xí)的方法應(yīng)用于時(shí)空數(shù)據(jù)預(yù)測(cè)問題,如利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)可以有效提取網(wǎng)格數(shù)據(jù)的空間特征,但對(duì)于圖結(jié)構(gòu)的時(shí)空數(shù)據(jù)的特征描述和時(shí)空相關(guān)性分析,目前仍然還在探索之中.
為了應(yīng)對(duì)上述挑戰(zhàn),我們提出了一種基于深度學(xué)習(xí)的交通流量預(yù)測(cè)方法——多組件時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(MCSTGCN)模型,使用基于時(shí)空卷積網(wǎng)絡(luò)的深度學(xué)習(xí)模型來處理交通路網(wǎng)這類圖結(jié)構(gòu)數(shù)據(jù),能夠同時(shí)有效捕獲數(shù)據(jù)的時(shí)空特性.該模型分別設(shè)置近期、日周期和周周期等 3個(gè)組件來描述交通數(shù)據(jù)的時(shí)空特征,最后將 3個(gè)組件的輸出進(jìn)行融合得到最終的預(yù)測(cè)結(jié)果.本文的主要貢獻(xiàn)概括如下:
· 同時(shí)考慮并建模了交通流量數(shù)據(jù)固有的3種時(shí)間維特性,即近期依賴、日周期性和周周期性,并利用3個(gè)學(xué)習(xí)組件分別建模這3種特性;
· 提出了MCSTGCN模型,能夠直接從基于圖結(jié)構(gòu)的交通數(shù)據(jù)中同時(shí)有效捕獲空間和時(shí)間維特征;
· 在真實(shí)的高速公路流量數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),驗(yàn)證本文提出模型的預(yù)測(cè)效果優(yōu)于其他現(xiàn)有的預(yù)測(cè)方法.
交通量預(yù)測(cè)問題歷經(jīng)多年的不斷研究和實(shí)踐,取得了大量的成果.傳統(tǒng)的統(tǒng)計(jì)學(xué)方法有歷史均值法、自回歸積分滑動(dòng)平均法(ARIMA)[2]等.歷史均值法是以歷史一段時(shí)間數(shù)據(jù)的均值為依據(jù)進(jìn)行預(yù)測(cè),ARIMA將預(yù)測(cè)對(duì)象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,用一定的數(shù)學(xué)模型近似描述這個(gè)序列.這類方法對(duì)復(fù)雜非線性的交通數(shù)據(jù)處理能力不足,因?yàn)樗鼈兌家髷?shù)據(jù)滿足一些前提假設(shè),但實(shí)際中的數(shù)據(jù)往往很難滿足這些假設(shè).K近鄰、支持向量機(jī)等機(jī)器學(xué)習(xí)方法能對(duì)更復(fù)雜的數(shù)據(jù)進(jìn)行建模.采用K近鄰方法的思想是識(shí)別相似的交通狀況用于預(yù)測(cè)[3],而采用支持向量機(jī)方法的思想是通過核函數(shù)將低維非線性流量數(shù)據(jù)映射到高維空間后再進(jìn)行線性分類[4].這類方法仍然無(wú)法同時(shí)有效考慮交通數(shù)據(jù)的時(shí)空相關(guān)性,且需要大量的特征工程.隨著深度學(xué)習(xí)在語(yǔ)音識(shí)別、圖像處理等領(lǐng)域取得的成果,越來越多的人將深度學(xué)習(xí)應(yīng)用于時(shí)空數(shù)據(jù)預(yù)測(cè)問題.Zhang等人[5]設(shè)計(jì)了基于殘差卷積單元的ST-ResNet來對(duì)城市人流量進(jìn)行預(yù)測(cè),這種方法雖然提取了流量數(shù)據(jù)的時(shí)空特征,但將輸入限制為標(biāo)準(zhǔn)的2維或3維網(wǎng)格數(shù)據(jù),因而不能用于圖結(jié)構(gòu)的高速路網(wǎng)上的交通預(yù)測(cè)問題.
傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)可以有效提取數(shù)據(jù)的局部特征,但只能作用于標(biāo)準(zhǔn)的網(wǎng)格數(shù)據(jù).而圖卷積可以直接在圖結(jié)構(gòu)的數(shù)據(jù)上實(shí)現(xiàn)卷積操作.目前,主流的圖卷積方法包括空間方法和譜圖方法.空間方法直接把卷積核應(yīng)用到圖上的節(jié)點(diǎn)及其鄰域,這種方法的核心在于如何選擇節(jié)點(diǎn)的鄰域.Niepert等人[6]為中心節(jié)點(diǎn)啟發(fā)式線性選擇鄰域,將其映射為向量再進(jìn)行卷積,在社交網(wǎng)絡(luò)任務(wù)中取得了不錯(cuò)的效果;Li等人[7]在人體動(dòng)作識(shí)別任務(wù)中引入圖卷積,提出多種劃分策略將節(jié)點(diǎn)的鄰域劃分為不同子集,通過控制子集的個(gè)數(shù),保證不同節(jié)點(diǎn)可以共享卷積核權(quán)重.譜圖方法通過圖拉普拉斯矩陣將網(wǎng)格數(shù)據(jù)上的卷積操作推廣到圖結(jié)構(gòu)數(shù)據(jù)上.Bruna等人[8]提出了一個(gè)通用的圖卷積框架,將拉普拉斯矩陣的特征向量變換到譜域,再通過樣條插值的方法近似求解;隨后, Defferrard等人[9]優(yōu)化了該方法,將樣條插值替換成切比雪夫多項(xiàng)式的K階截?cái)嘟魄蠼?并證明了卷積核的范圍嚴(yán)格限制在中心節(jié)點(diǎn)的K階鄰居內(nèi),同時(shí)降低了模型復(fù)雜度;Seo等人[10]提出了圖卷積循環(huán)網(wǎng)絡(luò)(GCRN),但在特定設(shè)置下很難確定循環(huán)網(wǎng)絡(luò)和圖卷積的最佳組合;隨后,Li等人[11]成功地使用門控循環(huán)單元(GRU)和圖卷積進(jìn)行長(zhǎng)期交通預(yù)測(cè);Yu等人[12]提出了一個(gè)帶有門控機(jī)制的圖卷積網(wǎng)絡(luò),并應(yīng)用于交通量預(yù)測(cè)問題.但這些模型都沒有考慮交通數(shù)據(jù)在時(shí)間維度上的周期性和趨勢(shì)性等多種固有特性.
交通流量預(yù)測(cè)問題的核心在于如何有效捕獲數(shù)據(jù)的時(shí)空維特征及相關(guān)性.圖卷積可以直接對(duì)圖結(jié)構(gòu)數(shù)據(jù)進(jìn)行特征提取,自動(dòng)挖掘交通數(shù)據(jù)的空間模式.沿時(shí)間軸做卷積操作,可以挖掘交通數(shù)據(jù)的時(shí)間模式.因此,本文采用基于時(shí)空?qǐng)D卷積網(wǎng)絡(luò)的深度學(xué)習(xí)模型,將二者結(jié)合起來同時(shí)捕獲交通數(shù)據(jù)的時(shí)空特性,有效解決交通流量預(yù)測(cè)問題.
我們將空間路網(wǎng)定義為無(wú)向圖G=(V,E,A),如圖2(a)所示,其中,V為節(jié)點(diǎn)集,|V|=N為節(jié)點(diǎn)個(gè)數(shù);E為邊集,表示節(jié)點(diǎn)間的連通性;A∈?N×N為圖G的鄰接矩陣.設(shè)在空間路網(wǎng)G上的每個(gè)節(jié)點(diǎn)都會(huì)檢測(cè)F個(gè)采樣頻率一致的時(shí)間序列數(shù)據(jù),即每個(gè)節(jié)點(diǎn)在每個(gè)時(shí)間戳都會(huì)產(chǎn)生一個(gè)長(zhǎng)度為F的特征向量,如圖2(b)(數(shù)據(jù)歸一化后的示意圖)實(shí)線所示.
Fig.2圖2
設(shè)路網(wǎng)G中各節(jié)點(diǎn)的第f∈(1,…,F)個(gè)時(shí)間序列為流量序列,未來某一段時(shí)間范圍內(nèi)的流量為我們的預(yù)測(cè)目標(biāo).用表示第i個(gè)節(jié)點(diǎn)的第c維時(shí)間序列在t時(shí)刻的值,表示所有節(jié)點(diǎn)的第c維時(shí)間序列在t時(shí)刻的值,表示所有節(jié)點(diǎn)的第c維時(shí)間序列在τ時(shí)段內(nèi)的值,表示所有節(jié)點(diǎn)的所有時(shí)間序列在t時(shí)刻的值,表示所有節(jié)點(diǎn)的所有時(shí)間序列在τ時(shí)段內(nèi)的值.設(shè)是第i個(gè)節(jié)點(diǎn)在t時(shí)刻的流量值,已知路網(wǎng)上所有節(jié)點(diǎn)的歷史τ時(shí)段內(nèi)的所有時(shí)間序列值X,我們的預(yù)測(cè)目標(biāo)是未來所有節(jié)點(diǎn)在窗口長(zhǎng)度為Tp的流量序列,其中,表示節(jié)點(diǎn)i的預(yù)測(cè)目標(biāo),如圖2(b)中的藍(lán)色虛線所示.表1列出了本文的符號(hào)約定.
Table 1 Mathematical notation表1 符號(hào)約定
圖3展示了本文提出的多組件時(shí)空?qǐng)D卷積(MCSTGCN)網(wǎng)絡(luò)的總體架構(gòu),它由3個(gè)主要部分組成,分別用來建模預(yù)測(cè)目標(biāo)的近期、日周期及周周期信息(GCN:空間維圖卷積;Conv:時(shí)間維卷積;FC:全連接).例如,對(duì)某地下午2點(diǎn)的車流量進(jìn)行預(yù)測(cè),那么與預(yù)測(cè)時(shí)段直接相鄰的歷史1小時(shí)內(nèi)的交通數(shù)據(jù)、對(duì)應(yīng)的1天前及1周前下午2點(diǎn)的交通數(shù)據(jù)都會(huì)對(duì)該預(yù)測(cè)問題提供有用信息,而當(dāng)天上午9點(diǎn)的交通狀況往往與預(yù)測(cè)目標(biāo)關(guān)系不大.為了得到充足的時(shí)間維信息,同時(shí)減少處理不相關(guān)歷史信息帶來的開銷,我們?cè)O(shè)計(jì)了 3個(gè)組件分別用于描述交通數(shù)據(jù)的3種時(shí)間維特性:近期特性、日周期特性及周周期特性.
Fig.3 Architecture of MCSTGCN圖3 MCSTGCN模型架構(gòu)圖
假設(shè)采樣頻率為每天q次,即時(shí)間序列上每天包含q個(gè)數(shù)據(jù)點(diǎn).設(shè)當(dāng)前時(shí)刻t0,待預(yù)測(cè)的時(shí)間窗口長(zhǎng)度為Tp,我們沿時(shí)間軸分別截取長(zhǎng)度為Th,Td和Tw的3個(gè)時(shí)間序列片段作為模型中近期、日周期和周周期3個(gè)組件的輸入,如圖4所示(設(shè)預(yù)測(cè)時(shí)段長(zhǎng)度Tp為 1小時(shí),Th,Td和Tw均取Tp的 2倍),其中,Th,Td和Tw均為Tp的整數(shù)倍.3個(gè)時(shí)間序列片段分別如下.
Fig.4 An example of constructing the input of time series segments圖4 輸入時(shí)間序列片段構(gòu)建示例
3個(gè)組件共享相同的網(wǎng)絡(luò)結(jié)構(gòu),由時(shí)空卷積模塊(如圖5所示)和全連接層組成,其中,時(shí)空卷積模塊包括空間維度的圖卷積和時(shí)間維度的標(biāo)準(zhǔn) 2維卷積兩部分.模型最后將 3個(gè)組件的輸出結(jié)果基于參數(shù)矩陣進(jìn)行融合,得到最終的預(yù)測(cè)結(jié)果.這種結(jié)構(gòu)能夠有效捕獲交通數(shù)據(jù)的時(shí)間維和空間維特征及其時(shí)空相關(guān)性.
Fig.5 Architecture of spatio-temporal convolutions of MCSTGCN圖5 MCSTGCN模型的時(shí)空卷積結(jié)構(gòu)
我們首先只考慮某一時(shí)間片上的空間圖G,以了解空間特征的建模過程.在我們的模型中,采用譜圖方法[9]將卷積操作推廣到圖結(jié)構(gòu)數(shù)據(jù),將數(shù)據(jù)視為圖上的信號(hào),然后直接在圖上對(duì)圖信號(hào)進(jìn)行處理,來捕獲空間中有意義的模式和特征.
譜圖方法主要通過將圖轉(zhuǎn)化為代數(shù)的形式來分析圖結(jié)構(gòu),在本文中,我們主要關(guān)心圖結(jié)構(gòu)中節(jié)點(diǎn)間的連通關(guān)系及相互影響,在譜圖論中,可以將一個(gè)圖用其對(duì)應(yīng)的拉普拉斯矩陣來表示.通過分析拉普拉斯矩陣及其特征值就可以得到圖結(jié)構(gòu)的性質(zhì).圖的拉普拉斯矩陣定義為L(zhǎng)=D-A,其規(guī)范化形式為,其中,A為鄰接矩陣,IN為單位陣,度矩陣是節(jié)點(diǎn)度數(shù)組成的對(duì)角矩陣,.對(duì)拉普拉斯矩陣進(jìn)行特征值分解L=UΛUT,其中,是L的特征值組成的對(duì)角矩陣,U是傅里葉基[12].以t時(shí)刻流量數(shù)據(jù)為例,圖信號(hào)為,對(duì)圖信號(hào)進(jìn)行傅里葉變換可表示為.根據(jù)拉普拉斯矩陣的性質(zhì)可知U是正交矩陣,因此得到逆傅里葉變換.圖卷積是利用定義在傅里葉域中對(duì)角化的線性算子來等價(jià)代替經(jīng)典卷積算子[13]實(shí)現(xiàn)的卷積操作,用卷積核gθ對(duì)圖G進(jìn)行卷積操作[9]:
由于對(duì)圖信號(hào)進(jìn)行卷積操作再做傅里葉變換等于對(duì)這些信號(hào)進(jìn)行傅里葉變換后的乘積[14],上式可以理解為對(duì)gθ和x分別做傅里葉變換到譜域,然后對(duì)二者的變換結(jié)果進(jìn)行乘法操作,再做傅立葉逆變換得到卷積操作的結(jié)果.
將圖變換到譜域?qū)崿F(xiàn)圖上的卷積操作即為圖卷積,但當(dāng)圖的規(guī)模較大時(shí),直接對(duì)拉普拉斯矩陣進(jìn)行特征值分解代價(jià)昂貴,因此,本文采用切比雪夫多項(xiàng)式近似展開求解:
θk∈?K為切比雪夫多項(xiàng)式系數(shù),表示拉普拉斯矩陣的最大特征值.切比雪夫多項(xiàng)式的遞歸定義:Tk(x)=2xTk-1(x)-Tk-2(x),其中,T0(x)=1,T1(x)=x.用切比雪夫多項(xiàng)式近似展開求解,相當(dāng)于對(duì)圖中的每個(gè)節(jié)點(diǎn)采用卷積核提取了以該節(jié)點(diǎn)為中心的周圍 0~K-1階鄰居的信息[9].圖卷積模塊使用線性修正單元(ReLU)為激活函數(shù),即ReLU(gθ×Gx).
以K=2為例,對(duì)每個(gè)節(jié)點(diǎn)提取其0~1階鄰居信息,對(duì)拉普拉斯矩陣特征值進(jìn)行縮放使λmax=2,上述圖卷積操作表示為
令θ0=-θ1=θ∈?以減少參數(shù),則,圖上所有節(jié)點(diǎn)共享卷積核權(quán)重θ.同時(shí),為避免數(shù)值不穩(wěn)定、梯度爆炸或梯度消失[15],我們令,得到:.拓展到多維數(shù)據(jù),第r層卷積的輸入數(shù)據(jù)是,其中:r∈{1,…,l}(l是時(shí)空卷積層數(shù));Cr-1是第r層網(wǎng)絡(luò)的輸入數(shù)據(jù)的通道數(shù),當(dāng)r=1時(shí),是輸入數(shù)據(jù)時(shí)間維長(zhǎng)度,當(dāng)r=1時(shí),近期組件T0=Th(日周期組件T0=Td、周周期組件T0=Tw).對(duì)進(jìn)行圖卷積操作,表示為,其中,是卷積核參數(shù).
以Cr-1=1為例,圖6展示了圖卷積過程中對(duì)空間節(jié)點(diǎn)的0~1階鄰居信息進(jìn)行提取的過程.圖6(a)為空間路網(wǎng)結(jié)構(gòu),圖6(b)為根據(jù)圖6(a)計(jì)算得到鄰接矩陣A和度矩陣及輸入數(shù)據(jù)的矩陣表示如圖6(c)所示,由此計(jì)算出用卷積核對(duì)數(shù)據(jù)進(jìn)行圖卷積操作的結(jié)果如圖6(d)所示,其中,節(jié)點(diǎn)F在t=2時(shí)刻的值由原來的變?yōu)?即,輸入數(shù)據(jù)被其0~1階鄰居的信息更新.其他特征及卷積核同理,對(duì)整個(gè)輸入數(shù)據(jù)進(jìn)行一次圖卷積操作,得到,每個(gè)節(jié)點(diǎn)被該節(jié)點(diǎn)的 0~K-1階鄰居的信息更新.
Fig.6 An example of graph convolutions and its matrix representation圖6 圖卷積示例及其矩陣表示
通過空間維圖卷積操作對(duì)輸入數(shù)據(jù)的空間特征進(jìn)行建模之后,再用標(biāo)準(zhǔn) 2維卷積捕獲時(shí)間維特征.我們用線性修正單元激活函數(shù),以提取近期特征為例,得到(Ψ為時(shí)間維卷積核的參數(shù)),具體卷積過程如圖5所示.
經(jīng)過一層時(shí)間維卷積之后,節(jié)點(diǎn)的信息被該節(jié)點(diǎn)相鄰時(shí)間片信息更新,而節(jié)點(diǎn)及其相鄰時(shí)間片信息在經(jīng)過圖卷積操作后已包含其相鄰節(jié)點(diǎn)同時(shí)刻的信息.因此,通過一層時(shí)空卷積操作之后,就會(huì)捕獲到數(shù)據(jù)的時(shí)間維和空間維特征以及時(shí)空相關(guān)性.我們使用多層時(shí)空卷積,以提取時(shí)空維上更遠(yuǎn)的信息,再通過全連接操作使時(shí)空卷積的結(jié)果與預(yù)測(cè)目標(biāo)維數(shù)一致,全連接模塊同樣使用線性修正單元作為激活函數(shù).
在本節(jié)中,我們將討論如何融合近期、日周期和周周期組件的輸出.以對(duì)整個(gè)路網(wǎng)周五上午 8點(diǎn)的流量進(jìn)行預(yù)測(cè)為例,有些地方早晚高峰周期規(guī)律明顯,其日周期、周周期組件的預(yù)測(cè)結(jié)果更為重要;而有些地方不存在明顯的交通周期規(guī)律,日周期、周周期組件對(duì)預(yù)測(cè)目標(biāo)起到的幫助較小.可見,不同節(jié)點(diǎn)受不同組件的影響程度是不一樣的,在融合不同組件的輸出結(jié)果時(shí),其影響程度也應(yīng)該不同.因此,應(yīng)該從歷史數(shù)據(jù)中進(jìn)行學(xué)習(xí).融合后的最終預(yù)測(cè)結(jié)果表示為
其中,⊙是矩陣對(duì)應(yīng)元素相乘的哈達(dá)馬積;Wh,Wd,Ww是學(xué)習(xí)參數(shù),反映了近期、日周期、周周期這3種時(shí)間維特性對(duì)預(yù)測(cè)目標(biāo)的影響程度.
為了檢驗(yàn)本文提出模型的性能,我們?cè)趦蓚€(gè)真實(shí)世界的數(shù)據(jù)集上進(jìn)行了對(duì)比實(shí)驗(yàn).本節(jié)將對(duì)數(shù)據(jù)集和實(shí)驗(yàn)設(shè)置進(jìn)行說明,并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行詳細(xì)的對(duì)比分析.
我們使用美國(guó)加利福尼亞州的真實(shí)高速公路數(shù)據(jù)集 PeMSD4和 PeMSD8來驗(yàn)證我們的模型.PeMS是由Caltrans Performance Measurement System實(shí)時(shí)采集的高速公路交通數(shù)據(jù),該系統(tǒng)擁有超過39 000個(gè)傳感器站,部署在加利福尼亞州高速公路系統(tǒng)的主要大都市區(qū)[16].數(shù)據(jù)集是基于 30s/次的頻率采樣得到的原始數(shù)據(jù)匯總成的以5m為時(shí)間間隔的樣本.數(shù)據(jù)集包含帶時(shí)間戳的車流量、平均車速、平均車道占用率這3個(gè)維度的特征及采集這些信息的檢測(cè)器的地理位置信息.
· PeMSD4:San Francisco Bay區(qū)域的數(shù)據(jù),共包含29條路上的3 848個(gè)檢測(cè)器,我們選取時(shí)間范圍為2018年1月~2月的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),其中,前50天作為訓(xùn)練集,后9天作為測(cè)試集;
· PeMSD8:San Bernardino區(qū)域的數(shù)據(jù),共包含8條路上的1 979個(gè)檢測(cè)器,我們選取時(shí)間范圍為2016年7月~8月的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),其中,前50天作為訓(xùn)練集,后12天作為測(cè)試集.
我們對(duì)道路上的檢測(cè)器進(jìn)行篩選,去掉那些距離過近的檢測(cè)器,保證檢測(cè)器節(jié)點(diǎn)間距離大于 3.5英里.樣本以5m為時(shí)間間隔,因此,道路上每個(gè)節(jié)點(diǎn)每天包含288個(gè)數(shù)據(jù)點(diǎn).用線性插值法填充缺失值.另外,對(duì)數(shù)據(jù)進(jìn)行0均值標(biāo)準(zhǔn)化(zero-mean)操作x′=x-mean(x),即讓數(shù)據(jù)的平均值為0.
我們基于Pytorch框架實(shí)現(xiàn)了MCSTGCN模型,圖卷積使用32個(gè)相同大小的卷積核.時(shí)間維卷積同樣使用32個(gè)相同大小的卷積核,這些卷積核沿空間軸維度為1,沿時(shí)間軸維度為3,通過控制步長(zhǎng)調(diào)整時(shí)間維長(zhǎng)度.整個(gè)模型訓(xùn)練時(shí)間大約為20s/輪.3個(gè)組件的輸入數(shù)據(jù)長(zhǎng)度會(huì)對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生影響,我們通過實(shí)驗(yàn)選定Th=3,Td=1和Tw=1為最佳的組合.均方誤差是反映估計(jì)量與被估計(jì)量之間差異程度的一種度量,因此,本文采用該度量指標(biāo)作為損失函數(shù).
我們將本文提出的模型與以下7種已有的時(shí)間序列預(yù)測(cè)方法進(jìn)行比較.
· HA:歷史均值法,其預(yù)測(cè)值為近期歷史流量狀況的平均值.在本文中,我們使用最近12個(gè)時(shí)間片的平均值來預(yù)測(cè)下一個(gè)時(shí)間片的值;
· ARIMA[2]:自回歸積分滑動(dòng)平均法,是時(shí)間序列分析中的一種經(jīng)典方法;
· LSTM[17]:長(zhǎng)短期記憶網(wǎng)絡(luò),一種特殊的RNN模型.LSTM單元由細(xì)胞、輸入門、輸出門和遺忘門組成;
· GRU[18]:門控循環(huán)單元網(wǎng)絡(luò)[18],一種特殊的RNN;
· STGCN[7]:一種基于空間方法定義的時(shí)空?qǐng)D卷積模型,采用了多種劃分策略將中心節(jié)點(diǎn)的鄰居劃分到不同子集,實(shí)現(xiàn)卷積核的參數(shù)共享;
· GCGRU[11]:一種將門控循環(huán)單元網(wǎng)絡(luò)與圖卷積網(wǎng)絡(luò)結(jié)合的方法;
· GLU-STGCN[12]:一種帶有門控機(jī)制的圖卷積網(wǎng)絡(luò),在交通數(shù)據(jù)預(yù)測(cè)問題上取得了很好的效果.
本文采用均方誤差(RMSE)和平均絕對(duì)誤差(MAE)作為評(píng)價(jià)指標(biāo),具體計(jì)算公式下:
我們將MCSTGCN模型在數(shù)據(jù)集PeMSD4和PeMSD8上與前述7種基準(zhǔn)方法進(jìn)行了比較,表2展示了對(duì)未來1h內(nèi)的流量進(jìn)行預(yù)測(cè)的結(jié)果.
Table 2 Performance comparison of different approaches on the PeMSD4 and PeMSD8 dataset表2 不同方法在數(shù)據(jù)集PeMSD4和PeMSD8上的性能比較
從表2可以看出,我們的模型在兩種評(píng)價(jià)指標(biāo)中均達(dá)到最佳性能.我們還可以觀察到,傳統(tǒng)的時(shí)間序列預(yù)測(cè)方法由于建模能力有限,預(yù)測(cè)結(jié)果并不理想.基于深度學(xué)習(xí)的方法獲得了比傳統(tǒng)方法更好的預(yù)測(cè)結(jié)果,而包含時(shí)空?qǐng)D卷積機(jī)制的模型由于考慮了時(shí)空依賴性,預(yù)測(cè)結(jié)果要優(yōu)于一般的深度學(xué)習(xí)模型.
此外,我們還比較了各種方法隨著預(yù)測(cè)時(shí)長(zhǎng)的增長(zhǎng)性能變化情況.我們以5m為間隔,讓預(yù)測(cè)時(shí)長(zhǎng)從5m增長(zhǎng)到1h,實(shí)驗(yàn)結(jié)果如圖7所示.
Fig.7 Performance changes of different methods along with the forecasting duration圖7 不同方法隨著預(yù)測(cè)時(shí)長(zhǎng)的性能變化情況
從圖7可以看出,從整體上,隨著預(yù)測(cè)時(shí)長(zhǎng)的逐步增大,預(yù)測(cè)難度越來越大,誤差整體呈上升趨勢(shì).我們的MCSTGCN模型在短期預(yù)測(cè)中就取得了較優(yōu)的的預(yù)測(cè)結(jié)果,這表明了多組件與時(shí)空?qǐng)D卷積結(jié)合的策略能充分挖掘數(shù)據(jù)的時(shí)空模式;而隨著預(yù)測(cè)時(shí)長(zhǎng)的增大,我們的模型預(yù)測(cè)誤差比其他方法增長(zhǎng)更加緩慢,這是由于該模型顯式建模了時(shí)間維度上的多種周期特性,因而在中長(zhǎng)期預(yù)測(cè)中顯示更加明顯的優(yōu)勢(shì).
最后,為了觀察每個(gè)組件的輸入數(shù)據(jù)的長(zhǎng)度變化對(duì)預(yù)測(cè)結(jié)果的影響,我們?cè)?PeMSD8數(shù)據(jù)集上將各組件的輸入數(shù)據(jù)長(zhǎng)度分別設(shè)置為Th∈{1,2,3},Td∈{1,2,3},Tw∈{1,2,3}進(jìn)行了實(shí)驗(yàn)對(duì)比,其結(jié)果見表3.
Table 3 MAE with different component input lengths on dataset PeMSD8表3 不同組件輸入數(shù)據(jù)長(zhǎng)度在數(shù)據(jù)集PeMSD8上的MAE
可以看出,Th的變化對(duì)預(yù)測(cè)結(jié)果影響較大,而Td和Tw影響相對(duì)較小.我們選定Th=3,Td=1和Tw=1為最佳的組合.
本文提出一種新穎的多組件時(shí)空?qǐng)D卷積網(wǎng)絡(luò) MCSTGCN,該模型結(jié)合圖卷積和標(biāo)準(zhǔn)卷積構(gòu)造時(shí)空卷積塊來同時(shí)捕獲交通數(shù)據(jù)的時(shí)空特性.在真實(shí)的高速公路流量數(shù)據(jù)集上的實(shí)驗(yàn)表明,本文提出的模型的預(yù)測(cè)效果優(yōu)于其他已有的交通數(shù)據(jù)預(yù)測(cè)方法,驗(yàn)證了該模型在捕獲時(shí)空特征及時(shí)空相關(guān)性方面具有優(yōu)勢(shì).事實(shí)上,除了高速公路流量預(yù)測(cè)任務(wù)外,我們提出的模型也適用于處理其他基于圖結(jié)構(gòu)表示的時(shí)空交通數(shù)據(jù).未來,我們將進(jìn)一步通過注意力機(jī)制等策略來優(yōu)化模型的網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)一步提升模型的預(yù)測(cè)能力.