高醇,王夢靈
基于特征融合圖注意網絡的高速公路交通流預測
高醇,王夢靈*
(華東理工大學 信息科學與工程學院,上海 200237)( ? 通信作者電子郵箱wml_ling@ecust.edu.cn)
基于交通網絡的實際時空拓撲,提出一種特征融合圖注意網絡(FF-GAT)模型融合節(jié)點獲取的多種交通狀態(tài)信息,預測高速公路交通流。首先,分析節(jié)點的車速、交通流和占有率之間的關聯(lián)特征,并基于多變量時間注意力機制,將車速、交通流和占有率之間的關系融入注意力機制,從而捕捉交通流的不同時間之間的動態(tài)時間相關性;其次,將節(jié)點劃分為不同的鄰域集,并通過特征融合圖注意網絡(GAT)捕獲交通流的不同鄰域之間的空間相關性;同時,通過特征交叉網絡充分挖掘多個異構數(shù)據(jù)之間的耦合相關性,為預測目標序列提供有效的信息補充。在兩個公開交通流數(shù)據(jù)集上的實驗結果表明:在PeMSD8數(shù)據(jù)集上,與ASTGCN(Attention based Spatial-Temporal Graph Convolutional Network)模型相比,F(xiàn)F-GAT模型的均方根誤差(RMSE)降低了3.4%;與GCN-GAN(Graph Convolutional Network and Generative Adversarial Network)模型相比,F(xiàn)F-GAT模型的RMSE降低了3.1%??梢姡現(xiàn)F-GAT模型能夠通過特征融合有效提高預測精度。
高速公路交通流預測;圖注意網絡;注意力機制;特征交叉網絡;時空拓撲
準確的交通預測可以幫助交通管理部門制定合適的控制策略,更合理地引導車輛,有效緩解交通擁堵。與地面道路和城市快速路相比,高速公路具有特定的交通模式。高速公路的車輛行駛速度快且不間斷,一旦發(fā)生擁堵或者交通事故,將嚴重影響通行能力。因此,預測高速公路的交通狀態(tài),及時發(fā)現(xiàn)交通狀態(tài)的變化,輔助交通治理十分重要[1-3]。
交通狀態(tài)隨時間和空間發(fā)生改變,可以根據(jù)交通網絡的地理位置劃分為不同的網格圖[4-5]。對于高速公路的交通網絡,可以將公路上不同位置布設的傳感器作為節(jié)點,傳感器間的信息連通作為邊,交通流、平均車速、占有率等交通狀態(tài)參數(shù)作為測量數(shù)據(jù)的屬性。針對交通網絡的圖結構表征,許多研究采用圖卷積模型聚合交通網絡節(jié)點的信息,通過捕捉節(jié)點之間的空間依賴關系,從整個圖結構預測所有節(jié)點交通狀態(tài)變化。文獻[6-8]中采用卷積神經網絡、循環(huán)神經網絡模擬時序關聯(lián),同時采用圖卷積模擬空間關聯(lián);但圖卷積在卷積過程中無法根據(jù)相鄰節(jié)點的重要性分配不同的權值,每個節(jié)點權重相同,影響預測精度。近年來,一些通過引入注意力機制考慮交通數(shù)據(jù)在時間和空間維度上的動態(tài)關聯(lián)性,計算不同場景中時空節(jié)點的相互影響程度。Zhu等[9]在時間圖卷積網絡(Temporal Graph Convolutional Network, T-GCN)[8]中引入時間注意力機制,調整不同時間點的重要性,基于該改進方法交通狀態(tài)變化預測精度更高。Guo等[10]分析交通流的近期相關性、日周期相關性和周周期相關性,先將交通流進行時間注意力機制處理,再在空間圖卷積中加入注意力機制(時間和空間上的注意力機制計算公式相同),設計時空圖卷積模型預測交通狀態(tài)的變化。事實上,特定位置的異構數(shù)據(jù)直接影響預測序列。Liang等[11]設計氣象等外部因素抽取模塊輸入到局部空間和全局空間注意力機制,捕獲不同傳感器之間的動態(tài)空間相關性。Yin等[12]提出的多階段注意力機制能捕獲同一傳感器采集的多個時間序列之間的交互作用。
由于基于圖卷積的交通預測模型屬于頻域(spectral domain)派別,主要通過引入濾波器定義圖卷積,其中圖卷積操作被解釋為從圖信號中去除噪聲,需要進行拉普拉斯矩陣特征分解[13-14],計算量較大。其次,由于高速公路網絡結構復雜,道路網絡中不同節(jié)點對目標節(jié)點的影響不同,隨著時間的推移,影響權重高度復雜,且是動態(tài)的。圖卷積的模型訓練依賴對全圖所有節(jié)點的預先訪問,泛化能力弱,無法實現(xiàn)歸納性學習。最后,多層圖卷積存在過平滑問題,在使用多層圖卷積后,節(jié)點的表示向量趨于一致,使得相應的學習任務變得更加困難。針對以上問題,Veli?kovi?等[15]提出了圖注意網絡(Graph Attention neTwork, GAT),GAT屬于空域(vertex domain)派別,無須代價高昂的矩陣計算,計算量較小。圖注意模型自主地學習一階鄰域中鄰居節(jié)點對目標節(jié)點的重要性,自適應分配不同鄰居的空間權重,更好地解決了基于頻域圖卷積的問題。當預測路網交通狀態(tài)時,需要準確計算路網節(jié)點影響系數(shù),但圖注意網絡僅考慮周圍有限節(jié)點對目標節(jié)點的交互影響,未考慮路網結構的多階鄰接關系,信息利用不充分,而且也沒有加入多變量的信息。
針對上述問題,本文提出一種基于特征融合圖注意網絡(Feature Fusion Graph ATtention network, FF-GAT)模型。將平均車速和占有率作為多變量,在時間維度上分別把車速、占有率對交通流的相關度函數(shù)引入時間注意力機制,增強模型刻畫時序上特征相關性的能力;為了更好地挖掘不同節(jié)點之間隱含空間相關性,構建一階鄰接矩陣和二階鄰接矩陣,將它們輸入圖注意網絡,計算不同鄰域對目標節(jié)點的影響系數(shù),線性組合后增大空間維度感受野;基于圖注意網絡引入特征交叉捕捉不同變量的交叉關系,抓取每個節(jié)點變量的特征信息;結合二維卷積網絡和特征融合圖注意網絡,模擬時空關聯(lián)。本文模型生成的預測結果與真實路網交通流分布基本一致,預測準確率較高,同時消融實驗和參數(shù)敏感性分析驗證了模型的有效性。
假設高速公路的交通狀態(tài)可以由個傳感器測得,具體可以表示為矩陣如下:
一般地,對于每一個傳感器(即節(jié)點)測量的不同的交通狀態(tài)變量,交通流、平均車速和道路占有率三者之間的關聯(lián)關系可以表示為式(2)~(3)[16]。
2)?關系。
其中:為映射函數(shù);為預測窗口長度。
雖然交通狀態(tài)變量之間的關系可以由常用的線性模型表示,但是高速公路網絡結構復雜,而且交通狀態(tài)是時變的,交通流計算結果與實際測量結果不一致,因此不能采用單一的模型描述。本文按照時空的推移尋找三者的關聯(lián)關系,在空間上盡可能挖掘圖結構的狀態(tài)信息,采取二階圖注意網絡的模型預測交通流。
FF-GAT模型的總體架構如圖1(a)所示,它主要由多層時空層組成。時空層由多變量時間注意力機制、特征交叉圖注意網絡和時間二維卷積串聯(lián)組成,串聯(lián)堆疊多個時空層,每個時空層采用殘差學習的方式訓練,最后接入一個多層感知機模型輸出層。
如圖1(b),在第一個虛線框中構建多變量時間注意力機制,利用平均車速、占有率和交通流的相關度函數(shù),融合計算各時刻流程狀態(tài)重要性,增強模型在時序上特征相關性的刻畫能力;在第二個虛線框中同時創(chuàng)建一階鄰接矩陣和二階鄰接矩陣,輸入圖注意網絡,計算不同鄰域對目標節(jié)點的影響系數(shù),增強路網節(jié)點的空間相關性,在圖注意網絡基礎上引入特征交叉挖掘每個節(jié)點的不同交通狀態(tài)關系;在第三個虛線框中利用二維卷積網絡提取時域上的特征信息,通過一層時空層操作后,可以捕獲交通流的時間維和空間維特征。
圖1 本文模型架構
在時間域上,不同時刻路網節(jié)點的交通流之間也存在相關性,且這種時間相關性隨著路網條件的變化而變化。文獻[10]中利用注意力機制為不同時刻路網交通流賦予不同重要性,時間域上的時間注意力機制如下:
對于交通網絡中的某個節(jié)點,記錄不同的時間序列,如交通流、速度和占有率。同一節(jié)點的這3個變量在不同時刻之間存在著相關性,由于式(2)~(3)是線性關系模型,數(shù)學形式簡單,對實際數(shù)據(jù)的擬合效果較差,不能用式(2)~(3)表示三者之間的關聯(lián)關系。因此,對于實際數(shù)據(jù),借助余弦相似度(式(6))分別計算平均車速和占有率對交通流的相似度:
圖2 多變量時間注意力機制
與一般忽略路網結構信息的基于注意的方法相比,本文所提圖注意網絡不需要在圖卷積基礎上進行注意力機制處理[10],可以直接自適應地分配不同鄰居的空間權重,采用鄰接關系作為先驗,將節(jié)點劃分為兩個鄰域集;其次,利用注意力機制同時動態(tài)捕捉第一階鄰域和第二階鄰域間的空間相關性;最后,對觀測節(jié)點的鄰域節(jié)點特征進行加權求和,提取目標節(jié)點的特征信息和不同鄰域對它的影響。
2.3.1構建鄰接矩陣
傳統(tǒng)的鄰接矩陣主要關注直接連接的節(jié)點,即相鄰的一階鄰居,而忽略了節(jié)點之間的間接連接。如圖3所示,本文采用新的鄰接矩陣編碼傳感器之間的直接鄰接關系和間接鄰接關系。
其中為i到j的最短路徑長度。
2.3.2二階鄰域圖注意網絡
圖4 圖注意力層
(=1,2)階鄰域的注意力系數(shù)的計算公式如下:
每個節(jié)點的最終輸出特征如下:
為了穩(wěn)定自注意力學習過程,進一步提升注意力層的表達能力,對最終的網絡層執(zhí)行多頭注意力機制:
其中表示注意力頭數(shù)。
圖5 二階鄰域圖注意網絡
圖6 特征交叉
第+1層的交叉過程如下:
通過多層網絡對特征向量各個維度進行充分的交叉組合,模型能夠抓取更多的非線性特征和組合特征的信息,此外,特征交叉網絡還有低線性復雜度和參數(shù)共享的優(yōu)點。
本文利用標準二維卷積提取時域上的特征,具體做法是對每個節(jié)點自身時間域上的相鄰點進行卷積操作。經過空間特征提取和時間特征提取后的結果如下:
步驟3 多個串聯(lián)堆疊的時空層采用殘差學習的方式訓練,輸出的交通流接入全連接層。
為了驗證本文模型的性能和有效性,在兩個數(shù)據(jù)集(PeMSD4和PeMSD8)上進行對比實驗。兩個數(shù)據(jù)集是從加州交通性能測量系統(tǒng)(PeMS)[17]收集:PeMSD4包含了美國加州舊金山灣區(qū)(San Francisco Bay Area)的路網節(jié)點交通狀態(tài)數(shù)據(jù),PeMSD8包含了美國加州圣貝納迪諾縣(San Bernardino)的路網節(jié)點交通狀態(tài)數(shù)據(jù)。為了方便研究,本文中所用的數(shù)據(jù)集都移除了路網節(jié)點中的冗余檢測點,確保數(shù)據(jù)集中每個節(jié)點都不過于接近(相鄰節(jié)點間的距離不大于3.5 英里(1 英里=1.61 km))。最終得到的PeMSD4和PeMSD8分別包含了307個節(jié)點和170個節(jié)點,同時聚集原有每隔30 s的采樣數(shù)據(jù),使得每條樣本數(shù)據(jù)間的間隔為5 min。本文利用平均值插值法補全缺失數(shù)據(jù),利用零均值對輸入數(shù)據(jù)歸一化。實驗考慮3個輸入特征:交通流、平均車速和占用率,并將數(shù)據(jù)集按照6∶2∶2隨機分割為訓練集、驗證集和測試集。
本文選擇均方根誤差(Root Mean Squared Error, RMSE)和平均絕對誤差(Mean Absolute Error, MAE)作為評價指標,它們的計算公式分別為:
選用長短期記憶(Long Short-Term Memory, LSTM)網絡[18]、時空圖卷積網絡(Spatio-Temporal Graph Convolutional Network, STGCN)[19]、GeoMAN(Multi-level Attention Network for Geo-sensory time series prediction)模型[11]、ASTGCN(Attention based Spatial-Temporal Graph Convolutional Network)模型[10]、GCN-GAN(Graph Convolutional Network and Generative Adversarial Network)模型[20]作為實驗對比的基線。同時,為了和傳統(tǒng)非深度學習模型進行比較,本文選取了歷史平均(Historical Average, HA)、向量自回歸(Vector Auto-Regressive, VAR)[21]和差分整合移動平均自回歸(AutoRegressive Integrated Moving Average, ARIMA)模型[22]作為傳統(tǒng)基線模型。在HA中,根據(jù)前12個時間片的平均值預測下一個值。
根據(jù)相關文獻和歷史經驗設定上述基準模型的關鍵參數(shù),分別如下:ARIMA模型的自回歸系數(shù)為4,移動平均項數(shù)為2,差分階數(shù)為2;VAR的最佳滯后階數(shù)為3;LSTM的網絡層數(shù)為2,隱藏層數(shù)為64;STGCN[19]、GeoMAN模型[11]、ASTGCN模型[10]和GCN-GAN模型[20]的參數(shù)設置均參考相應文獻,設置為默認值。
經過測試和驗證,時間維的卷積核大小不能過大,本文時間維卷積核的大小設置為(1,3),圖注意力網絡中的多頭注意力頭數(shù)設置為2,圖注意網絡中隱藏層維度設置為64,本文的預測步長大小置為12,即預測未來1 h的路網節(jié)點流量。利用Adam優(yōu)化器訓練,批處理大小設置為32,初始學習率設置為0.001,訓練的最大迭代數(shù)設置為100。
在本文建立的預測模型中,主要有3個影響模型預測性能的超參數(shù),分別是注意力頭數(shù)、鄰域階數(shù)和隱藏層維度,其中:注意力頭數(shù)影響注意力層的權重計算復雜度;鄰域階數(shù)影響圖結構中鄰居節(jié)點信息的聚合程度;隱藏層維度影響神經網絡的擬合函數(shù)能力。在PeMSD4和PeMSD8數(shù)據(jù)集上,設置注意力頭數(shù)為{1,2,3,4},鄰域階數(shù)為{1,2,3,4},隱藏層維度{16,32,64,128},使用試湊法分別測試3個參數(shù)對模型的影響。
注意力頭數(shù)、鄰域階數(shù)對模型性能的影響如圖7所示。隨著頭數(shù)增加,模型的誤差先降低再升高,當頭數(shù)為2時誤差最小,當頭數(shù)過大時,模型可能出現(xiàn)過擬合。隨著鄰域階數(shù)增加,在一階鄰域時模型不能提取更完善的信息;在二階鄰域時模型可以很好地聚合信息,此時模型誤差最??;繼續(xù)加深鄰域階數(shù),可能降低信息區(qū)分度,導致誤差較大。
圖7 不同超參數(shù)在不同數(shù)據(jù)集上的預測誤差對比
表1為不同模型在PeMSD4和PeMSD8數(shù)據(jù)集上在路網節(jié)點未來60 min的流量預測平均結果。從表1可以看出,在PeMSD4和PeMSD8數(shù)據(jù)集上,與4個經典時間序列模型相比,F(xiàn)F-GAT模型的RMSE分別降低了22.4%~47.8%和12.9%~38.2%,可以看出,經典時間序列模型的預測結果較差,這可能是因為經典時間序列模型對非線性的復雜交通數(shù)據(jù)建模能力有限,而深度學習模型對復雜的路網預測能力更強。對比不同的深度學習模型,STGCN、GeoMAN和FF-GAT模型都同時提取了時間和空間特征,在PeMSD4和PeMSD8數(shù)據(jù)集上,F(xiàn)F-GAT模型的RMSE與STGCN相比分別降低了7.4%和11.7%,與GeoMAN相比分別降低了6.0%和5.9%,與ASTGCN相比分別降低了2.0%和3.4%,與GCN-GAN相比分別降低了1.9%和3.1%。本文模型對路網的預測結果更理想,同時由于本文模型在特征提取時更全面地挖掘了節(jié)點拓撲信息,因此在兩個數(shù)據(jù)集上的預測結果精度都較好。
表1 不同模型在PeMSD4和PeMSD8數(shù)據(jù)集上的結果對比
圖8為9種模型的預測精度指標(RMSE和MAE)隨著預測時間的變化曲線。從圖8可以看出,隨著預測時間的增加,HA、ARIMA、LSTM的預測精度急劇下降,VAR的精度略慢于上述3種模型,深度學習模型的誤差隨著預測時間的增加而緩慢增加,總體性能良好。從圖8可以看出,當時間為60 min時,在兩個數(shù)據(jù)集上,F(xiàn)F-GAT模型的RMSE均低于其他對比模型。與上述模型相比,ASTGCN通過引入注意力機制處理時空動態(tài)特性,預測精度有所提升,本文模型在時間和空間維度都考慮了多變量的參數(shù)影響,充分考慮了交通流數(shù)據(jù)的時空相關性,因此能達到最佳的預測性能。
圖8 不同模型在不同預測時長下的性能比較
FF-GAT模型在PeMSD4數(shù)據(jù)集上對176號傳感器預測的交通流與實際值的差異曲線如圖9(a)所示,在PeMSD8數(shù)據(jù)集上對3號傳感器預測的交通流與實際值的差異曲線如圖9(b)所示?;谡鎸嵵档那€非常不規(guī)則,但本文模型大致符合趨勢,說明FF-GAT模型對數(shù)據(jù)中可能的模式有更強的學習能力,這也說明了本文模型的有效性。
圖9 FF-GAT模型的交通流量預測值與真實值的對比
FF-GAT模型參數(shù)擬合過程中的誤差變化曲線如圖10所示,隨著迭代次數(shù)(epoch)的增加,預測精度逐漸升高,誤差值逐漸減小,模型收斂較快。在PeMSD4數(shù)據(jù)集上,在迭代次數(shù)為40時模型趨于穩(wěn)定,觀察驗證集發(fā)現(xiàn)迭代次數(shù)為78時模型參數(shù)誤差最??;同樣地,在PeMSD8數(shù)據(jù)集上,模型在迭代次數(shù)為45時趨于穩(wěn)定,觀察驗證集發(fā)現(xiàn)迭代次數(shù)為74時模型參數(shù)誤差最小,以上結果說明了本文模型的穩(wěn)定性。
圖10 FF-GAT模型的誤差曲線
為了驗證本文模型中各個模塊的有效性,設計兩個變體模型:1)MA,即移除多變量時間注意力機制模塊;2)MF,即移除多變量輸入特征交叉模塊。消融實驗結果見表2,可以看出,兩個變體模型的誤差均高于FF-GAT模型,表明模型的各個組件的有效性,多變量時間注意力機制能為模型在時間維度上提供更多信息輔助模型預測,多變量輸入特征交叉也能更好地挖掘交通數(shù)據(jù)中的相關性。
表2 不同模塊在PeMSD4和PeMSD8數(shù)據(jù)集上的性能
高速公路交通流預測是現(xiàn)代交通管理的一個基本問題。針對采集的路網狀態(tài)具有時空復雜性和非線性特征的問題,本文提出一種基于特征融合圖注意網絡的路網交通流預測模型。在時間上考慮交通預測中同一節(jié)點不同交通變量之間的關系,利用多變量時間注意力機制捕捉不同時間之間的動態(tài)時間相關性;在空間上以路網不同鄰域信息為先驗,利用二階圖注意網絡捕獲網絡內部的綜合空間相關性,再用多變量特征交叉網絡充分挖掘多個異構數(shù)據(jù)之間的耦合相關性,為預測交通流提供有效的信息補充。在兩個PeMS數(shù)據(jù)集上的實驗結果表明,所提模型與現(xiàn)有對比模型相比,在挖掘特征和預測精度方面均具有一定優(yōu)勢。下一步將收集道路功能特征、天氣特征、節(jié)假日和社會事件等數(shù)據(jù)集,為用戶提供最全面的信息,形成完整的智能交通系統(tǒng),促進智慧城市交通的發(fā)展。
[1] CHEN L, SHAO W, LV M, et al. AARGNN: an attentive attributed recurrent graph neural network for traffic flow prediction considering multiple dynamic factors[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(10): 17201-17211.
[2] SHIN Y, YOON Y. Incorporating dynamicity of transportation network with multi-weight traffic graph convolutional network for traffic forecasting[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(3): 2082-2092.
[3] HUANG J, LUO K, CAO L, et al. Learning multiaspect traffic couplings by multirelational graph attention networks for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(11): 20681-20695.
[4] 王海起,王志海,李留珂,等. 基于網格劃分的城市短時交通流量時空預測模型[J]. 計算機應用, 2022, 42(7):2274-2280.(WANG H Q, WANG Z H, LI L K, et al. Spatial-temporal prediction model of urban short-term traffic flow based on grid division[J]. Journal of Computer Applications, 2022, 42(7):2274-2280.)
[5] LIN Z, FENG J, LU Z, et al. DeepSTN+: context-aware spatial-temporal neural network for crowd flow prediction in metropolis[C]// Proceedings of the 33rd AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 1020-1027.
[6] 陳丹蕾,陳紅,任安虎. 考慮時空影響下的圖卷積網絡短時交通流預測[J]. 計算機工程與應用, 2021, 57(13):269-275.(CHEN D L, CHEN H, REN A H. Short-time traffic flow prediction of graph convolutional network considering influence of space and time[J]. Computer Engineering and Applications, 2021, 57(13):269-275.)
[7] SONG C, LIN Y, GUO S, et al. Spatial-temporal synchronous graph convolutional networks: a new framework for spatial-temporal network data forecasting[C]// Proceedings of the 34th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2020: 914-921.
[8] ZHAO L, SONG Y, ZHANG C, et al. T-GCN: a temporal graph convolutional network for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(9): 3848-3858.
[9] ZHU J, HAN X, DENG H, et al. KST-GCN: a knowledge-driven spatial-temporal graph convolutional network for traffic forecasting[J]. IEEE Transactions on Intelligent Transaction Systems, 2022, 23(9): 15055-15065.
[10] GUO S, LIN Y, FENG N, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]// Proceedings of the 33rd AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 922-929.
[11] LIANG Y, KE S, ZHANG J, et al. GeoMAN: multi-level attention networks for geo-sensory time series prediction[C]// Proceedings of the 27th International Joint Conference on Artificial Intelligence. California: ijcai.org, 2018: 3428-3434.
[12] YIN X, WU G, WEI J, et al. Multi-stage attention spatial-temporal graph networks for traffic prediction[J]. Neurocomputing, 2021, 428: 42-53.
[13] DEFFERRARD M, BRESSON X, VANDERGHEYNST P. Convolutional neural networks on graphs with fast localized spectral filtering[C]// Proceedings of the 30th International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2016: 3844-3852.
[14] BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[EB/OL]. (2014-05-21) [2022-05-23].https://arxiv.org/pdf/1312.6203.pdf.
[15] VELI?KOVI? P, CUCURULL G, CASANOVA A, et al. Graph attention networks[EB/OL]. (2018-02-04) [2022-05-23].https://arxiv.org/pdf/1710.10903.pdf.
[16] GREENSHIELDS B D, BIBBINS J R, CHANNING W S, et al. A study of traffic capacity[J]. Highway Research Board Proceedings, 1935, 14: 448-477.
[17] CHEN C, PETTY K, SKABARDONIS A, et al. Freeway performance measurement system: mining loop detector data[J]. Transportation Research Record, 2001, 1748(1): 96-102.
[18] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.
[19] YU B, YIN H, ZHU Z. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting[C]// Proceedings of the 27th International Joint Conference on Artificial Intelligence. California: ijcai.org, 2018:3634-3640.
[20] ZHENG H, LI X, LI Y, et al. GCN-GAN: integrating graph convolutional network and generative adversarial network for traffic flow prediction[J]. IEEE Access, 2022, 10: 94051-94062.
[21] SETHI J K, MITTAL M. Analysis of air quality using univariate and multivariate time series models[C]// Proceedings of the 10th International Conference on Cloud Computing, Data Science and Engineering. Piscataway: IEEE, 2020: 823-827.
[22] RUN L, MIN L X, LU Z X. Research and comparison of ARIMA and grey prediction models for subway traffic forecasting[C]// Proceedings of the 2020 International Conference on Intelligent Computing, Automation and Systems. Piscataway: IEEE, 2020:63-67.
Highway traffic flow prediction based on feature fusion graph attention network
GAO Chun, WANG Mengling*
(,,200237,)
Based on the actual spatio-temporal topology of the traffic network, a Feature Fusion Graph ATtention network (FF-GAT) model was proposed to fuse multiple traffic state information obtained by nodes, so as to predict the highway traffic flow. First, the correlation features among the vehicle speed, traffic flow and occupancy of the nodes were analyzed, and based on the multivariate temporal attention mechanism, the relationships among the vehicle speed, traffic flow and occupancy were incorporated into the attention mechanism to capture the dynamic temporal correlation between different moments of traffic flow. Then, the nodes were divided into different sets of neighborhoods, and the spatial correlation between different neighborhoods of traffic flow was captured by the feature fusion Graph Attention neTwork (GAT). At the same time, the coupling correlation between multiple heterogeneous data was fully explored by the feature crossover network to provide effective information supplement for predicting the target sequence. Experiments were carried out on two publicly available traffic flow datasets. Experimental results show that FF-GAT model reduces the Root Mean Squared Error (RMSE) by 3.4% compared with ASTGCN (Attention based Spatial-Temporal Graph Convolutional Network) model and 3.1% compared with GCN-GAN (Graph Convolutional Network and Generative Adversarial Network) model on PeMSD8 dataset. It can be seen that FF-GAT model can effectively improve the prediction accuracy through feature fusion.
highway traffic flow prediction; Graph Attention neTwork (GAT); attention mechanism; feature crossover network; spatio-temporal topology
This work is partially supported by Project of Science and Technology Commission of Shanghai Municipality (19DZ1209003).
GAO Chun, born in 1998, M. S. candidate. Her research interests include traffic big data mining.
WANG Mengling, born in 1980, Ph. D., associate professor. Her research interests include traffic big data mining, computational intelligence algorithm, artificial intelligence-based modeling method, distributed predictive control, traffic management decision optimization.
1001-9081(2023)10-3114-07
10.11772/j.issn.1001-9081.2022101587
2022?10?24;
2023?03?13;
上海市科學技術委員會課題(19DZ1209003)。
高醇(1998—),女,云南曲靖人,碩士研究生,主要研究方向:交通大數(shù)據(jù)挖掘; 王夢靈(1980—),女,湖北黃岡人,副教授,博士,主要研究方向:交通大數(shù)據(jù)挖掘、計算智能算法、基于人工智能的建模方法、分布式預測控制、交通管理決策優(yōu)化。
TP391.4
A
2023?03?14。