龍望晨 王索 羅定福 劉紅
摘要:深度神經網絡能夠有效地捕捉城市區(qū)域間的時間和空間相關性,同時對于特征工程依賴較少,逐漸成為交通預測中的應用熱點。首先介紹交通預測的主要內容和挑戰(zhàn),從捕捉時空相關性的角度歸納近年來比較流行的基于深度神經網絡的交通預測方法,分析各類方法的優(yōu)缺點,最后對深度神經網絡在交通預測中的未來發(fā)展前景進行展望。
關鍵詞:機器學習;深度神經網絡;交通預測
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)16-0183-03
開放科學(資源服務)標識碼(OSID):
Application of Deep Neural Network in Urban Traffic Prediction
LONG Wang-chen , WANG Suo ,? LUO Ding-fu ,? LIU Hong
(School of Computer and Information Engineering, Guangdong Songshan Polytechnic College, Shaoguan 512126, China)
Abstract: Deep neural network can effectively capture the temporal and spatial correlation between urban regions, and at the same time, it is less dependent on feature engineering, which gradually becomes the application hotspot in traffic prediction. Firstly, it introduces the main contents and challenges of traffic prediction, summarizes the popular traffic prediction methods based on deep neural network in recent years from the perspective of capturing temporal and spatial correlation, analyzes the advantages and disadvantages of various methods, and finally forecasts the future development prospect of deep neural network in traffic prediction.
Key words: machine learning; deep neural network; traffic prediction
1 引言
隨著國民經濟的高速發(fā)展和城市化進程的不斷深入,城市機動車數量急劇增加。交通堵塞及車輛事故經常發(fā)生,城市機動車保有量的迅猛增長與有限的城市空間和道路資源之間的矛盾日益加劇,已成為影響和制約我國城市交通系統(tǒng)良性發(fā)展的關鍵因素。城市交通預測是解決這一矛盾的有效手段,城市交通預測通過研究歷史交通時空序列數據,嘗試構建城市交通的動態(tài)演化規(guī)律,以實現(xiàn)預測未來交通狀況。交通預測主要可以分為以下幾類:
1)流量預測:預測一個或多個節(jié)點或路段在某個時刻的通過車輛的數量;
2)速度預測:預測一個或多個節(jié)點或路段所有車輛的平均通過車速;
3)需求預測:預測一個或多個區(qū)域在某個時刻的用車需求;
4)出行時間預測:預測從某個地點前往另一地點所需的出行時間。
交通預測會面臨以下挑戰(zhàn):
1.1復雜的空間相關性
交通流的變化受區(qū)域間相互影響,產生影響的條件主要有以下幾點:
1)物理距離鄰近。由地理學第一定律可知:空間距離越近的區(qū)域,其關聯(lián)程度越強[1]。所以,某個區(qū)域的交通狀態(tài)是受其鄰接區(qū)域直接影響。如圖1中,區(qū)域A與其相鄰的區(qū)域C之間存在較強的影響。
2)具有高速道路連接。如圖1中,區(qū)域B與區(qū)域C之間有著高速道路直接相連,車流能夠快速地在區(qū)域B和區(qū)域C相互傳導,最終使得這兩個區(qū)域之間的交通狀況非常相似。
3)具有相似的功能性。某些距離上較遠,但具有相似功能性的區(qū)域間也存在著比較強的關聯(lián)性。例如圖1中,區(qū)域B與區(qū)域C都有學校,學生出入校園的時候區(qū)域B和區(qū)域C的交通狀況很相似。
1.2動態(tài)的時間相關性
區(qū)域間的相互影響隨著時間而不斷變化,主要表現(xiàn)為以下特點:
1)時間越近,影響越大。一般來說,當前時間交通狀態(tài)與最近的歷史交通狀態(tài)有著密切的關系。
2)周期性相關性。城市交通狀態(tài)往往呈現(xiàn)出周期性,例如:工作日時間,每天上午8點的交通狀態(tài)是類似的,每個周末的交通狀態(tài)也很可能是相似的。區(qū)域的當前狀態(tài)與上一個周期的同一時刻相似。
1.3外部因素
城市交通受很多外部因素如:天氣、節(jié)假日等影響。一場暴雨導致整個城市的交通的癱瘓;突然的冷空氣降溫可能只是推遲了上班高峰期的出現(xiàn)。不同的外部因素對城市交通的影響也是不同的。
上述的這些復雜的因素共同作用在一起,對城市交通狀態(tài)產生的不可預知的影響,使得城市交通的預測變得非常具有挑戰(zhàn)。
2 深度神經網絡在交通預測中的應用
深度神經網絡通過構造深層的非線性網絡結構在計算機視覺、自然語言處理、醫(yī)療影像等眾多領域取得了令人矚目的成績[2]。得益于深度學習技術的突破,深度神經網絡在表達復雜的時空相關性方面表面出很強的能力。而城市交通預測的關鍵是捕獲城市區(qū)域間時空關系的動態(tài)變化規(guī)律,因此,越來越多的研究者嘗試將深度神經網絡應用于交通預測中。基于城市交通的歷史時序數據,利用深度神經網絡去學習其中的時空相關性變化規(guī)律是實現(xiàn)準確預測的關鍵。為了實現(xiàn)精準的交通預測,現(xiàn)有基于深度神經網絡的預測方法會針對不同的預測場景,通過組合不同的深度神經網絡來聯(lián)合學習時間相關性和空間相關性。本文將從空間相關性建模和時間相關性建模的角度對已有基于深度神經網絡的預測方法進行介紹。
2.1 空間相關性建模
城市的區(qū)域位置可以通過二維坐標關系進行表達,因此城市空間的相關性形成了一個對應的二維空間相關圖??臻g相關性建模的目的在于捕捉所有區(qū)域間的空間特征。
2.1.1 基于卷積神經網絡(Convolutional Neural Networks)
卷積神經網絡因具有較強的捕捉二維空間特征而出名[3]。卷積神經網絡利用不同的卷積核對二維空間特征進行壓縮,然后再利用全連接網絡進行映射輸出,它能夠學到大量的映射關系而不需要任何輸入和輸出之間的精確數學表達式。卷積本質上就是利用一個共享參數的過濾器(kernel),通過計算中心像素點以及相鄰像素點的加權和來構成特征圖并實現(xiàn)空間特征的提取。為了能夠讓卷積進行有效的應用,一般需要將二維交通圖進行網格劃分。如圖2所示,將整個城市使用網格進行劃分,每個網格代表一個區(qū)域,所有網格進行整齊排列,形成歐式數據結構(Euclidean Structure)。卷積操作能夠非常高效的在這樣的結構中捕捉到空間特征。文獻[4-7]都采用了卷積神經網絡,這些方法首先都需要對整個城市進行網絡劃分,進而構建出歐式數據結構圖,然后再利用卷積去學習不同網格區(qū)域之間的空間相關性。
2.1.2 基于圖卷積神經網絡
近幾年,有學者提出區(qū)域間相互關系形成交互圖并不是二維結構的,例如兩個相鄰區(qū)域相關性很強,兩個相隔很遠的功能相似的區(qū)域之間也可能存在很強的相關性??紤]各種關系后,城市不同區(qū)域之間的交互關系會形成一個類似圖3的非歐式結構圖(Non-Euclidean Structure)。而卷積神經網絡CNN適合于二維平面圖,并不太適合于立體圖,所以學者開始將適用于非歐式結構圖的方法圖卷積神經網絡(Graph Convolutional Network)來捕捉空間特征??梢詫D卷積神經網絡可以分為兩類:基于譜域的圖卷積神經網絡和基于空域的圖卷積神經網絡?;谧V域的圖卷積神經網絡利用圖上傅里葉變換和卷積定理從譜域定義圖卷積,而基于空域的圖卷積神經網絡則在節(jié)點域定義加權函數在聚合中心節(jié)點及其鄰居節(jié)點的特征[8]。這兩種方法本質上都是盡可能多的聚合圖中節(jié)點及其鄰居節(jié)點之間的空間關系。采用圖卷積神經網絡捕獲空間相關性的代表有文獻[9-12],這些方法首先會根據不同的應用構建對應的具有圖結構的區(qū)域空間相關性圖,然后再設計不同的圖卷積方式去學習區(qū)域間的空間相關性。
2.1.3 基于注意力機制
無論是CNN還是GCN,其核心都是基于卷積操作,卷積操作會有一個特點是對于近距離區(qū)域節(jié)點關系的捕捉能力強,而對于遠距離節(jié)點關系的捕捉能力弱。針對CNN和GCN的這一不足,有學者將注意力機制(Attention Mechanism)應用于捕捉空間特征關系。注意力機制本質上是通過構建一個包含全體區(qū)域的相關矩陣來表達各個區(qū)域間的關系程度,因此注意力機制不僅能夠捕捉到近距離節(jié)點的關系強弱,也可以有效的表達出遠距離節(jié)點影響程度。注意力機制能夠表達出不同空間區(qū)域在不同時刻存在的不同大小的影響關系。采用注意力機制捕獲空間相關性的文獻有[13-14],這些方法在表達遠距離節(jié)點影響程度上具有優(yōu)勢,但注意力機制也需要消耗更大的計算量。
2.2 時間相關性建模
在時間維度上,交通流數據是時序數據,具有一些明顯的特征:相鄰時序相關性,周期相關性等。一個好的方法需要能夠建模出交通流數據這些特性,所以在時間維度的研究上主要關注了局部相關性,周期性等特征。
2.2.1 基于循環(huán)神經網絡
循環(huán)神經網絡(Recurrent Neural Network)是專門用于處理序列數據的神經網絡,它具有記憶歷史序列信息的能力,因此很自然就成了捕捉時間相關性的首選算法。但是,研究人員發(fā)現(xiàn)當輸入的時序數據比較長的時候,循環(huán)神經網絡存在梯度消失的問題,表現(xiàn)在記不住隔得遠的數據,只能記得近期的數據。這個缺點使得它不能有效的關注到交通流數據中的周期性特征。于是,研究人員開始后面人們利用長短期記憶人工神經網絡(Long Short Term Memory networks)和門控循環(huán)單元(Gated Recurrent Neural Networks)去捕捉區(qū)域間的時間相關性。長短期記憶人工神經網絡和門控循環(huán)單元是循環(huán)神經網絡的變種,它們在循環(huán)神經網絡的基礎上添加了門機制,其網絡結構如圖4所示。門機制能夠選擇性的忘記不重要的歷史信息,這樣可以網絡在保留長期序列信息下減少梯度消失問題。采用長短期記憶人工神經網絡和門控循環(huán)單元捕獲時間相關性的文獻有。文獻[4,10,11,14,15]分別利用了LSTM或GRU來實現(xiàn)時間相關性的學習,這些方法都是先捕獲空間相關性,然后再基于LSTM或GRU再進一步完成時間相關性的學習。
2.2.2 基于自注意力模型
長短期記憶人工神經網絡和門控循環(huán)單元雖然改善了RNN存在的問題,但效果仍然存在長歷史信息丟失的問題。于是研究人員又將注意力機制用于捕捉長期的時間特征,其中以Transformer中的自注意力模型(Self-Attention Mechanism)表現(xiàn)尤為出色[16],它彌補了類RNN模型的記不住長期上下文的缺點同時實現(xiàn)了并行計算。不過,Transformer中的自注意力模型默認是丟失了位置關系,也就是說沒有時序的概念。所以,利用自注意力模型在處理時序數據時,需要另外提供時序位置信息才能夠有效的捕捉到區(qū)域間的時間相關性。文獻[13-14]利用注意力機制實現(xiàn)了長距離時間相關性捕捉,但是注意力模型計算復雜度相對較高,對于計算和存儲容量需求較大。
2.2.3 基于卷積神經網絡
因為交通流數據是時序數據,具有相鄰時序相關性,周期相關性等特征。如果把每個時刻分成獨立的塊,卷積神經網絡也是可以捕捉相鄰時序塊的相關性的?;诰矸e神經網絡捕獲空間相關性的文獻有[6,17]。為了捕捉到周期性,卷積神經網絡需要能夠捕捉長距離間的特征,而單層卷積神經網絡是只能捕捉到相鄰區(qū)域而無法捕捉長距離時間相關性的。所以需要加深網絡用多層卷積神經網絡通過不斷疊加網絡深度來形成更大的感受野,進而實現(xiàn)長距離時間相關性的捕捉。但這種方式存在計算效率低,優(yōu)化困難等缺點。
3 結語
城市交通預測旨在利用歷史交通時空序列數據,探尋城市交通的動態(tài)演化規(guī)律,以實現(xiàn)未來交通狀況的預測,在交通規(guī)劃、安全管理和資源配置等方面起到重要作用。本文介紹了城市交通預測的主要內容及其挑戰(zhàn),從捕獲時空相關性的角度闡述了已有基于深度神經網絡方法的優(yōu)缺點。雖然已有基于深度神經網絡方法取得了不錯的成績,但大多數方法并不能夠實現(xiàn)線上實時預測。此外,現(xiàn)有方法對于交通數據的安全保護還需要進一步提高。
參考文獻:
[1] Tobler W R.A computer movie simulating urban growth in the Detroit region[J].Economic Geography,1970,46(sup1):234-240.
[2] LeCun Y,Bengio Y,Hinton G.Deep learning[J].Nature,2015,521(7553):436-444.
[3] 周飛燕,金林鵬,董軍.卷積神經網絡研究綜述[J].計算機學報,2017,40(6):1229-1251.
[4] 晏臻,于重重,韓璐,等.基于CNN+LSTM的短時交通流量預測方法[J].計算機工程與設計,2019,40(9):2620-2624,2659.
[5] 葉景,李麗娟,唐臻旭.基于CNN-XGBoost的短時交通流預測[J].計算機工程與設計,2020,41(4):1080-1086.
[6] Zhang J B,Zheng Y,Qi D K,et al.DNN-based prediction model for spatio-temporal data[C]//Proceedings of the 24th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems.Burlingame California.NewYork,NY,USA:ACM,2016.
[7] Zhang J B,Zheng Y,Qi D K,et al.Predicting citywide crowd flows using deep spatio-temporal residual networks[J].Artificial Intelligence,2018,259:147-166.
[8] 徐冰冰,岑科廷,黃俊杰,等.圖卷積神經網絡綜述[J].計算機學報,2020,43(5):755-780.
[9] 徐先峰,黃劉洋,龔美.基于卷積神經網絡與雙向長短時記憶網絡組合模型的短時交通流預測[J].工業(yè)儀表與自動化裝置,2020(1):13-18.
[10] 陳喜群,周凌霄,曹震.基于圖卷積網絡的路網短時交通流預測研究[J].交通運輸系統(tǒng)工程與信息,2020,20(4):49-55.
[11] Yu B,Yin H T,Zhu Z X.Spatio-temporal graph convolutional networks:adeeplearning framework for traffic forecasting[C]//Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence.July13-19,2018.Stockholm,Sweden.California:International Joint Conferences on Artificial IntelligenceOrganization,2018.
[12] Wang X Y,Ma Y,Wang Y Q,et al.Traffic flow prediction via spatial temporal graph neural network[C]//Proceedingsof The Web Conference 2020.Taipei Taiwan.NewYork,NY,USA:ACM,2020.
[13] 杜圣東,李天瑞,楊燕,等.一種基于序列到序列時空注意力學習的交通流預測模型[J].計算機研究與發(fā)展,2020,57(8):1715-1728.
[14] Feng J,Li Y,Zhang C,et al.DeepMove:predicting human mobility with attentional recurrent networks[C]//Proceedings of the 2018 World Wide Web Conference on World Wide Web - WWW '18.April10-27,2018.Lyon,F(xiàn)rance.New York:ACMPress,2018:1459-1468.
[15] 鳳少偉,鳳超,申浩.基于K-means與GRU的短時交通流預測研究[J].計算機技術與發(fā)展,2020,30(7):125-129.
[16] Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[C]//Advances in neural information processing systems. 2017: 5998-6008.
[17] Song C,Lin Y F,Guo S N,et al.Spatial-temporal synchronous graph convolutional networks:anew framework for spatial-temporal network data forecasting[J].Proceedings of the AAAI Conference on Artificial Intelligence,2020,34(1):914-921.
【通聯(lián)編輯:唐一東】