呂炎明 趙治宇 鄶世揚
(北京交通大學(xué)軟件學(xué)院 北京市 100091)
自動駕駛技術(shù)是基于人工智能、道路勘測等技術(shù)于一體的綜合技術(shù),是當(dāng)前道路交通科學(xué)研究領(lǐng)域繞不開的熱門課題,基于該技術(shù)的各種特定場景下的優(yōu)化模型層出不窮。汽車跟馳(Car-Following, CF)是該研究領(lǐng)域的核心場景之一,也是道路交通過程中最普遍存在的情況,汽車跟馳的主要任務(wù)是控制車速以保持安全舒適的跟車間隙。汽車跟馳的速度與間隙控制有利于減輕駕駛員的工作量、改善交通安全并增強道路通行能力。而通過模仿人類駕駛車輛的跟馳行為,應(yīng)用自動駕駛技術(shù)的汽車可以習(xí)得一定車輛跟馳能力。
基于該命題的研究,科學(xué)界已經(jīng)有比較清晰的研究方向和相對成熟的解決方案,其大多將場景定義為時序問題,利用RNN 等循環(huán)神經(jīng)網(wǎng)絡(luò)來訓(xùn)練智能體,因為RNN 天生的循環(huán)自回歸的結(jié)構(gòu)是對時間序列的很好的表示。Alahi 等首次提出RNN 的變體,基于長短時記憶(Long Short Term Memory, LSTM)的軌跡預(yù)測方法,將軌跡設(shè)立為一種時序問題,根據(jù)過去一段時間步長的軌跡序列預(yù)測未來的軌跡。Zhang 等通過使用LSTM,將車輛的跟馳行為(CF)與換道行為(Lane-Changing, LC)同時進(jìn)行建模,提出了一種不同于多次訓(xùn)練LSTM 模型(Retrained LSTM)的混合再訓(xùn)練約束(HRC)方法來進(jìn)一步優(yōu)化LSTM 模型。劉創(chuàng)等人提出將LSTM 網(wǎng)絡(luò)處理的車輛歷史軌跡信息作為全局特征,通過卷積池化來提取信息用于軌跡預(yù)測。Cho等提出了改良RNN的門控循環(huán)單元(Gated Recurrent Unit, GRU)。Wang等提出利用GRU 對汽車跟馳行為進(jìn)行建模,考慮駕駛員的記憶因素,并將其引入到模型中。費蓉等提出建立新的一種基于GRU 的車輛跟馳模型,獲得了較好的仿真度與穩(wěn)定性。
與之相比,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)一般被認(rèn)為不太適合時序問題的建模,這主要由于其卷積核大小的限制,不能很好的抓取長時的依賴信息。由此,傳統(tǒng)的卷積網(wǎng)絡(luò)并沒有被用來解決車輛跟馳問題。但近年來,由Bai 等提出的基于因果卷積、空洞卷積和殘存鏈接的時序卷積神經(jīng)網(wǎng)絡(luò)(Temporal Convolutional Network, TCN)可以被用來解決時序問題,并且在許多應(yīng)用場景上取得了與RNN、LSTM、GRU 等循環(huán)神經(jīng)網(wǎng)絡(luò)同等甚至更優(yōu)秀的表現(xiàn)。于是我們提出了將TCN 引入自動駕駛領(lǐng)域并將其應(yīng)用于車輛跟馳模型的研究,并通過實驗比較說明其與許多得到廣泛應(yīng)用的傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)建模方式在相同場景下的表現(xiàn)差異。
本文的剩余部分組成如下:第二節(jié)詳細(xì)介紹了車輛跟馳模型,TCN 網(wǎng)絡(luò)的組成結(jié)構(gòu)及項目采用的數(shù)據(jù)集NGSIM;第三節(jié)研究了本文網(wǎng)絡(luò)模型的輸入輸出,網(wǎng)絡(luò)參數(shù)及數(shù)據(jù)處理,并使用數(shù)據(jù)集中的i-80 路段對模型進(jìn)行訓(xùn)練和評估,通過us-101 路段的數(shù)據(jù)及HighD 數(shù)據(jù)集的數(shù)據(jù)研究了模型的泛化能力;第四節(jié)研究總結(jié)了項目的主要結(jié)論及未來的研究方向。
跟馳模型描述了跟馳車輛(Following Vehicle, FV)響應(yīng)引導(dǎo)車輛(Leading Vehicle, LV)的動作的運動,它們是微觀道路交通場景的重要組成部分,并且為自動駕駛車輛跟馳系統(tǒng)的理論提供了參考。早期的車輛跟馳模型是純數(shù)學(xué)演算的公式模型,該模型存在車輛跟馳的效率低、車輛行為預(yù)測效果差等特點。近年來,得益于人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)、強化學(xué)習(xí)等技術(shù)常應(yīng)用于車輛跟馳模型的研究,取得了一定進(jìn)展,目前主要應(yīng)用的神經(jīng)網(wǎng)絡(luò)模型有RNN、LSTM、GRU 等。
時序卷積神經(jīng)網(wǎng)絡(luò)(TCN)是卷積神經(jīng)網(wǎng)絡(luò)(CNN)的一種,是基于因果卷積(Causal Convolution)、空洞卷積(Dilated Convolution)和殘差鏈接(Residual Connections)的一種新型神經(jīng)網(wǎng)絡(luò)。
2.2.1 因果卷積
TCN 有兩個重要特征,一是其具有相同的輸入和輸出長度,二是其模型預(yù)測只會受到歷史數(shù)據(jù)的影響而不會受到未來數(shù)據(jù)的滲透,后者是卷積網(wǎng)絡(luò)用于解決時序問題的關(guān)鍵。因果卷積可以用(公式1)直觀表示。即對卷積網(wǎng)絡(luò)中每一層t 時刻的權(quán)重變化p 只來自其上一層的t 時刻及之前時刻節(jié)點的p 權(quán)重變化。作為一種單向的網(wǎng)絡(luò)結(jié)構(gòu),其存在使得整個卷積網(wǎng)絡(luò)的訓(xùn)練是以數(shù)據(jù)的時間屬性為基準(zhǔn),不會出現(xiàn)未來影響過去的情況,是一種嚴(yán)格的時間約束模型,因此被稱為因果卷積。
Causal Convolutions:
公式 1 因果卷積
2.2.2 空洞卷積
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)不能被應(yīng)用于時序問題的重要原因,是建?;诘臅r間步長受限于卷積核的大小,如果要想抓取更長的依賴關(guān)系,就需要線性的堆疊很多的網(wǎng)絡(luò)層,使得網(wǎng)絡(luò)體積過大或很難收斂。為了解決這一問題,TCN 采用了空洞卷積的方式,即通過對輸入數(shù)據(jù)指數(shù)級逐層間隔采樣,從而實現(xiàn)用較少的網(wǎng)絡(luò)層數(shù)獲得較大的感受野,具體的實現(xiàn)方法如(公式 2)所示,其中F 是我們定義的對序列元素s 的卷積運算,f 是一個過濾器,k 是過濾器的大小,d 是我們給定的擴張因子,s-d·i 說明過去的方向。(圖1)也能很好地說明該卷積方式。
圖1: TCN 網(wǎng)絡(luò)的空洞卷積結(jié)構(gòu)
Dilated Convolution:
公式 2 空洞卷積
2.2.3 殘差鏈接
對于深層的神經(jīng)網(wǎng)絡(luò),隨著網(wǎng)絡(luò)深度的不斷提高,獲取的信息量會逐層減少。TCN 通過構(gòu)建殘差鏈接來實現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)中跨層的傳遞信息,防止信息丟失。在本網(wǎng)絡(luò)結(jié)構(gòu)中,我們添加了一個殘差塊(Residual Block)以替代一層卷積。殘差塊擁有兩層的卷積和非線性映射,對于殘差塊中的每一層,我們添加了Dropout 層并進(jìn)行了權(quán)重值歸一化處理來將網(wǎng)絡(luò)正則化,提高網(wǎng)絡(luò)的泛化能力。
隨著智能交通系統(tǒng)的發(fā)展,NGSIM(Next Generation Simulation)數(shù)據(jù)集是美國FHWA 搜集的美國高速公路行車數(shù)據(jù)。數(shù)據(jù)集采集于美國的四個不同地區(qū),分別是加州南向的US-101 號公路,加州洛杉磯的Lankershim Boulevard 地圖,加州埃默里維爾的東向的 I-80 號公路,以及佐治亞州亞特拉大的Peachtree Street。該數(shù)據(jù)集覆蓋了結(jié)構(gòu)化道路的路口,高速上下閘道等車路協(xié)同研究的熱點區(qū)域。其數(shù)據(jù)是采用攝像頭獲取,得到了道路上的所有車輛在一個時間段的車輛行駛狀況。再通過對原始的視頻信息做后處理,加工成一條一條的軌跡點記錄,生成了交通流中每輛車的行駛軌跡數(shù)據(jù)。我們的項目依托NGSIM 進(jìn)行數(shù)據(jù)的分析和問題的研究。
我們的實驗聚焦簡單跟馳場景下不同網(wǎng)絡(luò)(TCN 和RNN、LSTM、GRU)之間的預(yù)測準(zhǔn)確性、收斂速率與泛化能力。在實驗場景一致的前提下,網(wǎng)絡(luò)中的各個非核心參數(shù)盡量保持統(tǒng)一,并通過實驗選取該場景下最優(yōu)的核心參數(shù),以保證該網(wǎng)絡(luò)在給定場景下的預(yù)測準(zhǔn)確性達(dá)到最高。
為研究簡單跟馳場景下后車根據(jù)跟馳前車時對自身情況的預(yù)測能力,本文研究就該場景建立TCN 預(yù)測模型,項目實驗情景模擬如圖2 所示。模型輸出層輸出為當(dāng)前車下一幀在x 及y 軸上的坐標(biāo)(x, y),模型的輸入為該時刻當(dāng)前車的x,y 坐標(biāo)、速度、加速度,被跟馳車的x,y 坐標(biāo)、速度、加速度,共8 項參數(shù)。輸入層的歷史數(shù)據(jù)seq_len 定義為80,對應(yīng)實際的8 秒時間。
圖2: 車輛跟馳場景模擬
TCN 模型作為一種深度學(xué)習(xí)算法,需要訓(xùn)練包含一段較長時間的車輛跟馳行為的大量數(shù)據(jù)。因此,我們采用NGSIM 中的i-80 路段的數(shù)據(jù)集來訓(xùn)練集成模型。其軌跡數(shù)據(jù)是2005 年4 月13 日在加州埃默里維爾的舊金山灣區(qū)i-80公路東行處獲得的。調(diào)查區(qū)域長約500 米(1640 英尺),行車方向由南向北,平均流量為7124 veh/h, 平均車速為8.32 m/s,由6 條高速公路車道組成,其中包括最右側(cè)的一條集散車道,為典型的交通擁堵狀態(tài),因此我們選取該路段數(shù)據(jù)進(jìn)行分析??紤]到最左側(cè)車道存在頻繁變道等現(xiàn)象,數(shù)據(jù)集中Lane_id 在2 到5 之間的中間車道被用于訓(xùn)練網(wǎng)絡(luò)模型。對于每輛車來說,我們提取了與該車輛在同一車道,相距100m 內(nèi)(因為常用傳感器如LIDAR 或RADAR 的距離為60-175 米)最近的前車數(shù)據(jù),其中兩車應(yīng)保持至少持續(xù)80 幀、間距不長于100m 的不變道跟馳行為。對于跟馳時間長于80 幀的數(shù)據(jù),我們截取了其中前80 幀數(shù)據(jù)并每隔10幀再次截取80 幀數(shù)據(jù)作為新的一段跟馳行為數(shù)據(jù)。最終我們得到了192307 段汽車跟馳事件,其中3/4 的數(shù)據(jù)用于訓(xùn)練模型,1/4 的數(shù)據(jù)用于測試模型。
與其他深度學(xué)習(xí)的網(wǎng)絡(luò)模型類似,在TCN 模型中,許多參數(shù)都會影響模型的性能。對于單一網(wǎng)絡(luò)在該跟車場景下最優(yōu)參數(shù)的尋找,我們通過執(zhí)行多組對照實驗,改動不同組實驗中的單一變量,尋找最優(yōu)參數(shù)。對于每一個模型,我們在該場景下進(jìn)行了多組實驗?zāi)M,通過比較最終預(yù)測結(jié)果準(zhǔn)確性的方式給出各模型在該場景下的最優(yōu)參數(shù),并盡量保證不同網(wǎng)絡(luò)非核心參數(shù)的一致性。以TCN 網(wǎng)絡(luò)為例,我們通過調(diào)整卷積核大小k_nize,隱藏層數(shù)量level,隱藏層中神經(jīng)元數(shù)量n_hid 和數(shù)據(jù)訓(xùn)練參數(shù)更新周期epoch,尋找神經(jīng)網(wǎng)絡(luò)收斂速度、最終模型預(yù)測效果等綜合最優(yōu)的一組參數(shù),作為TCN 網(wǎng)絡(luò)的最優(yōu)參數(shù),用于其與其他網(wǎng)絡(luò)模型進(jìn)行比較。如表1 所示。
根據(jù)不同參數(shù)下多輪數(shù)據(jù)訓(xùn)練及測試,當(dāng)k_nize 為4,level 為4,n_hid 為32,epoch 為10 時,網(wǎng)絡(luò)模型具有最小的均方誤差(MSE),在后續(xù)的訓(xùn)練中,我們使用該參數(shù)作為TCN 網(wǎng)絡(luò)模型的參數(shù),除此之外,根據(jù)車輛跟馳的實際情況及數(shù)據(jù)集特點,我們確立了TCN 網(wǎng)絡(luò)模型的各項參數(shù)(表2)。
表2: TCN 網(wǎng)絡(luò)各項參數(shù)
3.4.1 預(yù)測準(zhǔn)確率與收斂速度
我們?nèi)∮昧薸-80 路段的跟車對標(biāo)簽集,將80 幀作為時間步長,實驗比較了各網(wǎng)絡(luò)在該時間步長的模型大小下經(jīng)過一定輪數(shù)的訓(xùn)練達(dá)到的最優(yōu)預(yù)測能力。以前80 個連續(xù)時間單位的前車與后車的x 與y 坐標(biāo)、加速度與速度這個八個維度作為輸入,以第81 時間點的后車位置坐標(biāo)作為輸出,對模型進(jìn)行訓(xùn)練,并使用mse 損失函數(shù)對訓(xùn)練得到的網(wǎng)絡(luò)的預(yù)測效果進(jìn)行評價,得到各網(wǎng)絡(luò)在相同測試數(shù)據(jù)集下的loss,如(表3),并在測試數(shù)據(jù)集中隨機選取了200 個測試數(shù)據(jù)進(jìn)行預(yù)測并繪制預(yù)測曲線圖,結(jié)果如(圖3)??梢钥吹?,與其他網(wǎng)絡(luò)模型相比,TCN 網(wǎng)絡(luò)的預(yù)測結(jié)果更接近真實數(shù)據(jù)。我們記錄了網(wǎng)絡(luò)訓(xùn)練過程中的loss 值,并繪制曲線比較網(wǎng)絡(luò)收斂速率(圖3),可以看到,TCN 在1 ~2 輪訓(xùn)練后已經(jīng)有較低的loss 了,而其他網(wǎng)絡(luò)還需要重復(fù)訓(xùn)練幾遍才能達(dá)到相對不錯的效果。
圖3: 各網(wǎng)絡(luò)模型loss 曲線與預(yù)測曲線
表 1:TCN 網(wǎng)絡(luò)參數(shù)效率對比
表 3:時序網(wǎng)絡(luò)模型效率對比
3.4.2 泛化能力
HighD 數(shù)據(jù)集是德國高速公路的大型自然車輛軌跡數(shù)據(jù)集。我們將數(shù)據(jù)訓(xùn)練得到的網(wǎng)絡(luò)預(yù)測NGSIM 數(shù)據(jù)集中us-101 路段、HighD 數(shù)據(jù)集中01_highway 路段的車輛跟馳行為,以考察各個網(wǎng)絡(luò)的泛化能力。我們在測試數(shù)據(jù)集中隨機選取了符合條件的50 個測試用例,用實驗訓(xùn)練完成的各網(wǎng)絡(luò)模型預(yù)測其跟馳行為,比較loss 大小,并繪制曲線比較預(yù)測結(jié)果(圖4)。可以看到,各網(wǎng)絡(luò)模型在us-101 路段、01_highway 路段下均具有較高的車輛行為還原度。其中, TCN網(wǎng)絡(luò)模型對于數(shù)據(jù)的預(yù)測最接近真實值,具有最好的車輛行為還原度。該實驗說明了與其他網(wǎng)絡(luò)模型相比,TCN 具有較好的泛化能力且其泛化能力優(yōu)于其他模型。
圖4: 各網(wǎng)絡(luò)模型泛化能力對比圖
作為主流的自動駕駛理論研究場景和典型的時間序列問題,跟馳模型的優(yōu)化具有重要意義。本文將TCN 引入跟馳模型的研究,將卷積網(wǎng)絡(luò)引入自動駕駛汽車車輛軌跡模型優(yōu)化的研究,并通過實驗證明了其可應(yīng)用性及相對較高的準(zhǔn)確性和穩(wěn)定性,為上述問題的研究提供了新思路、新方法,相信時序卷積網(wǎng)絡(luò)模型會在自動駕駛研究領(lǐng)域大放異彩。