高建設(shè),柏海艦
(合肥工業(yè)大學(xué) 汽車與交通工程學(xué)院,安徽 合肥 230009)
由于機器學(xué)習(xí)的快速發(fā)展,機器學(xué)習(xí)模型已被應(yīng)用在很多領(lǐng)域,如自然語言處理、機器翻譯、語音識別、手寫識別及視頻標(biāo)記等模型中[1~4]。在跟馳模型研究中,有較多學(xué)者使用NGSIM數(shù)據(jù)集[5]訓(xùn)練模型,通過學(xué)習(xí)人的駕駛行為去再現(xiàn)真實交通流現(xiàn)象,然而評價模型的方法仍比較傳統(tǒng)和單一,如軌跡層面的均方誤差對比等方法。傳統(tǒng)的評價方式是將學(xué)習(xí)到的模型進行單一軌跡仿真,與真實軌跡在空間位置維度上使用均方誤差進行對比,進而比較模型的優(yōu)劣。該模型存在的問題主要有兩個方面:首先,原始軌跡不一定是一條值得學(xué)習(xí)的軌跡,由于人的行為具有一些隨機因素在其中,單個個體的駕駛行為也很難一直保持不變;其次,駕駛行為也不能單純地使用位置偏差來評判,應(yīng)結(jié)合速度或加速度進行綜合評判。
Parham[6]使用支持向量回歸方法,采用加速度的相關(guān)系數(shù)(R)和均方誤差(MSE)作為評價標(biāo)準(zhǔn),仿真發(fā)現(xiàn)SVR模型得出的跟馳反應(yīng)時間和軌跡數(shù)據(jù)更接近真實數(shù)據(jù)。Alireza[7]建立人工神經(jīng)網(wǎng)絡(luò)模型,并將駕駛員的瞬時反應(yīng)時間加入到輸入端,輸出后車的加速度,使用平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)、標(biāo)準(zhǔn)差(SDE)與真實數(shù)據(jù)進行對比。Gao[8]使用逆強化學(xué)習(xí),通過建立R函數(shù)的方式使車輛可以進行一系列連續(xù)的控制過程。M. Zhu[9]使用真實跟馳數(shù)據(jù)校準(zhǔn)深度強化學(xué)習(xí)模型,學(xué)習(xí)人類的駕駛行為,并使用均方根百分比誤差(RMSPE)進行速度及位置上的誤差分析。Daniel Meyer-Delius[10]使用隱馬爾可夫模型,證明了后驗概率作為選擇兩個競爭情境模型標(biāo)準(zhǔn)的有效性。Z. He[11]使用K近鄰模型去學(xué)習(xí)真實數(shù)據(jù)集,在位移上使用相對誤差(RE)進行對比,驗證了該模型可使用在交通流仿真中。YANG[12]結(jié)合了Gipps模型去除軌跡中的不安全行為,不斷完善數(shù)據(jù)集去訓(xùn)練隨機森林模型,使用平均絕對誤差(MAE)和平均絕對相對誤差(MARE)來對比速度誤差。M. Zhou[13]建立了最經(jīng)典的循環(huán)神經(jīng)網(wǎng)絡(luò)模型去學(xué)習(xí)人類駕駛行為數(shù)據(jù),得出的模型比IDM等模型更接近真實軌跡,比照方法為均方誤差(MSE)。X. Huang[14]使用LSTM神經(jīng)網(wǎng)絡(luò)得出的模型,驗證模型可以再現(xiàn)走走停停的交通現(xiàn)象,使用的軌跡評價標(biāo)準(zhǔn)包括相關(guān)系數(shù)(R)和速度與車頭間距的均方誤差(MSE)。上述學(xué)者在進行仿真軌跡評價時大多使用了軌跡層面的誤差分析,和原始軌跡進行加速度、速度及位置上的對比,但此評價方式存在兩方面的問題:一是原始軌跡不一定值得模型去學(xué)習(xí);二是考慮的因素單一且獨立,無法全面評價一條軌跡的駕駛行為。以上問題的存在使得該模型效果不顯著。
采用機器學(xué)習(xí)模型來學(xué)習(xí)跟馳數(shù)據(jù),學(xué)到的是多數(shù)人的行為,所以模型的仿真軌跡應(yīng)當(dāng)更大眾化。本文提出使用多元高斯模型來評價模型的軌跡仿真效果,將車頭間距和前后車相對速度作為自變量,計算每一時刻的車頭間距和相對速度在全體樣本中出現(xiàn)的概率值,并以此概率值作為軌跡優(yōu)劣的評判標(biāo)準(zhǔn)。
多元高斯模型常被應(yīng)用于異常識別[15-16],在跟車行為中,每一個駕駛員主要根據(jù)自身和前車的距離、與前車的相對速度來采取相對應(yīng)的動作,所以本文將車頭間距和相對速度作為評判駕駛員駕駛行為的標(biāo)準(zhǔn)。因此,建立的多元高斯模型自變量就是車頭間距和相對速度,并未將跟馳車輛的速度考慮在內(nèi),速度的大小主要取決于車流是否擁堵,不能反映駕駛?cè)说母Y行為。多元高斯模型需要自變量都服從高斯分布,兩個自變量的頻率分布如圖1所示,從圖1可以看出,相對速度比較符合高斯分布的特點,車頭間距的數(shù)據(jù)將其取對數(shù)后,使用高斯分布進行擬合。
圖1 車頭間距對數(shù)和相對速度頻率分布
建立的模型為
x=[ln (Δx),Δv]T.
(1)
式中:x為多元高斯模型自變量,Δx為車頭間距,Δv為相對速度。
(2)
在仿真軌跡中每一個時間步都可使用此模型來計算概率值P(x)。
機器學(xué)習(xí)跟馳模型需要位置、速度及加速度信息,速度和加速度分別通過對位移進行一階和二階差分獲得,由于差分次數(shù)越多誤差越大,所以NGSIM數(shù)據(jù)集顯得精度不足,需要對數(shù)據(jù)集進行平滑等方面的預(yù)處理。本文使用對稱指數(shù)滑動平均方法進行軌跡數(shù)據(jù)平滑,數(shù)據(jù)的處理步驟如下。
步驟1:使用對稱指數(shù)滑動平均(sEMA)平滑車輛軌跡沿前進方向的位移數(shù)據(jù);
步驟2:分別使用一階差分和二階差分,獲得車輛在每個時間步(0.1 s)的速度和加速度;
步驟3:通過步驟1和步驟2對數(shù)據(jù)的處理,發(fā)現(xiàn)處理后的速度和加速度會在首端和末端的小范圍內(nèi)產(chǎn)生突變,突變的原因是這部分?jǐn)?shù)據(jù)平滑窗口比較小,所以要剔除每個軌跡第一秒和最后一秒的軌跡數(shù)據(jù)。
對稱指數(shù)滑動平均(sEMA)公式為
(3)
其中
(4)
平滑寬度為
(5)
依照以上步驟處理的軌跡速度和加速度軌跡時空如圖2所示,描述兩條軌跡的時間-位移變化。圖3為軌跡速度時間圖,描述兩條軌跡的速度隨時間變化情況。圖4為軌跡加速度時間圖,描述的是兩條軌跡加速度隨著時間的變化情況。從圖4可以看出,加速度的變化區(qū)間基本穩(wěn)定在-4~4 m/s2之間,符合現(xiàn)實場景中的駕車數(shù)據(jù)。
圖2 軌跡時空
圖3 軌跡速度時間
圖4 軌跡加速度時間
本文使用的機器學(xué)習(xí)模型為K近鄰回歸模型,該模型已被廣泛應(yīng)用于各種分類和回歸任務(wù)[17-18]。將K近鄰回歸模型做簡單介紹,樣本總量為N,xi為樣本中第i個樣本的特征數(shù)據(jù)(輸入數(shù)據(jù)),本文選擇的輸入數(shù)據(jù)有3個,分別為車頭間距、相對速度和后車速度。yi為第i個樣本的屬性值(輸出數(shù)據(jù)),本文的跟馳模型選擇跟馳車輛下一個時刻的加速度作為輸出數(shù)據(jù)。待預(yù)測樣本為x,表示輸出樣本距離與之最近的K個樣本屬性的加權(quán)平均值。K近鄰回歸模型有3個超參數(shù)需要調(diào)節(jié):k值的抉擇,樣本間距離的度量模式,樣本距離的加權(quán)方式。k值選擇測試集中均方誤差趨于平穩(wěn)值,樣本距離度量方式選用歐式距離,樣本屬性值的加權(quán)方式采用樣本間歐式距離的倒數(shù)進行加權(quán),計算式為
xi=[Δx,Δv,v],
(6)
dij=‖xi-xj‖,
(7)
(8)
k值的選擇使用均方誤差作為評價標(biāo)準(zhǔn),通過比較選取200個不同的k值得到模型的均方誤差。從圖5可以看出,均方誤差隨著k值的增加而降低,當(dāng)k值大于100時下降趨勢基本趨于平穩(wěn),所以本文中k值取100。
圖5 MSE變化趨勢
仿真軌跡的獲得方法有兩種:第一種方法是假設(shè)一直給出前車的軌跡,通過模型生成跟隨者的軌跡;另一種方法是通過數(shù)據(jù)僅確定第一個前車和所有追隨者的初始/邊界條件,并通過模型計算一組后續(xù)車輛軌跡[21]。本文的軌跡仿真均采用第一種方法,仿真公式為
at+1=KNN(Δxt,Δvt,vt),
(9)
vt+1=vt+at+1·Δt,
(10)
xt+1=xt+vt·Δt+0.5·at+1·Δt2.
(11)
仿真效果如圖6所示,1 732~1 739和503~538為原始數(shù)據(jù)中的前車與后車編號。圖6(a)中的仿真軌跡更接近真實軌跡,說明相比圖6(b)而言,圖6(a)的軌跡更接近真實數(shù)據(jù)。跟馳模型要考慮的不僅有安全性還有效率,從圖6(b)真實軌跡可以看出,后車與前車的車頭間距較大,而且是在較低的車速下行駛,雖然安全性較高,但影響到整個交通流的效率,所以可認(rèn)為該駕駛軌跡不是一個值得去學(xué)習(xí)的軌跡模型。圖7中起點為軌跡中起點的車頭間距和相對速度聯(lián)合坐標(biāo),原始數(shù)據(jù)中心點為樣本中車頭間距和相對速度的均值點。圖7(a)中仿真軌跡明顯比真實數(shù)據(jù)偏離數(shù)據(jù)中心點多,而圖7(b)中的仿真軌跡不斷接近樣本中心,真實軌跡不斷偏離樣本中心。從這個角度看,應(yīng)該給圖6(a)的仿真軌跡低于真實軌跡的評價,使圖6(b)的仿真軌跡評價高于原始軌跡,但傳統(tǒng)的均方誤差和相關(guān)系數(shù)方法已經(jīng)不再適用,所以需要使用前面介紹的多元高斯模型來重新評價軌跡。
圖6 仿真軌跡
圖7 軌跡在樣本中趨勢
使用多元高斯模型重新評估圖6的兩條軌跡,結(jié)果如圖8所示,虛線代表的是真實軌跡在每一個時間步的多元高斯模型概率值變化曲線,實線代表的是K近鄰模型的仿真軌跡在每一個時間步的概率值變化曲線。從圖8(a)可以看出,在1 732~1 739的真實軌跡和仿真軌跡對比中,仿真軌跡的大部分時間步概率值要小于真實軌跡的概率值,說明仿真軌跡沒有真實軌跡好。圖8(b)503~538軌跡中雖然仿真軌跡偏離真實軌跡較多,但仿真軌跡的大部分時間步概率值都比真實軌跡高,說明仿真軌跡更接近樣本中心。
圖8 多元高斯模型軌跡評價
表1中,MSEx代表位移的均方誤差,MSEv代表速度的均方誤差,Rv代表速度的相關(guān)系數(shù),Ra代表加速度的相關(guān)系數(shù),均方誤差越小,相關(guān)系數(shù)越大,說明仿真軌跡越接近真實軌跡。從表1的數(shù)據(jù)可以看出,MSEx,MSEv,Rv和Ra4個指標(biāo)都說明1 732~1 739軌跡的仿真結(jié)果更接近真實數(shù)據(jù),但相比503~538,多元高斯模型計算出來的概率要更小。從整體數(shù)據(jù)角度看,軌跡的車頭間距和相對速度越接近樣本中心越好,因為更靠近大部分人的駕駛行為??梢园l(fā)現(xiàn),并不是與真實軌跡對比誤差越小說明仿真軌跡就越好,原因是原始軌跡可能并不是一條值得模型去學(xué)習(xí)的軌跡,原始軌跡可能在效率和安全性方面沒有做好平衡。
表1 多種評價方式對比
通過表2可以看出,部分仿真軌跡在全樣本數(shù)據(jù)上的概率值比原始軌跡高,通過多元高斯模型的計算可知仿真軌跡比原始軌跡好。此模型可以將概率值比原始軌跡高的仿真軌跡重新加入樣本數(shù)據(jù),來擴充和優(yōu)化數(shù)據(jù)集,部分學(xué)者在研究基于數(shù)據(jù)的跟馳模型時已經(jīng)考慮到對于原始數(shù)據(jù)集的擴充和改進問題[22],如果使用該模型評價軌跡的優(yōu)劣就可以將仿真概率大于原始軌跡的數(shù)據(jù)加入到原始數(shù)據(jù)中,并進行重新訓(xùn)練。
表2 多元高斯模型評價的仿真軌跡與真實軌跡平均概率值對比
跟馳數(shù)據(jù)的清洗工作已經(jīng)有學(xué)者研究,文獻[23]將車頭時距和速度差作為判斷自由流和跟馳狀態(tài)的依據(jù)。由于現(xiàn)實交通流中出現(xiàn)一些危險或者低效率的駕駛行為,但安全性和效率又是很難通過人為平衡的兩個屬性,在進行人為軌跡篩選時可根據(jù)車頭間距來篩選去掉車頭間距小的不安全行為和間距過大的低效率行為,標(biāo)準(zhǔn)難以界定。目前的大多研究將人的駕駛行為分為激進型、普通型和保守型[24-25],激進型駕駛風(fēng)格具有高效率的同時也具有高風(fēng)險,保守型駕駛風(fēng)格在具有高度安全性的同時也犧牲了效率,所以也無法根據(jù)這種分類方法進行軌跡篩選。研究發(fā)現(xiàn),將多元高斯模型應(yīng)用于跟馳數(shù)據(jù)清洗的方法更具科學(xué)性,可通過設(shè)定軌跡概率閾值來篩選軌跡。圖9為當(dāng)閾值為0.1時進行軌跡篩選所得的車頭間距-相對速度圖,原始數(shù)據(jù)集共有1 030條軌跡,閾值大于0.1的軌跡有521條,小于0.1的軌跡有509條。從圖9的展示結(jié)果看,軌跡的篩選工作已經(jīng)不可以簡單地使用車頭間距這一指標(biāo)進行軌跡篩選,因為軌跡數(shù)據(jù)已經(jīng)出現(xiàn)較多交叉現(xiàn)象。
圖9 平均概率軌跡
圖10展示的是根據(jù)不同的閾值篩選剩余的軌跡數(shù)量;圖11展示的是根據(jù)不同的閾值篩選后剩余軌跡的方差變化。從圖11中可以看出,隨著篩選閾值的增加,車頭間距方差和相對速度方差都會不斷減小,說明該篩選方法可使樣本中駕駛行為越來越趨于穩(wěn)定,證明該種篩選數(shù)據(jù)的方法更具有合理性。
圖10 剩余軌跡數(shù)量隨閾值變化
圖11 方差隨閾值變化
1)多元高斯模型的評價方法與傳統(tǒng)均方誤差等評價指標(biāo)相比,主要有兩個方面的改進:一是該模型從全樣本數(shù)據(jù)集角度評價模型仿真軌跡的優(yōu)劣;二是綜合考慮了更多因素,加入了前后車的相對速度,能更詳盡地描述駕駛行為。
2)該模型以單條軌跡概率作為評價指標(biāo),現(xiàn)實中部分駕駛員的駕駛行為屬于異常軌跡,可使用該方法過濾數(shù)據(jù)集,選擇一個概率閾值對原始數(shù)據(jù)集進行清洗,使得基于數(shù)據(jù)的跟馳模型避免學(xué)習(xí)到一些不安全或低效率的駕駛行為。