付斌 朱煦晗 涂寧寧
(嵐圖汽車科技有限公司,武漢 430000)
主題詞:智能汽車 換道決策 XGBoost 貝葉斯優(yōu)化
換道決策是智能駕駛車輛換道過(guò)程中非常重要的一環(huán),也是智能駕駛領(lǐng)域的重點(diǎn)研究方向。國(guó)內(nèi)外很多學(xué)者針對(duì)智能駕駛汽車換道決策模型開(kāi)展了深入研究。目前,可以將換道決策模型分為基于規(guī)則的模型和基于人工智能的模型。
基于規(guī)則的模型即人工建立一系列換道規(guī)則,從而作出換道決策,但其無(wú)法適應(yīng)復(fù)雜的交通道路條件。人工智能算法具有強(qiáng)大的學(xué)習(xí)能力和分類能力,基于人工智能算法的換道模型成為主流研究方向。其中,神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練后可以很好地模擬人類的決策過(guò)程,因此被廣泛應(yīng)用。Hunt 等[1]首次將神經(jīng)網(wǎng)絡(luò)模型引入車輛換道決策過(guò)程,并證明了其可行性。Dumbuya 等[2]建立了一個(gè)三次網(wǎng)絡(luò)的網(wǎng)絡(luò)數(shù)據(jù)聚合(Networks Data Aggregation,NDA)模型,通過(guò)車輛位置、速度及交通車的信息即可輸出換道主車的目標(biāo)速度和方向。Meng 等[3]建立了分類回歸樹(shù)(Classification and Regression Tree,CART)模型對(duì)駕駛員的換道行為進(jìn)行預(yù)測(cè)。Dou等[4]利用支持向量機(jī)(Support Vector Machine,SVM)和神經(jīng)網(wǎng)絡(luò)建立了高速車輛換道決策模型。Schubert 等[5]將貝葉斯網(wǎng)絡(luò)(Bayesian Network,BN)用于換道決策模型中;Motamedidehkordi 等[6]建立了基于隨機(jī)森林(Random Forest,RF)的換道決策模型。目前,相比于基于規(guī)則的決策模型,基于人工智能的換道決策模型決策準(zhǔn)確率大幅提升,但其模型單一,缺少參數(shù)尋優(yōu)過(guò)程,決策準(zhǔn)確率仍有提升空間。本文基于貝葉斯優(yōu)化算法來(lái)優(yōu)化XGBoost模型的超參數(shù),以進(jìn)一步提高模型的決策準(zhǔn)確率。
美國(guó)交通運(yùn)輸部門(mén)的NGSIM(Next Generation Simulation)計(jì)劃提供了5組數(shù)據(jù)集,其中I-80和US-101為高速數(shù)據(jù)集,本文選取這2 個(gè)數(shù)據(jù)集作為研究對(duì)象,提取換道數(shù)據(jù)。圖1所示為I-80數(shù)據(jù)的采集路段[7]。
圖1 I-80數(shù)據(jù)采集路段示意
NGSIM 中的數(shù)據(jù)在采集過(guò)程中并未采用高精度定位,所以數(shù)據(jù)中存在一定的錯(cuò)誤和誤差,故本文采用Thiemann 提出的對(duì)稱指數(shù)移動(dòng)平均濾波(symmetric Exponential Moving Average filter,sEMA)算法[8]對(duì)數(shù)據(jù)進(jìn)行平滑處理。sEMA算法的公式為:
式中,xa(ti)、高高高高(ti),i∈[1,Na]分別為車輛a在ti時(shí)刻的測(cè)量值、擬合值;Na為車輛a軌跡數(shù)據(jù)點(diǎn)的數(shù)量;D=min{3,i-1,Na-1}為考慮數(shù)據(jù)邊界的平滑窗口寬度;Δ=T/dt為平滑寬度;dt=0.1 s為采樣頻率;T為平滑區(qū)域的采樣時(shí)間寬度,其取值隨濾波數(shù)據(jù)類別x的不同而不同,當(dāng)x對(duì)應(yīng)位置、速度、加速度數(shù)據(jù)時(shí),T分別取0.5 s、1.0 s、4.0 s;。
本文針對(duì)I-80數(shù)據(jù)集中的第1882號(hào)車輛數(shù)據(jù)進(jìn)行濾波處理,距離、速度、加速度如圖2所示。
圖2 1882號(hào)車行駛狀態(tài)信息濾波結(jié)果
本文研究智能駕駛汽車的換道行為,因此需從US-101 和I-80 數(shù)據(jù)集中提取有效的換道片段供訓(xùn)練模型使用。Wang 等[9]研究發(fā)現(xiàn),車輛的換道時(shí)間通常小于20 s,因此可認(rèn)為一個(gè)完整的換道過(guò)程時(shí)間為20 s,以車輛所在車道發(fā)生變化的時(shí)刻為中心時(shí)刻,向前、向后各取10 s,作為換道軌跡片段。此外,并非所有換道過(guò)程數(shù)據(jù)均可使用,在US-101和I-80中有些換道點(diǎn)靠前或靠后,導(dǎo)致前10 s 或后10 s 并沒(méi)有完整的10 s 數(shù)據(jù),故將滿足條件T0-10>Tstart且T0+10<Tend的換道軌跡視為有效換道軌跡,其中T0為車道編號(hào)變化的時(shí)刻,Tstart為換道起始時(shí)刻,Tend為換道終止時(shí)刻。圖3 展示了數(shù)據(jù)中有些車輛雖然發(fā)生了換道,但換道軌跡不完整的情況。
圖3 不完整的換道軌跡
此外,仍存在某些換道不成功的軌跡,本文采用KMeans聚類算法進(jìn)行換道軌跡的聚類,進(jìn)而從中分離出可用的換道軌跡。令第i段軌跡的橫向位移為一維列向量Xi=(xi(1),xi(2),…,xi(N)),其中xi(k)為第i段軌跡在第k個(gè)時(shí)間點(diǎn)的車輛橫向位移坐標(biāo),考慮到NGSIM 數(shù)據(jù)集的采樣周期是0.1 s,所以N=200。
聚類前對(duì)軌跡進(jìn)行標(biāo)準(zhǔn)化處理,并計(jì)算其間的歐氏距離:
2個(gè)軌跡之間的歐式距離可以表征其相似度,歐式距離小于相應(yīng)閾值,表明2個(gè)軌跡屬于同一類軌跡,KMeans計(jì)算聚類差異值的公式為:
式中,X為當(dāng)前計(jì)算的某一條換道軌跡;μ為聚類的中心集;μk為第k類的聚類中心;n為聚類的軌跡數(shù)量。
通過(guò)K-Means的聚類,可以分離出換道成功的軌跡和換道失敗的軌跡,如圖4 所示,該聚類結(jié)果是I-80 數(shù)據(jù)中17:00~17:15之間換道的數(shù)據(jù)。
圖4 換道軌跡聚類結(jié)果
提取到可用換道軌跡后,還需提取換道的起始點(diǎn),本文結(jié)合車輛換道時(shí)的橫向位移變化和橫向速度閾值來(lái)確定車輛換道的起始點(diǎn)。在判斷換道起點(diǎn)時(shí),以NGSIM數(shù)據(jù)集中車輛車道信息變化的時(shí)刻點(diǎn)為基礎(chǔ),向前回溯至車輛的橫向加速度極值點(diǎn),再以此點(diǎn)作為第2基礎(chǔ)點(diǎn)向后追溯,直到車輛的橫向加速度大于0.2 m/s2,本文以此點(diǎn)作為換道起始點(diǎn),如圖5所示。
圖5 換道起點(diǎn)判斷示意
車輛的換道行為受到多方因素的影響,不僅包括自車的速度、加速度等,還包括交通車的運(yùn)動(dòng)狀態(tài)等。車輛換道過(guò)程如圖6所示。
圖6 車輛自由換道行為示意
現(xiàn)有的換道決策算法中,對(duì)于換道決策變量的選取不同,本文結(jié)合其他文獻(xiàn),選取共17 個(gè)換道決策變量,可以包含自車和交通車的行駛狀態(tài):換道主車速度vs、換道主車加速度as、當(dāng)前車道前車與主車的縱向距離df=yf-ys、主車與當(dāng)前車道前車的速度差Δvf=vs-vf、主車與當(dāng)前車道前車的加速度差Δaf=as-af、主車與當(dāng)前車道前車的碰撞時(shí)間tf=(yf-ys)/(vs-vf)、當(dāng)前車道后車與主車的縱向距離dr=yr-ys、主車與當(dāng)前車道后車的速度差Δvr=vsvr、主車與當(dāng)前車道后車的加速度差Δar=as-ar、目標(biāo)車道前車與主車的縱向距離dtf=ytf-ys、主車與目標(biāo)車道前車的速度差Δvtf=vs-vtf、主車與目標(biāo)車道前車的加速度差Δatf=as-atf、主車與目標(biāo)車道前車的碰撞時(shí)間ttf=(ytf-ys)/(vs-vtf)、目標(biāo)車道后車與主車的縱向距離dtr=ytr-ys、主車與目標(biāo)車道后車的速度差Δvtr=vs-vtr、主車與目標(biāo)車道后車的加速度差Δatr=as-atr、主車與目標(biāo)車道后車的碰撞時(shí)間ttr=(ytr-ys)/(vs-vtr)。其中,yf、vf、af分別為當(dāng)前車道前車縱向坐標(biāo)、速度、加速度,ys為主車縱向坐標(biāo),yr、vr、ar分別為當(dāng)前車道后車縱向坐標(biāo)、速度、加速度,ytf、vtf、atf分別為目標(biāo)車道前車縱向坐標(biāo)、速度、加速度,ytr、vtr、atr分別為目標(biāo)車道后車縱向坐標(biāo)、速度、加速度。
本文選取Chen[10]提出的重要性評(píng)價(jià)指標(biāo)F-score對(duì)不同的決策變量進(jìn)行重要性分析排序,其具體計(jì)算公式為:
F-score 越大,說(shuō)明該特征作為決策變量的辨別能力越強(qiáng),其對(duì)決策行為貢獻(xiàn)程度越大。通過(guò)計(jì)算Fscore得到這17個(gè)變量的重要性如圖7所示。
圖7 特征變量的F-score分?jǐn)?shù)
貝葉斯優(yōu)化算法可以縮短優(yōu)化時(shí)間,適合解決非凸問(wèn)題,其計(jì)算過(guò)程為:
1:fort=1,2,…do
2:最大化采集函數(shù),得到下一個(gè)采樣點(diǎn):xt=argmaxμ(x|D1:t-1)
3:求得采樣點(diǎn)處的函數(shù)值yt=f(xt)
4:更新樣本集合D1:t={D1:t-1,(xt,yt)},并更新函數(shù)f的后驗(yàn)分布
5:end
在XGBoost決策模型中,有許多超參數(shù)可以自行設(shè)定,本文采用貝葉斯優(yōu)化算法對(duì)XGBoost的部分超參數(shù)進(jìn)行尋優(yōu),需尋優(yōu)的超參數(shù)如表1所示。
表1 XGboost需要尋優(yōu)的超參數(shù)
貝葉斯尋優(yōu)算法的迭代次數(shù)設(shè)定為50次,XGBoost超參數(shù)優(yōu)化過(guò)程如圖8 所示,隨著迭代次數(shù)的增多,接受者操作特性(Receiver Operating Characteristic,ROC)曲線的曲線下面積(Area Under Curve,AUC)逐漸升高且趨于穩(wěn)定。
圖8 基于貝葉斯優(yōu)化的XGBoost超參數(shù)優(yōu)化過(guò)程
經(jīng)過(guò)貝葉斯優(yōu)化算法優(yōu)化后,XGBoost 的超參數(shù)的最優(yōu)值如表2所示。
表2 最優(yōu)超參數(shù)
將超參數(shù)帶入XGBoost模型進(jìn)行驗(yàn)證,可以得到其交叉驗(yàn)證的曲線如圖9所示。
在圖9 中,優(yōu)化后測(cè)試集的AUC 顯著提升,且其與優(yōu)化后的訓(xùn)練集之差也明顯小于未經(jīng)優(yōu)化的訓(xùn)練集和測(cè)試集之差。其結(jié)果表明,優(yōu)化后,XGBoost 模型的過(guò)擬合現(xiàn)象降低,可以有效預(yù)測(cè)未知數(shù)據(jù),泛化能力提升。
圖9 XGBoost交叉驗(yàn)證曲線
本文選取經(jīng)貝葉斯優(yōu)化的XGBoost 決策模型進(jìn)行測(cè)試,同時(shí)與未經(jīng)優(yōu)化的XGBoost 模型、支持向量機(jī)模型、隨機(jī)森林模型和決策樹(shù)模型進(jìn)行比較分析。帶入相同的換道訓(xùn)練樣本集,可以得到不同決策模型在測(cè)試集中的ROC 曲線,如圖10 所示,其中假正類率表示模型預(yù)測(cè)為正類但實(shí)際為負(fù)類的樣本占所有實(shí)際為負(fù)類的樣本的比例,真正類率表示模型預(yù)測(cè)為正類且實(shí)際也為正類的樣本占所有實(shí)際為正類的樣本的比例。ROC 曲線下包絡(luò)的面積即AUC,AUC 越高,其預(yù)測(cè)效果越好。本文設(shè)計(jì)的貝葉斯優(yōu)化的XGBoost 決策模型的AUC值為0.925。
圖10 不同方法的預(yù)測(cè)ROC曲線
其不同換道決策模型的性能測(cè)試參數(shù)如表3所示。
表3 不同換道決策模型性能參數(shù)
對(duì)以上的換道決策模型進(jìn)行比較,可以明顯看出,經(jīng)過(guò)貝葉斯優(yōu)化的XGBoost 換道決策模型在各項(xiàng)指標(biāo)上均由于其他換道決策模型,提升約4%。
本文基于NGSIM數(shù)據(jù)集進(jìn)行換道訓(xùn)練測(cè)試數(shù)據(jù)的提取,選取XGBoost 決策模型設(shè)計(jì)換道決策算法,以貝葉斯優(yōu)化算法來(lái)優(yōu)化XGBoost決策模型的超參數(shù),在模型的訓(xùn)練過(guò)程中,充分考慮了換道的實(shí)際情況,選取了自車和其他交通車等多項(xiàng)運(yùn)動(dòng)參數(shù)作為決策變量,最終訓(xùn)練出的模型在US-101 和I-80 數(shù)據(jù)集中決策精確率和準(zhǔn)確率均在90%以上,本文設(shè)計(jì)的換道決策模型可為智能駕駛汽車自主換道設(shè)計(jì)提供參考。