孫博華,鄧偉文,朱 冰,吳 堅,王姍姍
(吉林大學(xué) 汽車仿真與控制國家重點實驗室, 長春 130022)
當(dāng)無人駕駛智能汽車在結(jié)構(gòu)化道路上行駛時,交通車輛運動意圖不確定性作為交通環(huán)境主要不確定源之一,對控制系統(tǒng)決策規(guī)劃提出了巨大挑戰(zhàn),已成為影響智能汽車安全性的重要問題。因此,日益受到各國學(xué)者的廣泛關(guān)注[1-3]。
目前典型的車輛運動意圖辨識方法,主要在彎道、直線或坡道等特定工況下,通過辨識車輛的轉(zhuǎn)向、油門、制動等操縱意圖,來表征車輛的運動意圖,如基于多維高斯的轉(zhuǎn)向意圖辨識方法[4]、基于Hilbert-Huang的制動意圖辨識方法[5]和基于雙層隱馬爾科夫的轉(zhuǎn)向加速意圖辨識[6]等。上述方法在解決交通車輛運動意圖不確定性辨識問題時,會出現(xiàn)由于各種道路拓?fù)浣Y(jié)構(gòu)下車輛耦合區(qū)域數(shù)量趨于無限大,導(dǎo)致交通車輛運動意圖辨識模型無上界的問題,使得辨識模型精度不足,模型普適性和模型規(guī)??煽匦暂^差,在部分工況下甚至無法為智能汽車控制系統(tǒng)提供有效解[7]。
本文提出一種基于反應(yīng)式行為的車輛運動意圖辨識策略。通過對車輛運動意圖進(jìn)行描述與分類,建立基于多維高斯隱馬爾科夫過程的反應(yīng)式車輛運動意圖模型;搭建車輛運動意圖信息采集系統(tǒng),分別在T形路、環(huán)島、直線路3種典型工況下進(jìn)行數(shù)據(jù)采集;利用采集數(shù)據(jù)對反應(yīng)式車輛運動意圖模型進(jìn)行訓(xùn)練和辨識測試,并通過正交試驗對模型關(guān)鍵參數(shù)進(jìn)行優(yōu)化。該方法辨識過程不依賴于特定工況,可在全工況條件下為智能汽車決策與規(guī)劃提供準(zhǔn)確、可靠的交通車輛運動意圖信息,辨識方法具有普適性和規(guī)模可控性。
傳統(tǒng)的車輛運動意圖辨識策略將車輛的運動意圖定義為車輛運動意圖子模型的集合:
Im={i1,i2,…,im}
(1)
式中:Im為車輛運動意圖子模型集合,下角標(biāo)m代表車輛運動意圖子模型數(shù)目。
每一個子模型分別對應(yīng)一個車輛的隱目的地:
Hg={h1,h2,…,hg}
(2)
式中:Hg為車輛運動隱目的地集合,下角標(biāo)g代表在主車與交通車輛的特定行為耦合區(qū)域中,交通車輛運動隱目的地數(shù)目。
設(shè)在全部道路拓?fù)浣Y(jié)構(gòu)上主車與交通車輛產(chǎn)生行為耦合的區(qū)域集合為:
RA,j={RA,k,k=1,2,…,j}
(3)
式中:RA,k為行為耦合區(qū)域集合,下角標(biāo)k代表行為耦合區(qū)域數(shù)目。則主車與交通車輛在任意RA,k上,均對應(yīng)一組交通車輛的隱目的地集合,記為RA,k→Hg,k。
可得所有道路拓?fù)浣Y(jié)構(gòu)上交通車輛的運動意圖模型集合為:
(4)
顯然,在所有道路拓?fù)浣Y(jié)構(gòu)上,主車與交通車輛行為耦合區(qū)域的個數(shù)j趨近于無窮,則RA,j是無上界變量,對應(yīng)Hg,k→,即當(dāng)j→時,Im→。傳統(tǒng)車輛運動意圖辨識模型會出現(xiàn)隨耦合區(qū)域數(shù)量的增加而無限延展的情況。
為提高辨識模型的普適性和模型規(guī)模的可控性,本文通過判斷RA,j集合中交通車輛的反應(yīng)行為建立車輛運動意圖模型。如圖1所示,當(dāng)主車和交通車輛沿T形路行駛時,交通車輛會受到主車運動態(tài)勢的影響,產(chǎn)生避讓、猶豫、保持等反應(yīng)行為,可以通過辨識這些反應(yīng)行為來辨識交通車輛的運動意圖。
在空間演化上,主車與交通車輛的運動均可看作其在特定道路拓?fù)浣Y(jié)構(gòu)上的平面運動,即存在縱向和側(cè)向兩個方向的相對運動意圖;在時間演化上,交通車輛的反應(yīng)行為可以看作是本車狀態(tài)s0及其與主車相對狀態(tài)ds0相互作用的響應(yīng)結(jié)果。
因此,交通車輛的運動意圖可以表示為:
Im={Ilon,Ilat}=
{f(s0,lon,ds0,lon),f(s0,lat,ds0,lat)}
(5)
式中:Ilon和Ilat分別為交通車輛的縱向和側(cè)向運動意圖集合。
由于s0與ds0均不受道路拓?fù)浣Y(jié)構(gòu)約束,所以總可以找到一個有界的反應(yīng)式運動意圖集合建立車輛運動意圖模型。這種通過辨識交通車輛的反應(yīng)來描述車輛運動意圖的方式更具有普適性。
在任意道路拓?fù)浣Y(jié)構(gòu)行為耦合區(qū)域RA,k中,在主車刺激作用下,交通車輛會通過感知、推理和判斷等內(nèi)在狀態(tài)產(chǎn)生外在反應(yīng)式運動意圖,通過聚類,交通車輛的縱向和側(cè)向反應(yīng)行為意圖均可以歸納為:
(1)漸遠(yuǎn)意圖:交通車輛的運動意圖受到主車影響,產(chǎn)生躲避主車的反應(yīng)行為。
(2)猶豫意圖:交通車輛的運動意圖受到主車影響,產(chǎn)生猶豫判斷和動態(tài)微調(diào)的反應(yīng)行為。
(3)保持意圖:交通車輛的運動意圖不受主車影響,保持運動趨勢不變的反應(yīng)行為。
(4)漸近意圖:交通車輛的運動意圖受到主車影響,產(chǎn)生具有侵略性的漸近反應(yīng)行為,試圖對主車運動進(jìn)行抑制。
因此,反應(yīng)式車輛運動意圖可以表示為:
(6)
式中:下角標(biāo)FA、HT、NM、CI分別代表漸遠(yuǎn)、猶豫、保持和漸近運動意圖。
交通車輛在特定運動意圖下的自身狀態(tài)s0及與主車的相對狀態(tài)ds0為一組時間連續(xù)的觀測序列,且具有影響下一時刻內(nèi)在狀態(tài)的作用,故可以采用隱馬爾科夫過程(Hidden Markov process, HMP)對交通車輛的反應(yīng)式運動意圖進(jìn)行辨識。
本文采用多維高斯模型表示觀察量的概率密度函數(shù)[8],應(yīng)用多維高斯隱馬爾科夫過程(Multi-dimension Gaussian hidden Markov process, MGHMP)建立反應(yīng)式車輛運動意圖模型(Reaction motion intention model, RMIM),如圖2所示。
圖2反應(yīng)式車輛運動意圖模型
Fig.2Reactionmotionintentionmodelofobstaclevehicle
模型包含車輛縱向反應(yīng)行為運動意圖RMIMlon,r和側(cè)向反應(yīng)行為運動意圖RMIMlat,s兩個模塊,其中下角標(biāo)r=1,2,3,4;s=1,2,3,4分別代表縱向和側(cè)向的漸遠(yuǎn)、猶豫、保持和漸近等4個運動意圖子模型,每一個交通車輛運動意圖子模型均等價于一個MGHMP。
RMIM模型的輸入數(shù)據(jù)應(yīng)能夠表達(dá)交通車輛反應(yīng)式運動意圖的激勵特征,同時還應(yīng)考慮數(shù)據(jù)維度對計算時間的影響。因此,車輛縱向反應(yīng)行為運動意圖模塊選取縱向速度Vx,縱向加速度Ax,縱向相對位移DDlon和縱向相對速度DVlon等4維輸入。車輛側(cè)向反應(yīng)行為運動意圖模塊選取橫擺角速度AVz,側(cè)向速度Vy,側(cè)向加速度Ay,側(cè)向相對位移DDlat和側(cè)向相對速度DVlat等5維輸入。
RMIM模型中的各個子模型均等價于MGHMP過程。MGHMP過程包含一組N維隱狀態(tài)qt及每一狀態(tài)下κ組可能的觀察值輸出[9]。RMIM模型精度隨MGHMP階數(shù)的增加而提高,但階數(shù)過高會大大降低計算速度??紤]到主車與交通車輛運動模式的時間序列,其下一時刻的運動狀態(tài)主要受到上一時刻運動狀態(tài)的影響,故RMIM子模型采用從左至右結(jié)構(gòu)的一階馬爾科夫過程。
初始狀態(tài)分布定義為:
π={πi}
(7)
其中:
πi=P[q1=i]
(8)
1≤i≤N
狀態(tài)轉(zhuǎn)移概率矩陣定義為:
A={aij}
(9)
其中:
aij=P[qt+1=j|qt=i]
(10)
1≤i,j≤N
式中:qt表示t時刻的狀態(tài)。
O為一組可觀測序列集合,O={V1,V2,…,Vκ},V代表可能的觀察值,下角標(biāo)κ為每一狀態(tài)對應(yīng)的可能觀察值數(shù)目。
設(shè)狀態(tài)j的觀察概率矩陣為B={bj(O)},由于在連續(xù)觀測序列中κ→+,故B={bj(O)}為狀態(tài)j輸出的觀察值概率密度函數(shù)[4],表達(dá)式如下:
(11)
1≤j≤N
式中:cjk為第j個狀態(tài)第k次混合的混合權(quán)重系數(shù);M表示高斯混合數(shù);N(O|μjk,Σjk)表示均值為μ、協(xié)方差為Σ的高斯分布概率密度函數(shù)。
權(quán)重系數(shù)cjk滿足:
(12)
cjk≥0,1≤j≤N,1≤k≤M
(13)
1≤j≤N
故RMIM的子模型可以由N個隱狀態(tài)通過一個元組λ定義:
λ=(π,A,c,μ,Σ)
(14)
辨識過程中,RMIM子模型分別輸出交通車輛反應(yīng)式運動意圖模型概率,采用對數(shù)似然率表示所得結(jié)果:
Loglik(θ)=ln[P(O|λ)]
(15)
分別選取縱、側(cè)向子模型中最大似然函數(shù)值對應(yīng)的反應(yīng)行為意圖作為當(dāng)前時刻交通車輛的縱、側(cè)向運動意圖。
為采集用于反應(yīng)式車輛運動意圖模型訓(xùn)練的數(shù)據(jù),同時保證試驗的可操作性和可重復(fù)性,基于dSPACE Simulator實時仿真系統(tǒng)和PanoSim汽車智能駕駛仿真平臺建立了駕駛?cè)嗽诃h(huán)車輛運動意圖數(shù)據(jù)采集系統(tǒng),原理如圖3所示[10]。
圖3 車輛運動意圖數(shù)據(jù)采集系統(tǒng)Fig.3 Data acquisition platform for vehiclemotion intention
PanoSim汽車智能駕駛仿真平臺是本團(tuán)隊自主研發(fā)的集車輛動力學(xué)、三維行駛環(huán)境、交通和車載環(huán)境傳感模型等于一體的大型汽車模擬仿真軟件平臺,具有試驗設(shè)置主界面、車輛編輯器、場景編輯器、相機(jī)雷達(dá)安裝器、畫圖與動畫工具和模型自動生成工具等6大功能模塊,可實現(xiàn)高精度的車輛動力學(xué)模擬、道路與場景模擬、交通車輛模擬、雷達(dá)與相機(jī)模擬、無線通信模擬、天氣模擬等,可簡便、直觀地構(gòu)建交通場景,并能提供各種視角的動畫顯示,支持純軟件仿真、硬件在環(huán)仿真和駕駛員在環(huán)仿真,便于進(jìn)行車輛運動意圖數(shù)據(jù)采集。
選用dSPACE DS1006系統(tǒng)作為實時仿真模型處理器,并實時接收由真實油門踏板、制動踏板和SensoWheel力矩方向盤輸入的真實駕駛員操縱信息,據(jù)此實時運行PanoSim軟件模型,可以得到交通車輛狀態(tài)信息以及與主車的相對狀態(tài)信息。
綜合考慮道路拓?fù)浣Y(jié)構(gòu)的多樣性、主車和交通車輛空間相對位置等因素,選取道路軸線夾角α為銳角的T形路、環(huán)島、α角為零的直線路等3種典型工況進(jìn)行車輛運動意圖數(shù)據(jù)采集試驗,如圖4所示。試驗時,在PanoSim軟件中預(yù)先設(shè)定工況環(huán)境,令主車采用恒定速度沿圖4中實線路徑行駛。
圖4 車輛運動意圖數(shù)據(jù)采集工況Fig.4 Test scenarios for vehicle motionintention data collection
選取5名駕齡為2~8年的駕駛員進(jìn)行車輛運動意圖數(shù)據(jù)采集,每名駕駛員在圖4所示的3種典型工況下分別完成主車與交通車輛行為互不影響和主車與交通車輛行為相互影響兩種情況的駕駛,如圖4中虛線所示,每種工況分別測試10次。記錄RMIM模型所需的本車狀態(tài)信息以及與主車相對狀態(tài)信息,共計得到300組數(shù)據(jù)樣本。
所采數(shù)據(jù)量綱不同會導(dǎo)致數(shù)值數(shù)量級存在較大差異,易影響RMIM模型訓(xùn)練時參數(shù)矩陣的非奇異性,故將各輸入?yún)?shù)進(jìn)行歸一化處理,在直線路、環(huán)島和T形路下分別選取典型數(shù)據(jù),如圖5所示。
圖5 典型的歸一化后的試驗采集數(shù)據(jù)Fig.5 Normalized input data of the test data
反應(yīng)式車輛運動意圖模型訓(xùn)練及辨識流程如圖6所示。
圖6 RMIM模型訓(xùn)練及辨識流程圖Fig.6 Training and identification processfor RMIM model
采用Baum-Welch方法[11]對RMIM模型進(jìn)行訓(xùn)練,獲取交通車輛縱、側(cè)向運動意圖模型參數(shù)。用于訓(xùn)練的樣本數(shù)共180組,為采集數(shù)據(jù)量的3/5。訓(xùn)練時,首先將試驗數(shù)據(jù)進(jìn)行篩選和分類,交通車輛縱向和側(cè)向反應(yīng)行為意圖分類原則如表1所示,其中,當(dāng)1.9 s內(nèi)模型中縱、側(cè)向加速度的波形出現(xiàn)至少兩次周期性變化時被視為小波動情況。由表1可見,交通車輛運動意圖的分類與道路拓?fù)浣Y(jié)構(gòu)及特定道路拓?fù)浣Y(jié)構(gòu)下的任意行為耦合區(qū)域均無關(guān),僅與當(dāng)前時刻交通車輛狀態(tài)及主車與交通車輛相對狀態(tài)有關(guān)。
表1 模型訓(xùn)練數(shù)據(jù)分類原則Table 1 Classification principles of model training data
給定模型的隱狀態(tài)維數(shù)、訓(xùn)練時間長度和高斯混合數(shù),對交通車輛的縱、側(cè)向運動意圖分別進(jìn)行訓(xùn)練,即可得到RMIM各子模型對應(yīng)的模型參數(shù):
λlon,r=(πr,Ar,cr,μr,Σr)
(16)
r=1,2,3,4
λlat,s=(πs,As,cs,μs,Σs)
(17)
s=1,2,3,4
利用訓(xùn)練得到的模型參數(shù),采用滾動時間窗方法進(jìn)行交通車輛運動意圖的辨識。將辨識數(shù)據(jù)輸入RMIM模型,分別計算各子模型對數(shù)似然率,選取當(dāng)前窗口縱、側(cè)向子模型中最大似然函數(shù)值對應(yīng)的反應(yīng)行為意圖作為當(dāng)前時刻交通車輛的縱、側(cè)向運動意圖。將每次窗體計算的結(jié)果與實際情況進(jìn)行對比,累加所有正確的窗體數(shù),即可得出辨識準(zhǔn)確率。
模型辨識過程中,多維高斯混合數(shù)M、MGHMP過程對應(yīng)的隱狀態(tài)維數(shù)N、模型訓(xùn)練時間長度以及辨識時采用的滾動窗體長度是影響辨識結(jié)果的4個主要因素,采用正交試驗方法對這4個因素進(jìn)行優(yōu)化分析,建立L9(34)標(biāo)準(zhǔn)正交表,如表2所示。
表2 正交試驗因素水平表Table 2 Factor level table of orthogonal experiment
(18)
由正交試驗結(jié)果可知,在交通車輛縱側(cè)向運動意圖的辨識結(jié)果中,主次因素順序均為A、B、C、D;分別選擇縱向辨識情況下的A3B3C2D1組合,及側(cè)向辨識時情況下的A3B3C3D3組合時,車輛運動意圖辨識準(zhǔn)確率最高。綜上可知,A和B的最優(yōu)組合均為A3B3組合;作為次要因素的C和D,其最優(yōu)組合應(yīng)為訓(xùn)練時間C大于窗體長度D的組合,選擇C2D1或C3D3組合均可,最終選擇A3B3C2D1作為交通車輛縱側(cè)向運動意圖辨識的正交優(yōu)化參數(shù)組合。
表3 縱向運動意圖辨識結(jié)果Table 3 Longitudinal motion intention identification results
表4 側(cè)向運動意圖辨識結(jié)果Table 4 Lateral motion intention identification results
利用選定的參數(shù)組合,對T形路工況交通車輛運動意圖進(jìn)行辨識,場景如圖7所示,主車與交通車輛均沿T形路行駛,在T形路口后,交通車輛駛?cè)胫鬈囓嚨啦⒃谥鬈嚽巴蛑本€行駛,窗體滾動速度為0.1s/次。
圖7 T形路工況交通車輛運動意圖辨識場景Fig.7 Test scenario of obstacle vehicle motionintention identification in T-junction
交通車輛縱向運動意圖辨識結(jié)果如圖8所示。如圖8可見,開始的10個時間窗內(nèi),交通車輛沿T形路向前行駛,交通車輛與主車分別處在不同道路上,交通車輛呈現(xiàn)縱向保持運動意圖;在10~48個時間窗內(nèi),在T形路口交通車輛轉(zhuǎn)向并超過主車的過程中,交通車輛呈現(xiàn)縱向漸近運動意圖。當(dāng)交通車輛超過主車后的48~230個時間窗內(nèi),交通車輛超過主車并依次呈現(xiàn)縱向漸遠(yuǎn)、猶豫和保持運動意圖。經(jīng)計算,該T形路工況下對應(yīng)的交通車輛縱向運動意圖的辨識準(zhǔn)確率為99.4%。
圖8 交通車輛縱向運動意圖辨識結(jié)果Fig.8 Identification results of obstacle vehiclelongitudinal motion intention
交通車輛側(cè)向運動意圖辨識結(jié)果如圖9所示。
圖9 交通車輛側(cè)向運動意圖辨識結(jié)果Fig.9 Identification results of obstacle vehiclelateral motion intention
由圖9可見,開始的10個時間窗內(nèi),交通車輛沿T形路向前行駛,交通車輛與主車分別處在不同道路上,交通車輛呈現(xiàn)側(cè)向漸近運動意圖。在10~48個時間窗內(nèi),在T形路口交通車輛轉(zhuǎn)向并超過主車的過程中,交通車輛呈現(xiàn)側(cè)向漸近和保持運動意圖,且以側(cè)向漸近反應(yīng)運動意圖為主。當(dāng)交通車輛超過主車后的48~230個時間窗內(nèi),交通車輛呈現(xiàn)側(cè)向漸遠(yuǎn)運動意圖。經(jīng)計算,該T形路工況下對應(yīng)的交通車輛側(cè)向運動意圖的辨識準(zhǔn)確率為99.5%。
綜上,基于RMIM模型的交通車輛運動意圖辨識方法不依賴于特定工況,可在較大距離范圍內(nèi)為主車提供準(zhǔn)確的交通車輛運動意圖信息,可有效提高智能汽車的安全性,該辨識方法具有普適性和規(guī)??煽匦浴?/p>
交通車輛運動意圖不確定性是交通環(huán)境的主要不確定源,對無人駕駛智能汽車的安全決策規(guī)劃提出了巨大挑戰(zhàn)。本文提出了一種基于反應(yīng)式行為的車輛縱、側(cè)向運動意圖辨識策略,建立了基于多維高斯隱馬爾科夫過程的反應(yīng)式車輛運動意圖模型,搭建了駕駛?cè)嗽诃h(huán)的車輛運動意圖信息采集系統(tǒng),分別在T形路、環(huán)島、直線路3種典型工況下進(jìn)行了數(shù)據(jù)采集,利用采集的試驗數(shù)據(jù)對RMIM模型進(jìn)行了訓(xùn)練和辨識測試,通過正交試驗對模型關(guān)鍵參數(shù)進(jìn)行了優(yōu)化匹配分析。辨識結(jié)果表明,通過合理選擇參數(shù)組合,辨識準(zhǔn)確率可以達(dá)到99%以上。同時,該方法辨識過程不依賴于特定工況,可在全工況條件下為智能汽車決策與規(guī)劃提供準(zhǔn)確、可靠的交通車輛運動意圖信息,辨識方法具有普適性和規(guī)??煽匦?。
[1] Brechtel S, Gindele T, Dillmann R. Probabilistic decision making under uncertainty for autonomous driving using continuous pomdps[C]∥The 17th International IEEE Conference on Intelligent Transportation Systems (ITSC), IEEE, 2014: 392-399.
[2] Bai H, Cai S, Ye N, et al. Intention-aware online POMDP planning for autonomous driving in a crowd[C]∥The IEEE International Conference on Robotics and Automation (ICRA), Seattle,Washington, 2015: 454-460.
[3] Cai Shao-jun. Online pomdp planning for vehicle navigation in densely populated area[D]. Guangzhou: South China University of Technology, 2014 .
[4] 呂岸, 胡振程, 陳慧. 基于高斯混合隱馬爾科夫的高速公路超車行為辨識與分析[J]. 汽車工程, 2010, 32(7): 630-634.
Lv An, Hu Zhen-cheng, Chen Hui. Recognition and analysis on highway overtaking behavior based on Gaussian mixture-hidden Markov model [J]. Automotive Engineering, 2010, 32(7): 630-634.
[5] 唐先智, 王波, 楊樹軍, 等. 基于Hilbert-Huang變換的制動意圖聚類識別[J]. 汽車工程, 2016, 38(5): 580-586.
Tang Xian-zhi, Wang Bo, Yang Shu-jun, et al. Cluster identification of braking intention based on Hilbert-Huang transform [J]. Automotive Engineering, 2016, 38(5): 580-586.
[6] 王暢. 基于隱形馬爾科夫模型的駕駛員意圖辨識方法研究[D]. 長春: 吉林大學(xué)汽車工程學(xué)院, 2011.
Wang Chang. Research on driving intention identification based on hidden Markov model [D]. Changchun: College of Automotive Engineering, Jilin University, 2011.
[7] Urmson C, Anhalt J, Bagnell D, et al. Autonomous driving in urban environments: boss and the urban challenge [J]. Journal of Field Robotics, 2008, 25(8): 425-466.
[8] Rabiner Lawrence R. A tutorial on hidden Markov models and selected applications in speech recognition [J]. Proceeding of the IEEE, 1989, 77(2):257-286.
[9] Reynolds D A, Rose R C. Robust text-independent speaker identification using Gaussian mixture speaker models [J]. IEEE Transaction on Speech and Audio Processing, 1995, 3(1):72-83.
[10] 朱冰, 賈曉峰, 王御, 等. 基于雙dSPACE的汽車動力學(xué)集成控制快速原型試驗[J]. 吉林大學(xué)學(xué)報:工學(xué)版, 2016, 46(1): 8-14.
Zhu Bing, Jia Xiao-feng, Wang Yu, et al. Rapid prototype test for integrated vehicle dynamic control using tow dSPACE simulators [J]. Journal of Jilin University (Engineering and Technology Edition), 2016, 46(1): 8-14.
[11] Baum L E, Petrie T. Statistical inference for probabilistic functions of finite state Markov chains [J]. The Annals of Mathematical Statistics, 1966, 37: 1554-1563.