李文禮,李 超,李中峰,易 帆,李 安
(1.重慶理工大學(xué) 汽車零部件先進(jìn)制造技術(shù)教育部重點實驗室,重慶 400054;2.重慶長安汽車股份有限公司,重慶 400020)
自動駕駛汽車仿真測試需對場景進(jìn)行精準(zhǔn)的形式化描述[1],學(xué)者們對測試場景和評價方法進(jìn)行了大量研究。
在測試場景生成方面,主要包括組合方法、隨機(jī)采樣法、聚類、優(yōu)化搜索、重要性采樣及深度強(qiáng)化學(xué)習(xí)等。王榮等[2]基于標(biāo)準(zhǔn)法規(guī),通過挑選與組合基本場景要素,生成多維度測試內(nèi)容,并組合測試環(huán)境得到測試場景,但不依據(jù)數(shù)據(jù)直接對場景進(jìn)行組合,生成的測試場景與實際出入較大;劉康[3]基于PICT 對換道參數(shù)進(jìn)行組合,得到換道邏輯場景參數(shù),但該方法可能得到大量不合理、同質(zhì)化場景;M.SHAHIN等[4]通過聚類算法將十字路口交通事故數(shù)據(jù)聚類,得到非嚴(yán)重與嚴(yán)重事故兩類測試場景;C.E.TUNCALI等[5]定義TTC與相對速度之和這一目標(biāo)函數(shù),優(yōu)化搜索模型得到目標(biāo)函數(shù)值,但僅用TTC等指標(biāo)不能完全反映真實場景的高維復(fù)雜特性;周文帥等[6]在蒙特卡洛隨機(jī)采樣的基礎(chǔ)上,通過描述模型中的參數(shù)分布進(jìn)行重要性采樣,在隨機(jī)采樣的基礎(chǔ)上有效提高了高風(fēng)險場景的覆蓋度,但采樣過程往往無法創(chuàng)造新場景;李江坤等[7]提出了基于場景動力學(xué)和深度強(qiáng)化學(xué)習(xí)的邊緣場景生成方法,在場景的覆蓋度、可重復(fù)測試等方面具有良好性能,但易生成同質(zhì)化場景,無法提高場景多樣性。
在評價方面,目前主流的評價集結(jié)模型包括模糊綜合評價、灰色關(guān)聯(lián)法、逼近理想解排序法(TOPSIS)、加權(quán)算術(shù)評價法、耦合聚類法及反向傳播神經(jīng)網(wǎng)絡(luò)法等。王成壯[8]通過層次分析法(AHP)與專家打分的模糊綜合分析相結(jié)合,對控制算法進(jìn)行了安全性評價,但主觀性較強(qiáng);魏子茹等[9]利用CRITIC權(quán)重法與灰色關(guān)聯(lián)度模型相結(jié)合評價場景;戴劍勇等[10]利用PPR計算網(wǎng)絡(luò)中心指標(biāo)權(quán)重,結(jié)合TOPSIS方法對高速公路交通事故風(fēng)險因素重要度進(jìn)行了排序;ZHAO Yanan等[11]將屬性指標(biāo)設(shè)定為車輛完成任務(wù)的成本函數(shù),將熵權(quán)法與加權(quán)平均算法相結(jié)合,對車輛的任務(wù)完成度進(jìn)行評價;朱冰等[12]通過耦合聚類得到場景危險率參數(shù)來評價自動駕駛的安全性,但缺乏通用性;陳君毅等[13]利用客觀指標(biāo)作為輸入,主觀評價結(jié)果作為輸出建立了BP神經(jīng)網(wǎng)絡(luò)評價模型,但模型非公式化結(jié)果,不同對象評價結(jié)果的差異緣由無法得知,且主觀性較強(qiáng)。
綜上,筆者以研究自動駕駛汽車在匝道匯入過程中的安全性為目標(biāo),通過采集匝道車輛匯入行駛數(shù)據(jù),在固定功能場景的前提下篩選出匝道匯入交互邏輯動態(tài)場景要素,利用聚類得到兩類典型測試場景用于自動駕駛汽車仿真中行駛參數(shù)設(shè)置,以模擬真實道路行駛狀態(tài);同時,提出了一種客觀評價模型,將灰色關(guān)聯(lián)度模型與核密度估計模型相融合,通過擬合估計匯入車輛真實指標(biāo)數(shù)據(jù),確定匝道匯入安全性指標(biāo)最優(yōu)閾值。該閾值在灰色關(guān)聯(lián)評價模型中取代傳統(tǒng)的專家意見,能更準(zhǔn)確地評價仿真車輛的匝道匯入安全性;最后利用模糊綜合分析主觀評價模型驗證此模型的準(zhǔn)確性及有效性。
數(shù)據(jù)采集設(shè)備為“DJI Mini 2”無人機(jī),工作頻率為5.725~5.850 GHz,錄像分辨率為4k/24 fps,單次飛行時間為30 min,視頻格式為MP4。采集地點為重慶華陶立交匝道,拍攝區(qū)域覆蓋合流區(qū),如圖1。
圖1 無人機(jī)采集示意Fig.1 UAV acquisition diagram
采集時間避開高峰段,分布在10:00—17:00,共采集7次,將采集的視頻通過軟件進(jìn)行自動標(biāo)注,標(biāo)注范圍為橫坐標(biāo)位于25~325 m,交互區(qū)域為100~260 m。整理得到507條有效匯入軌跡數(shù)據(jù),累計2.592×105幀。原始數(shù)據(jù)存在較大波動,為便于研究對原始數(shù)據(jù)進(jìn)行3-σ原則異常值剔除和Savitzky-Golay濾波。由此得到平滑后的數(shù)據(jù),具體包括:追蹤編號ID、時間t、位置坐標(biāo)(x,y)、前車編號ID、車道ID等如表1。
表1 部分駕駛數(shù)據(jù)Table 1 Partial driving data
在測試場景生成中,為保證環(huán)境信息與道路信息的不變,同時引入自車及前車的速度、自車交互區(qū)域(交互區(qū)域)、匯入車道及駛離車道等邏輯場景要素進(jìn)行場景聚類。參照SHRP2[14]篩選危險工況的方法,從采集數(shù)據(jù)中得到匯入工況片段289例。
針對得到的289例有效匝道匯入工況,因類例數(shù)較少,選擇系統(tǒng)聚類生成測試場景。筆者的聚類要素中的環(huán)境信息與道路信息已固定,只聚類自車信息、周車信息、交通信息等。因碰撞時間(time-to-collision,tTTC)等指標(biāo)為評價指標(biāo),為不影響最優(yōu)閾值提取,統(tǒng)計時不考慮在內(nèi)。最終得到12類匯入(場景)要素,用編碼1~5代替各要素變量,如表2。
表2 各要素變量數(shù)量表Table 2 Quantity table of each factor variable
步驟1用絕對值距離計算多名義尺度、二值名義尺度的變量間距,并對連續(xù)變量(速度、距離)做歸一化處理,保證多名義尺度、二值名義尺度及連續(xù)變量的變量間距都為1。
步驟2計算樣本間距離選擇閔可夫斯基距離,如式(1):
(1)
式中:xij為樣本i的j個數(shù)據(jù);xi′j為將xij標(biāo)準(zhǔn)化處理以后的標(biāo)準(zhǔn)值;p為樣本數(shù)量;q為參量,q=1時,dii′(q)為絕對值距離,m。
步驟3計算類之間的距離通常使用類平均法,如式(2):
(2)
聚類時應(yīng)當(dāng)排除某一要素中單個變量占95%以上的場景要素[15],如車輛類型中轎車占98%則直接作為聚類結(jié)果,聚類過程形成的樹狀圖見圖2,圖中縱軸表樣本間的距離(無綱量),橫軸表示樣本編號。
圖2 各案例聚類Fig.2 Cluster diagram of each case
不一致系數(shù)可以用來確定分類個數(shù),計算發(fā)現(xiàn)最后一次不一致系數(shù)增幅最大,故選擇聚類個數(shù)為2類。將聚類結(jié)果中的名義變量在每類中的占比與此類變量在總體變量中所占比例比較,比例較高的作為聚類結(jié)果,連續(xù)變量取當(dāng)前類所有值的平均值,最終得到典型的匝道匯入場景,如表3。將其結(jié)果用于后文自動駕駛車輛測試場景的搭建和車輛測試參數(shù)的設(shè)定。
確定測試場景及車輛測試參數(shù)后,需建立自動駕駛汽車安全性評價體系,對其匝道匯入過程的安全性進(jìn)行評價。其原理為通過評價目標(biāo)或?qū)ο蟮男阅軈?shù)和實際表現(xiàn)等,建立一維或多維指標(biāo)體系,通過多種賦權(quán)方法對指標(biāo)體系賦權(quán),并利用定性或者定量評價模型劃分等級或得出精確數(shù)值,來反映評價目標(biāo)或?qū)ο蟮男阅軆?yōu)劣。
表3 聚類分析典型匝道匯入場景Table 3 Cluster analysis of typical ramp merging scenarios
基于此,筆者利用重要性分析得到匯入過程與駕駛安全相關(guān)性高的指標(biāo)體系,通過AHP和CRITIC主客觀結(jié)合賦權(quán)法對指標(biāo)體系進(jìn)行賦權(quán),結(jié)合核密度估計模型與灰色關(guān)聯(lián)理論模型,得到基于駕駛數(shù)據(jù)驅(qū)動的客觀評價模型。
評價指標(biāo)體系指通過車輛的行駛參數(shù)得到不同指標(biāo)并用來評價車輛不同性能。在篩選過程中,盡可能選擇信息量大、與測試場景關(guān)聯(lián)性高的指標(biāo),這樣可以更準(zhǔn)確有效地反映車輛在測試場景中性能,具體表現(xiàn)為車輛決策后發(fā)生改變的量化數(shù)據(jù),如碰撞時間(tTTC)、后侵入時間(tPET)及車頭時距(tTHW)等。同時匝道匯入過程中,過高或過低的通過性都容易引起碰撞事故,故筆者以匯入安全性為目標(biāo),以安全性指標(biāo)和通過性指標(biāo)為主,將自動駕駛汽車匝道匯入安全性評價作為目標(biāo)層,將行駛安全性、通過高效性作為總指標(biāo)層,并通過重要性分析得到指標(biāo)層的具體指標(biāo),如圖3。
圖3 評價指標(biāo)體系Fig.3 Evaluation index system
利用客觀CRITIC法確定對應(yīng)指標(biāo)權(quán)重,用層次分析法(AHP)確定總指標(biāo)層權(quán)重。使用這樣的賦權(quán)方法一方面能避免賦權(quán)的主觀性,另一方面又能考慮會對指標(biāo)權(quán)重產(chǎn)生影響的數(shù)據(jù)波動性與數(shù)據(jù)間相關(guān)關(guān)系,使所求指標(biāo)權(quán)重更加準(zhǔn)確客觀。
灰色系統(tǒng)指人們通過信息不能充分認(rèn)知的的系統(tǒng),自動駕駛車輛的評價指標(biāo)繁雜,無法面面俱到,與灰色系統(tǒng)十分類似,故灰色關(guān)聯(lián)理論被廣泛應(yīng)用在車輛的評價之中。其結(jié)果由事物間的關(guān)聯(lián)程度或影響程度——灰色關(guān)聯(lián)度來決定,當(dāng)輸入序列曲線與參考序列曲線相似程度越近時,其灰色關(guān)聯(lián)度也就越大,反之則越小,具體計算步驟如下:
步驟1確定參考序列R0,即指標(biāo)最優(yōu)閾值,由核密度估計模型給出。
步驟2確定評價指標(biāo)的比較序列矩陣,假設(shè)同一輛車在同一場景下進(jìn)行了m次實驗,共有n個評價指標(biāo),比較序列矩陣為(Rij)m×n。Rij表示在i次實驗時輸出的指標(biāo)數(shù)據(jù)j。
步驟3當(dāng)存在R1j與R2j分別在最優(yōu)值兩端時,存在正向指標(biāo)R2j>R1j時其關(guān)聯(lián)系數(shù)反而小的情況,故因?qū)⒈容^序列正向化,保證所有值在最優(yōu)值的一側(cè),負(fù)向指標(biāo)亦如此,如式(3)、式(4):
(3)
(4)
步驟4使用均值法對各指標(biāo)值進(jìn)行無量綱處理,如式(5)、式(6):
(5)
(6)
步驟5計算關(guān)聯(lián)系數(shù)ξi(j),如式(7):
ξi(j)=[miniminj|X0(j)-Xi(j)|+ρ·maximaxj|X0(j)-Xi(j)|]/[|X0(j)-Xi(j)|+ρ·maximaxj|X0(j)-Xi(j)|]
(7)
式中:ρ為分辨系數(shù),一般取0.5。
步驟6計算總指標(biāo)得分,根據(jù)筆者構(gòu)建的評價體系為多層評價體系,將關(guān)聯(lián)度與指標(biāo)層權(quán)重wj和總指標(biāo)層進(jìn)行累計加權(quán)平均,得到目標(biāo)層得分S,如式(8):
(8)
灰色關(guān)聯(lián)評價模型結(jié)果的準(zhǔn)確性與最優(yōu)閾值(參考序列)高度相關(guān),但由于最優(yōu)閾值往往由專家給出,與具體場景值的契合度較小且主觀性較強(qiáng)。核密度估計模型為非參數(shù)估計模型,不需要有關(guān)數(shù)據(jù)的先驗基礎(chǔ)知識,它以數(shù)據(jù)特征為依據(jù),能有效描述復(fù)雜指標(biāo)的數(shù)據(jù)分布情況。筆者引入非參數(shù)估計模型中的核密度估計模型(KDE),對采集數(shù)據(jù)中的指標(biāo)數(shù)據(jù)進(jìn)行擬合估計,得到最優(yōu)閾值以提高灰色關(guān)聯(lián)度模型的客觀性。帶寬是KDE模型的核心,其值決定了核密度估計模型的擬合質(zhì)量,通過Silverman經(jīng)驗法和最小化AMISE法則得到平均積分平方誤差最小化的最優(yōu)帶寬,其中核函數(shù)為高斯核函數(shù),如式(9):
(9)
以聚類結(jié)果的目標(biāo)車工況數(shù)據(jù)作為核密度估計模型的輸入,利用最優(yōu)寬帶的核密度估計模型對各評價指標(biāo)在不同場景下時序值進(jìn)行密度擬合,其核密度估計如圖4(a)~圖4(f)。核密度最大處表示數(shù)據(jù)熱點,并作為指標(biāo)的最優(yōu)閾值[16]。如出現(xiàn)偏峰,取左右側(cè)各85%分位值所在區(qū)間的平均值為最優(yōu)閾值,得到的各指標(biāo)最優(yōu)閾值結(jié)果見表4。
圖4 不同場景下各指標(biāo)核密度估計Fig.4 Kernel density estimation of each indicator in different scenarios
表4 核密度估計結(jié)果Table 4 Kernel density estimation results
考慮實車測試的成本高、實驗重復(fù)性差,筆者選用PreScan和MATLAB的聯(lián)合仿真搭建兩類典型匝道合流場景。為了達(dá)到接近真實測試目的,根據(jù)聚類結(jié)果選取轎車模型,并加載車輛動力學(xué)模型、駕駛員模型及雷達(dá)傳感器模型,保證車輛模型可靠性。利用TIFF格式地圖用RoadRunner進(jìn)行1∶1精確地圖復(fù)現(xiàn),設(shè)置路面附著系數(shù)為0.7,天氣晴朗,可視度高,無其它因素干擾等,保證實際道路信息與仿真場景信息的一致性。根據(jù)聚類結(jié)果設(shè)置車輛相關(guān)行駛參數(shù),保證交互中干擾車運(yùn)動狀態(tài)的統(tǒng)一性。最后對仿真被測車輛加入兩種不同的自動駕駛控制算法來驗證評價模型的有效性。
按聚類結(jié)果設(shè)置仿真車輛參數(shù),直行車輛速度包含初始車速、交互車速及最終車速,起始位置由前車間距得到,保持第3車道行駛。交互車速位于交互區(qū)域,交互區(qū)域由每類車輛匯入橫坐標(biāo)平均值得到,場景1為x=135.73 m,場景2為x=207.12 m。場景2的后車間距為35.13 m,相關(guān)車速均由后車車速平均值得到,保證仿真中的所有主路車行駛狀態(tài)符合實際駕駛規(guī)律。匯入車輛僅按照聚類結(jié)果設(shè)置初始車速、匯入車道。車輛行駛區(qū)間起始位置為x=25 m,結(jié)束位置為x=325 m,與采集數(shù)據(jù)一致。
觀察自動駕駛算法在匯入過程的交互行為,仿真片段如圖5。
圖5 聚類仿真片段Fig.5 Clustering simulation fragment
場景1仿真片段中,目標(biāo)車從第4車道駛?cè)朐训?主車道前方有車后方無車,算法在導(dǎo)流線一結(jié)束便開始匯入動作,但由于匯入車的減速運(yùn)動導(dǎo)致后續(xù)速度下降較快,場景2仿真片段中目標(biāo)車從第5車道駛?cè)朐训?主車道前后方均有車,算法在第4、5車道即將消失的末端才開始匯入動作,兩車在測試過程中都未發(fā)生碰撞,且能在較短時間內(nèi)通過雷達(dá)識別到前方車輛,并通過算法進(jìn)行判斷是否制動。
通過仿真輸出的測試數(shù)據(jù)計算得到各指標(biāo)的值,其中計算方法與駕駛數(shù)據(jù)一致,如表5。
表5 場景仿真結(jié)果Table 5 Scenario simulation results
觀察仿真測試結(jié)果,在測試場景方面,車輛一和車輛二的行駛路徑與聚類結(jié)果中車輛的關(guān)鍵途徑點一致。場景1中,匯入車輛左側(cè)前方有車后方無車,匯入時間較小,但由于直行車的減速運(yùn)動,匯入安全性較低,通行效率更高。場景2中,匯入車輛左側(cè)前方有車后方有車,造成匯入時間較大,通過高效性較差。在安全匯入不考慮后車追尾情況下,由于場景2匯入過程存在判斷延遲,其整體安全性反而更高。
在不同車輛方面,車輛一的tTTC、tPET及tTHW均小于采集數(shù)據(jù),安全性較差,說明在車速較高距離較近時未進(jìn)行大幅度制動措施。車輛二的tTTC在兩個場景中皆為4 s以上,tTTC也皆大于車輛一,正向碰撞安全性較車輛一更好,tPET與采集數(shù)據(jù)接近,側(cè)向碰撞安全性表現(xiàn)優(yōu)秀。但通過高效性方面車輛一的效率好于車輛二,同時也反映出車輛一整體偏向激進(jìn)型,車輛二偏向保守性,整體來說,兩車都符合安全性與高效性要求,且符合采集數(shù)據(jù)的分布特點。
以仿真輸出的值為被測對象,參照文獻(xiàn)[9]中層次分析法及CRITIC法的計算得到總指標(biāo)層和各指標(biāo)的權(quán)重,如表6。
表6 車輛指標(biāo)的權(quán)重Table 6 Weight of vehicle indicators
利用基于核密度估計的灰色關(guān)聯(lián)理論評價模型,以相同場景不同車輛為關(guān)聯(lián)矩陣,并對正負(fù)向指標(biāo)按式(3)~式(8)計算得到各指標(biāo)分值及車輛綜合得分,如表7。
表7 車輛綜合得分及總指標(biāo)得分Table 7 Vehicle comprehensive score and total index score
為驗證評價模型的有效性,利用模糊綜合分析評價模型對比驗證,通過邀請有駕駛經(jīng)驗的駕駛員共50人,觀察仿真車輛數(shù)據(jù)并按照評價標(biāo)準(zhǔn)對兩個場景車輛表現(xiàn)進(jìn)行打分,統(tǒng)計出各分?jǐn)?shù)等級的人數(shù),考慮成本,僅對車輛一場景1進(jìn)行評分,如表8。
表8 場景1中車輛一專家評分統(tǒng)計Table 8 Statistical table of expert rating for vehicle 1 in scenario 1
參照文獻(xiàn)[9]計算得到模糊綜合評價結(jié)果。其與灰色關(guān)聯(lián)理論結(jié)果比較,如表9。
表9 不同模型評價結(jié)果Table 9 Evaluation results of different models
觀察評價結(jié)果,從相同模型下不同車輛評價結(jié)果、相同車輛下不同模型評價結(jié)果兩方面分析,來驗證基于核密度估計的灰色關(guān)聯(lián)理論評價模型可靠性,得到以下結(jié)論:
1)分析對比表5仿真數(shù)據(jù)與表7灰色關(guān)聯(lián)模型結(jié)果可知:在安全性方面,兩個場景中車輛一的tTTC、tPET及tTHW皆明顯低于車輛二,正向碰撞和側(cè)向碰撞安全都較差;在灰色關(guān)聯(lián)模型量化評價結(jié)果中,車輛二在場景1的安全性得分高于車輛一27.97%,且場景2的安全性高24.10%,與測試數(shù)據(jù)量化分析結(jié)果規(guī)律一致。在高效性方面,場景中的兩車在通過時間、換道時間差異極大,灰色關(guān)聯(lián)模型中場景2兩車差異達(dá)到23.81%,場景1僅差11.11%,說明基于核密度估計的灰色關(guān)聯(lián)模型評價結(jié)果與測試數(shù)據(jù)量化分析結(jié)果的規(guī)律一致性較高,且評價模型的評分波動區(qū)間也符合數(shù)據(jù)分布的特點,能準(zhǔn)確評價車輛的表現(xiàn)。
2)分析對比不同模型評價結(jié)果的一致性可知:車輛一場景1中兩模型安全方面得分一致性達(dá)91.47%,高效方面得分一致性達(dá)89.49%,綜合分一致性達(dá)98.01%。其中綜合性的得分一致性明顯高于安全性和高效性,主要是由于層次分析法得到的權(quán)重所導(dǎo)致。總指標(biāo)層的得分一致性在90%左右,說明指標(biāo)層權(quán)重法較合理??傮w來說基于核密度估計的客觀灰色關(guān)聯(lián)理論模型與主觀評價模糊綜合分析法具有較高一致性。
針對高速匝道匯入場景,利用采集的駕駛數(shù)據(jù)求出安全性評價指標(biāo)的客觀值,提出基于核密度估計的灰色關(guān)聯(lián)理論模型,其主要結(jié)論如下:
1)考慮了匝道匯入車輛的各行駛要素,利用聚類分析實現(xiàn)測試場景生成及測試數(shù)據(jù)生成,避免了測試用例在場景中的行駛參數(shù)由主觀設(shè)定;在后續(xù)的仿真測試中,搭建了精度較高的典型高速匝道匯入測試場景,保證了測試仿真與匝道匯入場景的一致性,進(jìn)一步提高了測試評價結(jié)果的準(zhǔn)確度。
2)在評價模型中考慮到了主觀評價對模型結(jié)果的影響,以核密度估計得到的最優(yōu)閾值作為評價模型的輸入,代替了專家意見值,客觀模型與主觀模型結(jié)果相似度為98.01%,評價結(jié)果較準(zhǔn)確、客觀性強(qiáng),適用于自動駕駛車輛仿真測試中的安全性評價。