覃文文,鄢祺陽,谷金晶,李武,戢曉峰*
(1.昆明理工大學(xué),交通工程學(xué)院,昆明 650504;2.云南省現(xiàn)代物流工程研究中心,昆明 650504;3.同濟大學(xué),電子與信息工程學(xué)院,上海 201804;4.大連理工大學(xué),建設(shè)工程學(xué)部,遼寧大連 116024)
駕駛風(fēng)格是對駕駛?cè)肆?xí)慣性駕駛方式的泛化概括,綜合反映了駕駛?cè)斯逃械鸟{駛行為模式[1]。一般來說,駕駛風(fēng)格的激進程度與事故數(shù)量呈現(xiàn)正相關(guān)關(guān)系,具體地,駕駛?cè)税l(fā)生超速、急加減速等不良駕駛行為的頻次越高,誘發(fā)交通事故的可能性越大[2]。與小汽車駕駛?cè)讼啾龋捎谪浽吹牟淮_定性及其與目的地距離偏長等因素,重載貨車駕駛?cè)似毡榇嬖谛熊囁俣瓤臁Ⅰ{駛時間長等特點,更容易表現(xiàn)出不良駕駛行為,進而形成激進的駕駛風(fēng)格[3-4]。2017年,《道路交通運輸安全發(fā)展報告(2017)》特別指出,重載貨車駕駛?cè)思みM駕駛風(fēng)格導(dǎo)致的事故數(shù)、死亡人數(shù)和直接經(jīng)濟損失分別占相應(yīng)總數(shù)的47.08%、56.18%和59.65%[5]。統(tǒng)計數(shù)據(jù)表明,重載貨車駕駛?cè)说募みM駕駛風(fēng)格具有強烈的習(xí)慣性特征和風(fēng)險性特征,一旦養(yǎng)成很難矯正,目前已成為交通事故最主要的致因之一。因此,研究重載貨車駕駛?cè)说鸟{駛風(fēng)格特性及其風(fēng)險性,對于開展重載貨車駕駛?cè)笋{駛行為安全教育,降低重載貨車交通事故發(fā)生率具有指導(dǎo)借鑒意義。
近年來,駕駛風(fēng)格研究吸引了眾多國內(nèi)外學(xué)者的關(guān)注?,F(xiàn)有成果主要集中于數(shù)據(jù)獲取相對容易的小汽車駕駛?cè)笋{駛風(fēng)格辨識,涉及重載貨車駕駛?cè)笋{駛風(fēng)格的研究尚不多見。采用的研究數(shù)據(jù)主要包括:問卷調(diào)查[6]、駕駛模擬實驗[7]、道路實車駕駛實驗[8-10]和交通運輸企業(yè)運營數(shù)據(jù)等[11-13]。其中,問卷調(diào)查數(shù)據(jù)主觀性較強,導(dǎo)致數(shù)據(jù)難以反映真實駕駛情況;在駕駛模擬實驗中,模擬環(huán)境的逼真度極大地影響了所獲取數(shù)據(jù)的可靠性;道路實車駕駛實驗通常行程較短,受實驗人數(shù)限制,得到的研究樣本較少。此外,受試者可能會刻意避免不良駕駛行為,難以獲取到駕駛?cè)说恼鎸嶑{駛行為特征。而通過交通運輸企業(yè)獲取的運營數(shù)據(jù)具有數(shù)據(jù)規(guī)模大、真實性好、可靠性強的優(yōu)點,能夠有效反映駕駛?cè)说鸟{駛行為。然而,道路實車駕駛實驗數(shù)據(jù)和交通運輸企業(yè)運營數(shù)據(jù)以采集頻率不低于1 Hz 的高頻軌跡數(shù)據(jù)為主,低頻軌跡數(shù)據(jù)較為鮮見。高頻軌跡數(shù)據(jù)雖然精度較高,但數(shù)據(jù)采集、存儲、處理成本高昂,導(dǎo)致大規(guī)模應(yīng)用成本較高。而低頻軌跡數(shù)據(jù)的優(yōu)勢在于獲取相對容易、成本低,在實際應(yīng)用中,60%以上的GPS 軌跡數(shù)據(jù)均為低頻采樣[14]。根據(jù)《道路運輸車輛動態(tài)監(jiān)督管理辦法》的規(guī)定,我國重載貨車已全部安裝衛(wèi)星定位裝置,獲取的低頻軌跡數(shù)據(jù)已接入道路貨運車輛公共管理平臺[15],這為基于低頻軌跡數(shù)據(jù)開展廣域尺度的重載貨車駕駛?cè)笋{駛風(fēng)格研究提供了基礎(chǔ)。
盡管如此,大部分學(xué)者偏向于研究小汽車駕駛?cè)说鸟{駛風(fēng)格聚類分析與駕駛風(fēng)格識別。在駕駛風(fēng)格聚類方法層面,現(xiàn)有研究主要采用無監(jiān)督學(xué)習(xí)方法進行風(fēng)格劃分,如K-均值(K-means)聚類[6-9,12-13,16]、高斯混合模型[10]和層次聚類[11]等。其中,K-means 在運算效率和精度上均表現(xiàn)較好[7,17],被廣泛應(yīng)用于駕駛風(fēng)格聚類分析中。對于風(fēng)格數(shù)量的界定,既有研究多以輪廓系數(shù)等指標(biāo)作為依據(jù),將駕駛風(fēng)格劃分為2 類[9](正常、激進)、3類[6,8,10,12,13,16-17](激進、保守、溫和)或者4類[7](安全、一般-安全、一般-危險、危險),在此基礎(chǔ)上,定性評估不同風(fēng)格間的特性。然而,僅有少數(shù)文獻(xiàn)報道了貨車駕駛?cè)说鸟{駛風(fēng)格聚類研究。Figueredo 等[11]以油門持續(xù)時間、行車距離、行車時間、制動等特征為表征指標(biāo),聚類得到英國貨車駕駛?cè)说?種行為模式。孫川等[12]基于貨車速度特征,結(jié)合因子分析與K-means聚類算法,圍繞超速、變速、減速和加速分別進行分析,提出變速駕駛行為程度較重的駕駛?cè)笋{駛風(fēng)險較高。王海星等[13]基于貨車速度與加速度特征,采用因子分析方法提取超速、急加減速和變速因子,利用模糊C均值方法將駕駛操作評價結(jié)果劃分為劇烈、較大、一般和較好,并挖掘出具有危險傾向的駕駛?cè)恕?/p>
在駕駛風(fēng)格識別方法層面,駕駛風(fēng)格識別主要以聚類結(jié)果[8-9]為數(shù)據(jù)標(biāo)簽,采用監(jiān)督學(xué)習(xí)方法進行風(fēng)格識別。常用方法包括:支持向量機(Support Vector Machine,SVM)[8]、AdaBoost 算法[9]和隨機森林(Random Forest,RF)[17]等。其中,SVM 具有較高的識別精度和較好的魯棒性,能很好地識別出不同類型的駕駛風(fēng)格[8]。類似地,現(xiàn)有針對貨車駕駛?cè)说鸟{駛風(fēng)格識別研究,均參考小汽車駕駛?cè)说鸟{駛風(fēng)格識別分析模式,即采用車輛運動數(shù)據(jù),提煉出特征參數(shù)(如車速平均值、加速度、角速度等)來刻畫貨車駕駛?cè)说鸟{駛風(fēng)格。徐婷等[9]對貨車的加速度、發(fā)動機轉(zhuǎn)速等指標(biāo)進行聚類,以聚類結(jié)果作為數(shù)據(jù)標(biāo)簽,訓(xùn)練基于AdaBoost方法的識別模型,識別準(zhǔn)確率達(dá)到98.74%。Wang 等[17]以角速度、油門開合等特征為指標(biāo),從聚類中獲得樣本數(shù)據(jù)標(biāo)簽,建立基于RF 的礦用卡車駕駛風(fēng)格識別模型,在重載和空載工況下,識別準(zhǔn)確率分別達(dá)到95.39%和90.74%。
上述研究可為重載貨車駕駛?cè)孙L(fēng)格辨識提供有益參考,但還存在以下不足:(1)現(xiàn)有駕駛風(fēng)格研究對象多聚焦于小汽車駕駛?cè)?,所采用?shù)據(jù)各異,缺少基于低頻軌跡數(shù)據(jù)分析廣域尺度的重載貨車駕駛?cè)笋{駛風(fēng)格的研究范式和框架;(2)現(xiàn)有貨車駕駛?cè)笋{駛風(fēng)格研究成果的特征構(gòu)建主要移植于小汽車駕駛?cè)笋{駛風(fēng)格特征體系,對重載貨車駕駛?cè)说男熊囂攸c考慮不足,特別是疲勞駕駛;(3)現(xiàn)有成果多側(cè)重于貨車駕駛?cè)说鸟{駛風(fēng)格分析和識別,鮮有研究在風(fēng)格識別的基礎(chǔ)上進一步對單個貨車駕駛?cè)说鸟{駛風(fēng)格表現(xiàn)及其風(fēng)險性進行量化評估。
因此,本文首先構(gòu)建超速駕駛特征集和疲勞駕駛特征集,綜合表征重載貨車駕駛?cè)说鸟{駛風(fēng)格。然后,通過因子分析對特征集進行特征約簡,以Kmeans 聚類方法獲得的風(fēng)格類別作為識別模型的數(shù)據(jù)標(biāo)簽,訓(xùn)練基于SVM的駕駛風(fēng)格識別模型,并對比梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)的識別性能。最后,建立基于CRITIC賦權(quán)法的駕駛風(fēng)格量化評估模型,實現(xiàn)對重載貨車駕駛?cè)笋{駛風(fēng)格的類別標(biāo)定、快速識別和定量評估。
本文所用的重載貨車軌跡數(shù)據(jù)獲取于某全國貨運監(jiān)管平臺,主要分布于云南省域,圖1 清晰地對部分?jǐn)?shù)據(jù)進行了空間呈現(xiàn),可見,軌跡點在各種等級道路上均有分布。該數(shù)據(jù)集采集于2019年3月1~7日,采樣間隔為30 s,總計約6 億個軌跡點。每個軌跡點包含6個字段,分別為車輛編號、經(jīng)度、緯度、時間戳、瞬時速度和方向角。其中,車輛編號作為唯一標(biāo)識,對應(yīng)了單個重載貨車駕駛?cè)?;時間戳和瞬時速度在一定程度上反映了重載貨車駕駛?cè)说鸟{駛行為特征。本文將在研究方法部分詳細(xì)介紹如何從低頻軌跡數(shù)據(jù)中提煉出特征參數(shù)集。
圖1 部分軌跡數(shù)據(jù)的可視化Fig.1 Visualization of partial trajectory data
在方法部分,本文提出用于快速識別與量化評估重載貨車駕駛?cè)笋{駛風(fēng)格的研究框架,如圖2所示。該框架主要由5 個步驟組成,分別為數(shù)據(jù)準(zhǔn)備、特征約簡、風(fēng)格聚類、風(fēng)格識別與風(fēng)格量化。第1 部分為數(shù)據(jù)準(zhǔn)備階段,主要包括數(shù)據(jù)預(yù)處理和特征參數(shù)集的構(gòu)建;第2 部分為特征約簡,采用因子分析方法,對兩類特征集進行降維;第3 部分為風(fēng)格聚類,基于降維后的結(jié)果,實現(xiàn)基于K-means 方法的重載貨車駕駛?cè)说鸟{駛風(fēng)格聚類;第4部分在風(fēng)格聚類的基礎(chǔ)上,構(gòu)建重載貨車駕駛?cè)说鸟{駛風(fēng)格識別模型,目的是在方法應(yīng)用層面,隨著新駕駛?cè)藛T加入,能夠快速識別出任意一個重載貨車駕駛?cè)说鸟{駛風(fēng)格;第5部分在識別出單個重載貨車駕駛?cè)笋{駛風(fēng)格的基礎(chǔ)上,對其駕駛風(fēng)格的風(fēng)險性進行定量打分。
圖2 重載貨車駕駛?cè)笋{駛風(fēng)格識別與量化研究框架Fig.2 Basic frame work of proposed methodology for driving styles of heavy-duty truck drivers
2.1.1 軌跡提取
與其他等級道路工況相比,高速公路的工況受外界干擾較小,能夠清晰地反映駕駛?cè)说鸟{駛習(xí)慣。此外,觀察圖1呈現(xiàn)的重載貨車在云南省內(nèi)的行駛軌跡可以發(fā)現(xiàn),大部分軌跡點分布在云南省高速公路上。因此,本文選取云南省高速公路網(wǎng)作為研究區(qū)域,將方向角不在0~360°區(qū)間內(nèi),定位不在云南省范圍內(nèi)或者瞬時速度高于120 km·h-1的軌跡點剔除,重復(fù)記錄只保留1條。根據(jù)貨車在高速公路上最低車速不得低于60 km·h-1的規(guī)定[18],再鑒于重載貨車在高速公路上的行駛時間較長,本文只研究持續(xù)駕駛時間大于20 min 且瞬時速度均大于60 km·h-1的軌跡,提取在云南省主要高速公路上行駛的1567輛重載貨車的GPS軌跡數(shù)據(jù)。
2.1.2 特征構(gòu)建
現(xiàn)有研究廣泛采用角速度、加速度等微觀駕駛行為特征,用于表征駕駛?cè)说鸟{駛風(fēng)格。然而,此類特征參數(shù)對低頻軌跡數(shù)據(jù)不適用[16]。因此,本文結(jié)合重載貨車駕駛?cè)诵熊囁俣瓤旌婉{駛時間長的特點,基于低頻軌跡數(shù)據(jù)構(gòu)建了疲勞駕駛特征集和超速駕駛特征集,如表1所示。重載貨車駕駛?cè)顺掷m(xù)駕駛時間越長,越容易出現(xiàn)疲勞駕駛行為[18]。故本文采用最大持續(xù)駕駛時間、超時駕駛時間、疲勞駕駛時間比例綜合反映重載貨車駕駛?cè)说钠隈{駛行為。此外,平均速度[13]、最大速度[9]、平均最大速度能在一定程度反映重載貨車駕駛?cè)说某亳{駛傾向。故本文選取超速駕駛頻次、超速駕駛時間比例[11]、平均速度、最大速度、平均最大速度作為表征重載貨車駕駛?cè)顺亳{駛的重要特征。
表1 重載貨車駕駛?cè)笋{駛風(fēng)格特征集Table 1 Driving style features of heavy-duty truck drivers
根據(jù)《中華人民共和國道路交通安全法實施條例》規(guī)定,駕駛機動車不得出現(xiàn)持續(xù)駕駛4 h未停車休息或休息不足20 min的行為;貨運汽車在高速公路上最高時速不得高于100 km·h-1[19]。因此,本文將持續(xù)駕駛時間超過4 h的部分定義為超時駕駛時間,但鑒于云南高速公路橋隧占比高、路線起伏大、急彎陡坡多,故本文將瞬時速度大于90 km·h-1的軌跡點判別為超速。如果超速軌跡點是孤立的點,那么認(rèn)為發(fā)生了1次超速駕駛行為,下一軌跡點的時間戳與該點時間戳的差值記錄為超速駕駛持續(xù)時間;如果多個超速軌跡點相鄰,則合并這些軌跡點,只記為1 次超速駕駛,以超速軌跡終點時間戳與起點時間戳的差值作為超速駕駛持續(xù)時間。
既有研究多采用較高維度的特征表征駕駛風(fēng)格,且通常利用主成分分析方法進行維度約簡[6,8],但該方法難以對提取出的主成分所代表的含義進行清晰解釋。因子分析作為主成分分析的推廣,能夠很好地克服主成分分析方法固有的不足。本文選取的表征重載貨車駕駛?cè)笋{駛風(fēng)格的特征參數(shù)較多,有必要利用因子分析方法對特征進行降維。在此基礎(chǔ)上,本文將基于約簡得到的主因子,利用聚類方法獲得不同類型的重載貨車駕駛?cè)笋{駛風(fēng)格。
為從重載貨車行駛軌跡中提煉出駕駛?cè)说鸟{駛風(fēng)格,以因子分析提取的主因子作為變量進行聚類,將K-means算法的聚類結(jié)果作為下一步風(fēng)格識別的數(shù)據(jù)標(biāo)簽。為確定重載貨車駕駛?cè)笋{駛風(fēng)格最佳的聚類個數(shù),本文利用戴維森堡丁指數(shù)(Davies-Bouldin Index, DBI)衡量聚類效果。計算公式為
式中:l為聚類個數(shù);為第u類樣本間的平均距離;為第v類樣本間的平均距離;duv為第u類與第v類質(zhì)心間的距離。DBI(k)越小,說明聚類效果越好。
為實現(xiàn)對未知單個重載貨車駕駛?cè)笋{駛風(fēng)格的識別,本文基于SVM 訓(xùn)練風(fēng)格識別模型。SVM是一種學(xué)習(xí)能力強、準(zhǔn)確率高、泛化能力較強的機器學(xué)習(xí)算法,核心思想是尋找一個使兩個類別之間間隔最大的超平面,適合處理非線性和高維的分類問題。通過構(gòu)造最優(yōu)化問題,并計算最優(yōu)解λ*=(λ*1;λ*2;…;λ*m)和偏移量最優(yōu)解b*,即
式中:xα、xβ為表1 中駕駛風(fēng)格特征;yα為駕駛風(fēng)格類別;α、β=1,2,…,m,m為駕駛?cè)藰颖緮?shù);λ*α為拉格朗日乘子;K為核函數(shù);sgn 為符號函數(shù)。根據(jù)式(2)分類決策函數(shù)識別駕駛風(fēng)格。為驗證SVM 模型的識別性能,用與SVM 一樣具有較強泛化能力的GBDT模型作駕駛風(fēng)格識別對照試驗。
2.5.1 駕駛風(fēng)格量化
在利用風(fēng)格識別模型確定單個重載貨車駕駛?cè)笋{駛風(fēng)格之后,為進一步確定該駕駛?cè)说鸟{駛表現(xiàn)及其潛在的行車風(fēng)險性,有必要對其駕駛風(fēng)格進行量化評估。本文以超速駕駛特征值和疲勞駕駛特征值刻畫不同駕駛風(fēng)格的駕駛風(fēng)險,假設(shè)重載貨車駕駛?cè)似隈{駛與超速駕駛特征值越大,則駕駛表現(xiàn)越差,駕駛風(fēng)險越高,評分越低?;诖?,結(jié)合每一個超速駕駛特征和疲勞駕駛特征的累積分布函數(shù)確定評估值,并考慮不同特征的權(quán)重差異,建立風(fēng)格量化評估模型為
式中:S(x)為駕駛?cè)藊的駕駛風(fēng)格量化得分,范圍為0~100 分,得分越高表明該駕駛?cè)笋{駛表現(xiàn)越好,駕駛風(fēng)險越低;ωj為第j個特征參數(shù)的權(quán)重,j∈n;n為特征總數(shù);Fj(xj)為第j個特征參數(shù)的累積分布函數(shù)。
2.5.2 CRITIC賦權(quán)法
為確定式(3)中權(quán)重,本文引入CRITIC 賦權(quán)法確定不同特征參數(shù)的權(quán)重。CRITIC賦權(quán)法是基于評價特征對比強度與特征間沖突性,綜合衡量特征權(quán)重的一種客觀賦權(quán)方法。既考慮了特征內(nèi)數(shù)據(jù)的變異性,又兼顧了特征之間數(shù)據(jù)的相關(guān)性。權(quán)重計算時,先確定信息量,再對其進行歸一化處理,即得到各個特征的權(quán)重。計算公式為
式中:Cj為第j個特征的信息量,公式為
式中:δj為第j個特征的標(biāo)準(zhǔn)差,即特征的對比強度;Rj為第j個特征與其他特征間的沖突性;rjk為特征j與特征k之間的相關(guān)系數(shù)。
本文利用SPSS26 進行因子分析,首先驗證因子分析可行性,得出KMO 值(Kaiser-Meyer-Olkin)為0.739(>0.5),變量間相關(guān)性較好;巴特利特球形度檢驗顯著性水平為0.000(<0.05),拒絕原假設(shè),因子分析有效。其次,采用主成分分析法提取因子并計算各因子方差貢獻(xiàn)率,如表2所示,可知,前兩個主因子特征值大于1,累計方差貢獻(xiàn)率為80.838%(>60%),因子提取效果較好。因此,選取兩個主因子進行分析。
表2 各因子方差貢獻(xiàn)率Table 2 Accumulative contribution for different factor
再利用凱撒正態(tài)化最大方差法對因子進行旋轉(zhuǎn),如表3 所示??芍褐饕蜃? 在平均速度、最大速度、平均最大速度、超速駕駛頻次、超速駕駛時間比例上載荷較大,故將其命名為超速因子;主因子2在最大持續(xù)駕駛時間、超時駕駛時間、疲勞駕駛時間比例上載荷較大,故將其命名為疲勞因子。
表3 旋轉(zhuǎn)后的因子載荷矩陣Table 3 Factor loading matrix after rotation
現(xiàn)有研究中,駕駛風(fēng)格主要被劃分為2~4類[6-10],并以3 類居多。因此,本文計算聚類結(jié)果分別為2~5 類時的DBI 值,分別為0.9104、0.7706、0.8178、0.8747。其中,樣本劃分為3 類時,DBI 最小。然而,此時不同類別的駕駛風(fēng)格特性難以被清晰解釋。樣本劃分為4類時,不同類別的疲勞駕駛特征和超速駕駛特征最明顯,且更符合人類的認(rèn)知規(guī)律,故將貨車駕駛?cè)笋{駛風(fēng)格劃分為4類,圖3直觀地對聚類結(jié)果進行了展示。
圖3 聚類結(jié)果Fig.3 Clustering results
結(jié)合圖3 和表4 可知,類1 聚類中心的超速因子與疲勞因子都最小,故將其代表的駕駛風(fēng)格命名為穩(wěn)健型,包含981個樣本,占比62.60%,此類駕駛?cè)诵熊囕^謹(jǐn)慎;類2 聚類中心的超速因子最大,故將其代表的駕駛風(fēng)格命名為超速型,包含392個樣本,占比25.02%,駕駛風(fēng)格特點主要表現(xiàn)為超速駕駛;類3 聚類中心的疲勞因子較大,故將其代表的駕駛風(fēng)格命名為疲勞型,駕駛風(fēng)格特點主要表現(xiàn)為疲勞駕駛,包含116個樣本,占比7.40%;類4聚類中心的疲勞因子最大,且超速因子僅小于類2,故將其代表的駕駛風(fēng)格命名為危險型,包含78個樣本,占比4.98%,此類駕駛?cè)舜嬖谳^嚴(yán)重的疲勞駕駛與超速駕駛行為。其中,超速型、危險型和疲勞型的樣本之和在總體中占比37.40%。顯而易見的,重載貨車駕駛?cè)说牟话踩{駛風(fēng)格仍普遍存在,對于重載貨車駕駛?cè)说倪x拔培訓(xùn)和安全教育有待于進一步規(guī)范和加強。
表4 聚類中心及結(jié)果Table 4 Clustering centers and results
利用scikit-learn 機器學(xué)習(xí)開源框架,以構(gòu)建的特征集作為數(shù)據(jù)特征,以3.2 節(jié)聚類得到的4 類駕駛風(fēng)格作為數(shù)據(jù)標(biāo)簽,按7∶3將數(shù)據(jù)集劃分為訓(xùn)練集和測試集,再采用SMOTE(Synthetic Minority Oversampling Technique)方法對訓(xùn)練集進行過采樣處理,解決不同類別間樣本的不平衡問題,構(gòu)建基于SVM 的駕駛風(fēng)格識別模型,并在相同數(shù)據(jù)集上對比GBDT 的識別效果。兩個模型都通過網(wǎng)格搜索和5折交叉驗證確定最佳參數(shù)組合,相關(guān)參數(shù)如表5所示。
表5 模型相關(guān)參數(shù)Table 5 Related parameters of classification models
根據(jù)識別結(jié)果分別繪制兩種識別模型在測試集上的混淆矩陣圖,如圖4所示。
圖4 駕駛風(fēng)格識別模型混淆矩陣Fig.4 Confusion matrix for driving style recognition model
圖4 中混淆矩陣對角線上數(shù)值代表每個類別分類正確的數(shù)量,值越大越好。明顯地,SVM在穩(wěn)健型、疲勞型和危險型上分類正確的數(shù)量更多,對4種風(fēng)格的識別準(zhǔn)確率均大于97%。進一步計算各識別模型的精確率、召回率、F1-score,表6 為兩種模型在不同駕駛風(fēng)格上的表現(xiàn)。可見,SVM 識別不同駕駛風(fēng)格的精確率、召回率、F1值均大于等于GBDT 相應(yīng)的評估指標(biāo),表明SVM 的識別性能整體最好。因此,本文采用SVM 識別重載貨車駕駛?cè)说鸟{駛風(fēng)格。
表6 模型識別效果Table 6 Results of recognition model
圖5 為所有樣本超速駕駛特征和疲勞駕駛特征的頻次直方圖。明顯地,平均速度、平均最大速度、最大速度、最大持續(xù)駕駛時間呈對數(shù)正態(tài)分布,超時行駛時間、疲勞駕駛時間比例、超速駕駛頻次、超速駕駛時間比例呈指數(shù)分布。
圖5 駕駛風(fēng)格特征頻次分布圖Fig.5 Frequency distribution of driving style features
根據(jù)上述各個特征的頻次分布,應(yīng)用Python的Scipy 庫擬合出每個特征頻次分布的概率密度函數(shù),進而求出累積分布函數(shù)。再利用CRITIC 賦權(quán)法確定每一個超速駕駛特征和疲勞駕駛特征的權(quán)重,計算結(jié)果如表7所示。
表7 CRITIC賦權(quán)法計算結(jié)果Table 7 Results of CRITIC weighting method
最后,應(yīng)用式(3)得出重載貨車駕駛?cè)笋{駛風(fēng)格量化評估結(jié)果,4 類駕駛風(fēng)格的評分結(jié)果如圖6所示。
圖6 各風(fēng)格駕駛?cè)肆炕u估箱型圖Fig.6 Quantitative assessment boxplots for different diving styles
從聚類結(jié)果中,選取5名具有不同駕駛風(fēng)格特點的重載貨車駕駛?cè)?,分別命名為driver1#、driver2#、driver3#、driver4#、driver5#。圖7為5名重載貨車駕駛?cè)嗽诟咚俟飞? d 的行車軌跡,分別用三角形、菱形、圓點代表重載貨車駕駛?cè)说某亳{駛狀態(tài)、疲勞駕駛狀態(tài)和正常駕駛狀態(tài)。
圖7 不同風(fēng)格駕駛?cè)笋{駛行為的空間分布Fig.7 Spatial distributions of driving behaviors with different driving styles
表8 給出駕駛?cè)嗽诔亳{駛特征和疲勞駕駛特征上的評分,分別相加即為評估總分。每一個特征評分的取值范圍下限為0分,上限為特征權(quán)重與100 的乘積,分值由低到高,代表駕駛表現(xiàn)由低到高、駕駛風(fēng)險由高到低的變化。
表8 各風(fēng)格駕駛?cè)笋{駛風(fēng)格量化評估結(jié)果對比Table 8 Comparison of quantitative assessment results by different diving styles
由圖6 可知,危險型評估總分最低,其75%以上的樣本評估總分低于20分,駕駛風(fēng)險最高;穩(wěn)健型評估總分最高,其評估總分在60 分以上的樣本占比大于75%,駕駛風(fēng)險最低。以穩(wěn)健型driver1#和危險型driver2#為例,由圖7 和表8 可知,driver1#存在偶發(fā)的超速駕駛行為,評估總分為78.72 分;driver2#存在嚴(yán)重的疲勞駕駛與超速駕駛行為,評估總分為15.06分。
由于量化評估模型綜合考慮了疲勞駕駛與超速駕駛兩類特征,部分不同風(fēng)格駕駛?cè)嗽u估結(jié)果近似,但在風(fēng)險的表現(xiàn)上存在一定差異。以疲勞型driver3#和超速型driver4#為例,由圖7 和表8 可知,評估結(jié)果分別為44.97分和45.09分。其中,driver3#存在嚴(yán)重的疲勞駕駛行為,超速駕駛評估結(jié)果為42.97分,主要表現(xiàn)為疲勞駕駛風(fēng)險;driver4#存在嚴(yán)重的超速駕駛行為,疲勞駕駛評估結(jié)果為30.69分,主要表現(xiàn)為超速駕駛風(fēng)險。類似的,部分穩(wěn)健型駕駛風(fēng)格駕駛?cè)俗罱K評估總分低于疲勞型駕駛?cè)耍蛟谟谄淦隈{駛評估結(jié)果優(yōu)于疲勞型駕駛?cè)?,而在超速駕駛上的評估結(jié)果較差。同樣地,在穩(wěn)健型與超速型駕駛?cè)酥g也存在類似的情況。以穩(wěn)健型driver5#、疲勞型driver3#和超速型driver4#為例,由圖7 和表8 可知,driver5#疲勞駕駛評估結(jié)果優(yōu)于driver3#,超速駕駛評估結(jié)果優(yōu)于driver4#,但最終評估總分為42.72分,低于driver3#和driver4#。
此外,由圖6 還能發(fā)現(xiàn),穩(wěn)健型評估總分第30分位數(shù)以下的值與部分疲勞型、超速型評估總分相近。因此,將穩(wěn)健型評估總分第30 分位數(shù)以下的樣本命名為低穩(wěn)健型,反之則命名為高穩(wěn)健型,得到如圖8 所示的不同風(fēng)格駕駛?cè)笋{駛風(fēng)格量化評估散點圖。
圖8 4類風(fēng)格駕駛?cè)说牧炕u估散點圖Fig.8 Scatter plots for quantitative assessment of four types of style drivers
圖8 中橫坐標(biāo)超速駕駛評分與縱坐標(biāo)疲勞駕駛評分之和,即為駕駛風(fēng)格量化評估總分。從整體上看,駕駛風(fēng)格風(fēng)險評估情況與上述舉例大體一致,即評估總分相近但風(fēng)險表現(xiàn)不同。評分結(jié)果可應(yīng)用于物流企業(yè)的車輛風(fēng)險識別和績效管理,以及保險公司保費的定制和調(diào)整。
本文利用某全國貨運監(jiān)管平臺獲取的云南省重載貨車低頻軌跡數(shù)據(jù),提出一套簡單實用的集重載貨車駕駛?cè)笋{駛風(fēng)格聚類、快速識別與風(fēng)格量化評估于一體的研究框架。該方法能定性識別單個重載貨車駕駛?cè)说鸟{駛風(fēng)格,并可對所識別出的不同風(fēng)格駕駛?cè)说鸟{駛風(fēng)險進行定量評估。本文結(jié)論如下:
(1)在重載貨車駕駛?cè)笋{駛風(fēng)格研究的特征構(gòu)建方面,考慮與小汽車駕駛?cè)笋{駛風(fēng)格特征具有共性的超速駕駛行為特征,也兼顧了重載貨車駕駛?cè)诵熊嚂r間長和疲勞駕駛行為相對多發(fā)的特點,構(gòu)建了表征其駕駛風(fēng)格的超速駕駛與疲勞駕駛特征集。在重載貨車駕駛?cè)笋{駛風(fēng)格聚類方面,本文利用因子分析降低特征維度,提取超速因子與疲勞因子作為K-means聚類方法的數(shù)據(jù)輸入,將重載貨車駕駛?cè)笋{駛風(fēng)格劃分為穩(wěn)健型、超速型、疲勞型、危險型,并對不同風(fēng)格特性進行定性評價。其中,超速型駕駛?cè)笋{駛風(fēng)險主要表現(xiàn)為超速駕駛,疲勞型駕駛?cè)笋{駛風(fēng)險主要表現(xiàn)為疲勞駕駛,危險型駕駛?cè)送瑫r存在嚴(yán)重的超速駕駛與疲勞駕駛行為。這3類駕駛風(fēng)格的樣本之和占總體的37.40%,重載貨車駕駛?cè)说牟话踩{駛風(fēng)格問題突出仍是困擾我國道路運輸業(yè)科學(xué)可持續(xù)發(fā)展的重大挑戰(zhàn)之一。
(2)在重載貨車駕駛?cè)笋{駛風(fēng)格識別方面,以K-means聚類結(jié)果作為識別模型的數(shù)據(jù)標(biāo)簽,訓(xùn)練基于SVM 的重載貨車駕駛?cè)笋{駛風(fēng)格識別模型,對不同風(fēng)格的識別準(zhǔn)確率均大于97%。識別效果較好。對識別出的不安全駕駛風(fēng)格駕駛?cè)耍梢圆扇∠鄳?yīng)的控制策略矯正不良駕駛行為,有利于減少重載貨車所帶來的交通安全隱患問題。
(3)在重載貨車駕駛?cè)笋{駛風(fēng)格量化方面,利用基于CRITIC 賦權(quán)法的評估方法,實現(xiàn)對任意一個駕駛?cè)笋{駛風(fēng)格的量化評估。其中,穩(wěn)健型駕駛表現(xiàn)最好,危險型駕駛風(fēng)險最高。由于量化評估模型綜合考慮了疲勞駕駛與超速駕駛兩類特征,部分駕駛?cè)说鸟{駛風(fēng)險雖然表現(xiàn)不同,但評估結(jié)果近似。