李月明,鄭貴省,車亞輝,王 鵬
(1.軍事交通學(xué)院 研究生管理大隊(duì),天津300161; 2.軍事交通學(xué)院 基礎(chǔ)部,天津300161)
?
● 基礎(chǔ)科學(xué)與技術(shù)Basic Science & Technology
基于譜系聚類的公路運(yùn)輸駕駛行為研究
李月明1,鄭貴省2,車亞輝1,王鵬1
(1.軍事交通學(xué)院 研究生管理大隊(duì),天津300161; 2.軍事交通學(xué)院 基礎(chǔ)部,天津300161)
為規(guī)范駕駛行為、提高公路運(yùn)輸安全水平,對(duì)公路運(yùn)輸事故中車輛的駕駛行為及其誘因之間的關(guān)系進(jìn)行研究。基于譜系聚類法并結(jié)合相關(guān)數(shù)學(xué)軟件對(duì)駕駛行為進(jìn)行聚類分析,并以2010—2012年道路交通事故統(tǒng)計(jì)數(shù)據(jù)為例進(jìn)行實(shí)例驗(yàn)證,對(duì)引起交通事故的駕駛行為給出聚類圖譜。研究結(jié)果表明:各種不規(guī)范的駕駛行為是引起交通事故的重要原因,通過聚類分析能夠?qū)σl(fā)交通事故的不規(guī)范駕駛行為進(jìn)行識(shí)別,為規(guī)范駕駛行為提供重要依據(jù)。
譜系聚類;公路運(yùn)輸;駕駛行為
隨著經(jīng)濟(jì)的發(fā)展,公路運(yùn)輸作為重要的運(yùn)輸方式不可避免地承擔(dān)著越來越多的運(yùn)輸任務(wù),與此同時(shí),公路運(yùn)輸中交通事故也在不斷發(fā)生。據(jù)有關(guān)數(shù)據(jù)顯示,全球每年因公路交通事故都會(huì)使超過120萬的人失去生命,經(jīng)濟(jì)損失數(shù)目巨大[1]。
國外關(guān)于公路運(yùn)輸事故的數(shù)據(jù)分析中,由人為因素引發(fā)的公路運(yùn)輸事故占了全部交通事故的80%~90%,國內(nèi)有關(guān)數(shù)據(jù)分析中,在公路運(yùn)輸事故中92.9%的事故都是人為因素引發(fā)的[2]。很明顯,在公路運(yùn)輸“人—車—貨物及環(huán)境”系統(tǒng)中,車輛駕駛員的駕駛行為是導(dǎo)致公路運(yùn)輸交通事故的重要因素。本文利用譜系聚類法對(duì)公路運(yùn)輸中的駕駛行為進(jìn)行研究,對(duì)引發(fā)交通事故的駕駛行為進(jìn)行分析,為駕駛行為識(shí)別和駕駛員行車習(xí)慣分析提供支持,從而為公路運(yùn)輸安全提供重要保證。
聚類分析是一種基于統(tǒng)計(jì)學(xué)對(duì)未知類屬樣品進(jìn)行區(qū)分和歸類的一種手段方法。對(duì)所獲得樣品對(duì)象的程度大小進(jìn)行評(píng)估,最終將某種特征相同或者比較接近的樣品對(duì)象看作一類,反之看作不同類。聚類分析的結(jié)果具有很多研究價(jià)值,比如提供實(shí)驗(yàn)猜測(cè)的依據(jù),判別獲得新數(shù)據(jù)的類屬等應(yīng)用[3]。
聚類分析根據(jù)分類對(duì)象的不同,即對(duì)樣品的分類還是對(duì)變量的分類,可以分為Q型分析(前者)和R型分析(后者)。Q型聚類常常把樣品的相似度以距離的形式來度量,這種聚類分析方法的特點(diǎn):對(duì)樣品的特征進(jìn)行不同維數(shù)的數(shù)據(jù)采集處理和分析;清晰地呈現(xiàn)出分類結(jié)果,分類結(jié)果能夠通過聚類譜系圖把初始數(shù)據(jù)用圖樣表示出來;通過比較可知該聚類分析方式的分類結(jié)果具有合理性和全面性。
譜系聚類法在眾多的聚類方法中是一種非常有效的分類方法。譜系聚類法通過對(duì)各個(gè)樣品間相似程度的度量用距離進(jìn)行統(tǒng)計(jì)學(xué)數(shù)字化,把距離相同或者距離最小的樣品聚成一個(gè)小類;通過類間距離的計(jì)算進(jìn)行類間相似度的評(píng)估,把小類聚合成較大的類,最后將所有樣品聚合成一個(gè)大類,形成一個(gè)各類相似度不斷減小,類間距離不斷增大的譜系圖[4]。
公路運(yùn)輸中的大部分交通事故都與不規(guī)范的駕駛行為有關(guān),比如加塞、變道超車、超速、遇障礙急剎車等駕駛行為[5]。不規(guī)范的駕駛行為是造成公路運(yùn)輸中交通事故的重要原因,通過不規(guī)范駕駛行為對(duì)以往交通事故引發(fā)因素的數(shù)據(jù)進(jìn)行聚類分析,找出與外部影響因素的關(guān)系,對(duì)改善交通安全狀況,提高公路運(yùn)輸效率有著極其重要的研究價(jià)值和經(jīng)濟(jì)效益[6]。
2.1駕駛行為類間距離定義
本文對(duì)引發(fā)公路運(yùn)輸交通事故的不規(guī)范駕駛行為進(jìn)行聚類分析,聚類的各駕駛行為作為不同樣品,所以此處關(guān)于樣品的譜系聚類法依據(jù)Q型聚類方式討論。Q型聚類方式是通過對(duì)類間距離的大小評(píng)估類間相似程度大小進(jìn)行劃分類別。
類間距離的大小會(huì)根據(jù)不同的類間距離定義而產(chǎn)生不同的計(jì)算結(jié)果,類間距離的定義有下面幾種。
圖1 最長、最短距離示意
(3)類平均距離:通過計(jì)算類間所有樣品之間距離的平均值作為兩類之間的距離。
類平均距離還可以描述為:通過類間所有樣品之間的平方距離的平均記為兩類之間的距離。
(4)重心距離:用兩類重心之間的距離作為兩類距離。
(5)離差平方和距離:由Ward依據(jù)方差分析的思想提出來的。
在聚類樣品時(shí)依據(jù)需要選擇不同距離定義進(jìn)行聚類或者選擇不同距離定義比較聚類結(jié)果。
2.2駕駛行為譜系聚類法步驟
(1)確定要用的距離定義,包括樣品距離和類間距離。此處以d(xi,xj)表示樣品i與j間的距離,記為dij。類間距離按照上述幾種距離定義選擇,此處選擇最小距離定義來計(jì)算類間距離。
(2)聚類樣品開始時(shí)有n個(gè)樣品就當(dāng)作n個(gè)類,然后對(duì)n個(gè)類相互之間的距離進(jìn)行計(jì)算,得出一個(gè)行向量,通過三角化得到一個(gè)對(duì)稱矩陣。
此時(shí),Dpq=dpq。
(3)選擇找出D(0)非對(duì)角線上的數(shù)據(jù)最小的元素Dpq。這時(shí)Gp={xp},Gq={xq}。將Gp、Gq合在一起組成一個(gè)類Gr={Gp,Gq}。這時(shí)類個(gè)數(shù)就減少了一個(gè)變成了n-1個(gè),所以得到新的矩陣距離D(1),這個(gè)新的矩陣是n-1階方陣。
(4)從D(1)新矩陣經(jīng)歷步驟(3)的過程,得到下一個(gè)新矩陣D(2)。再由D(2)重復(fù)上述步驟,最后n個(gè)樣品聚為一個(gè)大類的時(shí)候停止。
(5)在上述類別聚合的過程中,對(duì)被聚合的樣品號(hào)碼和聚合時(shí)候的相似程度要給以記錄,并把聚合過程的聚類譜系圖繪制出來。
根據(jù)《中華人民共和國道路交通事故統(tǒng)計(jì)年報(bào)(2010—2012)》,引發(fā)事故發(fā)生的因素主要有視野、行車道路環(huán)境、車身性能和其他的原因,不規(guī)范駕駛行為誘發(fā)事故的因素統(tǒng)計(jì)見表1[7]。
表1 不規(guī)范駕駛行為誘發(fā)事故因素統(tǒng)計(jì)表 次
下面進(jìn)行譜系聚類的Matlab實(shí)現(xiàn),利用最短距離法將其分為3類。
(1)在Matlab中依據(jù)樣品類型輸入數(shù)據(jù)矩陣,每一種駕駛行為看作一個(gè)樣品,作為數(shù)據(jù)矩陣的行向量,事故的各種誘因作為樣品的樣本特征看作數(shù)據(jù)矩陣的列向量輸入。
(2)利用軟件函數(shù)(d=pdist(A),A為數(shù)據(jù)矩陣)進(jìn)行計(jì)算各樣品之間的距離d。此處d為每兩行之間距離的一個(gè)行向量。
(3)利用軟件函數(shù)(z=linkage(d),求得z為類間最小距離)進(jìn)行不同類間距離計(jì)算并進(jìn)行聚類,行表示類。最后將得到的距離矩陣?yán)妹顃ril(squareform(z))進(jìn)行處理,最終得到一個(gè)三角矩陣D。
(4)將上述矩陣?yán)肧AS進(jìn)行譜系聚類處理,按最短距離法聚為3類,得到譜系聚類如圖2所示。
圖2 將各類駕駛行為聚為3類的譜系聚類
通過譜系聚類圖可以看出:超速行為u1自成一類;操作失誤u2、超載行為u3分為一類;其他7項(xiàng)分為一類。結(jié)合初始數(shù)據(jù)表可以看出,在實(shí)際的車輛安全事故中,超速行駛是最容易引發(fā)事故的現(xiàn)象,因此超速行為被單獨(dú)聚類成一個(gè)大類是符合現(xiàn)實(shí)的。
此外,操作失誤和超載行為被聚成一個(gè)大類,結(jié)合聚類圖譜和初始數(shù)據(jù)容易看出,道路環(huán)境的復(fù)雜變化性是操作失誤和超載行為引發(fā)事故的非常突出的因素。實(shí)際公路運(yùn)輸中,由于超載會(huì)使車輛的正常駕駛模式失效,在道路環(huán)境發(fā)生變化時(shí)不能及時(shí)避免事故發(fā)生,從而造成車禍;在復(fù)雜多變的道路環(huán)境中,駕駛員也很容易發(fā)生操作失誤行為,從而引發(fā)交通安全事故。道路環(huán)境因素是引發(fā)超載和操作失誤行為類事故的突出因素,因此數(shù)據(jù)聚類的結(jié)果是符合實(shí)際意義的。現(xiàn)實(shí)中經(jīng)常發(fā)生車輛因超載、超員而產(chǎn)生的公路運(yùn)輸交通事故,在高速公路以及城市交通中一個(gè)錯(cuò)誤的操作就可能帶來嚴(yán)重的交通安全事故,因此超速行為和操作錯(cuò)誤行為聚成的大類圖譜結(jié)果和現(xiàn)實(shí)情況也是非常符合的。
其他7類現(xiàn)象的樣品特征相似度比較高,所以其他7類駕駛行為就聚合成了一個(gè)大類。結(jié)合圖譜和初始數(shù)據(jù)很容易發(fā)現(xiàn)圖譜和初始數(shù)據(jù)是一致的,這幾類不規(guī)范駕駛行為造成公路運(yùn)輸安全事故的因素是多種因素綜合影響的結(jié)果,單一因素雖然相比較于前面兩個(gè)大類的駕駛行為的危險(xiǎn)程度相對(duì)小一點(diǎn),但是每一個(gè)引發(fā)事故的因素都不可忽視。
本文依據(jù)影響駕駛行為的因素,將引發(fā)交通事故的不規(guī)范駕駛行為進(jìn)行譜系聚類法分析,相似度接近的行為聚合為一類,聚類結(jié)果的圖譜和現(xiàn)實(shí)背景具有一致性。通過成功應(yīng)用譜系聚類法分析引發(fā)事故的不規(guī)范行為,說明聚類法在公路運(yùn)輸安全領(lǐng)域是可以用來分析事故原因以及公路運(yùn)輸安全影響潛在因素的威脅程度,由此可以對(duì)駕駛行為進(jìn)行規(guī)范,對(duì)駕駛行為進(jìn)行預(yù)判以及實(shí)時(shí)駕駛機(jī)動(dòng)模式的判別等。
[1]張興儉.基于駕駛行為個(gè)體特征的酒后駕駛狀態(tài)識(shí)別方法研究[D].北京:北京工業(yè)大學(xué),2014.
[2]肖獻(xiàn)強(qiáng).基于信息融合的駕駛行為識(shí)別關(guān)鍵技術(shù)研究[D].合肥:合肥工業(yè)大學(xué),2011.
[3]楊淑瑩,張樺.模式識(shí)別與智能計(jì)算—MATLAB技術(shù)實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2015:16.
[4]范金城,梅長林.?dāng)?shù)據(jù)分析[M].2版.北京:科學(xué)出版社,2010:198-202.
[5]成波,徐少兵,王文軍,等.激進(jìn)駕駛狀態(tài)識(shí)別算法研究[J].汽車工程,2014,36(7):784-789.
[6]牛增良,李海斌,王文峰,等.基于聚類分析的營運(yùn)駕駛?cè)宋kU(xiǎn)駕駛行為研究[J].山東交通學(xué)院學(xué)報(bào),2014,22(1):19-23.
[7]公安部交通管理局.中華人民共和國道路交通事故統(tǒng)計(jì)年報(bào)(2010—2012)[R].北京:公安部交通管理局,2012.
(編輯:史海英)
Road Transportation Driving Behavior Based on Pedigree Cluster
LI Yueming1, ZHENG Guixing2, CHE Yahui1, WANG Peng1
(1.Postgarduate Training Brigade, Military Transportation University, Tianjin 300161, China;2.General Courses Department, Military Transportation University, Tianjin 300161, China)
To regularize driving behavior and improve road transportation safety, the paper studies the relation between driving behavior in road transportation accidents and its causes. It analyzes driving behavior with related mathematical software based on pedigree cluster and verifies it with 2010—2012 road traffic accident statistics as the example, and provides cluster map on driving behaviors caused traffic accidents. The result shows that irregular driving behaviors are the important causes for traffic accidents. Cluster analysis can identify irregular driving behaviors causing traffic accidents, which can provide important basis for regulating driving behaviors.
pedigree cluster; road transportation; driving behavior
2016-03-20;
2016-04-24.
李月明(1990—),男,碩士研究生;
鄭貴省(1975—),男,教授,碩士研究生導(dǎo)師.
10.16807/j.cnki.12-1372/e.2016.10.022
U471.1
A
1674-2192(2016)10- 0092- 04