王巖
摘要:本文采用數(shù)量積法,對選取的交通事故數(shù)據(jù)進行模糊聚類分析。結(jié)果表明,模糊聚類方法對于事故分析是有一定的作用的。
關(guān)鍵詞:模糊聚類;交通事故;分類
在道路交通中,常常要對一些交通事故進行分類分析,以找出其中的內(nèi)在規(guī)律。由于各事故之間在很多方面并沒有一個截然的區(qū)別界限,所以分類本身就帶有模糊性。我們可以采用模糊方法對已有的事故資料進行模糊聚類,也就是說,找出他們在什么程度上屬于一類,在什么程度上不屬于一類,從而便于對事故進行進一步的分析。
為了對交通事故分類分析方法進行研究,本文選取107國道351條事故數(shù)據(jù),通過去處一些明顯錯誤和不適合的數(shù)據(jù),得到249條數(shù)據(jù)。取死亡一人及一人以上的重大事故作為研究對象,那么通過檢索,得到了符合要求的事故數(shù)據(jù)共39條。
一、建立相似關(guān)系
在模糊聚類中,建立相似關(guān)系的方法有很多,此處采用數(shù)量積法,亦即:
其中,M為一適當(dāng)?shù)恼龜?shù),它滿足
為了便于采用數(shù)量積法建立相似關(guān)系,對上述數(shù)據(jù)進行一些處理。
1.1 對“事故具體地點”項的處理
該次統(tǒng)計地段的起點到終點是從107國道的1445公里處----1620公里處。對地點數(shù)據(jù)進行重新標(biāo)定。具體方法是:
處理后地點數(shù)據(jù)=(事故具體地點-1445)/175*10
1.2 事故損失金額
所有事故中最大損失金額為200000元。據(jù)此對地點數(shù)據(jù)進行標(biāo)定,具體方法是:
處理后事故損失金額數(shù)據(jù)=損失金額/200000*10
經(jīng)過處理,將事故地點和事故損失金額都在1—10的范圍內(nèi)進行了標(biāo)定,以避免數(shù)據(jù)數(shù)量級的不同對相似關(guān)系建立的影響。
二、求模糊等價矩陣
用上述方法求得的相似矩陣還不具有傳遞性,即還不是模糊等價矩陣。為此,我們應(yīng)把它改造成模糊等價矩陣R*。也就是求R2,R4,R8,…一直到使R2n=R2(n+1),此時的R2n即為所求的R*。
上面的相似矩陣經(jīng)過自乘,可求得模糊等價矩陣:
三、按照不同的λ值進行聚類
然后,把數(shù)據(jù)輸入模糊聚類計算程序,可以得到:
當(dāng)λ=0.7時得到的截矩陣為
當(dāng)λ=0.8時得到的截矩陣為
當(dāng)λ=0.9時得到的截矩陣為:
可見:
● 當(dāng)λ=0.7時,第2,3,5,8,13,14,15,16,17,20,25,28,29,34,35項是相同的,
● 當(dāng)λ=0.8時,第2,3,5,8,13,14,15,16,17,20,25,28,29,34,35項是相同的
● 當(dāng)λ=0.9時,第2,3,5,8,13, 15,16,17,20,25,28,29,34,35項是相同的
我們把由模糊聚類分出的數(shù)據(jù)挑選出來。經(jīng)過分析可以看出:
1、 事故發(fā)生地點集中在國道1605公里—1622公里之間,共有13起,占重大事故總數(shù)39起的33.33%,而事故數(shù)據(jù)收集地點是從國道1535公里——國道1671公里,總長136公里,而該路段只占總路段長度的10.3%。可見,該路段的重大事故發(fā)生率明顯偏高,
2、 在這15起事故中,有非機動車損失的只有3起,可見這類事故主要是發(fā)生在機動車和機動車之間或機動車與行人之間。
3、 就以上分析來看,模糊聚類方法對于事故分析是有一定的作用的。