夏萍萍 ,魏麗英,馬壯林
(1.北京交通大學(xué)交通運(yùn)輸學(xué)院,北京 100044;2.長(zhǎng)安大學(xué)汽車(chē)學(xué)院,陜西 西安 710064)
截至2011年底,我國(guó)高速公路里程已達(dá)8.5 萬(wàn)km。高速公路里程的逐年增加,方便了人們的出行,促進(jìn)了社會(huì)的發(fā)展,但也突顯了我國(guó)重特大交通事故頻發(fā)的高速公路安全性問(wèn)題。據(jù)統(tǒng)計(jì),2010年我國(guó)高速公路里程占公路通車(chē)總里程的1.85%,而其事故起數(shù)和死亡人數(shù)分別占公路交通事故總數(shù)的7.76%和13.54%;高速公路百公里事故率和死亡率分別約為普通公路的4.47 和8.31 倍[1]。由此可見(jiàn),我國(guó)亟需提高對(duì)高速公路交通安全的重視程度,加強(qiáng)對(duì)高速公路交通事故影響因素的專(zhuān)題研究,從而改善我國(guó)高速公路的安全現(xiàn)狀。
國(guó)內(nèi)外學(xué)者先后在事故致因機(jī)理方面開(kāi)展了較為豐富的研究。Poch 等[2]搜集了63 個(gè)十字交叉口7年的事故數(shù)據(jù),運(yùn)用負(fù)二項(xiàng)回歸擬合了入口水平的追尾事故起數(shù)模型。Yan 等[3]運(yùn)用雙重邏輯回歸模型對(duì)事故點(diǎn)車(chē)道數(shù)、限速值等因素進(jìn)行了信號(hào)交叉口事故特征的研究。Wang 等[4]采用帶有不同關(guān)聯(lián)函數(shù)的廣義估計(jì)方程對(duì)信號(hào)交叉口追尾事故起數(shù)建模,結(jié)果表明追尾事故間有很高的相關(guān)性。Chang[5]分別采用負(fù)二項(xiàng)回歸和人工神經(jīng)網(wǎng)絡(luò)算法,構(gòu)建了高速公路交通事故的起數(shù)模型。張生瑞等[6]結(jié)合高速公路隧道交通事故的特點(diǎn)及隧道出入口的道路特征,進(jìn)行了事故多發(fā)段的成因分析,提出了隧道群交通事故的預(yù)防對(duì)策。馬明等[7]利用基于3 種作業(yè)相關(guān)結(jié)構(gòu)的廣義估計(jì)方程負(fù)二項(xiàng)模型擬合了87 個(gè)信號(hào)交叉口的事故數(shù)據(jù),結(jié)果表明基于自回歸型相關(guān)結(jié)構(gòu)的廣義估計(jì)方程回歸模型擬合效果最優(yōu)。但是,現(xiàn)有成果大多以針對(duì)信號(hào)交叉口和高速公路隧道群等特殊事故點(diǎn)的追尾事故的研究為主,而面向高速公路全路段各種形態(tài)交通事故的系統(tǒng)性研究還不多見(jiàn)。
本文較為深入地剖析了高速公路交通事故的主要影響因素,構(gòu)建了基于負(fù)二項(xiàng)回歸的高速公路交通事故時(shí)空分析模型,量化分析了各種時(shí)空因素對(duì)交通事故的影響程度,最后以某高速公路典型危險(xiǎn)路段為例,驗(yàn)證了模型的可用性。
以系統(tǒng)觀(guān)點(diǎn)來(lái)看,交通事故是由人、車(chē)、路、環(huán)境間的不協(xié)調(diào)所致。單從時(shí)間角度分析,事故率與交通量大致呈“U”形關(guān)系,與交通組成和不良天氣存在某些聯(lián)系[8-9];單從空間角度分析,道路平縱線(xiàn)形及線(xiàn)形組合影響著交通事故的發(fā)生。本文采用定長(zhǎng)法將研究對(duì)象劃分為若干路段,每段長(zhǎng)度為1 km,從時(shí)間和空間角度選取9 個(gè)候選自變量,以每一路段的年交通事故起數(shù)為因變量,構(gòu)建高速公路交通事故時(shí)空分析模型。各候選自變量概念如下,部分自變量公式見(jiàn)表1。
(1)交通量。表示在指定時(shí)段內(nèi),通過(guò)道路某一斷面或某一車(chē)道的交通實(shí)體數(shù)。本文以研究對(duì)象的年平均日交通量對(duì)數(shù)作為模型的自變量。
(2)大車(chē)比例。本文以載重超過(guò)5 t 的貨車(chē)和座位超過(guò)19 座的客車(chē)之和來(lái)計(jì)算大車(chē)比例。
(3)彎曲比。表示在指定路段內(nèi),曲線(xiàn)長(zhǎng)度之和占路段總長(zhǎng)的比例,記作Ri。
(4)平均曲率。表示在指定路段內(nèi),各線(xiàn)形要素曲率的平均值,記作Ci。
(5)曲率變化率。表示在指定路段內(nèi),單位長(zhǎng)度平曲線(xiàn)的角度變化之和,記作Ki。
(6)曲線(xiàn)頻率。表示在指定路段內(nèi),含有不同類(lèi)型、不同半徑的曲線(xiàn)的條數(shù),記作Fi。本文以1 km 定長(zhǎng)路段為單位,清算每一路段內(nèi)包含的曲線(xiàn)數(shù)量。
(7)平均坡度。表示在指定路段內(nèi),縱坡坡度的加權(quán)平均值,記作Gi。
表1 自變量計(jì)算公式Table 1 Formula of independent variables
(8)連續(xù)下坡累積效應(yīng)。高速公路連續(xù)下坡對(duì)車(chē)輛制動(dòng)性能的影響有明顯的“后效性”,即從坡頂出發(fā),行駛距離越長(zhǎng),制動(dòng)器性能下降幅度越大,直至制動(dòng)器“熱衰退”而失效,引發(fā)交通事故。為描述連續(xù)下坡路段對(duì)行車(chē)安全的這種影響,受土壤學(xué)中“地形因子”[10]的啟發(fā),本文提出長(zhǎng)大下坡路段“連續(xù)下坡累積效應(yīng)”的概念,將其定義如下:
首先,計(jì)算第l 個(gè)路段的坡度因子Sl和坡長(zhǎng)因子Ll,進(jìn)而計(jì)算改善的LS 因子El。其次,假設(shè)當(dāng)累積下坡長(zhǎng)度超過(guò)5 km 時(shí),相鄰坡段之間存在指數(shù)影響關(guān)系[11],計(jì)算第l -1 個(gè)坡段對(duì)第l 個(gè)坡段的影響系數(shù)Fl。最后,計(jì)算第i 個(gè)路段的連續(xù)下坡累積效應(yīng)Di。
整個(gè)計(jì)算過(guò)程如下:
其中θl,λl分別為第l 個(gè)縱坡的坡度和坡長(zhǎng)(轉(zhuǎn)換為角度),Gl為第l 個(gè)坡段的縱坡坡度(%),Lil為位于第i 個(gè)路段內(nèi)的第l 個(gè)坡段的長(zhǎng)度。
(9)連續(xù)轉(zhuǎn)彎。為衡量高速公路平面線(xiàn)形的連續(xù)性,本文提出“連續(xù)轉(zhuǎn)彎”的概念,將其定義為在某一研究路段內(nèi),是否存在相鄰的兩個(gè)或兩個(gè)以上轉(zhuǎn)向相反的彎道的情況。由此可見(jiàn),連續(xù)轉(zhuǎn)彎是一個(gè)二元變量,如果第i 個(gè)路段內(nèi)存在兩條或兩條以上轉(zhuǎn)向相反的平曲線(xiàn),那么該路段的連續(xù)轉(zhuǎn)彎值就取為1;反之,連續(xù)轉(zhuǎn)彎值取為0。
高速公路交通事故起數(shù)屬于離散型計(jì)數(shù)數(shù)據(jù),通??梢圆捎貌此苫貧w模型來(lái)進(jìn)行離散型計(jì)數(shù)數(shù)據(jù)的處理。泊松回歸以事件起數(shù)Y 為研究對(duì)象,以y 表示事件起數(shù)的觀(guān)測(cè)值,假設(shè)事件的發(fā)生遵循泊松分布,隨機(jī)變量Y 等于y 的概率,則其分布密度函數(shù)為
然而,泊松回歸要求樣本均值等于或者接近樣本方差,當(dāng)二者差異較大時(shí)若仍采用泊松回歸進(jìn)行擬合,將導(dǎo)致第一類(lèi)誤差的增加。事實(shí)上,高速公路交通事故起數(shù)的方差通常遠(yuǎn)大于其均值,即產(chǎn)生過(guò)度離散現(xiàn)象,此時(shí)負(fù)二項(xiàng)回歸模型比泊松回歸模型更適合于數(shù)據(jù)的擬合。負(fù)二項(xiàng)分布是一個(gè)連續(xù)的混合泊松分布,它允許泊松均值服從分布。如果將獨(dú)立樣本表示為Xi,Yi(i=1,2,…,n),那么Y 的概率分布表達(dá)式為
其中Y 為指定地點(diǎn)和指定時(shí)段內(nèi)發(fā)生交通事故的隨機(jī)變量;y 為指定地點(diǎn)和指定時(shí)段內(nèi)預(yù)測(cè)發(fā)生的交通事故起數(shù);μ 為指定地點(diǎn)和指定時(shí)段內(nèi)預(yù)測(cè)發(fā)生的平均事故起數(shù);k 為離散系數(shù),k 值越大,離散性越大。
負(fù)二項(xiàng)模型的參數(shù)估計(jì)可采用最大似然函數(shù)法(MLE)來(lái)進(jìn)行,似然函數(shù)的形式為
如果以1年為時(shí)間間隔來(lái)分析高速公路不同路段的交通事故起數(shù),那么建立的單位里程路段年交通事故起數(shù)時(shí)空分析模型的表達(dá)式為
其中λij為第i 個(gè)路段第j年的交通事故起數(shù);Qij為第i 個(gè)路段第j年的交通量;T 為統(tǒng)計(jì)時(shí)間,T=365 d;xijk為第i 個(gè)路段第j年第k 個(gè)自變量;a0、ak為模型參數(shù)。
由于不能保證9 個(gè)候選自變量對(duì)因變量都有顯著影響,故本文選用理論上最佳的反向逐步選擇法進(jìn)行時(shí)空分析模型自變量的篩選,即先將9 個(gè)自變量全部選入方程,然后作F 檢驗(yàn),每一步只剔除方程中偏回歸平方和最小(P 值最大)的一個(gè)變量,然后對(duì)剩余自變量建立新的回歸方程。重復(fù)上述過(guò)程,直至方程中所有自變量都有統(tǒng)計(jì)學(xué)意義(取顯著性水平α=0.05)為止。反向逐步選擇法的流程見(jiàn)圖1。
本文采用極大似然估計(jì)法對(duì)模型進(jìn)行參數(shù)估計(jì),即在總體類(lèi)型已知條件下,某一試驗(yàn)有n 個(gè)可能的結(jié)果:A1,…,An,當(dāng)進(jìn)行試驗(yàn)時(shí),若事件發(fā)生了,則認(rèn)為事件Ai出現(xiàn)的概率最大。定義似然函數(shù)為L(zhǎng)(θ),用L(θ)達(dá)到最大值去估計(jì)θ。
分別采用回歸系數(shù)的顯著性檢驗(yàn)、擬合優(yōu)度檢驗(yàn)、AIC 準(zhǔn)則(Akaike information criterion) 和 BIC(Bayesian Information Criterion)準(zhǔn)則來(lái)檢驗(yàn)?zāi)P偷挠行?。AIC 準(zhǔn)則是一種用于衡量統(tǒng)計(jì)模型擬合優(yōu)良性的方法,該準(zhǔn)則借助信息論,按照使AIC 值達(dá)到最小來(lái)對(duì)模型定階。假設(shè)模型誤差服從獨(dú)立正態(tài)分布,那么極大似然估計(jì)的對(duì)數(shù)似然函數(shù)和相應(yīng)的AIC 值分別如下式所示,式中p 是模型中待估計(jì)的參數(shù)個(gè)數(shù)。
圖1 反向逐步選擇法流程Fig.1 Flowchart of backward stepwise selection
在AIC 準(zhǔn)則中,p 取值越小,模型越簡(jiǎn)潔,AIC 值越小;對(duì)數(shù)似然函數(shù)取值越大,模型越精確,AIC 值越小。因此AIC 準(zhǔn)則兼顧了簡(jiǎn)潔性和精確性,AIC 值越小時(shí),模型擬合程度越好。AIC 準(zhǔn)則用于尋找可以最好地解釋數(shù)據(jù)并且包含最少自由參數(shù)的模型,但在大樣本數(shù)據(jù)時(shí),由于似然函數(shù)值太大,會(huì)淹沒(méi)模型參數(shù)p 的影響,此時(shí)可以采用BIC 準(zhǔn)則,其計(jì)算式如下,式中n 為模型中觀(guān)察值的數(shù)量。
BIC 準(zhǔn)則考慮了樣本數(shù)據(jù)的影響,由極小化BIC 準(zhǔn)則定出的估計(jì)值一般要比AIC 得到的估計(jì)值更低。在進(jìn)行回歸分析時(shí),BIC 的值越小,其擬合程度越好。
京港澳高速公路是我國(guó)國(guó)家級(jí)交通運(yùn)輸大動(dòng)脈,其中粵境北段K39 +180~K52 +180 穿行于崇山峻嶺之中,自2003年建成通車(chē)至2005年底,該路段共發(fā)生481 起交通事故?,F(xiàn)以該路段為研究對(duì)象,進(jìn)行高速公路交通事故時(shí)空分析模型的實(shí)證性研究。由該路段的事故統(tǒng)計(jì)數(shù)據(jù)可得到3年內(nèi)每起事故發(fā)生的時(shí)間和地點(diǎn),測(cè)算設(shè)計(jì)施工圖可得到路段的線(xiàn)形指標(biāo),另外還可得到每天的分車(chē)型交通量。該路段由16 個(gè)連續(xù)下坡坡段組成,最大縱坡坡度為-4.6%/km,最小圓曲線(xiàn)半徑為600 m。采用定長(zhǎng)法將其劃分為13 個(gè)每段1 km 的路段,搜集了連續(xù)3年的交通事故縱向數(shù)據(jù),共得到474 個(gè)有效事故樣本點(diǎn)。
將研究路段的事故數(shù)據(jù)按13 個(gè)路段和3 個(gè)不同年份進(jìn)行統(tǒng)計(jì),得到39 個(gè)不同路段、不同年份的交通事故起數(shù)統(tǒng)計(jì)樣本,由此計(jì)算出該路段交通事故的均值和方差分別為
由上式可知,這段高速公路事故多發(fā)段事故起數(shù)的方差是其均值的14.67 倍,數(shù)據(jù)方差遠(yuǎn)大于均值,數(shù)據(jù)過(guò)離散,因此采用負(fù)二項(xiàng)回歸來(lái)進(jìn)行擬合在理論上較為合適。
采 用 SAS 軟 件 STAT 模 塊 的GENMOD 過(guò)程[12]對(duì)由9 個(gè)自變量構(gòu)建的基于路段長(zhǎng)度一致的高速公路交通事故起數(shù)負(fù)二項(xiàng)回歸模型進(jìn)行數(shù)據(jù)擬合;本文取顯著性水平為0.05,每次剔除一個(gè)α >0.05 的最不符合的變量,并對(duì)剩余變量再次擬合,直至模型中各自變量都有統(tǒng)計(jì)學(xué)意義為止,最終得到的各變量估計(jì)值和檢驗(yàn)值見(jiàn)表2。
表2 各變量的估計(jì)值和檢驗(yàn)值Table 2 Estimated values and test values of variables
表2 中各參數(shù)的P 值均小于0.05,說(shuō)明各變量都有顯著的統(tǒng)計(jì)學(xué)意義。將各自變量的估計(jì)值帶入模型中,得到高速公路交通事故起數(shù)負(fù)二項(xiàng)回歸時(shí)空分析模型的表達(dá)式如下:
其中x2為大車(chē)比例;x3為彎曲比;x7為平均坡度;x8為連續(xù)下坡累積效應(yīng)。
由上式可知,高速公路交通事故率與路段彎曲比、連續(xù)下坡累積效應(yīng)等呈正相關(guān);與平均坡度、大車(chē)比例等呈負(fù)相關(guān);大車(chē)比例是交通事故的首要影響因素,其次是路段彎曲比、平均坡度和連續(xù)下坡累積效應(yīng)。為減少高速公路交通事故,應(yīng)適當(dāng)提高車(chē)流中的大車(chē)比例、減少?gòu)澢范螖?shù)量、降低下坡坡度。除大車(chē)比例外的其他3 個(gè)變量對(duì)事故率的影響符合通常思維,無(wú)需贅述,故這里僅對(duì)大車(chē)比例對(duì)交通事故的影響做進(jìn)一步的分析。筆者認(rèn)為,由于研究對(duì)象為貨車(chē)主導(dǎo)的山區(qū)高速公路,其大車(chē)比例通常較高,故當(dāng)小車(chē)增多,大車(chē)比例下降時(shí),車(chē)輛速度差增加,自由度變大,因而發(fā)生交通事故的概率增大。
本文采用擬合優(yōu)度檢驗(yàn)?zāi)P蛯?duì)樣本觀(guān)測(cè)值的擬合程度,SAS 軟件給出的擬合優(yōu)度檢驗(yàn)中,異方差為36.137 7,皮爾遜χ2檢驗(yàn)值為38.832 1,對(duì)數(shù)似然檢驗(yàn)值為-18.068 9,由此計(jì)算出模型的AIC 值為46.1378,BIC 值為44.093 1,說(shuō)明構(gòu)建的負(fù)二項(xiàng)回歸分析模型擬合良好。另外,GENMOD 過(guò)程可產(chǎn)生第一類(lèi)檢驗(yàn)和第三類(lèi)檢驗(yàn),分別為因變量總離差平方和中能解釋部分所占的比例(即F 統(tǒng)計(jì)量)和各斜率項(xiàng)是否為0 (H0:βj=0)的檢驗(yàn)結(jié)果。SAS 給出的模型第一類(lèi)和第三類(lèi)檢驗(yàn)分別見(jiàn)表3 和表4,表中P 值均不超過(guò)0.05,表明在α=0.05 的顯著水平下,各自變量都有統(tǒng)計(jì)意義,即各自變量對(duì)高速公路交通事故的影響都是顯著的。
表3 模型的第一類(lèi)檢驗(yàn)分析Table 3 TypeⅠanalysis of the model
表4 模型的第三類(lèi)檢驗(yàn)分析Table 4 Type Ⅲanalysis of the model
本文分析了高速公路交通事故的顯著影響因素,提出了“連續(xù)下坡累積效應(yīng)”的概念,構(gòu)建了基于負(fù)二項(xiàng)回歸的高速公路交通事故時(shí)空分析模型,并對(duì)京港澳高速粵境北段進(jìn)行了實(shí)證性研究。分析表明,事故率與路段彎曲比和連續(xù)下坡累積效應(yīng)呈正相關(guān),與平均坡度和大車(chē)比例呈負(fù)相關(guān),大車(chē)比例對(duì)事故率影響程度最大。該結(jié)論適用于我國(guó)山區(qū)高速公路交通事故的成因分析。由于未能取得車(chē)流速度差和天氣情況等數(shù)據(jù),故本文在建模過(guò)程中未予考慮,全面分析高速公路交通事故影響因素還有待于進(jìn)一步的探討。
[1]公安部交通管理局.中華人民共和國(guó)道路交通事故統(tǒng)計(jì)年報(bào)(2010年度)[R].無(wú)錫:公安部交通管理科學(xué)研究所,2011.
[2]POCH M,MANNERING F.Negative binomial analysis of intersection-accident frequencies[J].Journal of transportation engineering,1996,122(2):105 -113.
[3]YAN X,RADWAN E,ABDEL-ATY M.Characteristics of rear-end accidents at signalized intersections using multiple logistic regression model[J].Accident Analysis & Prevention,2005,37(6):983 -995.
[4]WANG X,ABDEL-ATY M.Temporal and spatial analyses of rear-end crashes at signalized intersections[J].Accident Analysis &Prevention,2006,38(6):1137 -1150.
[5]CHANG L Y.Analysis of freeway accident frequencies:Negative binomial regression versus artificial neural network[J].Safety Science,2005,43(8):541 -557.
[6]張生瑞,馬壯林,石強(qiáng).高速公路隧道群交通事故分布特點(diǎn)及預(yù)防對(duì)策[J].長(zhǎng)安大學(xué)學(xué)報(bào):自然科學(xué)版,2007,27(1):63 -66.
[7]馬明,嚴(yán)新平,吳超仲,等.信號(hào)交叉口交通事故頻次顯著影響因素的作用[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2010,40(2):417 -422.
[8]鐘連德,孫小端,陳永勝,等.高速公路大、小車(chē)速度差與事故率的關(guān)系[J].北京工業(yè)大學(xué)學(xué)報(bào),2007,33(2):185 -188.
[9]周爾波,劉瀾.災(zāi)害性天氣對(duì)高速公路交通安全的影響及對(duì)策[J].交通科技,2008,(4):94 -96.
[10]張宏鳴,楊勤科,劉晴蕊,等.基于GIS 的區(qū)域坡度坡長(zhǎng)因子提取算法[J].計(jì)算機(jī)工程,2010,36(9):246 -248.
[11]馬壯林.高速公路交通事故時(shí)空分析模型及其預(yù)防方法[D].北京:北京交通大學(xué),2010.
[12]SAS Institute Inc.SAS/ STAT 9.2 User's Guide The GENMOD Procedure[M].Cary,NC:SAS Institute Inc,2004.