高艷艷,陳秀鋒,曲大義,陳 偉
(青島理工大學(xué) 機(jī)械與汽車(chē)工程學(xué)院,青島266525)
隨著我國(guó)經(jīng)濟(jì)水平的提高,汽車(chē)保有量迅速增加,城市交通擁堵接踵而至。及時(shí)、準(zhǔn)確地提供道路交通狀態(tài)信息,出行者可以根據(jù)有效信息選擇合適的交通工具以及出行時(shí)間點(diǎn);交通組織者可以獲取實(shí)時(shí)道路交通狀態(tài),采取交通控制和誘導(dǎo)對(duì)策,從而有效提高城市出行效率,緩解路網(wǎng)交通擁堵。
目前,交通狀態(tài)判別主要從兩方面開(kāi)展:判別指標(biāo)、判別方法。城市道路交通狀態(tài)的判別指標(biāo)主要有流量、速度、占有率、密度和平均延誤等[1-3],關(guān)偉等[4]對(duì)不同密度下的交通速度分布特性進(jìn)行綜合分析,最終把一個(gè)城市道路交通流劃分為4種狀態(tài);戴學(xué)臻等[5]選取的判別指標(biāo)為車(chē)輛平均行程車(chē)速、道路網(wǎng)延誤時(shí)間比,利用集對(duì)化的分析方法與三角模糊化函數(shù)方法進(jìn)行實(shí)時(shí)耦合,構(gòu)建了城市道路交通運(yùn)行狀態(tài)識(shí)別模型;黃艷國(guó)等[6]選擇了3個(gè)樣本數(shù)據(jù)信息:流量、速度、占有率,并明確提出了一種道路交通運(yùn)行狀態(tài)實(shí)時(shí)化的判別分析方法,這種判別方法采用的是模糊C均值聚類(lèi)算法。K-means聚類(lèi)算法是判斷城市道路狀況最常用的方法之一,然而,由于聚類(lèi)數(shù)的確定難度大,對(duì)初始聚類(lèi)中心選擇更是無(wú)統(tǒng)一標(biāo)準(zhǔn),最終導(dǎo)致交通狀態(tài)判別結(jié)果與實(shí)際城市交通狀態(tài)不相匹配,這就需要對(duì)聚類(lèi)數(shù)和聚類(lèi)中心進(jìn)行優(yōu)化。針對(duì)這些問(wèn)題,F(xiàn)AYYAD U等[7]明確提出選擇多次迭代來(lái)更新采樣數(shù)據(jù)以獲得初始值,從而解決K-means算法嚴(yán)重依賴(lài)于初始聚類(lèi)中心選擇的問(wèn)題;卞彩峰等[8]采用粒計(jì)算,這一算法屬性分辨能力較強(qiáng),利用這一優(yōu)點(diǎn),使聚類(lèi)有效性函數(shù)對(duì)屬性值依賴(lài)降低,最終獲取最佳聚類(lèi)數(shù)。
交通流參數(shù)選取具有一定的隨機(jī)性,往往會(huì)影響判別結(jié)果的準(zhǔn)確性。K-means聚類(lèi)算法在一定程度上取得了實(shí)際效果,不過(guò)只是對(duì)聚類(lèi)數(shù)和初始聚類(lèi)中心進(jìn)行單一優(yōu)化,并未將兩者結(jié)合在一起,仍存在一定的不足。本文利用因子分析方法,對(duì)多個(gè)變量進(jìn)行相關(guān)性分析,選取出合適的交通流參數(shù),作為交通判別指標(biāo),并結(jié)合改進(jìn)K-means聚類(lèi)算法,探究交通流的運(yùn)行情況,從而對(duì)城市快速路交通狀態(tài)進(jìn)行判別。
本文所研究的對(duì)象是某城市約10 km快速路,交通流數(shù)據(jù)由兩部分組成:①感應(yīng)線圈檢測(cè)器進(jìn)行采集分析得到,包括流量q、速度v、占有率o。數(shù)據(jù)采集時(shí)間為某一個(gè)工作日0:00—24:00,每次數(shù)據(jù)采集時(shí)間間隔為5 min。該路段上某一截面命名為S,共有4條車(chē)道,每條車(chē)道上各有一個(gè)感應(yīng)線圈檢測(cè)器,分別為S1,S2,S3,S4。數(shù)據(jù)類(lèi)型如表1所示。②行程時(shí)間t數(shù)據(jù),利用Vissim仿真軟件,根據(jù)實(shí)測(cè)數(shù)據(jù)進(jìn)行標(biāo)定得到。
表1 數(shù)據(jù)類(lèi)型
感應(yīng)線圈檢測(cè)器共收集原始數(shù)據(jù)852條,缺失12條,為了保證結(jié)果更加準(zhǔn)確,現(xiàn)需要將缺失數(shù)據(jù)進(jìn)行補(bǔ)充完整,數(shù)據(jù)具體處理方法如下:
1) 缺失數(shù)據(jù)的補(bǔ)充。由于本文數(shù)據(jù)僅缺失12條,屬于少量數(shù)據(jù)缺失范疇,數(shù)據(jù)采集時(shí)間間隔較短,所以行駛狀態(tài)不會(huì)發(fā)生太大的變化,基于以上特性,為保持?jǐn)?shù)據(jù)的完整性,同時(shí)也要求計(jì)算簡(jiǎn)單,收斂性好,故采用分段線性插值法對(duì)數(shù)據(jù)進(jìn)行補(bǔ)充。
分段線性插值法采用的函數(shù)是分段線性插值函數(shù),用直線將兩個(gè)相鄰的數(shù)據(jù)點(diǎn)連接。要求一個(gè)點(diǎn)的數(shù)值,假設(shè)與其相鄰的兩個(gè)節(jié)點(diǎn)是(xm,ym)和(xn,yn),具體求值方法如式(1)所示。
(1)
2) 數(shù)據(jù)的合成。本文數(shù)據(jù)是由4個(gè)車(chē)道所測(cè)數(shù)據(jù)組成,需要將每個(gè)車(chē)道上的數(shù)據(jù)合成為一個(gè)截面的數(shù)據(jù)[9],合成數(shù)據(jù)方法如式(2)所示。
(2)
式中:qe為截面e的流量;ve為截面e的速度;oe為截面e的占有率;f為車(chē)道編號(hào);m為截面車(chē)道數(shù)。
交通流參數(shù)的選取和算法的應(yīng)用效果密切相關(guān),選擇的交通參數(shù)要能夠準(zhǔn)確反映交通狀態(tài)變化規(guī)律。結(jié)合交通流數(shù)據(jù)來(lái)源以及特點(diǎn),本文選取8個(gè)交通流參數(shù),分別為流量q、速度v、占有率o、密度k、行程時(shí)間t、飽和度s、占有率/流量(o/q)、占有率/速度(o/v),其中q,v,o通過(guò)合成公式(2)計(jì)算得到,k,s,o/q,o/v在原有數(shù)據(jù)基礎(chǔ)上,通過(guò)計(jì)算和處理得到,行程時(shí)間t由Vissim仿真獲得。
所謂因子分析,就是保持原有信息不發(fā)生任何的變化,將具有相同特性的變量劃分到同一個(gè)因子中,實(shí)現(xiàn)數(shù)據(jù)的簡(jiǎn)化、指標(biāo)的降維,從而簡(jiǎn)化因子分析過(guò)程[10]。
本文采用KMO(Kaiser-Meyer-Olkin)和Bartlett球形(Bartlett's Test of Sphericity)兩種檢驗(yàn)方法,檢驗(yàn)8個(gè)交通流參數(shù)是否適合因子分析[11]。使用Spss軟件進(jìn)行檢驗(yàn),結(jié)果如表2所示,KMO結(jié)果為0.790>0.6,表明8個(gè)交通流之間存在較好的相關(guān)性。Bartlett球形假設(shè)檢驗(yàn)顯著性為0,拒絕零假設(shè),表明相關(guān)系數(shù)矩陣不是單位陣,適合進(jìn)行因子分析。
表2 KMO和Bartlett檢驗(yàn)結(jié)果
主因子提取通常采用不小于85%的累積方差貢獻(xiàn)率來(lái)確定主成分的數(shù)量。如表3所示,前2個(gè)主因子累積方差貢獻(xiàn)率為98.052%,大于85%,符合判斷標(biāo)準(zhǔn)。因此,選取前2個(gè)主因子進(jìn)行分析。
表3 各因子解釋原有指標(biāo)總方差情況
表4所示為因子載荷矩陣,顯示出2個(gè)主因子在8個(gè)交通流參數(shù)上的載荷,通過(guò)分析得出以下個(gè)結(jié)論:
表4 主成分載荷矩陣
1) 主因子1與8個(gè)交通流參數(shù)的相關(guān)性均在0.8以上,此數(shù)據(jù)顯示,主因子1與各交通參數(shù)都具有很強(qiáng)的相關(guān)性。無(wú)論是負(fù)相關(guān)還是正相關(guān),為了符合實(shí)際,需進(jìn)行因子旋轉(zhuǎn)。
2) 主因子2與q、s、o/q相對(duì)于其他指標(biāo)具有較強(qiáng)的相關(guān)性。
本文采用凱撒正態(tài)化最大方差法對(duì)2個(gè)主因子進(jìn)行因子旋轉(zhuǎn)。表5所示為因子旋轉(zhuǎn)后主因子1,2對(duì)8個(gè)交通流參數(shù)的載荷。
由表5可知,旋轉(zhuǎn)后的主因子1與q,v,o/v相關(guān)性較大;旋轉(zhuǎn)后的主因子2與8個(gè)交通參數(shù)指標(biāo)相關(guān)性還是很弱,綜合考慮,剔除主因子2,僅保留主因子1。綜上所述,因子分析從8個(gè)交通流參數(shù)中最終提取出q,v,o/v3個(gè)交通參數(shù)作為交通狀態(tài)判別指標(biāo)。
表5 旋轉(zhuǎn)后的因子載荷矩陣
K-means聚類(lèi)算法根據(jù)樣本之間的距離或相似度,把相似度高、差異小的樣本聚類(lèi)為一類(lèi),最后形成多個(gè)類(lèi)別,使得同一個(gè)類(lèi)別內(nèi)的樣本具有高相似度,不同類(lèi)別間差異性大,聚類(lèi)速度快,方法簡(jiǎn)單。但傳統(tǒng)的K-means聚類(lèi)算法仍存在一定不足:①聚類(lèi)數(shù)K很難確定;②初始聚類(lèi)中心選取隨意。為了解決以上問(wèn)題,本文提出了一種改進(jìn)K-means聚類(lèi)算法。
改進(jìn)K-means聚類(lèi)算法的思路如下:假設(shè)要將n個(gè)樣本數(shù)據(jù)Y={Yi|i=1,2,...,n}劃分為K類(lèi),用B={Bj|j=1,2,...,K}分別表示K種交通狀態(tài),C1點(diǎn)為首個(gè)初始聚類(lèi)中心點(diǎn),C={Cj|j=2,3,...,K}為后續(xù)初始聚類(lèi)中心。
Step3:求出每個(gè)數(shù)據(jù)與初始聚類(lèi)中心的距離D(Yi,Cj),i=1,2,...,n,j=1,2,...,K,根據(jù)求出的距離,按照距離最短原則,將每個(gè)數(shù)據(jù)歸到相應(yīng)的類(lèi)別中,即滿足D(Yi,Cj)=min{D(Yi,Cj)},則Yi∈Zj;
Step7:通過(guò)指標(biāo)值比較選擇最佳的K值,使IDB指標(biāo)達(dá)到最優(yōu);
Step8:輸出最優(yōu)聚類(lèi)數(shù)K以及滿足聚類(lèi)準(zhǔn)則函數(shù)收斂性的K個(gè)聚類(lèi)集。
將改進(jìn)K-means算法應(yīng)用到處理好的289組交通流參數(shù)數(shù)據(jù)中,通過(guò)因子分析提取q,v,o/v3個(gè)判別指標(biāo),計(jì)算出初始聚類(lèi)中心,最后輸出最佳聚類(lèi)數(shù)K=4,如表6所示,參照相關(guān)已有研究成果將交通運(yùn)行狀態(tài)命名為自由流狀態(tài)、穩(wěn)定流狀態(tài)、擁擠流狀態(tài)和阻塞流狀態(tài)[12]。
表6 初始聚類(lèi)中心
使用Spss軟件對(duì)數(shù)據(jù)進(jìn)行交通狀態(tài)判別分析,選取初始聚類(lèi)中心,設(shè)置K=4,經(jīng)過(guò)16次迭代,聚類(lèi)中心的變化可忽略不計(jì)時(shí),從而達(dá)到聚合的目的,將所有的數(shù)據(jù)劃分為4類(lèi)。表7所示為最終聚類(lèi)中心。圖1所示為截面S通過(guò)Spss檢驗(yàn)最終得到的全天24 h交通狀態(tài)判別結(jié)果,圖2所示為Origin繪制的4種交通狀態(tài)下的交通流基本參數(shù)關(guān)系。
表7 最終聚類(lèi)中心
圖1 截面S交通狀態(tài)判別結(jié)果
圖1縱軸1—4分別代表自由流狀態(tài)、穩(wěn)定流狀態(tài)、擁擠流狀態(tài)、阻塞流狀態(tài),數(shù)據(jù)共有289組。其中自由流狀態(tài)為94組,占比32.53%;穩(wěn)定流狀態(tài)為88組,占比30.45%;擁擠流狀態(tài)為28組,占比9.69%;阻塞流狀態(tài)為79組,占比27.34%。由圖1、圖2可知,該快速路道路狀況基本暢通,大多數(shù)擁堵主要集中在早晚高峰,說(shuō)明本文方法能有效地對(duì)交通運(yùn)行狀態(tài)進(jìn)行分類(lèi),且與實(shí)際狀況相符。
本文以判別率和誤判率為指標(biāo),根據(jù)上述獲取的交通流數(shù)據(jù),分別使用傳統(tǒng)K-means算法和改進(jìn)K-means算法對(duì)其進(jìn)行交通狀態(tài)判別,與道路實(shí)際運(yùn)行狀況相比,得到4種交通狀態(tài)下的判別率和誤判率,如表8所示。
從表8可以看出,在4種交通狀態(tài)下,改進(jìn)K-means算法判別率為97.21%,誤判率為0.74%,其判別精度比傳統(tǒng)K-means算法提高了8.13%,誤判率降低了1.05%。由此可見(jiàn),改進(jìn)K-means算法可獲得較好的判別效果,在交通狀態(tài)判別上具有一定的優(yōu)勢(shì)。
表8 交通狀態(tài)判別效果對(duì)比 %
1) 傳統(tǒng)交通狀態(tài)判別指標(biāo)的選取都是按照一定的標(biāo)準(zhǔn)和規(guī)定,進(jìn)行直接選取,本文采用因子分析,從q,v,o,k,t,s,o/q,o/v8個(gè)交通流參數(shù)中,提取出q,v,o/v最為適合的3個(gè)交通狀態(tài)判別指標(biāo)。減少交通流參數(shù)的選取對(duì)算法應(yīng)用效果的影響,更好地呈現(xiàn)交通狀態(tài)變化規(guī)律。
2) 改進(jìn)K-means聚類(lèi)算法創(chuàng)新點(diǎn)在于建立了交通狀態(tài)判別綜合評(píng)價(jià)函數(shù),將聚類(lèi)數(shù)K和初始聚類(lèi)中心同步進(jìn)行優(yōu)化。
3) 本文將因子分析與改進(jìn)K-means聚類(lèi)算法相結(jié)合在一起,通過(guò)實(shí)例驗(yàn)證,這種方法對(duì)快速路交通運(yùn)行狀態(tài)可以有效判別。