王 晰,袁紹欣
長安大學(xué) 信息工程學(xué)院,西安 710064
車牌識別系統(tǒng)目前在城市交通中得到了廣泛應(yīng)用,已經(jīng)成為獲取車輛交通旅行時間的一個重要數(shù)據(jù)源[1]。系統(tǒng)利用設(shè)置在城市道路上的卡口攝像機(jī),對經(jīng)過車輛進(jìn)行車牌號碼識別、車牌顏色識別、位置記錄、時間戳記錄和速度計算,從而實(shí)現(xiàn)對超速和闖紅燈等交通違法行為的監(jiān)控。此外,根據(jù)車輛依次經(jīng)過的兩個卡口的時間戳可計算得到車輛在兩個卡口間路段的旅行時間觀測點(diǎn)[2],以下簡稱ANPR(Automatic Number Plate Recognition)數(shù)據(jù)。相對于具有路網(wǎng)覆蓋能力但采樣精度低的車輛GPS 數(shù)據(jù)而言,ANPR 數(shù)據(jù)可形成采樣精度高、數(shù)據(jù)量大的研究樣本,并可通過車牌顏色區(qū)分車型,這對于城市管理者評價道路通行能力以及出行者的出行決策都非常重要[3]。
ANPR 數(shù)據(jù)中的少量數(shù)據(jù)往往因明顯偏離大多數(shù)數(shù)據(jù)而被視為噪音數(shù)據(jù),相應(yīng)地大多數(shù)的數(shù)據(jù)被視為有效數(shù)據(jù)。與由設(shè)備產(chǎn)生的異常數(shù)據(jù)不同,這些噪音數(shù)據(jù)都是真實(shí)的車輛旅行時間數(shù)據(jù)。實(shí)時采集的ANPR 數(shù)據(jù)中的噪音數(shù)據(jù)通常由不能代表特定時空下交通狀況的數(shù)據(jù)組成。例如,少數(shù)私家車會因不熟悉道路路況而緩行;空載出租車因?qū)た投徯校簧贁?shù)車輛在兩個卡口間因各種原因存在臨時停車行為而導(dǎo)致其旅行時間過長;少數(shù)公交車在個別站點(diǎn)停留時間過長;因偶發(fā)的惡劣天氣、交通事故或紅綠燈故障等造成特定路段個別時段車輛的整體緩行。此外,當(dāng)采集的ANPR數(shù)據(jù)存檔形成歷史數(shù)據(jù)后,其中的噪音數(shù)據(jù)還要包括不能代表特定時空下通常交通狀況的觀測點(diǎn),例如在某一時間段通常擁堵的路段在個別天非常通暢,從而使車輛旅行時間較通常短,反之亦然。識別和濾除ANPR歷史數(shù)據(jù)中的噪音數(shù)據(jù)后,得到的有效數(shù)據(jù)可以表征特定時空下大概率可重復(fù)發(fā)生的通常交通狀況,因而進(jìn)行這方面的研究很有意義。
對ANPR 數(shù)據(jù)中的噪音數(shù)據(jù)進(jìn)行識別并提取有效數(shù)據(jù)的相關(guān)研究,因ANPR 數(shù)據(jù)應(yīng)用環(huán)境和場景的不同,研究方法也有所不同。
實(shí)時的交通控制系統(tǒng),如Transguide[4]、TranStar[5]等,需要識別并濾除不代表交通狀況的ANPR 噪音數(shù)據(jù),從而根據(jù)有效數(shù)據(jù)準(zhǔn)確評估路段的交通狀態(tài)并給出控制措施。這些系統(tǒng)中的算法針對交通狀態(tài)在時間上具有連續(xù)性變化以及ANPR 觀測點(diǎn)通常具有的正態(tài)分布的特點(diǎn),將系統(tǒng)控制時間劃分為連續(xù)時間窗口,利用前一個時間窗口中的旅行時間數(shù)據(jù)或指標(biāo)計算得到當(dāng)前時間窗口用均值和標(biāo)準(zhǔn)差表示的有效數(shù)據(jù)范圍,范圍外的過大和過小的數(shù)據(jù)將被視為噪音數(shù)據(jù),如此循環(huán)往復(fù)就可實(shí)現(xiàn)噪音數(shù)據(jù)的連續(xù)識別和清除。但當(dāng)交通狀態(tài)產(chǎn)生突變時,上述方法對噪音數(shù)據(jù)的識別不理想,為此Dion 等[6]將突變交通狀態(tài)下的ANPR 觀測點(diǎn)設(shè)定為遵從對數(shù)正態(tài)分布來確定有效數(shù)據(jù)范圍,取得對噪音數(shù)據(jù)的良好識別效果的同時也增強(qiáng)了算法處理這類數(shù)據(jù)的魯棒性。
將ANPR 歷史數(shù)據(jù)中的噪音數(shù)據(jù)和有效數(shù)據(jù)區(qū)分開來,往往需要將有效數(shù)據(jù)和噪音數(shù)據(jù)視為不同種群。這是因為比例較少的噪音數(shù)據(jù)在ANPR 歷史數(shù)據(jù)中通常呈現(xiàn)出穩(wěn)定的右向尾部分布特點(diǎn),而比例較大的有效數(shù)據(jù)則由于旅行時間的可變性呈現(xiàn)出單峰、偏斜乃至多峰形態(tài)。因而基于它們在分布上的各自特征進(jìn)行分布擬合和相應(yīng)的數(shù)據(jù)聚類來加以區(qū)分是常用的研究方法。Kieu等人[7]研究比較了高斯分布、對數(shù)正態(tài)分布、伽馬分布、韋伯分布和布爾分布,認(rèn)為對數(shù)正態(tài)分布對旅行時間具有很好的分布擬合效果。Rakha 等人[8]和Emam等人[9]的研究也得到了類似結(jié)論。Kazagli等人[10]通過使用兩個對數(shù)正態(tài)分布的混合模型分析了近10個月ANPR數(shù)據(jù)樣本,對其中無停車行為和有停車行為的兩類數(shù)據(jù)進(jìn)行分布擬合,同時實(shí)現(xiàn)相應(yīng)的數(shù)據(jù)聚類加以區(qū)分。但該研究關(guān)注的有停車行為觀測點(diǎn)僅是噪音數(shù)據(jù)中具有較大值的一類,因此研究者用10 個月的數(shù)據(jù)疊加在一起來增強(qiáng)右向長尾特征,同時這也導(dǎo)致了有效數(shù)據(jù)的可變性變得不突出——更多地呈現(xiàn)單峰形態(tài),這也是該研究用兩個對數(shù)正態(tài)分布的混合模型進(jìn)行分析的合理之處。但是如果以月或星期為規(guī)模進(jìn)行數(shù)據(jù)疊加(不同規(guī)模的數(shù)據(jù)從不同層次反映通常交通狀況特征),數(shù)據(jù)樣本量的降低可導(dǎo)致有效數(shù)據(jù)的形態(tài)不一定能保證單峰形態(tài),即有效數(shù)據(jù)也存在多種群,同時也會導(dǎo)致噪音數(shù)據(jù)尾部分布的長度縮短或不明顯,這為二類數(shù)據(jù)的區(qū)分帶來了困難,因而有必要提出算法,提升對ANPR 歷史數(shù)據(jù)中噪音數(shù)據(jù)識別的魯棒性和有效數(shù)據(jù)可變性的處理能力。
(1)旅行時間可變性導(dǎo)致有效數(shù)據(jù)和噪音數(shù)據(jù)的區(qū)分閾值和種群數(shù)量難以界定。一天不同時間段因交通狀態(tài)的多樣性(通暢、擁堵和堵塞)導(dǎo)致不同時間段的旅行時間(為有效數(shù)據(jù))可變,因而有效數(shù)據(jù)和噪音數(shù)據(jù)之間很難用固定的閾值加以區(qū)分[11]。此外,不同天的同一時間段的旅行時間也會因為交通狀態(tài)的不同而具有可變性,即多種群特點(diǎn),從分布上表現(xiàn)為偏斜或多峰形態(tài)。因而用兩個分布的混合模型來區(qū)分帶有多種群特點(diǎn)的有效數(shù)據(jù)與噪音數(shù)據(jù)兩類數(shù)據(jù)并不合適。
(2)ANPR數(shù)據(jù)樣本質(zhì)量欠佳情況下有效數(shù)據(jù)提取的魯棒性問題。噪音數(shù)據(jù)具有分布上的右向尾部以及比例少的特點(diǎn),這是區(qū)分兩類數(shù)據(jù)的主要參考依據(jù),但ANPR數(shù)據(jù)樣本在數(shù)據(jù)量比較少時,噪音數(shù)據(jù)的這個特點(diǎn)可能并不突出。因此如何設(shè)計算法可以同時很好地識別噪音數(shù)據(jù)特點(diǎn)明顯和不明顯的數(shù)據(jù)樣本是需要解決的問題。
將一天時間以30 分鐘為間隔分為48 個時間段,根據(jù)起始卡口通過車輛的時間戳,將ANPR數(shù)據(jù)劃分為48組數(shù)據(jù)樣本。估計一個旅行時間經(jīng)驗閾值π(一般為高峰期間車輛平均旅行時間的2~3 倍),其值將確保各組樣本都能包含所有的有效數(shù)據(jù)和一定量的噪音數(shù)據(jù)。大于π的觀測點(diǎn)數(shù)據(jù)將從所有樣本中作為噪音數(shù)據(jù)被濾除。
式(1)是對數(shù)正態(tài)分布混合模型,它用K個對數(shù)正態(tài)分布的密度分支所組成混合密度f(yi|θ)來擬合形狀通常不規(guī)則的數(shù)據(jù)樣本概率密度曲線。
K最小值為2 意味著至少用兩個密度分支來對數(shù)據(jù)樣本的分布進(jìn)行擬合,以體現(xiàn)大部分?jǐn)?shù)據(jù)樣本中都至少包含有效數(shù)據(jù)和噪音數(shù)據(jù)兩個種群;K大于2意味著同一時間段不同天可能存在多個交通狀態(tài),從而導(dǎo)致有效數(shù)據(jù)也具有多種群。yi為數(shù)量為N的數(shù)據(jù)樣本中的第i個觀測點(diǎn)。ηk(η1+η2+…+ηk=1,0<ηk <1)是密度分支混合比例。需要評估的參數(shù)θ=(η1,η2,…,ηk,為分布參數(shù)。
模型參數(shù)θ需要通過EM(Expectation Maximization)算法[12]來估計。算法包含E 和M 兩個步驟。通過E 步驟評估得到的后驗概率(樣本中第i個數(shù)據(jù)在t次迭代隸屬于第k個分布的概率),如式(2)所示:
M步驟利用評估θ參數(shù):
EM 兩個步驟交替進(jìn)行直到θ參數(shù)收斂。再根據(jù)式(2)中的Iik可以判斷出yi所屬的密度分支。因而對K個密度分支進(jìn)行參數(shù)估計的同時,也將數(shù)據(jù)樣本聚類為K組,即K個種群。
式(1)可轉(zhuǎn)為式(6)的形式,表示對數(shù)據(jù)樣本分布的擬合可表示為有效數(shù)據(jù)分布的擬合和噪音數(shù)據(jù)分布的擬合。
其中,fV(yi|θV)表示由一個或多個密度分支組成的有效數(shù)據(jù)密度。fK(yi|θK)用一個密度分支表示具有穩(wěn)定的右向尾部特點(diǎn)的噪音密度。fV(yi|θV) 和fK(yi|θK) 在(0,π)內(nèi)可能存在一個交叉點(diǎn)或多個交叉點(diǎn),設(shè)x為具有最大橫坐標(biāo)交叉點(diǎn)的橫坐標(biāo)值,則(0,π)區(qū)間被分為(0,x)和 (x,π)兩部分。
K個密度分支中代表噪音數(shù)據(jù)密度的分支具有如下三個有異于有效數(shù)據(jù)密度分支的特征。
(1)噪音數(shù)據(jù)在分布上呈現(xiàn)右向尾部特點(diǎn)決定了噪音密度分支fK(yi|θK)的分布參數(shù)σK應(yīng)是所有密度分支中最大的,如式(9)所示:
(2)fK(yi|θK)的比例需要遵循式(10)以體現(xiàn)噪音數(shù)據(jù)比例少于有效數(shù)據(jù)的特點(diǎn)。
(3)噪音數(shù)據(jù)在分布上呈現(xiàn)的右向尾部特點(diǎn)也決定了在 (x,π)區(qū)間f(yi|θ)的右向尾部主要由fK(yi|θK)擬合而成,它們的擬合優(yōu)度用R2指標(biāo)度量,見式(11),該值介于0 和1 之間,越接近1 表示擬合效果越好。應(yīng)好于任一有效數(shù)據(jù)密度分支與f(yi|θ)的擬合優(yōu)度(k <K),如式(12)所示:
其中,表示在 (x,π)區(qū)間內(nèi)fK(yi|θK)和f(yi|θ)直方圖中各對應(yīng)直方條值差的平方和,而表示在(x,π)區(qū)間與f(yi|θ)各直方條值與它們平均值差的平方和。
上述三個分布特征也是判斷數(shù)據(jù)樣本質(zhì)量欠佳的依據(jù),即數(shù)據(jù)樣本較為稀疏時,噪音數(shù)據(jù)在分布上的右向尾部特點(diǎn)不明顯,從而導(dǎo)致式(9)、式(10)、式(12)不能同時成立。此時可將數(shù)據(jù)樣本小于第10 百分位(過快觀察點(diǎn))和大于第90 百分位(過慢觀察點(diǎn))的數(shù)據(jù)視作噪音數(shù)據(jù)[13]。
判據(jù)1 在(0,x)內(nèi),尋找K=O,使fV(yi|θV)與f(yi|θ)擬合優(yōu)度R2K取得最大值,即fK(yi|θK)與fV(yi|θV)重疊部分最小——fK(yi|θK)對f(yi|θ)影響最小,如式(13)所示:
其中,為在 (0,x)區(qū)間fV(yi|θV)和f(yi|θ)直方圖中對應(yīng)直方條值差的平方和,而表示在(0,x) 區(qū)間f(yi|θ)各直方條值與它們平均值差的平方和。
判據(jù)2 在(0,x)內(nèi),當(dāng)與1 的差值達(dá)到一個可接受的ε時,相應(yīng)的K值可認(rèn)定為最佳值。
步驟1 設(shè)置K=2,ε=0.03,π=4 200 s。
步驟2 將ANPR數(shù)據(jù)分成48個數(shù)據(jù)樣本并進(jìn)行噪音數(shù)據(jù)的初步過濾。
步驟3 用EM算法將樣本數(shù)據(jù)分為K個具有對數(shù)正態(tài)分布的聚類組,將滿足式(9)、式(10)、式(12)的密度分支標(biāo)識為噪音密度分支,否則轉(zhuǎn)到步驟6。
步驟5 得到K=O個密度分支以及相應(yīng)數(shù)目的聚類組,根據(jù)Iik識別噪音數(shù)據(jù)并濾除,剩下的數(shù)據(jù)則為有效數(shù)據(jù),轉(zhuǎn)到步驟7。
步驟6 提取數(shù)據(jù)樣本中介于第10百分位和第90百分位之間的數(shù)據(jù)為有效數(shù)據(jù)。
步驟7 計算有效數(shù)據(jù)平均值和標(biāo)準(zhǔn)差等統(tǒng)計指標(biāo)。
算法在帶Mixmod軟件包[14]的Matlab平臺上實(shí)現(xiàn)。
案例選取西安市咸寧路和友誼路自西向東方向兩組卡口之間的路段(如圖1所示),長度分別為3.8 km和1.8 km。這兩個路段是西安市流量較大的主干道,各包含三個信號交叉口,沿線有居民區(qū)和商業(yè)區(qū),在兩個卡口間車輛出現(xiàn)臨時停車以及緩行等現(xiàn)象較為常見。所用數(shù)據(jù)采集于2014年3月,車型為車牌為黃色擁有專用車道的公交車以及車牌為藍(lán)色的非公交車(主要為私家車和出租車)兩種。
圖1 研究選用的兩個路段
圖2展示了咸寧路公交車和非公交車6:00至22:00期間的旅行時間觀測點(diǎn),橫坐標(biāo)為車輛經(jīng)過起始卡口的時刻點(diǎn),縱坐標(biāo)為車輛經(jīng)過兩個卡口所在路段的旅行時間。觀測點(diǎn)可分為密集區(qū)域以及分散區(qū)域兩部分,分散區(qū)域觀測點(diǎn)可視作噪音數(shù)據(jù)。從圖2(a)和圖2(c)可以看出,公交車噪音數(shù)據(jù)比較稀疏且個別時段甚至缺乏噪音數(shù)據(jù),而圖2(b)和圖2(d)各時間段的噪音數(shù)據(jù)都比較豐富。
圖2 選用路段公交車和非公交車旅行時間觀測點(diǎn)
圖3 以咸寧路非公交車18:30—19:00 數(shù)據(jù)樣本為例,展示了算法提取有效數(shù)據(jù)的過程。圖3(a)中,用K=2 個對數(shù)正態(tài)分布對數(shù)據(jù)樣本進(jìn)行分布擬合和數(shù)據(jù)聚類,在旅行時間(0,x)范圍內(nèi),有效數(shù)據(jù)的密度曲線與混合密度曲線的擬合優(yōu)度0.946<0.970,即兩個密度曲線擬合程度沒有達(dá)到設(shè)定水平,噪音密度分支影響依然很大。因此在圖3(b)中用K=3 個對數(shù)正態(tài)分布對數(shù)據(jù)樣本進(jìn)行分布擬合和數(shù)據(jù)聚類。在旅行時間(0,x) 范圍內(nèi),有效數(shù)據(jù)密度曲線和混合密度曲線的0.997>0.970,即有效數(shù)據(jù)密度曲線和混合密度曲線擬合程度比較好,噪音數(shù)據(jù)密度分支影響已經(jīng)很小,有效數(shù)據(jù)和噪音數(shù)據(jù)在K=3 時取得了較好分離效果。圖3(c)展示了噪音數(shù)據(jù)被濾除后的有效數(shù)據(jù)直方圖,隸屬于噪音密度分支的數(shù)據(jù)可近似看作旅行時間大于x的觀測點(diǎn),實(shí)際區(qū)分方法依據(jù)式(2)進(jìn)行。上述過程中,在(x,4 200)范圍內(nèi),被認(rèn)定的噪音密度分支曲線(相比任一個有效數(shù)據(jù)密度分支曲線)與混合密度曲線始終保持了最好擬合效果。
圖3 咸寧路非公交車18:30—19:00有效數(shù)據(jù)提取
圖4 展示了研究的算法對咸寧路公交車18:30—19:00數(shù)據(jù)樣本提取有效數(shù)據(jù)的過程,當(dāng)K=2 時,0.989>0.970。有效數(shù)據(jù)密度曲線和混合密度存在兩個交點(diǎn)并取得了較好的擬合效果。此時提取的有效數(shù)據(jù)可近似地看作介于這兩個交點(diǎn)間的觀測點(diǎn),實(shí)際區(qū)分方法依據(jù)式(2)進(jìn)行,噪音數(shù)據(jù)相應(yīng)地也被分為過快和過慢兩種類型。
圖5 展示了算法對兩個路段公交車稀疏噪音數(shù)據(jù)和非公交車密集噪音數(shù)據(jù)都具有良好的識別效果,此外還判別出咸寧路公交車在12:30—13:30、14:00—14:30、15:30—16:00 以及 20:30—21:00 時間段,友誼路公交車在07:30—08:00、19:00—19:30、21:00—22:00 時間段內(nèi)的數(shù)據(jù)樣本缺少噪音右向尾部特點(diǎn),提取數(shù)據(jù)樣本中介于第10 百分位和第90 百分位之間的數(shù)據(jù)為有效數(shù)據(jù)。
圖4 咸寧路公交車18:30—19:00包含過快和過慢兩種噪音數(shù)據(jù)
圖5 旅行時間噪音數(shù)據(jù)的識別及對均值的影響
從圖5還可以看出:非公交車各時間段有效數(shù)據(jù)平均值明顯小于濾除噪音數(shù)據(jù)前的所有數(shù)據(jù)平均值,這意味著數(shù)量較少的噪音數(shù)據(jù)具有很強(qiáng)的干擾作用。相比之下,公交車噪音數(shù)據(jù)對數(shù)據(jù)平均值影響并不明顯,這不僅因為公交車樣本數(shù)據(jù)中噪音數(shù)據(jù)量較少,而且多個時間段過快和過慢的噪音數(shù)據(jù)對平均值的影響具有相互抵消的效果。
圖6 對比了研究路段有效數(shù)據(jù)提取前后公交車與非公交車旅行時間的均值和標(biāo)準(zhǔn)差(圖中公交車有效數(shù)據(jù)均值可近似看作濾除噪音前的數(shù)據(jù)均值)。
在圖6(a)中的大部分時間段內(nèi),咸寧路公交車濾除噪音數(shù)據(jù)前的平均旅行時間都小于非公交車,友誼路在8:30—18:00 時間段內(nèi)的大部分時段也是如此,這明顯有違常識,因為公交車在站點(diǎn)上下客停留時間通常會使其旅行時間高于非公交車。而去除噪音數(shù)據(jù)后,咸寧路在大部分時間段內(nèi)非公交車的平均旅行時間要小于公交車(晚高峰17:30—19:00期間除外,該時間段公交車因具有專用車道而使其旅行時間小于處于擁堵中的非公交車)。友誼路公交車和非公交車平均旅行時間也有類似關(guān)系。另外濾除噪音數(shù)據(jù)前,非公交車的旅行時間標(biāo)準(zhǔn)差明顯比公交車旅行時間標(biāo)準(zhǔn)差偏高,而濾除噪音數(shù)據(jù)后,差距則沒有那么明顯。由于旅行時間平均值代表了出行的平均成本[15],標(biāo)準(zhǔn)差代表了出行者到達(dá)目的地的旅行時間可靠程度。如果對ANPR 數(shù)據(jù)不經(jīng)過有效數(shù)據(jù)提取就直接進(jìn)行平均值以及標(biāo)準(zhǔn)差的計算,得到結(jié)論對于出行方式?jīng)Q策必然產(chǎn)生誤判。
圖6 公交車和非公交車有效數(shù)據(jù)提取前后的統(tǒng)計值
圖7 是用K-Means 算法對每半小時觀測點(diǎn)數(shù)據(jù)聚為兩類的效果圖,從圖中可見,不僅很多稀疏觀測點(diǎn)沒有被識別為噪音數(shù)據(jù),而且提取的有效數(shù)據(jù)也沒能體現(xiàn)出在一天不同時間段應(yīng)有的可變特征。而在圖5(b)中,應(yīng)用“ANPR樣本有效數(shù)據(jù)提取算法”,除了08:00—08:30和18:30—19:00 時間段的數(shù)據(jù)被聚為三類外,其他時間段的數(shù)據(jù)也聚為兩類,但卻取得了對噪音數(shù)據(jù)的良好識別效果以及使有效數(shù)據(jù)呈現(xiàn)出在一天不同時間段應(yīng)有的可變特征。這種對比效果意味著歐式距離不是對這兩類數(shù)據(jù)進(jìn)行聚類的有效依據(jù)。“ANPR 樣本有效數(shù)據(jù)提取算法”從“比例較少的噪音數(shù)據(jù)在分布上通常呈現(xiàn)出穩(wěn)定的右向尾部特點(diǎn)”直觀感知出發(fā),用對數(shù)正態(tài)分布混合模型對噪音數(shù)據(jù)右向尾部特征和有效數(shù)據(jù)多種群可變性進(jìn)行建模,并用提出的兩個判據(jù)確保兩類數(shù)據(jù)具有最佳的分離效果。這種將觀察特點(diǎn)和定量分析緊密結(jié)合的方法確保了算法在提取有效旅行時間數(shù)據(jù)方面的合理性和有效性。
圖7 K-Means算法識別咸寧路非公交車噪音數(shù)據(jù)
ANPR 系統(tǒng)中的有效數(shù)據(jù)代表特定時空下的通常交通狀況,為排除樣本中不代表通常狀況的噪音數(shù)據(jù),本文研究工作的主要貢獻(xiàn)為:
(1)提出了ANPR樣本有效數(shù)據(jù)提取算法。該算法用K個對數(shù)正態(tài)分布混合模型針對噪音數(shù)據(jù)的右向尾部分布以及比例少的特點(diǎn)進(jìn)行建模,依據(jù)噪音數(shù)據(jù)的三個分布特征從K個密度分支中識別噪音密度分支并對數(shù)據(jù)質(zhì)量進(jìn)行判斷。對于噪音數(shù)據(jù)特征明顯的樣本給出了使有效數(shù)據(jù)和噪音數(shù)據(jù)具有最佳聚類效果的分布數(shù)量K值判據(jù);對于質(zhì)量欠佳的樣本,則將第10百分位和第90 百分位之間的數(shù)據(jù)視為有效數(shù)據(jù),不僅解決了因旅行時間可變引起的有效數(shù)據(jù)和噪音數(shù)據(jù)的區(qū)分閾值和種群數(shù)量難以界定的問題,同時增強(qiáng)了算法提取有效數(shù)據(jù)時的魯棒性。
(2)針對西安市咸寧路和友誼路選用路段上收集的公交車和非公交車ANPR數(shù)據(jù),算法實(shí)驗取得了良好的噪音數(shù)據(jù)識別效果,同時也說明了ANPR數(shù)據(jù)中的噪音數(shù)據(jù)會影響旅行時間統(tǒng)計結(jié)果的精確度,不濾除噪音數(shù)據(jù)會對兩類車通常交通狀況下的運(yùn)行狀態(tài)產(chǎn)生誤判。