• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于支持向量聚類和模糊粗糙集的交通流數(shù)據(jù)修復(fù)方法

      2023-02-11 11:32:10朱世超王騁程王超劉隆張潤(rùn)芝王浩
      森林工程 2023年1期
      關(guān)鍵詞:粗糙集交通流遺傳算法

      朱世超,王騁程,王超,劉隆,張潤(rùn)芝,3,王浩,3

      (1.山東高速基礎(chǔ)設(shè)施建設(shè)有限公司,濟(jì)南 250000;2.山東省交通規(guī)劃設(shè)計(jì)院集團(tuán)有限公司,濟(jì)南 250000;3.山東高速濟(jì)濰高速公路有限公司,濟(jì)南 250000)

      0 引言

      環(huán)路檢測(cè)器與視頻、藍(lán)牙和裝有全球定位系統(tǒng)(Global Positioning System, GPS)設(shè)備的浮動(dòng)車輛等傳統(tǒng)的交通數(shù)據(jù)收集方法相比,其檢測(cè)成本低的優(yōu)勢(shì)在交通流量數(shù)據(jù)檢測(cè)中被廣泛使用。然而,這些技術(shù)檢測(cè)出來(lái)的數(shù)據(jù)可能會(huì)由于天氣因素、數(shù)據(jù)傳輸中的延遲和錯(cuò)誤,以及數(shù)據(jù)丟失等因素的影響[1-4]而出現(xiàn)數(shù)據(jù)異常、缺失等情況。交通流數(shù)據(jù)的完整性是交通流預(yù)測(cè)、交通運(yùn)行狀態(tài)分析和路網(wǎng)通行能力分析的基礎(chǔ),交通數(shù)據(jù)的缺失必將影響分析結(jié)果的合理性及其在智能交通系統(tǒng)(Intelligent Transportation System, ITS)中應(yīng)用的可行性[5]。因此,如何從龐大的交通大數(shù)據(jù)系統(tǒng)中獲得真實(shí)、準(zhǔn)確的信息來(lái)反映交通狀態(tài)是研究者們目前面臨的重要問(wèn)題。

      為提高交通模型輸入數(shù)據(jù)的準(zhǔn)確性,國(guó)內(nèi)外學(xué)者建立了許多模型對(duì)交通數(shù)據(jù)進(jìn)行預(yù)處理。當(dāng)前,國(guó)外關(guān)于數(shù)據(jù)修復(fù)方面的研究可以歸納為4個(gè)方面,分別以傳統(tǒng)模型、統(tǒng)計(jì)相關(guān)模型、機(jī)器學(xué)習(xí)模型和粗糙集模型為基礎(chǔ)。傳統(tǒng)方法的結(jié)構(gòu)簡(jiǎn)單且易于計(jì)算,估計(jì)性能主要取決于交通流數(shù)據(jù)中的相似性特征,然而交通流的短期波動(dòng)表現(xiàn)使得相似性并不顯著,因此傳統(tǒng)方法的估算性能常常不盡如人意;與傳統(tǒng)方法相比,統(tǒng)計(jì)模型通常以其合理的數(shù)學(xué)結(jié)構(gòu)表現(xiàn)出良好的歸因性能,并且在交通流分析中具有清晰的可解釋性,因此被廣泛用于數(shù)據(jù)插補(bǔ)中;基于機(jī)器學(xué)習(xí)的插補(bǔ)方法在數(shù)據(jù)不完整的情況下由于其強(qiáng)大的學(xué)習(xí)能力而表現(xiàn)出較高的歸因或預(yù)測(cè)性能,也成為了一種典型的交通流缺失數(shù)據(jù)處理方法;以粗糙集模型為基礎(chǔ)的數(shù)據(jù)修復(fù)方法,其中模糊粗糙集(Fuzzy Rough Set, FRS)是在數(shù)據(jù)集不完整的情況下進(jìn)行分類和預(yù)測(cè)的有效方法[6-9]。模糊粗糙集融合了粗糙集和模糊集的優(yōu)勢(shì),通常表現(xiàn)出較強(qiáng)的能力來(lái)表示原始數(shù)據(jù)集中的不確定性和模糊性。然而,無(wú)監(jiān)督學(xué)習(xí)機(jī)制使得模糊粗糙集的學(xué)習(xí)能力相對(duì)有限,導(dǎo)致其應(yīng)用的推算或預(yù)測(cè)結(jié)果可能并不理想。一些神經(jīng)模糊推理系統(tǒng)是為分類而設(shè)計(jì)的,很少有方法可以使用該系統(tǒng)來(lái)估算缺失的數(shù)據(jù)[10-12]。

      在國(guó)內(nèi)方面,隨著交通智能化的不斷發(fā)展,數(shù)據(jù)質(zhì)量的問(wèn)題引發(fā)了越來(lái)越多研究人員的關(guān)注。國(guó)內(nèi)相關(guān)學(xué)者認(rèn)為,首先應(yīng)該充分了解數(shù)據(jù)丟失的過(guò)程,然后根據(jù)數(shù)據(jù)丟失的形式采取對(duì)應(yīng)的修復(fù)模型。針對(duì)不同情況的數(shù)據(jù)缺失,選擇不同的數(shù)據(jù)修復(fù)方法及模型可以更好地提高修復(fù)的準(zhǔn)確度[13-14]。此外,交通流數(shù)據(jù)之間的空間相關(guān)性逐漸受到重視。鄒海翔等[15]利用插值法對(duì)交通數(shù)據(jù)進(jìn)行空間建模,以空間距離作為度量基準(zhǔn)對(duì)未知路段交通數(shù)據(jù)進(jìn)行估計(jì)。一些學(xué)者同樣在探索使用基于粗糙集的修復(fù)方法以提高數(shù)據(jù)質(zhì)量。于洪等[16]考慮具有不同丟失值的數(shù)據(jù)的相關(guān)性,結(jié)合粗糙集理論提出了一種基于時(shí)空權(quán)重的交通流數(shù)據(jù)的重構(gòu)模型,利用北京二環(huán)高速公路的數(shù)據(jù)完成了仿真建模。

      盡管目前大量工作側(cè)重于對(duì)丟失的交通流數(shù)據(jù)進(jìn)行插補(bǔ),但是如何快速準(zhǔn)確地估計(jì)丟失值,尤其是在高丟失率下,仍然是在ITS應(yīng)用中實(shí)現(xiàn)交通流精確預(yù)測(cè)和合理分析的挑戰(zhàn)。為了克服交通數(shù)據(jù)中強(qiáng)隨機(jī)性對(duì)插補(bǔ)性能的影響,將機(jī)器學(xué)習(xí)框架和交通流理論相結(jié)合被證明是提高插補(bǔ)精度的有效方法[17-18]。在神經(jīng)網(wǎng)絡(luò)插補(bǔ)的應(yīng)用中,訓(xùn)練過(guò)程中的參數(shù)選擇和優(yōu)化是實(shí)現(xiàn)較高插補(bǔ)性能的關(guān)鍵步驟[18-19]。當(dāng)支持向量機(jī)(Support Vector Machine, SVM)模型用于缺少的流量估算時(shí),也需要解決類似的問(wèn)題[21-22]。與神經(jīng)網(wǎng)絡(luò)相比,支持向量機(jī)具有更好的擬合性能和泛化能力。因此,本研究將支持向量聚類和模糊粗糙集相結(jié)合,并結(jié)合模糊神經(jīng)網(wǎng)絡(luò)和遺傳算法建立了一個(gè)混合模型來(lái)估算丟失的交通流數(shù)據(jù),結(jié)合粗糙集和神經(jīng)模糊系統(tǒng)的混合模型可以在不完整的數(shù)據(jù)集下訓(xùn)練模型,并可以估計(jì)缺失值的近似間隔。該混合模型結(jié)合粗糙集處理不確定性的優(yōu)點(diǎn)和在神經(jīng)模糊網(wǎng)絡(luò)中具有監(jiān)督學(xué)習(xí)過(guò)程的強(qiáng)大學(xué)習(xí)能力,并增強(qiáng)了圖像識(shí)別中的聚類性能。因此,可以提高交通流數(shù)據(jù)中缺失值估算的準(zhǔn)確性和穩(wěn)定性。最后以高速公路的實(shí)測(cè)交通流數(shù)據(jù)為例對(duì)模型的性能進(jìn)行驗(yàn)證。

      1 粗糙支持向量聚類分類模型

      1.1 粗糙集

      粗糙集理論提供了一種依靠模糊和不精確的數(shù)據(jù)推理的技術(shù),由Pawlak[23]于1982年提出。從可用信息的角度來(lái)看,具有相同信息的對(duì)象是不可分辨的。由不可分辨的物體組成的基本集形成了知識(shí)的基本粒子。基本集合的聯(lián)合被稱為清晰集合,否則該集合被認(rèn)為是粗糙的。

      (1)

      (2)

      式中:X為研究的論域;x為X中的一個(gè)對(duì)象;[x]R表示所有與x不可分辨的對(duì)象所組成的集合;?為空集。

      粗糙度是指上部和下部近似之間的差異,集合A的粗糙度是通過(guò)等價(jià)關(guān)系R來(lái)定義的,定義如下。

      (3)

      1.2 支持向量聚類

      在支持向量聚類中[24],用核函數(shù)變換實(shí)現(xiàn)將數(shù)據(jù)點(diǎn)從平面空間映射到高維的特征空間。在高維特征空間上,尋找囊括所有數(shù)據(jù)點(diǎn)的最小空間球體。然后將此球映射到平面空間,則它將形成一些可以包圍數(shù)據(jù)點(diǎn)的形狀。內(nèi)核參數(shù)可以控制群集的數(shù)量。在這里,借助軟邊距公式來(lái)處理異常值。

      為了定義公式,令{xi}?X是具有m個(gè)點(diǎn)的多維數(shù)據(jù)集,數(shù)據(jù)空間為xi∈Rd。使用從X到某個(gè)高維空間的非線性變換φ,尋找包含X的所有點(diǎn)的最小半徑R的球體。原始問(wèn)題表達(dá)公式為

      (4)

      由于這是一個(gè)凸二次規(guī)劃問(wèn)題,因此很容易解決它的Wolfe對(duì)偶形式

      s.t. 0≤?i≤Ci=1,2,…,m;

      (5)

      式中:K(xi,xj)表示核函數(shù),給出了高維空間中的點(diǎn)積φ(xi)·φ(xj);?i的值決定點(diǎn)φ(xi)是在球體內(nèi)還是球體外;0

      R={G(xi):0

      (6)

      現(xiàn)在,由{x/G(x)=R}定義了包圍數(shù)據(jù)空間中點(diǎn)的輪廓。因此,借助核函數(shù),避免了在高維空間中進(jìn)行計(jì)算以及在數(shù)據(jù)空間中查找輪廓的反向映射。一旦找到這些輪廓,就按以下步驟完成聚類分配。根據(jù)觀察結(jié)果,其采用涉及G(x)的幾何方法:給定一對(duì)屬于不同聚類的點(diǎn),連接其任何路徑都必須從特征空間的球體中退出。因此,可以通過(guò)將其連接在特征空間中的球面之中或之上的點(diǎn)xi和xj對(duì)之間定義鄰接矩陣M,將其連接到的路徑的圖像定義為

      (7)

      式中,y表示xi,xj連線上的點(diǎn);?表示為對(duì)任意的屬于xi,xj連線上的點(diǎn)y。

      將聚類定義為由M誘導(dǎo)的圖的連接部分,可以將球外的點(diǎn)(有界支持向量)分配給最接近的聚類。

      1.3 粗糙支持向量聚類

      在支持向量模型的基礎(chǔ)上,遵循粗糙集的概念,粗糙球體為具有下近似的內(nèi)半徑(R)和上近似的外半徑(T),并且T>R的球體。與支持向量聚類(Support Vector Clustering, SVC)中一樣,粗糙支持向量聚類(Rough Support Vector Clustering, RSVC)還通過(guò)使用內(nèi)核函數(shù)來(lái)實(shí)現(xiàn)平面數(shù)據(jù)映射到高維空間。其試圖在高維空間中找到內(nèi)外半徑最小的粗糙球體,將數(shù)據(jù)集中所有點(diǎn)的圖像封閉起來(lái)?,F(xiàn)在,那些圖像位于較低近似范圍內(nèi)的點(diǎn)是肯定屬于一個(gè)群集(群集的核心)的點(diǎn),而圖像位于邊界區(qū)域(位于較高近似范圍內(nèi)但不在較低近似范圍內(nèi)的那些點(diǎn))被稱為由多個(gè)群集(群集的軟核)共享。某些點(diǎn)被允許位于球外,被稱為離群值。

      利用非線性變換方法,將數(shù)據(jù)從平面映射到某些高維空間,尋找內(nèi)近似半徑(R)和外近似半徑(T)的最小封閉粗糙球體。原始問(wèn)題表達(dá)公式為

      0≤ξi≤T2-R2,ξi′≥0,i=1,2,…,m。

      (8)

      為了解決這個(gè)問(wèn)題,找到在SVC中的Wolfe對(duì)偶形式,所以拉格朗日可以寫(xiě)成

      (9)

      式中:αi≥0,βi≥0,λi≥0,ηi≥0 ,i=1,2,…,m。

      應(yīng)用KKT條件,可以得到

      (10)

      (11)

      (12)

      (13)

      補(bǔ)充松弛條件為

      (14)

      λi(ξi-T2+R2)=0。

      (15)

      βiξi=0。

      (16)

      ηiξi′=0。

      (17)

      從以上等式可以將Wolfe對(duì)偶形式寫(xiě)為

      (18)

      可以觀察到,當(dāng)δ>1,采用RSVC公式;當(dāng)δ=1時(shí),其退化為原始SVC公式。 從公式(12)和公式(13)可以看出,αi的值決定了圖案xi是否落在較低近似值,邊界區(qū)域或特征空間粗糙球之外。

      其來(lái)自表示點(diǎn)的圖像公式(12)—公式(18)。

      (1)αi=0處于較低近似值。

      第二步:查找圖形的連接組件。通過(guò)查找圖形的連接組件,給出每個(gè)簇的較低近似值。

      第三步:尋找邊界區(qū)域。對(duì)于任何聚類j,對(duì)于xi∈下近似(Ci)和xk?下近似(Cj):G(y)≤T,?y∈[xi,xk],則xk?邊界區(qū)域(Ci)。

      2 模糊神經(jīng)網(wǎng)絡(luò)和遺傳算法數(shù)據(jù)補(bǔ)齊模型

      2.1 模糊推理系統(tǒng)

      模糊推理系統(tǒng)[25]基于模糊規(guī)則庫(kù)實(shí)現(xiàn)模糊推理。通常規(guī)則表示為

      Rr:如果x是Ar,那么y是Br。

      (19)

      式中:x是對(duì)象或狀態(tài);y=[y1,y2,…,ym]是輸出語(yǔ)言變量;Ar是規(guī)則r的前置部分使用的模糊集;Br是規(guī)則r后置中使用的模糊集;r=1,…,N;N是規(guī)則數(shù);m是輸出語(yǔ)言變量的數(shù)。

      假設(shè)ε=[ε1,ε2,…,εn]是描述任何對(duì)象或狀態(tài)的特征的向量,n是輸入語(yǔ)言變量的數(shù)量。將對(duì)象的隸屬函數(shù)及其特征等同起來(lái),可以將規(guī)則(19)記為

      Rr:如果ε是Ar,那么y是Br。

      (20)

      (21)

      (22)

      接下來(lái)枚舉幾組模糊蘊(yùn)含

      S-模糊蘊(yùn)含:I(a,b)=S{N{a},b};

      R-模糊蘊(yùn)含:I(a,b)=supz∈[0,1]{z|Г{a,z}≤b};

      QL-模糊蘊(yùn)含:I(a,b)=S{N{a},Г{a,b}};

      D-模糊蘊(yùn)含:I(a,b)=S{Г{N{a},N},b}。

      其中a,b∈[0,1],Г是任何t-范數(shù),S是任何t-范數(shù),N是任何模糊否定。

      2.2 模糊神經(jīng)網(wǎng)絡(luò)

      將模糊推理模型和神經(jīng)網(wǎng)絡(luò)系統(tǒng)進(jìn)行集計(jì)可以構(gòu)成模糊神經(jīng)網(wǎng)絡(luò)[21-22](Fuzzy Neural Network, FNN),實(shí)際上是將常規(guī)的神經(jīng)網(wǎng)絡(luò)模型輸入模糊的信號(hào)和權(quán)值,其結(jié)構(gòu)如圖1所示。

      圖1 標(biāo)準(zhǔn)模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of a standard fuzzy neural network

      將模糊推理系統(tǒng)與自適應(yīng)神經(jīng)網(wǎng)絡(luò)集計(jì)在一起,該組合系統(tǒng)更加可以發(fā)揮這2個(gè)模型的優(yōu)勢(shì),彌補(bǔ)了這2個(gè)模型的不足。該系統(tǒng)的框架如下。

      第1層:通過(guò)計(jì)算輸入信號(hào)的隸屬函數(shù)的值來(lái)模糊輸入信息,一般模型使用的隸屬度函數(shù)是高斯函數(shù),其計(jì)算公式為

      (23)

      式中:xa是節(jié)點(diǎn)a的輸入;高斯函數(shù)的形狀由參數(shù)c和b決定,c、b分別是隸屬函數(shù)形狀的中心值和寬度,被稱為前件參數(shù)。

      第2層:強(qiáng)度釋放層。變量x與模糊集A的隸屬度定義為

      μA(r)(X)=μa1(r)(x1)·μa2(r)(x2)…μaA(r)(xA)=∑a∈Aμa(r)(xa)。

      (24)

      式中,r是模糊規(guī)則。

      第3層:對(duì)所有規(guī)則信息強(qiáng)度進(jìn)行歸一化處理操作。在神經(jīng)網(wǎng)絡(luò)的每個(gè)節(jié)點(diǎn)處根據(jù)模糊規(guī)則r下計(jì)算歸一化可信度

      (25)

      式中,R是規(guī)則庫(kù)。

      第4層:計(jì)算在模糊規(guī)則r下的每個(gè)節(jié)點(diǎn)的輸出信號(hào)。第4層的每個(gè)輸出信號(hào)均是擁有自適應(yīng)性質(zhì)的節(jié)點(diǎn),其輸出結(jié)果為

      f(r)(X)=g(r)(X)·y(r)(X)。

      (26)

      y(r)(X)=pT·[1,X]T=[p0(r),p1(r),…,pA(r)]·[1,x1,…,xA]T。

      (27)

      其中,g(r)(X)是第3層歸一化可信度的輸出;p是第4層上每個(gè)節(jié)點(diǎn)的參數(shù)集,稱為后置參數(shù)。

      第5層:計(jì)算所有信號(hào)的總輸出。該層是一個(gè)固定節(jié)點(diǎn),其計(jì)算如下

      (28)

      2.3 模糊神經(jīng)網(wǎng)絡(luò)和遺傳算法數(shù)據(jù)補(bǔ)齊

      在利用粗糙支持向量聚類進(jìn)行數(shù)據(jù)分類之后,獲得了各個(gè)分類的上下中心,然后結(jié)合模糊神經(jīng)網(wǎng)絡(luò)和遺傳算法進(jìn)行缺失數(shù)據(jù)的補(bǔ)齊,具體的修復(fù)步驟如下。

      (1)使用模糊神經(jīng)網(wǎng)絡(luò)訓(xùn)練完整數(shù)據(jù)集,輸入數(shù)據(jù)組X,輸出的數(shù)據(jù)組為Y。

      (3)使用遺傳算法獲得優(yōu)化的參數(shù)c和m,最小化粗糙支持向量與模糊神經(jīng)網(wǎng)絡(luò)兩者輸出之間的差異,使用帶有優(yōu)化參數(shù)的支持向量補(bǔ)齊缺失。

      (4)將結(jié)果與模糊神經(jīng)網(wǎng)絡(luò)輸出的結(jié)果進(jìn)行對(duì)比。

      3 交通流數(shù)據(jù)修復(fù)模型

      本研究建立的模型框架如圖2所示。該框架由3個(gè)模塊組成。首先,通過(guò)粗糙集和支持向量聚類相結(jié)合來(lái)進(jìn)行交通流數(shù)據(jù)的分類,設(shè)定初始的上下c、m參數(shù),利用加權(quán)因子法獲得缺失數(shù)據(jù)的補(bǔ)齊值。然后,利用模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)的預(yù)測(cè)獲得的數(shù)據(jù)與前面的數(shù)據(jù)進(jìn)行對(duì)比,然后利用遺傳算法優(yōu)化參數(shù),減小修復(fù)誤差,獲得最優(yōu)參數(shù)。

      4 實(shí)例分析

      4.1 數(shù)據(jù)準(zhǔn)備

      本論文使用的交通流數(shù)據(jù)是高速公路上利用線圈探測(cè)器采集的交通量數(shù)據(jù),共計(jì)120 d,時(shí)間是2011年1月至2011年4月。在圖3中顯示了1月3日至1月7日不同時(shí)間間隔(5、10、30、60 min)的交通流量數(shù)據(jù)分布。

      根據(jù)缺失的位置的分布情況,可以將數(shù)據(jù)缺失形式分為隨機(jī)丟失、連續(xù)丟失和系統(tǒng)丟失,3種丟失形式的示意圖如圖4所示。

      圖2 基于支持向量聚類和模糊粗糙集的交通流數(shù)據(jù)修復(fù)框架圖Fig.2 Framework of missing data imputation for traffic flow based on SVC and fuzzy rough set

      圖3 在相鄰的5 d內(nèi)以不同的時(shí)間間隔收集的流量數(shù)據(jù)折線圖Fig.3 Graphs of traffic data collected at different time intervals during the five adjacent days

      4.2 粗糙支持向量聚類分類結(jié)果

      利用建立的粗糙支持向量聚類模型進(jìn)行交通流數(shù)據(jù)的分類,在數(shù)據(jù)以不同時(shí)間間隔收集的情況下獲得的分類結(jié)果如圖5所示。

      在圖5中,交通流數(shù)據(jù)總共分成了3類,分別以橙色、藍(lán)色和粉色為中心,球形的上近似半徑和下近似半徑形成了輪廓包圍了這3個(gè)中心。可以通過(guò)設(shè)置每個(gè)分類的上下中心的權(quán)值,通過(guò)加權(quán)平均值法獲得初始缺失數(shù)據(jù)補(bǔ)齊值。

      (a) 隨機(jī)丟失(a) Missing at random

      (b) 連續(xù)丟失(b) Continuous data loss

      (c) 系統(tǒng)丟失(c) Systematic data loss

      圖5 粗糙支持向量聚類模型分類結(jié)果圖Fig.5 Classification results of the support vector clustering model with fuzzy rough sets

      4.3 模糊神經(jīng)網(wǎng)絡(luò)和遺傳算法數(shù)據(jù)補(bǔ)齊結(jié)果

      在進(jìn)行數(shù)據(jù)分類之后,結(jié)合模糊神經(jīng)網(wǎng)絡(luò)和遺傳算法對(duì)缺失數(shù)據(jù)進(jìn)行補(bǔ)齊,選取均方根誤差(RMSE)、相關(guān)系數(shù)(R)、相關(guān)精度(RA)3個(gè)結(jié)果評(píng)價(jià)指標(biāo),并選擇平均值法(MV)、回歸法(Regression)、基于KNN的模糊粗糙集方法(KNN-FRS)、自適應(yīng)網(wǎng)絡(luò)的模糊推理系統(tǒng)(ANFIS)、支持向量機(jī)(SVM)和張量(Tensor)6個(gè)模型進(jìn)行結(jié)果對(duì)比。在數(shù)據(jù)以5 min間隔收集,以不同丟失形式,不同丟失率的情況下,結(jié)果如圖6所示。

      從圖6可以看出,在隨機(jī)丟失和連續(xù)丟失2種情況下(本研究中的數(shù)據(jù)丟失是對(duì)采集的完整數(shù)據(jù)集進(jìn)行隨機(jī)丟失和連續(xù)丟失的模擬),隨著數(shù)據(jù)丟失率的增加,模型的補(bǔ)齊結(jié)果的均方根誤差(RMSE)都增加,相關(guān)系數(shù)(R)和相對(duì)精度(RA)都減少,說(shuō)明隨著數(shù)據(jù)丟失率的增加,模型的補(bǔ)齊效果減少。通過(guò)圖6(a)和圖6(b)可以看出,隨著丟失率增大,基于支持向量聚類和模糊粗糙集的交通流數(shù)據(jù)修復(fù)方法(FRS-SVR)的結(jié)果均小于其他6種方法,這說(shuō)明就均方根誤差這一評(píng)價(jià)指標(biāo)而言,本研究所建立的交通流丟失數(shù)據(jù)補(bǔ)齊模型的修復(fù)效果優(yōu)于其他6種對(duì)比模型。通過(guò)圖6(c)和圖6(f)中關(guān)于指標(biāo)相關(guān)系數(shù)和相對(duì)精度的結(jié)果可以看出,隨著數(shù)據(jù)丟失率的增加,基于支持向量聚類和模糊粗糙集的交通流數(shù)據(jù)修復(fù)方法(FRS-SVR)的結(jié)果從總體上來(lái)說(shuō)均大于其他6種方法,這說(shuō)明根據(jù)相關(guān)系數(shù)和相對(duì)精度這2個(gè)評(píng)價(jià)指標(biāo)的表現(xiàn),本研究所建立的交通流丟失數(shù)據(jù)補(bǔ)齊模型的修復(fù)效果優(yōu)于其他6種對(duì)比模型。

      圖6 在不同丟失類型的數(shù)據(jù)集中7種方法的性能表現(xiàn)Fig.6 Performance of seven methods in datasets with different missing strategies

      5 結(jié)論

      本研究將支持向量聚類和模糊粗糙集相結(jié)合,并結(jié)合模糊神經(jīng)網(wǎng)絡(luò)和遺傳算法建立了一個(gè)混合模型來(lái)估算丟失的交通流數(shù)據(jù)。將模糊粗糙集和支持向量聚類結(jié)合,進(jìn)行不同時(shí)間間隔收集的交通流數(shù)據(jù)的分類,然后結(jié)合模糊神經(jīng)網(wǎng)絡(luò)和遺傳算法進(jìn)行缺失數(shù)據(jù)的估計(jì)。利用某高速公路收集的交通流數(shù)據(jù)用于模型性能的驗(yàn)證,并使用均方根誤差、相關(guān)系數(shù)和相關(guān)精度3個(gè)指標(biāo)來(lái)評(píng)估插補(bǔ)精度。結(jié)果表明,研究中提出的支持向量聚類和模糊粗糙集模型的插補(bǔ)性能比其他6種對(duì)比方法的修復(fù)性能更高。這些結(jié)果驗(yàn)證了所提出的方法的有效性,也呈現(xiàn)出一定的局限性。例如,隨著缺失率的增加,3個(gè)評(píng)價(jià)指標(biāo)的惡化程度迅速增加,這意味著模型的補(bǔ)齊效果降低,模型的穩(wěn)定性較差。在交通系統(tǒng)中,一旦受到比較嚴(yán)重的影響時(shí),交通流數(shù)據(jù)極大可能存在大范圍的丟失。因此,應(yīng)做出更大的努力來(lái)提高模型的穩(wěn)定性,以滿足在數(shù)據(jù)存在系統(tǒng)丟失的情況。此外,本研究?jī)H考慮隨機(jī)和連續(xù)丟失數(shù)據(jù)的情況,而沒(méi)有考慮在特殊情況下(如事故情況和天氣影響)丟失數(shù)據(jù)的情況。在這種情況下,流量檢測(cè)儀器可能會(huì)完全無(wú)法檢測(cè)與記錄數(shù)據(jù),流量數(shù)據(jù)將存在系統(tǒng)丟失的情況。數(shù)據(jù)系統(tǒng)的缺失意味著一定時(shí)間內(nèi)數(shù)據(jù)會(huì)完全丟失。系統(tǒng)缺失的數(shù)據(jù)補(bǔ)齊是未來(lái)需要進(jìn)一步突破的挑戰(zhàn)。在未來(lái),可以考慮多個(gè)檢測(cè)器之間的時(shí)空相關(guān)性以提高插補(bǔ)精度,進(jìn)一步考慮道路網(wǎng)的交通流數(shù)據(jù)之間的關(guān)系,系統(tǒng)地補(bǔ)齊交通流丟失數(shù)據(jù),為交通道路網(wǎng)系統(tǒng)的研究提供一定的數(shù)據(jù)支持,最終可為智能交通的發(fā)展奠定數(shù)據(jù)基礎(chǔ)。

      猜你喜歡
      粗糙集交通流遺傳算法
      基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
      基于自適應(yīng)遺傳算法的CSAMT一維反演
      一種基于遺傳算法的聚類分析方法在DNA序列比較中的應(yīng)用
      基于遺傳算法和LS-SVM的財(cái)務(wù)危機(jī)預(yù)測(cè)
      多?;植诩再|(zhì)的幾個(gè)充分條件
      交通流隨機(jī)行為的研究進(jìn)展
      雙論域粗糙集在故障診斷中的應(yīng)用
      路內(nèi)停車對(duì)交通流延誤影響的定量分析
      基于改進(jìn)的遺傳算法的模糊聚類算法
      兩個(gè)域上的覆蓋變精度粗糙集模型
      嵊州市| 昌江| 潍坊市| 宁武县| 古丈县| 台南市| 邹城市| 喀什市| 游戏| 杭锦旗| 永州市| 巴马| 通化县| 双鸭山市| 麟游县| 彰化县| 安图县| 盐津县| SHOW| 曲沃县| 林口县| 进贤县| 翁源县| 海原县| 深水埗区| 秭归县| 台南市| 台中市| 苏尼特左旗| 扬中市| 葫芦岛市| 隆回县| 海晏县| 昌宁县| 鹤岗市| 交口县| 罗江县| 务川| 大安市| 浏阳市| 柳林县|