于福華,范永青
(西安郵電大學 自動化學院, 陜西 西安 710121)
基于改進FCM算法的交通流分析
于福華,范永青
(西安郵電大學 自動化學院, 陜西 西安 710121)
摘要:針對交通流聚類問題,提出一種改進的模糊C-均值算法。該算法根據(jù)交通流特點,對樣本數(shù)據(jù)集進行處理得到模糊等價矩陣,通過改進隸屬度函數(shù)和距離度量函數(shù)得到新的目標函數(shù),利用拉格朗日算法優(yōu)化隸屬度和聚類中心,最后通過凝聚度和分離度實現(xiàn)自動聚類。實驗結(jié)果表明,改進FCM算法削弱了突變點影響,提高了聚類效果。
關鍵詞:FCM算法;改進FCM算法;隸屬度函數(shù);聚類中心;交通流
模糊C-均值(FuzzyC-Means,F(xiàn)CM)聚類算法是由硬C-均值(HardC-Means,HCM)聚類算法發(fā)展而來[1],已被廣泛應用于模式識別[2-3]、數(shù)據(jù)挖掘[4-5]、圖像處理[6]及機器學習[7]等領域。
交通流數(shù)據(jù)尤其是小數(shù)據(jù)量交通流數(shù)據(jù)存在數(shù)據(jù)噪聲,并且實時交通流是動態(tài)變化的,其聚類數(shù)及聚類中心未知,這對FCM聚類算法提出更高的要求。現(xiàn)有的FCM聚類算法在交通流數(shù)據(jù)聚類中存在抗噪性不足的問題[8-10]。本文通過改進隸屬度函數(shù)和距離度量函數(shù),對FCM聚類算法進行優(yōu)化,最后利用改進的FCM自動聚類算法對某高速公路交通流樣本數(shù)據(jù)進行聚類分析。
1FCM聚類算法
FCM算法通過迭代優(yōu)化目標函數(shù)而得到聚類結(jié)果,用隸屬度來反映樣本點隸屬于某一類的程度[11]。原始數(shù)據(jù)樣本集X={x1,x2,…,xn},共n個樣本,每個樣本有m項指標。建立優(yōu)化目標函數(shù)
其中隸屬矩陣為U=(uij)c×n,uij表示數(shù)據(jù)集合中第j個元素對第i個聚類中心的隸屬度;聚類中心矩陣為V=(vi)c,c為分類樹,vi表示第i個聚類的聚類中心,vi=(vi1,vi2,…,vim);dij為第i個聚類中心與第j個元素間的歐幾里德距離;α為模糊指數(shù),反映模糊程度。值越大,分類的模糊度越高。對隸屬度和聚類中心按照拉格朗日乘子尋優(yōu)算法進行迭代。第q步后的隸屬度和聚類中心迭代表達式為
‖v(q+1)-v(q)‖<ε1并且‖u(q+1)-u(q)‖<ε2,
則迭代停止,其中ε1和ε2為迭代停止閾值。
2改進FCM聚類算法
對經(jīng)過標準均一化處理后的標準數(shù)據(jù)集進行模糊運算,得到模糊相似矩陣,對模糊相似矩陣進行平方法運算得到模糊等價矩陣。通過優(yōu)化隸屬度函數(shù)和距離度量函數(shù)從而改進目標函數(shù)。經(jīng)過對隸屬度和聚類中心進行迭代優(yōu)化,并由凝聚度和分離度確定最優(yōu)分類數(shù),從而實現(xiàn)改進FCM聚類算法的自動聚類。
2.1數(shù)據(jù)預處理
2.2模糊等價矩陣
模糊相似矩陣R=(rij)n×n,分別按照最大最小法和比例相似法建立模糊相似矩陣
2.3目標函數(shù)
為了提高FCM聚類算法的抗噪性,提出改進FCM聚類算法。減少數(shù)據(jù)樣本中噪聲點或跳變點對聚類的影響,引入偏差系數(shù)對隸屬度函數(shù)進行優(yōu)化;在距離度量函數(shù)的優(yōu)化中,引入距離調(diào)整系數(shù)對距離度量函數(shù)進行修正,從而改進目標函數(shù)[13]。
2.4迭代優(yōu)化
2.5自動聚類
分析不同分類數(shù)c所對應的聚類結(jié)果,按照凝聚度和分離度自動確定最優(yōu)分類數(shù),實現(xiàn)改進FCM聚類算法。聚類有效性評價指標FXB用以評價聚類有效性,F(xiàn)XB越小對應聚類有效性越好?;贔CM聚類算法的理論最優(yōu)分類數(shù)目標函數(shù)表達式為
3實驗結(jié)果與分析
3.1指標聚類
取某高速公路一個月上行和下行的交通流數(shù)據(jù)Y和Z為樣本,其指標包括交通流量、平均速度、時間占有率、時間間距、交通密度。對數(shù)據(jù)樣本進行指標聚類,設定初始參數(shù)
w(xc)=w(bl)=0.5,ε1=ε2=1E-5,α=2。采用改進FCM聚類算法進行指標聚類,其結(jié)果相同。自動聚類c*=3,指標聚類為{交通流量q}、{平均速度v}和{時間占有率o,時間間距t,交通密度ρ}。
3.2數(shù)據(jù)聚類
根據(jù)交通流指標聚類結(jié)果,在交通流數(shù)據(jù)聚類中對交通流量q、平均速度v和時間占有率o進行分析。采用各日平均小時交通流數(shù)據(jù)用于FCM聚類分析和改進FCM聚類分析,得到各聚類中心以及評價指標如表1所示。
表1 智能交通系統(tǒng)隧道交通流數(shù)據(jù)聚類
聚類評價指標分別表示對于c*分類時各聚類水平,并且相對于FXB和FIXB越小代表其聚類越合理。從表1可看出,采用改進FCM比采用FCM的評價指標值減小,反映出改進FCM聚類算法優(yōu)于FCM聚類算法。改進FCM聚類算法提高了FCM聚類算法的抗噪性,在交通流數(shù)據(jù)聚類中削弱了噪聲點和突變點對聚類的影響,聚類中心向各中心靠近,提高了原有聚類算法的聚類效果。對于節(jié)假日出現(xiàn)突變數(shù)據(jù)時,改進FCM聚類優(yōu)化明顯優(yōu)于經(jīng)典FCM聚類結(jié)果。
4結(jié)束語
改進的FCM聚類算法通過引入偏差系數(shù)和距離調(diào)整系數(shù)分別對隸屬度函數(shù)和距離度量函數(shù)進行優(yōu)化。通過對某高速公路的交通流樣本進行實驗,分別對FCM聚類算法和改進FCM聚類算法進行聚類對比。實驗結(jié)果表明,通過采用改進FCM聚類算法后評價指標均有所改善,即改進FCM聚類算法優(yōu)于原FCM聚類算法。改進FCM算法削弱了噪聲對算法的影響,并且減弱了突變點數(shù)據(jù)對聚類的影響。
參考文獻
[1]KUMARP,SirohiD.ComparativeAnalysisofHCMandFCMAlgorithmonirisDataSet[J].InternationalJournalofComputerApplications, 2010,5(2):33.
[2]張超,趙向陽. 基于加權模糊核聚類的局部放電模式識別[J].電力電子,2012(1):32-35.
[3]侯雪梅. 基于全監(jiān)督算法RBF神經(jīng)網(wǎng)絡的語音識別[J]. 西安郵電學院學報, 2011,16(1): 88-90.
[4]劉靜,趙宇馳. 數(shù)據(jù)挖掘領域中的聚類分析[J]. 東北林業(yè)大學學報,2012(8): 163-166.
[5]支曉斌, 田溪. 判別模糊c-均值聚類算法[J]. 西安郵電大學學報, 2013,18(5): 26-30.DOI:10.13682/j.issn.2095-6533.2013.05.025.
[6]李琳,范九倫,趙鳳. 模糊C-均值聚類圖像分割算法的一種改進[J]. 西安郵電大學學報, 2014,19(05):56-70.DOI:10.13682/j.issn.2095-6533.2014.05.011.
[7]高琰,古士文,唐琎. 機器學習中譜聚類方法的研究[J].計算機科學,2007(2):201-203.
[8]王旭琴,諶業(yè)文,胡堯. 基于FCM聚類的多路段城市道路車流數(shù)據(jù)分析及其應用[C]//貴州省系統(tǒng)工程學會第五屆學術年會論文集,貴陽:貴州省科學技術協(xié)會2014:10-20.
[9]黃艷國,許倫輝,鄺先驗.基于模糊C均值聚類的城市道路交通狀態(tài)判別[J].重慶交通大學學報:自然科學版,2015,2:106-111.DOI:10.3969/j.issn.1674-0696.2015.02.22.
[10]夏美娟, 梁雪春, 韓峰濤. 基于改進FCM聚類算法的T-S模糊神經(jīng)網(wǎng)絡水質(zhì)評價方法[J]. 計算機與應用化學, 2013,30(10):1197-1202.DOI:10.3969/j.issn.1001-4160.2013.10.024.
[11]高新波.模糊聚類分析及其應用[M].西安:西安電子科技大學出版社,2004:1-212.
[12]張媛,沈慶偉,張鈴. 基于上空間的模糊等價關系在聚類分析中的應用[J].安徽建筑工業(yè)學院學報:自然科學版,2013,21(2):83-86.
[13]于福華.特長高速公路隧道交通流研究[D].西安:長安大學,2010:1-66.
[責任編輯:祝劍]
AnalysisoftrafficflowbasedontheimprovedFCMalgorithm
YUFuhua,F(xiàn)ANYongqing
(SchoolofAutomation,Xi’anUniversityofPostsandTelecommunications,Xi’an710121,China)
Abstract:An improved Fuzzy C-Means (FCM) algorithm is put forward to resolve the traffic flow clustering. According to the characteristics of traffic flow, a fuzzy equivalent matrix is achieved by dealing with the sample data sets, a new objective function is optimized by improving the membership function and distance measurement function,and the Lagrange multiplier optimization algorithm is used to optimize the membership degree and clustering center. Then the automatic clustering is obtained by the degree of cohesion and separation. Experimental results show that, the improved FCM algorithm can weaken the mutation point effect and improve the clustering effect.
Keywords:FCM algorithm, improved FCM algorithm, membership function, clustering center, traffic flow
doi:10.13682/j.issn.2095-6533.2016.02.023
收稿日期:2014-5-16
基金項目:國家自然科學基金資助項目(61305098);陜西省教育廳科學研究計劃資助項目(12JK0791,14JK1671)
作者簡介:于福華(1976-),女,博士,講師,從事智能交通系統(tǒng)仿真研究。E-mail:yufuhua@xupt.edu.cn 范永青(1978-),女,博士,講師,從事非線性系統(tǒng)控制研究。E-mail:fanyongqing@xupt.edu.cn
中圖分類號:TP274
文獻標識碼:A
文章編號:2095-6533(2016)02-0115-04