• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      粒子群差分?jǐn)_動優(yōu)化的聚類算法研究

      2016-04-25 08:16:40于海鵬
      關(guān)鍵詞:聚類大數(shù)據(jù)

      米 捷,張 鵬,于海鵬

      (1.河南工程學(xué)院 計算機(jī)學(xué)院,河南 鄭州 451191;2.南召縣電業(yè)局,河南 南陽 474650)

      ?

      粒子群差分?jǐn)_動優(yōu)化的聚類算法研究

      米捷1,張鵬2,于海鵬1

      (1.河南工程學(xué)院 計算機(jī)學(xué)院,河南 鄭州 451191;2.南召縣電業(yè)局,河南 南陽 474650)

      摘要:通過對大數(shù)據(jù)優(yōu)化聚類分析,實現(xiàn)了機(jī)械設(shè)備的工況監(jiān)測和故障診斷,提出了一種基于粒子群差分?jǐn)_動優(yōu)化的數(shù)據(jù)模糊C均值聚類改進(jìn)算法,利用粒子群種群進(jìn)化的差異度逐漸變小的聚集原理,求得符合分類屬性模式的有限數(shù)據(jù)集特征,使用關(guān)聯(lián)維特征提取方法得到時頻聚類交叉項,結(jié)合模糊C均值聚類算法,把適應(yīng)度最小的粒子群個體進(jìn)行差分進(jìn)化處理,實現(xiàn)大數(shù)據(jù)信息流的特征融合和優(yōu)化聚類.仿真結(jié)果表明,采用該算法進(jìn)行大數(shù)據(jù)聚類處理,數(shù)據(jù)聚類中心具有較好的聚焦能力,受到的旁瓣干擾較小,避免陷入局部最優(yōu),降低了誤分率,在工況識別等領(lǐng)域具有較好的應(yīng)用價值.

      關(guān)鍵詞:大數(shù)據(jù);聚類;模糊C均值;粒子群

      隨著計算機(jī)信息處理技術(shù)的快速發(fā)展,人類進(jìn)入了大數(shù)據(jù)時代.大數(shù)據(jù)是通過云計算和云存儲方式加工和處理數(shù)據(jù),在信息庫中,需要對大數(shù)據(jù)進(jìn)行有效的挖掘和分類,為數(shù)據(jù)的特征分析和識別提供前提和基礎(chǔ).大數(shù)據(jù)的聚類分析就是通過提取數(shù)據(jù)的規(guī)則性信息特征并進(jìn)行分別,達(dá)到物以類聚的效果.優(yōu)化的數(shù)據(jù)聚類算法提高了數(shù)據(jù)處理和信息加工的效率及系統(tǒng)反應(yīng)的實時性,減少了運算開銷,受到了專家的廣泛重視[1].

      對大數(shù)據(jù)優(yōu)化聚類的原理是通過提取數(shù)據(jù)信息之間的相似性特征并進(jìn)行特征區(qū)分和分類處理,常見的數(shù)據(jù)聚類算法主要有數(shù)據(jù)網(wǎng)格層次聚類算法、數(shù)據(jù)特征風(fēng)格聚類算法、模糊C均值聚類算法、基于分布式網(wǎng)格粒子群調(diào)度的聚類算法等[2].各種聚類算法在不同的應(yīng)用環(huán)境中各有優(yōu)點,其中基于網(wǎng)格層次的聚類算法分為融合法和分裂法,適合于特征空間維數(shù)較高的數(shù)據(jù)聚類,對聚類中心矢量選擇的靈活性較好,但缺點是反復(fù)調(diào)整聚類的目標(biāo)狀態(tài)函數(shù)實現(xiàn)收斂,導(dǎo)致計算量較大.K-means聚類算法在數(shù)據(jù)出現(xiàn)小擾動干擾下,得不到全局最優(yōu)解,穩(wěn)定性較差[3].對此,Dunn提出了模糊C均值算法(Fuzzy C-means,F(xiàn)CM).FCM聚類算法利用數(shù)據(jù)特征之間的模糊性,通過對數(shù)據(jù)特征之間非此即彼關(guān)系的分析,使數(shù)據(jù)聚類中心不受數(shù)據(jù)次序的影響,提高了數(shù)據(jù)的聚斂能力,但FCM算法的缺陷是對初始值聚類中心敏感,容易陷入局部最優(yōu)解,導(dǎo)致數(shù)據(jù)聚類的精度不高[4-6].針對上述問題,利用粒子群種群進(jìn)化的差異度逐漸變小的“聚集”現(xiàn)象,進(jìn)行大數(shù)據(jù)聚類中心的差分進(jìn)化擾動,提出了一種基于粒子群差分?jǐn)_動優(yōu)化的大數(shù)據(jù)模糊C均值聚類改進(jìn)算法.首先,進(jìn)行了大數(shù)據(jù)信息流時間序列模型的構(gòu)建,對大數(shù)據(jù)信息流進(jìn)行特征融合處理,以此為基礎(chǔ),采用粒子群差分?jǐn)_動方法實現(xiàn)聚類中心的確定和計算,最后通過仿真實驗進(jìn)行了性能驗證.

      1數(shù)據(jù)分布結(jié)構(gòu)分析和大數(shù)據(jù)時間序列模型

      1.1大數(shù)據(jù)的分布式結(jié)構(gòu)分析

      為了實現(xiàn)對大數(shù)據(jù)的優(yōu)化聚類,首先需要分析大數(shù)據(jù)在云存儲系統(tǒng)中的分布式結(jié)構(gòu)模型.設(shè)大數(shù)據(jù)庫的分布式調(diào)度的概念格結(jié)點G1=(Ma1,Mβ1,Y1),G2=(Ma2,Mβ2,Y2),調(diào)整聚類中心矢量,兩個數(shù)據(jù)庫訪問時刻t和t+τ相互關(guān)聯(lián)的初始化聚類中心滿足G1?G2?Y1?Y2,令A(yù)={a1,a2,…,an}為大數(shù)據(jù)特征矢量的模糊聚類中心,采用大數(shù)據(jù)信息流預(yù)處理特征序列訓(xùn)練集的屬性集,令B={b1,b2,…,bm}為海量數(shù)據(jù)庫特征挖掘的屬性類別集,在給定大數(shù)據(jù)分布的權(quán)重指數(shù)下,ai的屬性值為{c1,c2,…,ck}.需要構(gòu)建數(shù)據(jù)庫的矢量空間,在矢量空間中進(jìn)行特征信息流分析,把有限數(shù)據(jù)集合X分為c類,通過數(shù)據(jù)預(yù)處理和篩選,尋找符合特征模式的有限數(shù)據(jù)集特征,使用關(guān)聯(lián)維特征提取方法得到時頻聚類交叉項,實現(xiàn)數(shù)據(jù)表示.

      把云存儲數(shù)據(jù)庫中的有限數(shù)據(jù)集合X分為c類,得到大數(shù)據(jù)分布式結(jié)構(gòu)下的屬性類別集信息增益表達(dá)式:

      (1)

      (2)

      Gain(A)=Info(B)-InfoA(B),

      (3)

      式中:A和B分別表示大數(shù)據(jù)的數(shù)據(jù)特征類別,pi表示數(shù)據(jù)信息增益特征分布在A類屬性的概率,Info()表示取信息熵并進(jìn)行卷積運算,計算第i個結(jié)點的數(shù)據(jù)目錄,采用廣義似然比檢驗方法對數(shù)據(jù)特征進(jìn)行匹配和融合,表示為

      C=min{max(Ci)},

      (4)

      (5)

      1.2大數(shù)據(jù)信息流的時間序列分析和預(yù)處理

      在上述構(gòu)建的大數(shù)據(jù)分布式結(jié)構(gòu)模型中,對大數(shù)據(jù)信息流采用非線性時間序列分析方法進(jìn)行信息融合和特征提取,在分布式云存儲系統(tǒng)中,采用滑動時間窗口采樣方法,提取大數(shù)據(jù)信息流的時間序列為{x(t0+iΔt)}, 其中的i=0,1,…,N-1,分布空間的微簇記為CF=〈F,Q,n,RT1,RT2,RW〉,數(shù)據(jù)流滑動窗口總數(shù)為n,設(shè)X和Y為類判別屬性集合,在云存儲系統(tǒng)中,設(shè)t時刻的時序窗口平均測度ε滿足2-λt<ε,其中的λ>0,大數(shù)據(jù)聚類的矢量特征狀態(tài)空間的相軌跡狀態(tài)表達(dá)式為

      X=[x(t0),x(t0+Δt),…,x(t0+(K-1)Δt)]=

      (6)

      式中:x(t)表示數(shù)據(jù)的分布式結(jié)構(gòu)下數(shù)據(jù)流微簇時間序列,J是相似度特征向量的時間窗函數(shù),m是目標(biāo)聚類特征空間的最小嵌入維數(shù),Δt為采樣時間間隔.進(jìn)一步,采用粒子群進(jìn)化方法進(jìn)行數(shù)據(jù)的濾波抗干擾預(yù)處理.假設(shè)在D維大數(shù)據(jù)聚類搜索空間中有m個粒子組成一個種群,結(jié)合FCM聚類算法,得到數(shù)據(jù)流在聚類過程中的分集聚斂目標(biāo)函數(shù)為

      (7)

      式中:m為權(quán)重指數(shù),xi為聚類中心的第i個矢量, ximax為最大聚斂半徑,ximin最小聚斂半徑,dik為樣本xk與Vi的聚類中心距離.采用歐氏距離計算,結(jié)合粒子濾波對聚類特征信息流進(jìn)行抗干擾信息融合處理,提高了聚類算法的抗干擾能力.

      2粒子群差分?jǐn)_動優(yōu)化及大數(shù)據(jù)聚類算法的改進(jìn)

      2.1粒子群差分?jǐn)_動優(yōu)化

      在進(jìn)行了大數(shù)據(jù)聚類的數(shù)據(jù)結(jié)構(gòu)分析和時間序列模型構(gòu)建的基礎(chǔ)上,對大數(shù)據(jù)聚類算法進(jìn)行改進(jìn).算法改進(jìn)的原理如下:為了使數(shù)據(jù)聚類算法的粒子群差分?jǐn)_動的全局搜索能力與局部搜索能力達(dá)到平衡,利用Logistics混沌映射對粒子群進(jìn)化種群的聚類中心矢量進(jìn)行優(yōu)化搜索,把混沌擾動量引入有限數(shù)據(jù)集合的粒子群進(jìn)化種群中,彌補了傳統(tǒng)的FCM算法對初始聚類中心有較大敏感性的缺陷.

      利用粒子群差分?jǐn)_動優(yōu)化聚類進(jìn)行算法改進(jìn)的優(yōu)勢體現(xiàn)在:

      (1)根據(jù)混沌差分進(jìn)化算法的全局搜索性尋找大數(shù)據(jù)FCM聚類中心的最佳值,隨著聚類中心的更新,把混沌擾動量引入進(jìn)化種群當(dāng)中,選出初始最優(yōu)和全局最優(yōu)個體,此時算法的尋優(yōu)能力得到了有效提高;

      (2)為了反映數(shù)據(jù)類群的多樣性特征,產(chǎn)生一個隨機(jī)矩陣作為初始種群,采用粒子群差分?jǐn)_動序列Logistics混沌映射加入種群中,載入到種群個體中的擾動變量得到最優(yōu)的適應(yīng)度值,提高了數(shù)據(jù)的聚類準(zhǔn)確度;

      (3)在迭代過程中,為了避免算法過早地進(jìn)入局部極值部分的點,將粒子群差分?jǐn)_動理論引入算法中,利用混沌序列的均勻遍歷特性和差分進(jìn)化算法的高效全局搜索能力,有效地克服了算法對初始聚類中心較大的敏感性.

      算法的具體實現(xiàn)過程描述如下:利用粒子群種群進(jìn)化的差異度逐漸變小的“聚集”現(xiàn)象,進(jìn)行大數(shù)據(jù)聚類中心的差分進(jìn)化擾動.假設(shè)具有均勻遍歷性的大數(shù)據(jù)分布式數(shù)據(jù)集為X,由m個粒子構(gòu)成一個種群,滿足最優(yōu)目標(biāo)函數(shù)下的粒子個體搜索有限數(shù)據(jù)集

      X={x1,x2,…,xn}?Rs,

      (8)

      式中:第i個粒子的當(dāng)前聚類中心的特征向量xi=(xi1,xi2,…,xiD).在大數(shù)據(jù)特征空間中,采用協(xié)方差搜索方法得到梯度下降方向的數(shù)據(jù)集合中最優(yōu)聚類粒子權(quán)值

      (9)

      (10)

      對于含有n個樣本的有限數(shù)據(jù)集,樣本xi(i=1,2,…,n)的聚類中心擾動矢量為

      xi=(xi1,xi2,…,xis)T.

      (11)

      對大數(shù)據(jù)聚類控制模型進(jìn)行相位合成,把有限數(shù)據(jù)集合X分為c類,其中1

      V={vij|i=1,2,…,c,j=1,2,…,s}.

      (12)

      根據(jù)個體最優(yōu)和全局最優(yōu)解得到第i個聚類中心矢量,從而得到標(biāo)準(zhǔn)粒子群優(yōu)化下的模糊劃分矩陣

      U={μik|i=1,2,…,c,k=1,2,…,n},

      (13)

      式中:c為差分進(jìn)化的步數(shù),μik為種群類的分岔李雅普諾夫泛函集.為了反映數(shù)據(jù)聚類過程中粒子群的多樣性特征,結(jié)合FCM聚類算法,通過定義得到粒子群差分?jǐn)_動下的聚類目標(biāo)函數(shù)為

      (14)

      式中:m為聚類包絡(luò)向量振蕩時的極大值,(dik)2為樣本xk與Vi的測度距離,用歐氏距離表示為

      (dik)2=‖xk-Vi‖2.

      (15)

      進(jìn)一步計算大數(shù)據(jù)聚類的數(shù)據(jù)類群適應(yīng)度值為

      (16)

      采用粒子群差分?jǐn)_動產(chǎn)生一個初始隸屬度矩陣,載入到種群個體中的擾動變量為

      xn,G=xn,G+Δxi,

      (17)

      式中:Δxi為最優(yōu)個體的迭代步長增量.利用梯度下降信息得到擾動范圍NP個混沌序列分量

      xn+1=4xn(1-xn),n=1,2,…,NP.

      (18)

      獲取大數(shù)據(jù)聚類中心穩(wěn)定階段前的全局最優(yōu)點,加入NP個擾動變量的混沌分量:

      Δxi=a+(b-a)xn,n=1,2,…,NP.

      (19)

      為了使大數(shù)據(jù)聚類算法的粒子群差分?jǐn)_動的全局搜索能力與局部搜索能力達(dá)到平衡,避免陷入約束條件,設(shè)置門限值Nth,當(dāng)Neff

      (20)

      考慮全局優(yōu)化問題,在搜索的后期定位適應(yīng)度最小的個體,并計算粒子群差分?jǐn)_動個體經(jīng)歷過的最好位置pi=(pi1,pi2,……,piD).通過上述設(shè)計,在粒子群差分?jǐn)_動優(yōu)化下,使大數(shù)據(jù)聚類的中心在xi和xj處達(dá)到收斂,避免陷入局部最優(yōu).

      2.2改進(jìn)算法的實現(xiàn)流程

      通過粒子群差分?jǐn)_動,利用粒子群種群進(jìn)化的差異度逐漸變小的聚集原理,進(jìn)行大數(shù)據(jù)聚類中心的差分進(jìn)化擾動.根據(jù)FCM算法更新模糊分類矩陣,采用粒子群差分?jǐn)_動方法實現(xiàn)聚類中心的確定和計算,進(jìn)行數(shù)據(jù)優(yōu)化聚類,改進(jìn)算法的具體流程如下:

      (1)初始化大數(shù)據(jù)聚類中心,計算粒子群種群一定的速度Vi=(υi1,υi2,…,υiD)T和位置Xi=(xi1,xi2,…,xiD)T,對粒子群進(jìn)行當(dāng)前位置的更新處理,產(chǎn)生一個隨機(jī)矩陣作為初始種群,選出初始最優(yōu)個體和全局最優(yōu)個體,提取第j個粒子移動的采樣均值

      (21)

      (2)按照差分進(jìn)化(differential evolution,DE)算法進(jìn)行粒子群擾動分解,計算第i個粒子全局優(yōu)化擾動下的聚類中心概率

      (22)

      式中:xk為第k個動態(tài)慣性權(quán)重,a為聚類中心的控制參量.

      (3)設(shè)定相空間搜索維度為m,比較粒子群慣性權(quán)重系數(shù),如果滿足mf<ξ,則進(jìn)行第(4)步;如果mf>ξ,則轉(zhuǎn)入第(5)步.

      (4)根據(jù)不同數(shù)據(jù)聚類任務(wù),把適應(yīng)度最小的個體進(jìn)行差分進(jìn)化處理,將擾動序列加入粒子群種群中產(chǎn)生模因組信息素矩陣,矩陣大小為c×D維,聚類中心采用歸一化處理,收斂到(0,1).若數(shù)據(jù)集為m,令A(yù)j(L)作為聚類中心,其中j=1,2,…,k.根據(jù)Logistic混沌映射形式,聚類矢量特征序列分量

      xn+1=4xn(1-xn),n=1,2,…,NP.

      (23)

      (5)在大數(shù)據(jù)環(huán)境下,對若干樣本數(shù)據(jù)進(jìn)行歸一化處理,調(diào)整適應(yīng)度函數(shù),在分類器中實現(xiàn)數(shù)據(jù)優(yōu)化聚類,其中大數(shù)據(jù)歸一化處理過程為

      (24)

      通過上述處理,以適應(yīng)度最優(yōu)解作為最終結(jié)果輸出,結(jié)合對大數(shù)據(jù)信息流進(jìn)行特征融合處理的結(jié)果,采用粒子群差分?jǐn)_動提高了對聚類中心的收斂性能和數(shù)據(jù)聚類的精度.

      3仿真實驗與結(jié)果分析

      為了測試本算法在實現(xiàn)大數(shù)據(jù)優(yōu)化聚類中的性能,進(jìn)行仿真實驗.采用人工數(shù)據(jù)集和Web云存儲數(shù)據(jù)庫中的DDR3 2014實驗數(shù)據(jù)集進(jìn)行測試.DDR3 2014實驗數(shù)據(jù)集分為4組樣本集合,每類樣本屬性集有102 498個樣本,人工數(shù)據(jù)集為某大型紡織機(jī)械系統(tǒng)工況監(jiān)測分析專家數(shù)據(jù)庫中的數(shù)據(jù)樣本.設(shè)粒子數(shù)種群規(guī)模為Ns=200,500,700,1 000,對于每一個粒子,通過比較其適應(yīng)度與群體最優(yōu)適應(yīng)度值的大小,根據(jù)群體適應(yīng)度方差得出大數(shù)據(jù)聚類中心的分布式衰減因子λ=0.25;按照最近鄰法則,確定數(shù)據(jù)集中的聚類劃分半徑,得出云存儲數(shù)據(jù)庫中的中心節(jié)點的聚類空間半徑R=16;對于每一個粒子,比較它的更新位置和速度,得出群體最優(yōu)適應(yīng)度值,把數(shù)據(jù)聚類的數(shù)據(jù)點隨機(jī)劃分為某一類,得出粒子位置的閾值μ=10;數(shù)據(jù)采樣樣本的時間間隔為0.13s.采用文獻(xiàn)[7]給出的虛假最近鄰點法,進(jìn)行相空間搜索維度的最小嵌入維數(shù)的計算,得出數(shù)據(jù)聚類特征空間的維度為30.根據(jù)群體適應(yīng)度方差,設(shè)定參量Gmax=30,D=12,c=3,NP=30,擾動范圍β=0.001,個體的適應(yīng)度值T=5,群迭代次數(shù)為100,粒子群規(guī)模為20,差分進(jìn)化的閾值為[0.4,0.9],加速因子為2,粒子群的交叉概率取值為[0,1].采用Web云存儲數(shù)據(jù)庫中的DDR3 2014實驗數(shù)據(jù)作為分析樣本,得到4個數(shù)據(jù)庫分析樣本的聚類結(jié)果,如圖1所示.

      圖1 Web數(shù)據(jù)采樣樣本大數(shù)據(jù)聚類結(jié)果Fig.1 Data clustering results of Web data samples

      圖2 人工樣本數(shù)據(jù)采集時域波形Fig.2 Time domain waveform of artificial sample data

      從圖1可見,采用本算法進(jìn)行大數(shù)據(jù)聚類,通過提取數(shù)據(jù)集的屬性特征,采用粒子群差分?jǐn)_動進(jìn)行聚類中心估算,實現(xiàn)了4組數(shù)據(jù)集的特征優(yōu)化分類,有效降低了誤分率.為了進(jìn)一步驗證本算法在實現(xiàn)模式識別和智能診斷方面的應(yīng)用性能,以實際工作環(huán)境中采集的某大型紡織機(jī)械系統(tǒng)工況監(jiān)測分析專家數(shù)據(jù)庫中的數(shù)據(jù)為分析樣本進(jìn)行數(shù)據(jù)聚類分析,實現(xiàn)工況模式識別和智能診斷,得到不同數(shù)據(jù)采集通道上的時域波形,如圖2所示.

      以上述采集的工況數(shù)據(jù)為測試樣本集,輸入本設(shè)計的數(shù)據(jù)聚類系統(tǒng)中進(jìn)行分析.為了對比算法性能,分別采用本算法和傳統(tǒng)算法通過10 000次MonteCarlo運算,得到了大數(shù)據(jù)聚類中心特征分布結(jié)果,如圖3所示,從圖3可見,采用本算法,聚類中心具有較好的聚焦能力,受到的旁瓣干擾較小,通過粒子群差分?jǐn)_動抑制了干擾向量,隨著數(shù)據(jù)特征向量的增大,避免了在局部極值點收斂,聚類中心的收斂性較好,有效解決了聚類中心陷入了局部最優(yōu)的問題.

      為了定量分析算法的性能,以大數(shù)據(jù)聚類的誤分率為測試指標(biāo),采用本算法和傳統(tǒng)算法得到的性能對比結(jié)果如圖4所示.由圖4可知,采用本算法數(shù)據(jù)聚類的誤分率最小、精度較高,提高了狀態(tài)監(jiān)測和模式識別的精度,性能優(yōu)越.

      圖3 大數(shù)據(jù)聚類中心特征分布結(jié)果Fig.3 Feature distribution results of large data clustering center

      圖4 性能對比Fig.4 Performance comparison results

      4結(jié)語

      通過大數(shù)據(jù)優(yōu)化聚類實現(xiàn)模式識別和狀態(tài)監(jiān)測,提出了一種基于粒子群差分?jǐn)_動優(yōu)化的大數(shù)據(jù)模糊C均值聚類算法.研究結(jié)果表明,采用該聚類算法能有效提高數(shù)據(jù)聚類的精度、降低誤分率,無論是在云存儲環(huán)境下的Web數(shù)據(jù)挖掘還是在實際環(huán)境下的紡織機(jī)械工況監(jiān)測等領(lǐng)域,都具有較好的應(yīng)用價值.

      參考文獻(xiàn):

      [1]吳濤,陳黎飛,郭躬德.優(yōu)化子空間的高維聚類算法[J].計算機(jī)應(yīng)用,2014,34(8):2279-2284.

      [2]辛宇,楊靜,湯楚蘅,等.基于局部語義聚類的語義重疊社區(qū)發(fā)現(xiàn)算法[J].計算機(jī)研究與發(fā)展,2015,52(7):1510-1521.

      [3]文天柱,許愛強(qiáng),程恭.基于改進(jìn)ENN2 聚類算法的多故障診斷方法[J].控制與決策,2015,30(6):1021-1026.

      [4]陶新民,宋少宇,曹盼東,等.一種基于流形距離核的譜聚類算法[J].信息與控制,2012(3):307-313.

      [5]LIAOLC,JIANGXH,ZOUFM,etal.Aspectralclusteringmethodforbigtrajectorydataminingwithlatentsemanticcorrelation[J].ChineseJournalofElectronics,2015,43(5):956-964.

      [6]XINY,YANGJ,TANGCH,etal.Anoverlappingsemanticcommunitydetectionalgorithmbasedonlocalsemanticcluster[J].JournalofComputerResearchandDevelopment,2015,52(7):1510-1521.

      [7]李鋼虎,李亞安,賈雪松.水聲信號的混沌特征參數(shù)提取與分類研究[J].西北工業(yè)大學(xué)學(xué)報,2006,24(2):170-173.

      Research of data clustering algorithm based on particle swarm differential perturbation optimization

      MI Jie1, ZHANG Peng2, YU Haipeng1

      (1.CollegeofComputer,HenanUniversityofEngineering,Zhengzhou451191,China;2.NanzhaoCountyElectricPowerBureau,Nanyang474650,China)

      Abstract:Through the analysis of large data optimization clustering analysis, the fault diagnosis of mechanical equipment is realized. An improved algorithm for large data fuzzy C means clustering based on particle swarm optimization and differential perturbation optimization is proposed. By using the clustering principle of the population evolution of particle swarm optimization, the finite data set of classification attributes is obtained. Using correlation dimension feature extraction method and FCM clustering algorithm, the population of the adaptive degree is different. Simulation results show that the proposed algorithm is used in large data clustering, and the data clustering center has a good focusing capability, and the side lobe interference is small, which can avoid falling into local optimum, and it can reduce the error rate.

      Key words:large data; clustering; fuzzy C means; particle swarm optimization

      中圖分類號:TP391

      文獻(xiàn)標(biāo)志碼:A

      文章編號:1674-330X(2016)01-0063-06

      作者簡介:米捷(1981-),女,河南鄭州人,講師,主要從事計算機(jī)應(yīng)用研究.

      基金項目:河南省教育廳科學(xué)技術(shù)研究重點項目(16A520004)

      收稿日期:2015-10-15

      猜你喜歡
      聚類大數(shù)據(jù)
      基于K-means聚類的車-地?zé)o線通信場強(qiáng)研究
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      條紋顏色分離與聚類
      大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
      新聞世界(2016年10期)2016-10-11 20:13:53
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
      中國記者(2016年6期)2016-08-26 12:36:20
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
      自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
      汝州市| 读书| 罗田县| 崇义县| 奉化市| 肥西县| 门源| 通山县| 诸城市| 白水县| 琼海市| 河曲县| 静乐县| 岳池县| 枝江市| 长寿区| 离岛区| 衡南县| 抚远县| 长沙市| 临沧市| 洮南市| 将乐县| 穆棱市| 合川市| 宁化县| 阿图什市| 文化| 金乡县| 蚌埠市| 屏东县| 盈江县| 鹤山市| 济源市| 睢宁县| 綦江县| 宁河县| 革吉县| 沂源县| 西乌| 金川县|