張秋穎 沈小芳
【摘要】本文提出了一種基于模糊聚類和模糊模式識(shí)別的故障診斷系統(tǒng)的診斷流程,并討論了將原始數(shù)據(jù)進(jìn)行前期處理的方法,同時(shí)提出了使故障診斷系統(tǒng)具有自學(xué)習(xí)功能的方法.本文提出的方法不僅具有一定的學(xué)術(shù)價(jià)值,在實(shí)踐中也具有指導(dǎo)意義.最后,本文對(duì)以上的研究工作進(jìn)行了總結(jié),并提出了進(jìn)一步的研究方向.
【關(guān)鍵詞】模糊聚類;模糊模式識(shí)別;故障診斷;自學(xué)習(xí)
引 言
基于模糊數(shù)學(xué)理論中的模糊聚類和模糊模式識(shí)別技術(shù)進(jìn)行故障診斷是目前的研究熱點(diǎn),文獻(xiàn)[1]研究了基于模糊聚類的柴油機(jī)故障診斷技術(shù),其采用的是經(jīng)典的模糊C均值聚類算法,該算法的一個(gè)明顯缺點(diǎn)是以歐式距離度量樣本間的距離,進(jìn)而得出隸屬度,僅對(duì)球狀或橢球狀數(shù)據(jù)集(各向同性數(shù)據(jù)集)能得出較優(yōu)的分類結(jié)果,對(duì)其他類型數(shù)據(jù)集分類效果差,甚至與實(shí)際情況不符;文件[2][3]提出了改進(jìn)的模糊C均值聚類故障診斷方法,即在計(jì)算樣本距離時(shí)乘以一個(gè)權(quán)值;文獻(xiàn)[4]以遺傳算法計(jì)算權(quán)值,其實(shí)質(zhì)仍然是以歐式距離度量樣本間的距離.
結(jié)合上述介紹,本文主要研究的內(nèi)容為:一是討論基于模糊數(shù)學(xué)理論的故障診斷流程,并提出將系統(tǒng)原始數(shù)據(jù)集變換為各向同性數(shù)據(jù)集的思想;二是提出一種故障診斷系統(tǒng)的自學(xué)習(xí)機(jī)制,使故障診斷系統(tǒng)真正具有智能性.
一、模糊聚類、模糊模式識(shí)別與故障診斷
設(shè)對(duì)某個(gè)系統(tǒng)進(jìn)行故障診斷,采集系統(tǒng)數(shù)據(jù)m個(gè),每隔一段時(shí)間記錄一組樣本,已記錄樣本n個(gè),分別用x1,x2,…,xn表示,其中每個(gè)樣本的具體數(shù)據(jù)為:
xi=(xi1,xi2,…,xim)(i=1,2,…,n)(1)
于是可得原始數(shù)據(jù)矩陣如下表所示.
應(yīng)用模糊聚類技術(shù)并結(jié)合實(shí)際情況,將上述n個(gè)樣本分為r類,其中,第j類的樣本數(shù)為nj,分別用x(j)1,x(j)2,…,x(j)nj表示,其中每個(gè)樣本的具體數(shù)據(jù)為:
x(j)i=(x(j)i1,x(j)i2,…,x(j)im)(i=1,2,…,nj,j=1,2,…,r) (2)
第j類的聚類中心為:
x-(j)=(x-(j)1,x-(j)2,…,x-(j)m)(3)
式中x-(j)k為第k個(gè)數(shù)據(jù)的平均值,即:
x-(j)k=1nj∑nji=1x(j)ik(k=1,2,…,m)(4)
將n個(gè)樣本分好類后,面對(duì)樣本xn+1,根據(jù)r個(gè)聚類中心,應(yīng)用模糊模式識(shí)別技術(shù),將樣本xn+1歸為r類中的某類或求出其隸屬于各類的隸屬度.
以上即是基于模糊數(shù)學(xué)理論的故障診斷系統(tǒng)的基本原理,其是模糊聚類和模糊模式識(shí)別的綜合運(yùn)用過程.以下討論具體故障的診斷流程.
二、基于模糊數(shù)學(xué)理論的故障診斷流程
在給出故障診斷流程之前,先討論一下原始數(shù)據(jù)的前期處理.不同的數(shù)據(jù)一般有不同的量綱,為了使有不同量綱的量也能進(jìn)行比較,需要對(duì)數(shù)據(jù)作適當(dāng)?shù)淖儞Q,通常是歸一化處理,即將數(shù)據(jù)值壓縮到區(qū)間[0,1]上.
應(yīng)用模糊聚類進(jìn)行故障診斷,需要計(jì)算樣本之間的相似程度,而相似程度通常以樣本間的歐式距離為基礎(chǔ).這就存在一個(gè)問題,即在某些情況下,歐式距離不能準(zhǔn)確反映樣本之間的相似程度,甚至與事實(shí)不符.
如某系統(tǒng)的電壓、電流樣本x1,x2,x3,x4分布如圖1所示.從圖中可以直觀看出,若用歐式距離法計(jì)算樣本之間的相似程度,則樣本分類為{x1,x2},{x3,x4}.而實(shí)際情況中,若以系統(tǒng)的功率分類,則上述分類是符合事實(shí)的;若以系統(tǒng)表現(xiàn)出的電阻值分類,則符合事實(shí)的分類應(yīng)為{x1,x3},{x2,x4}.
因此,若要進(jìn)行符合事實(shí)的分類,在將原始數(shù)據(jù)歸一化處理之前,應(yīng)去除原始數(shù)據(jù)之間的耦合性,使原始數(shù)據(jù)集變換為各向同性數(shù)據(jù)集.對(duì)于圖1所示的數(shù)據(jù),以系統(tǒng)功率分類時(shí),應(yīng)以UI為新數(shù)據(jù);以系統(tǒng)表現(xiàn)出的電阻值分類時(shí),應(yīng)以U/I為新數(shù)據(jù).而實(shí)際系統(tǒng)復(fù)雜多樣,且對(duì)同一系統(tǒng),不同的分類所關(guān)心的數(shù)據(jù)也不一樣,因此,并沒有統(tǒng)一的使原始數(shù)據(jù)集變換為各向同性數(shù)據(jù)集的方法,應(yīng)具體問題具體分析.本文總結(jié)出以下幾種方法.
1.專家統(tǒng)計(jì)法
統(tǒng)計(jì)本領(lǐng)域內(nèi)的專家意見,并進(jìn)行綜合考慮.
2.加權(quán)法
不同的分類所關(guān)心的數(shù)據(jù)不同,對(duì)分類影響大的數(shù)據(jù)給予大的權(quán)值,對(duì)分類影響小的數(shù)據(jù)給予小的權(quán)值.
3.借用法
直接借用已有的客觀指標(biāo),如要將某些人按胖瘦分類,采集每人的身高、體重信息,則應(yīng)采用國際通用的BMI指數(shù)(BMI=體重(kg)/身高2(m))方法進(jìn)行數(shù)據(jù)變換.
4.倒推試湊法
如已事先知道樣本的分類情況,可采用倒推試湊法,哪種數(shù)據(jù)變換方法的分類效果最好,就采用哪種方法.
下面給出故障診斷流程,如圖2所示.圖中部分模塊說明如下:
1.數(shù)據(jù)歸一化模塊
將數(shù)據(jù)歸一化處理,可采用標(biāo)準(zhǔn)差變換、極差變換、對(duì)數(shù)變換等.
2.模糊聚類模塊
模糊聚類方法大體上有模糊C均值聚類方法及其改進(jìn)方法和基于模糊相似矩陣的方法兩種.由于原始數(shù)據(jù)進(jìn)行了各向同性變換,應(yīng)用模糊C均值聚類方法可以得到較合理的分類.模糊C均值聚類方法是一個(gè)最優(yōu)化的搜索過程,可設(shè)置分類數(shù)的取值范圍.基于模糊相似矩陣的方法需要建立模糊相似矩陣,進(jìn)而根據(jù)模糊相似矩陣進(jìn)行聚類分析,模糊相似矩陣可以根據(jù)樣本間的歐氏距離計(jì)算.
3.聚類結(jié)果判斷
可根據(jù)實(shí)際情況、專家經(jīng)驗(yàn)等判斷聚類結(jié)果是否合理.若不合理,則修改數(shù)據(jù)處理方法或分類方法后重新聚類;若合理,則根據(jù)生成的聚類中心應(yīng)用模糊模式識(shí)別技術(shù)進(jìn)行故障診斷.
4.模糊模式識(shí)別
聚類完成后,進(jìn)入故障診斷的循環(huán)過程,若沒有待診斷數(shù)據(jù),則系統(tǒng)延時(shí)后等待新數(shù)據(jù);若有待診斷數(shù)據(jù),則將該數(shù)據(jù)進(jìn)行各向同性變換和歸一化變換后進(jìn)入模糊模式識(shí)別模塊進(jìn)行故障診斷.模糊模式識(shí)別方法主要有最大隸屬度原則和擇近原則兩種.根據(jù)模糊模式識(shí)別的結(jié)果就可判斷待診斷數(shù)據(jù)屬于模糊聚類結(jié)果中的某類,即完成了故障診斷.
三、故障診斷系統(tǒng)自學(xué)習(xí)功能的實(shí)現(xiàn)
智能化一直是故障診斷系統(tǒng)追求的目標(biāo),而智能化和非智能化的本質(zhì)區(qū)別在于是否具有自學(xué)習(xí)功能.前面介紹的故障診斷系統(tǒng)是沒有自學(xué)習(xí)功能的,試想若存在某個(gè)待診斷數(shù)據(jù)不屬于任何分類或隸屬于各個(gè)分類的程度相同,此時(shí)又應(yīng)如何進(jìn)行故障診斷.存在這種情況的原因是,原始數(shù)據(jù)不可能包含系統(tǒng)運(yùn)行的全部情況.也就是說,故障診斷只依賴于原始數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,系統(tǒng)必須具有自學(xué)習(xí)功能,在故障診斷的同時(shí)進(jìn)行自學(xué)習(xí),以適應(yīng)系統(tǒng)運(yùn)行的全部情況.
圖3給出了實(shí)現(xiàn)自學(xué)習(xí)功能的一種方法.設(shè)待診斷數(shù)據(jù)xn+1對(duì)r個(gè)聚類中心的隸屬度或貼近度為[b1,b2,…,br],若滿足如下任一點(diǎn),則判斷診斷結(jié)果不合理,進(jìn)而將該數(shù)據(jù)作為一個(gè)新分類的聚類中心加入原始數(shù)據(jù).
1.bi 2.M=max1≤i≤rbi 3.Ad≤bi≤Au(i=1,2,…,r),式中Au=1r∑ri=1bi+c3,Ad=1r∑ri=1bi-c4(可取c3=c4=0.05). 若診斷結(jié)果合理,則輸出診斷結(jié)果用于進(jìn)一步的決策,同時(shí)判斷是否將此次診斷的數(shù)據(jù)加入原始數(shù)據(jù).判斷的標(biāo)準(zhǔn)可為:當(dāng)原始數(shù)據(jù)中某個(gè)分類的樣本個(gè)數(shù)nj 這樣,通過設(shè)置c1~c5幾個(gè)常數(shù),就實(shí)現(xiàn)了故障診斷系統(tǒng)的自學(xué)習(xí),可自動(dòng)生成新的故障類型,使系統(tǒng)具有一定的智能化水平. 四、結(jié)束語 自學(xué)習(xí)是智能化系統(tǒng)區(qū)別于非智能化系統(tǒng)的本質(zhì)特性.本文在提出故障診斷流程的基礎(chǔ)上,增加了自學(xué)習(xí)機(jī)制,以使系統(tǒng)具備一定的智能化水平.當(dāng)然,機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的一個(gè)重要內(nèi)容,需要進(jìn)行系統(tǒng)、深入的研究. 【參考文獻(xiàn)】 [1]吳震宇,袁惠群.基于EMD和模糊聚類的柴油機(jī)故障診斷[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,12:1784-1787. [2]王英赫.基于模糊聚類的間歇過程故障診斷的研究[D].哈爾濱理工大學(xué),2018. [3]王印松,商丹丹.改進(jìn)的模糊聚類在控制系統(tǒng)故障診斷中的應(yīng)用研究[J].計(jì)算機(jī)工程與科學(xué),2018,2:326-330. [4]劉太洪,趙永雷.動(dòng)態(tài)加權(quán)模糊聚類在變壓器故障診斷中的應(yīng)用研究[J].電網(wǎng)與清潔能源,2016,4:89-92.