游仕豪,鄭陽,閆懂林,陳盛,陳天涯,陳啟卷
(武漢大學(xué)動(dòng)力與機(jī)械學(xué)院,湖北武漢 430072)
水電機(jī)組是水電能源轉(zhuǎn)換的核心設(shè)備,其高效安全穩(wěn)定運(yùn)行是保證電站安全和電網(wǎng)穩(wěn)定的重要前提。因此,開展水電機(jī)組故障診斷研究,能減少水電機(jī)組事故的發(fā)生,對(duì)保障電網(wǎng)安全穩(wěn)定的運(yùn)行具有重要意義。
到目前為止,學(xué)者們針對(duì)水電機(jī)組的故障診斷進(jìn)行了諸多研究。黨建等[1]通過經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)和連續(xù)幾何分布相似性結(jié)合實(shí)現(xiàn)對(duì)水電機(jī)組振動(dòng)信號(hào)降噪;杜義等[2]提出經(jīng)驗(yàn)?zāi)B(tài)分解的奇異值為基礎(chǔ)的水電機(jī)組特征提取方法,并結(jié)合時(shí)域和頻域特征,實(shí)現(xiàn)對(duì)工況的精確識(shí)別;陳喜陽[3]等利用PSO優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的連接權(quán)值,提高BP 分類器的識(shí)別速度和精度。何葵東[4]等通過采用EEMD 分解后各本征模態(tài)函數(shù)(IMF)的多尺度熵作為特征值,并結(jié)合極限學(xué)習(xí)機(jī)(ELM)對(duì)水電機(jī)組進(jìn)行故障診斷。
經(jīng)過上述的分析可以看出,現(xiàn)已形成了以信號(hào)去噪、信號(hào)特征提取、診斷模型構(gòu)建為核心的水電機(jī)組故障診斷基本流程。在信號(hào)去噪方面,EMD降噪[1],小波降噪[5]、EEMD[6]降噪等方法被廣泛使用。但上述降噪方法分別存在模態(tài)混疊、適應(yīng)范圍不廣泛、IMF分量中殘留白噪聲等問題,往往導(dǎo)致降噪的效果不理想。本文采用CEEMDAN 方法[7]對(duì)振動(dòng)信號(hào)進(jìn)行降噪處理,能很好的解決模態(tài)混疊現(xiàn)象和信號(hào)中殘留白噪聲的問題。在信號(hào)特征提取方面,單一的時(shí)域特征、頻域特征或者信號(hào)復(fù)雜程度等特征往往不能全面地表征信號(hào)特性,在本文中,分別對(duì)時(shí)域、頻域和各IMF 分量樣本熵進(jìn)行提取,構(gòu)建混合特征向量來表征振動(dòng)信號(hào)特性。最后對(duì)于模型構(gòu)建方面,BP 神經(jīng)網(wǎng)絡(luò)[8]、SVM[9]、樸素貝葉斯網(wǎng)絡(luò)[10]等方法被廣泛使用,但存在訓(xùn)練速度慢、精度較低等問題。而GAO Huang等[11]提出了極限學(xué)習(xí)機(jī)(ELM),該方法無需通過迭代調(diào)節(jié)網(wǎng)絡(luò)參數(shù),因此訓(xùn)練速度得到大幅提升,具有學(xué)習(xí)速度快、泛化能力強(qiáng)等優(yōu)點(diǎn)。本文利用Adaboost算法[12]和ELM 進(jìn)行組合,能大大提高對(duì)水電機(jī)組故障診斷的精度和穩(wěn)定性。
綜上,本文將首先對(duì)機(jī)組原始振動(dòng)信號(hào)利用CEEMDAN 進(jìn)行分解降噪和重構(gòu)。然后對(duì)降噪后的水電機(jī)組振動(dòng)信號(hào),提取常規(guī)的時(shí)域和頻域特征,通過特征的離散程度大小實(shí)現(xiàn)特征的降維,并結(jié)合CEEMDAN 分解后主要IMF 分量的樣本熵構(gòu)建混合特征向量,將其作為ELM-Adaboost 強(qiáng)分類器的輸入最終得到智能診斷模型,從而實(shí)現(xiàn)對(duì)水電機(jī)組實(shí)測(cè)振動(dòng)故障樣本集的高精度識(shí)別診斷。
完全自適應(yīng)噪聲集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)是互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD)算法的一種改進(jìn)算法,該方法能更有效地消除模態(tài)混疊現(xiàn)象并且分解后的IMF 分量中無白噪聲殘留[7]。CEEMDAN分解的步驟如下:
(1)將服從正態(tài)分布的高斯白噪聲uj(t)(j=1,2,…,N為加入白噪聲的次數(shù))加入待分解信號(hào)y(t)中得到新信號(hào)y(t)+εvj(t),對(duì)其進(jìn)行EMD 分解,得到第一階本征模態(tài)函數(shù)分量C1,對(duì)產(chǎn)生的N個(gè)模態(tài)分量取均值得到CEEMDAN 分解的第一個(gè)IMF分量為:
(2)計(jì)算原始信號(hào)去除IMF1后相應(yīng)的殘差。
(3)在殘差r1(t)中加入服從正態(tài)分布的高斯白噪聲uj(t)(j=1,2,…,N為加入白噪聲的次數(shù))得到新信號(hào),對(duì)新信號(hào)進(jìn)行EMD分解得到第一階模態(tài)分量D1,則有:
(4)計(jì)算相應(yīng)的殘差。
(5)重復(fù)上述步驟,直至殘差信號(hào)為單調(diào)函數(shù)且不適合被分解時(shí),算法結(jié)束。此時(shí)得到m個(gè)本征模態(tài)函數(shù)分量和剩余的殘差分量。則原始信號(hào)可以表示為:
Adaboost 算法[12]的核心是合并多個(gè)弱分類器的輸出實(shí)現(xiàn)更加精確的分類,從而形成強(qiáng)分類器。ELM-Adaboost強(qiáng)分類器即把ELM 分類算法作為弱分類器,通過多次迭代訓(xùn)練ELM 分類器,并通過Adaboost 算法賦予每個(gè)ELM 分類器相應(yīng)的權(quán)重并組合成強(qiáng)分類器。ELM-Adaboost 強(qiáng)分類器相比傳統(tǒng)的ELM 弱分類器具有分類精度高,分類結(jié)果波動(dòng)性小的優(yōu)點(diǎn),其具體步驟如下[13]:
(1)隨機(jī)選擇m組樣本作為強(qiáng)分類器的訓(xùn)練數(shù)據(jù),賦予每組樣本初始權(quán)值D1,同時(shí)根據(jù)數(shù)據(jù)的輸入輸出確定ELM 弱分類器的輸入層、隱含層和輸出層中神經(jīng)元的個(gè)數(shù)。
(2)對(duì)于每次迭代t(t為ELM-Adaboost 中ELM 弱分類器的個(gè)數(shù)),重復(fù)以下步驟:
①訓(xùn)練第t個(gè)ELM 弱分類器并對(duì)訓(xùn)練數(shù)據(jù)的輸出進(jìn)行預(yù)測(cè),得到訓(xùn)練數(shù)據(jù)的預(yù)測(cè)序列g(shù)(t)以及其預(yù)測(cè)誤差和et,預(yù)測(cè)誤差和的計(jì)算公式為:
②根據(jù)第t個(gè)弱分類器的預(yù)測(cè)誤差和et計(jì)算該分類器的權(quán)重αt,分類器權(quán)重計(jì)算公式為
③根據(jù)弱分類器的權(quán)重αt調(diào)整下一次迭代中訓(xùn)練樣本的權(quán)重,調(diào)整公式為
式中:Bi是歸一化因子,i=1,2,…,m
(3)經(jīng)過n次迭代后,得到n組弱分類器的輸出函數(shù)f(gt,αt),并將其組合成強(qiáng)分類的輸出函數(shù)h(x)。
基于CEEMDAN-ELM-Adaboost 的水電機(jī)組故障診斷流程如圖1所示,其步驟如下:利用CEEMDAN 對(duì)振動(dòng)信號(hào)進(jìn)行分解重構(gòu),實(shí)現(xiàn)對(duì)振動(dòng)信號(hào)的降噪。提取樣本數(shù)據(jù)的IMF 樣本熵特征、時(shí)域特征和頻域特征,建立包含21個(gè)特征的特征數(shù)據(jù)池,充分挖掘出蘊(yùn)藏在振動(dòng)信號(hào)中的故障信息??紤]到特征量之間可能存在耦合性和特征冗余性,故對(duì)特征池中的特征量做降維處理,從每類特征數(shù)據(jù)中篩選出差異性明顯的特征,構(gòu)建包含樣本數(shù)據(jù)的時(shí)域、頻域以及IMF 樣本熵的混合特征向量矩陣,將所有樣本的混合特征向量劃分為訓(xùn)練集和測(cè)試集,輸入到ELM-Adaboost 強(qiáng)分類器中訓(xùn)練強(qiáng)分類器模型并輸出測(cè)試集的預(yù)測(cè)結(jié)果。
圖1 基于CEEMDAN-ELM-Adaboost的故障診斷流程圖Fig.1 Fault diagnosis flow based on CEEMDAN-ELM-Adaboost
本文數(shù)據(jù)來源于某水電站的三號(hào)機(jī)組,該機(jī)組水輪機(jī)型號(hào)ZZA315-LJ-800,發(fā)電機(jī)型號(hào)SF200-56/11950,額定功率200 MW,立軸半傘式。分析數(shù)據(jù)為機(jī)組主軸軸向的振動(dòng)數(shù)據(jù),機(jī)組故障類型為轉(zhuǎn)輪室碰摩故障。分別將采自于機(jī)組故障發(fā)生前的數(shù)據(jù)標(biāo)記為故障預(yù)警狀態(tài)、故障發(fā)生后的數(shù)據(jù)標(biāo)記為故障狀態(tài)、檢修后正常運(yùn)行的數(shù)據(jù)標(biāo)記為正常運(yùn)行狀態(tài),其中每種狀態(tài)數(shù)據(jù)各40組,每組數(shù)據(jù)波形長(zhǎng)度為4 096 個(gè)采樣點(diǎn),數(shù)據(jù)點(diǎn)的采樣頻率為458 Hz。
對(duì)每個(gè)樣本中的原始振動(dòng)信號(hào)進(jìn)行CEEMDAN 分解,經(jīng)過多次試驗(yàn)分析,設(shè)定加入高斯白噪聲的次數(shù)為100,高斯白噪聲標(biāo)準(zhǔn)差為0.2,最大的迭代次數(shù)為1 000。信號(hào)分解得到若干個(gè)IMF分量,同時(shí)計(jì)算每個(gè)IMF分量與原始振動(dòng)信號(hào)的相關(guān)系數(shù),各個(gè)IMF分量的相關(guān)系數(shù)如表1所示。由表1可知,前幾個(gè)IMF分量與原始信號(hào)的相關(guān)系數(shù)較大,能很大程度地表征原始信號(hào)的特征,故可通過選取前幾個(gè)相關(guān)系數(shù)較大的IMF 分量進(jìn)行重構(gòu)從而達(dá)到信號(hào)去噪的效果[14-16]。綜合120 個(gè)樣本的分解結(jié)果,本文選取前6個(gè)IMF分量進(jìn)行信號(hào)重構(gòu)。
表1 IMF分量與原始數(shù)據(jù)的相關(guān)系數(shù)表Tab.1 Table of IMF components in relation to raw data
為更加全面獲取振動(dòng)信號(hào)深度蘊(yùn)含的信息,提高故障診斷的準(zhǔn)確性,本文對(duì)樣本數(shù)據(jù)中常規(guī)的時(shí)域特征、頻域特征和各IMF 分量的樣本熵進(jìn)行提取,提取的特征及其對(duì)應(yīng)的編號(hào)如表2所示。
表2 振動(dòng)信號(hào)特征集Tab.2 Characteristic set of vibration signal
考慮到提取的特征量過多,特征量之間可能存在耦合性和特征冗余性,本文對(duì)提取的高維特征集進(jìn)行降維處理,通過特征值離散程度的差異對(duì)提取的特征進(jìn)行篩選。計(jì)算14個(gè)時(shí)域、頻域特征的標(biāo)準(zhǔn)差,得到各特征的離散程度(即標(biāo)準(zhǔn)差的大?。┮妶D2。由圖2 可知,部分特征的離散程度幾乎趨近于0,即特征值基本都聚集于某一個(gè)值的附近,不能對(duì)3 種運(yùn)行狀態(tài)進(jìn)行有效區(qū)分,故分別剔除掉時(shí)域特征和頻域特征中離散程度較小的無效特征。通常前幾個(gè)IMF 分量集中了原始振動(dòng)信號(hào)中最顯著、最重要的信息[17]。為保證提取特征的代表性和算法運(yùn)行的快速性,本文選用CEEMDAN 分解后的前3 個(gè)與原始信號(hào)相關(guān)性系數(shù)較大的IMF 分量并計(jì)算其樣本熵,最后篩選出T1、T4、T5、F2、F3、F4、S1、S2、S3九個(gè)特征用來構(gòu)建混合特征向量。
圖2 樣本特征的離散程度Fig.2 Degree of dispersion of sample features
圖3、4 和圖5 分別為特征降維處理后的篩選出的時(shí)域特征、頻域特征和樣本熵在不同樣本上的分布圖,其中樣本序號(hào)1~40 為正常運(yùn)行樣本,序號(hào)41~80 為故障預(yù)警樣本,序號(hào)81~120為故障樣本。由圖3、4和圖5可知,在所篩選出的特征分布圖中,故障樣本和其他兩種樣本有較明顯的差異,正常運(yùn)行樣本和故障樣本在部分特征上的分布上也存在差異。
圖3 樣本的時(shí)域特征分布圖Fig.3 Time-domain distribution of the sample
圖4 樣本的頻域特征分布圖Fig.4 Frequency domain feature distribution of the sample
圖5 樣本的IMF樣本熵分布圖Fig.5 IMF sample entropy distribution of samples
將降維后的9 個(gè)特征組合成混合特征向量,其格式為[T1,T4,T5,F(xiàn)2,F(xiàn)3,F(xiàn)4,S1,S2,S3]。依據(jù)每種運(yùn)行狀態(tài)對(duì)120 組樣本按6∶4 的比例隨機(jī)劃分為72 組訓(xùn)練集和48 組測(cè)試集。首先對(duì)ELM-Adaboost 的輸入?yún)?shù)進(jìn)行初始化,經(jīng)過多次試驗(yàn)分析,設(shè)定ELM 選取的個(gè)數(shù)為10,ELM 的輸入層節(jié)點(diǎn)數(shù)為9,輸出層節(jié)點(diǎn)數(shù)為3,單隱含層的節(jié)點(diǎn)數(shù)為50,激活函數(shù)為sigmoid 函數(shù)。利用訓(xùn)練樣本對(duì)模型進(jìn)行訓(xùn)練,對(duì)比在EMD 和CEEMDAN 兩種不同降噪方法下不同分類方法的分類準(zhǔn)確性??紤]到ELMAdaboost 算法在水電機(jī)組小樣本故障診斷上的適用性,設(shè)置訓(xùn)練集和測(cè)試組樣本數(shù)量比例為4∶6 的對(duì)照組,并對(duì)每種組合運(yùn)行100 取平均值來避免隨機(jī)誤差的影響,對(duì)比試驗(yàn)結(jié)果如表3所示。其中實(shí)驗(yàn)組中最能代表平均結(jié)果的分類結(jié)果見圖6和圖7。
圖6 基于CEEMDAN降噪的分類結(jié)果Fig.6 Classification result based on CEEMDAN denoising
圖7 基于EMD降噪的分類結(jié)果Fig.7 Classification result based on EMD denoising
從表3 可知,相比于EMD 分解降噪,利用CEEMDAN 方法進(jìn)行降噪可以提高分類的準(zhǔn)確性。此外,對(duì)比相同降噪方法下的3 中分類方法的分類情況,ELM-Adaboost 相比于ELM 和BPNN 分類方法,其對(duì)水電機(jī)組的故障分類更加精確。同時(shí)ELM-Adaboost 也繼承了ELM 網(wǎng)絡(luò)訓(xùn)練速度快的優(yōu)點(diǎn),其相比于BPNN 分類方法其運(yùn)行時(shí)間更短。最后,相比于其他兩者分類方法,ELM-Adaboost 方法在水電機(jī)組小樣本故障分類問題上,其識(shí)別精度基本不隨樣本數(shù)量的變化而變化,表現(xiàn)出良好的魯棒性。綜上,本文提出的基于CEEMDAN-ELM-Adaboost的水電機(jī)組故障診斷方法相比于傳統(tǒng)方法具有更好的應(yīng)用性。
表3 分類準(zhǔn)確度對(duì)比Tab.3 Comparison of classification accuracy
本文提出了基于CEEMDAN-ELM-Adaboost 的水電機(jī)組故障診斷方法,并利用水電機(jī)組轉(zhuǎn)輪室碰摩故障的實(shí)際數(shù)據(jù)進(jìn)行分析,得到以下結(jié)論。
(1)相比于傳統(tǒng)的EMD 降噪方法,通過CEEMDAN 對(duì)原始信號(hào)降噪能提高后續(xù)故障分類的準(zhǔn)確性。
(2)相對(duì)于傳統(tǒng)的BPNN 和ELM 方法,ELM-Adaboost 方法在水電機(jī)組小樣本的故障分類問題上具有更高的識(shí)別精度和魯棒性。此外,該方法在保證高識(shí)別率的前提下具有訓(xùn)練速度的特點(diǎn)。
(3)CEEMDAN-ELM-Adaboost方法在水電機(jī)組轉(zhuǎn)輪室碰摩故障識(shí)別問題上具有很好的適應(yīng)性,其識(shí)別精度可以達(dá)到97.92%。