辜文娟,張 揚
(1.江西省商務(wù)學(xué)校,江西 南昌 330038;2.湖北工業(yè)大學(xué) 機械工程學(xué)院,湖北 武漢 430068)
離心泵是一種廣泛應(yīng)用于化工、電力等行業(yè)的流體機械設(shè)備。由于工作環(huán)境惡劣和運行時間較長,離心泵工作過程中易發(fā)生各類故障。又由于行業(yè)的特殊性,離心泵的損傷容易引發(fā)嚴(yán)重的生產(chǎn)事故。因此,研究離心泵的故障診斷方法對于確保安全穩(wěn)定生產(chǎn)具有實際工程意義[1-5]。
離心泵的結(jié)構(gòu)復(fù)雜,且因為受摩擦、湍流、阻尼等多種因素的影響,所以離心泵的振動信號或聲信號表現(xiàn)為非線性,這增加了離心泵故障信號分析的難度[6,7]。目前,針對非線性信號的分析方法通常以樣本熵、排列熵、模糊熵和散布熵為代表。其中,由于具備穩(wěn)定且優(yōu)異的特征提取性能,目前排列熵已被廣泛應(yīng)用于各種故障診斷領(lǐng)域。
高素杰等人[8]將排列熵用于齒輪箱的故障診斷,實現(xiàn)了齒輪箱故障準(zhǔn)確識別的目的;然而排列熵忽略了時間序列的幅值信息。隨后,吳新忠等人[9]利用加權(quán)排列熵代替排列熵,進行了滾動軸承的故障特征提取,結(jié)果證明,加權(quán)排列熵要優(yōu)于排列熵;然而該方法只是進行了單一尺度的分析,特征描述不夠完整[10]。
針對排列熵以及加權(quán)排列熵的多尺度化,學(xué)者們進行了大量的工作。
AZIZ W等人[11]提出了多尺度排列熵(multiscale permutation entropy,MPE),用于生理時間序列的分析;然而MPE仍然忽略了信號中的幅值信息[12]。為此,YUAN Xu-yi等人[13]提出了多尺度加權(quán)排列熵(multi scale weighted permutation entropy,MWPE)算法,用于泵的故障檢測,結(jié)果證明了該算法是一種有效的復(fù)雜性測量指標(biāo);但是MWPE算法所采用的加權(quán)排列熵在分析某些幅值相同的時間序列的復(fù)雜性時,仍然無法實現(xiàn)準(zhǔn)確的測量。針對MWPE仍然存在的信息丟失缺陷,LIU Xiao-feng等人[14]4-7提出了增長熵(increment entropy,IE)的概念,并將其用于生理時間序列的分析,結(jié)果證明其優(yōu)于排列熵和樣本熵;但是IE未進行多尺度分析。WANG Xue等人[15]進一步地提出了多尺度增長熵(multiscale increment entropy,MIE),用于處理醫(yī)學(xué)時間序列,其證明了MIE的優(yōu)越性;然而MIE的粗?;幚泶嬖谳^大的缺陷,使得熵值誤差隨著尺度的增加而增大,這降低了算法的有效性[16]。
在故障的分類識別方面,由于具有效率高、數(shù)據(jù)處理能力強等優(yōu)點,極限學(xué)習(xí)機(ELM)被廣泛應(yīng)用于故障識別領(lǐng)域[17]。
姚峰林等人[18]使用ELM進行了滾動軸承的故障識別;然而其未對ELM的參數(shù)進行優(yōu)化,使該模型不夠穩(wěn)定。隨后,張玉學(xué)等人[19]采用粒子群算法(particle swarm optimization,PSO),對ELM進行了優(yōu)化,準(zhǔn)確地識別了齒輪箱的故障;然而PSO算法的優(yōu)化性能較差。秦波等人[20]利用具有更好優(yōu)化性能的蝙蝠算法,對ELM進行了優(yōu)化,結(jié)果驗證了該方法的優(yōu)越性;然而蝙蝠算法的局部尋優(yōu)能力仍然較差,因此需要采用具有更強尋優(yōu)性能的算法對ELM進行優(yōu)化。劉曉悅等人[21]129-130采用麻雀搜索算法(SSA),對ELM的權(quán)重和隱含層閾值進行了尋優(yōu),建立了SSA-ELM多故障分類器,實現(xiàn)了對齒輪箱的準(zhǔn)確分類。
鑒于SSA-ELM的優(yōu)異性能,筆者將使用SSA-ELM進行離心泵的故障識別。
針對上述研究提到的缺陷,筆者利用改進的粗粒化對時間序列進行處理,提出改進多尺度增長熵(IMIE),其既能改善MPE忽略信號幅值信息的缺陷,也能緩解MIE算法的粗?;瘑栴};在此基礎(chǔ)上,提出一種基于IMIE、多聚類特征選擇(MCFS)和麻雀搜索算法優(yōu)化極限學(xué)習(xí)機(SSA-ELM)的離心泵故障診斷方法。
首先,基于IMIE提取離心泵振動信號的故障特征,表征離心泵的故障狀態(tài);隨后,利用MCFS對原始特征進行優(yōu)化,生成低維敏感的故障特征;最后,將故障特征輸入至基于麻雀搜索算法優(yōu)化的極限學(xué)習(xí)機中,進行離心泵故障的識別。
增長熵只進行了信號單一尺度的評估,忽略了其他尺度上有用的信息,因此其分析不夠完整。為此,學(xué)者們提出了多尺度增長熵(其中,增長熵的理論可參考LIU Xiao-feng等人[14]3的研究)。
多尺度增長熵(MIE)的詳細計算過程如下:
1)對于時間序列{x(k),k=1,…,N},進行粗?;幚?得到粗粒化序列如下:
(1)
2)對粗?;蟮臅r間序列進行增長熵計算,得到多尺度增長熵MIE:
(2)
式中:m為嵌入維數(shù);R為量化分辨率。
雖然MIE實現(xiàn)了信號的多尺度分析目的,但其依然存在缺陷[22]:
1)在進行粗粒化處理時,對每個數(shù)據(jù)點的處理存在不一致的情況,即MIE是不對稱的,這會造成IE值突變。
例如,當(dāng)尺度因子為3時,對應(yīng)的粗粒化過程如圖1所示。
圖1 尺度因子為3時的MIE粗粒化處理
理想情況下,x3、x4與x2、x3處的計算應(yīng)保持一致,但是根據(jù)圖1的處理過程可知:x1,x2,x3與x4,x5,x6在x3處斷開,導(dǎo)致x3和x4存在斷點,這造成了IE值不夠穩(wěn)定;
2)計算IE值時,信號的數(shù)據(jù)長度越大則結(jié)果越穩(wěn)定,然而MIE的粗?;幚頃@著減少數(shù)據(jù)的長度,導(dǎo)致熵值偏差不斷增加,使得IE對系統(tǒng)復(fù)雜性的反映精度變低。
為改善MIE的性能,筆者對粗?;幚磉M行了改進,構(gòu)造了改進多尺度增長熵(IMIE)。
此處仍然以尺度因子3為例,對應(yīng)的改進粗?;幚砣鐖D2所示。
圖2 尺度因子為3時的IMIE改進粗?;幚?/p>
與MIE不同,在同一尺度τ下,IMIE經(jīng)過粗粒化處理后,能夠生成τ組粗粒序列,有效避免了斷點處的突變問題,而傳統(tǒng)粗?;幚碇簧梢唤M粗粒序列。
IMIE的計算過程如下:
1)對給定時間序列進行改進的粗?;幚?其生成τ組粗粒序列:
(3)
(4)
根據(jù)IMIE的定義可以知道,核心參數(shù)為時間序列的長度N,嵌入維數(shù)m,量化分辨率R和尺度因子τ。
通常而言,嵌入維數(shù)m的取值為[2,5],過小會造成信號重構(gòu)時重構(gòu)向量包含的元素太少,無法表征系統(tǒng)的動態(tài)特性;反之,過大會忽視系統(tǒng)的細節(jié)特征。筆者設(shè)置m=2。
量化分辨率R的取值會影響算法的抗噪性,R過大會對噪聲過于敏感,筆者設(shè)置R=4。
時間序列的長度會影響增長熵的精度,數(shù)據(jù)越長則熵值的精度也就越高;但是太長的數(shù)據(jù)會極大地增加計算量,若數(shù)據(jù)過短則無法準(zhǔn)確地反映系統(tǒng)的動態(tài)特征。筆者設(shè)置N=2 048。
尺度因子的設(shè)置一般不會影響算法的精度,但是尺度過小會造成特征數(shù)量較少,難以全面地反映系統(tǒng)的固有特性;反之,尺度過大會造成特征的冗余且降低計算效率。筆者設(shè)置τ=20。
為了驗證IMIE方法的優(yōu)點,筆者利用30組高斯白噪聲和1/f噪聲進行分析。
筆者采用IMIE和MIE方法分別計算兩種噪聲信號的增長熵值和標(biāo)準(zhǔn)差,如圖3所示。
圖3 高斯白噪聲和1/f噪聲的增長熵
由圖3可以發(fā)現(xiàn):隨著尺度的增加,IMIE熵值的變化較MIE更加平滑,沒有出現(xiàn)較大的突變,而且IMIE在各個尺度上的標(biāo)準(zhǔn)差也小于MIE,即對應(yīng)的誤差較小。因此,可以證明IMIE方法具有良好的穩(wěn)定性,優(yōu)于MIE。
根據(jù)ZHANG Wei-bo等人[23]的研究,原始故障特征通常包含部分的冗余信息,沒有必要將全部特征進行分類,有必要對其進行降維處理,以提高分類的效率和精度。
筆者引入基于MCFS的特征降維算法,依照各尺度特征的貢獻度來對特性向量進行賦分,保留分?jǐn)?shù)較高的特征,并剔除分?jǐn)?shù)較低的特征,實現(xiàn)特征的降維目的(MCFS的理論可參照候曉麗等人[24]的研究)。
極限學(xué)習(xí)機模型(ELM)具有優(yōu)異的分類性能,并且兼顧效率,但是其需要對參數(shù)進行優(yōu)化設(shè)置,否則容易影響泛化性。劉曉悅等人[21]128-129采用麻雀搜索算法(SSA)對ELM的參數(shù)進行了優(yōu)化,并將其與基于粒子群算法、灰狼算法優(yōu)化的ELM模型進行了對比,結(jié)果驗證了SSA-ELM的有效性。
為此,筆者引入了SSA-ELM分類器,用于離心泵的故障識別。
針對離心泵的故障特征提取和分類識別,筆者引入了增長熵這一具有優(yōu)異性能的非線性動力學(xué)指標(biāo),并對其進行了改進,提出了改進多尺度增長熵;并結(jié)合多聚類特征選擇和麻雀搜索算法優(yōu)化極限學(xué)習(xí)機,提出了一種新的離心泵故障診斷方法。
該方法的具體流程如下:
1)采集離心泵在多種工況下的振動信號,以長度為2 048的窗口進行樣本的截取,每個工況得到100組樣本;
2)利用IMIE提取振動信號的熵值信息,構(gòu)造故障特征樣本;
3)利用MCFS對故障特征進行賦分,依據(jù)對分類的貢獻度選擇前15個特征,構(gòu)造新的低維特征;
4)在新的特征向量中,隨機抽取30個樣本用于訓(xùn)練SSA-ELM分類器,剩余70個樣本進行測試識別;
5)將測試樣本輸入到訓(xùn)練好的分類器中[25,26],進行分類,完成離心泵的故障檢測任務(wù)。
該離心泵實驗數(shù)據(jù)由KUMAR A等人[27]提供。
筆者利用振動傳感器和麥克風(fēng)設(shè)備采集了離心泵不同工況下的振動信號和聲信號,并對振動信號進行了分析。
離心泵的實驗平臺如圖4所示。
圖4 離心泵實驗平臺
在該離心泵平臺中,包含兩個滾動軸承,靠近葉輪端的軸承標(biāo)記為實驗軸承,遠離葉輪端的軸承標(biāo)記為非實驗軸承。
軸承的參數(shù)如表1所示。
表1 滾動軸承的指標(biāo)參數(shù)
離心泵以一定的角速度運轉(zhuǎn),筆者針對葉輪損傷(S1)、葉輪堵塞(S2)、正常(S3)、軸承內(nèi)圈故障(S4)和軸承外圈故障(S5)這5種工況進行了研究,并采用型號為PCB353 B34的單軸加速度計,以70 kHz的頻率采集了振動信號。
筆者利用寬度2 048的窗口截取每種工況的樣本共100組,其中,隨機抽取30組樣本作為訓(xùn)練樣本,剩余70組樣本作為測試樣本。
樣本的相關(guān)信息如表2所示。
表2 離心泵的樣本信息
在5種工況下離心泵的振動信號如圖5所示。
圖5 離心泵振動信號波形
由圖5可以發(fā)現(xiàn):直接分析振動信號的波形難以判斷未知樣本的故障類型,這證明了對信號進行分析的必要性。
筆者對5種狀態(tài)的振動信號進行了IMIE分析。同時,為了驗證IMIE的優(yōu)越性,采用MIE、MPE和改進多尺度排列熵(improved multiscale permutation entropy,IMPE)進行了對比分析,其中,MPE和IMPE的參數(shù)設(shè)置為:嵌入維數(shù)m=5,時間延遲d=1。
每種類型的樣本不同處理方法的熵均值標(biāo)準(zhǔn)差如圖6所示。
圖6 4種方法的熵均值標(biāo)準(zhǔn)差曲線
從圖6可以發(fā)現(xiàn):在大多數(shù)尺度上,IMIE和IMPE方法的熵值曲線表現(xiàn)為故障振動信號高于正常振動信號的特點,并且不同故障類型樣本的復(fù)雜性也呈現(xiàn)出規(guī)律性的差異,因此,后續(xù)可以考慮將IMIE方法用于區(qū)分離心泵是否正常;
此外,IMIE和IMPE都能夠較為有效地區(qū)分5種故障樣本,且熵值具有較大的區(qū)分度。而MIE和MPE熵值曲線發(fā)生了明顯的混疊,難以有效區(qū)分不同故障類型;同時IMIE和IMPE曲線的標(biāo)準(zhǔn)差顯著小于MIE和MPE,兩種現(xiàn)象均表明改進的粗?;幚韮?yōu)于傳統(tǒng)的粗?;幚怼5侨匀粺o法通過熵值曲線來判斷增長熵優(yōu)于排列熵,為此,需要進行更深層次的分析。
隨后,為了減小原始特征中的冗余信息,提高特征的質(zhì)量,筆者利用MCFS對IMIE特征進行了排序,如圖7所示。
圖7 經(jīng)過MCFS排序后的新特征
從圖7可以發(fā)現(xiàn):原始特征在經(jīng)過MCFS排序后,所生成的新特征具有更顯著的區(qū)分度,這表明利用MCFS進行特征降維是必要的,其有助于提高故障特征的質(zhì)量。筆者選擇排序得分前15的特征,作為分類器的輸入。
為了進一步對比4種方法的優(yōu)劣性,同時識別離心泵的故障類型,筆者將IMIE、MIE、IMPE和MPE這4種方法提取的故障特征,采用MCFS降維,把生成的新特征輸入至SSA-ELM分類器中,進行了故障識別,其結(jié)果如圖8所示。
圖8 基于不同故障診斷方法的SSA-ELM分類結(jié)果
詳細的分類識別結(jié)果如表3所示。
表3 基于不同故障診斷方法的詳細分類結(jié)果
從表3可以發(fā)現(xiàn):基于IMIE的故障診斷方法取得了100%的識別準(zhǔn)確率,完全準(zhǔn)確地識別了離心泵的故障,證明了該方法能夠有效地用于離心泵的故障診斷。而IMPE方法的分類準(zhǔn)確率僅低于IMIE方法,達到了98.57%,這證明了改進多尺度分析方法能夠從振動信號中提取出質(zhì)量較高的特征,并實現(xiàn)對故障精準(zhǔn)識別的目的。
MIE和MPE方法的分類準(zhǔn)確率分別為72.86%和93.71%,這表明在與傳統(tǒng)粗?;嘟Y(jié)合時,排列熵優(yōu)于增長熵;而在與改進粗?;嘟Y(jié)合時,增長熵優(yōu)于排列熵。此外,基于增長熵的方法具有非常高的效率,僅需要93.81 s即可完成故障特征提取任務(wù)。其特征提取的時間僅多于MIE方法所用時間,這表明改進的粗?;幚矸绞皆黾恿嘶瑒拥牟僮?因此,其效率低于傳統(tǒng)的粗?;幚?。
此外,IMIE的效率是IMPE的10倍,這證明IMIE不僅可以提取高質(zhì)量的故障特征,還具有非??捎^的效率,優(yōu)于其他3種方法。
為進一步比較IMIE方法和IMPE方法在特征提取中的優(yōu)劣,筆者在輸入不同數(shù)量的故障特征時,將2種方法的準(zhǔn)確率進行比較,將經(jīng)過MCFS排序后的前20個特征依次輸入至SSA-ELM分類器中,進行故障識別。
當(dāng)輸入不同數(shù)量故障特征時,基于IMIE和IMPE的故障診斷方法的識別準(zhǔn)確率變化曲線,如圖9所示。
圖9 輸入不同數(shù)量特征時2種故障診斷方法的準(zhǔn)確率對比
從圖9可以發(fā)現(xiàn):在輸入不同數(shù)量的特征時,IMIE的準(zhǔn)確率曲線大多數(shù)時候在上方,當(dāng)輸入的特征數(shù)量為13個時,IMIE方法的準(zhǔn)確率已經(jīng)達到了99.71%,而此時IMPE方法的準(zhǔn)確率低于IMIE,證明輸入13個特征時,基于IMIE的故障診斷方法已經(jīng)能夠取得非常精確的故障識別結(jié)果了。
綜上可和,在大多數(shù)情況下,基于IMIE的故障診斷方法要優(yōu)于IMPE方法,且IMIE方法的效率非常高。
最后,為了驗證SSA-ELM分類模型在故障識別中的優(yōu)越性,筆者對遺傳算法(genetic algorithm,GA)、粒子群算法(particle swarm optimization,PSO)、灰狼算法(grey wolf optimization,GWO)和鯨魚算法(whale optimization algorithm,WOA)進行對比。
對于每種優(yōu)化算法,種群規(guī)模都設(shè)置為30,迭代次數(shù)設(shè)置為100,并將IMIE故障特征輸入到5種分類器中,進行故障的識別;同時,為了確保性能評估的可靠性,分類重復(fù)20次。
20次實驗下,5種分類器的識別結(jié)果如圖10所示。
圖10 20次實驗下5種分類器的識別結(jié)果
5種分類器的詳細識別結(jié)果如表4所示。
表4 5種分類器的詳細識別結(jié)果
從表4可以發(fā)現(xiàn):
1)5種分類器的平均識別準(zhǔn)確率均達到了98%以上,證明不同優(yōu)化算法都可以構(gòu)建分類性能較強的ELM模型;
2)SSA-ELM的平均識別準(zhǔn)確率達到了99.73%,高于其他4種分類模型,這驗證了SSA在參數(shù)優(yōu)化中優(yōu)于另外4種算法;
3)就參數(shù)優(yōu)化的表現(xiàn)而言,GWO算法優(yōu)于WOA、GA和PSO,證明GWO具有較強的全局優(yōu)化性能。
采用多尺度排列熵分析離心泵的振動信號,存在粗?;幚泶嬖诓蛔愕葐栴},導(dǎo)致離心泵的故障識別準(zhǔn)確率不高,為此,筆者提出了一種基于IMIE、MCFS和SSA-ELM的離心泵故障診斷方法,利用離心泵振動信號故障數(shù)據(jù)對該方法進行了實驗,驗證了該方法的有效性,同時將該方法和其他方法進行了對比,驗證了該方法的優(yōu)越性。
研究結(jié)論如下:
1)仿真信號的分析結(jié)果表明:和基于傳統(tǒng)粗?;腗IE方法相比,IMIE方法能夠更加準(zhǔn)確和穩(wěn)定地測量時間序列的復(fù)雜度,且偏差更小;
2)IMIE方法能夠有效地提取高質(zhì)量故障特征,基于IMIE的故障診斷方法取得了100%的識別準(zhǔn)確率,且特征提取時間僅需要93.81 s,綜合性能要優(yōu)于IMPE、MPE和MIE方法;
3)SSA-ELM能夠準(zhǔn)確地識別離心泵的故障,平均識別準(zhǔn)確率高達99.73%,高于GA-ELM、PSO-ELM、GWO-ELM和WOA-ELM分類器,其具有顯著的優(yōu)越性。
雖然所提方法取得了不錯的效果,但需要人為設(shè)置參數(shù),其是否適用于其他工業(yè)場景還有待于今后的檢驗。筆者后續(xù)將對該方法中的參數(shù)自適應(yīng)設(shè)置進行研究。