郭代華
(安徽天長市工業(yè)學(xué)校,安徽 滁州 239300)
滾動軸承故障診斷與其提取的特征信息密切相關(guān)[1-2],熵值能夠有效衡量非線性信號的復(fù)雜程度,在軸承故障診斷領(lǐng)域得到一些應(yīng)用,如廣義精細(xì)復(fù)合多尺度樣本熵[3]、復(fù)合多尺度模糊熵[4]及其與改進(jìn)半監(jiān)督局部切空間排列相結(jié)合[5]等滾動軸承特征提取方法;但上述方法存在樣本熵運算效率較低,模糊熵易受輸入信號長度影響,排列熵忽視信號幅值信息等缺陷;散布熵作為一種新穎的非線性技術(shù)被提出并在其基礎(chǔ)上發(fā)展出了多尺度散布熵[6](Multiscale Dispersion Entropy,MDE)和精細(xì)復(fù)合多尺度散布熵[7](Refined Composite Multiscale Dispersion Entropy,RCMDE)等改進(jìn)方法,雖然能緩解上述方法存在的局限性,但MDE和RCMDE在粗粒化構(gòu)造中的平均運算方式仍會忽視序列的重要信息,因此,本文提出一種精細(xì)時移多尺度散布熵(Refined Time-Shifted Multiscale Dispersion Entropy,RTSMDE),并將其應(yīng)用于滾動軸承特征信息的提取。
獲取穩(wěn)定、精確的軸承故障特征信息后,還需采用分類器對所提取特征進(jìn)行模式識別。支持向量機具有泛化能力強,易處理小樣本問題等優(yōu)勢[8],但其分類效果受懲罰參數(shù)和核參數(shù)的影響較大;因此,本文采用哈里斯鷹優(yōu)化方法[9]對其進(jìn)行參數(shù)優(yōu)化,建立哈里斯鷹優(yōu)化支持向量機(Harris Hawk Optimized Support Vector Machine,HHOSVM)實現(xiàn)滾動軸承的智能診斷。
多尺度散布熵結(jié)合了散布熵于復(fù)雜性度量和多尺度熵于多維尺度分析的優(yōu)勢,對時間序列{u(i),i=1,2,…,L},定義尺度s下的粗粒化序列x(s)為
(1)
則粗?;蛄猩⒉检刂禐?/p>
(2)
式中:D(·)為散布熵運算方式;m為嵌入維數(shù);c為類別;t為時延;N為數(shù)據(jù)長度。
隨著尺度s的增加,粗?;蛄虚L度會變短,從而導(dǎo)致EMDE在大尺度上出現(xiàn)較大偏差。為克服這一限制,采用精細(xì)復(fù)合多尺度散布熵進(jìn)行處理。對時間序列u(i)采用復(fù)合粗粒化運算方式可得
(3)
計算s下k個粗?;蛄兄忻糠N分散模式π的概率pk并采用精細(xì)運算方式,得到精細(xì)復(fù)合多尺度散布熵,即
(4)
為克服MDE和RCMDE粗?;骄\算方式會忽視原始信號幅值信息的問題,受時移技術(shù)啟發(fā),提出了一種精細(xì)時移多尺度散布熵,其流程如圖1所示,具體步驟如下:
1)對時間序列u(i),采用時移粗?;\算方式,即
(5)
3)采用精細(xì)運算方式得到精細(xì)時移多尺度散布熵,即
(6)
采用常見的50組白噪聲和50組1/f噪聲進(jìn)行RTSMDE參數(shù)選取試驗和方法優(yōu)越性驗證。
1.4.1 參數(shù)選取試驗
RTSMDE方法中有5個參數(shù)需要人為設(shè)置,分別是尺度s、數(shù)據(jù)長度N、嵌入維數(shù)m、類別c以及時延t。
1)對于尺度s而言,當(dāng)s較小時,RTSMDE無法全面獲取滾動軸承的故障特征信息;s較大時,會出現(xiàn)熵值不穩(wěn)定現(xiàn)象:為較好地挖掘軸承故障特征信息,設(shè)定s=25[3]。
2)對于數(shù)據(jù)長度N,設(shè)定s=25,m=2,c=6,t=1,分別對長度為3 000,4 000,5 000,6 000的2種噪聲進(jìn)行分析,結(jié)果如圖2所示:同一數(shù)據(jù)長度下,白噪聲的熵值均值曲線均高于1/f噪聲,這是由于白噪聲的非線性特征更復(fù)雜,因此熵值較大;不同數(shù)據(jù)長度下,RTSMDE對同一類型噪聲的分析結(jié)果較為接近,表明N對試驗結(jié)果影響較小。故本文選定N=3 000。
3)對于時延t,設(shè)定s=25,N=3 000,m=2,c=6,分別對時延為1,2,3,4的2種噪聲進(jìn)行分析,結(jié)果如圖3所示:t越小,2種噪聲的熵值均值曲線在大尺度上區(qū)分越明顯,與文獻(xiàn)[10]結(jié)論相符,故本文設(shè)定t=1。
4)對于嵌入維數(shù)m,設(shè)定s=25,N=3 000,c=6,t=1,分別對m為2,3,4的2種噪聲進(jìn)行分析,結(jié)果如圖4和表1所示。
表1 不同m時RTSMDE時間對比
由圖4可知,隨著m的增加,2種噪聲的熵值均值曲線變化趨勢大致相同,熵值均有所提升,這是由于散布模式(即cm)增加所致;由表1可知,m較大時,RTSMDE分析需要更多的運行時間:因此,選取m=2作為最佳解決方案。
5)對于類別c,設(shè)定s=25,N=3 000,m=2,t=1,分別對類別為5,6,7的2種噪聲進(jìn)行分析:2種噪聲的熵值均值曲線隨c的增大而增加,但整體變化趨勢大致相同,同樣是由于RTSMDE的分散模式會隨c增大而增多,從而獲取更大的熵值(圖5);但當(dāng)c過大時,RTSMDE需要花費更多的運算時間(表2):故綜合考慮設(shè)定c=6。
表2 不同c時RTSMDE時間對比
綜上,RTSMDE的參數(shù)設(shè)置為:s=25,N=3 000,m=2,c= 6,t= 1。
1.4.2 對比分析
在相同的參數(shù)設(shè)置下,RTSMDE與MDE,RCMDE的對比分析如圖6所示:
1)MDE與RCMDE的熵值均值曲線較為接近,但RCMDE在大尺度上的誤差值較小,且RCMDE的熵值曲線更加光滑、波動較??;這是由于RCMDE考慮同一尺度多個復(fù)合粗?;蛄械撵刂敌畔ⅲ葍H考慮同一尺度單個粗?;蛄械腗DE效果更好。
2)與MDE和RCMDE相比,RTSMDE可以完全將2種噪聲區(qū)分開,而且RTSMDE的誤差值更小,與實際更相符,表明RTSMDE能夠保留時間序列更多的幅值信息,從而獲取更穩(wěn)定的熵值。
上述分析證實了RTSMDE度量非線性信號復(fù)雜性的優(yōu)越性。
支持向量機的性能與關(guān)鍵參數(shù)(c,g)密切相關(guān),為克服人為參數(shù)對分類效果的不利影響,采用哈里斯鷹優(yōu)化方法進(jìn)行參數(shù)優(yōu)化,建立HHOSVM分類器,其流程如圖7所示,具體步驟如下:
1)分別將訓(xùn)練集和測試集進(jìn)行歸一化。
2)初始化HHO參數(shù),定義種群大小為30,迭代次數(shù)為200,個體位置為(c,g),位置上下限分別為0.001和100。
3)將訓(xùn)練集經(jīng)交叉驗證法得到的平均誤差定義為適應(yīng)度值,即尋找全局最小值的過程。
4)將當(dāng)前迭代下具有最小適應(yīng)度值的個體定義為食物位置。
5)更新個體位置,對每只哈里斯鷹進(jìn)行位置更新,若新食物位置的適應(yīng)度值低于歷史位置,則新位置替換歷史位置,否則保留歷史位置。
6)判斷迭代是否終止,若達(dá)到最大迭代次數(shù)則停止循環(huán),輸出食物位置,即為最佳結(jié)果。
7)根據(jù)優(yōu)化結(jié)果,建立SVM預(yù)測模型并識別測試集故障類型。
鑒于RTSMDE于故障提取以及HHOSVM于故障識別的優(yōu)勢,本文建立一種基于RTSMDE和HHOSVM的滾動軸承故障診斷新模型,流程如圖8所示,具體如下:
1)數(shù)據(jù)采集。利用加速度傳感器采集軸承在不同故障狀態(tài)下的振動加速度信號,并隨機劃分為訓(xùn)練集和測試集樣本。
2)特征提取。采用RTSMDE方法對訓(xùn)練樣本和測試樣本進(jìn)行熵值特征提取,全面挖掘軸承信號特征信息。
3)模式識別。將訓(xùn)練和測試特征集輸入HHOSVM分類器中進(jìn)行模式識別,輸出故障類型。
通過凱斯西儲大學(xué)軸承數(shù)據(jù)集驗證所提故障診斷模型的有效性和優(yōu)越性[11],選用1hp工況下的6205軸承數(shù)據(jù)進(jìn)行分析,轉(zhuǎn)速為1 772 r/min,采樣頻率為12 kHz,采集每種運行狀態(tài)60組樣本,隨機選取20組作為訓(xùn)練樣本,剩余40組作為測試樣本。每組樣本包含3 000個采樣點,數(shù)據(jù)集的具體描述見表3,軸承各運行狀態(tài)對應(yīng)的時域波形如圖9所示。
表3 軸承故障類型和故障程度
分別采用RTSMDE,MDE和RCMDE對每組樣本進(jìn)行非線性熵值提取,對比結(jié)果如圖10所示:與仿真分析結(jié)果一致,MDE和RCMDE的熵值均值曲線大致相同,但RCMDE的熵值曲線具有較低的誤差值且在大尺度上表現(xiàn)更為明顯,但故障狀態(tài)下的MDE和RCMDE熵值曲線較為接近,區(qū)分難度較大;RTSMDE對軸承的10種狀態(tài)的區(qū)分度較好,可用于滾動軸承故障特征的提取。
將上述方法提取到的特征集分別輸入HHOSVM分類器進(jìn)行智能診斷,結(jié)果如圖11所示:RCMDE和MDE分別有6個和11個樣本出現(xiàn)錯誤分類,RTSMDE則正確識別出全部測試樣本的故障類型,沒有出現(xiàn)錯誤分類現(xiàn)象;RTSMDE的平均分類準(zhǔn)確率達(dá)到100%,相對RCMDE和MDE分別提升1.50%和2.75%,表明該模型不僅可以識別出軸承故障類型,也可以識別出故障程度,適用于軸承故障監(jiān)測。
為驗證HHOSVM在軸承故障識別方面的優(yōu)勢,將其與SVM以及灰狼優(yōu)化支持向量機(Grey Wolf Optimized Support Vector Machine,GWOSVM)[12]等分類器進(jìn)行比較,結(jié)果見表4?;趨?shù)優(yōu)化的GWOSVM和HHOSVM對每種特征集的平均識別精度均高于原始SVM,表明利用優(yōu)化算法對SVM進(jìn)行參數(shù)優(yōu)化可以避免人為選取不當(dāng)而導(dǎo)致識別準(zhǔn)確率不高現(xiàn)象的發(fā)生。此外,與GWOSVM相比,HHOSVM分類器對每種特征集均具有最高的平均識別率。這表明,對于SVM參數(shù)優(yōu)化方法,HHO方法可以有效避免局部尋優(yōu)情況的發(fā)生,獲取較好的參數(shù)優(yōu)化結(jié)果,證實了HHOSVM分類器在滾動軸承故障診斷方面的優(yōu)越性。
表4 不同分類器對3種特征集的平均分類準(zhǔn)確率
提出一種基于精細(xì)時移多尺度散布熵和哈里斯鷹優(yōu)化支持向量機的滾動軸承故障診斷模型,通過仿真試驗和CWRU軸承故障診斷試驗進(jìn)行方法有效性驗證,得到如下結(jié)論:
1)采用精細(xì)運算方式和時移粗?;瘶?gòu)造方式的RTSMDE方法能夠有效衡量時間序列復(fù)雜特性,在軸承故障特征提取效果方面優(yōu)于MDE和RCMDE方法。
2)與SVM和GWOSVM相比,HHOSVM分類器對軸承故障狀態(tài)診斷的分類準(zhǔn)確率更高。
本文所提故障診斷模型可以有效、精準(zhǔn)地診斷出滾動軸承不同故障類型和故障損傷程度;但RTSMDE方法中有個別參數(shù)仍需人為設(shè)置,后續(xù)將對其進(jìn)行完善。