基于K-means和高斯混合模型聚類的齒輪箱故障識(shí)別研究*

2021-08-07 02:03:42劉勝蘭

機(jī)電工程 2021年7期

王浩,劉勝蘭,劉晨

(中國(guó)艦船研究院,北京 100192)

0 引言

齒輪箱的構(gòu)件主要包含軸承、齒輪、轉(zhuǎn)軸等,它是機(jī)械裝置中應(yīng)用最廣泛的傳動(dòng)設(shè)備。

在軸承和齒輪的運(yùn)行過(guò)程中,其承受的力均為周期性的沖擊,往往容易造成點(diǎn)蝕或局部缺陷,長(zhǎng)期運(yùn)行會(huì)造成齒輪箱構(gòu)件的疲勞失效,因此,其故障率往往很高[1-3]。齒輪箱軸承或齒輪一旦失效,會(huì)導(dǎo)致整個(gè)傳動(dòng)系統(tǒng)癱瘓。雖然很多企業(yè)已經(jīng)安裝了齒輪箱在線狀態(tài)監(jiān)測(cè)系統(tǒng),但目前在用的狀態(tài)監(jiān)測(cè)系統(tǒng)中的報(bào)警閾值均是根據(jù)齒輪箱構(gòu)件損傷的極限狀態(tài)設(shè)置的,監(jiān)測(cè)準(zhǔn)確率不高;而且從故障預(yù)警到分析確定故障源需要花費(fèi)大量時(shí)間,對(duì)振動(dòng)信號(hào)進(jìn)行處理和分析。

因此,通過(guò)構(gòu)造齒輪箱各運(yùn)行狀態(tài)的從屬概率模型,從而快速地識(shí)別齒輪箱齒輪和軸承構(gòu)件的故障,可以提升齒輪箱的故障診斷效率。

近年來(lái),國(guó)內(nèi)外學(xué)者基于齒輪箱的振動(dòng)機(jī)理,開(kāi)展了大量針對(duì)齒輪箱故障診斷的研究,這些技術(shù)已在齒輪箱故障診斷領(lǐng)域被廣泛應(yīng)用。例如,通過(guò)包絡(luò)解調(diào)分析技術(shù)提取軸承故障特征[4]。但隨著軸承故障診斷研究的深入,人們發(fā)現(xiàn),包絡(luò)分析的難點(diǎn)在于確定信號(hào)解調(diào)頻帶,大多時(shí)候采取反復(fù)試湊的方式,這在實(shí)際應(yīng)用中非常不方便。因此,后來(lái)出現(xiàn)了信號(hào)分解技術(shù)與包絡(luò)分析相結(jié)合的軸承故障分析方法。例如:蔡艷平等[5]結(jié)合經(jīng)驗(yàn)?zāi)B(tài)分解和包絡(luò)分析,提取了滾動(dòng)軸承內(nèi)圈缺陷故障特征,進(jìn)行了軸承的故障分析。岳應(yīng)娟[6]提出了結(jié)合變分模態(tài)分解和包絡(luò)分析的軸承故障特征提取方法。潘海洋[7]提出了結(jié)合系數(shù)帶寬模態(tài)分解與包絡(luò)分析的軸承故障特征提取方法。

隨著齒輪箱使用場(chǎng)合的復(fù)雜化,及其在工業(yè)領(lǐng)域重要性的不斷提升,對(duì)齒輪箱故障診斷提出了更高的要求。傳統(tǒng)基于振動(dòng)信號(hào)分析的齒輪箱機(jī)械故障診斷方法,需要花費(fèi)大量的時(shí)間進(jìn)行信號(hào)處理,無(wú)法快速、有效地分析得出診斷齒輪箱中存在的故障,增加了設(shè)備停機(jī)時(shí)間或帶病運(yùn)行的時(shí)間。

針對(duì)上述問(wèn)題,秦波等[8]通過(guò)Hilbert變換,提取了滾動(dòng)軸承信號(hào)的特征值,利用支持向量機(jī)實(shí)現(xiàn)了對(duì)滾動(dòng)軸承各類故障的分類。WIDODO A等[9]提出了基于相關(guān)支持向量機(jī)的多分類方法,實(shí)現(xiàn)了對(duì)低速狀態(tài)下運(yùn)行的軸承的故障識(shí)別。

在聚類算法分析方面,王書濤等[10]提出了基于威布爾和模糊C均值聚類的故障識(shí)別方法。姜萬(wàn)錄等[11]結(jié)合變分模態(tài)分解和核模糊C均值聚類,實(shí)現(xiàn)了對(duì)軸承故障的識(shí)別。張淑清等[12]基于RQA參數(shù)和GG聚類方法,實(shí)現(xiàn)了對(duì)軸承故障的識(shí)別。

在預(yù)測(cè)模型和神經(jīng)網(wǎng)絡(luò)模型的故障識(shí)別算法方面,張?jiān)獜?qiáng)等[13]結(jié)合變分模態(tài)分解和Volterra預(yù)測(cè)模型,實(shí)現(xiàn)了對(duì)軸承的故障識(shí)別。PATIL A B等[14]利用離散小波變換,得到了振動(dòng)信號(hào)的特征參數(shù),并通過(guò)構(gòu)件前饋BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了對(duì)軸承故障的分類。

同樣,很多學(xué)者利用模式識(shí)別和機(jī)器學(xué)習(xí)算法進(jìn)行了齒輪故障的快速識(shí)別。陳法法等[15]通過(guò)局部切空間排列算法,對(duì)構(gòu)建的特征集進(jìn)行了降維,利用多核支持向量機(jī)訓(xùn)練降維特征,實(shí)現(xiàn)了對(duì)齒輪箱故障的識(shí)別,但該方法對(duì)齒輪的某些故障的識(shí)別準(zhǔn)確率依然不高。鄧世杰等[16]采用鄰域自適應(yīng)增量式PCA-LPP流行學(xué)習(xí)算法,在對(duì)齒輪箱振動(dòng)信號(hào)特征進(jìn)行降維處理后,進(jìn)行了故障識(shí)別。

綜上可以看出,在齒輪箱故障的自動(dòng)識(shí)別技術(shù)研究當(dāng)中,識(shí)別準(zhǔn)確率有待進(jìn)一步提高,以便于齒輪箱故障自動(dòng)識(shí)別方法的推廣應(yīng)用。

本文結(jié)合K-means算法和高斯混合模型聚類,針對(duì)齒輪箱最常見(jiàn)的軸承和齒輪故障,提出基于模型的故障識(shí)別方法,并通過(guò)與模糊c均值聚類方法的比較,以驗(yàn)證本文提出的方法故障識(shí)別率更高,對(duì)齒輪箱故障識(shí)別有實(shí)際意義。

1 經(jīng)驗(yàn)?zāi)B(tài)分解及分析

經(jīng)驗(yàn)?zāi)B(tài)分解是一種能將信號(hào)按低頻到高頻進(jìn)行分解的方法。相比短時(shí)傅里葉變換及小波變換,經(jīng)驗(yàn)?zāi)B(tài)分解無(wú)須人工選擇基函數(shù),可以根據(jù)信號(hào)特點(diǎn)產(chǎn)生基函數(shù),分解信號(hào)時(shí)域和頻域精度高,能夠很好地展現(xiàn)信號(hào)的局部特征。

首先,筆者將信號(hào)分解為一系列表征信號(hào)特征時(shí)間尺度的固有模態(tài)函數(shù)。原始信號(hào)可由若干個(gè)IMF分量和一項(xiàng)殘差構(gòu)成[17],即:

(1)

式中:ci(t)—固有模式分量,主要包含信號(hào)的局部信息,m/s2;Rn(t)—信號(hào)殘余分量,m/s2。

經(jīng)驗(yàn)?zāi)B(tài)分解得到的各個(gè)分量能夠表征信號(hào)的局部信息,可利用相關(guān)分析法選取IMF分量,從而實(shí)現(xiàn)信號(hào)特征的提取。

兩個(gè)序列相關(guān)系數(shù)的計(jì)算公式如下:

(2)

式中:cov(x,y)—x,y的協(xié)方差;D(x)—x的方差;D(y)—y的方差。

ρxy值越接近1,x,y的相關(guān)性越大;ρxy越接近0,x，y相關(guān)性越小。IMF分量和原始信號(hào)的相關(guān)系數(shù)反映了IMF分量包含原始信號(hào)局部特征的信息量,該系數(shù)越大,表明IMF分量包含的原始信號(hào)局部特征信息越全面。

2 聚類方法

2.1 K-means聚類

K-means聚類是一種經(jīng)典的無(wú)監(jiān)督學(xué)習(xí)算法,通過(guò)迭代將數(shù)據(jù)劃分到各個(gè)區(qū)域,使得數(shù)據(jù)點(diǎn)到各區(qū)域中心的距離之和最小。

K-means的目標(biāo)函數(shù)及優(yōu)化如下[18]:

(3)

迭代優(yōu)化中,聚類中心μk和指示矩陣rnk,這是一個(gè)NP問(wèn)題,直接進(jìn)行優(yōu)化太難,需要迭代優(yōu)化這兩個(gè)變量,從而得到一個(gè)最優(yōu)解。具體的迭代步驟如下:

(1)固定聚類中心μk,優(yōu)化指示矩陣rnk:若第n個(gè)樣本距離第k個(gè)中心最近,則賦值rnk=1;否則,rnk=0;

(2)固定指示矩陣rnk,優(yōu)化聚類中心μk,由式(3)對(duì)中心μk求導(dǎo)可得:

(4)

令式(4)等于0,可以得到聚類中心μk:

(5)

通過(guò)迭代,最終達(dá)到最小化距離總和的目標(biāo),如下式所示:

(6)

經(jīng)過(guò)上述迭代,最終可得到k個(gè)區(qū)域的類中心。

2.2 高斯混合模型聚類

高斯混合模型是基于高斯函數(shù)的一種聚類方法,它是一種軟聚類。此處首先對(duì)數(shù)據(jù)類別和數(shù)據(jù)的分布進(jìn)行假設(shè)[19]:

zi～Multinomial(φ)

(7)

p(x(i)|z(i))～N(μj,∑j)

(8)

式(7,8)分別是類別數(shù)和樣本數(shù)據(jù)的假設(shè)分布類型—多項(xiàng)式分布和高斯分布。由式(7,8)可以得到x和z的聯(lián)合分布函數(shù):

p(x(i),z(i))=p(x(i)|z(i))*p(z(i))

(9)

根據(jù)似然函數(shù)可得到假設(shè)分布的3個(gè)參數(shù):

(10)

式中:φ—包含隱含變量z服從的概率分布;μ—混合高斯分布的均值;∑—混合高斯分布的協(xié)方差。

筆者通過(guò)最大期望算法EM實(shí)現(xiàn)了參數(shù)估計(jì),通過(guò)對(duì)式(10)進(jìn)行拉格朗日替換和對(duì)3個(gè)參數(shù)求偏導(dǎo),得到了3個(gè)參數(shù)的迭代式。具體的算法流程如下[20]:

(1)對(duì)于每一個(gè)i,j,重復(fù)下列運(yùn)算,直到收斂:

(11)

(2)參數(shù)更新:

(12)

(13)

(14)

根據(jù)貝葉斯公式可以得到:

p(z(i)=j|x(i);φ,μ,∑)=

(15)

(3)不斷地迭代步驟(1,2),更新3個(gè)參數(shù),直到|P(X|φ)-P′(X|φ)|<ε,即前后兩次迭代得到的結(jié)果變化小于設(shè)定誤差,則終止迭代。

3 齒輪箱故障識(shí)別實(shí)驗(yàn)及分析

3.1 數(shù)據(jù)樣本特征集構(gòu)造

筆者設(shè)置齒輪箱正常、軸承內(nèi)外圈磨損、齒輪磨損、缺齒、斷齒等情況下的實(shí)驗(yàn),實(shí)驗(yàn)臺(tái)如圖1所示。

圖1 齒輪箱實(shí)驗(yàn)臺(tái)

圖1中,實(shí)驗(yàn)臺(tái)所用傳感器為JM411加速度傳感器,數(shù)據(jù)采集設(shè)備是美國(guó)NI公司生產(chǎn)的NI9234采集卡。采集齒輪箱振動(dòng)信號(hào),由振動(dòng)信號(hào)的均方根值構(gòu)成全局特征參數(shù),由最佳IMF分量的均方根值作為信號(hào)的局部特征參數(shù),共同構(gòu)成振動(dòng)數(shù)據(jù)樣本的特征集。

齒輪箱正常狀態(tài)、齒輪斷齒故障、齒輪磨損故障、缺齒故障、軸承內(nèi)圈磨損故障、軸承外圈磨損故障等狀態(tài)下,振動(dòng)信號(hào)的原始波形如圖2所示。

圖2 原始振動(dòng)加速度信號(hào)波形圖

由圖2中的振動(dòng)信號(hào)波形形態(tài)可以看出:軸承和齒輪在正常、各類故障狀態(tài)下,振動(dòng)信號(hào)波形均有差異,但需要將定性分析轉(zhuǎn)變?yōu)槎康奶卣鳌?/p>

IMF分量的均方根值能夠反映信號(hào)的局部特征,其計(jì)算公式如下:

(16)

式中:xi—信號(hào)序列,m/s2;N—信號(hào)點(diǎn)數(shù)。

在齒輪箱各狀態(tài)下,根據(jù)各IMF分量與原始數(shù)據(jù)的相關(guān)分析結(jié)果,筆者從振動(dòng)信號(hào)中選取相對(duì)最佳IMF分量,最佳分量的波形如圖3所示。

圖3 齒輪箱各狀態(tài)下最佳IMF分量

由圖3可以看出:除齒輪磨損信號(hào)外,軸承和齒輪正常、各類故障狀態(tài)下,最佳IMF分量信波形中的沖擊信號(hào)更加明顯;經(jīng)驗(yàn)?zāi)B(tài)分解獲取的最佳IMF分量一定程度上能夠去除原始信號(hào)中的冗余信息和干擾信號(hào)。

考慮到經(jīng)驗(yàn)?zāi)B(tài)分解會(huì)造成信號(hào)的全局特征信息丟失,要通過(guò)計(jì)算原始信號(hào)的均方根值表征信號(hào)的全局特征。因此,此處整個(gè)特征集由局部特征和全局特征構(gòu)成。

3.2 訓(xùn)練樣本特征分析

齒輪箱正常、故障等6種狀態(tài)下的實(shí)驗(yàn)中,電機(jī)轉(zhuǎn)速為1 500 r/min,6種狀態(tài)下振動(dòng)信號(hào)的IMF分量均方根值和原始信號(hào)均方根值各50組,構(gòu)成樣本特征集。筆者通過(guò)K-means聚類算法對(duì)上述構(gòu)造的特征集進(jìn)行評(píng)判,為后續(xù)建立故障識(shí)別模型奠定基礎(chǔ)。

3.2.1 K-means聚類分析

筆者利用K-means算法,通過(guò)不斷遍歷指定分類范圍內(nèi)不同類別數(shù)K值下,分類結(jié)果中樣本點(diǎn)到各自聚類中心距離的平方誤差,從而確定樣本數(shù)據(jù)類別數(shù)。

誤差的計(jì)算公式如下:

(17)

當(dāng)分類數(shù)等于總樣本數(shù)時(shí),平方誤差等于0,因此可以得出,平方誤差值隨著K值的增加單調(diào)遞減,不斷接近于0;當(dāng)K值接近于數(shù)據(jù)最佳類別數(shù)的地方時(shí),平方誤差SSE會(huì)出現(xiàn)一個(gè)拐點(diǎn),平方誤差的變化趨于緩慢,此時(shí)的K值即為最佳類別數(shù)。

不同K值下,距離誤差總合SSE的變化趨勢(shì)如圖4所示。

圖4 不同K值下K-means聚類結(jié)果

圖4中,隨著K值的增加,平方誤差SSE逐漸變小,并逐漸收斂于0。

不同K值下,平方誤差SSE及其差值如表1所示。

表1 不同K值下k-means聚類誤差

由表1可以看出：當(dāng)K=6時(shí),K=5與K=6的平方誤差SSE的差值降為0.1;K>6時(shí),平方誤差SSE開(kāi)始緩慢變化,可以判定樣本數(shù)據(jù)為6類,與實(shí)際特征集類別數(shù)相符,證明了特征集的有效性。

利用K-means算法可以快速、準(zhǔn)確地確定出樣本數(shù)據(jù)的類別數(shù),從而實(shí)現(xiàn)對(duì)樣本特征集效果的評(píng)價(jià),K值越靠近理論類別值,說(shuō)明各類間特征的區(qū)分度越高,構(gòu)造的樣本特征集越好。

3.2.2 高斯混合模型聚類分析

筆者利用高斯混合模型方法對(duì)齒輪箱振動(dòng)數(shù)據(jù)的特征進(jìn)行聚類分析,利用齒輪箱6種狀態(tài)下的振動(dòng)特征數(shù)據(jù)建立高斯混合模型。

由高斯混合模型得到的6類數(shù)據(jù)的二維高斯分布圖如圖5所示。

圖5 齒輪箱6種狀態(tài)下二維高斯分布

圖5中,橫坐標(biāo)是由振動(dòng)信號(hào)IMF分量信號(hào)的均方根值構(gòu)成的局部特征,縱坐標(biāo)是由原始振動(dòng)信號(hào)的均方根值構(gòu)成的全局特征。由圖5可以看出:齒輪箱6種狀態(tài)下二維高斯分布云圖形態(tài)均有差異,能夠?qū)X輪箱6種狀態(tài)區(qū)分開(kāi)。

6種狀態(tài)下二維高斯分布函數(shù)的參數(shù)如表2所示。

表2 6種狀態(tài)二維高斯分布函數(shù)參數(shù)

多維高斯分布函數(shù)的計(jì)算公式為:

(18)

式中:x—樣本數(shù)據(jù),m/s2;d—數(shù)據(jù)維度;α—權(quán)重系數(shù),由高斯混合模型訓(xùn)練得到的每類數(shù)據(jù)的概率;u—樣本均值,m/s2;∑—樣本協(xié)方差。

筆者利用高斯混合模型聚類方法建立齒輪箱狀態(tài)識(shí)別模型。

該模型的故障識(shí)別流程如圖6所示。

圖6 基于高斯混合聚類的齒輪箱故障識(shí)別流程

圖6中,筆者首先利用K-means算法間接評(píng)價(jià)了齒輪箱狀態(tài)特征庫(kù)特征集的效果,確定了高斯混合模型各類數(shù)據(jù)的多維高斯分布模型,根據(jù)實(shí)時(shí)采集的齒輪箱振動(dòng)信號(hào),得到了齒輪箱振動(dòng)數(shù)據(jù)的特征值,將該特征值輸入到各狀態(tài)模型中,從而得到了該特征值在各個(gè)分布函數(shù)中的從屬概率,由從屬概率的大小最終確定了齒輪箱的運(yùn)行狀態(tài);

然后筆者利用齒輪箱實(shí)驗(yàn)數(shù)據(jù)對(duì)上述方法進(jìn)行驗(yàn)證,將齒輪箱各狀態(tài)下實(shí)時(shí)運(yùn)行數(shù)據(jù)輸入到齒輪箱狀態(tài)匹配模型中,得到了實(shí)時(shí)運(yùn)行數(shù)據(jù)的從屬狀態(tài)。

齒輪箱各狀態(tài)下的特征值輸入到二維高斯?fàn)顟B(tài)模型，得到的從屬概率值如圖7所示。

圖7 齒輪箱各運(yùn)行狀態(tài)下模型從屬概率

從圖7中可以看出:(1)6個(gè)狀態(tài)模型給出從屬概率值越大,齒輪箱越傾向于該運(yùn)行狀態(tài);(2)正常狀態(tài)模型、軸承內(nèi)圈磨損故障模型、齒輪磨損故障模型、齒輪缺齒故障模型和軸承外圈磨損故障模型,均能夠準(zhǔn)確判斷出齒輪箱正常運(yùn)行狀態(tài);(3)齒輪箱齒輪斷齒故障模型確定的齒輪箱斷齒和軸承內(nèi)圈故障的從屬概率值有重合,但從平均概率可以判定為齒輪斷齒故障。

同時(shí),筆者將本文提出方法的故障識(shí)別準(zhǔn)確率與模糊c均值聚類方法進(jìn)行對(duì)比。

基于模糊c均值聚類的齒輪箱故障識(shí)別流程如圖8所示。

圖8 基于模糊c均值聚類的齒輪箱故障識(shí)別流程

本文定義的齒輪箱各狀態(tài)下故障識(shí)別準(zhǔn)確率如下式所示:

(19)

式中:Ci—該類樣本分類正確的樣本數(shù);Li—該類實(shí)際樣本數(shù)。

兩種方法對(duì)相同齒輪箱運(yùn)行狀態(tài)的故障識(shí)別準(zhǔn)確率如表3所示。

由表3兩種方法的對(duì)比可以發(fā)現(xiàn):

表3 兩種故障識(shí)別方法識(shí)別正確率

(1)兩種方法均能準(zhǔn)確識(shí)別齒輪箱的正常狀態(tài)及齒輪缺齒狀態(tài),準(zhǔn)確率達(dá)到100%;(2)模糊c均值聚類方法對(duì)齒輪箱齒輪磨損故障和軸承內(nèi)圈磨損故障診斷準(zhǔn)確率過(guò)低,分別為66%和53%;(3)從整體上看,基于高斯混合模型的故障識(shí)別率比基于模糊c均值聚類方法的故障識(shí)別率更高。

4 結(jié)束語(yǔ)

本文通過(guò)齒輪箱振動(dòng)信號(hào)均方根值和IMF分量的均方根值構(gòu)造了振動(dòng)信號(hào)全局特征和局部特征,利用K-means對(duì)特征集的分類數(shù)進(jìn)行了確定,驗(yàn)證了特征集的構(gòu)造效果;然后通過(guò)構(gòu)造各運(yùn)行狀態(tài)的高斯混合模型,得到了各類數(shù)據(jù)的多維高斯分布模型,根據(jù)各運(yùn)行狀態(tài)的多維高斯分布模型計(jì)算得到了齒輪箱當(dāng)前運(yùn)行數(shù)據(jù)的從屬概率;并根據(jù)從屬概率最大原則,得出了齒輪箱的運(yùn)行狀態(tài)。實(shí)驗(yàn)結(jié)果表明,本文提出的方法能夠識(shí)別齒輪箱各類物理仿真狀態(tài)。

根據(jù)研究結(jié)果可得出以下結(jié)論:

(1)基于K-means和高斯混合模型聚類的齒輪箱故障識(shí)別方法,能夠準(zhǔn)確識(shí)別試驗(yàn)環(huán)境下齒輪箱軸承和齒輪的典型故障;

(2)基于高斯混合模型聚類的齒輪箱狀態(tài)識(shí)別方法,能夠準(zhǔn)確識(shí)別齒輪箱齒輪磨損、缺齒及軸承內(nèi)、外圈故障,但對(duì)于齒輪斷齒故障識(shí)別的準(zhǔn)確率還需進(jìn)一步提升。

筆者后續(xù)將根據(jù)該方法的實(shí)際應(yīng)用效果,不斷優(yōu)化故障識(shí)別方法,進(jìn)一步提升齒輪箱軸承和齒輪故障識(shí)別準(zhǔn)確率。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看