謝鋒云,姜永奇,馮春雨,王二化,劉翊
(1.華東交通大學(xué)機(jī)電與車輛工程學(xué)院,江西南昌 330013;2.常州信息職業(yè)技術(shù)學(xué)院常州市高端制造裝備智能化技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇常州 213164;3.國(guó)家先進(jìn)軌道交通裝備創(chuàng)新中心,湖南株洲 412000)
牽引座位于機(jī)車箱體下部縱梁上,是機(jī)車關(guān)鍵零部件之一,其作用是將機(jī)車產(chǎn)生的牽引和制動(dòng)作用傳遞到機(jī)車走行部進(jìn)而實(shí)現(xiàn)機(jī)車車輛的行進(jìn)和制動(dòng)。由于牽引座反復(fù)承受和傳遞機(jī)車產(chǎn)生的作用力,因此在機(jī)車運(yùn)行中容易出現(xiàn)裂紋等機(jī)械故障,影響機(jī)車運(yùn)行狀態(tài)。因?yàn)闄C(jī)車牽引座在機(jī)車安全可靠運(yùn)行中起到的重要作用,其結(jié)構(gòu)是否安全可靠將直接關(guān)系機(jī)車運(yùn)行的安全性。
在以往的機(jī)械設(shè)備狀態(tài)識(shí)別研究中,由于機(jī)械設(shè)備的運(yùn)轉(zhuǎn)存在平穩(wěn)性和非平穩(wěn)性,進(jìn)行振動(dòng)信號(hào)分析是機(jī)械設(shè)備狀態(tài)識(shí)別的重要方法。振動(dòng)信號(hào)通常涵蓋了時(shí)間特征、頻率特征、能量值、信息熵等多種信息,通過(guò)分析這些信息能夠了解掌握機(jī)械設(shè)備運(yùn)行狀態(tài),及時(shí)發(fā)現(xiàn)設(shè)備出現(xiàn)故障情況。所以如何能夠準(zhǔn)確、快捷地分析采集的信號(hào)并最終得到準(zhǔn)確分析識(shí)別結(jié)果成為了眾多學(xué)者研究的方向。馮春雨在牽引座的故障診斷方法方面進(jìn)行了很多有益的嘗試和研究,特征指標(biāo)參數(shù)采用時(shí)域指標(biāo)和EEMD(Ensemble Empirical Mode Decomposition)分解指標(biāo),再用KNN(K-Nearest Neighbor)算法進(jìn)行識(shí)別。但是在時(shí)域指標(biāo)以及EEMD指標(biāo)選擇上還有待進(jìn)一步的研究,KNN算法輸入?yún)?shù)選擇上也可以進(jìn)一步研究。申炎仃等提出了一種改進(jìn)EMD和小波閾值的方法,用于材料斷裂故障的智能診斷。EEMD算法是對(duì)EMD算法的改進(jìn),可以有效抑制模態(tài)混疊現(xiàn)象,具有實(shí)際物理意義。在振動(dòng)診斷過(guò)程中模式識(shí)別方法的選擇也非常重要,目前在模式識(shí)別中應(yīng)用較為廣泛的方法主要有K鄰近算法(KNN)。HUANG等基于類貢獻(xiàn)和特征加權(quán),得到K-最鄰近數(shù),與平均距離結(jié)合得到最終標(biāo)簽,優(yōu)化后的KNN提高了分類精度。但是,KNN算法在處理分類決策問(wèn)題時(shí)仍存在不足之處,即樣本數(shù)量不滿足平衡條件時(shí),發(fā)生近鄰樣本容錯(cuò)數(shù)量過(guò)大現(xiàn)象,導(dǎo)致分類決策出現(xiàn)偏差,進(jìn)而影響了KNN算法的廣泛應(yīng)用。
機(jī)械設(shè)備故障診斷技術(shù)發(fā)展可謂日新月異,很多專家學(xué)者都對(duì)故障診斷技術(shù)應(yīng)用于機(jī)車的故障診斷進(jìn)行了很多有益的嘗試并取得了良好的結(jié)果,所以利用振動(dòng)診斷技術(shù)進(jìn)行牽引座裂紋故障狀態(tài)識(shí)別研究是可行的。因此本文作者提出基于EEMD-KNN算法方法對(duì)機(jī)車牽引座故障狀態(tài)進(jìn)行識(shí)別。
EMD為數(shù)據(jù)本身驅(qū)動(dòng)的自適應(yīng)分解方法,可以得到一組包含真實(shí)物理意義以及瞬時(shí)頻率特性的本征模態(tài)函數(shù)(IMF)。在每個(gè)IMF分量中,過(guò)零點(diǎn)總數(shù)、極值點(diǎn)總數(shù)必須相等或者最多相差一個(gè),每個(gè)數(shù)據(jù)點(diǎn)的局部極大值與極小值對(duì)應(yīng)的上下包絡(luò)線的均值必須等于零。
由于振動(dòng)信號(hào)采集過(guò)程中會(huì)出現(xiàn)脈沖、間歇性等復(fù)雜情況,EMD分解過(guò)程可能會(huì)出現(xiàn)模態(tài)混疊現(xiàn)象。EEMD即集合經(jīng)驗(yàn)?zāi)B(tài)分解就是為了解決該問(wèn)題而產(chǎn)生的,因此EEMD是一種改善了EMD的局限性且非常適合分析非線性、非平穩(wěn)信號(hào)的時(shí)頻分析方法。EEMD在EMD的基礎(chǔ)上,向原始信號(hào)中多次增加均值為零、頻率均勻的隨機(jī)白噪聲,分解時(shí)仍然采用EMD分解方法,最后對(duì)IMF分量平均化處理。
EEMD分解步驟為:
(1)向采集振動(dòng)信號(hào)中多次添加隨機(jī)白噪聲序列():
()=()+()
(1)
(2)對(duì)()進(jìn)行EMD分解,重復(fù)次,獲得組IMFs;
(3)對(duì)所有IMFs求平均值,獲得最終IMF分量:
(2)
其中:,()為第次EMD分解所得到第個(gè)IMF分量。
由于KNN算法的簡(jiǎn)單、便捷、高效性、準(zhǔn)確性,成為了應(yīng)用最廣泛的機(jī)器學(xué)習(xí)算法之一。
KNN算法流程的核心思想是統(tǒng)計(jì)未知樣本周圍一定范圍內(nèi)的全部已知點(diǎn)及其類別,然后把樣本歸為統(tǒng)計(jì)量最多的已知點(diǎn)所在的類別。該算法在處理分類決策問(wèn)題時(shí),只統(tǒng)計(jì)最鄰近的已知點(diǎn)及其類別,單純比較已知點(diǎn)數(shù)量,進(jìn)而判定該類別,不需要判斷其他類域等問(wèn)題。因此對(duì)于類別之間交叉或重疊較多的待分樣本集來(lái)說(shuō),KNN方法較其他方法更為適合。
KNN的算法步驟如下:
(1)統(tǒng)計(jì)未知點(diǎn)一定范圍內(nèi)已知點(diǎn)及其類別;
(2)計(jì)算已知點(diǎn)數(shù)最多的類別;
(3)將未知點(diǎn)歸于上述類別;
(4)一定范圍內(nèi)值一般是根據(jù)經(jīng)驗(yàn)設(shè)定的。
為研究早期裂紋發(fā)生以及發(fā)展的進(jìn)程,實(shí)驗(yàn)應(yīng)盡量在同等加工條件下,采用同等材質(zhì)材料;參考現(xiàn)行車輛段修規(guī)程,參照實(shí)際牽引座形制以及實(shí)際裂紋發(fā)生情況,采用15 mm厚鋼板制作正常、小裂紋(寬度為1 mm)以及大裂紋(寬度為2 mm)狀態(tài)的實(shí)驗(yàn)?zāi)P?。?shí)驗(yàn)裝置示意如圖1所示,實(shí)驗(yàn)器材如圖2所示。
圖1 實(shí)驗(yàn)裝置示意
圖2 實(shí)驗(yàn)器材
數(shù)據(jù)采集實(shí)驗(yàn)過(guò)程,利用專業(yè)采集信號(hào)軟件YE7600,調(diào)整“示波”、 “零漂采集”等標(biāo)準(zhǔn),將觸發(fā)方式設(shè)為“定時(shí)觸發(fā)”,采樣頻率設(shè)為12 kHz,采樣時(shí)長(zhǎng)設(shè)為5 s,采樣間隔設(shè)為30 min,以便于設(shè)備進(jìn)行數(shù)據(jù)采集。為保證數(shù)據(jù)的有效性和可靠性,采集數(shù)據(jù)的過(guò)程是隨機(jī)進(jìn)行的;每種狀態(tài)分別采集100組數(shù)據(jù),一共300組,登記存儲(chǔ)數(shù)據(jù)zc-1,…,100;xlw-1,…,100;dlw-1,…,100。
分別截取上述采集的3種狀態(tài)(zc-10、xlw-10和dlw-10)數(shù)據(jù)的某段時(shí)長(zhǎng)0.5 s、采樣點(diǎn)數(shù)6 000的數(shù)據(jù),繪制原始信號(hào)圖,如圖3所示。
圖3 不同狀態(tài)時(shí)域分析圖
從圖3可以看出:幅值、波形等存在明顯變化情況,分別計(jì)算時(shí)域特征(峰-峰值、方差、峭度),計(jì)算結(jié)果見(jiàn)表1。
表1 3種狀態(tài)時(shí)域指標(biāo)對(duì)比
表1計(jì)算結(jié)果的差異性驗(yàn)證了所選時(shí)域特征的準(zhǔn)確性,將上述時(shí)域特征結(jié)果合并為時(shí)域特征矩陣,記為[,,]。
原始信號(hào)經(jīng)過(guò)EEMD分解,得到12個(gè)IMF分量和1個(gè)殘差分量。為了分析這些分量與原始信號(hào)的相關(guān)性,分別計(jì)算每一個(gè)分量與原始振動(dòng)加速度信號(hào)之間的相關(guān)系數(shù),計(jì)算結(jié)果如表2所示。
表2 各分量與原始信號(hào)相關(guān)系數(shù)
由表2可以看出:IMF1分量與原始信號(hào)的相關(guān)系數(shù)近似接近1.0,相關(guān)系數(shù)越大,相關(guān)性越好,則所包含的有用信息也就越多;反之則所包含的有用信息較少。綜合以上分析,最終選取前5個(gè)分量用于后面的狀態(tài)識(shí)別研究。
因KNN算法只能識(shí)別量化后的敏感特征參數(shù),將IMF分量波形進(jìn)行量化的方式是計(jì)算各分量能量所占比例,將計(jì)算結(jié)果記為特征矩陣,記為[,,,,]。
將上述特征矩陣拆分為KNN的訓(xùn)練集和測(cè)試集。240個(gè)樣本的5個(gè)特征作為訓(xùn)練集,42個(gè)樣本的5個(gè)特征作為測(cè)試集。對(duì)所有樣本進(jìn)行歸一化,將正常、小裂紋、大裂紋3種狀態(tài)的識(shí)別結(jié)果的標(biāo)簽分別記為00、01、10。經(jīng)過(guò)交叉驗(yàn)證以及比較認(rèn)為值等于4比較好。只使用EEMD分解得到的分量作為特征矩陣,KNN算法的牽引座狀態(tài)識(shí)別結(jié)果如表3所示。
表3 各狀態(tài)識(shí)別結(jié)果
在表3中,帶下劃線的數(shù)字表示識(shí)別錯(cuò)誤。表3顯示:所有42個(gè)識(shí)別結(jié)果中,有35個(gè)結(jié)果識(shí)別準(zhǔn)確,準(zhǔn)確率為83.3%。分析出現(xiàn)這個(gè)結(jié)果的原因,觀察到特征矩陣有些數(shù)據(jù)相似。
分析了EEMD特征矩陣相似性的局限后,再將時(shí)域特征加入EEMD特征矩陣構(gòu)成全新的特征矩陣,即240個(gè)樣本的8個(gè)特征作為訓(xùn)練集,42個(gè)樣本的8個(gè)特征作為測(cè)試集,記為[,,,,,,,]。沿用前面的便簽,同樣對(duì)所有樣本進(jìn)行歸一化處理。再經(jīng)過(guò)交叉驗(yàn)證以及比較認(rèn)為值等于6比較好。最終KNN算法的牽引座狀態(tài)識(shí)別結(jié)果如表4所示,42個(gè)結(jié)果識(shí)別正確,4個(gè)結(jié)果識(shí)別錯(cuò)誤,識(shí)別率達(dá)到90.5%。表明加入時(shí)域特征后KNN算法的牽引座狀態(tài)識(shí)別率更高。
表4 各狀態(tài)識(shí)別結(jié)果
為了將故障診斷技術(shù)應(yīng)用于牽引座結(jié)構(gòu)缺陷裂紋狀態(tài)的識(shí)別,文中提出將時(shí)域、EEMD分解后的時(shí)頻域特征相結(jié)合作為敏感特征矩陣,構(gòu)建了KNN算法識(shí)別模型,針對(duì)采集到的振動(dòng)信號(hào)進(jìn)行了牽引座的3種不同狀態(tài)識(shí)別。結(jié)果表明有較好的識(shí)別率,達(dá)到了83.3%。而且,加入時(shí)域敏感特征之后的識(shí)別結(jié)果顯示,KNN算法的識(shí)別效果更好,識(shí)別率達(dá)到90.5%。分析其原因,KNN算法在加入更多特征之后,每個(gè)已知點(diǎn)的空間定位更準(zhǔn)確了,尋找最鄰近的個(gè)已知點(diǎn)時(shí)距離計(jì)算也更加精準(zhǔn),進(jìn)而提高了KNN識(shí)別準(zhǔn)確率。由于實(shí)驗(yàn)條件和實(shí)驗(yàn)平臺(tái)的局限性,以及KNN及其構(gòu)建模型的局限性,得到的結(jié)果存在一定的失真性和誤差,這也為今后提高識(shí)別率提供了思考方向和研究側(cè)重點(diǎn)。