蔣佳煒 胡以懷 丁夢豪 高雨頎 周輝
摘要:為提高船舶機(jī)艙狀態(tài)監(jiān)測的實(shí)時(shí)性和故障診斷的準(zhǔn)確性,提出一種由數(shù)據(jù)獲取、特征提取、特征選擇和故障識(shí)別組成的智能狀態(tài)監(jiān)測和故障診斷框架,以及基于相對(duì)混亂度的特征選擇方法和基于特征選擇的支持向量機(jī)訓(xùn)練方法。該方法相比傳統(tǒng)方法在故障識(shí)別準(zhǔn)確率上有所提升,可達(dá)到94.46%,并且可有效縮短分類器計(jì)算耗時(shí),最快可將其縮短77.8%。文中提出的算法框架、特征選擇方法、基于特征選擇的支持向量機(jī)訓(xùn)練方法和智能故障診斷方法相比現(xiàn)有方法有一定的優(yōu)勢,對(duì)機(jī)艙中回轉(zhuǎn)機(jī)械設(shè)備的狀態(tài)監(jiān)測和故障診斷有一定的參考價(jià)值。
關(guān)鍵詞:智能故障診斷; 特征選擇; 支持向量機(jī); 狀態(tài)監(jiān)測; 智能機(jī)艙
中圖分類號(hào):? U676.4+2文獻(xiàn)標(biāo)志碼:? A
Intelligent condition monitoring and fault diagnosis of marine fans
based on feature selection of relative chaos
JIANG Jiawei, HU Yihuai, DING Menghao, GAO Yuqi, ZHOU Hui
(Merchant Marine College, Shanghai Maritime University, Shanghai 201306, China)
Abstract: In order to improve the real-time performance of condition monitoring and the accuracy of fault diagnosis of ship intelligent engine rooms, this paper proposes a framework of intelligent condition monitoring and fault diagnosis composed of data acquisition, feature extraction, feature selection and fault recognition, as well as the feature selection method based on relative chaos and the support vector machine training method based on feature selection. Compared with traditional methods, this method improves the fault recognition accuracy, reaching 94.46%. It can effectively reduce the calculation time of the classifier, and it can be reduced by 77.8% at the fastest. The algorithm framework, the feature selection method, the support vector machine training method and the intelligent fault diagnosis method proposed in this paper have certain advantages over the existing methods, which? have certain reference value for the condition monitoring and fault diagnosis of? rotating machinery equipments in the engine room.
Key words: intelligent fault diagnosis; feature selection; support vector machine; condition monitoring; intelligent engine room
0 引 言
在《中國制造2025》中,高科技造船被列為十大重點(diǎn)領(lǐng)域之一,其中智能船舶是其重要組成部分[1]??梢灶A(yù)見,未來10~20年內(nèi)智能船舶是航運(yùn)業(yè)發(fā)展的重要方向之一。在全球航運(yùn)的大背景下,船舶航行安全是保障航運(yùn)業(yè)健康良好運(yùn)行和發(fā)展的前提。智能船舶技術(shù)中的智能機(jī)艙技術(shù)是決定船舶安全、高效、平穩(wěn)航行的核心要素。在智能船舶的發(fā)展過程中,船舶也在向大型化、高速化、少人化方向發(fā)展,大型遠(yuǎn)洋船舶的機(jī)艙設(shè)備不斷增多,且船舶機(jī)械設(shè)備不斷向自動(dòng)化、復(fù)雜化、智能化的方向發(fā)展。使用適當(dāng)?shù)姆椒▽?duì)船舶機(jī)械設(shè)備進(jìn)行狀態(tài)監(jiān)測、健康管理和故障診斷是智能機(jī)艙技術(shù)研究的熱點(diǎn)之一,船舶機(jī)械設(shè)備智能故障診斷也是智能船舶發(fā)展中的重要一環(huán)[2]。
機(jī)械設(shè)備的故障診斷方法主要分為基于模型驅(qū)動(dòng)和基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法[3]。基于模型驅(qū)動(dòng)的故障診斷方法是先建立機(jī)械設(shè)備的數(shù)學(xué)模型然后通過殘差分析實(shí)現(xiàn)故障診斷[4],這種方法需要深入研究機(jī)械的原理和數(shù)學(xué)模型。船舶機(jī)械種類繁多且船用機(jī)械系統(tǒng)復(fù)雜,要對(duì)這些機(jī)械設(shè)備逐一建模分析是一項(xiàng)非常繁重的工作任務(wù),因此基于模型驅(qū)動(dòng)的故障診斷方法
并不是最理想的,基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法并不要求太多機(jī)械設(shè)備的先驗(yàn)知識(shí)[5-6]。這種方法使用智能算法和訓(xùn)練數(shù)據(jù)去訓(xùn)練機(jī)器學(xué)習(xí)模型,使用訓(xùn)練好的模型完成故障識(shí)別,最終實(shí)現(xiàn)故障診斷,十分適合自動(dòng)化程度較高且機(jī)械設(shè)備復(fù)雜的船舶機(jī)艙系統(tǒng)。
現(xiàn)有機(jī)械設(shè)備的故障診斷大多被概括為3個(gè)主要步驟[7]:數(shù)據(jù)獲取、特征提取和故障分類。
(1)數(shù)據(jù)獲取。現(xiàn)代自動(dòng)化船舶機(jī)艙中配備著各類傳感器監(jiān)測機(jī)械設(shè)備的不同信息。而設(shè)備的故障信息大多存在于熱力學(xué)、動(dòng)力學(xué)、摩擦學(xué)、聲學(xué)等物理場中?;谝环N或多種類型傳感器數(shù)據(jù)展開分析是故障診斷的第一步。
(2)特征提取。某些類型的數(shù)據(jù)(如機(jī)械設(shè)備的電壓、溫度等)可以直接用于分析,但機(jī)械設(shè)備的振動(dòng)信號(hào)、噪聲信號(hào)等還需要先對(duì)其進(jìn)行特征提取才能進(jìn)行分析[8]。雷亞國等[7]對(duì)不同信號(hào)的特征提取方法做了對(duì)比。
(3)故障分類?;跈C(jī)械原始監(jiān)測數(shù)據(jù)或特征提取后的數(shù)據(jù),使用不同的機(jī)器學(xué)習(xí)分類方法對(duì)故障進(jìn)行識(shí)別是機(jī)械故障診斷中較為常用的方法[9]。機(jī)器學(xué)習(xí)分類方法分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)[10]。無監(jiān)督學(xué)習(xí)指數(shù)據(jù)中不含有標(biāo)簽的機(jī)器學(xué)習(xí)方法,這類方法大多使用聚類算法將數(shù)據(jù)分為幾個(gè)類別。本文主要討論監(jiān)督學(xué)習(xí)。通過帶有標(biāo)簽的數(shù)據(jù)來訓(xùn)練分類器,進(jìn)行一定調(diào)整后得到一個(gè)理想的分類器,再用其對(duì)新的數(shù)據(jù)進(jìn)行故障分類。常見的監(jiān)督學(xué)習(xí)分類方法有K最鄰近算法、支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)。
對(duì)于船舶風(fēng)機(jī)設(shè)備和其他機(jī)械設(shè)備,無論是經(jīng)過特征提取后的振動(dòng)信號(hào)還是原始的熱工參數(shù)信號(hào),其對(duì)應(yīng)的數(shù)據(jù)集往往是一個(gè)包含很多項(xiàng)的高維數(shù)據(jù)集。高維數(shù)據(jù)集不僅會(huì)增加分類器訓(xùn)練難度,還會(huì)降低分類器的運(yùn)算速度并增加運(yùn)算成本,而且其中的冗余信息會(huì)導(dǎo)致分類器的準(zhǔn)確率降低[11]。為保證航行安全,船舶機(jī)艙機(jī)械設(shè)備的故障診斷對(duì)實(shí)時(shí)性和準(zhǔn)確性要求非常高,這就要求故障診斷算法能夠快速準(zhǔn)確地識(shí)別出機(jī)械故障。為此,本文在船舶機(jī)械設(shè)備的智能狀態(tài)監(jiān)測與故障診斷方法中引入特征選擇方法以期加快分類器的運(yùn)算速度并提高分類器的識(shí)別準(zhǔn)確率。
1 智能狀態(tài)監(jiān)測和故障診斷框架
本文提出的基于特征選擇的船舶機(jī)械設(shè)備狀態(tài)監(jiān)測和故障診斷框架見圖1。
本方法由模型訓(xùn)練和狀態(tài)監(jiān)測與故障診斷這2部分組成,屬于基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法。首先,進(jìn)行機(jī)械設(shè)備的故障診斷實(shí)驗(yàn),對(duì)獲取到的正常狀態(tài)下的信號(hào)和不同故障狀態(tài)下的信號(hào)進(jìn)行標(biāo)記。然后,針對(duì)不同的信號(hào)類型對(duì)信號(hào)進(jìn)行相應(yīng)的特征提取,降低數(shù)據(jù)冗余。對(duì)振動(dòng)信號(hào)進(jìn)行特征提取的方法有:快速傅里葉變換、小波分析、希爾伯特-黃變換和變分模態(tài)分解等。將經(jīng)特征提取后得到的數(shù)據(jù)以一定比例劃分為訓(xùn)練集和測試集。對(duì)多個(gè)特征使用特征選擇方法進(jìn)行數(shù)據(jù)降維,去除無關(guān)特征從而進(jìn)一步降低數(shù)據(jù)冗余。使用訓(xùn)練集訓(xùn)練指定的分類器。這時(shí)可以通過交叉驗(yàn)證和迭代尋優(yōu)等方法進(jìn)一步對(duì)模型進(jìn)行優(yōu)化。最后,使用測試集驗(yàn)證分類器的準(zhǔn)確性和有效性,得到有效模型和特征后就可以開始實(shí)施機(jī)械設(shè)備的狀態(tài)監(jiān)測與故障診斷。步驟如下:
(1)使用相同的傳感器對(duì)機(jī)械設(shè)備進(jìn)行監(jiān)測,并使用同樣的特征提取方法處理得到的監(jiān)測信號(hào)。
(2)從得到的特征數(shù)據(jù)集中選擇模型訓(xùn)練時(shí)選定的特征子集。
(3)使用得到的待測向量和訓(xùn)練好的故障診斷分類器進(jìn)行故障識(shí)別。
(4)識(shí)別完成后輸出相應(yīng)的故障類型,并繼續(xù)監(jiān)測被測機(jī)械設(shè)備。
該船舶機(jī)械設(shè)備狀態(tài)監(jiān)測和智能故障診斷框架是一個(gè)通用的框架,不同的特征提取方法、特征選擇方法和機(jī)器學(xué)習(xí)分類器模型在該框架下均有效。研究人員可以針對(duì)某些方法或步驟進(jìn)行優(yōu)化,并不影響整體流程的有效性。
2 基于相對(duì)混亂度的特征選擇
以數(shù)據(jù)降維、降低數(shù)據(jù)冗余、提高模型透明度和計(jì)算速度為目標(biāo)的特征選擇方法主要有過濾式、封裝式、嵌入式和集成式等4種[12]。過濾式特征選擇方法與機(jī)器學(xué)習(xí)算法互不相干,獨(dú)立于算法,適合本文提出的故障診斷框架。LUUKKA[13]基于相似度和模糊熵提出一種過濾式特征選擇方法,該方法在應(yīng)用時(shí)比同類方法取得了更好的效果[11]。本文基于特征與標(biāo)簽的相對(duì)混亂度提出一種新的過濾式特征選擇方法——基于相對(duì)混亂度的特征選擇方法。
2.1 特征-標(biāo)簽映射空間
對(duì)一個(gè)特定對(duì)象進(jìn)行監(jiān)測并獲取狀態(tài)數(shù)據(jù)時(shí),設(shè)該對(duì)象在所有狀態(tài)下的某個(gè)特征Fn取值分布在區(qū)間[fn,min,fn,max]內(nèi)。如果該對(duì)象的狀態(tài)為有限個(gè),可以將相似狀態(tài)歸為同類,并設(shè)其所有狀態(tài)類型集合為P。每次在某個(gè)狀態(tài)下取得特征Fn的值時(shí)會(huì)得到一個(gè)對(duì)象的狀態(tài)類型pi??梢詫i設(shè)置為標(biāo)簽,如果獲取了足夠多的特征的值和對(duì)應(yīng)的標(biāo)簽類型,就可以通過機(jī)器學(xué)習(xí)對(duì)分類器進(jìn)行訓(xùn)練。若Fn與P的相關(guān)性不強(qiáng),甚至不相關(guān),則認(rèn)為該特征對(duì)分類器的貢獻(xiàn)很小甚至產(chǎn)生了負(fù)面影響。
假設(shè)P中包含M(M >2)個(gè)不同的類。對(duì)pi進(jìn)行獨(dú)熱編碼[14],使其成為一個(gè)M維0-1向量,每個(gè)維度取值為0或1。可以將特征Fn和其對(duì)應(yīng)的標(biāo)簽pi映射到一個(gè)M+1維空間。這個(gè)空間的維度為集合P中元素的數(shù)量,x軸為特征Fn的值,其余軸與pi一一對(duì)應(yīng)。特別地,若M=2,則pi可以是一維向量,取值為0或1。
3 基于特征選擇的支持向量機(jī)訓(xùn)練
使用選出的特征數(shù)據(jù)可直接訓(xùn)練多分類器[12],但是無法將不同特征與不同標(biāo)簽的關(guān)系完全表述出來。為取得更好的特征選擇效果并優(yōu)化多分類器的預(yù)測準(zhǔn)確率,本文提出基于特征選擇的支持向量機(jī)訓(xùn)練方法。
支持向量機(jī)[15]的目標(biāo)是尋找最優(yōu)分類超平面。在保證分類精度的前提下,使最優(yōu)分類超平面兩側(cè)的區(qū)域最大。
單個(gè)支持向量機(jī)本質(zhì)是二分類器。對(duì)于多分類問題,學(xué)者提出了一對(duì)多和一對(duì)一模型[16],特征選擇一般在支持向量機(jī)訓(xùn)練前完成。然而,基于特征選擇的支持向量機(jī)訓(xùn)練方法是先復(fù)制多個(gè)訓(xùn)練集,訓(xùn)練時(shí)針對(duì)每個(gè)二分類器訓(xùn)練集的特征計(jì)算對(duì)應(yīng)的特征相對(duì)混亂度,選擇相對(duì)混亂度較低的特征值構(gòu)成特征子集,針對(duì)每個(gè)二分類器篩選出不同的訓(xùn)練子集進(jìn)行訓(xùn)練。這樣可以在不同標(biāo)簽之前使用不同的特征,完全發(fā)揮每個(gè)特征的效果。本文以一對(duì)多模型為例,若目前有M個(gè)類別,則訓(xùn)練M個(gè)二分類器,每個(gè)二分類器對(duì)應(yīng)訓(xùn)練集的標(biāo)簽為yi∈{1,-1}。對(duì)于第m個(gè)分類器,第m類的標(biāo)簽為1,其余標(biāo)簽為-1,則基于特征選擇的支持向量機(jī)訓(xùn)練方法如圖2所示。
對(duì)每組訓(xùn)練數(shù)據(jù)求所有特征的相對(duì)混亂度,得到特征相對(duì)混亂度集合R。在R中選擇n個(gè)相對(duì)混亂度較小的特征,將訓(xùn)練數(shù)據(jù)以這些特征構(gòu)成新的訓(xùn)練子集。用每組子集訓(xùn)練對(duì)應(yīng)的二分類器,最后得到多分類器模型。
設(shè)訓(xùn)練樣本中共有F個(gè)特征,則對(duì)于每個(gè)二分類器來說,剔除掉F-n個(gè)對(duì)分類器貢獻(xiàn)較小的特征,可以在準(zhǔn)確率基本不變的情況下有效提高模型預(yù)測速度。如果剔除的特征為冗余特征,對(duì)分類器沒有貢獻(xiàn),那么準(zhǔn)確率不會(huì)降低。如果剔除掉的是無效特征,那么分類器在預(yù)測速度提高的同時(shí)識(shí)別準(zhǔn)確率也能提高。
4 實(shí)驗(yàn)驗(yàn)證
以船用風(fēng)機(jī)故障診斷為例分析并討論本文提出方法的有效性。以機(jī)械振動(dòng)信號(hào)為基礎(chǔ),使用由快速傅里葉變換得到的頻譜對(duì)應(yīng)的幅值為特征數(shù)據(jù)。將特征數(shù)據(jù)作為支持向量機(jī)訓(xùn)練和測試的數(shù)據(jù)。
4.1 實(shí)驗(yàn)設(shè)置
對(duì)三相異步電動(dòng)機(jī)驅(qū)動(dòng)的船用風(fēng)機(jī)進(jìn)行故障診斷實(shí)驗(yàn)。風(fēng)機(jī)相關(guān)參數(shù)見表1。
對(duì)風(fēng)機(jī)7種不同狀態(tài)下運(yùn)行的振動(dòng)數(shù)據(jù)進(jìn)行分析,故障設(shè)置見表2。
在經(jīng)典旋轉(zhuǎn)機(jī)械故障診斷中將機(jī)械回轉(zhuǎn)頻率相關(guān)倍頻作為特征值,但是復(fù)合故障和輕微故障的故障特征可能存在于其他頻域中,因此本文使用全頻域?qū)?yīng)的振幅作為特征值構(gòu)建訓(xùn)練集,每個(gè)頻率對(duì)應(yīng)一個(gè)特征值,保留每個(gè)頻率對(duì)應(yīng)的振幅大小。
使用磁吸式加速度傳感器,靈敏度和偏置電壓分別是10.20 mV/g和12.4 V,其中g(shù)為重力加速度。采樣頻率為1 652 Hz,每個(gè)樣本時(shí)長為2 s,對(duì)7種不同的故障分別在不同環(huán)境下進(jìn)行多次重復(fù)模擬實(shí)驗(yàn),共計(jì)得到2 460組實(shí)驗(yàn)數(shù)據(jù)。實(shí)驗(yàn)測點(diǎn)布置見圖3。
4.2 數(shù)據(jù)處理
風(fēng)機(jī)在7種運(yùn)行狀態(tài)下得到的振動(dòng)信號(hào)見圖4。
對(duì)得到的振動(dòng)信號(hào)采用快速傅里葉變換進(jìn)行特征提取,每個(gè)樣本在0~826 Hz的頻域下均得到1 652個(gè)特征。給2 460個(gè)樣本貼上故障編號(hào)作為標(biāo)簽,構(gòu)成故障模擬實(shí)驗(yàn)中故障診斷的數(shù)據(jù)集。圖5為對(duì)振動(dòng)信號(hào)進(jìn)行快速傅里葉變換后0~300 Hz的頻譜圖。
4.3 故障識(shí)別
在工程應(yīng)用中,訓(xùn)練數(shù)據(jù)往往比實(shí)測數(shù)據(jù)小。
為模擬實(shí)測數(shù)據(jù)的變化以及不確定性,實(shí)驗(yàn)中將數(shù)據(jù)集以1∶4的比例劃分為訓(xùn)練集和測試集。其中訓(xùn)練集包含492個(gè)學(xué)習(xí)樣本,測試集包含1 968個(gè)待測樣本,兩個(gè)訓(xùn)練集都包含1 652個(gè)特征。計(jì)算訓(xùn)練集中所有特征的相對(duì)混亂度歸一化值并由小到大排序,結(jié)果見圖6。由圖6可以看出,特征相對(duì)混亂度歸一化值分散在0.1~0.3內(nèi),而且大部分分布在0.15~0.20內(nèi)。對(duì)數(shù)值進(jìn)行分析可知,大多數(shù)特征對(duì)分類幫助不大,僅部分特征對(duì)分類有較大的幫助,比較符合機(jī)械故障診斷的實(shí)際情況。
使用第3節(jié)提出的方法訓(xùn)練一對(duì)多模型(基于特征選擇的支持向量機(jī)模型)。對(duì)于7個(gè)不同的類別訓(xùn)練7個(gè)二分類支持向量機(jī),組合成支持向量機(jī)集。所有分類器進(jìn)行i次訓(xùn)練,每次選擇不同的特征數(shù)量n,n=100i。對(duì)1 652組數(shù)據(jù)共進(jìn)行16次特征選擇。最后使用1 652組特征值對(duì)分類器進(jìn)行訓(xùn)練,對(duì)比特征篩選效果。使用訓(xùn)練好的分類器進(jìn)行故障識(shí)別,其識(shí)別準(zhǔn)確率與特征數(shù)量關(guān)系見圖7。
不進(jìn)行特征選擇而使用全部特征進(jìn)行訓(xùn)練的支持向量機(jī)識(shí)別準(zhǔn)確率為93.9%。當(dāng)只選取100個(gè)特征時(shí)識(shí)別準(zhǔn)確率為89.8%,隨著選取特征數(shù)量的增加識(shí)別準(zhǔn)確率也逐步提升。選取800個(gè)特征時(shí)識(shí)別準(zhǔn)確率達(dá)到93.95%,已經(jīng)超過了不進(jìn)行特征選擇的識(shí)別準(zhǔn)確率。當(dāng)選擇1 200個(gè)特征時(shí)識(shí)別準(zhǔn)確率達(dá)到了最高值94.46%。繼續(xù)增加特征數(shù)量會(huì)導(dǎo)致識(shí)別準(zhǔn)確率的降低,這主要是因?yàn)槭褂昧讼鄬?duì)混亂度歸一化值較大的特征。這些特征會(huì)對(duì)分類器造成一定干擾,削弱相關(guān)性較大特征的貢獻(xiàn),從而導(dǎo)致分類器識(shí)別準(zhǔn)確率降低。圖6的結(jié)果可以說明,經(jīng)過基于歸一化后的特征相對(duì)混亂度的特征選擇后,篩除了對(duì)分類器產(chǎn)生干擾的特征,提高了識(shí)別準(zhǔn)確率。同時(shí)使用特征選擇方法還可以在只使用較少特征的前提下進(jìn)行有效的故障識(shí)別,這對(duì)分類器模型的透明度和分類速度的提升有良好效果。
4.4 方法對(duì)比
為進(jìn)一步說明本文方法的有效性,分別使用模糊熵和歸一化后的特征相對(duì)混亂度分別訓(xùn)練基于特征選擇的支持向量機(jī)。為體現(xiàn)基于特征選擇的支持向量機(jī)訓(xùn)練方法充分利用了不同特征與不同標(biāo)簽的對(duì)應(yīng)關(guān)系,使用常規(guī)方法對(duì)多分類支持向量機(jī)進(jìn)行訓(xùn)練,對(duì)比本文提出方法的效果。數(shù)據(jù)集劃分和訓(xùn)練次數(shù)與前文相同。每種分類器的識(shí)別準(zhǔn)確率見圖8。
由圖8可以看出,使用相對(duì)混亂度進(jìn)行特征選擇的效果優(yōu)于模糊熵的。使用模糊熵進(jìn)行特征選擇時(shí),特征數(shù)量少于600時(shí)效果較差,無法有效進(jìn)行故障識(shí)別。而使用相對(duì)混亂度時(shí)特征數(shù)量達(dá)到400以上時(shí)即可維持85%以上的識(shí)別準(zhǔn)確率。尤其是本文提出的歸一化特征相對(duì)混亂度結(jié)合基于特征選擇的支持向量機(jī)的效果最為突出,僅使用100個(gè)特征識(shí)別準(zhǔn)確度依然接近90%。對(duì)比支持向量機(jī)和基于特征選擇的支持向量機(jī)時(shí)可以發(fā)現(xiàn),不論使用那種特征選擇方法,基于特征選擇的支持向量機(jī)的效果都優(yōu)于同參數(shù)下的多分類支持向量機(jī),也證明了第3節(jié)提出方法的有效性。
4.5 模型分類速度分析
對(duì)于船舶智能機(jī)艙系統(tǒng)來說,無論是故障診斷還是狀態(tài)監(jiān)測,在產(chǎn)生故障的第一時(shí)間進(jìn)行報(bào)警對(duì)避免事故是非常重要的,這就要求故障識(shí)別分類器具有較高的分類速度。提高模型的運(yùn)算速度也是特征選擇的另一個(gè)關(guān)鍵目標(biāo),數(shù)據(jù)維度也就是特征數(shù)量是影響分類器分類的一個(gè)指標(biāo)。本文對(duì)選取不同特征數(shù)量的分類器的分類速度進(jìn)行對(duì)比,結(jié)果見圖9。分類器的計(jì)算耗時(shí)與數(shù)據(jù)樣本特征數(shù)量呈正相關(guān)關(guān)系,篩除冗余的特征有利于加快分類器的分類速度,提高分類器效率。
從圖9可以看出,使用全部特征的分類器計(jì)算耗時(shí)大于500 ms,而進(jìn)行特征選擇后的分類器耗時(shí)均小于500 ms,其中在使用100個(gè)特征時(shí)計(jì)算耗時(shí)115.3 ms,相比使用全部特征的分類器,縮短了77.8%的計(jì)算耗時(shí)。在追求準(zhǔn)確率最高的前提下,特征數(shù)量定為1 200,計(jì)算耗時(shí)為482.2 ms,相比全部特征計(jì)算耗時(shí)縮短了17.59%??梢钥闯?,經(jīng)過特征選擇可以有效縮短分類器的計(jì)算耗時(shí),提高故障診斷速度,增加整體算法的實(shí)時(shí)性和有效性,使用特征提取方法對(duì)實(shí)現(xiàn)船舶風(fēng)機(jī)的狀態(tài)監(jiān)測與故障診斷有重要的作用。
就工程應(yīng)用而言,在本文數(shù)據(jù)和模型的前提下,基于對(duì)模型的不同要求可以對(duì)選擇的特征數(shù)量進(jìn)行調(diào)整。若精度優(yōu)先則可以選擇1 200個(gè)特征,達(dá)到94.46%的識(shí)別準(zhǔn)確率。若速度優(yōu)先則可以選擇100個(gè)特征,計(jì)算耗時(shí)為115.3 ms。若均衡考慮則可以選擇300個(gè)特征,在僅耗時(shí)172.6 ms的前提下達(dá)到93.5%的識(shí)別準(zhǔn)確率。
如圖1所示,在工程應(yīng)用中,特征選擇是圖中左半邊故障診斷模型訓(xùn)練的一個(gè)步驟。一旦完成特征選擇和分類器的訓(xùn)練,就可以開始對(duì)機(jī)械進(jìn)行狀態(tài)監(jiān)測。選擇較少的特征可以讓分類器在狀態(tài)監(jiān)測時(shí)使用更短的時(shí)間完成分類,識(shí)別故障,這有助于提升狀態(tài)監(jiān)測和故障預(yù)測報(bào)警的實(shí)時(shí)性。
5 結(jié) 論
以提高船舶機(jī)械狀態(tài)監(jiān)測的實(shí)時(shí)性和故障診斷的準(zhǔn)確性為目標(biāo)提出一種基于特征選擇的船舶機(jī)械智能狀態(tài)監(jiān)測與故障診斷方法,并以船舶風(fēng)機(jī)故障診斷為例對(duì)本文方法的有效性進(jìn)行驗(yàn)證。文中提出的基于特征選擇的支持向量機(jī)訓(xùn)練方法相比傳統(tǒng)的一對(duì)多支持向量機(jī),在特征選擇算法中有更高的準(zhǔn)確性,并且準(zhǔn)確率較為穩(wěn)定,在選擇的特征數(shù)量較少時(shí)仍能保證分類器的有效性。文中提出的故障診斷方法比現(xiàn)有方法在準(zhǔn)確率和分類速度上均有提升。在精度優(yōu)先的情況下可以達(dá)到94.46%的識(shí)別準(zhǔn)確率,在速度優(yōu)先的情況下可縮短77.8%的計(jì)算耗時(shí)。
綜上,本文提出的算法框架、特征選擇方法、基于特征選擇的支持向量機(jī)訓(xùn)練方法和智能故障診斷方法可以有效改進(jìn)現(xiàn)有算法,對(duì)船舶風(fēng)機(jī)的狀態(tài)監(jiān)測與故障診斷的實(shí)現(xiàn)有重要意義,對(duì)機(jī)艙中回轉(zhuǎn)機(jī)械設(shè)備的狀態(tài)監(jiān)測與故障診斷有一定參考價(jià)值。
參考文獻(xiàn):
[1]吳強(qiáng). 加快轉(zhuǎn)型升級(jí),推動(dòng)船舶工業(yè)在“中國制造2025”中率先實(shí)現(xiàn)突破[N]. 中國船舶報(bào), 2015-12-16(2). DOI: 10.28054/n.cnki.nccpb.2015.000176.
[2]蔣佳煒, 胡以懷, 方云虎, 等. 船舶動(dòng)力裝置智能故障診斷技術(shù)的應(yīng)用與展望[J]. 中國艦船研究, 2020, 15(1): 56-67. DOI: 10.19693/j.issn.1673-3185.01679.
[3]TAN Y H, ZHANG J D, TIAN H, et al. Multi-label classification for simultaneous fault diagnosis of marine machinery: a comparative study[J]. Ocean Engineering, 2021, 239: 109723. DOI: 10.1016/j.oceaneng.2021.109723.
[4]CHEN H T, JIANG B. A review of fault detection and diagnosis for the traction system in high-speed trains[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 21(2): 450-465. DOI: 10.1109/TITS.2019.2897583.
[5]HUANG R Y, LI W H, CUI L L. An intelligent compound fault diagnosis method using one-dimensional deep convolutional neural network with multi-label classifier[C]//2019 IEEE International Instrumentation and Measurement Technology Conference. IEEE, 2019: 1-6. DOI: 10.1109/I2MTC.2019.8827030.
[6]楊劍鋒, 喬佩蕊, 李永梅, 等. 機(jī)器學(xué)習(xí)分類問題及算法研究綜述[J]. 統(tǒng)計(jì)與決策, 2019, 35(6): 36-40. DOI: 10.13546/j.cnki.tjyjc.2019.06.008.
[7]雷亞國, 賈峰, 孔德同, 等. 大數(shù)據(jù)下機(jī)械智能故障診斷的機(jī)遇與挑戰(zhàn)[J]. 機(jī)械工程學(xué)報(bào), 2018, 54(5): 94-104. DOI: 10.3901/JME.2018.05.094.
[8]趙志宏. 基于振動(dòng)信號(hào)的機(jī)械故障特征提取與診斷研究[D]. 北京: 北京交通大學(xué), 2012.
[9]時(shí)培明, 梁凱, 趙娜, 等. 基于深度學(xué)習(xí)特征提取和粒子群支持向量機(jī)狀態(tài)識(shí)別的齒輪智能故障診斷[J]. 中國機(jī)械工程, 2017, 28(9): 1056-1061. DOI: 10.3969/j.issn.1004-132x.2017.09.009.
[10]劉建偉, 劉媛, 羅雄麟. 半監(jiān)督學(xué)習(xí)方法[J]. 計(jì)算機(jī)學(xué)報(bào), 2015, 38(8): 1592-1617. DOI: 10.11897/SP.J.1016.2015.01592.
[11]LOHRMANN C, LUUKKA P, JABLONSKA-SABUKA M, et al. A combination of fuzzy similarity measures and fuzzy entropy measures for supervised feature selection[J]. Expert Systems with Applications, 2018, 110: 216-236. DOI: 10.1016/j.eswa.2018.06.002.
[12]李郅琴, 杜建強(qiáng), 聶斌, 等. 特征選擇方法綜述[J]. 計(jì)算機(jī)工程與應(yīng)用, 2019, 55(24): 10-19. DOI: 10.3778/j.issn.1002-8331.1909-0066.
[13]LUUKKA P. Feature selection using fuzzy entropy measures with similarity classifier[J]. Expert Systems with Applications, 2011, 38: 4600-4607. DOI: 10.1016/j.eswa.2010.09.133.
[14]YU L, ZHOU R T, CHEN R D, et al. Missing data preprocessing in credit classification: one-hot encoding or imputation?[J]. Emerging Markets Finance and Trade, 2022, 58(2): 472-482. DOI: 10.1080/1540496X.2020.1825935.
[15]SUYKENS J A K, VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9: 293-300. DOI: 10.1023/A:1018628609742.
[16]SCHWENKER F. Hierarchical support vector machines for multi-class pattern recognition[C]//Fourth International Conference on Knowledge-Based Intelligent Engineering Systems and Allied Technologies. IEEE, 2000: 561-565. DOI: 10.1109/KES.2000.884111.
(編輯 賈裙平)
收稿日期: 2021-11-23
修回日期: 2022-03-17
基金項(xiàng)目: 上海市科技計(jì)劃(20DZ2252300)
作者簡介: 蔣佳煒(1992—),男,山西太原人,博士研究生,研究方向?yàn)榇皺C(jī)械設(shè)備智能故障診斷,(E-mail)83003599@qq.com;
胡以懷(1964—),男,江蘇高郵人,教授,博士,研究方向?yàn)榇皠?dòng)力裝置振動(dòng)分析、故障診斷和系統(tǒng)仿真,(E-mail)yhhu@shmtu.edu.cn
上海海事大學(xué)學(xué)報(bào)2023年1期