段禮祥 , 郭 晗, 2 , 王金江
(1.中國(guó)石油大學(xué)(北京) 機(jī)械與儲(chǔ)運(yùn)工程學(xué)院,北京 102249; 2.中國(guó)特種設(shè)備檢測(cè)研究院,北京 100013)
?
數(shù)據(jù)集不均衡下的設(shè)備故障程度識(shí)別方法研究
段禮祥1, 郭 晗1, 2, 王金江1
(1.中國(guó)石油大學(xué)(北京) 機(jī)械與儲(chǔ)運(yùn)工程學(xué)院,北京 102249; 2.中國(guó)特種設(shè)備檢測(cè)研究院,北京 100013)
在機(jī)械故障診斷中,由于故障樣本難以收集且數(shù)量遠(yuǎn)遠(yuǎn)少于正常樣本,即產(chǎn)生數(shù)據(jù)集不均衡問(wèn)題。這將導(dǎo)致傳統(tǒng)的分類算法如支持向量機(jī)(SVM)在處理不均衡分類問(wèn)題時(shí)對(duì)少數(shù)類樣本(故障樣本)的分類準(zhǔn)確率過(guò)低。加權(quán)支持向量機(jī)(C-SVM)算法是一種處理樣本集不均衡問(wèn)題的常用算法,可以在一定程度上改善少數(shù)類樣本的分類準(zhǔn)確率。但是在故障程度相近時(shí)會(huì)導(dǎo)致樣本間距過(guò)小,加權(quán)C-SVM算法對(duì)這類故障樣本的識(shí)別精度不理想。為提高數(shù)據(jù)集不均衡下故障程度相近樣本的分類準(zhǔn)確率,采用二叉樹結(jié)構(gòu)與加權(quán)C-SVM相結(jié)合的方法,綜合考慮樣本類間距離、類內(nèi)距離和不均衡程度,優(yōu)化二叉樹結(jié)構(gòu)。結(jié)果表明,該算法能夠有效處理樣本距離過(guò)近的不均衡數(shù)據(jù)集分類問(wèn)題,從而提高了故障程度相近樣本的分類準(zhǔn)確率。
故障診斷;故障程度識(shí)別;數(shù)據(jù)集不均衡;二叉樹加權(quán)支持向量機(jī)
轉(zhuǎn)子不平衡是旋轉(zhuǎn)機(jī)械中最常見(jiàn)的故障之一,正確識(shí)別轉(zhuǎn)子不平衡故障程度,是對(duì)設(shè)備進(jìn)行視情維修的前提條件[1-2]。在故障程度相近時(shí),不同類別的樣本相似度很高,且距離較近,在進(jìn)行分類時(shí)很容易將其誤分成其他類別。在工程實(shí)際中,故障樣本的數(shù)量遠(yuǎn)遠(yuǎn)少于正常樣本,并且當(dāng)準(zhǔn)備收集異常樣本時(shí),設(shè)備可能已經(jīng)無(wú)法運(yùn)行,即出現(xiàn)數(shù)據(jù)集不均衡問(wèn)題[3-4]。
SVM算法在針對(duì)小樣本、維數(shù)過(guò)高、非線性等問(wèn)題方面具有明顯的優(yōu)勢(shì),因此在近些年發(fā)展非常迅速[5-6]。但是,在處理不均衡數(shù)據(jù)集分類問(wèn)題時(shí),傳統(tǒng)SVM算法以樣本的整體分類準(zhǔn)確率為評(píng)價(jià)準(zhǔn)則,分類超平面會(huì)朝著少數(shù)類樣本方向移動(dòng),忽略少數(shù)類樣本,且在多數(shù)類樣本內(nèi)產(chǎn)生過(guò)擬合[7-8]。針對(duì)這一問(wèn)題,文獻(xiàn)[7]提出了一種加權(quán)C-SVM算法,研究懲罰參數(shù)C的選擇方式,降低了樣本的誤分率。文獻(xiàn)[8]根據(jù)正負(fù)類樣本數(shù)量確定懲罰參數(shù)C,并將改進(jìn)后的C-SVM算法與KNN欠抽樣算法相結(jié)合,取得了良好的效果。
上述文獻(xiàn)都證明加權(quán)C-SVM算法可以提高不均衡數(shù)據(jù)集中少數(shù)類樣本的分類準(zhǔn)確率,但是在故障程度相近時(shí),不同類別的樣本相似度很高,且容易出現(xiàn)邊界混疊現(xiàn)象,利用加權(quán)參數(shù)移動(dòng)分類面可能會(huì)導(dǎo)致某類樣本分類準(zhǔn)確率過(guò)低。針對(duì)這一問(wèn)題,本文采用一種二叉樹加權(quán)支持向量機(jī)算法,在進(jìn)行樣本加權(quán)時(shí)綜合考慮樣本的類間距離、類內(nèi)距離以及不均衡程度,確定二叉樹結(jié)構(gòu),并采用該方法識(shí)別5種不同程度的轉(zhuǎn)子不平衡故障樣本。
1.1 加權(quán)支持向量機(jī)
加權(quán)C-SVM算法是在SVM算法的基礎(chǔ)上,針對(duì)樣本的大小、重要度等特點(diǎn)引入不同的權(quán)重,其優(yōu)化問(wèn)題可以表示成如下形式[7]:
(1)
式中:si表示第i類樣本的權(quán)重。式(1)的含義是通過(guò)給不同種類樣本賦予不同的權(quán)重,改變樣本的懲罰參數(shù),進(jìn)而補(bǔ)償類別不均衡所帶來(lái)的影響。
計(jì)算加權(quán)參數(shù)si的一種最基本方法是計(jì)算每種樣本與占樣本總數(shù)的比例,取倒數(shù)作為該類樣本的加權(quán)參數(shù),可以得出:
(2)
式中:ni代表第i類樣本數(shù),m代表樣本種類。
在進(jìn)行故障程度識(shí)別時(shí),希望故障程度越大的樣本識(shí)別的錯(cuò)誤率越低,因此,要給其賦予較大的懲罰參數(shù)。加權(quán)C-SVM算法中法分類函數(shù)為:
(3)
式中:αi表示拉格朗日算子。在尋找最優(yōu)解時(shí),若αi=0,則對(duì)應(yīng)的訓(xùn)練樣本稱作支持向量;若αi=C,則對(duì)應(yīng)的樣本稱作邊界支持向量;若0<αi 1.2 二叉樹加權(quán)支持向量機(jī) 二叉樹加權(quán)支持向量機(jī)由多個(gè)二分類加權(quán)支持向量機(jī)組成,每個(gè)節(jié)點(diǎn)的分類器按照屬性結(jié)構(gòu)排列。二叉樹算法比一對(duì)一分類算法需要訓(xùn)練的子分類器數(shù)目更少,且能夠避免一對(duì)一方法中產(chǎn)生的不可分區(qū)域,并且由于每一級(jí)分類器訓(xùn)練樣本數(shù)目在逐漸減少,因此可以提高運(yùn)行效率,縮短運(yùn)行時(shí)間。但是二叉樹加權(quán)支持向量機(jī)分類算法存在誤差累計(jì)問(wèn)題,即上層節(jié)點(diǎn)產(chǎn)生的分類錯(cuò)誤會(huì)一直延續(xù)下去,導(dǎo)致下層節(jié)點(diǎn)的分類誤差較大。因此,必須確保上層節(jié)點(diǎn)的分類器的性能最優(yōu),在確定二叉樹結(jié)構(gòu)時(shí)應(yīng)該首先識(shí)別最容易區(qū)分的類別[9-10]。本文綜合考慮類間距離與類內(nèi)距離確定二叉樹結(jié)構(gòu),再根據(jù)樣本分布范圍與樣本不均衡度確定加權(quán)參數(shù)。 (5) 式中::ni表示第i類樣本中的樣本個(gè)數(shù),xj表示將該類樣本中的任意樣本點(diǎn)。可以得出整個(gè)樣本集內(nèi)任意點(diǎn)xk到該類樣本中心距離為: (6) 類間距離表示的是兩類樣本中心點(diǎn)間的距離,不能代表樣本的可分離度,因此需要進(jìn)一步進(jìn)行計(jì)算,第i類樣本的類內(nèi)距離可以表示為: (7) 根據(jù)文獻(xiàn)[11],可以推出分離性測(cè)度公式表示如下: (8) 式中:i和j分別表示第i類樣本和第j類樣本。Sij越大,證明兩類樣本的可分離性越好,在建立二叉樹支持向量機(jī)分類器時(shí),應(yīng)該在越上層。 1.3 粒子群優(yōu)化算法 粒子群優(yōu)化算法的原理是模擬鳥類的捕食行為,鳥類在捕食的時(shí)候,會(huì)搜索當(dāng)前最近的食物區(qū)域。通過(guò)鳥類捕食行為的啟發(fā),PSO算法中將問(wèn)題的潛在解用不同的粒子來(lái)表示,通過(guò)合適的適應(yīng)度函數(shù)確定各個(gè)粒子的適應(yīng)度值。PSO算法是一種并行的隨機(jī)搜索算法,可以實(shí)現(xiàn)對(duì)整個(gè)解空間的搜索,并且該算法具有控制參數(shù)少、算法簡(jiǎn)單等優(yōu)點(diǎn),因而一經(jīng)提出便獲得了廣泛的關(guān)注。 假設(shè)PSO種群大小為n,用Pi表示種群中第i個(gè)粒子的位置,Vi表示速度,fitnessi表示適應(yīng)度值。則基于PSO的尋優(yōu)算法步驟可以描述如下:① 初始化種群中的粒子位置和速度,粒子位置Pi,速度Vi隨機(jī)初始化;② 根據(jù)目標(biāo)函數(shù)計(jì)算粒子適應(yīng)度值fitnessi;③ 循環(huán)迭代,尋找個(gè)體極值Pbest和群體極值Gbest;④ 滿足條件,終止循環(huán),算法結(jié)束。 2.1 轉(zhuǎn)子振動(dòng)信號(hào)特征提取 本次實(shí)驗(yàn)采用美國(guó)本特利公司生產(chǎn)的RK4系列轉(zhuǎn)子振動(dòng)試驗(yàn)臺(tái),轉(zhuǎn)子系統(tǒng)由調(diào)速臺(tái)、電機(jī)、轉(zhuǎn)軸、雙圓盤、軸承、基座等組成,最大速度10 000 r/min。采樣精度24 Bit,采樣頻率16 000 Hz,采樣長(zhǎng)度25段(每段為1 024點(diǎn)),轉(zhuǎn)速為 6 230 r/min。通過(guò)在轉(zhuǎn)子圓盤上加裝不同質(zhì)量的配重螺釘來(lái)模擬不同程度的不平衡故障,本實(shí)驗(yàn)加裝了質(zhì)量為0.3 g, 0.5 g, 0.8 g, 1.0 g的4種配重螺釘,采集包括正常信號(hào)在內(nèi)的五種樣本。采用MF-DFA方法對(duì)每段數(shù)據(jù)進(jìn)行分析,提取出αmax、αmin、α0、Δf四種特征參數(shù),圖1(a)~1(d)所示為每種特征參數(shù)對(duì)應(yīng)的分布圖。 圖1 αmax、αmin、α0、Δf特征參數(shù)變化曲線圖Fig.1 Curves of αmax,αmin,α0 and Δf features 由圖1可以看出,針對(duì)轉(zhuǎn)子不平衡信號(hào),特征參數(shù)αmax和α0能夠較好地區(qū)分出5種故障程度,而其他指標(biāo)均出現(xiàn)不同程度的混疊。αmax與α0兩種特征參數(shù)只有個(gè)別點(diǎn)出現(xiàn)混疊,并且兩組參數(shù)中混疊的樣本點(diǎn)不同,因此本文采用αmax和α0兩種特征參數(shù)結(jié)合共同作為特征向量,并進(jìn)行歸一化處理,形成原始特征集。 2.2 轉(zhuǎn)子故障程度識(shí)別 由于RBF核函數(shù)能夠解決樣本特征與類別標(biāo)簽之間的非線性問(wèn)題,并且計(jì)算起來(lái)較為簡(jiǎn)單,因此本文選用RBF核函數(shù)。采用RBF核函數(shù)的加權(quán)C-SVM算法有C和γ兩個(gè)參數(shù)需要確定。采用的數(shù)據(jù)分析工具是Matlab2013和libsvm工具箱,表1描述了這些數(shù)據(jù)的基本特性參數(shù)。 將原始數(shù)據(jù)集中任取一組數(shù)據(jù)作為測(cè)試樣本,其余149組數(shù)據(jù)作為訓(xùn)練樣本,循環(huán)測(cè)試150次。分別采用傳統(tǒng)SVM算法和加權(quán)C-SVM算法對(duì)測(cè)試樣本進(jìn)行分類,分類結(jié)果如圖2(a)和2(b)所示,圖中縱坐標(biāo)代表樣本實(shí)際類別,橫坐標(biāo)代表樣本預(yù)測(cè)類別,不同的顏色代表不同的分類準(zhǔn)確率,即0%~100%。通過(guò)對(duì)比可以看出,傳統(tǒng)的SVM多分類方法分類結(jié)果偏向多數(shù)類樣本,即圖2(a)中分類結(jié)果集中在1、2、3類,第4、5類樣本因?yàn)閿?shù)據(jù)的數(shù)量較少被分類器忽略。觀察圖2(b)可以發(fā)現(xiàn),將樣本集賦予不同的權(quán)重后,第4、5類樣本分類準(zhǔn)確率明顯提高,證明分類面的傾斜情況有所好轉(zhuǎn)。 圖2 SVM、加權(quán)C-SVM、PSO-CSVM、PSO-BT-CSVM算法分類結(jié)果Fig.2 Classification results of SVM、weighted C-SVM、PSO-CSVM and PSO-BT-CSVM 引入加權(quán)C-SVM算法后,雖然對(duì)分類結(jié)果的分布起到一定的改善,但是并未完全解決少數(shù)類樣本的識(shí)別問(wèn)題,即第4類樣本有25%被誤分為第3類樣本。分析原因可能有以下2點(diǎn):① 在建立分類模型時(shí)沒(méi)有對(duì)參數(shù)進(jìn)行優(yōu)化,可能造成C和γ不夠適合,進(jìn)而導(dǎo)致分類結(jié)果不夠理想。② 本文中采用的數(shù)據(jù)是故障程度相近的5組轉(zhuǎn)子不平衡數(shù)據(jù),因此特征指標(biāo)相似度較高,且隨著樣本個(gè)數(shù)的減少,很可能出現(xiàn)正類樣本特征完全被負(fù)類樣本包圍的情況。引入加權(quán)C-SVM算法,調(diào)整懲罰參數(shù)后雖然樣本分布情況得到了改善,但是引入不同的權(quán)重僅僅改變了樣本的相對(duì)重要性,對(duì)每類樣本的分布情況沒(méi)有做充分地考慮,在樣本距離較近,邊界不明顯的情況下難以得到理想結(jié)果。 表1 數(shù)據(jù)集描述 針對(duì)第一種假設(shè),引入粒子群優(yōu)化算法優(yōu)化參數(shù)C和γ,得到分類結(jié)果如圖2(c)所示??梢园l(fā)現(xiàn),各類樣本的分類準(zhǔn)確率均有所提高,證明參數(shù)是否優(yōu)化是影響加權(quán)C-SVM分類器結(jié)果的一個(gè)因素。但是第4類樣本仍存在15%的樣本點(diǎn)被誤分為第3類樣本,因此需要進(jìn)一步分析該類樣本的數(shù)據(jù)特點(diǎn),找出影響分類結(jié)果的因素。前文提到根據(jù)樣本的不均程度衡度確定樣本的權(quán)值分布不能反映出樣本的分布特性,樣本距離較近,邊界不明顯的情況會(huì)影響加權(quán)C-SVM的分類效果。針對(duì)這一問(wèn)題,對(duì)5種樣本的類內(nèi)距離、類間距離和不均衡程度進(jìn)行綜合分析,引入二叉樹加權(quán)支持向量機(jī)算法進(jìn)行識(shí)別。首先要根據(jù)公式(5)~(8)計(jì)算出每種樣本與其他樣本之間的可分離度,可以得到表2。 表2 故障樣本可分離度 由表2可知,第4類樣本與第3類樣本的可分離度最小,解釋了第四類樣本容易被誤分的原因。因此,可以將第3、4類樣本最后識(shí)別,避免其對(duì)其他類別的樣本造成干擾。計(jì)算其他三種樣本的平均可分離度為0.653 0、0.499 9、0.551 0,可以確定二叉樹分類器的分離順序?yàn)?.0、1.0、0.3、0.5、0.8。由于本文討論的是不均衡數(shù)據(jù)集分類情況,按照可分離度來(lái)構(gòu)建二叉樹支持向量機(jī)分類模型,第二節(jié)點(diǎn)分類器將面臨樣本極度不均衡的情況,即正類樣本不均衡程度為1∶9,這種情況很容易使正類樣本淹沒(méi)在負(fù)類樣本中,導(dǎo)致正類樣本無(wú)法識(shí)別。為了改善每個(gè)子分類器的分類效果,確保少數(shù)類樣本的識(shí)別精度,將加權(quán)C-SVM與二叉樹方法箱結(jié)合,構(gòu)建基于不均衡樣本集的BT-CSVM算法。采用樣本不均衡度與樣本類半徑相乘得到權(quán)重指標(biāo),確定每個(gè)節(jié)點(diǎn)加權(quán)C-SVM分類器的樣本權(quán)重,計(jì)算結(jié)果如表3所示。 表3 故障樣本分布指標(biāo) 構(gòu)造分類器的節(jié)點(diǎn),利用PSO算法優(yōu)化參數(shù)C和γ,圖2(d)表示PSO-BT-CSVM算法的分類結(jié)果。證明該方法針對(duì)樣本類間距離較小的不均衡數(shù)據(jù)集分類效果由于傳統(tǒng)的多分類加權(quán)C-SVM算法,具體分類準(zhǔn)確率如表4所示。 表4 SVM、C-SVM、PSO-CSVM、 對(duì)比表4中各種算法,可見(jiàn)加權(quán)C-SVM算法能夠改善少數(shù)類樣本的識(shí)別精度,但是參數(shù)的優(yōu)化程度和樣本的可分離度會(huì)對(duì)結(jié)果產(chǎn)生影響。經(jīng)過(guò)PSO算法優(yōu)化后第4類樣本識(shí)別精度有所提高。PSO-BT-CSVM算法在識(shí)別分離度較小的樣本集上有明顯的優(yōu)勢(shì),并且總體分類準(zhǔn)確率達(dá)到了98%,因此可以得出結(jié)論,PSO-BT-CSVM算法在識(shí)別故障程度相近的數(shù)據(jù)集時(shí)具有明顯優(yōu)勢(shì)。 傳統(tǒng)SVM算法在進(jìn)行故障診斷時(shí)沒(méi)有考慮樣本的不均衡問(wèn)題,導(dǎo)致故障樣本分類準(zhǔn)確率偏低?;跇颖静痪獬潭鹊募訖?quán)C-SVM算法能夠改善分類器的少數(shù)類樣本識(shí)別效果,但是降低了多數(shù)類樣本的分類準(zhǔn)確率,并且在處理相近故障程度識(shí)別問(wèn)題時(shí)分類結(jié)果不理想。本文提出了一種二叉樹加權(quán)C-SVM算法,提高了故障程度相近樣本的分類準(zhǔn)確率。 (1) 加權(quán)C-SVM算法中懲罰參數(shù)C和核函數(shù)參數(shù)γ的選用直接影響算法的分類準(zhǔn)確率。通過(guò)PSO算法尋找合適的C和γ可以明顯提高樣本的分類準(zhǔn)確率,但樣本相似度高、類間距離小的情況下分類效果仍然不夠理想。 (2) 引入樣本可分離度概念,解釋相近故障程度的樣本容易錯(cuò)分的原因。采用二叉樹結(jié)構(gòu)與加權(quán)C-SVM算法相結(jié)合的方式,綜合考慮樣本可分離度與樣本不均衡度2種參數(shù)確定加權(quán)參數(shù),實(shí)例中該方法將類間距離過(guò)小的兩類樣本分類準(zhǔn)確率分別提高6.7和10個(gè)百分點(diǎn),而全部樣本分類準(zhǔn)確率也提高了2.7個(gè)百分點(diǎn)。 [1] 張龍, 黃文藝, 熊國(guó)良. 基于多尺度熵的滾動(dòng)軸承故障程度評(píng)估[J].振動(dòng)與沖擊, 2014,33(9): 185-189. ZHANG Long, HUANG Wenyi, XIONG Guoliang. Assessment of rolling element bearing fault severity using multi-scale entropy[J].Journal of Vibration and Shock,2014,33(9): 185-189. [2] 江瑞龍, 陳進(jìn), 劉韜, 等. 設(shè)備性能退化評(píng)估在巡檢系統(tǒng)中的應(yīng)用[J]. 振動(dòng)與沖擊,2012, 31(16): 134-137. JIANG Ruilong, CHEN Jin, LIU Tao, et al. Performance degradation assessment with the application of patrol inspection system[J]. Journal of Vibration and Shock, 2012,31(16): 134-137. [3] 陶新民, 劉福榮, 童智靖, 等. 不均衡數(shù)據(jù)下基于SVM的故障檢測(cè)新算法[J]. 振動(dòng)與沖擊, 2010,29(12):8-12. TAO Xinmin, LIU Furong, TONG Zhijing, et al. A new fault detection method of unbalanced data based on SVM[J]. Journal of Vibration and Shock, 2010, 29(12):8-12. [4] 姚培, 王仲生, 姜洪開(kāi), 等. 不均衡數(shù)據(jù)下基于CS-Boosting的故障診斷算法[J]. 振動(dòng)、測(cè)試與診斷, 2013, 33(1):111-115. YAO Pei, WANG Zhongsheng, JIANG Hongkai, et al. Fault diagnosis method based on CS-boosting for unbalanced training data[J]. Journal of Vibration, Measurement & Diagnosis, 2013, 33(1):111-115. [5] PAHLO C, EVA A, JOSE B, et al. Multiclass support vector machines with example—dependent costs applied to plankton biomass estimation[J]. IEEE Transaction on Neural Networks and Learning Systems, 2013,24(11):1901-1905. [6] 石志標(biāo), 苗瑩. 基于FOA-SVM的汽輪機(jī)振動(dòng)故障診斷[J].振動(dòng)與沖擊, 2014,33(22): 111-114. SHI Zhibiao, MIAO Ying. Vibration fault diagnosis for steam turbine by using support vector machine based on fruit fly optimization algorithm[J]. Journal of Vibration and Shock, 2014,33(22): 111-114. [7] WANG Xiping, TAN Wenxue, WU Huarui. An innovative SVM for wheat seed quality estimation[J]. Journal of Information & Computational Science, 2015,12(1): 223-233. [8] 劉進(jìn)軍. 基于懲罰的SVM和集成學(xué)習(xí)的非平衡數(shù)據(jù)分類算法研究[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2014,31(1): 186-190. LIU Jinjun. Research onclassificating unbalanced data based on penalty-based SVM and ensemble learning[J]. Computer Applications and Software, 2014,31(1): 186-190. [9] 趙海洋, 徐敏強(qiáng), 王金東. 改進(jìn)二叉樹支持向量機(jī)及其故障診斷方法研究[J].振動(dòng)工程學(xué)報(bào), 2013,26(5):764-769. ZHAO Haiyang, XU Minqiang, WANG Jindong. An improved binary tree SVM and application for fault diagnosis[J]. Journal of Vibration Engineering, 2013,26(5):764-769. [10] LIU Xiaofeng, LIN Bo. Identification of resonance states of rotor-bearing system using RQA and optimal binary tree SVM[J]. Neurocomputing, 2015,152:36-44. [11] 許永建. 變壓器故障診斷技術(shù)研究[D]. 南京:南京理工大學(xué), 2010. A mechanical fault severity identification method under unbalanced datasets DUAN Lixiang1, GUO Han1,2, WANG Jinjiang1 (1. School of Mechanical and Transportation Engineering, China University of Petroleum, Beijing 102249, China;2. China Special Equipment Inspection and Research Institute, Beijing 100013, China) In mechanical fault diagnosis, the samples under fault condition are often difficult to obtain, which is the called unbalanced dataset issue. This leads to very low classification accuracy for the conventional algorithm, such as support vector machine (SVM). Weighted C-support vector machine shows improved performance, however, due to the small sample space caused by close fault severities, the classification accuracy of weighted C-support vector machine is still not high enough. To improve the classification accuracy for close fault severity cases under unbalanced dataset, this paper presented an approach integrating weighted C-support vector machine algorithm with binary tree structure, named as BT-CSVM. The binary structure was then optimized taking account of sample space of class-to-class, sample space of inter-class, and unbalance degree. Experimental results show that the proposed method can effectively deal with the unbalanced dataset problem by improving the classification accuracy for close fault severity cases. fault diagnosis; fault severity identification; unbalanced data; binary tree weighted C-support SVM 國(guó)家自然科學(xué)基金項(xiàng)目(51005247);中國(guó)石油大學(xué)(北京)科研基金資助(2462015YQ0403;2462014YJRC039) 2015-07-10 修改稿收到日期:2015-10-15 段禮祥 男,副教授,1969年10月生 TH17 A 10.13465/j.cnki.jvs.2016.20.0292 故障診斷應(yīng)用
3 結(jié) 論