梅檢民,趙慧敏,肖云魁,周 斌
(1.軍事交通學(xué)院汽車(chē)工程系,天津 300161; 2.天津大學(xué)機(jī)械工程學(xué)院,天津 300072)
?
2015021
基于多分類(lèi)支持向量機(jī)和D-S證據(jù)理論的軸承故障診斷
梅檢民1,2,趙慧敏1,肖云魁1,周 斌2
(1.軍事交通學(xué)院汽車(chē)工程系,天津 300161; 2.天津大學(xué)機(jī)械工程學(xué)院,天津 300072)
針對(duì)支持向量機(jī)(SVM)硬判定輸出分類(lèi)結(jié)果缺乏定量評(píng)價(jià)的問(wèn)題,提出了一種多分類(lèi)SVM后驗(yàn)概率建模的改進(jìn)方法。通過(guò)引入D-S證據(jù)理論,得到多分類(lèi)SVM在D-S證據(jù)理論識(shí)別框架下的基本概率分配,使樣本在分類(lèi)時(shí)同時(shí)具有定性解釋和定量評(píng)價(jià)。接著,將多源信息送入SVM之后在決策級(jí)對(duì)多個(gè)SVM分類(lèi)輸出進(jìn)行證據(jù)融合,以提高診斷精度。最后,將該方法應(yīng)用于軸承故障的診斷中。結(jié)果表明,該方法能正確分類(lèi)采用單源信息時(shí)所錯(cuò)分樣本,降低識(shí)別的整體誤差,顯著提高故障診斷的準(zhǔn)確性。
故障診斷;支持向量機(jī);后驗(yàn)概率;D-S證據(jù)理論;信息融合
機(jī)械故障樣本獲取困難,限制了人工神經(jīng)網(wǎng)絡(luò)在機(jī)械故障模式分類(lèi)中的應(yīng)用。20世紀(jì)90年代初由Vapnik等人提出的支持向量機(jī)(support vector machine, SVM)能夠在訓(xùn)練樣本較少的情況下得到較強(qiáng)的分類(lèi)推廣能力,較好地解決了小樣本、非線(xiàn)性和高維數(shù)等模式識(shí)別問(wèn)題[1]。然而傳統(tǒng)SVM不提供概率輸出,在進(jìn)行樣本分類(lèi)學(xué)習(xí)時(shí),只考慮兩種極端情況,即屬于某一類(lèi)的概率為1或0,因此SVM對(duì)故障模式識(shí)別的不確定性問(wèn)題缺乏識(shí)別結(jié)果的準(zhǔn)確性解釋[2]。D-S證據(jù)理論引入了信任函數(shù),滿(mǎn)足比概率論弱的公理,并能區(qū)分不確定性的差異。D-S證據(jù)理論作為一種不確定性推理方法,利用多源冗余信息進(jìn)行融合,可以有效提高推理準(zhǔn)確度,在故障診斷領(lǐng)域受到越來(lái)越多的關(guān)注[3]。本文中提出多分類(lèi)SVM后驗(yàn)概率輸出建模方法,并將其與D-S證據(jù)理論相結(jié)合,對(duì)軸承故障進(jìn)行融合診斷,提高診斷精度和準(zhǔn)確率。
1.1 二分類(lèi)SVM后驗(yàn)概率輸出
Wahha和Platt最早在二分類(lèi)SVM方法中引入后驗(yàn)概率,通過(guò)樣本的后驗(yàn)概率來(lái)確定樣本的類(lèi)別,使樣本在分類(lèi)時(shí)不僅具有定性解釋?zhuān)揖哂卸吭u(píng)價(jià)。SVM的標(biāo)準(zhǔn)輸出[4]為
(1)
支持向量到分類(lèi)面之間的距離記為
dsvm=1/‖ω‖
(2)
則任意樣本點(diǎn)x到分類(lèi)面之間的距離為
dx=f(x)/‖ω‖
(3)
從SVM分類(lèi)超平面的幾何角度,可通過(guò)樣本與最優(yōu)分類(lèi)面間距離的遠(yuǎn)近來(lái)定量評(píng)價(jià)分類(lèi)問(wèn)題中的樣本屬于所在類(lèi)可能性的大小,即后驗(yàn)概率。由式(2)和式(3)得出f(x)=dx/dsvm,f(x)反映了樣本x經(jīng)非線(xiàn)性映射至高維隱空間的最優(yōu)分類(lèi)超平面的相對(duì)代數(shù)距離,反映了對(duì)類(lèi)別的相對(duì)支持程度。
概率輸出函數(shù)須滿(mǎn)足兩個(gè)條件:(1)函數(shù)的值域?yàn)閇0,1];(2)函數(shù)滿(mǎn)足單調(diào)性。Platt提出將后驗(yàn)概率視為sigmoid函數(shù),將SVM的輸出fi(x)映射到[0,1],后驗(yàn)概率輸出形式[5]為
(4)
(5)
式中:i=1,2,…,l;yi為樣本的類(lèi)別標(biāo)簽。
1.2 多分類(lèi)SVM后驗(yàn)概率輸出
(6)
式中:pij(i|j;x)表示由第i類(lèi)和第j類(lèi)構(gòu)成的兩類(lèi)分類(lèi)器計(jì)算所得x屬于第i類(lèi)的后驗(yàn)概率。
(7)
簡(jiǎn)記pi=p(i|x),p(i|j)=pij(i|j,x),式(7)可以整理為
(8)
式中p(i|j)=1-p(j|i),同時(shí)滿(mǎn)足約束條件:
(9)
求解方程組,可以得到樣本x在各類(lèi)中的后驗(yàn)概率pi。式(6)和式(8)組合為一個(gè)超定方程組,其系數(shù)矩陣的列向量組線(xiàn)性無(wú)關(guān),得到的最小二乘解是唯一的。
設(shè)Θ為識(shí)別框架,若集函數(shù)m:2θ→[0,1](2θ為Θ的冪集)滿(mǎn)足
(1) 不可能事件的基本概率為0,即:m(φ)=0;
u(Θ)=Pls(A)-Bel(A)
(10)
[Bel(A),Pls(A)]稱(chēng)為置信區(qū)間,表示對(duì)A的不確定區(qū)間。
設(shè)Bel1和Bel2是基于同一識(shí)別框架Θ的兩個(gè)置信度函數(shù),m1和m2分別是對(duì)應(yīng)的基本可信數(shù),焦元分別為A1,A2,…,AK和B1,B2,…,BL,并假設(shè)
(11)
合成后的基本概率分配函數(shù)m:2θ→[0,1]則為
(12)
從式(12)可以看出,多個(gè)證據(jù)的合成與次序無(wú)關(guān),多個(gè)證據(jù)的合成計(jì)算可以用兩個(gè)證據(jù)合成的計(jì)算遞推得到。
3.1 后驗(yàn)概率的BPA輸出
Platt給出的仿真結(jié)論表明:式(4)的概率輸出模型并沒(méi)有明顯提高分類(lèi)器的識(shí)別精度,而是與原SVM精度相近[8]。其原因在于sigmoid函數(shù)只是將SVM的輸出映射到[0,1],并沒(méi)有真正反映樣本的后驗(yàn)概率。因此SVM的后驗(yàn)概率輸出更符合證據(jù)理論框架下的基本概率分配,首先將其轉(zhuǎn)換為證據(jù)理論識(shí)別框架下的基本概率分配函數(shù)BPA。
定理:如果一組訓(xùn)練樣本能夠被一個(gè)最優(yōu)分類(lèi)面或廣義最優(yōu)分類(lèi)面分開(kāi),則對(duì)于測(cè)試樣本分類(lèi)錯(cuò)誤率期望的上界是訓(xùn)練樣本中平均的支持向量占總訓(xùn)練樣本數(shù)的比例[9]:
E(Perror)≤E(nsv)/(N2-1)
(13)
式中:N2表示訓(xùn)練樣本的總數(shù);E(nsv)表示支持向量個(gè)數(shù)的平均值。一個(gè)SVM分類(lèi)器的上限正好反映了SVM對(duì)樣本x的不確知性,即識(shí)別框架的u(Θ)。由此得到多分類(lèi)SVM證據(jù)理論識(shí)別框架下的基本概率分配
mi(x)=pi(1-E(Perror)),i=1,2,…,M
(14)
mΘ=E(Perror)
(15)
3.2 融合決策
診斷決策層采用D-S證據(jù)理論推理方法,通過(guò)對(duì)同一識(shí)別框架上的各證據(jù)體進(jìn)行融合推理,最終形成決策結(jié)果。作用到框架上的證據(jù)體由特征診斷層輸出結(jié)果組成。采用如下方法進(jìn)行判定:如果x點(diǎn)滿(mǎn)足m+(x)>m-(x),m+(x)-m-(x)>ε1,m(Θ)<ε2,則把x判為正類(lèi),反之為負(fù)類(lèi)。其中ε1的選取參照Platt基于SVM概率輸出判定的做法,取ε1=0;ε2的選取考慮無(wú)法分類(lèi)時(shí)的極限情況:當(dāng)f(x)=-B/A時(shí),SVM無(wú)法做出判定,此時(shí)m+(x)=m-(x)=1/2(1-E(Perror)),多個(gè)SVM局部決策進(jìn)行融合時(shí),取多個(gè)SVM的最小值ε2=min{(1-ESVM1(Perror))/2,(1-ESVM2(Perror))/2,…,(1-ESVMN3(Perror))/2},其中N3為SVM的個(gè)數(shù)。
采用上述方法對(duì)軸承故障進(jìn)行診斷,對(duì)象為發(fā)動(dòng)機(jī)第3缸前后兩道曲軸軸承和第3缸連桿軸承。曲軸軸承配合間隙分別設(shè)置為0.08mm(正常)、0.20mm(輕微磨損)、0.40mm(嚴(yán)重磨損),連桿軸承間隙設(shè)置為0.07mm(正常)、0.1mm(輕微磨損)、0.2mm(嚴(yán)重磨損),對(duì)應(yīng)曲軸軸承和連桿軸承皆正常、曲軸軸承輕微異響、曲軸軸承嚴(yán)重異響、連桿軸承輕微異響、連桿軸承嚴(yán)重異響5種工作狀態(tài)。振動(dòng)傳感器分別放置在第3缸頂部、缸體右側(cè)、油底與缸體結(jié)合處右側(cè),如圖1所示。
經(jīng)反復(fù)試驗(yàn)確定發(fā)動(dòng)機(jī)轉(zhuǎn)速為1 300r/min時(shí)故障特征最明顯,采集該轉(zhuǎn)速下不同位置傳感器的振動(dòng)信號(hào)。對(duì)各通道信號(hào)分別進(jìn)行4層db2小波包分解,再對(duì)分解后各頻段的時(shí)域序列重構(gòu)信號(hào)進(jìn)行AR譜分析。為便于數(shù)據(jù)分析,將分解重構(gòu)后柴油機(jī)加速振動(dòng)信號(hào)的頻率歸一化,分為16段,各頻段所代表的實(shí)際頻率如表1所示。選取訓(xùn)練樣本和測(cè)試樣本各10組,每種技術(shù)狀態(tài)對(duì)應(yīng)兩個(gè)樣本,如表2和表3所示。表中,A-E4,1、A-E4,2、A-E4,3、B-E4,1、B-E4,2、B-E4,3、C-E4,1、C-E4,2、C-E4,3分別表示A、B、C 3處加速振動(dòng)信號(hào)進(jìn)行小波包AR譜分析后的2、3、4頻段能量。
表1 16個(gè)頻率分段代表的實(shí)際頻率范圍
表2 SVM模型訓(xùn)練樣本
表3 SVM模型檢驗(yàn)樣本
用表2樣本中不同傳感器的數(shù)據(jù)分別進(jìn)行訓(xùn)練,得到3個(gè)SVM分類(lèi)器,將表3樣本輸入3個(gè)不同的分類(lèi)器,并采用式(6)~式(9)算法求得各個(gè)SVM的后驗(yàn)概率輸出,如表4所示。
表4 測(cè)試樣本的SVM后驗(yàn)概率輸出
由表4陰影部分可知,有5個(gè)樣本被錯(cuò)分。為提高識(shí)別精度,將3個(gè)SVM的輸出結(jié)果進(jìn)行D-S融合。首先按式(13)~式(15)得到錯(cuò)分樣本的BPA,如表5所示。接著按照式(12)算法融合,得到融合診斷結(jié)果如表6所示。
表5 錯(cuò)分的測(cè)試樣本證據(jù)體的基本概率分配
表6 錯(cuò)分測(cè)試樣本的證據(jù)合成
從表4、表5和表6可以看出,證據(jù)融合后的診斷結(jié)果準(zhǔn)確度達(dá)到了100%,對(duì)SVM局部診斷決策錯(cuò)分的樣本也能正確識(shí)別,診斷精度大大提高。與此同時(shí),從表5與表6的比較可以看出,經(jīng)過(guò)證據(jù)融合后置信區(qū)間范圍和證據(jù)的不確定性mΘ明顯減小,說(shuō)明經(jīng)融合后,診斷結(jié)果的不確定性減小,診斷精度大幅提高,證明多分類(lèi)SVM后驗(yàn)概率與D-S證據(jù)理論相結(jié)合的故障診斷模型的有效性和準(zhǔn)確性。
(1) 改進(jìn)的多分類(lèi)SVM后驗(yàn)概率輸出模型將被測(cè)樣本屬于各二分類(lèi)SVM的概率作為權(quán)值,符合多類(lèi)樣本的實(shí)際分布,提高了SVM后驗(yàn)概率的準(zhǔn)確性。
(2) 將SVM誤差上界分配給識(shí)別框架,符合D-S證據(jù)理論的不確知性質(zhì),提高了算法的有效性。采用SVM和D-S證據(jù)理論的集成故障診斷模型,能夠顯著提高軸承故障診斷的精確性。
[1] 李凌均,張周鎖,何正嘉.支持向量機(jī)在機(jī)械故障診斷中的應(yīng)用研究[J].計(jì)算機(jī)工程與應(yīng)用,2002,19:19-21.
[2] 杜京義,侯媛彬.基于最小風(fēng)險(xiǎn)的SVM及其在故障診斷中的應(yīng)用[J].振動(dòng)、測(cè)試與診斷,2006,26(2):108-159.
[3] 閆宏莉.證據(jù)理論在機(jī)械設(shè)備故障診斷中的應(yīng)用研究[D].北京:華北電力大學(xué),2006.
[4] Vapnik.統(tǒng)計(jì)學(xué)習(xí)理論[M].許建華,張學(xué)工,譯.北京:電子工業(yè)出版社,2004.
[5] Platt John C. Probabilistic Output for Support Vector Machine and Comparisons to Regularized Likelihood Methods[M]. Advances in Large Margin Classifier, Cambridge: MIT Press,2000.
[6] Wu Ting-Fan, Lin Chih-Jen, Weng Ruby C. Probability Estimates for Multi-class Classification by Pairwise Coupling[J]. Journal of Machine Learning Research,2004(5):975-1005.
[7] Dempster A P. Upper and Lower Probabilities Induced by a Multivalued Mapping[J]. Annals of Mathematical Statistics.1967,38:325-339.
[8] Tipping Michael E. Sparse Bayesian Learning and the Relevance Vector Machine[J]. Journal of Machine Learning Research,2001(1):211-244.
[9] 邊肇祺,張學(xué)工,等.模式識(shí)別[M].北京:清華大學(xué)出版社,2000.
Fault Diagnosis of Bearings Based on Multi-class SVM and D-S Evidence Theory
Mei Jianmin1,2, Zhao Huimin1, Xiao Yunkui1& Zhou Bin2
1.DepartmentofAutomobileEngineering,MilitaryTransportationUniversity,Tianjin300161;2.SchoolofMechanicalEngineering,TianjinUniversity,Tianjin300072
In view of the problem that the classification results of hard decision output of support vector machine (SVM) lack of quantitative evaluation, an improved modeling method for the posterior probability of multi-class SVM is proposed. Through the introduction of D-S evidence theory, the basic probability assignment (BPA) of multi-class SVM under the recognition frame of evidence theory is obtained to enable the samples have both qualitative explanation and quantitative evaluation. And then the multi-source information is delivered to SVM to conduct the evidence fusion of several SVM classification outputs for improving diagnostic accuracy. Finally the method is applied to the fault diagnosis of bearings with a result showing that the method proposed can correctly classify the samples being classified wrongly using single-source information, reduce the overall error of recognition frame, and enhance the correctness of fault diagnosis remarkably.
fault diagnosis; SVM; posterior probability; D-S evidence theory; information fusion
原稿收到日期為2012年8月17日,修改稿收到日期為2013年8月8日。