□ 李鴻光 □ 孫樹棟 □ 司書賓 □ 司佳佳
西北工業(yè)大學(xué) 現(xiàn)代設(shè)計(jì)與集成制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室 西安 710072
機(jī)械故障[1]指機(jī)械系統(tǒng)(零件、組件、部件或整臺(tái)設(shè)備乃至一系列的設(shè)備組合)已偏離其設(shè)備狀態(tài)而喪失部分或全部功能的現(xiàn)象。如果能夠?qū)C(jī)械的運(yùn)行狀態(tài)進(jìn)行監(jiān)測(cè),并在故障發(fā)生前發(fā)現(xiàn)故障并采取相應(yīng)措施,開展預(yù)先維護(hù),對(duì)于保障設(shè)備正常運(yùn)行、避免嚴(yán)重故障危害是非常有效的。對(duì)于旋轉(zhuǎn)設(shè)備,一般可以通過采集實(shí)時(shí)振動(dòng)信號(hào),并通過對(duì)數(shù)據(jù)進(jìn)行分析提取振動(dòng)特征,從而建立振動(dòng)幅度、頻率與設(shè)備狀態(tài)間的映射關(guān)系,達(dá)到預(yù)先維護(hù)的目的。
貝葉斯網(wǎng)絡(luò)[2,3](Bayesian Networks,BN)是一種有向無圈圖。它通過基于概率推理的圖形化網(wǎng)絡(luò),表示變量的不確定狀態(tài)及變量之間條件依賴關(guān)系。目前貝葉斯網(wǎng)絡(luò)在統(tǒng)計(jì)決策、醫(yī)療診斷、專家系統(tǒng)以及處理不確定性信息的智能化系統(tǒng)等領(lǐng)域的應(yīng)用已十分廣泛,是進(jìn)行數(shù)據(jù)分析和不確定性推理的重要工具。
本文基于故障模擬器采集到的軸裂紋故障數(shù)據(jù)集,分別用常用的貝葉斯網(wǎng)絡(luò)分類器,如樸素貝葉斯(Na?ve Bayes,NB)[3,4]、 增 強(qiáng) 樸 素 貝 葉 斯 (Augmented Na?ve-Bayes,ANB)[5]、 樹型樸素貝葉斯 (Tree Augmented Na?ve-Bayes,TAN)[6]和無監(jiān)督貝葉斯網(wǎng)絡(luò)(General Beyasian Network,GBN)[7]進(jìn)行診斷模型構(gòu)建和性能分析,為軸裂紋故障診斷提供了方法依據(jù)。
機(jī)械故障仿真器/模擬器(MFS)是一種用于機(jī)械健康檢測(cè)的測(cè)試設(shè)備。此設(shè)備可模擬各種機(jī)械軸的常見故障,諸如:軸裂紋不平衡、軸不對(duì)中、彎曲軸、裂紋軸、滾珠和油膜軸承缺陷、帶傳動(dòng)故障、齒輪箱障、電機(jī)故障、壓縮機(jī)故障及泵故障等。本文涉及的有關(guān)故障模擬器的實(shí)驗(yàn)主要是:將以下故障件在故障模擬器上以不同狀態(tài)運(yùn)行,并收集它們的故障數(shù)據(jù)。
此故障件包括一根直徑為 4.5 in(1in=25.4 mm)、通過帶4個(gè)螺栓的轉(zhuǎn)盤來模擬裂紋的軸、一根有裂縫及填充物的軸、一根有深度V型裂紋缺口的軸,如圖1所示。
圖1 軸裂紋研究套件
分別取正常軸(T)、裂紋軸 1(L-1)、裂紋軸 2(L-2)、裂紋軸3(L-3)在故障模擬器上運(yùn)行。其中用轉(zhuǎn)盤上的4個(gè)螺栓緊固的軸裂紋套件模擬正常軸,用松動(dòng)1個(gè)螺栓的套件模擬L-1,用松動(dòng)2個(gè)相鄰螺栓的套件模擬L-2,用松動(dòng)3個(gè)螺栓的套件模擬L-3,分別收集它們?cè)诠收夏M器上轉(zhuǎn)速處于60 Hz時(shí)的系統(tǒng)運(yùn)行狀態(tài)數(shù)據(jù)。
本數(shù)據(jù)集取自故障模擬器實(shí)驗(yàn)中,此數(shù)據(jù)集記錄了軸在正常狀態(tài)和故障狀態(tài)(裂紋)下傳感器所收集的振動(dòng)數(shù)據(jù)。目標(biāo)變量為State(軸狀態(tài)),屬性變量包括:tach、Hz、L-V、L-H、R-V、R-H。 模型涉及的變量描述如表1所示。
表1 實(shí)例變量描述
從收集的數(shù)據(jù)中隨機(jī)抽取出12 000條數(shù)據(jù),建立數(shù)據(jù)集,其中取2/3為訓(xùn)練集,1/3為測(cè)試集,表2列出了數(shù)據(jù)集屬性。
表2 數(shù)據(jù)集屬性
確定已有數(shù)據(jù)集D的目標(biāo)變量T和屬性變量P;整理數(shù)據(jù)集D,按照變量分布概率隨機(jī)生成原則補(bǔ)充缺失數(shù)據(jù),遵照平均分布原則將連續(xù)變量離散化。
為了防止過度擬合,保證各分類器的精度,將數(shù)據(jù)集按照2∶1的比例隨機(jī)抽樣,2/3作為訓(xùn)練集Dtrain,1/3作為測(cè)試集Dtest;利用訓(xùn)練集數(shù)據(jù)Dtrain分別建立多種貝葉斯網(wǎng)絡(luò)分類器模型;對(duì)于已建立好的貝葉斯網(wǎng)絡(luò)模型,利用測(cè)試集Dtest驗(yàn)證分類器的分類精度和結(jié)構(gòu)復(fù)雜度,并與用Dtest測(cè)試得到的精度進(jìn)行比較。
NB分類器[4]是一種結(jié)構(gòu)簡單、實(shí)踐有效的貝葉斯分類器,它包含一個(gè)根節(jié)點(diǎn)、多個(gè)葉節(jié)點(diǎn),其假定給定目標(biāo)變量C、各屬性變量Xi相互條件獨(dú)立。該分類器采用的局部獨(dú)立假設(shè)簡化了對(duì)訓(xùn)練數(shù)據(jù)的條件概率分類,盡管這個(gè)假設(shè)過于理想化,但這種分類器在實(shí)踐中的分類精度較高,而且它的結(jié)構(gòu)簡單,易于理解,計(jì)算復(fù)雜度低,學(xué)習(xí)效率高,因此在實(shí)踐中得到廣泛應(yīng)用。
ANB分類器在NB分類器基礎(chǔ)上松弛了屬性變量之間的條件獨(dú)立假設(shè),使屬性之間存在一定的依賴關(guān)系,即在屬性之間增添連接弧,這些弧稱為擴(kuò)展弧。從節(jié)點(diǎn)Xi到Xj的擴(kuò)展弧表示屬性Xj對(duì)分類的影響也取決于Xi的值。
TAN分類器[6,8,10]是NB分類器的擴(kuò)展,它松弛了各屬性變量的條件獨(dú)立假設(shè),允許屬性變量所對(duì)應(yīng)的節(jié)點(diǎn)之間由連接弧連接。TAN分類器松弛了屬性變量之間的條件獨(dú)立假設(shè),這使它具有兩方面的優(yōu)勢(shì):一方面,繼承了ANB結(jié)構(gòu)中類節(jié)點(diǎn)作為分類節(jié)點(diǎn)特殊地位的優(yōu)勢(shì),可以有效避免由于馬爾可夫鏈的存在而導(dǎo)致分類精度的下降;另一方面,由于強(qiáng)制屬性節(jié)點(diǎn)間只能形成樹結(jié)構(gòu),因此可以充分利用圖論中最大權(quán)重生成樹算法實(shí)現(xiàn)對(duì)最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)快速搜索,極大地提高了計(jì)算效率,保證在網(wǎng)絡(luò)結(jié)構(gòu)滿足增強(qiáng)樹結(jié)構(gòu)的條件下,可以逼近真實(shí)的類條件概率分布,同時(shí)也更好地表達(dá)了屬性間的相互關(guān)系,并在多數(shù)情況下獲得了良好的分類精度,得到了廣泛應(yīng)用[9]。
GBN分類器[7,11]是一種無約束的貝葉斯網(wǎng)絡(luò)分類器。前三種分類器均將目標(biāo)節(jié)點(diǎn)作為一個(gè)特殊的節(jié)點(diǎn)處理,而GBN分類器則把目標(biāo)節(jié)點(diǎn)當(dāng)作普通的節(jié)點(diǎn),通過貝葉斯網(wǎng)絡(luò)學(xué)習(xí)算法構(gòu)建基于所有節(jié)點(diǎn)的貝葉斯網(wǎng)絡(luò)模型。然后,以目標(biāo)節(jié)點(diǎn)為中心尋找最優(yōu)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的馬爾可夫覆蓋(Markov blanket,MB)節(jié)點(diǎn)。給定目標(biāo)節(jié)點(diǎn)的MB,則目標(biāo)變量條件獨(dú)立于網(wǎng)絡(luò)中所有其它變量,這樣就大大降低了貝葉斯網(wǎng)絡(luò)模型的復(fù)雜度。
利用訓(xùn)練集數(shù)據(jù)和Bayesialab仿真軟件建立分類器模型,對(duì)于連續(xù)變量采用決策樹分布離散化,按上述數(shù)據(jù)集所建立的NB、ANB、TAN、GBN分類器模型如圖2所示。
圖2 軸裂紋故障診斷貝葉斯網(wǎng)絡(luò)模型
根據(jù)上述模型,用測(cè)試集對(duì)模型的分類效果進(jìn)行測(cè)試,各貝葉斯分類器的測(cè)試集混淆矩陣見表3。表4列出了基于混淆矩陣計(jì)算的各分類器在訓(xùn)練集和測(cè)試集上的分類精度,其中分類精度較高的用字體加粗表示。從表3可以看出,每一種貝葉斯分類器的訓(xùn)練集和測(cè)試集的分類精度基本相等,說明該數(shù)據(jù)集的貝葉斯分類器模型具有良好的泛化能力。
表3 軸裂紋故障貝葉斯分類器混淆矩陣
表4 貝葉斯分類器分類精度
根據(jù)上述模型,用測(cè)試集對(duì)模型的分類效果進(jìn)行測(cè)試,由上述實(shí)驗(yàn)及表3、表4可分析得知,目前為止分類精度最高為74.09%,表明直接建模精度不高,應(yīng)該尋找其它的方法建模來提高診斷系統(tǒng)的精確度。表4列出了基于混淆矩陣計(jì)算的各分類器在訓(xùn)練集和測(cè)試集上的分類精度,其中分類精度較高的用字體加粗表示。從表3可以看出,每一種貝葉斯分類器的訓(xùn)練集和測(cè)試集的分類精度基本相等,說明該數(shù)據(jù)集的貝葉斯分類器模型具有良好的泛化能力。另外通過分析還可得出如下結(jié)論。
(1)由于NB分類器只考慮屬性變量與目標(biāo)變量之間的關(guān)系,忽略了其它屬性變量之間的關(guān)系,所以其分類精度明顯低于其它三種分類器,TAN分類器總是表現(xiàn)一般,ANB分類器和GBN分類器表現(xiàn)得比較好。
(2)由以上建模得知,目前為止分類精度最高為74.09%,接下來可以繼續(xù)討論其它建模方法。
本文通過故障模擬器收集軸裂紋故障數(shù)據(jù),以各實(shí)例集的訓(xùn)練集為基礎(chǔ),利用BayesiaLab仿真軟件實(shí)現(xiàn)各貝葉斯網(wǎng)絡(luò)分類器的建模;以測(cè)試數(shù)據(jù)集為基礎(chǔ),利用各貝葉斯網(wǎng)絡(luò)分類器模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行分類;通過對(duì)各模型精度的比較,從眾多數(shù)據(jù)中和NB、ANB、TAN和GBN網(wǎng)絡(luò)模型中找出了最佳診斷模型。
[1] 李海軍,馬登武,劉宵.貝葉斯網(wǎng)絡(luò)理論在裝備故障診斷中的應(yīng)用[M].北京:國防工業(yè)出版社,2009.
[2] 張連文,郭海鵬.貝葉斯網(wǎng)引論[M].北京:科學(xué)出版社,2006.
[3] 王建林,王學(xué)玲.數(shù)據(jù)挖掘中的貝葉斯分類器[J].長春理工大學(xué)學(xué)報(bào),2006,29(3):51-53.
[4] 謝斌.樸素貝葉斯分類在數(shù)據(jù)挖掘中的應(yīng)用[J].甘肅聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版),2007, 21(4):79-82.
[5] Cheng Jie,GreinerR.Comparing Bayesian Network Classifiers [C].Proceedings of the 15th Annual Conference on Uncertainty in Artificial Intelligence,San Francisco:Morgan Kaufmann,1999.
[6] FR Iedman N,Geiger D,Goldszm IDT M.Bayesian Network Classifiers[J].Machine Learning,1997,29:131-163.
[7] Munteanu P,Bendou M.The EQ Famework for Learning Equivalence Classes of Bayesian Networks [C].Proceedings of IEEE International Conference on Data Mining,Washington DC:IEEE Computer Society,2001.
[8] Bart Baesens,Geert Verstraeten,Dirk Van den Poel,et al.Bayesian Network Classifiers for Identifying the Slope of the Customer Lifecycle of Long-life Customers [J].European Journal of Operational Research,2004,156(2):508-523.
[9] 李旭升,郭耀煌.靈活的增強(qiáng)樸素貝葉斯分類器[J].信息與控制,2007,36(6):690-695.
[10] 孫笑微,趙大宇,李曉毅,等.基于數(shù)據(jù)挖掘的TAN分類器的研究與應(yīng)用 [J]. 計(jì)算機(jī)技術(shù)與發(fā)展,2006,11(16):140-142.
[11] 蔡志強(qiáng),孫樹棟,Yannou Bernard,等.基于貝葉斯網(wǎng)絡(luò)分類器的產(chǎn)品故障率分類研究[J].計(jì)算機(jī)應(yīng)用研究,2009,26(9):3307-3309.