朱建新 , 呂寶林, 喬 松, 王溢芳, 陳嘉宏
(1. 合肥通用機(jī)械研究院有限公司,安徽 合肥 230031;2. 國家壓力容器與管道安全工程技術(shù)研究中心,安徽 合肥 230031)
流程行業(yè)設(shè)備在長周期運(yùn)行過程中,受部件之間、設(shè)備之間以及設(shè)備與工藝介質(zhì)之間的耦合影響,發(fā)生的失效或故障十分復(fù)雜,故障一旦發(fā)生往往導(dǎo)致流程中斷,因而行業(yè)對設(shè)備的可靠性具有很高的要求。傳統(tǒng)的設(shè)備失效或故障診斷往往從機(jī)理出發(fā),利用材料力學(xué)、結(jié)構(gòu)力學(xué)、流體力學(xué)以及腐蝕理論等開展失效或故障的分析,這種方法對于結(jié)構(gòu)單一、影響因素簡單、失效或故障模式清晰的失效往往十分有效[1]?;跈C(jī)理的分析方法在傳統(tǒng)的設(shè)備失效或故障診斷中發(fā)揮了重要作用,如依據(jù)振動頻譜分析轉(zhuǎn)子可能發(fā)生的不平衡、不對中及磨碰等故障,依據(jù)潤滑油成分分析設(shè)備可能的故障等[2],采用化學(xué)成分、力學(xué)性能、金相等分析設(shè)備的失效[3],采用動力學(xué)及振動響應(yīng)分析方法研究轉(zhuǎn)子-支承-機(jī)匣耦合系統(tǒng)碰摩故障、滾動軸承故障等[4~6]。然而隨著設(shè)備復(fù)雜程度的提高,部件之間、設(shè)備之間、設(shè)備與工藝之間耦合關(guān)聯(lián),設(shè)備發(fā)生失效或故障往往受多種因素影響,在這種情況下設(shè)備主導(dǎo)失效或故障機(jī)理的分析需要設(shè)計(jì)、材料、制造、使用管理等多專業(yè)配合[1]。傳統(tǒng)的以機(jī)理分析為主的故障診斷方法需要全面考慮這些相互影響,并在做大量簡化的前提下選擇部分主導(dǎo)因素開展分析,因而分析過程復(fù)雜且準(zhǔn)確性難以保證。若將所有影響因素全部考慮在內(nèi)又會因系統(tǒng)的復(fù)雜程度太高而無法求解。為解決這一問題,研究者將主要影響因素及其相互關(guān)系進(jìn)行一定的簡化后,提出了基于貝葉斯網(wǎng)絡(luò)的可靠性分析方法[7,8]。貝葉斯網(wǎng)絡(luò)是不確定知識表達(dá)和推理領(lǐng)域最有效的理論模型,該方法考慮了影響因素的相互關(guān)系后,以貝葉斯理論為基礎(chǔ)開展故障的診斷,在一定程度上解決了復(fù)雜系統(tǒng)的可靠性分析與故障診斷難題。如將貝葉斯網(wǎng)絡(luò)用于機(jī)械系統(tǒng)的剩余壽命預(yù)測,大型回轉(zhuǎn)設(shè)備故障診斷,水電機(jī)組的振動故障診斷、機(jī)械設(shè)備轉(zhuǎn)子系統(tǒng)的故障診斷等[9~13]。
貝葉斯網(wǎng)絡(luò)通過建立表示事件之間因果關(guān)系的有向無環(huán)圖,并利用一系列條件概率來分析事件發(fā)生的依存關(guān)系及可能性,因而應(yīng)用貝葉斯網(wǎng)絡(luò)時,首先要建立表示事件因(父節(jié)點(diǎn))與果(子節(jié)點(diǎn))之間的相互關(guān)系。實(shí)際應(yīng)用時,若無法明確狀態(tài)之間的因果關(guān)系,貝葉斯網(wǎng)絡(luò)構(gòu)建就存在困難,此外當(dāng)存在多個影響因素時,影響因素之間的獨(dú)立性也難以保證。
近年來隨著數(shù)據(jù)科學(xué)的發(fā)展,將大數(shù)據(jù)分析方法用于多種影響因素耦合作用的設(shè)備故障分析與診斷已成為可能,該方法以發(fā)生失效的原始數(shù)據(jù)為基礎(chǔ),通過對數(shù)據(jù)背后的統(tǒng)計(jì)規(guī)律進(jìn)行深入研究,分析影響因素與故障狀態(tài)之間的相互關(guān)系,用概率分析方法判斷在多種因素交互作用下的設(shè)備失效或故障可能性。與傳統(tǒng)的方法相比,由于無需進(jìn)行任何簡化,避免了先入為主的主觀因素可能帶來的不足,對影響因素的獨(dú)立性沒有特殊要求,因而可以最大程度避免不必要的簡化帶來的問題。
在眾多的大數(shù)據(jù)的分析方法中,通過貝葉斯理論把現(xiàn)象發(fā)生的可能性與原因(故障)聯(lián)系起來,描述了設(shè)備故障診斷的一般規(guī)律,因而貝葉斯模型在實(shí)際設(shè)備的故障診斷中具有廣泛應(yīng)用[7]。依據(jù)樣本的特點(diǎn),貝葉斯又分為樸素貝葉斯、高斯貝葉斯等不同類型。本文采用多維高斯貝葉斯模型為基礎(chǔ),研究了模型在故障智能診斷中的應(yīng)用,以公開發(fā)表的超聲流量計(jì)診斷數(shù)據(jù)庫為例,對方法應(yīng)用流程及效果進(jìn)行分析,并將分析結(jié)果與k-最近鄰(k- nearest neighbors,KNN)聚類分析算法結(jié)果進(jìn)行比較。
設(shè)備的故障診斷,是通過觀測設(shè)備運(yùn)行的特征來判斷發(fā)生特定故障的可能性。通常設(shè)備發(fā)生故障時往往伴隨一個或多個特征,其完全符合貝葉斯理論有關(guān)條件概率的描述:當(dāng)設(shè)備發(fā)生Ck類故障模式時,該故障會使設(shè)備表現(xiàn)出若干特征,如壁厚的減薄、振動振幅、頻率、流量或壓力的變化等。當(dāng)觀測的對象具有N個特征時,用X表示N個特征構(gòu)成的特征向量。則當(dāng)設(shè)備有K個可能的故障模式時,可以計(jì)算出Ck故障模式下X中N個特征的先驗(yàn)聯(lián)合分布概率:
(1)
當(dāng)發(fā)生Ck故障模式時,對應(yīng)特征X的先驗(yàn)聯(lián)合分布概率P(X|Ck)最大。這樣可以通過計(jì)算不同故障模式下特征的聯(lián)合分布概率,概率最大時對應(yīng)的故障模式即為最可能的故障模式。
對于特征X中任一子特征x,若特定故障模式Ck下的子特征x的條件概率密度函數(shù)服從參數(shù)為μ和σ的高斯分布,即:
(2)
則認(rèn)為特定的失效模式下任一子特征服從高斯分布,相應(yīng)地滿足該條件的全部子特征組成的聯(lián)合分布稱為多維高斯貝葉斯分布。
對于一個包含N個特征,共有K種故障模式(或稱為分類)的系統(tǒng),對特定的分類Ck,全部子特征組成的聯(lián)合分布概率密度函數(shù)為[14,15]:
(3)
采用極大似然估計(jì)方法可以估計(jì)N個特征同時發(fā)生時系統(tǒng)隸屬于Ck故障模式的似然函數(shù)值:
lnL= ln (P(x1,x2,…,xN|Ck))=
(4)
對特定的故障模式,式(4)中 ln (|ΣK|)和Nln (2π)均為常數(shù)。
對特定的待檢樣本,可以通過多維高斯貝葉斯求解不同故障模式下全部特征的聯(lián)合分布概率密度,概率密度越大表明發(fā)生該故障模式的可能性越大。這樣就可以利用極大似然對設(shè)備的故障進(jìn)行智能診斷,通過排序篩選設(shè)備最可能的失效或故障模式,從而為維護(hù)維修提供依據(jù)。
基于多維高斯貝葉斯分類模型,可以整理出相應(yīng)的智能診斷算法流程如圖1所示。
圖1 基于多維高斯貝葉斯的智能診斷算法流程Fig.1 Flowchart of smart diagnosis method based on multivariate Gaussian Bayesian model
智能診斷流程主要包括以下幾個步驟:
1) 數(shù)據(jù)集準(zhǔn)備。設(shè)備的故障數(shù)據(jù)樣本是多維高斯貝葉斯智能診斷方法的基礎(chǔ),要針對特定的研究對象,篩選所有與故障有關(guān)的參數(shù)做為特征,并標(biāo)記特征所對應(yīng)的故障分類作為數(shù)據(jù)集。數(shù)據(jù)的收集過程中可能會由于偶發(fā)因素(如傳感器損壞)導(dǎo)致數(shù)據(jù)缺失,故需要對數(shù)據(jù)集進(jìn)行完整性分析,舍棄特征數(shù)據(jù)缺失的樣本,或采用一定的策略補(bǔ)充缺失的數(shù)據(jù),形成結(jié)構(gòu)化的數(shù)據(jù)。
2) 數(shù)據(jù)的降維與數(shù)據(jù)集劃分。當(dāng)樣本數(shù)量較少而特征數(shù)量較多時,可能導(dǎo)致建立的協(xié)方差矩陣為奇異矩陣而無法求逆,此時需要對數(shù)據(jù)進(jìn)行降維處理,降維的作用一是通過特定的變換,使各特征參數(shù)投影到正交空間上,確保變換后的特征相互獨(dú)立;二是通過保留變換后方差最大的若干個特征,舍棄方差小的特征,來實(shí)現(xiàn)參數(shù)降維。常見的降維算法有主成分分析(primary component analysis,PCA),奇異值分解等。降維后的數(shù)據(jù)需要將數(shù)據(jù)集依據(jù)一定的比例分成訓(xùn)練集與檢驗(yàn)集,訓(xùn)練集用于分析檢驗(yàn)集用于檢驗(yàn)。
3) 不同故障模式的多維高斯貝葉斯模型的建立。在訓(xùn)練集中將相同故障模式的特征分別篩出,依據(jù)第2.1節(jié)的分析方法建立各故障模式的多維高斯貝葉斯模型。
4) 模型的檢驗(yàn)。將檢驗(yàn)集中除故障模式外的特征數(shù)據(jù)分別用不同故障模式的多維高斯貝葉斯模型進(jìn)行計(jì)算,計(jì)算得到的似然函數(shù)最大的故障模式即為診斷結(jié)果。將該診斷結(jié)果與檢驗(yàn)集樣本中實(shí)際故障模式進(jìn)行比對,判斷模型的準(zhǔn)確性。
5) 降維模型修正與模型的輸出。由于降維后的特征數(shù)少于原始特征數(shù)量,不可避免會導(dǎo)致表征設(shè)備故障信息的丟失,為避免降維對診斷結(jié)果的影響,需要適當(dāng)調(diào)整降維深度,使診斷識別率達(dá)到最佳。當(dāng)通過多次檢驗(yàn)達(dá)到最佳的效果時,將模型參數(shù)固化下來,用于后續(xù)故障的智能診斷。
本文方法僅通過特征的先驗(yàn)聯(lián)合分布概率來進(jìn)行故障的診斷,診斷過程并未涉及復(fù)雜的機(jī)理分析,以及為開展機(jī)理分析所做的簡化,當(dāng)設(shè)備故障機(jī)理復(fù)雜但數(shù)據(jù)量大時,該方法可以較好地滿足大數(shù)據(jù)條件下設(shè)備故障的智能診斷要求。
若故障數(shù)據(jù)收集共有M個樣本X=[x1,x2,…,xM]T,其中第i個樣本的W個的特征數(shù)據(jù)為xi=(xi,1,xi,2,…,xi,W),則各特征的協(xié)方差矩陣Σ如式(5)所示,協(xié)方差矩陣反映了各特征之間的相互關(guān)系。
(5)
式(5)中μ=[μ1,μ2,…,μW]為全部W個特征的均值。
若存在矩陣A∈RW×W,使(X-μ)·A=y,且y的協(xié)方差矩陣Σy滿足:
=AT·Σ·A=Λ
(6)
式中:Λ為對角陣,其對角線元素λi為一個大于0的數(shù),則說明變換得到的y中各特征相互獨(dú)立,λi越大表明y中第i個特征的方差越大,即數(shù)據(jù)的分散性越好。
式(6)中的變換矩陣A即為由協(xié)方差矩陣Σ的特征值所對應(yīng)的特征向量(列向量)組成的矩陣。當(dāng)將特征值由大到小排列,取全部特征值之和中一定比例的前N個特征值,并將對應(yīng)的N個特征向量(列向量)組成新的變換矩陣B∈RW×N,則通過計(jì)算(X-μ)·B即可將全部樣本中的特征參數(shù)由W維降為N維。
降維時特征值的比例越小,降維深度越深,則保留的特征值個數(shù)N越小,即降維后的維數(shù)越小,信息丟失的越多。
超聲波流量計(jì)是一種以速度差法為原理的非接觸測量儀表,測量準(zhǔn)確度高,廣泛應(yīng)用于石油、化工、冶金、電力、給排水等領(lǐng)域。實(shí)際使用中超聲波流量計(jì)存在空氣侵入、蠟沉積等故障,需要定期進(jìn)行校準(zhǔn)。在英國的石化等流程行業(yè)中超聲波流量計(jì)使用量大,但校準(zhǔn)成本高昂[17]。為避免設(shè)備過度檢驗(yàn)與校準(zhǔn),英國研究機(jī)構(gòu)采集了流量計(jì)相關(guān)參數(shù)并建立了設(shè)備健康數(shù)據(jù)庫,擬采用機(jī)器學(xué)習(xí)方法開展流量計(jì)健康診斷。
圖2 超聲波流量計(jì)檢測通道Fig.2 Test paths of ultrasonic flowmeters
本文使用的超聲波流量計(jì)故障診斷數(shù)據(jù)庫(Ultrasonic flowmeter diagnostics Data Set,http:// archive.ics.uci.edu/ml/datasets/Ultrasonic+flowme-ter+diagnostics)是由英國考文垂大學(xué)(Coventry University)和國家工程實(shí)驗(yàn)室(National Engineering Laboratory,TUV-NEL)采集,數(shù)據(jù)庫由加州大學(xué)歐文分校提供[18]。該數(shù)據(jù)庫收錄了4類流量計(jì)共540個樣本,4類樣本中,B型流量計(jì)的樣本數(shù)92個,故障分類包括無故障(Healthy)、氣體侵入(Gas injection)及蠟沉積(Waxing),C型流量計(jì)的樣本數(shù)181個,故障分類除上述3種外,還包括安裝影響(Installation effects)故障模式。2個子數(shù)據(jù)庫中檢測的項(xiàng)目分別如表1、表2所示。
利用多維高斯貝葉斯模型,本文對兩類超聲波流量計(jì)開展健康狀態(tài)智能診斷。并利用k-最近鄰(KNN)聚類分析工具,對2種分析方法的效果進(jìn)行了比對。
表1 B型流量計(jì)故障診斷檢測項(xiàng)目Tab.1 Test items for failure diagnosis of type B flowmeter
表2 C型流量計(jì)故障診斷檢測項(xiàng)目Tab.2 Test items for failure diagnosis of type C flowmeter
超聲波流量計(jì)故障診斷數(shù)據(jù)庫是一個標(biāo)準(zhǔn)的結(jié)構(gòu)化數(shù)據(jù)庫,數(shù)據(jù)中不存在缺失數(shù)據(jù),但數(shù)據(jù)庫中原始的特征數(shù)分別為51和43個,多數(shù)特征存在明顯的相關(guān)性,如4個通道中通道兩端信號強(qiáng)度、信號質(zhì)量,通道內(nèi)流速與聲速等。由于數(shù)據(jù)庫的樣本數(shù)偏少,僅為92和181個,為避免特征的協(xié)方差矩陣為奇異矩陣帶來的求解困難,需要對樣本數(shù)據(jù)進(jìn)行降維處理,剔除相關(guān)的因素。
為更好地檢驗(yàn)診斷效果,對樣本進(jìn)行隨機(jī)排列后采用相同的方法進(jìn)行10次不重復(fù)的診斷,相同的數(shù)據(jù)同時利用開源的聚類分析工具Scikit-learn中的KNN聚類分析算法進(jìn)行診斷,并對結(jié)果進(jìn)行比對。
利用本文提出的方法及流程,對超聲波流量計(jì)進(jìn)行故障智能診斷。B型和C型流量計(jì)分別保留70.0%和99.7%的特征值進(jìn)行降維,在全部樣本中選擇70%(B型64個,C型126個)用于訓(xùn)練,30%(B型28個,C型55個)用于檢驗(yàn),2種診斷方法得到的結(jié)果如表3所示。
表3 流量計(jì)的檢驗(yàn)結(jié)果Tab.3 Test results of flowmeters
為分析數(shù)據(jù)特征及降維深度對診斷結(jié)果的影響,采用不同的PCA降維策略,對B型和C型流量計(jì)進(jìn)行診斷分析,得到結(jié)果如圖3所示。圖中可以發(fā)現(xiàn)B型流量計(jì)和C型流量計(jì)的診斷結(jié)果存在較大區(qū)別。對B型流量計(jì)采用PCA降維后,降維時特征值保留比例由0.4上升至0.9時,本文算法的診斷識別率98.5%附近波動,總體較佳但進(jìn)一步增加特征值的保留比例會使維數(shù)增加過多,反而使識別率有所降低。而對于KNN算法,提高PCA降維特征值保留比例時,正確識別率會發(fā)生顯著下降。C型流量計(jì)樣本數(shù)量相對較多,當(dāng)特征值保留比例由0.9上升至0.999時,本文算法計(jì)算得到的識別率顯著增加,特征值保留比例達(dá)到99.9%時全部55個待檢樣本共550次診斷的故障識別率為96.9%,這一數(shù)據(jù)明顯高于KNN聚類分析75.3%的診斷結(jié)果。
圖3 兩型流量計(jì)的PCA降維深度對故障識別率的影響Fig.3 Influence of PCA dimensionality reduction depth on failure diagnosis rate for two types of flowmeters
1) 提出了基于多維高斯貝葉斯的設(shè)備故障智能診斷流程,將該方法用于某超聲波流量計(jì)的故障智能診斷,故障的正確識別率達(dá)到95%以上,該診斷效果總體優(yōu)于k-最近鄰(KNN)聚類分析算法;
2) 多維高斯貝葉斯分類算法克服了復(fù)雜設(shè)備系統(tǒng)故障診斷分析中需要對故障模式及影響進(jìn)行機(jī)理研究,對耦合影響因素進(jìn)行簡化分析等不足,可將全部影響設(shè)備失效或故障的因素考慮在內(nèi),避免了為開展機(jī)理分析需要進(jìn)行簡化帶來的不足;
3) 用多維高斯貝葉斯方法進(jìn)行設(shè)備的故障診斷時,需要綜合考慮樣本及特征的數(shù)量、特征與失效或故障的相互關(guān)系,可以通過分析選擇恰當(dāng)?shù)慕稻S深度,以達(dá)到最佳的診斷效果;
4) 樣本中不同特征對故障識別率的影響存在較大區(qū)別,應(yīng)用降維技術(shù)進(jìn)行分析時,不同的降維深度可能對診斷結(jié)果產(chǎn)生較大影響。由于PCA降維后的復(fù)合特征與初始特征存在一定的線性關(guān)系,如何利用復(fù)合特征來分析原始特征對診斷結(jié)果的影響,這是后續(xù)值得進(jìn)一步開展的研究方向。