郭小萍 滕佳岐 李 元
(沈陽(yáng)化工大學(xué)信息工程學(xué)院 遼寧 沈陽(yáng) 110142)
在工業(yè)生產(chǎn)過程中,隨著某些設(shè)備老化、元器件磨損等情況的發(fā)生,可能會(huì)出現(xiàn)一些從小到大、自弱至強(qiáng)緩慢變化的、早期特征不明顯的異常狀況,文獻(xiàn)中通常稱其為微小故障,這種微小故障的及時(shí)有效檢測(cè),將會(huì)避免嚴(yán)重的系統(tǒng)事故或造成停工等狀況出現(xiàn)[1-2]。數(shù)據(jù)驅(qū)動(dòng)故障檢測(cè)方法得到了廣泛應(yīng)用并取得了可喜的成果,如主成分分析(Principal Components Analysis, PCA)、獨(dú)立主元分析(Independent Component Analysis,ICA)和kNN等[3-4]。然而,這些方法在從過程數(shù)據(jù)中提取局部微弱特征信息方面存在不足,不能及時(shí)識(shí)別過程發(fā)生的微小故障。葛志強(qiáng)等[5]提出MCUSUM-ICA-PCA方法,將傳統(tǒng)的單變量累積和控制圖擴(kuò)展為多變量形式,并結(jié)合了ICA和PCA,改善了檢測(cè)效果。鄧曉剛等[6]提出一種雙層局部核主元分析(Double-Level Local Kernel Principal Component Analysis, DLKPCA)的故障檢測(cè)方法,通過用貝葉斯融合算法,對(duì)每塊的結(jié)果進(jìn)行融合,并從樣本和變量?jī)蓚€(gè)角度發(fā)掘數(shù)據(jù)的局部信息。Du等[7]將EEMD與PCA相結(jié)合應(yīng)用于過程微小故障檢測(cè)。然而,這些方法都通過結(jié)合PCA等線性方法完成,將其用于具有較強(qiáng)非線性特征的過程進(jìn)行微小故障的檢測(cè)時(shí),檢測(cè)效果會(huì)受到影響。
針對(duì)非線性過程微小故障的檢測(cè),本文提出一種基于EEMD-k近鄰的故障檢測(cè)方法。該方法在EEMD分解原始建模數(shù)據(jù)獲得的本征函數(shù)(Intrinsic Mode Function, IMF)空間引入kNN規(guī)則,通過構(gòu)造的加權(quán)因子,更好地提取原始建模數(shù)據(jù)的非線性特征,實(shí)現(xiàn)原始樣本的重構(gòu)。然后,在重構(gòu)空間再一次采用kNN提取樣本的非線性等特征,同時(shí)構(gòu)建k近鄰統(tǒng)計(jì)量并計(jì)算其累積和,通過核密度估計(jì)法確定統(tǒng)計(jì)量控制限。最后通過一個(gè)數(shù)值案例和TE(Tenessee Eastman)過程的仿真實(shí)驗(yàn)驗(yàn)證了所提方法的有效性。
集合經(jīng)驗(yàn)?zāi)B(tài)分解通過引入白噪聲解決了模態(tài)混疊問題,該算法基本步驟為[8]:
(1) 向原始信號(hào)中加入個(gè)高斯白噪聲得到,即:
y(t)=x(t)+σn(t)
(1)
式中:n(t)是高斯白噪聲。
(2) 通過EMD計(jì)算y(t)的q個(gè)IMF分量ci(t),i=1,2,…,q。
(3) 重復(fù)前兩步L次,得到IMF的集合:
(2)
其中,每次的高斯白噪聲不同,但個(gè)數(shù)相同。
(4) 求IMF的平均值:
(3)
kNN規(guī)則的基本思想是利用樣本與其局部鄰域之間的累積距離來(lái)度量樣本間的差異。在訓(xùn)練樣本集中,正常樣本都是相似的,但故障樣本應(yīng)與正常樣本不同。kNN利用樣本局部最近鄰的累積距離來(lái)表示樣本間的相似度,并通過式(4)計(jì)算樣本與其前k個(gè)近鄰樣本的距離平方和[9]。
(4)
(5)
圖1為EEMD-kNN方法的流程,包括離線建模和在線監(jiān)視兩個(gè)部分。
圖1 EEMD-kNN方法流程
(1) 采用EEMD方法進(jìn)行數(shù)據(jù)分解。
將m個(gè)變量的q個(gè)IMF按照順序排序,獲得q個(gè)數(shù)據(jù)集為:
(6)
(7)
(3) 構(gòu)造加權(quán)因子γj(t),表示為:
(8)
式中:b為大于1的數(shù)值。
i=1,2,…,m,j=1,2,…,q
(9)
(1) 對(duì)測(cè)試數(shù)據(jù)y進(jìn)行EEMD分解,分別獲得q個(gè)IMF平均分量。
采用的數(shù)值模型[11-12]如式(10)和式(11)所示。
(10)
t(k)=0.811t(k-1)+0.193w(k)
(11)
式中:x1、x2、x3為過程變量,t為內(nèi)部變量。ei(i=1,2,3)服從期望為0,標(biāo)準(zhǔn)差為0.01的高斯分布,w服從a=0.01,b=2的均勻分布。本文通過式(9)和式(10)收集400組樣本作為訓(xùn)練樣本。產(chǎn)生兩種帶故障的測(cè)試樣本,每種400組。兩種故障的設(shè)置規(guī)則分別為:
故障1:從第101個(gè)樣本開始,在x2中加入振幅為-0.5的小階躍偏差;
故障2:從第101個(gè)樣本開始,在x1中加入斜率為0.003的斜坡變化。
以故障2為例,采用傳統(tǒng)kNN、EEMD-PCA和本文所提的EEMD-kNN方法的故障檢測(cè)結(jié)果如圖2所示。
圖2 故障2檢測(cè)結(jié)果
圖2(a)和圖2(b)顯示,EEMD-PCA方法的兩個(gè)統(tǒng)計(jì)量的檢測(cè)率分別為10.67%和33.67%,由圖2(c)可以看出,傳統(tǒng)kNN方法對(duì)故障2的檢測(cè)效果不太理想,檢測(cè)率為59.33%,大部分故障沒有被檢測(cè)出來(lái)。圖2(d)顯示EEMD-kNN方法檢測(cè)效果明顯提高,并且有著較低的誤報(bào)率,第187時(shí)刻檢出故障,故障檢測(cè)率為71%。
采用三種方法對(duì)兩種故障進(jìn)行故障檢測(cè)實(shí)驗(yàn)的誤報(bào)率和檢測(cè)率匯總?cè)绫?所示。由表1看出,EEMD-kNN有著較低的誤報(bào)率以及更高的檢測(cè)率,驗(yàn)證了本文所提方法的有效性。
表1 數(shù)值案例誤報(bào)率檢測(cè)率匯總表(%)
田納西-伊斯曼(Tennessee Eastman, TE)過程被廣泛用于模擬實(shí)際復(fù)雜的工業(yè)過程系統(tǒng),并且驗(yàn)證各種故障檢測(cè)方法。該過程包括41個(gè)測(cè)量變量、12個(gè)操作變量和20種故障,去除攪拌速度常用變量共有52個(gè)。文獻(xiàn)[13]已經(jīng)介紹了該過程的詳細(xì)描述、工藝流程圖以及其故障形式。許多過程故障檢測(cè)方法通過TE過程驗(yàn)證方法的有效性,然而對(duì)該過程的故障3、9、15的檢測(cè)效果不佳[13], 這三種類型的故障傳統(tǒng)方法較難檢測(cè),其中:故障3是在D進(jìn)料口溫度加一個(gè)階躍類型的故障,由于該故障對(duì)過程影響較小,導(dǎo)致許多傳統(tǒng)方法檢測(cè)到該故較為困難;故障9是D進(jìn)料口溫度發(fā)生隨機(jī)變化,也是屬于對(duì)TE過程影響較小的一種故障,傳統(tǒng)的檢測(cè)方法很難檢測(cè)到它;故障15是冷凝器冷卻水閥門粘住,屬于靜摩擦類型故障,同樣對(duì)過程的影響微乎其微[12]。
故障類型與描述匯總?cè)绫?所示。
表2 TE過程故障
本文采用TE過程的生產(chǎn)模式1驗(yàn)證本文所提方法的有效性,用于建模的正常工況樣本數(shù)為480,用于在線監(jiān)視的故障樣本為故障3、故障9和故障15,每一種故障樣本的樣本數(shù)為960,其中前160是正常的,后800為有故障的[13]。
采用本文所提方法對(duì)3種故障進(jìn)行仿真實(shí)驗(yàn),并與kNN方法以及EEMD-PCA方法進(jìn)行了比較,其中各種參數(shù)值的選取通過交叉驗(yàn)證法獲得。以故障3為例,給出了較詳細(xì)的檢測(cè)結(jié)果,如圖3所示。圖3(a)和圖3(b)為EEMD-PCA方法的檢測(cè)結(jié)果,兩個(gè)統(tǒng)計(jì)量的檢測(cè)率分別為100%和92.13%,但是T2統(tǒng)計(jì)量的誤報(bào)率較高,為70.13%。圖3(c)為kNN方法的檢測(cè)結(jié)果,D2檢測(cè)率只有30.38%,大部分故障沒有被檢測(cè)出來(lái),檢測(cè)效果不是很好。圖3(d)為EEMD-kNN方法的檢測(cè)結(jié)果,檢測(cè)率為95.62%,誤報(bào)率為1.25%,有著較高檢測(cè)率的同時(shí),還保證了誤報(bào)率。本文所提方法檢出故障發(fā)生的時(shí)間為第195個(gè)采樣時(shí)刻,相比前幾種方法,更接近實(shí)際故障發(fā)生的時(shí)刻,體現(xiàn)了本文方法的有效性。
圖3 故障3檢測(cè)結(jié)果
三種方法檢測(cè)三種故障的誤報(bào)率和檢測(cè)率匯總?cè)绫?所示。進(jìn)一步可看出,EEMD-kNN方法在保證了較高檢測(cè)率的同時(shí)誤報(bào)率較低,其中對(duì)故障3的誤報(bào)率僅有1.25%,檢測(cè)率為95.62%,檢測(cè)效果比較好。EEMD-PCA方法的T2統(tǒng)計(jì)量對(duì)故障3的檢測(cè)率為100%,但是誤報(bào)率為70.13%。對(duì)于故障9而言,kNN方法的檢測(cè)率較低,未檢測(cè)到故障,EEMD-PCA方法的T2統(tǒng)計(jì)量的檢測(cè)率雖然為100%,但與EEMD-kNN方法相比,后者的誤報(bào)率較低。對(duì)于故障15,EEMD-kNN的檢測(cè)率最高,EEMD-PCA方法的兩個(gè)統(tǒng)計(jì)量誤報(bào)率為0%,但其檢測(cè)率較低,而且EEMD-kNN的誤報(bào)率只有3.75%。綜上,本文所提方法EEMD-kNN相比其他幾種方法,檢測(cè)效果最好,而且只采用了一個(gè)統(tǒng)計(jì)量完成,簡(jiǎn)便有效。
表3 TE過程誤報(bào)率及檢測(cè)率匯總表(%)
本文提出了一種基于EEMD和k近鄰指標(biāo)累積和的非線性過程故障的檢測(cè)方法。該方法采用EEMD方法提取過程變量的本征模態(tài),并通過k近鄰距離統(tǒng)計(jì)量構(gòu)造加權(quán)因子重構(gòu)出建模樣本。利用重構(gòu)樣本建立k近鄰故障檢測(cè)模型,計(jì)算距離統(tǒng)計(jì)量并與累積和方法相結(jié)合,檢測(cè)過程出現(xiàn)的早期特征變化不明顯、傳統(tǒng)方法較難檢測(cè)的故障。采用數(shù)值案例和TE過程進(jìn)行方法有效性的驗(yàn)證,并與EEMD-PCA和kNN方法進(jìn)行比較,結(jié)果表明本文方法在處理非線性過程故障問題中有著更好的檢測(cè)效果。所提方法在多工況過程的應(yīng)用,將是下一步工作重點(diǎn)。