謝彥紅, 劉文靜, 李 元
(沈陽(yáng)化工大學(xué) 數(shù)理系, 遼寧 沈陽(yáng) 110142)
隨著工業(yè)結(jié)構(gòu)的日益復(fù)雜化,對(duì)運(yùn)行系統(tǒng)的安全性和可靠性的要求也日益提高[1-3],對(duì)設(shè)備和系統(tǒng)進(jìn)行及時(shí)有效的監(jiān)控,是提高設(shè)備工作效率和可靠性的有效方法[4-7].目前,以主元分析(principal component analysis,PCA)[8-9]、偏最小二乘(partial least squares,PLS)[10-11]為代表的經(jīng)典統(tǒng)計(jì)方法在使用時(shí)仍然存在局限性.PCA只利用了信號(hào)的二階統(tǒng)計(jì)信息,在數(shù)據(jù)不滿足完全高斯分布時(shí)其檢測(cè)效果并不理想.獨(dú)立主元分析(independent component analysis,ICA)[12-13]方法雖然使用了高階統(tǒng)計(jì)量信息,但研究仍然還停留在線性問(wèn)題上,對(duì)線性、非線性混合方面的問(wèn)題研究還不成熟.Tax[14-15]等人提出了支持向量數(shù)據(jù)描述(SVDD)方法,該算法可以很好地處理過(guò)程混合信息,而且又對(duì)非線性問(wèn)題具有較高的處理能力.雖然SVDD方法有許多優(yōu)點(diǎn),但是當(dāng)樣本數(shù)據(jù)較大時(shí),由于核函數(shù)的原因?qū)?huì)導(dǎo)致計(jì)算的復(fù)雜性明顯增加.為了克服這個(gè)缺點(diǎn),提高數(shù)據(jù)檢測(cè)效率,降低檢測(cè)時(shí)間,將從降低數(shù)據(jù)維數(shù)和減少樣本個(gè)數(shù)兩個(gè)方面考慮.本文綜合考慮了主元空間及殘差空間的特征信息,提出一種對(duì)主元空間及殘差空間先后建模的故障檢測(cè)方法,提高檢測(cè)效率的同時(shí)又有效地防止漏檢情況的發(fā)生.
支持?jǐn)?shù)據(jù)向量描述[16-17](support vector data description,SVDD)的基本思想是數(shù)據(jù)集X={xi,i=1,2,…,N},通過(guò)某種非線性函數(shù)Φ:X→F將原始空間的數(shù)據(jù)投射到高維特征空間{Φ(xi),i=1,…,N},在高維特征空間中找到一個(gè)幾乎包含所有數(shù)據(jù)樣本的最小體積超球體,a是超球體的球心,R是超球體的半徑.考慮到測(cè)量誤差或者噪音等干擾引起的離群點(diǎn)影響,引入松弛變量ζi;C是懲罰參數(shù).此問(wèn)題可描述為:
(1)
上述問(wèn)題可以轉(zhuǎn)化為解決相應(yīng)的對(duì)偶問(wèn)題:
(2)
其中a是拉格朗日因子.
用核函數(shù)K(xi,xj)代替內(nèi)積〈Φ(xi)·Φ(xj)〉可以將低維空間的數(shù)據(jù)向高維空間進(jìn)行投射:
(3)
利用規(guī)劃問(wèn)題求解,可以求出ai,如果0 (4) 對(duì)于新的樣本xnew,其到超球體球心的距離可表示為: Dnew= (5) 如果Dnew 從以上SVDD的算法可以看出:支持向量數(shù)據(jù)描述的算法將會(huì)轉(zhuǎn)變?yōu)橐粋€(gè)最優(yōu)規(guī)劃的問(wèn)題,在求解過(guò)程中需用到核函數(shù)來(lái)進(jìn)行數(shù)據(jù)計(jì)算,算法的復(fù)雜度明顯增大,隨著樣本個(gè)數(shù)的增加,算法的計(jì)算量也會(huì)呈指數(shù)增長(zhǎng),這樣一來(lái),當(dāng)需要計(jì)算的數(shù)據(jù)很龐大時(shí)就會(huì)產(chǎn)生維數(shù)災(zāi)難.而且由支持向量機(jī)理可知:只有“支持向量”才會(huì)對(duì)數(shù)據(jù)的分類起作用,但是支持向量在數(shù)據(jù)很龐大時(shí)所占的比重較小.因此,需要花費(fèi)大量時(shí)間去優(yōu)化非支持向量,浪費(fèi)大量的有用計(jì)算時(shí)間. 主元分析(principal component analysis,PCA)是多元統(tǒng)計(jì)過(guò)程常用的方法,是將數(shù)據(jù)的主要信息方向作為新的數(shù)據(jù)空間的坐標(biāo)方向,從而達(dá)到數(shù)據(jù)從高維空間向低維空間的變換. (1) 初始化:設(shè)數(shù)據(jù)樣本X={x1,x2,…,xM},其中每個(gè)樣本xi的維數(shù)為n. (2) 預(yù)處理:對(duì)數(shù)據(jù)樣本集X={x1,x2,…,xM}中的每個(gè)樣本xi∈X進(jìn)行中心標(biāo)準(zhǔn)化處理,從而得到新的樣本集X′. (3) 計(jì)算協(xié)方差矩陣.根據(jù)式(6)計(jì)算經(jīng)過(guò)預(yù)處理的樣本集的協(xié)方差矩陣C (6) (4) 計(jì)算特征值和特征向量.求上述協(xié)方差矩陣的所有特征值λi,當(dāng)λi≠0時(shí),計(jì)算其對(duì)應(yīng)的特征向量pi. (5) 計(jì)算累計(jì)貢獻(xiàn)率并求解各特征值λi的累計(jì)貢獻(xiàn)率a: (7) 其中:z表示值不為0的特征值的個(gè)數(shù).選取貢獻(xiàn)率大的特征值所對(duì)應(yīng)的特征向量組成優(yōu)化特征向量集合為P. (6)主元空間及殘差空間的表示如下: (8) 2.2.1 建模描述 首先,在采集的原始數(shù)據(jù)基礎(chǔ)上,通過(guò)主元分析進(jìn)行特征提取,獲得維數(shù)簡(jiǎn)約的樣本數(shù)據(jù);其次,將主元空間和殘差空間得分矩陣分別運(yùn)用SVDD算法確定闕值R1及R2. 2.2.2 檢測(cè)模型描述 ① 采集故障數(shù)據(jù):數(shù)據(jù)發(fā)生故障時(shí)在不同的設(shè)備中會(huì)有不同的表現(xiàn),在機(jī)器設(shè)備中,可以將震動(dòng)信號(hào)作為發(fā)生故障的信號(hào);在發(fā)動(dòng)機(jī)設(shè)備中,可以通過(guò)振動(dòng)的頻信號(hào)作為特征信號(hào). ② 應(yīng)用PCA方法對(duì)采集的數(shù)據(jù)進(jìn)行降維,降低數(shù)據(jù)的復(fù)雜度. ③ 利用SVDD算法對(duì)主元空間進(jìn)行故障檢測(cè):對(duì)主元空間得分矩陣?yán)肧VDD算法進(jìn)行故障檢測(cè),計(jì)算其到超球球心的距離D1,如果得到的距離D1大于半徑R1,則為故障樣本,否則轉(zhuǎn)入步驟④. ④ 利用SVDD算法對(duì)殘差空間進(jìn)行故障檢測(cè):對(duì)殘差空間得分矩陣?yán)肧VDD算法進(jìn)行故障檢測(cè),計(jì)算其到超球球心的的距離D2,如果得到的距離D2大于半徑R2,則為故障樣本,如果得到的距離D2小于半徑R2,則為正常樣本. 建模及檢測(cè)流程如圖1所示. 圖1 建模及檢測(cè)流程Fig.1 Modeling and testing flow chart 首先進(jìn)行一個(gè)數(shù)值仿真的實(shí)驗(yàn),然后又對(duì)TE過(guò)程數(shù)據(jù)進(jìn)行實(shí)驗(yàn),驗(yàn)證了該方法的有效性. 過(guò)程數(shù)據(jù)產(chǎn)生如式(9)所示: x1=x2+e x2=x+e (9) 其中:x服從N(0,1)分布,e為噪聲,服從N(0,1)分布. 產(chǎn)生700個(gè)訓(xùn)練數(shù)據(jù),53個(gè)測(cè)試數(shù)據(jù)(50個(gè)校驗(yàn)數(shù)據(jù)及3個(gè)故障數(shù)據(jù)).選取第一個(gè)變量作為主元,第二個(gè)變量作為殘差主元.圖2為SVDD與PCA-SVDD方法的檢測(cè)結(jié)果. 圖2 PCA-SVDD及SVDD檢測(cè)結(jié)果Fig.2 PCA-SVDD and SVDD test results 由圖2可以看出:PCA-SVDD的誤報(bào)數(shù)比SVDD明顯減少.由支持向量機(jī)理可知,只有支持向量對(duì)分類起決定的作用,在沒(méi)有降維的情況下,支持向量所占的比重小,不能進(jìn)行很好的分類;PCA-SVDD通過(guò)主元提取獲得更多的支持向量,支持向量所占的比重增大,可以更好地分類,從而降低了誤報(bào).另外從檢測(cè)時(shí)間上來(lái)看,PCA-SVDD提取出數(shù)據(jù)的特征,獲得維數(shù)簡(jiǎn)約的樣本數(shù)據(jù),在計(jì)算時(shí)間上也比SVDD方法的用時(shí)短.圖3為SVDD及PCA-SVDD各個(gè)樣本所用時(shí)間折線圖,可以更加直觀地看出兩種方法各個(gè)樣本的用時(shí),證明了PCA-SVDD具有縮短檢測(cè)時(shí)間的優(yōu)勢(shì). 圖3 SVDD及PCA-SVDD時(shí)間折線圖Fig.3 SVDD and PCA-SVDD time line chart Tennessee Eastman過(guò)程中共包含有41個(gè)測(cè)量變量和12個(gè)控制變量,其中41個(gè)測(cè)量變量又可以劃分為22個(gè)過(guò)程測(cè)量變量以及19個(gè)成分測(cè)量變量.在應(yīng)用過(guò)程驗(yàn)證監(jiān)控方法性能時(shí),一般選擇22個(gè)連續(xù)過(guò)程測(cè)量變量和12個(gè)控制變量作為監(jiān)控變量,仿真數(shù)據(jù)集包含了正常工況和21種不同的故障,每種狀態(tài)分別包括480組訓(xùn)練數(shù)據(jù)和960組測(cè)試數(shù)據(jù),在所有的過(guò)程監(jiān)測(cè)測(cè)試數(shù)據(jù)中,故障均從第161組數(shù)據(jù)開始引入故障.現(xiàn)對(duì)幾種典型的故障進(jìn)行檢測(cè),即故障1(階躍型)、故障2(階躍型)、故障8(隨機(jī)型)、故障13(慢偏移型).圖4為故障1的檢測(cè)結(jié)果,圖5為4組故障的檢測(cè)效率及所用時(shí)間柱狀圖,表1為 4種故障的故障檢測(cè)率及所用時(shí)間的統(tǒng)計(jì). 表1 4種故障的檢測(cè)結(jié)果Table 1 4 the fault detection results 選取前3個(gè)變量作為主元,第4至第6個(gè)變量作為殘差主元.由圖4可以看出PCA-SVDD方法的檢測(cè)效果要優(yōu)于SVDD.這是因?yàn)镾VDD方法所獲得的支持向量的個(gè)數(shù)少,支持向量所占的比重小,不能進(jìn)行很好地分類;PCA-SVDD方 法通過(guò)主元提取獲得更多的支持向量,支持向量所占的比重增大,這樣可以更好地分類.利用PCA-SVDD的故障檢測(cè)方法可以有效地提取數(shù)據(jù)的特征,獲得維數(shù)簡(jiǎn)約的樣本數(shù)據(jù),在計(jì)算時(shí)間上也比SVDD方法的用時(shí)短.從表1可以看出:PCA-SVDD方法的兩項(xiàng)指標(biāo)的檢測(cè)效果明顯優(yōu)于SVDD方法. 圖4 故障1檢測(cè)結(jié)果Fig.4 The results of fault detection 1 圖5 故障檢測(cè)率及所用時(shí)間Fig.5 The fault detection rate and time histograms used 針對(duì)傳統(tǒng)SVDD算法對(duì)大樣本集操作時(shí)的檢測(cè)時(shí)間長(zhǎng)、檢測(cè)效率低等不足,提出了一種PCA和SVDD結(jié)合的故障檢測(cè)方法,該方法有兩個(gè)優(yōu)勢(shì):一是利用SVDD算法對(duì)主元空間得分及殘差空間得分進(jìn)行檢測(cè),與傳統(tǒng)的SVDD算法對(duì)所有數(shù)據(jù)都進(jìn)行檢測(cè)相比,降低了檢測(cè)時(shí)間;二是,相較于傳統(tǒng)的SVDD算法,PCA-SVDD將PCA有效提取數(shù)據(jù)特征的優(yōu)勢(shì)與SVDD可以有效地處理非高斯非線性數(shù)據(jù)的優(yōu)勢(shì)相結(jié)合,在突出有效特征信息的同時(shí)又獲得更多的支持向量,使支持向量所占的比重增大,有利于SVDD更好地進(jìn)行分類,避免了漏檢率,從而提高了故障檢測(cè)率. : [1] 趙曉君,鄭倩.基于PCA-KNN聚類的通用在線故障診斷算法設(shè)計(jì)[J].計(jì)算機(jī)測(cè)量與控制,2015,23(8):2762-2765. [2] KARIMI H R,ZAPATEIRO M,LUO N.A Linear Matrix Inequality Approach to Robust Fault Detection Filter Design of Linear Systems with Mixed Time-Varying Delays and Non-linear Perturbations[J].Journalof The Franklin Institute.2010,347(6):957-973. [3] 孫蓉,劉勝,張玉芳.基于參數(shù)估計(jì)的一類非線性系統(tǒng)故障診斷算法[J].控制與決策,2014,29(3):506-510. [4] 王國(guó)剛,史澤林,劉云鵬.多分辨率迭代切距離及其在目標(biāo)識(shí)別中的應(yīng)用[J].紅外與激光工程,2012,41(5):1369-1373. [5] 周東華,李鋼,李元.數(shù)據(jù)驅(qū)動(dòng)的工業(yè)過(guò)程故障診斷技術(shù)——基于主元分析與偏最小二乘的方法[M].北京:科學(xué)出版社,2011:1-14. [6] 郭金玉,趙璐璐,李元.基于統(tǒng)計(jì)特征的不等長(zhǎng)間歇過(guò)程故障診斷研究[J].計(jì)算機(jī)應(yīng)用研究,2014,31(1):128-130. [7] 楊正永,王昕,王振雷.一種非線性過(guò)程監(jiān)控方法[J].計(jì)算機(jī)與應(yīng)用化學(xué),2013,30(10):1131-1134. [8] CHANG Y Q,LU Y S,WANG F L,et al.Sub-Stage PCA Modelling and Monitoring Method for Uneven-Length Batch Processes[J].The Canadian Journal of Chemical Engineering,2012,90(1):144-152. [9] WISE B M,RICKER N L,VELTKAMP D F,et al.A Theoretical Basis for The Use of Principal Component Models for Monitoring Multivariate Processes[J].Process Control & Quality,1990,1(1):41-51. [10] KRESTA J V,MACGREGOR J F,MARLIN T E.Multivariate Statistical Monitoring of Process Operating Performance[J].The Canadian Journal of Chemical Engineering,1991,69(1):35-47. [11] 苑天琪,胡靜,文成林.T-PLS下相關(guān)系數(shù)矩陣對(duì)質(zhì)量影響的研究[J].杭州電子科技大學(xué)學(xué)報(bào),2013,33(6):120-123. [12] GE Z Q,SONG Z H.Process Monitoring Based on Independent Component Analysis-Principal Component Analysis(ICA-PCA)and Similarity Factors[J].Industrial and Engineering Chemistry Research,2007,46(7):2054-2063. [13] 徐瑩,鄧曉剛,鐘娜.基于ICA混合模型的多工況過(guò)程故障診斷方法[J].化工學(xué)報(bào),2016,67(9):3793-3803. [14] TAX D M J,DUIN R P W.Support Vector Data Description[J].Machine Learning,2004,54(1):45-66. [15] 謝彥紅,孫呈敖,李元.基于滑動(dòng)窗口SVDD的間歇過(guò)程故障監(jiān)測(cè)[J].信息與控制,2015,44(5):531-537. [16] 張少捷,王振雷,錢鋒.基于LTSA的FS-SVDD方法及其在化工過(guò)程監(jiān)控中的應(yīng)用[J].化工學(xué)報(bào),2010,61(8):1894-1900. [17] 楊正永,王昕,王振雷.基于LTSA-Greedy-SVDD的過(guò)程監(jiān)控[J].華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,40(3):342-348.2 基于PCA的SVDD故障檢測(cè)
2.1 主元分析(PCA)
2.2 PCA-SVDD建模及檢測(cè)
3 仿真實(shí)驗(yàn)
3.1 數(shù)值仿真
3.2 TE過(guò)程仿真
4 結(jié) 論