杜海蓮,苗詩瑜,杜文霞,劉小亮
(1.河北師范大學(xué) 職業(yè)技術(shù)學(xué)院 河北 石家莊 050024;2.北京交通大學(xué) 電氣工程學(xué)院 北京 100044;3.石家莊鐵道大學(xué) 四方學(xué)院 河北 石家莊 051132)
改進(jìn)PCA方法在化工過程中的故障診斷研究
杜海蓮1,苗詩瑜2,杜文霞1,劉小亮3
(1.河北師范大學(xué) 職業(yè)技術(shù)學(xué)院 河北 石家莊 050024;2.北京交通大學(xué) 電氣工程學(xué)院 北京 100044;3.石家莊鐵道大學(xué) 四方學(xué)院 河北 石家莊 051132)
為了使化工生產(chǎn)中復(fù)雜系統(tǒng)的故障判斷更加精準(zhǔn)、更加有說服力,采集系統(tǒng)正常工作和故障狀態(tài)時(shí)的數(shù)據(jù),運(yùn)用改進(jìn)的主元分析(PCA)算法判斷系統(tǒng)是否有故障產(chǎn)生。改進(jìn)的主元分析算法是在傳統(tǒng)主元分析的基礎(chǔ)上將平方預(yù)測誤差SPE統(tǒng)計(jì)量分化成與主元顯著關(guān)聯(lián)的檢測變量殘差(PVR)統(tǒng)計(jì)量和其余一般變量殘差(CVR)統(tǒng)計(jì)量,再與Hotelling’sT2統(tǒng)計(jì)量相配合進(jìn)行系統(tǒng)故障的判斷,使檢測到的結(jié)果更加精準(zhǔn),生產(chǎn)過程更加安全。將此改進(jìn)的主元分析方法運(yùn)用到田納西—伊斯曼過程中,仿真結(jié)果驗(yàn)證了該方法可以有效識別系統(tǒng)處于正常工況狀態(tài)還是故障狀態(tài),是一種系統(tǒng)故障分析和診斷的有效方法。
主元分析;故障診斷;生產(chǎn)安全
現(xiàn)代化工生產(chǎn)過程日趨復(fù)雜,系統(tǒng)中的變量增多,如傳感器個(gè)數(shù)多,需要檢測的數(shù)據(jù)很龐大,檢測起來有一定的困難,并且不同的生產(chǎn)系統(tǒng)組成不盡相同,都有自身的特殊性,不適用同一種檢測規(guī)律進(jìn)行檢測,而主元分析(principal component analysis,PCA)解決了這個(gè)問題。主元分析算法是利用系統(tǒng)自身的正常工作數(shù)據(jù)進(jìn)行建模,之后再根據(jù)輸入的工作數(shù)據(jù)進(jìn)行故障的判斷,解決了系統(tǒng)不同所導(dǎo)致的檢測規(guī)律不通用的問題,使算法的使用范圍大大擴(kuò)大,并提供了便利的檢測方法[1-3]。
傳統(tǒng)的主元分析方法能夠成功的將一些系統(tǒng)中的故障信息反饋出來,是通過平方預(yù)測誤差SPE(squared prediction error)統(tǒng)計(jì)量(即Q統(tǒng)計(jì)量)和Hotelling’sT2統(tǒng)計(jì)量來檢測,若有工作數(shù)據(jù)超出了控制限的大小,說明該系統(tǒng)在這一采樣點(diǎn)處有故障出現(xiàn),便于通知給工作人員進(jìn)行檢查[4-6]。
但是這兩個(gè)統(tǒng)計(jì)量導(dǎo)致有四種檢測結(jié)果出現(xiàn),其中當(dāng)Hotelling’sT2統(tǒng)計(jì)量可以看出很顯著的變化而SPE統(tǒng)計(jì)量幾乎看不出變化時(shí)無法準(zhǔn)確判斷是系統(tǒng)工作狀態(tài)發(fā)生了變化還是真的有故障產(chǎn)生,而解決這一缺陷的方法,是將SPE統(tǒng)計(jì)量進(jìn)行分離[7-9],這樣一來,就有四個(gè)統(tǒng)計(jì)量一起對系統(tǒng)進(jìn)行檢測,準(zhǔn)確度得到了提升,更重要的是這種方法可以準(zhǔn)確的告訴工作人員是否確有故障發(fā)生。
文獻(xiàn)[7]將這種方法運(yùn)用到粘菌素發(fā)酵過程中,得到了有效的故障檢測結(jié)果,并且檢測的結(jié)果更加精確,工作效率更高;文獻(xiàn)[8]應(yīng)用改進(jìn)的主元分析方法,并以β-甘露聚糖酶發(fā)酵過程為對象,得到了有效的統(tǒng)計(jì)量檢測圖;文獻(xiàn)[9]應(yīng)用改進(jìn)的PCA算法檢測了雙效蒸發(fā)過程的故障,同樣得到了有效的檢測結(jié)果;而文獻(xiàn)[10]則是運(yùn)用傳統(tǒng)的主元分析進(jìn)行鍋爐系統(tǒng)的故障診斷,通過比較傳統(tǒng)和改進(jìn)的PCA兩種方法,可以看到改進(jìn)后的主元分析更加可靠。
以上文獻(xiàn)均是將主元分析方法運(yùn)用到個(gè)別的實(shí)際系統(tǒng)中進(jìn)行檢測,但是隨著生產(chǎn)系統(tǒng)的日趨復(fù)雜繁瑣,也為了保證此方法確實(shí)可靠準(zhǔn)確,還應(yīng)該將該方法應(yīng)用到更加復(fù)雜的生產(chǎn)系統(tǒng)中,如田納西—伊斯曼系統(tǒng),這種系統(tǒng)的生產(chǎn)過程非常復(fù)雜繁瑣,其系統(tǒng)內(nèi)部以及各個(gè)部分之間的數(shù)據(jù)聯(lián)系也非常龐大,將其作為評價(jià)過程控制和監(jiān)測方法的基準(zhǔn),在此系統(tǒng)中進(jìn)行改進(jìn)的主元分析的檢驗(yàn)是非??煽康摹?/p>
傳統(tǒng)主元分析方法的主要步驟是:首先從工程現(xiàn)場采集系統(tǒng)各個(gè)傳感器的工作數(shù)據(jù)信息建立一個(gè)m×n的矩陣X,其中:m為采樣點(diǎn)個(gè)數(shù),n為傳感器個(gè)數(shù)也即該系統(tǒng)中所要檢測的變量個(gè)數(shù)。通過主元分析的建模算法在這些變量中得到b個(gè)主元變量,因?yàn)檫@b個(gè)變量對系統(tǒng)最終檢測到的數(shù)據(jù)變化的貢獻(xiàn)率>85%,它們提供的數(shù)據(jù)信息量已經(jīng)達(dá)到了我們對于生產(chǎn)過程檢測的精度要求。之后再對這些主元數(shù)據(jù)構(gòu)成的矩陣進(jìn)行分解和分析,算出平方預(yù)測誤差SPE(即Q統(tǒng)計(jì)量)和T2兩個(gè)統(tǒng)計(jì)量指標(biāo),以及它們各自的控制限,通過MATLAB平臺畫出相應(yīng)的圖觀察是否有故障發(fā)生。
下面介紹傳統(tǒng)PCA具體建模算法:將檢測到的現(xiàn)場數(shù)據(jù)組成m×n的矩陣X,m可以理解為在一定時(shí)間內(nèi)在m個(gè)不同的時(shí)間點(diǎn)采集了m組數(shù)據(jù),即為m個(gè)采樣點(diǎn),每一次采集的數(shù)據(jù)中又包括了n個(gè)變量(傳感器)的信息,用下式表示:
X=(x1,x2,…,xm)T。
(1)
其中,每一個(gè)xi都是一個(gè)行向量,有n個(gè)參數(shù),即每一個(gè)xi代表一個(gè)采樣點(diǎn)的數(shù)據(jù)。
但由于一般從生產(chǎn)現(xiàn)場采集過來的每一個(gè)傳感器的數(shù)據(jù)單位都不相同,所以在進(jìn)行主元算法建模之前要對這些數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化處理的方式有很多,其中一種標(biāo)準(zhǔn)化處理方式是將原始數(shù)據(jù)矩陣中的數(shù)據(jù)減去其相應(yīng)傳感器此次檢測的所有數(shù)據(jù)的均值,再除以其方差,可以得到標(biāo)準(zhǔn)化后的矩陣Y,具體公式為:
(2)
Y矩陣的協(xié)方差矩陣S為:
(3)
得到協(xié)方差S后,便可以求取主元個(gè)數(shù)了,首先求出S的特征值λi和特征向量P,并將特征值按照由大到小排列,即λ1≥λ2≥λ3≥…≥λn≥0
根據(jù)累計(jì)貢獻(xiàn)率得出主元個(gè)數(shù),將特征值從大到小逐次相加,將每一次的和除以所有特征值的和,當(dāng)結(jié)果達(dá)到85%及以上時(shí)的特征值個(gè)數(shù)即為主元個(gè)數(shù)b,公式為:
(4)
因b個(gè)主元對于最終的數(shù)據(jù)變化提供的貢獻(xiàn)達(dá)到了85%以上,提供的數(shù)據(jù)信息量可以達(dá)到精度要求。此時(shí),矩陣Y就可以分解為主元空間和殘差空間兩部分,即:
Y=TPT+M。
(5)
(6)
至此,主元分析的建模部分就結(jié)束了,之后計(jì)算兩個(gè)統(tǒng)計(jì)量的大小及其控制限,并將數(shù)據(jù)放入程序畫出圖像比較是否數(shù)據(jù)超出了控制限即可,若超出了說明有故障產(chǎn)生,若都在控制限以下說明系統(tǒng)正常運(yùn)行。
首先SPE統(tǒng)計(jì)量Q為:
(7)
控制限為Qα:
(8)
(9)
此時(shí)說明工作正常,沒有故障產(chǎn)生,否則說明系統(tǒng)工作不正常。
T2統(tǒng)計(jì)量為:
T2=xTPΛ-1PTx。
(10)
(11)
其中:Fb,n-b,α是自由度為b,n-b,置信度為α的F分布臨界值。
(12)
此時(shí)說明系統(tǒng)正常工作,否則屬于不正常狀態(tài)。
SPE統(tǒng)計(jì)量稱為平方預(yù)測誤差,檢測的是系統(tǒng)中所檢測變量的變化,SPE統(tǒng)計(jì)量超過控制限時(shí)說明變量之間的相關(guān)性發(fā)生了變化,有過程故障產(chǎn)生;只有T2統(tǒng)計(jì)量發(fā)生變化時(shí)說明可能有工況的變化發(fā)生,但變量之間的相關(guān)性依然滿足。所以當(dāng)T2統(tǒng)計(jì)量有顯著變化,而SPE統(tǒng)計(jì)量沒有顯著變化時(shí)無法判斷是工況引起的變化還是系統(tǒng)確有故障產(chǎn)生,使得檢測效果不好,精確度不高。
通過分析得知,T2統(tǒng)計(jì)量檢測的是與主元顯著相關(guān)的變量的信息,而SPE統(tǒng)計(jì)量檢測的是被檢測數(shù)據(jù)的殘差的信息,所以我們只要把SPE統(tǒng)計(jì)量中與主元相關(guān)的變量分離出來就可以與T2統(tǒng)計(jì)量更好的相配合檢測系統(tǒng)故障。
傳統(tǒng)的主元分析算法中用到了SPE和T2兩個(gè)統(tǒng)計(jì)量,首先要指出SPE統(tǒng)計(jì)量統(tǒng)計(jì)的是正常建模數(shù)據(jù)本身內(nèi)部數(shù)據(jù)之間的聯(lián)系是否遭到破壞及遭到破壞的程度,T2統(tǒng)計(jì)量統(tǒng)計(jì)的是檢測到的(噪聲)數(shù)據(jù)與主元子空間的距離,又由于T2統(tǒng)計(jì)量本身包括主元子空間和殘差子空間,所以T2統(tǒng)計(jì)量的控制限比SPE統(tǒng)計(jì)量的控制限要大的多。而且T2統(tǒng)計(jì)量檢測與主元明顯關(guān)聯(lián)的那些檢測變量的信息,SPE統(tǒng)計(jì)量檢測變量殘差的信息,兩種統(tǒng)計(jì)量的重點(diǎn)也并不一致。
以上兩種統(tǒng)計(jì)量檢測出來的結(jié)果有四種:SPE有很大變化而T2沒有明顯變化,此情況說明變量之間的相關(guān)性發(fā)生了變化,系統(tǒng)有故障產(chǎn)生;兩者都沒有明顯變化說明沒有故障產(chǎn)生,系統(tǒng)正常運(yùn)行;兩者都有明顯變化說明系統(tǒng)有故障產(chǎn)生,但是當(dāng)T2有明顯變化,而SPE沒有明顯變化時(shí),就分不清是工況發(fā)生了變化還是數(shù)據(jù)之間的聯(lián)系遭到了破壞,不能準(zhǔn)確的檢測出故障的原因,所以針對此不利因素,對傳統(tǒng)的主元分析按照以下的方法進(jìn)行改進(jìn)。
假設(shè)過程變量中與主元顯著相關(guān)的變量有s個(gè),它們構(gòu)成的殘差統(tǒng)計(jì)量為PVR(principal-component-related variable residual)統(tǒng)計(jì)量,其余的(n-s)個(gè)變量構(gòu)成的殘差的統(tǒng)計(jì)量為CVR(common variable residual)統(tǒng)計(jì)量,即將SPE統(tǒng)計(jì)量分成了兩個(gè)統(tǒng)計(jì)量PVR和CVR,并有:
(13)
(14)
通過計(jì)算過程變量與主元的復(fù)相關(guān)系數(shù)可以確定s的大小,復(fù)相關(guān)系數(shù)的平方為:
(15)
其中:pi,j是特征向量P的元素,λi是特征值。
復(fù)相關(guān)系數(shù)的平方反映某個(gè)變量被主元概括了多少信息[8]。
s的確定方法是:將算出的相關(guān)系數(shù)中大于0.85的系數(shù)相加,那么這些被加入到其中的相關(guān)系數(shù)個(gè)數(shù)即為s,通過這些系數(shù)的和可以算出wPVR,從而也可以算出wCVR的值,進(jìn)而得到兩個(gè)統(tǒng)計(jì)量的大小,實(shí)現(xiàn)改進(jìn)的主元分析的故障診斷。
接下來建立PVR和CVR統(tǒng)計(jì)量的控制限:
Qα=PVRα+CVRα=wPVRQα+wCVRQα,
(16)
PVRα=wPVRQα,
(17)
CVRα=wCVRQα,
(18)
wCVR=1-wPVR,
(19)
(20)
s表示與主元相關(guān)的過程的變量。由此就將SPE統(tǒng)計(jì)量分解成了兩個(gè)統(tǒng)計(jì)量,這樣使檢測的結(jié)果更加精確。最終檢測與傳統(tǒng)的主元分析進(jìn)行比較,判斷改進(jìn)的分析方法是否提高精確度。
3.1 田納西伊斯曼過程
田納西伊斯曼過程(TennesseeEastmanProcess,TEprocess),是Downs和Vogel提出的一種標(biāo)準(zhǔn)測試(Benchmark)過程。田納西伊斯曼過程包括41個(gè)測量變量和11個(gè)控制變量。這些數(shù)據(jù)包含正常狀態(tài)和21種不同的故障,每種狀態(tài)包括訓(xùn)練部分和測試部分,分別為480和960組數(shù)據(jù),可見田納西伊斯曼過程的數(shù)據(jù)非常龐大,各部分之間的聯(lián)系也是非常緊密的,正是由于田納西伊斯曼系統(tǒng)很強(qiáng)的代表性,因此可以將田納西伊斯曼過程作為評價(jià)過程控制和監(jiān)測方法的基準(zhǔn)工業(yè)過程。根據(jù)此系統(tǒng)提供的數(shù)據(jù)來驗(yàn)證改進(jìn)后的主元分析方法是否提高故障檢測的準(zhǔn)確性,其過程如圖1所示。
圖1 田納西伊斯曼過程示意圖
3.2 改進(jìn)的PCA方法檢測故障結(jié)果分析
給該系統(tǒng)設(shè)置不同的故障,得到相應(yīng)的故障數(shù)據(jù),再次代入到程序中,得到的檢測結(jié)果如圖2所示:
圖2 故障4時(shí)數(shù)據(jù)檢測圖
在故障4中,故障產(chǎn)生的原因是田納西伊斯曼系統(tǒng)中的反應(yīng)器冷卻水入口溫度發(fā)生階躍變化,分別用傳統(tǒng)主元分析和改進(jìn)主元分析進(jìn)行檢測的圖示如圖2所示:
在第162個(gè)采樣點(diǎn)之后的數(shù)據(jù)使得SPE統(tǒng)計(jì)量發(fā)生了顯著變化,在這一部分可以確定明過程變量之間的相關(guān)性發(fā)生了變化,且還看到PVR統(tǒng)計(jì)量有非常明顯的超過控制限的現(xiàn)象,又進(jìn)一步說明了系統(tǒng)的過程變量發(fā)生了變化,確有故障產(chǎn)生。
但是在第162采樣點(diǎn)之前,T2統(tǒng)計(jì)量超過了控制限,而SPE統(tǒng)計(jì)量沒有明顯變化,無法判斷是工況的變化還是故障引起的變化,這時(shí)可以看到PVR統(tǒng)計(jì)量明顯超過了控制限,因此可以判定是這部分也有故障發(fā)生。
可見,利用改進(jìn)的主元分析方法可以更加準(zhǔn)確地判定故障產(chǎn)生與否。
在故障10中,故障產(chǎn)生的原因是物料C溫度隨機(jī)變化,同樣檢測得到的結(jié)果如圖3所示。
圖3 故障10數(shù)據(jù)檢測圖
由圖3可見,同樣在SPE統(tǒng)計(jì)量162個(gè)采樣點(diǎn)之后有明顯的變化,說明有故障產(chǎn)生,結(jié)合PVR統(tǒng)計(jì)量更加證實(shí)了這一結(jié)論,但在162采樣點(diǎn)之前SPE統(tǒng)計(jì)量的變化并不明顯,只是T2統(tǒng)計(jì)量有變化產(chǎn)生,也同樣判斷不出是否有故障產(chǎn)生,通過觀察PVR統(tǒng)計(jì)量便可以確定有故障產(chǎn)生,因?yàn)榕c主元顯著相關(guān)的過程變量有明顯的超過控制限的現(xiàn)象。
通過以上分析可以看出改進(jìn)的主元分析方法不僅可以檢測出系統(tǒng)中的故障,而且結(jié)果更加準(zhǔn)確,更加詳細(xì),可以分清楚是工況的變化還是故障的產(chǎn)生,有效的保證了系統(tǒng)的安全性能。
運(yùn)用改進(jìn)的主元分析對田納西伊斯曼過程進(jìn)行檢測,用正常數(shù)據(jù)建模,之后用工作數(shù)據(jù)進(jìn)行故障的判斷,并通過仿真實(shí)驗(yàn)結(jié)果分析,主元分析檢測出了復(fù)雜系統(tǒng)的生產(chǎn)過程的故障問題,為復(fù)雜系統(tǒng)的安全性問題提供了便捷的檢測和故障診斷方式,對之前故障數(shù)據(jù)不明確的缺陷有了改進(jìn),應(yīng)用改進(jìn)的主元分析方法進(jìn)行系統(tǒng)的故障檢測,結(jié)果準(zhǔn)確度更高和效率更高。
[1]WANG Y F,MA X D,JOYCE M J.Reducing sensor complexity for monitoring wind turbine performance using principal component analysis [J].Renewable Energy,2016,97:444-456.
[2]GAO X,HOU J.An improved SVM integrated GS-PCA fault diagnosis approach of Tennessee Eastman process [J].Neurocomputing,2016,174(22):906-911.
[3]XU X Z,XIE L,WANG S Q.Multimode process monitoring with PCA mixture model[J].Computers & Electrical Engineering,2014,40:2101-2112.
[4]ZHOU B,YE H,ZHANG H F,LI M L.Process monitoring of iron-making process in a blast furnace with PCA-based methods [J].Control Engineering Practice,2016,47:1-14.
[5]PAN Y,YANG C,AN R,et al.Fault detection with improved principal component pursuit method[J].Chemometrics & Intelligent Laboratory Systems,2016,157(1):111-119.
[6]周東華,李鋼,李元.數(shù)據(jù)驅(qū)動的工業(yè)過程故障診斷技術(shù)[M].北京:科學(xué)出版社,2011:23-27,58-59.
[7]肖應(yīng)旺,徐保國.改進(jìn)PCA在發(fā)酵過程監(jiān)測與故障診斷中的應(yīng)用[J].控制與決策,2005,20(5):571-574. XIAO Yingwang,XU Baoguo.Application of improved PCA in the fermentation process monitoring and fault diagnosis [J].Control and Decision,2005,20(5):571-574.
[8]張新榮,熊偉麗,徐保國.基于Q統(tǒng)計(jì)量分量的故障檢測算法研究[J].計(jì)算機(jī)與應(yīng)用化學(xué),2008,25(12):1537-1542. ZHANG Xinrong,XIONG Weili,XU Baoguo.A study of approach on fault detection based on Q statistic component[J].Computers and Applied Chemistry,2008,25(12):1537-1542.
[9]王海清,宋執(zhí)環(huán),李平.改進(jìn)PCA及其在過程監(jiān)測與故障診斷中的應(yīng)用[J].化工學(xué)報(bào),2001,52(6):471-475. WANG Haiqing,SONG Zhihuan,LI Ping.Improved PCA with application to process monitoring and fault diagnosis[J].Journal of Chemical Industry and Engineering,2001,52(6):471-475.
[10]李傳金,王文標(biāo),花義峰,等.基于主元分析的鍋爐系統(tǒng)故障檢測與診斷[J].機(jī)電信息,2016(24):92-93. LI Chuanjin,WANG Wenbiao,HUA Yifeng,et al.Fault detection and diagnosis of boiler system based on principal component analysis [J].Mechanical and Electrical Information,2016(24):92-93.
(責(zé)任編輯:李 磊)
Research on Fault Diagnosis of Chemical Process Based on Improved PCA Method
DU Hailian1, MIAO Shiyu2, DU Wenxia1, LIU Xiaoliang3
(1. College of Career Technology, Hebei Normal University, Shijiazhuang, Hebei 050024, China;2. School of Electrical Engineering, Beijing Jiaotong University, Beijing 100044, China;3. Sifang College, Shijiazhuang Tiedao University, Shijiazhuang, Hebei 051132, China)
In order to further improve the accuracy and persuasiveness of the fault diagnosis of complex system in chemical production, data of the system at normal working state and failure state were collected, and the improved principal component analysis (PCA) algorithm was used to determine whether there was fault in the system. Based on the traditional PCA, the improved PCA algorithm decomposed the squared prediction error (SPE) statistic into principal-component-related variable residual (PVR) statistic and common variable residual (CVR) statistic, and it was then cooperated with Hotelling’sT2statistics to diagnose fault of the system so that the diagnostic results were more accurate and the production process was more safe. Finally, the improved PCA method was applied in Tennessee Eastman process. The results show that this method, being able to identify the normal mode state and fault state more accurately, is an effective method of fault analysis and diagnosis.
PCA; fault diagnosis; production safety
2017-03-11
國家自然科學(xué)基金項(xiàng)目(61673160,60974063,61175059);河北省自然科學(xué)基金項(xiàng)目(F2014205115);河北省教育廳課題(ZD2016053)
杜海蓮(1978—),女,河北保定人,副教授,主要從事故障診斷方面的研究.E-mail: duhailian@126.com 杜文霞(1973—),女,河北衡水人,副教授,博士,主要從事智能監(jiān)測與故障診斷的研究,本文通信作者. E-mail:dwx20040513@163.com
TP206
A
1672-3767(2017)05-0016-07
10.16452/j.cnki.sdkjzk.2017.05.003