蒲健飛,任少君,周東陽,曹 軍,范 偉,司風(fēng)琪
(1.東南大學(xué) 能源熱轉(zhuǎn)換及過程測控教育部重點(diǎn)實(shí)驗(yàn)室,南京 210096;2.西安熱工研究院有限公司,西安 710054)
隨著信息化的發(fā)展,火電機(jī)組自動(dòng)化程度越來越高,對電站設(shè)備的安全性和可靠性提出了更高的要求?;跀?shù)據(jù)驅(qū)動(dòng)的故障監(jiān)測與診斷方法具有數(shù)據(jù)代表性好和方法通用性強(qiáng)等優(yōu)點(diǎn),受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。基于數(shù)據(jù)驅(qū)動(dòng)的故障監(jiān)測和診斷方法主要分為兩類:一類是基于有標(biāo)簽數(shù)據(jù)的有監(jiān)督方法,如人工神經(jīng)網(wǎng)絡(luò)(ANN)[1]、支持向量機(jī)(SVM)[2]等;另一類是基于無標(biāo)簽數(shù)據(jù)的無監(jiān)督方法,如多元統(tǒng)計(jì)方法(MSPM)[3]和高斯混合模型(GMM)[4]等。有監(jiān)督故障診斷方法對于難以獲得大量故障工況樣本的過程具有較大的局限性,并且對未知故障類型診斷能力差;無監(jiān)督故障診斷方法通過設(shè)備正常運(yùn)行數(shù)據(jù)建立故障監(jiān)測模型并計(jì)算故障限值,當(dāng)統(tǒng)計(jì)指標(biāo)超過限值時(shí)進(jìn)行故障預(yù)警。無監(jiān)督故障診斷方法因具有通用性強(qiáng)、建模樣本易獲得等優(yōu)點(diǎn)在工業(yè)領(lǐng)域得到了廣泛的使用。
無監(jiān)督故障診斷方法中基于MSPM的故障診斷算法(如主成分分析(PCA)[5]、偏最小二乘(PLS)算法[6])通過計(jì)算故障監(jiān)測指標(biāo)平方預(yù)測誤差Q和T平方(T2)進(jìn)行故障監(jiān)測,需要設(shè)備運(yùn)行數(shù)據(jù)服從高斯分布才能保證監(jiān)測的限值的有效性[7]。在實(shí)際熱工過程中,隨著負(fù)荷的變化,設(shè)備運(yùn)行模態(tài)(工況)隨之發(fā)生變化,使得設(shè)備運(yùn)行數(shù)據(jù)呈高斯混合分布。針對運(yùn)行數(shù)據(jù)呈高斯混合分布的多模態(tài)過程[8],GE Z Q等[9]通過模糊C均值算法對訓(xùn)練樣本進(jìn)行分割并建立多個(gè)子模型對多模態(tài)過程進(jìn)行監(jiān)測,該方法在線監(jiān)測時(shí)計(jì)算量大,降低了在線監(jiān)測效果。YU J等[10]提出一種基于GMM的多模態(tài)過程故障監(jiān)測方法,并通過基于概率的全局貝葉斯推理作為監(jiān)測指標(biāo)進(jìn)行故障監(jiān)測,但傳統(tǒng)GMM受初始參數(shù)的影響容易陷入局部最優(yōu)解。YANG M S等[11]通過在期望最大化(EM)算法目標(biāo)函數(shù)中加入信息熵的方式提出魯棒高斯混合模型(RGMM)算法,實(shí)現(xiàn)了高斯成分?jǐn)?shù)的自適應(yīng)更新,避免模型參數(shù)陷入局部最優(yōu)。當(dāng)監(jiān)測到故障發(fā)生時(shí)需要進(jìn)一步進(jìn)行故障變量定位,傳統(tǒng)貢獻(xiàn)圖通過計(jì)算故障統(tǒng)計(jì)量貢獻(xiàn)進(jìn)行故障分離,由于拖尾效應(yīng)[12]的影響,造成分離結(jié)果誤診率高。
針對歷史數(shù)據(jù)呈高斯混合分布的多模態(tài)熱工過程,筆者提出一種融合監(jiān)測指標(biāo)的引力搜索算法(GSA)[13]故障分離方法。首先,使用RGMM算法建立故障監(jiān)測模型,監(jiān)測到故障后計(jì)算故障樣本各變量的貢獻(xiàn);其次,利用融合監(jiān)測指標(biāo)的GSA對潛在故障變量進(jìn)行故障重構(gòu);最后,確定樣本中的故障變量。分別采用多模態(tài)數(shù)學(xué)算例和高壓加熱器(簡稱高加)作為研究對象,驗(yàn)證該算法在多模態(tài)熱工過程的故障監(jiān)測和診斷中的有效性。
設(shè)原始數(shù)據(jù)集X∈Rm×n(R為實(shí)數(shù)組成的矩陣)為C個(gè)模態(tài)的測量數(shù)據(jù),X=[x1,x2,…,xm],其中:C為GMM成分?jǐn)?shù);m為樣本數(shù)量;n為變量數(shù)量;x為任意時(shí)刻觀測值。其概率密度函數(shù)p(x|θ)可以表示為:
(1)
第k個(gè)高斯成分的密度函數(shù)為:
(2)
式(2)中模型參數(shù)通過EM算法[14]進(jìn)行迭代求解。
根據(jù)貝葉斯理論計(jì)算隱變量的過程如下。
(3)
調(diào)整系數(shù)β(0≤β≤1)可以定義為:
(4)
然后更新模型參數(shù),即
(5)
(6)
(7)
(8)
(9)
RGMM算法計(jì)算流程見表1。
表1 RGMM算法計(jì)算流程
當(dāng)設(shè)備發(fā)生故障時(shí)需要及時(shí)進(jìn)行故障預(yù)警,防止故障進(jìn)一步惡化。針對多模態(tài)過程,建立基于RGMM的故障監(jiān)測模型并通過故障監(jiān)測指標(biāo)GBID和GBIP進(jìn)行故障預(yù)警。
定義樣本點(diǎn)x對于第k個(gè)高斯成分的修正馬氏距離Dr為:
Dr[(x,Ck)|x∈Ck]=
(x-μk)T(vk+φI)-1(x-μk)
(10)
式中:φ為極小值,用于去除協(xié)方差矩陣的奇異性;I為單位矩陣。
樣本x屬于第k個(gè)高斯成分的后驗(yàn)概率P(Ck|x)為:
(11)
全局監(jiān)測指標(biāo)GBIP定義為:
Dr[(x,Ck)|x∈Ck]}
(12)
選取置信度為γ,當(dāng)GBIP>γ時(shí),認(rèn)為設(shè)備發(fā)生故障,反之,認(rèn)為設(shè)備運(yùn)行正常[10]。
基于局部馬氏距離的全局監(jiān)測指標(biāo)[15]GBID為:
(13)
GBID指標(biāo)的限值L根據(jù)F分布[16]計(jì)算,計(jì)算公式為:
企業(yè)對于IPO的困惑,宋彬也給予了解讀?!靶氯迤髽I(yè)IPO始于2007年,受企業(yè)資質(zhì)和IPO暫緩等因素的影響,歷年IPO數(shù)量分布不均。2016年前,新三板企業(yè)IPO數(shù)量較少,2017年以來,已成功IPO的新三板企業(yè)數(shù)量激增,其中2018年已達(dá)18家?!睆男氯迤髽I(yè)IPO情況來看,截至2018年9月30日,已有55家新三板企業(yè)成功過會(huì),其中已有48家成功登陸A股市場?!靶氯迤髽I(yè)IPO板塊中,目前55家已過會(huì)的新三板企業(yè)中,有28家選擇登陸創(chuàng)業(yè)板,9家選擇登陸中小板,18家選擇登陸主板,符合新三板企業(yè)‘小而精’的總體特征?!?/p>
(14)
式中:L為置信度為γ時(shí)的GBID指標(biāo)的限值;γ的取值通常為95%和99%;n和p分別代表樣本數(shù)量和變量數(shù)。當(dāng)GBID≥L認(rèn)為設(shè)備發(fā)生故障,反之則運(yùn)行正常。
當(dāng)故障監(jiān)測指標(biāo)超過限值時(shí),表明設(shè)備發(fā)生故障,需要進(jìn)一步進(jìn)行故障分離,分離出故障發(fā)生的參數(shù),定位故障變量。
基于重構(gòu)的故障分離方法為根據(jù)故障變量通過測量值x找出對應(yīng)的正常值x*,即單故障時(shí)為x*=x-s(p)fp,多故障時(shí)為x*=x-s(p)fp-s(q)fq。其中:s(p)、s(q)為故障變量;fp、fq分別為s(p)、s(q)對應(yīng)的故障幅值?;贕SA重構(gòu)的故障分離方法是通過找出故障變量和對應(yīng)的故障幅值使故障監(jiān)測指標(biāo)達(dá)到最小值。
以GBID監(jiān)測指標(biāo)為例:
Dr[(x-sf),Ck]}
(15)
當(dāng)GBID降到控制限以下時(shí),表明s為真正的故障變量,f為對應(yīng)的故障幅值。
GSA是一種源于萬有引力定律的啟發(fā)式智能優(yōu)化算法,通過粒子位置的移動(dòng)搜索空間中的最優(yōu)位置,獲得優(yōu)化問題的最優(yōu)解,GSA具有收斂速度快、全局搜索能力強(qiáng)的優(yōu)點(diǎn)[13]。
將故障重構(gòu)轉(zhuǎn)化為最優(yōu)解問題,選取重構(gòu)故障變量集,當(dāng)minGBID小于限值時(shí),證明該變量集為故障變量,反之,證明該變量集并非真實(shí)的故障變量。
表2 基于GSA-RGMM算法故障重構(gòu)流程
通過重構(gòu)的方式進(jìn)行故障分離需要先預(yù)設(shè)故障變量,再對故障變量進(jìn)行重構(gòu)實(shí)現(xiàn)故障分離,隨著維度的升高,變量組合會(huì)呈指數(shù)增長,計(jì)算量較大。為此,采用組合優(yōu)化的思想是將故障變量逐個(gè)定位出來,計(jì)算出故障樣本在各變量的高斯混合貢獻(xiàn),選取高斯混合貢獻(xiàn)最大的變量加入重構(gòu)變量集,如果重構(gòu)監(jiān)測指標(biāo)低于故障限值,則重構(gòu)變量集即為真實(shí)故障變量,否則根據(jù)重構(gòu)后的樣本更新高斯混合貢獻(xiàn),選取其中貢獻(xiàn)最大的變量加入重構(gòu)變量集,直至重構(gòu)監(jiān)測指標(biāo)低于故障限值,輸出真實(shí)故障變量。
式(10)可以改寫為:
Dr[(x,Ck)|x∈Ck]=
(16)
(17)
(18)
圖1 基于GSA-RGMM算法的故障監(jiān)測與診斷流程
為驗(yàn)證提出的故障監(jiān)測與分離方法的有效性,建立如下數(shù)值案例[10]:
(19)
式中:[e1,e2,e3]T為均值為0、方差為0.01的白噪聲;[s1,s2]T為服從高斯分布的數(shù)據(jù)源。
在數(shù)據(jù)源中設(shè)置如下3種分布狀態(tài),分別表示不同的操作模態(tài)。
(1)分布1:s1=N(5,0.6);s2=N(20,0.7)。
(2)分布2:s1=N(10,0.8);s2=N(12,1.3)。
(3)分布3:s1=N(16,1.5);s2=N(30,2.5)。
由式(19)生成3 000組正常運(yùn)行的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其中3個(gè)模態(tài)各占1 000組,見圖2。
圖2 多模態(tài)仿真數(shù)據(jù)
故障模擬形式為:
xfault=x*+f
(20)
由式(19)生成正常工況樣本,并通過式(20)的方式進(jìn)行故障仿真。
故障1:取500組模態(tài)1數(shù)據(jù),歸一化后從第100組樣本開始,在變量1上加入幅值為0.3~0.5的偏差。
故障2:取500組模態(tài)2數(shù)據(jù),歸一化后從第100組樣本開始,在變量2上加入幅值為0.004(k-100)的偏差,其中k為樣本序號。
故障3:隨機(jī)選取500組3個(gè)模態(tài)數(shù)據(jù),歸一化后從第100組樣本開始隨機(jī)選擇2個(gè)變量分別加入幅值為0.8~1.0的偏差。
通過正常工況樣本訓(xùn)練RGMM并通過GBIP和GBID對故障仿真數(shù)據(jù)進(jìn)行監(jiān)測。為證明RGMM算法的有效性,采用GMM算法和PCA算法對故障仿真數(shù)據(jù)進(jìn)行監(jiān)測,并與RGMM算法進(jìn)行對比,結(jié)果見表3。
表3 故障監(jiān)測準(zhǔn)確率 %
由表3可以看出:在多模態(tài)過程中當(dāng)故障幅度較小時(shí),RGMM算法相比于PCA和GMM算法具有更強(qiáng)的敏感性,監(jiān)測準(zhǔn)確率更高。
當(dāng)監(jiān)測到故障后還需要進(jìn)一步通過故障分離方法定位故障變量,判斷故障類型。采用故障診出率(FDR)和故障誤診率(FAR)這兩個(gè)評價(jià)指標(biāo)對診斷結(jié)果進(jìn)行評價(jià)[17]。有效的故障分離算法具有較高的故障診出率和較低的故障誤診率。
為驗(yàn)證提出的故障分離算法效果,將所提方法與傳統(tǒng)貢獻(xiàn)圖(CP-PCA)、重構(gòu)PCA(RB-PCA)和GMM算法的結(jié)果進(jìn)行對比,結(jié)果見表4。在多模態(tài)過程中由于PCA算法的故障監(jiān)測準(zhǔn)確率較低,導(dǎo)致其故障診出率低于GSA-RGMM算法。當(dāng)故障幅度增加時(shí),受殘差污染的影響,CP-PCA和GMM算法誤診率高于GSA-RGMM算法,表明基于重構(gòu)的 GSA-RGMM算法能有效降低故障誤診率。
表4 故障分離結(jié)果 %
高加作為火電機(jī)組回?zé)嵯到y(tǒng)的重要組成部分,對保障火電機(jī)組的安全經(jīng)濟(jì)運(yùn)行具有重要作用。高加長期運(yùn)行于高溫、高壓和變工況環(huán)境中,容易發(fā)生管路泄漏和積垢等故障,影響機(jī)組安全穩(wěn)定運(yùn)行。以某660 MW燃煤機(jī)組1號高加作為研究對象,采集2020年6月29日—7月4日高加相關(guān)測點(diǎn)數(shù)據(jù)(見圖3)。由圖3可以看出:受調(diào)峰影響,機(jī)組負(fù)荷呈白天高、夜晚低的趨勢,并且高加運(yùn)行參數(shù)與負(fù)荷具有較強(qiáng)的相關(guān)性。
圖3 1號高加運(yùn)行數(shù)據(jù)
1號高加運(yùn)行參數(shù)概率密度分布見圖4。
圖4 1號高加運(yùn)行參數(shù)概率密度分布
由圖4可以看出:高加運(yùn)行參數(shù)呈高斯混合分布。采用穩(wěn)態(tài)篩選算法[18]提取2 000組穩(wěn)態(tài)運(yùn)行數(shù)據(jù)建立基于RGMM、GMM和PCA算法的高加監(jiān)測模型。為驗(yàn)證算法多模態(tài)過程中的故障監(jiān)測與分離的有效性,采用分段熱力計(jì)算方法建立高加故障仿真模型[19],該仿真模型涉及9個(gè)變量,分別為6個(gè)輸入變量(tsin、twin、pwin、h、pst、qmw)和3個(gè)輸出變量(Δt、θ、Dod),具體描述見表5。
表5 1號高加仿真模型變量名稱及范圍
選取800組穩(wěn)態(tài)樣本作為測試樣本,并在201組樣本點(diǎn)處加入表6中所列故障。根據(jù)故障仿真結(jié)果和文獻(xiàn)[19]中的故障特征分析,得出模型故障類型與對應(yīng)故障參數(shù)(見表6)。
表6 1號高加故障列表
通過不同監(jiān)測模型得到高加故障的監(jiān)測準(zhǔn)確率,結(jié)果見表7。
表7 故障監(jiān)測準(zhǔn)確率 %
圖5和圖6分別為故障d、故障e監(jiān)測結(jié)果圖。由圖5和圖6可以看出:RGMM算法相對于PCA算法和GMM算法具有更高的準(zhǔn)確率。在高加建模過程中,RGMM算法在處理分布復(fù)雜的熱工過程數(shù)據(jù)時(shí)相比于GMM算法具有更強(qiáng)的魯棒性,并且模型精度更高。
圖5 故障d的故障監(jiān)測結(jié)果
圖6 故障e的故障監(jiān)測結(jié)果
監(jiān)測到故障后再通過提出的GSA-RGMM算法進(jìn)行故障分離,同時(shí)與基于PCA算法的CP-PCA、RB-PCA和GMM算法進(jìn)行對比,故障分離效果比較見表8,圖7和圖8分別為故障d、故障e的故障分離結(jié)果,所提算法具有更高的故障診出率和較低的故障誤診率。
表8 故障分離結(jié)果 %
圖7 故障d故障分離結(jié)果
圖8 故障e故障分離結(jié)果
為提高多模態(tài)熱工過程故障監(jiān)測與診斷準(zhǔn)確性,采用RGMM算法建立故障監(jiān)測模型,并使用兩個(gè)故障監(jiān)測指標(biāo)(GBIP和GBID)進(jìn)行實(shí)時(shí)故障監(jiān)測,當(dāng)故障指標(biāo)超過限值時(shí)表明設(shè)備發(fā)生了故障。提出GSA-RGMM算法分離相關(guān)故障參數(shù)。該方法先通過高斯混合貢獻(xiàn)法計(jì)算故障樣本各變量的高斯混合貢獻(xiàn),根據(jù)貢獻(xiàn)大小逐步選擇變量加入重構(gòu)變量集,直至基于GSA算法重構(gòu)的監(jiān)測指標(biāo)低于故障限值,輸出故障變量,完成故障分離。
以多模態(tài)數(shù)值算例和某燃煤機(jī)組1號高加為研究對象,驗(yàn)證該算法的有效性,結(jié)果表明:相比于PCA算法和傳統(tǒng)GMM算法,RGMM算法具有較高的故障監(jiān)測準(zhǔn)確率;同時(shí),相比于CP-PCA、RB-PCA和GMM算法,GSA-RGMM算法能準(zhǔn)確分離出故障變量,具有較高的故障診出率和較低的故障誤診率,表明該算法在多模態(tài)熱工過程故障監(jiān)測與診斷中的有效性和可行性。