楊錫運(yùn),鄧子琦,康 寧
(1.華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,北京 102206;2.華北電力大學(xué) 電站設(shè)備狀態(tài)監(jiān)測(cè)與控制教育部重點(diǎn)實(shí)驗(yàn)室,北京 102206;3.北京廣利核系統(tǒng)工程有限公司,北京 102206)
近年來,作為一種清潔、可再生的綠色能源,風(fēng)能的應(yīng)用研究得到了快速發(fā)展。由于環(huán)境惡劣、工況復(fù)雜,風(fēng)力發(fā)電機(jī)組易發(fā)生故障,齒輪箱是風(fēng)力發(fā)電機(jī)的重要組成部分,其油溫升高易發(fā)生齒面膠合等故障[1]。齒輪箱故障導(dǎo)致的停機(jī)時(shí)間和維護(hù)成本在所有類型故障中都非常高,選擇一種良好的齒輪箱油溫狀態(tài)監(jiān)測(cè)和故障診斷方法尤為重要[2]。
深層學(xué)習(xí)思想在數(shù)據(jù)建模領(lǐng)域已有深度應(yīng)用,將其與人工智能算法結(jié)合,利用運(yùn)維數(shù)據(jù)[3]開展基于數(shù)據(jù)驅(qū)動(dòng)的故障預(yù)測(cè)研究正成為研究熱點(diǎn)[4]。劉輝海等[5]提出一種基于風(fēng)電機(jī)組齒輪箱的數(shù)據(jù)采集與監(jiān)視控制(Supervisory Control and Data Acquisition, SCADA)數(shù)據(jù)和振動(dòng)信號(hào)的深度自編碼網(wǎng)絡(luò)模型,通過所搭建的網(wǎng)絡(luò)模型智能學(xué)習(xí)齒輪箱故障前、后深層樣本的每一層特征,得到更抽象更高維的數(shù)據(jù)規(guī)則與分布特點(diǎn)。風(fēng)電機(jī)組狀態(tài)檢測(cè)過程中數(shù)據(jù)量大、故障特征提取困難,針對(duì)該問題,劉秀麗等[6]提出一種基于深度信念網(wǎng)絡(luò)的風(fēng)電機(jī)組齒輪箱故障診斷方法,證明在風(fēng)機(jī)故障診斷問題中,與深度置信網(wǎng)絡(luò)(Deep Belief Networks, DBN)、反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network, BPNN)算法和傳統(tǒng)故障診斷方法相比,該方法利用深度學(xué)習(xí)理論的強(qiáng)大感知與自我學(xué)習(xí)能力能夠提高故障診斷準(zhǔn)確率。ZHONG等[7]將卷積神經(jīng)網(wǎng)絡(luò)與其他人工智能算法結(jié)合,取得了較好的效果,其中卷積神經(jīng)網(wǎng)絡(luò)用于降低數(shù)據(jù)規(guī)模和復(fù)雜程度,提升模型整體的泛化和學(xué)習(xí)能力。深層結(jié)構(gòu)雖然如此強(qiáng)大,但是由于涉及大量超參數(shù)和復(fù)雜的結(jié)構(gòu),使得大多數(shù)模型訓(xùn)練時(shí)間長,而且預(yù)警的準(zhǔn)確率與模型精度的關(guān)系較大。經(jīng)驗(yàn)?zāi)B(tài)分解作為時(shí)頻分析的一種方法,可用于分析振動(dòng)信號(hào),常被用于診斷風(fēng)機(jī)故障[8-10],集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition, EEMD)是其中的一種改進(jìn)算法。王紅君等[11]提出一種基于EEMD小波閾值去噪和布谷鳥算法優(yōu)化BP(back propagation)神經(jīng)網(wǎng)絡(luò)的故障診斷方法,其通過采用EEMD分解和小波閾值去噪方法對(duì)故障振動(dòng)信號(hào)進(jìn)行數(shù)據(jù)預(yù)處理來抑制原始振動(dòng)信號(hào)中的噪聲干擾,實(shí)例仿真表明,所提故障診斷方法具有良好的診斷精度、速度和成功率;顧煜炯等[12]提出一種基于改進(jìn)的多元離群監(jiān)測(cè)方法來解決早期故障診斷,該方法較原始方法能夠更早地察覺風(fēng)電齒輪箱的早期故障,但是存在運(yùn)行工況波動(dòng)和故障特征不易提取的問題。上述經(jīng)驗(yàn)?zāi)B(tài)分解方法在風(fēng)機(jī)故障診斷中的應(yīng)用均基于振動(dòng)信號(hào)進(jìn)行。
本文基于風(fēng)電機(jī)組齒輪箱SCADA系統(tǒng)所得的數(shù)據(jù)樣本,提出基于交叉熵融合EEMD變點(diǎn)檢測(cè)與寬度學(xué)習(xí)系統(tǒng)(Broad Learning System, BLS)的齒輪箱溫度預(yù)警方法。首先分別用EEMD和BLS算法為齒輪箱油溫建立監(jiān)測(cè)模型。EEMD對(duì)齒輪箱油溫時(shí)間序列進(jìn)行時(shí)頻分析,將齒輪箱油溫信號(hào)分解為多個(gè)本征模態(tài)函數(shù)(Intrinsic Mode Function, IMF)分量,計(jì)算健康樣本與待測(cè)樣本的馬氏距離[13];BLS模型對(duì)穩(wěn)定運(yùn)行狀態(tài)下的SCADA數(shù)據(jù)樣本進(jìn)行學(xué)習(xí),建立齒輪箱溫的狀態(tài)監(jiān)測(cè)模型,并計(jì)算待測(cè)樣本經(jīng)模型預(yù)測(cè)所得的預(yù)測(cè)油溫曲線與真實(shí)曲線的關(guān)聯(lián)程度。然后通過計(jì)算交叉熵分別評(píng)價(jià)兩個(gè)監(jiān)測(cè)模型,得到兩個(gè)模型的權(quán)重,按照權(quán)重將兩個(gè)模型結(jié)合,以充分利用時(shí)頻和相關(guān)變量信息,降低誤報(bào)的可能性,提高故障報(bào)警準(zhǔn)確率。
經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)是一種自適應(yīng)數(shù)據(jù)信息挖掘方法,其將非線性序列信號(hào)分解為若干不同尺度的IMF分量和1個(gè)殘余分量,從而更加直觀地觀察信號(hào)中各頻率分量的分布情況[14-15]。EMD分解信號(hào)不需要事先預(yù)定或強(qiáng)制給定基函數(shù),而是依賴信號(hào)本身特征自適應(yīng)地進(jìn)行分解,理論上可以應(yīng)用于任何類型的時(shí)間序列信號(hào)。
EEMD是在EMD基礎(chǔ)上的改進(jìn)算法,EMD中的信號(hào)極值點(diǎn)會(huì)影響IMF,在分布不均勻時(shí)會(huì)出現(xiàn)模態(tài)混疊。EEMD將白噪聲引入待分析信號(hào)中,白噪聲的頻譜均勻分布,使不同尺度的信號(hào)自動(dòng)映射到與背景白噪聲相關(guān)的適當(dāng)尺度上,從而解決了EMD中極值點(diǎn)分布不均勻?qū)е碌乃纸庑盘?hào)頻率模式混疊現(xiàn)象。算法流程如下:
(1)在原始信號(hào)上添加一個(gè)白噪聲序列。
(2)采用EMD將添加了白噪聲的信號(hào)分解為多個(gè)IMF分量和1個(gè)殘余分量。
(3)多次重復(fù)(1)和(2),但是每次采用不同的白噪聲序列。
(4)獲得分解的相應(yīng)IMF分量和殘余分量。
(5)對(duì)多次添加白噪音后分解得到的IMF分量和殘余分量進(jìn)行平均計(jì)算,得到最終的多個(gè)IMF分量和1個(gè)殘余分量。
采用EEMD對(duì)齒輪箱油溫信號(hào)進(jìn)行時(shí)頻分析。EEMD將健康樣本分解為n個(gè)IMF分量,以這n維分量作為基準(zhǔn)特征值,計(jì)算待測(cè)樣本的特征值與基準(zhǔn)特征值的馬氏距離,用于判別齒輪箱的健康程度。
(1)
式中:d1為待測(cè)樣本與健康樣本的馬氏距離;xi為待測(cè)樣本特征值;μ為健康樣本基準(zhǔn)特征的均值;T為協(xié)方差。馬氏距離d1越大,該樣本的時(shí)頻特性與健康樣本差別越大,該樣本的故障概率越大。
為了更好地評(píng)估設(shè)備的運(yùn)行狀況,進(jìn)一步通過隸屬度函數(shù)計(jì)算待測(cè)樣本的健康度,本文選取logistics函數(shù)作為隸屬度函數(shù),具體為
(2)
式中:f1為樣本健康度;k與a為模糊因子。f1越接近1,健康度越高。
BLS算法是一種不需要深度學(xué)習(xí)結(jié)構(gòu)的高效增量學(xué)習(xí)算法[14],其主要設(shè)計(jì)思想是將輸入數(shù)據(jù)的映射特征作為隨機(jī)向量函數(shù)鏈接神經(jīng)網(wǎng)絡(luò)(Random Vector Functional Link Neural Network, RVFLNN)的輸入。
風(fēng)機(jī)運(yùn)行過程中,齒輪箱會(huì)不斷老化,導(dǎo)致齒輪箱油溫的模型特性發(fā)生改變,當(dāng)更新或增加輸入數(shù)據(jù)時(shí),不同于深度學(xué)習(xí)需要重新訓(xùn)練網(wǎng)絡(luò)模型,BLS可以通過增量式學(xué)習(xí)在線更新網(wǎng)絡(luò)模型,因此實(shí)時(shí)性好,訓(xùn)練速度快。
BLS網(wǎng)絡(luò)模型由輸入數(shù)據(jù)、特征節(jié)點(diǎn)、增強(qiáng)節(jié)點(diǎn)和模型輸出組成。其中,特征節(jié)點(diǎn)利用輸入數(shù)據(jù)映射得到;增強(qiáng)節(jié)點(diǎn)由映射的特征乘隨機(jī)生成的權(quán)重經(jīng)非線性函數(shù)變換得到。將所有映射的特征節(jié)點(diǎn)和增強(qiáng)節(jié)點(diǎn)直接連接到輸出端,得到模型的輸出。假設(shè)輸入的數(shù)據(jù)集為X,則特征節(jié)點(diǎn)
Zi=φ(XWei+βei),i=1,…,n;
(3)
式中:φ為激活函數(shù);Wei,βei為隨機(jī)生成的第i個(gè)特征節(jié)點(diǎn)的權(quán)重;n為特征節(jié)點(diǎn)個(gè)數(shù)。
增強(qiáng)節(jié)點(diǎn)
Hj=ξ(ZnWhj+βhj),j=1,…,m。
(4)
式中:ξ為激活函數(shù);Whj,βhj為隨機(jī)生成的第j個(gè)增強(qiáng)節(jié)點(diǎn)的權(quán)重;m為增強(qiáng)節(jié)點(diǎn)個(gè)數(shù)。
將特征節(jié)點(diǎn)和增強(qiáng)節(jié)點(diǎn)作為輸入,得到輸出矩陣
(5)
(6)
系統(tǒng)模型如圖1所示。
隨著機(jī)組運(yùn)行時(shí)長的增加,其運(yùn)行特性會(huì)產(chǎn)生變化,使得原始模型不能很好地?cái)M合機(jī)組的運(yùn)行情況。為了使模型更好地適應(yīng)現(xiàn)場(chǎng)變化,需要在深層結(jié)構(gòu)網(wǎng)絡(luò)中重新進(jìn)行訓(xùn)練。當(dāng)需要提高模型精度時(shí),一般做法是增加訓(xùn)練層數(shù)重新訓(xùn)練,訓(xùn)練層數(shù)越多,訓(xùn)練時(shí)間越長。然而當(dāng)現(xiàn)場(chǎng)機(jī)組運(yùn)行特性變化或擬合精度不足時(shí),BLS算法不用重新訓(xùn)練模型,只要在訓(xùn)練好的模型基礎(chǔ)上在線更新參數(shù)即可,同時(shí)增量式學(xué)習(xí)可通過增加特征節(jié)點(diǎn)和增強(qiáng)節(jié)點(diǎn)的個(gè)數(shù),即增加算法的寬度,來提高模型訓(xùn)練的精確度。
圖2所示為BLS增量式學(xué)習(xí)模型,其模型結(jié)構(gòu)使得無論離線建模還是在線更新,均能在實(shí)現(xiàn)一定精度的同時(shí)保證快速性,更加適應(yīng)現(xiàn)場(chǎng)需求[16]。
以增加輸入數(shù)據(jù)為例說明BLS增量式學(xué)習(xí)方式的特點(diǎn)。
(7)
式中:Zn,Hm分別為原始數(shù)據(jù)的特征節(jié)點(diǎn)和增強(qiáng)節(jié)點(diǎn)。
Ax=[φ(XaWe1+βe1),…,φ(XaWen+βen)|
(8)
(9)
(10)
(11)
式中:
(12)
(13)
(14)
結(jié)合式(10)~式(14),將輸出矩陣的權(quán)重更新為
(15)
當(dāng)系統(tǒng)有新的數(shù)據(jù)輸入時(shí),深度學(xué)習(xí)的模型結(jié)構(gòu)往往需要重新訓(xùn)練整個(gè)模型。而對(duì)于BLS,由于其橫向擴(kuò)張的獨(dú)特結(jié)構(gòu),無需對(duì)整個(gè)模型進(jìn)行重新訓(xùn)練,大大提高了計(jì)算效率,使在線學(xué)習(xí)成為可能。
用健康運(yùn)行狀態(tài)下的齒輪箱數(shù)據(jù)對(duì)BLS網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到齒輪箱油溫檢測(cè)模型,再將待測(cè)數(shù)據(jù)送入訓(xùn)練好的模型中。用模型預(yù)測(cè)曲線與真實(shí)數(shù)據(jù)曲線的歐式距離和余弦相似度表征兩種溫度的距離和趨勢(shì),從而計(jì)算預(yù)估值與實(shí)際值之間的關(guān)聯(lián)程度。聯(lián)合二者的歐式距離和余弦相似度表征齒輪箱的健康度。健康度f2的計(jì)算公式如下:
(16)
(17)
(18)
(19)
在機(jī)組健康情況下,風(fēng)機(jī)機(jī)組的齒輪箱油溫一般根據(jù)運(yùn)行狀況的不同在30 ℃~70 ℃間波動(dòng),當(dāng)機(jī)組齒輪箱出現(xiàn)故障時(shí),齒輪箱的油溫會(huì)在短時(shí)間內(nèi)升高至75 ℃甚至80 ℃以上。因此,該類故障在提高算法準(zhǔn)確性的前提下,應(yīng)重點(diǎn)考慮檢測(cè)的及時(shí)性、快速性指標(biāo)。
風(fēng)機(jī)齒輪箱油溫會(huì)隨運(yùn)行風(fēng)速、運(yùn)行功率的隨機(jī)波動(dòng)進(jìn)行不規(guī)則變化,呈現(xiàn)出非平穩(wěn)時(shí)間序列特點(diǎn)。EEMD變點(diǎn)檢測(cè)方法可對(duì)溫度時(shí)序信號(hào)進(jìn)行數(shù)據(jù)預(yù)處理,將信號(hào)分解降維成多個(gè)序列,從而降低系統(tǒng)的非平穩(wěn)特性,提高算法的準(zhǔn)確性。然而,在機(jī)組啟?;蝻L(fēng)速突變時(shí),溫度的變化情況可能與風(fēng)機(jī)設(shè)備故障的升溫情況相似,從而使模型出現(xiàn)誤判。而且EEMD作為變點(diǎn)檢測(cè)方法,在檢測(cè)過程中只針對(duì)監(jiān)控?cái)?shù)據(jù)中某一變量進(jìn)行分解,沒有充分挖掘其他變量的信息。
與EEMD相比,作為一種新型算法,BLS能夠充分挖掘SCDAD數(shù)據(jù)中的多維變量信息來判斷齒輪箱的健康狀況。在快速性方面,相比深度學(xué)習(xí)網(wǎng)絡(luò),BLS有很大的優(yōu)勢(shì)。除此之外,由于設(shè)備的運(yùn)行狀況會(huì)隨使用年限發(fā)生變化,BLS獨(dú)特的增量式學(xué)習(xí)方式使其能夠以較小的計(jì)算成本不斷增加訓(xùn)練數(shù)據(jù),以通過更新設(shè)備的模型來反映設(shè)備狀況的真實(shí)性,但是BLS需要一定數(shù)據(jù)量才能保證預(yù)測(cè)精度,而且其泛化能力不如深度學(xué)習(xí)[17]。因?yàn)锽LS網(wǎng)絡(luò)沒有記憶,而溫度變化卻具有很強(qiáng)的時(shí)間連貫性,所以僅采用BLS算法進(jìn)行故障預(yù)警也可能出現(xiàn)誤報(bào)點(diǎn)。
為了提高故障預(yù)警的準(zhǔn)確率,本文提出基于交叉熵(cross entropy)融合EEMD與BLS的齒輪箱故障預(yù)警方法,該方法能夠兼顧準(zhǔn)確性和快速性,具體工作流程如圖3所示。
交叉熵是Shannon信息論中的一個(gè)重要概念,主要用于度量兩個(gè)概率分布間的差異性信息。交叉熵用于在給定的真實(shí)分布下,衡量使用非真實(shí)分布所指定的策略消除系統(tǒng)的不確定性所需要付出的成本。交叉熵越小,預(yù)測(cè)模型的精度越高。計(jì)算公式為
(20)
式中:N為樣本數(shù);M為類別的數(shù)量;yc,n為第n個(gè)樣本的指示變量,若該樣本為c類別則yc,n=1,否則yc,n=0;pc,n為第n個(gè)樣本屬于類別c的預(yù)測(cè)概率。
基于交叉熵融合的溫度趨勢(shì)分析方法步驟如下:
(1)采用EEMD對(duì)健康運(yùn)行的齒輪箱油溫時(shí)序信號(hào)進(jìn)行分解,將其分量作為基準(zhǔn)特征。計(jì)算待測(cè)樣本分量特征與基準(zhǔn)特征的馬氏距離,通過式(2)計(jì)算待測(cè)樣本的健康度f1。
(2)利用皮爾遜相關(guān)分析篩選出SCADA數(shù)據(jù)中與齒輪箱油溫相關(guān)性高的數(shù)據(jù)作為輸入變量,采用BLS建立齒輪箱健康狀態(tài)下的溫度模型進(jìn)行溫度預(yù)測(cè)。當(dāng)齒輪箱工作異常時(shí),油溫偏離預(yù)測(cè)值,BLS溫度模型預(yù)測(cè)曲線的分布特性發(fā)生改變。將預(yù)測(cè)曲線與真實(shí)曲線的關(guān)聯(lián)程度作為齒輪箱健康度f2。
(3)為了提高預(yù)警信息的時(shí)效性和準(zhǔn)確率,分別用交叉熵評(píng)價(jià)兩個(gè)算法所得模型。由交叉熵得到兩種算法的權(quán)重,按權(quán)重將兩種算法的健康度結(jié)合。當(dāng)健康度低于閾值時(shí),提示運(yùn)行人員檢查設(shè)備狀態(tài),以避免機(jī)組造成不可逆轉(zhuǎn)的損害,同時(shí)為運(yùn)行人員在突發(fā)故障導(dǎo)致停機(jī)之前爭(zhēng)取更多時(shí)間,避免因突發(fā)故障停機(jī)造成巨大的經(jīng)濟(jì)損失。
本文用安徽某風(fēng)電場(chǎng)1.5 WM風(fēng)機(jī)2019年6月1日~7月21日的SCADA數(shù)據(jù)為健康樣本,采樣間隔為10 min,共8 668個(gè)樣本,以該機(jī)組8月1日至停機(jī)前的976個(gè)樣本數(shù)據(jù)為待測(cè)樣本進(jìn)行仿真。仿真實(shí)驗(yàn)基于MATLAB2019a環(huán)境,處理器主頻為2.5 Hz,內(nèi)存為16 GB。
齒輪箱油溫信號(hào)具有不平穩(wěn)、波動(dòng)性大的特點(diǎn),為此本文基于信號(hào)尺度分解降維的思想,采用EEMD的方法建立模型,有效處理了非線性時(shí)序油溫信號(hào)。健康機(jī)組的齒輪箱原始油溫時(shí)序信號(hào)如圖4所示。
首先進(jìn)行EEMD分析,根據(jù)經(jīng)驗(yàn)和相關(guān)參考文獻(xiàn),所添加的噪聲與待分析信號(hào)的標(biāo)準(zhǔn)偏差之比為0.2,噪聲組數(shù)為100。首先對(duì)健康樣本進(jìn)行EEMD分解得到基準(zhǔn)的特征向量,再對(duì)待測(cè)樣本進(jìn)行EEMD分解得到待測(cè)樣本的特征向量,用式(1)計(jì)算待測(cè)樣本與健康樣本的馬氏距離,通過隸屬度函數(shù)式(2),得到該樣本的健康度f1,仿真結(jié)果如圖5所示。
由圖5可見,停機(jī)前EEMD模型所得馬氏距離遠(yuǎn)大于健康運(yùn)行狀態(tài)下的樣本,EEMD能夠檢測(cè)出異常溫升。
為了簡(jiǎn)化輸入數(shù)據(jù),從SCADA數(shù)據(jù)中選取與齒輪箱油溫相關(guān)性強(qiáng)的變量作為模型的輸入變量。本文引入Pearson相關(guān)系數(shù)[18],將齒輪箱油溫作為參考變量,系數(shù)的值域?yàn)閇-1,1],系數(shù)值越大,相關(guān)性越強(qiáng)。相關(guān)系數(shù)
(21)
根據(jù)式(21)計(jì)算變量與油溫之間的相關(guān)系數(shù),得到的結(jié)果如表1所示。
表1 相關(guān)性分析結(jié)果
由相關(guān)性分析得到模型的輸入為齒輪箱高速軸驅(qū)動(dòng)端軸承溫度、齒輪箱高速軸非驅(qū)動(dòng)端軸承溫度、發(fā)電機(jī)非驅(qū)動(dòng)端軸承溫度、風(fēng)速、風(fēng)功率5個(gè)變量。
選取風(fēng)電機(jī)組健康運(yùn)行過程中的齒輪箱樣本數(shù)據(jù)與算法擬合效果進(jìn)行對(duì)比,測(cè)試樣本數(shù)量為500。將BLS算法與BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(Support Vector Machine, SVM)和DBN進(jìn)行對(duì)比仿真,采用平均絕對(duì)誤差MAE、均方根誤差RMSE、訓(xùn)練時(shí)間T作為算法的性能指標(biāo)來比較擬合結(jié)果。其中:BP的網(wǎng)絡(luò)結(jié)構(gòu)為5-15-1;SVM選用多項(xiàng)式基核函數(shù)作為核函數(shù);DBN網(wǎng)絡(luò)結(jié)構(gòu)為5-20-15-1,激活函數(shù)為sigmoid函數(shù);BLS增加訓(xùn)練樣本的方式為增量學(xué)習(xí),具體公式如2.2節(jié)所述,特征節(jié)點(diǎn)的數(shù)目為50,激活函數(shù)選用線性函數(shù);增強(qiáng)節(jié)點(diǎn)數(shù)為200,激活函數(shù)選用tansig函數(shù)。采用同樣的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)對(duì)所得測(cè)試集擬合結(jié)果進(jìn)行分析,仿真結(jié)果如表2所示。
表2 算法性能對(duì)比
由表2可見,在訓(xùn)練數(shù)據(jù)樣本較少時(shí),BLS預(yù)測(cè)精度相比BP,SVM,DBN較低,但是當(dāng)訓(xùn)練數(shù)據(jù)逐漸提升至7 000及以上時(shí),BLS的預(yù)測(cè)精度優(yōu)于BP,SVM,DBN,而且BLS的訓(xùn)練速度遠(yuǎn)快于其余3種算法。這是由于其特殊的增量式學(xué)習(xí)方式大大縮短了計(jì)算時(shí)間,以訓(xùn)練數(shù)據(jù)8 000為例,因?yàn)锽P,SVM,DBN無法直接進(jìn)行增量式學(xué)習(xí),所以需要每次重新訓(xùn)練所有樣本,即BP,SVM,DBN需要用全部8 000個(gè)數(shù)據(jù)重新訓(xùn)練其權(quán)值,從而耗費(fèi)了大量時(shí)間。而BLS只需要對(duì)新增的1 000個(gè)樣本進(jìn)行增量學(xué)習(xí),當(dāng)訓(xùn)練數(shù)據(jù)為8 000時(shí),其仿真總訓(xùn)練時(shí)間為訓(xùn)練數(shù)據(jù)7 000時(shí)的訓(xùn)練時(shí)間加上本次增量學(xué)習(xí)所用的時(shí)間,極大加快了運(yùn)算速度,使其在工業(yè)應(yīng)用上更具可行性,因此將其作為一種溫度預(yù)警模型算法進(jìn)行后續(xù)應(yīng)用是有效的。
根據(jù)2.3節(jié)所述,將停機(jī)前的976個(gè)待測(cè)樣本送入訓(xùn)練好的BLS模型中,得到預(yù)測(cè)油溫,然后根據(jù)式(15)計(jì)算待測(cè)樣本的健康度。所得預(yù)測(cè)結(jié)果擬合情況及待測(cè)樣本的健康度如圖6所示。
從圖6可見,在機(jī)組健康運(yùn)行狀態(tài)下,各SCADA狀態(tài)監(jiān)測(cè)變量之間滿足穩(wěn)定的內(nèi)部聯(lián)系,處于動(dòng)態(tài)平衡狀態(tài)。當(dāng)齒輪箱狀態(tài)健康時(shí),這種動(dòng)態(tài)平衡表現(xiàn)為,真實(shí)值和預(yù)測(cè)值的關(guān)聯(lián)程度雖然存在一定波動(dòng),但是保持相對(duì)穩(wěn)定;當(dāng)齒輪箱發(fā)生異常時(shí),狀態(tài)監(jiān)測(cè)變量間失去長期穩(wěn)定關(guān)系,反映齒輪箱油溫狀態(tài)的健康度隨之下降。
采用交叉熵分別對(duì)兩種算法模型進(jìn)行評(píng)價(jià)。由于故障檢測(cè)問題是二分類問題,采用交叉熵公式
(22)
計(jì)算EEMD與BLS兩種模型的交叉熵,其中EEMD方法所得交叉熵為0.103 2,BLS方法所得交叉熵為0.149 2。交叉熵值越低,模型越準(zhǔn)確。因此以兩種算法的交叉熵為各自權(quán)重進(jìn)行融合,計(jì)算公式如下:
(23)
f=ω1·f1+ω2·f2。
(24)
式中:L1,L2分別表示EEMD模型和BLS模型得到的交叉熵;f1,f2分別表示EEMD模型和BLS模型得到的健康度。
為了驗(yàn)證基于交叉熵進(jìn)行算法融合后的方法在齒輪箱故障預(yù)警問題上的效果,對(duì)EEMD模型所得樣本健康度、BLS模型所得樣本健康度及基于交叉熵融合后的方法所得的樣本健康度進(jìn)行對(duì)比,對(duì)比結(jié)果如圖7所示。
以3δ定律確定正常狀態(tài)下的健康度閾值,如圖7中的虛線所示。由圖7可見,EEMD模型所得的健康度f1在860點(diǎn)低于閾值,因此能在停機(jī)點(diǎn)前116點(diǎn)給工作人員發(fā)出預(yù)警信號(hào)。然而因?yàn)轱L(fēng)速不確定導(dǎo)致風(fēng)機(jī)啟停不確定,風(fēng)機(jī)啟停時(shí)的溫升變化特性與故障時(shí)相似,所以啟停時(shí)容易出現(xiàn)誤報(bào),圖7a的f1在第120個(gè)數(shù)據(jù)點(diǎn)和第291個(gè)數(shù)據(jù)點(diǎn)時(shí)都超過了閾值。圖7b BLS模型所得的健康度f2在第872個(gè)數(shù)據(jù)點(diǎn)時(shí)低于閾值,即在停機(jī)點(diǎn)前104點(diǎn)發(fā)出預(yù)警信號(hào),比EEMD模型所得預(yù)警結(jié)果延遲了12個(gè)數(shù)據(jù)點(diǎn),而且當(dāng)機(jī)組健康運(yùn)行時(shí)健康度f2也會(huì)出現(xiàn)波動(dòng)。而融合后的健康度f能夠避免f1的誤報(bào)點(diǎn),同時(shí)減小f2的波動(dòng)性,并可在停機(jī)前114點(diǎn)發(fā)出預(yù)警信號(hào),提醒運(yùn)行人員關(guān)注該機(jī)組的運(yùn)行狀況。
為驗(yàn)證融合方法對(duì)齒輪箱超溫預(yù)警的可行性,搜集同個(gè)風(fēng)場(chǎng)不同機(jī)組的數(shù)據(jù),以3∶1的比例選取健康樣本和故障樣本進(jìn)行仿真。用EEMD模型預(yù)警方法、BLS模型預(yù)警方法對(duì)比本文所提的融合方法,仿真結(jié)果如表3所示??梢?,融合后的方法的提前預(yù)警時(shí)間高于BLS方法,略低于EEMD方法,且準(zhǔn)確率高于單種方法。
表3 故障預(yù)警效果對(duì)比
為進(jìn)一步探究齒輪箱超溫故障的原因,針對(duì)前文所述停機(jī)故障,以6月1日~7月21日的8 668個(gè)健康樣本為訓(xùn)練數(shù)據(jù),停機(jī)前的976個(gè)待測(cè)樣本為測(cè)試數(shù)據(jù),將齒輪箱油溫、發(fā)電機(jī)非驅(qū)動(dòng)端軸承溫度、發(fā)電機(jī)非驅(qū)動(dòng)端軸承溫度、風(fēng)速、功率作為BLS模型輸入,齒輪箱高速軸驅(qū)動(dòng)端軸承溫度、齒輪箱高速軸非驅(qū)動(dòng)端軸承溫度作為輸出,其他步驟不變,用融合方法分析超溫故障,得到驅(qū)動(dòng)端軸溫與非驅(qū)動(dòng)端軸溫的健康度,仿真結(jié)果如圖8所示。
由圖8可見,在本次齒輪箱油溫超溫停機(jī)故障中,驅(qū)動(dòng)端軸溫健康度下降的幅度明顯大于非驅(qū)動(dòng)端軸溫健康度,提示該齒輪箱油溫超溫故障可能由驅(qū)動(dòng)端軸承引起,為后續(xù)工作人員登塔處理提供了檢修方向。
針對(duì)風(fēng)力齒輪箱的狀態(tài)監(jiān)測(cè)與故障診斷方法研究,本文提出采用交叉熵將EEMD變點(diǎn)檢測(cè)方法和BLS算法融合進(jìn)行故障預(yù)警的方法,實(shí)現(xiàn)了基于SCADA運(yùn)行數(shù)據(jù)趨勢(shì)的齒輪箱溫度早期預(yù)警。利用交叉熵確定兩種故障模型的權(quán)重,對(duì)兩種算法進(jìn)行融合,通過實(shí)際故障分析驗(yàn)證了融合后的方法在風(fēng)機(jī)故障預(yù)警問題中的有效性,即降低了單種方法的誤報(bào)概率,提高了預(yù)警準(zhǔn)確性,而且訓(xùn)練速度快、計(jì)算量小。由于該融合方法應(yīng)用算法自動(dòng)對(duì)信號(hào)進(jìn)行數(shù)據(jù)挖掘分解,其原理具有通用性,可以進(jìn)一步推廣到風(fēng)機(jī)其他關(guān)鍵部件(如主軸承和發(fā)電機(jī)等)的故障診斷與預(yù)警中。
后續(xù)的研究重點(diǎn)為提高BLS算法的預(yù)測(cè)精度,并對(duì)該融合方法在風(fēng)機(jī)齒輪箱以外其他設(shè)備的故障診斷與預(yù)警問題中的應(yīng)用進(jìn)行仿真驗(yàn)證。