丁學(xué)輝,許海林,羅穎婷,楊 鑫,鄂盛龍
(1.長(zhǎng)沙理工大學(xué)電氣與信息工程學(xué)院,湖南 長(zhǎng)沙 410114;2.廣東電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,廣東 廣州 510080)
變壓器承擔(dān)著對(duì)電壓的轉(zhuǎn)換和對(duì)電能的分配,及時(shí)發(fā)現(xiàn)變壓器內(nèi)部潛在故障并準(zhǔn)確診斷其故障類型對(duì)維護(hù)整個(gè)電網(wǎng)的安全運(yùn)行與供電可靠性具有重要意義。
隨著變壓器油中溶解氣體(DGA)在線監(jiān)測(cè)技術(shù)不斷發(fā)展,越來(lái)越多的基于DGA數(shù)據(jù)的人工智能算法被運(yùn)用在變壓器故障診斷領(lǐng)域并取得了不錯(cuò)的效果,如支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯分類器等[1]。這些智能算法克服了傳統(tǒng)IEC三比值法分類邊界過(guò)于絕對(duì)、反映故障類型與表現(xiàn)特征之間關(guān)聯(lián)關(guān)系準(zhǔn)確率不足的局限性[2],但診斷模型訓(xùn)練效果差,難以滿足實(shí)際工程運(yùn)用需求。
近年來(lái),極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)以其學(xué)習(xí)速度快、泛化能力優(yōu)良、分類準(zhǔn)確率高等特點(diǎn)在變壓器故障診斷領(lǐng)域運(yùn)用廣泛,然而ELM 對(duì)變壓器故障分類時(shí),隨機(jī)產(chǎn)生的輸入層權(quán)值和隱層閾值對(duì)故障診斷準(zhǔn)確率會(huì)帶來(lái)不良影響[3]。常用粒子群優(yōu)化(particle swarm optimization,PSO)算法求解ELM參數(shù)[4],但該算法在搜索過(guò)程中易導(dǎo)致群體多樣性喪失、早熟、陷入局部最優(yōu)。為此,本文利用多尺度協(xié)同變異的自適應(yīng)粒子群優(yōu)化(multi-scale cooperative mutatingly self-adaptive escape PSO,MAEPSO)算法對(duì)ELM參數(shù)進(jìn)行優(yōu)化,建立多尺度協(xié)同變異粒子群極限學(xué)習(xí)機(jī)(MAEPSO-ELM)變壓器故障診斷模型。MAEPSO算法的多尺度高斯變異機(jī)制,能促使整個(gè)種群以盡量分散的變異尺度對(duì)解空間進(jìn)行更加詳盡的探索,在強(qiáng)化算法全局尋優(yōu)能力的同時(shí)兼顧局部精細(xì)化探索的能力,找到適應(yīng)值更高的參數(shù)以提高ELM的診斷效果。
此外,目前基于DGA和智能算法建立的診斷方法大部分采用H2、CH4、C2H2、C2H4、C2H6等主要特征氣體及部分比值作為算法輸入特征,在選擇特征量時(shí)并沒(méi)有充足的依據(jù),而各種人工智能診斷方法會(huì)因?yàn)檩斎胩卣鞑煌绊懺\斷結(jié)果[5]。文獻(xiàn)[6]基于篩選器模式利用粗糙集方法對(duì)變壓器故障輸入特征進(jìn)行約簡(jiǎn);文獻(xiàn)[7]基于封裝器模式利用SVM分類準(zhǔn)確率評(píng)估變壓器故障輸入特征并通過(guò)遺傳算法搜索適應(yīng)度最高的輸入特征集。篩選器模式獨(dú)立于后續(xù)的智能分類算法,選取的輸入特征集準(zhǔn)確度不高;封裝器模式使用的智能搜索算法計(jì)算量大且需要提前設(shè)定輸入特征維數(shù)。隨機(jī)森林算法利用變量重要性評(píng)分(variable importance measure,VIM)值這一指標(biāo)反映各輸入特征對(duì)因變量變化所做貢獻(xiàn)的重要性,在輸入特征選擇領(lǐng)域應(yīng)用廣泛[8]。本文擬利用隨機(jī)森林算法計(jì)算候選特征集各特征重要性評(píng)分并降序排列,結(jié)合優(yōu)化的ELM,基于序列前向選擇法逐一添加VIM值最高的輸入特征計(jì)算其分類準(zhǔn)確率,由分類準(zhǔn)確率最大確定最優(yōu)輸入特征。該方法相比篩選器模式和封裝器模式,具有計(jì)算量小且無(wú)需提前設(shè)定特征個(gè)數(shù)并能給出各輸入特征對(duì)故障分類影響程度的優(yōu)點(diǎn)。
綜上所述,本文基于變壓器DGA數(shù)據(jù)及相關(guān)運(yùn)算屬性構(gòu)建候選特征集,建立基于隨機(jī)森林特征優(yōu)選與MAEPSO-ELM算法的變壓器故障診斷方法,通過(guò)實(shí)例驗(yàn)證所提方法的有效性與正確性。
隨機(jī)森林算法是利用bootstrap重采樣技術(shù)從原始樣本中抽取多個(gè)樣本,對(duì)每個(gè)采樣得到的樣本集建立決策樹進(jìn)行訓(xùn)練,然后組合多棵決策樹投票得到最終分類結(jié)果的集成決策樹算法,同時(shí)該算法能給出各輸入變量重要性評(píng)分,廣泛應(yīng)用于特征選擇場(chǎng)景[9]。隨機(jī)森林算法對(duì)特征進(jìn)行評(píng)估主要思想是通過(guò)對(duì)未參與決策樹訓(xùn)練的袋外(out-of-bag,OOB)數(shù)據(jù)施加擾動(dòng),再計(jì)算預(yù)測(cè)準(zhǔn)確率的變化來(lái)獲得特征重要性。
假定變壓器故障數(shù)據(jù)訓(xùn)練集(X,y),每個(gè)樣本含n個(gè)輸入特征x1、x2、…、xn,隨機(jī)森林算法通過(guò)bootstrap方法隨機(jī)抽取K個(gè)子樣本數(shù)據(jù)集,對(duì)應(yīng)K個(gè)OOB數(shù)據(jù)集,特征重要性排序步驟如下:
1)初始化k=1;
4)當(dāng)k=2,3,…,K時(shí),重復(fù)步驟2、3;
5)計(jì)算特征xi重要性,即
(1)
6)對(duì)VIMi降序排列,得到特征重要度排序,VIM越大特征越重要。
由于PSO算法中粒子的運(yùn)動(dòng)軌跡是一個(gè)有限的并逐漸減小的區(qū)域,無(wú)法覆蓋整個(gè)可行空間解,因此,存在早熟收斂、易陷入局部最優(yōu)等不足[10]。鑒于此,引入多尺度協(xié)同變異粒子群算法,該算法粒子速度變異能力由粒子所在子群高斯變異算子決定,不同子群的變異算子尺度由該子群的適應(yīng)度決定,有助于粒子群在搜索空間中分散式搜索,增強(qiáng)算法全局尋優(yōu)能力,同時(shí)變異算子的大小隨著適應(yīng)度的提升逐漸減小,在算法后期有利于提高最優(yōu)解的精度。
設(shè)粒子變異尺度為M,并設(shè)置M個(gè)高斯變異算子標(biāo)準(zhǔn)差的初始值,其值為優(yōu)化變量取值范圍內(nèi)的隨機(jī)值:
(2)
隨著算法的迭代,不同尺度變異算子的標(biāo)準(zhǔn)差會(huì)改變,規(guī)律如下:首先,將種群中的N個(gè)粒子依據(jù)適應(yīng)度F的大小升序排列;然后,將排好序的種群按照適應(yīng)度大小劃分為M個(gè)子群,每個(gè)子群的粒子個(gè)數(shù)為P=N/M。t為算法當(dāng)前迭代次數(shù),則第m個(gè)子群在第t次迭代時(shí)平均適應(yīng)度值可定義為
(3)
(4)
(5)
為最大范圍實(shí)現(xiàn)空間搜索能力,粒子速度Vij達(dá)到一定閾值Tj時(shí)按偽代碼進(jìn)行一次變異操作,計(jì)算變異后所有粒子適應(yīng)度及M個(gè)變異算子,取適應(yīng)度最大位置作為下一次粒子新的逃逸點(diǎn),代碼描述如下:
(6)
其中,Tj記錄種群中第j維的當(dāng)前速度閾值且恒為正數(shù),其自適應(yīng)設(shè)定原理參考文獻(xiàn)[11],xi為粒子位置,rand為均勻分布在[0,1]范圍內(nèi)的隨機(jī)數(shù)。
將隨機(jī)森林特征優(yōu)選與MAEPSPO-ELM算法變壓器DGA故障診斷方法分為3步:建立候選特征集、確定最優(yōu)輸入特征以及ELM參數(shù)優(yōu)化過(guò)程。
本文采用廣東電科院提供的已確認(rèn)變壓器故障類型樣本,共417組。根據(jù)相關(guān)規(guī)程,診斷結(jié)果可劃分為7種狀態(tài):正常(N)、低能放電(D1)、高能放電(D2)、局部放電(PD)、中低溫過(guò)熱(T12)、高溫過(guò)熱(T3)、放電兼過(guò)熱(TD),分別用{1,2,3,4,5,6,7}表示,樣本分布如表1所示。隨機(jī)選取80組樣本為訓(xùn)練集、186組為驗(yàn)證集、120組為測(cè)試集。
表1 變壓器故障樣本Table 1 Transformer fault samples
目前,常用CH4、C2H2、C2H4、C2H6、H2的體積分?jǐn)?shù)檢測(cè)變壓器是否發(fā)生故障而利用其對(duì)故障狀態(tài)與性質(zhì)進(jìn)行更明確判斷時(shí)依舊存在較大程度偏差。IEC三比值法、Duval三角形法、無(wú)編碼比值法等一系列方法則常用于判定具體的故障類型。此外,文獻(xiàn)[12]表明,與 DGA 全部數(shù)據(jù)相比,DGA氣體中2種氣體的相對(duì)比值和變壓器運(yùn)行狀態(tài)聯(lián)系更緊密。為此,以上述5種氣體為典型故障特征氣體,并參照相關(guān)比值法構(gòu)造故障特征的規(guī)則,選取關(guān)鍵氣體的相關(guān)比率以及氣體之間的總體占比作為候選特征集,如表2所示,其中CH為總烴含量。
表2 候選輸入特征Table 2 Candidate input features
首先,在訓(xùn)練集中通過(guò)隨機(jī)森林算法計(jì)算各候選輸入特征的VIM值并降序排列;然后,假設(shè)最優(yōu)輸入特征集合為空集,依據(jù)特征重要度排序,使用序列前向選擇法,每次無(wú)放回地選取排序最前的特征加入最優(yōu)輸入特征集合,在驗(yàn)證集上利用MAEPSO-ELM模型進(jìn)行訓(xùn)練,得到最優(yōu)輸入特征集合的分類準(zhǔn)確率。遍歷完所有特征后,最優(yōu)輸入特征集合即為分類準(zhǔn)確率最高對(duì)應(yīng)的特征。最優(yōu)輸入特征選擇流程如圖1所示。
圖1 最優(yōu)輸入特征集合篩選流程Figure 1 Optimal input feature set screening process
利用MAEPSO算法優(yōu)化ELM的輸入層權(quán)值和隱層閾值,其中ELM算法分類準(zhǔn)確率作為粒子適應(yīng)度,算法流程如圖2所示。
MAEPSO算法優(yōu)化步驟如下。
1)預(yù)設(shè)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、PSO算法的慣性權(quán)重、學(xué)習(xí)因子等固有參數(shù)。
圖2 MAEPSO-ELM算法流程Figure 2 Flowchart of MAEPSO-ELM algorithm
3)根據(jù)粒子適應(yīng)度競(jìng)爭(zhēng)機(jī)制,更新所有微粒當(dāng)前最優(yōu)適應(yīng)度Pbest、種群當(dāng)前最優(yōu)適應(yīng)度gbest。
4)根據(jù)PSO粒子速度進(jìn)化公式調(diào)整微粒速度。
5)判斷粒子速度是否滿足Vij 6)按PSO粒子位置更新公式調(diào)整微粒的位置。 7)根據(jù)式(3)~(5)更新M個(gè)高斯變異算子的大小,并更新每一維速度的閾值Tj。 8)判斷是否滿足迭代條件。迭代次數(shù)t>tmax則退出循環(huán),輸出最優(yōu)適應(yīng)度對(duì)應(yīng)的ELM輸入權(quán)值和隱層閾值,否則轉(zhuǎn)至步驟3。 9)由訓(xùn)練求出的最優(yōu)參數(shù)建立ELM分類模型。 按本文方法通過(guò)隨機(jī)森林算法計(jì)算訓(xùn)練集22個(gè)候選輸入特征VIM值,在驗(yàn)證集下結(jié)合優(yōu)化的ELM,可得到不同輸入特征個(gè)數(shù)時(shí)的分類準(zhǔn)確率,如圖3所示。本文隨機(jī)森林參數(shù)設(shè)置: 回歸樹數(shù)目為400,節(jié)點(diǎn)最小尺寸為5, mtry 節(jié)點(diǎn)值為8。 圖3 變量重要性評(píng)分及分類準(zhǔn)確率曲線Figure 3 Variable importance score and prediction error curve 由圖3可知,輸入特征維數(shù)較低時(shí)模型提取表征輸出特性的關(guān)鍵信息較困難,分類準(zhǔn)確率低;當(dāng)按照VIM值排序逐個(gè)增加故障特征量時(shí),進(jìn)一步豐富了信息,分類準(zhǔn)確率有所提高,并且在特征個(gè)數(shù)為9時(shí)準(zhǔn)確率最大;繼續(xù)增加特征量,分類準(zhǔn)確率又呈下降趨勢(shì),最后趨于平穩(wěn)。這說(shuō)明在特征增加到一定個(gè)數(shù)時(shí)輸入特征混入冗余特征,隨之而來(lái)的冗余信息對(duì)模型的分類性能有副作用。由此可見特征選擇的必要性,選擇VIM值排序前9的特征作為本文方法的最優(yōu)輸入特征,分別為C2H4/C2H6、CH4/H2、C2H2/CH、C2H4/CH、C2H2/C2H4、H2/CH、CH4、C2H6/CH4、H2。 從結(jié)果來(lái)看,最優(yōu)輸入特征排序的前幾個(gè)特征包括CH4/H2、C2H4/C2H6、C2H2/C2H4,即IEC導(dǎo)則推薦的三比值特征量,說(shuō)明本文方法篩選的特征量與傳統(tǒng)變壓器故障診斷理論中故障特征比值量的選取有較大一致性。 本文方法參數(shù)最終設(shè)置:種群總規(guī)模N=50,尺度個(gè)數(shù)M=5,慣性權(quán)重w采用隨進(jìn)化次數(shù)線性遞減方式,粒子學(xué)習(xí)因子c1、c2均取1.5,Vmax為100,迭代次數(shù)tmax為160。ELM輸入節(jié)點(diǎn)為篩選出的特征維數(shù)9,輸出節(jié)點(diǎn)個(gè)數(shù)對(duì)應(yīng)變壓器7種狀態(tài)設(shè)為7,采用嘗試對(duì)比法確定隱含層節(jié)點(diǎn)數(shù)為50,因此ELM拓?fù)浣Y(jié)構(gòu)為9-50-7。 構(gòu)建粒子群極限學(xué)習(xí)機(jī)(PSO-ELM)、量子粒子群極限學(xué)習(xí)機(jī)(quantum particle swarm extreme learning machine,QPSO-ELM)、MAEPSO-ELM模型,當(dāng)輸入為最優(yōu)輸入特征時(shí),驗(yàn)證集在相同參數(shù)情況下各方法迭代過(guò)程的適應(yīng)度進(jìn)化曲線如圖4所示。 圖4 適應(yīng)度隨迭代次數(shù)的變化曲線Figure 4 Variation curve of fitness with the number of iterations 圖4表明在PSO-ELM模型中,粒子迭代早期就陷入局部最優(yōu),導(dǎo)致后續(xù)迭代搜索無(wú)法優(yōu)化出適應(yīng)度更高的曲線,此即為標(biāo)準(zhǔn)PSO算法的“早熟”缺陷,在約第35次迭代時(shí)訓(xùn)練精度收斂于83.3%;QPSO-ELM全局尋優(yōu)性能略好于PSO-ELM,在第45次迭代時(shí)進(jìn)化陷入停滯,并收斂于86.7%的訓(xùn)練正確率;MAEPSO-ELM利用多尺度高斯變異算子對(duì)粒子速度進(jìn)行變異,迭代初期粒子訓(xùn)練精度就達(dá)到81%,遠(yuǎn)大于PSO-ELM、QPSO-ELM;迭代后期,當(dāng)粒子適應(yīng)度陷入局部最優(yōu)后,通過(guò)多尺度協(xié)同變異多次跳出局部最優(yōu)在搜索空間中分散式搜索,在有限的迭代次數(shù)內(nèi)提高搜索精度,最終收斂于95.2%。綜合對(duì)比,本文引入的MAEPSO算法尋優(yōu)能力最好。 為驗(yàn)證本文方法高效性,將MAEPSO-ELM及對(duì)比模型輸入特征分為4類:①最優(yōu)輸入特征;②DGA氣體比值,即H2/CH、CH4/CH、C2H6/CH、C2H2/CH、C2H4/CH;③IEC氣體比值,即CH4/H2、C2H4/C2H6、C2H2/C2H4;④DGA全數(shù)據(jù)。 3種方法在4種輸入特征下及IEC三比值法的測(cè)試樣本整體診斷結(jié)果對(duì)比如圖5所示,得出結(jié)論: 1)當(dāng)采用相同診斷方法、最優(yōu)輸入特征作為輸入時(shí),診斷準(zhǔn)確率比DGA全數(shù)據(jù)高20%左右; 2)當(dāng)采用相同特征量時(shí),該文方法的識(shí)別準(zhǔn)確率比PSO-ELM、QPSO-ELM故障診斷準(zhǔn)確率高5.6%~13.1%; 3)當(dāng)同時(shí)采用最優(yōu)輸入特征與該文方法進(jìn)行故障診斷時(shí),能獲得最高的故障診斷準(zhǔn)確率;本文方法識(shí)別準(zhǔn)確率為91.3%,高于IEC三比值法32.9%、QPSO-ELM法7.9%、PSO-ELM法13.1%,診斷效果最好。 圖5 不同方法診斷準(zhǔn)確率Figure 5 Diagnosis accuracy of different methods 利用本文方法對(duì)廣東電網(wǎng)某供電局提供的4組變壓器油色譜在線監(jiān)測(cè)異常數(shù)據(jù)進(jìn)行故障診斷,樣本如表3所示。本文方法和IEC三比值法對(duì) 4組樣本的診斷結(jié)果及經(jīng)吊芯檢查后得出的明確變壓器狀態(tài)結(jié)論如表4所示。 表3 故障樣本Table 3 Failure samples μL/L 表4 故障樣本診斷結(jié)果Table 4 Fault sample diagnosis results 由于IEC三比值分類邊界過(guò)于絕對(duì)、所選用參數(shù)較少不能準(zhǔn)確反映故障類型與表現(xiàn)特征之間的關(guān)聯(lián)關(guān)系,因而無(wú)法正確識(shí)別第1、2、3組樣本。本文方法診斷結(jié)果顯示1、4組樣本為高能放電故障,第2、3組樣本分別為低溫過(guò)熱和局部放電故障,與吊芯檢查結(jié)論基本一致,驗(yàn)證了該模型的有效性與正確性。 本文通過(guò)隨機(jī)森林算法結(jié)合MAEPSO-ELM進(jìn)行變壓器故障特征量的優(yōu)選和故障診斷;結(jié)合變壓器樣本數(shù)據(jù),篩選出與故障類型最相關(guān)的輸入特征;并對(duì)比本文方法與不同組合的ELM在不同輸入特征集下的診斷效果;最后,用某供電局的故障數(shù)據(jù)進(jìn)行測(cè)試。 1)隨機(jī)森林結(jié)合智能分類算法進(jìn)行特征優(yōu)選,能以較少的優(yōu)選特征提高分類算法的診斷效果; 2)通過(guò)3種不同組合ELM模型的參數(shù)尋優(yōu)曲線可知,PSO、QPSO算法較易陷入局部最優(yōu),尋優(yōu)結(jié)果一般;而MAEPSO算法多次跳出局部最優(yōu),搜索空間中分散式搜索,找到適應(yīng)值更高的參數(shù),證明了多尺度協(xié)同變異機(jī)制的有效性; 3)本文方法測(cè)試集的識(shí)別準(zhǔn)確率為91.3%,高于IEC三比值法32.9%、QPSO-ELM法7.9%、PSO-ELM法13.1%,診斷效果最好。4 算例計(jì)算與分析
4.1 基于隨機(jī)森林的故障特征優(yōu)選
4.2 輸入量的選擇
4.3 技術(shù)應(yīng)用
5 結(jié)語(yǔ)