李成強(qiáng),許冠芝
(西安工程大學(xué)電子信息學(xué)院,西安710600)
電力變壓器中的任何故障都可能導(dǎo)致電源意外中斷,同時帶來巨大損失。變壓器早期故障的發(fā)現(xiàn),將降低非計劃停電的成本,提高電力系統(tǒng)的可靠性和運(yùn)行水平。因此,對其進(jìn)行故障診斷具有重大意義[1]。電暈、電弧以及過熱是變壓器早期故障的主要原因。這些故障導(dǎo)致變壓器絕緣油分解,形成不同濃度的氣體,有一些技術(shù)曾被用于檢測故障氣體,但DGA(Dissolved Gas Analysis, 油中溶解氣體分析法)是國內(nèi)外公認(rèn)的有效方式[2-3]。DGA 是根據(jù)氣體的濃度來判斷變壓器故障的分析方法,特別是針對變壓器內(nèi)部的潛伏性故障,DGA 能夠及時發(fā)現(xiàn)并得知故障發(fā)展的程度[4]。傳統(tǒng)的針對變壓器故障診斷的方法大多是根據(jù)導(dǎo)則[5],通過結(jié)合特征氣體分析法[6]以及比值法[7]分析變壓器內(nèi)的絕緣材料和外部環(huán)境等作用下發(fā)生老化過程中所產(chǎn)生的特征氣體(H2、CH4、C2H6、C2H4、C2H2)的體積分?jǐn)?shù)或比值,進(jìn)行變壓器故障的診斷和分析。在實際診斷過程中當(dāng)變壓器發(fā)生一個或多個故障時,氣體濃度存在差異且各種氣體之間的關(guān)系變得過于復(fù)雜,與預(yù)先定義的值不匹配。隨著神經(jīng)網(wǎng)絡(luò)[8]、遺傳算法[9]以及模糊理論[10]等理論的提出和發(fā)展,人工智能[11]被應(yīng)用到變壓器故障診斷中。人工神經(jīng)網(wǎng)絡(luò)(ANN)[12]、支持向量機(jī)(SVM)[13]等是用于溶解氣體分析的常見方法;在實際運(yùn)用中取得了一定的效果,但也有不足處。如ANN 方法用于變壓器故障診斷時有訓(xùn)練速度慢、易陷入局部最優(yōu)并且在結(jié)構(gòu)復(fù)雜和大樣本時,極易出現(xiàn)過度學(xué)習(xí)或泛化能力低的缺陷。因冗余信息的影響使得SVM 在處理較大數(shù)據(jù)量訓(xùn)練時間過長、速度變慢,不適合大樣本,其參數(shù)選取很困難[14]也降低了實用性;并且SVM 的診斷輸出為硬分割邊界。粒子群優(yōu)化算法具有簡單通用、容易實現(xiàn)的特點(diǎn),并且?guī)缀醪簧婕捌湔{(diào)整參數(shù),適合求解優(yōu)化問題,但是對于離散化的優(yōu)化問題處理不佳,容易陷入局部最優(yōu),并且在其進(jìn)化后期會出現(xiàn)收斂速度慢等,進(jìn)而發(fā)生早熟收斂?;谀:窠?jīng)的專家系統(tǒng)因算法本身的局限性,將其應(yīng)用到變壓器故障診斷中不能準(zhǔn)確反應(yīng)問題。
鑒于混沌運(yùn)動具有規(guī)律性、隨機(jī)性、遍歷性等特點(diǎn),能夠用于解決算法收斂速度慢以及陷入局部極值的問題,針對上述問題,在此提出一種基于混沌粒子群優(yōu)化核極限學(xué)習(xí)機(jī)的變壓器故障診斷方法,引入CPSO(Chaotic Particle Swarm Optimization,混沌粒子群優(yōu)化)對KELM(Kernel Extreme Learning Machine,核極限學(xué)習(xí)機(jī))參數(shù)進(jìn)行優(yōu)化,將特征氣體參數(shù)輸入到優(yōu)化后的核極限學(xué)習(xí)機(jī)分類模型中實現(xiàn)診斷。在彌補(bǔ)單一算法不足的同時提高變壓器故障的分類能力以及診斷準(zhǔn)確率。
ELM 算法是一種單隱藏層前饋型神經(jīng)網(wǎng)絡(luò),模型可表示為:
其中X 為輸入;f(X)為類別向量輸出結(jié)果;h(X)及H為隱藏層特征映射的矩陣;β 為輸出鏈接的權(quán)重。計算如下式:
其中,T 為訓(xùn)練樣本類向量組矩陣,λ 表示正則化系數(shù)。
KELM 是新型的單隱藏層前饋型神經(jīng)網(wǎng)絡(luò)算法。對于N 個訓(xùn)練樣本?= {(Xi,ti)|Xi∈Rd,t i∈Rm,i=1,...,N}(其中Xi為輸入,ti為輸出),核函數(shù)KELM 的模型可表示為:
式中,f(X)表示KELM 分類結(jié)果輸出;h(X)及H 為隱含層特征映射的矩陣;ω 為輸出層間和隱含層的連接權(quán)值;h(X)·h(XN)=K(X,XN)為核函數(shù);ΩKELM=HHT為核矩陣;I 為單位對角矩陣;為正則化系數(shù);T 為期望輸出的矩陣。
徑向基函數(shù)(RBF)中只需確定一個參數(shù)(s)的特點(diǎn)對優(yōu)化更有利,所以使用RBF 作為核函數(shù),即:
由于λ 和s 需要事先設(shè)定,因此KELM 分類器性能受其影響。
實踐證明,KELM 的分類準(zhǔn)確率受正則化系數(shù)以及核函數(shù)參數(shù)s 設(shè)置的影響,且分類的準(zhǔn)確率極易陷入局部最小值。因此,此處對KELM 的參數(shù)通過改進(jìn)粒子群優(yōu)化算法進(jìn)行優(yōu)化,以得到最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)模型。
粒子群優(yōu)化算法(PSO)建立在模擬鳥群社會的基礎(chǔ)上,源于對鳥群捕食行為的研究[15]。粒子在搜索范圍內(nèi)飛行的過程中會不斷地通過自己以及相鄰粒子的所歷經(jīng)驗來改變自己的位置,并在所有的位置里找出最佳值。
若粒子群由群體規(guī)模為M 的隨機(jī)粒子構(gòu)成,D為群體的維數(shù),令第i 個粒子所處的位置是xi=(xi1,xi2,…,xiN)。優(yōu)化問題的隨機(jī)解之一就是該粒子所處的位置,再由迭代求出最優(yōu)解。粒子通過跟蹤該粒子的局部最優(yōu)位置pbest和所有粒子的最優(yōu)位置gbest,兩個極值來更新自己的位置,得到兩個最優(yōu)值之后,由如下二式來更新粒子的速度和位置:
式中,k 為當(dāng)前代數(shù);i=1,2,…,M;d=1,2,…,D;是粒子的速度;pbesti,d表示粒子群的局部最優(yōu)位置;gbesti,d表示粒子群的全局最優(yōu)位置,r1、r2是(0,1)中的一個隨機(jī)數(shù);表示粒子當(dāng)前所處的位置。
為改善收斂性,引入慣性權(quán)重因子ω 后的粒子群速度,更新公式為:
PSO 對于離散化的優(yōu)化問題處理不佳,容易陷入局部最優(yōu),進(jìn)化后期收斂的速度和精度都會下降,混沌搜索的引入解決了這一問題。在給定范圍內(nèi)混沌搜索可以按照其自身規(guī)律在每個狀態(tài)只遍歷一次的情況下達(dá)到所有狀態(tài)。能夠避免陷入局部最優(yōu)的情況。因此將混沌搜索應(yīng)用于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,能提高收斂速度和收斂性,具有快速和全局收斂性能。同其他隨機(jī)算法相比混沌搜索有更高的收斂精度[16]。
此處采用經(jīng)典的帳篷(Tent)方程構(gòu)成混沌序列,其數(shù)學(xué)表達(dá)式為:
式中,0≤Zn+1≤1;μ 為控制參量,在μ=1 時,Tent 映射在[0,1]上呈現(xiàn)各狀態(tài)歷變以及完全混沌動力學(xué)特性。
若粒子群出現(xiàn)停滯陷入局部最優(yōu),容易導(dǎo)致PSO 算法早熟。利用災(zāi)變擺混合粒子群進(jìn)化停頓,可加快其進(jìn)化的速度。對于第n 代群體,令fm(n)為其最優(yōu)適應(yīng)度,fa(n)為其平均適應(yīng)度,載氣滿足下式時,算法會出現(xiàn)停頓[17]:
式中,fa(n-n1)表示近期n1代平均進(jìn)化速率(n >n1)。保留全局搜索的最優(yōu)粒子,并對其附近的粒子給以混沌擾動[18],使粒子擺脫局部最優(yōu),提升算法的全局搜索能力。令混沌的擾動范圍為[-β,β],并將各分量映射到該范圍,擾動量Δx=(Δx1,Δx2,…,ΔxD),則:
此時擾動前、后粒子的位置分別由如下二式所示:
通過計算比較這兩個位置的適應(yīng)值來確定是否跟新粒子的位置。混沌粒子群算法能夠避免算法后期的震蕩,提高了收斂性。混沌粒子群算法的具體思想歸納如下:
一、慣性權(quán)重ω
為了平衡算法的局部和全局的搜索能力,既保證其快速收斂又避免陷入局部最優(yōu),引入慣性權(quán)重,此ω 的值越大越有助于全局尋優(yōu),反之有助于局部尋優(yōu),即:
式中,ωmin、ωmax的取值范圍為[0.4,0.9]。
二、加速常數(shù)c
要使算法的收斂速度得到保證,加速常數(shù)調(diào)整更新為:
式中,z=1,2;cmin、cmax的取值范圍為[1.5,2]。
三、隨機(jī)數(shù)
處理隨機(jī)數(shù)以保證效率,如下式所示:
式中rz的取值范圍為[0,1],z=1,2。
四、早熟處理
針對粒子群算法后期收斂速度較慢、容易陷入局部極值點(diǎn)從而出現(xiàn)早熟的問題,粒子群的適應(yīng)度與于粒子的位置息息相關(guān),通過粒子群的方差δ2來判斷是否早熟,即:
式中,F(xiàn)i表示粒子的適應(yīng)度;Favg表示粒子的平均適應(yīng)度。
當(dāng)δ2小于給定值時粒子已經(jīng)進(jìn)入早熟,為跳出局部最優(yōu),此時需要重新設(shè)定粒子速度和位置。圖1為CPSO 與PSO 參數(shù)尋優(yōu)過程中適應(yīng)度值收斂曲線,從圖中收斂曲線可見,與PSO 相比使用CPSO 可獲得精度較高的解。
圖1 適應(yīng)度值收斂曲線圖
對正則化系數(shù)λ 和核函數(shù)參s 數(shù)的優(yōu)化及KELM 最優(yōu)參數(shù),就是選擇適當(dāng)?shù)恼齽t化系數(shù)和核,通過矩陣運(yùn)算得到最大的分類準(zhǔn)確率。記Acc(λ,s)為KELM 的分類準(zhǔn)確率,其最大值記為:maxAcc(λ,s),其中λ∈[0,a] , s∈[0,b]。
此處采用5 折交叉驗證法(5-CV)生成隨機(jī)的訓(xùn)練集、驗證集以及測試集。在避免使用Holdout 驗證泛化性能差的缺點(diǎn)的同時使有限的DGA 數(shù)據(jù)得以充分利用。記去掉第i 折后的分類模型為f-k(i)(xi);第i 折上分類模型驗證的準(zhǔn)確率為d[yi,f-k(i)(xi)],分類準(zhǔn)確率平均值就是交叉驗證準(zhǔn)確率,即:
基于5-CV 和CPSO 算法結(jié)合的KELM 核函數(shù)參數(shù)優(yōu)化過程歸納如下:
1)種群初始化,生成粒子群,給各粒子在搜索空間內(nèi)賦予隨機(jī)的位置和速度;
2)用5-CV 方法評估KELM 分類器參數(shù);
3)是否到達(dá)終止條件4);
4)更新粒子的位置和速度并回到2);
5)根據(jù)最優(yōu)參數(shù)得到最優(yōu)模型。
通過CPSO 對KELM 的核函數(shù)的優(yōu)化,得到優(yōu)化后的KELM 分類器。
基于KELM 的變壓器故障診斷模型,是把測試數(shù)據(jù)輸入到先前所建立的變壓器各故障和與之相應(yīng)的狀態(tài)映射模型中進(jìn)行分類處理。
給定訓(xùn)練集,通過結(jié)合混沌粒子群算法對核函數(shù)參數(shù)進(jìn)行優(yōu)化,并達(dá)到模型的最優(yōu)分類性能。
通過不同特征氣體含量來反映變壓器的運(yùn)行狀態(tài),已得到大量理論研究和實踐的證明。在油浸式電力變壓器運(yùn)行過程中所產(chǎn)生的氣體對其故障診斷極具意義的有H2、CH4、C2H6、C2H4和C2H2。此處以國際電工委員會(IEC)推薦的DGA 數(shù)據(jù)中的H2、CH4、C2H6、C2H4和C2H2的溶解量作為特征量。DGA 數(shù)據(jù)分布區(qū)間大,并且數(shù)據(jù)之間有較大差異性,為降低其相互間由于量值差異造成的影響,減少計算的誤差,提高診斷的精度,在將特征量輸入分類器前首先要對特征氣體數(shù)據(jù)進(jìn)行歸一化處理。令xnew為進(jìn)行歸一化處理之后的氣體體積分?jǐn)?shù);xmin為其對應(yīng)的最小值;xmax為其對應(yīng)的最大值,有:
式中,Up、Lo為常數(shù),表示氣體體積分?jǐn)?shù)歸一化的上下限,且Up∈[-1,1] , Lo∈[-1,1]。
KELM 算法的多分類能力正好用來解決變壓器故障診斷這一多分類問題,因此可以用一個分類器來辨識變壓器的低能放電、高能放電、中低溫過熱、高溫過熱以及正常5 種狀態(tài)。各狀態(tài)編碼如表1。
表1 變壓器狀態(tài)編碼
此處采用5-CV 和CPSO 結(jié)合對KELM 分類器的參數(shù)進(jìn)行優(yōu)化,設(shè)置粒子群的大小為30,進(jìn)化的迭代數(shù)為50,慣性權(quán)重為0.4,加速因子c1、c2都為常數(shù)2,其適應(yīng)度函數(shù)為式(19),具體流程如3.2 節(jié)所述。
基于CPSO-KELM 算法的壓器油中溶解氣體預(yù)測具體實現(xiàn)過程如下:
①對于樣本數(shù)據(jù)按4:1 分為訓(xùn)練集和測試集;
②選取樣本數(shù)據(jù)并按公式(20)做歸一化處理;
③結(jié)合粒子的位置以及參數(shù)(λ,s),訓(xùn)練組數(shù)據(jù)對應(yīng)用了CPSO、5-CV 結(jié)合方法的KELM 進(jìn)行訓(xùn)練;
④訓(xùn)練結(jié)束,歸一化處理測試集數(shù)據(jù);
⑤由公式(1)得到X 所對應(yīng)的輸出向量o(X)={on},n=1,2,…,5;
⑥由下式求得o(X)的編碼向量T={tn},n=1,2,…,5:
⑦對照表1 變壓器狀態(tài)編碼獲得最終分類結(jié)果。
為避免樣本數(shù)據(jù)選取時數(shù)據(jù)集不均衡的問題,應(yīng)使各類樣本數(shù)量相近。原始數(shù)據(jù)中的故障樣本全部采用。選取與DT/L 722-2014《變壓器油中溶解氣體分析和判斷導(dǎo)則》中所給出的氣體注意值相近的樣本作為正常類數(shù)據(jù)。從公開發(fā)表的刊物、資料所確定的變壓器故障的DGA 樣本數(shù)據(jù)中選取樣本訓(xùn)練集與樣本測試集共150 組[19-23]樣本數(shù)據(jù)分別為低能放電、高能放電、中低溫過熱、高溫過熱以及正常共五組,各樣本數(shù)量如表2 所示。
表2 各故障選取的樣本數(shù)
樣本數(shù)據(jù)中每一折數(shù)量為30,120 組訓(xùn)練樣本集用于每次的交叉驗證,30 組樣本用于驗證。表3為PSO-KELM 與CPSO-KELM 的診斷結(jié)果對比(對訓(xùn)練集進(jìn)行5 折交叉驗證),與CPSO-KELM 相比文中所提出的CPSO-KELM 方法訓(xùn)練、測試時間短且更精度高。
表3 兩種方法的結(jié)果對比
為驗證CPSO 優(yōu)化KELM 故障診斷方法的分類性能,將同樣的故障樣本數(shù)據(jù)分別用CPSO-KELM、ELM 和SVM 三種不同方法進(jìn)行對比試驗,對于ELM 采用默認(rèn)的Sigmoid 函數(shù),隱藏層結(jié)點(diǎn)數(shù)為100,通過十次實驗。結(jié)果列于表4,其中每一個結(jié)果均為10 次實驗的平均值,對比曲線如圖2 所示。
表4 三種診斷方法性能對比
圖2 三種診斷方法性能對比
可以看出,同其他兩種方法相比,基于CPSOKELM 的變壓器故障診斷方法需要的訓(xùn)練時間和測試時間更短,同時還兼有更高的準(zhǔn)確率。從圖2 中可以看出,CPSO-KELM 的性能與ELM、SVM 相比也更穩(wěn)定。
將混沌理論、PSO 與核極限學(xué)習(xí)機(jī)相結(jié)合,以CPSO 優(yōu)化KELM,可有效應(yīng)用到變壓器故障診斷當(dāng)中?;煦缋碚撆cPSO 進(jìn)行混合,提高了PSO 的局部能力。將混合后的CPSO 用于對KELM 參數(shù)進(jìn)行尋優(yōu)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,可使KELM 的網(wǎng)絡(luò)結(jié)構(gòu)最優(yōu),以此提高了診斷的可靠性。結(jié)合實際數(shù)據(jù),SVM、ELM 與所提新方法在診斷結(jié)果上的不同表現(xiàn)得到直觀的對比。實驗結(jié)果表明, 所提出的CPSO 優(yōu)化KELM 的故障診斷方法具有更好的學(xué)習(xí)能力和更高的診斷精度。