陸敏安 任堂正 肖遠兵 陳敬德 崔明飛
摘要:油中溶解氣體分析(DGA)是評估變壓器運行狀態(tài)和故障診斷的重要指標(biāo)?,F(xiàn)將支持向量機算法(SVM)應(yīng)用于DGA和故障診斷中,并對比了SVM算法和其他傳統(tǒng)算法在故障診斷中的正確率。研究結(jié)果表明,傳統(tǒng)算法的故障診斷正確率在43%~54%,而優(yōu)化后的SVM算法正確率為76.77%。超過23%的正確率提升充分證明了SVM算法在故障數(shù)據(jù)特征識別中的先進性,對變壓器運維提供了強力的技術(shù)支持。
關(guān)鍵詞:變壓器;支持向量機;油中溶解氣體分析;故障診斷
0? ? 引言
準(zhǔn)確評估變壓器運行狀態(tài)對提升電網(wǎng)可靠性、制定運維檢修策略及消除事故隱患具有重要意義。油中溶解氣體分析(DGA)是反映變壓器運行狀態(tài)的重要指標(biāo)[1]。
傳統(tǒng)的DGA方法主要使用IEC 60599提出的三比值法[2],國內(nèi)的科研人員也提出了《變壓器油中溶解氣體分析和判斷導(dǎo)則》(DL/T 722—2014)用以正確評估變壓器油的質(zhì)量和設(shè)備運行狀況[3]。傳統(tǒng)分析方法雖然有國內(nèi)外電工委員會的支持,但固定的閾值邊界無法保證正確率[4-5]。
近年來,專家系統(tǒng)、模糊理論和灰色關(guān)聯(lián)性理論等方法逐漸被應(yīng)用于DGA[6-7]。相比于傳統(tǒng)的DGA方法,這些評估理論體系的確提升了故障識別的正確率,但是這些有限的提高依托于豐富的機理知識儲備,推理過程中的邏輯也不夠縝密,從而導(dǎo)致應(yīng)用門檻較高。更先進的智能算法也被嘗試用于DGA,例如BP神經(jīng)網(wǎng)絡(luò),但是網(wǎng)絡(luò)收斂速度慢,容易過擬合,并且在數(shù)據(jù)量較少時無法保證正確率的缺點也阻礙了它的進一步應(yīng)用與推廣[8]。
基于對過往發(fā)表論文的研究,為了顯著提升基于DGA的故障診斷的正確率,需要使用有堅實理論基礎(chǔ)并且適用于小樣本的機器學(xué)習(xí)算法。本文將介紹支持向量機算法(SVM)在DGA中的應(yīng)用。第一節(jié)首先介紹SVM算法的原理;第二節(jié)則驗證SVM在DGA故障診斷中的正確率,并將其與傳統(tǒng)算法進行對比;第三節(jié)對文章成果進行了總結(jié)。
1? ? SVM算法原理
支持向量機(SVM)[9-10]的理論依據(jù)是統(tǒng)計學(xué)習(xí),通過數(shù)據(jù)挖掘的方法,解決模式識別、時間序列分析等問題,最小化了經(jīng)驗風(fēng)險和模型復(fù)雜度的同時,在數(shù)據(jù)樣本有限的條件下,能夠確保輸出函數(shù)的平滑性以及模型的推廣性[11]。
以二分類問題舉例[10],如圖1(a)所示,要將灰、黑兩種類別分類,圖1(b)中提供了一個分割線A,可以被稱為分類線。但是,推廣到高維空間,當(dāng)要被分割的數(shù)據(jù)不只是一維或二維的數(shù)據(jù),那么分割這些數(shù)據(jù)的點和線則會變?yōu)槊?,即被稱作“決策面”,而虛線所連接的點即被稱為“支持向量”。
圖1(c)中提供了決策面B和其對應(yīng)的支持向量。雖然A和B都達到了將灰、黑兩類數(shù)據(jù)分類的效果,但SVM算法會認(rèn)為A在性能上優(yōu)于B,其依據(jù)是決策面A的分類間隔大于B,分類間隔為“決策面”移動到“支持向量”所形成的平面的極限距離。所以,SVM的學(xué)習(xí)策略就是間隔最大化,其機理為尋找一個不僅能以一定的精度完成問題分類,并且還能保證決策面到兩側(cè)支持向量間隔最大的最優(yōu)分類面[10,12]。
圖1中的數(shù)據(jù)點可以看作x,它們的顏色可以看作類別y,訓(xùn)練集可以寫為(xi,yi),x∈RRn,y∈{±1},由于圖1中的灰、黑數(shù)據(jù)線性可分,分類面可以寫作xw+b=0,w為權(quán)值向量,b為偏置。為了滿足所有樣本可以被分類面進行正確分類,并且具有一定的分類間隔的條件,則需:
2? ? 基于SVM的變壓器DGA和故障診斷
2.1? ? 變壓器DGA和故障診斷原理
油浸式變壓器的絕緣油主要有兩種元素:碳和氫。當(dāng)變壓器內(nèi)部發(fā)生過熱和放電反應(yīng)時,絕緣油和絕緣材料則發(fā)生化學(xué)分解,產(chǎn)生氫氣、烴類氣體和碳氧化物[1]。油中溶解的氣體包括7種:氫氣(H2)、甲烷(CH4)、乙炔(C2H2)、乙烯(C2H4)、乙烷(C2H6)、一氧化碳(CO)、二氧化碳(CO2)[2-3]。
上述7種氣體可以作為故障特征氣體,它們的種類、含量、氣體之間的比例關(guān)系也直接反應(yīng)了變壓器的故障類別,例如低溫過熱產(chǎn)生大量H2,嚴(yán)重過熱產(chǎn)生少量C2H4,故障涉及絕緣材料時則產(chǎn)生大量CO和CO2。基于DGA的變壓器故障類別可分為6種:過熱300 ℃以下(T1)、過熱300~700 ℃(T2)、過熱700 ℃以上(T3)、低能量放電(D1)、高能量放電(D2)和局部放電(PD)[2]。
2.2? ? 算例分析
2.2.1? ? 數(shù)據(jù)描述
本文基于TPC&KHB變壓器故障案例數(shù)據(jù)[13],對SVM算法在溶解氣體故障特征分析中的應(yīng)用結(jié)果進行驗證。案例中的DGA故障數(shù)據(jù)數(shù)量為215,按照7:3的比例分為訓(xùn)練集和測試集。由于CO2的數(shù)據(jù)缺失比例達到60%,本文中只考慮其他6種氣體為特征氣體。將烴類氣體濃度也作為特征氣體,即CH4、C2H2、C2H4和C2H6這四種氣體濃度之和。最后一個特征量為所有特征氣體的濃度總量。
2.2.2? ? SVM模型調(diào)參
對低維空間內(nèi)線性不可分的問題,SVM算法可以將其映射到高維空間,從而變成線性可分[14]。然而,如果將所有線性不可分的樣例都映射到高維空間中,那么維度的大小和計算復(fù)雜度會急劇上升。核函數(shù)的存在,可以先在低維上進行計算,將實質(zhì)的分類效果表現(xiàn)在高維上,從而避免了直接在高維空間中進行復(fù)雜的運算。本文中,在應(yīng)用SVM算法進行DGA故障特征分析時,考慮了4種核函數(shù),分別為線性核函數(shù)(Linear)、多項式核函數(shù)(Poly)、徑向基核函數(shù)(Rbf)以及Sigmoid核函數(shù)[14-15]。
此外,SVM模型還有兩個重要參量:C和γ[14-15]。C為懲罰系數(shù),即為對誤差的容忍度。提高C的數(shù)值意味著對誤差容忍度的降低,但容易造成過擬合,但C的數(shù)值太小也會造成欠擬合,影響結(jié)果精度。γ為徑向基核函數(shù)的一個參量,決定了低維數(shù)據(jù)映射到高維特征空間的分布。γ的數(shù)值大小和支持向量的個數(shù)成反比,而支持向量的個數(shù)會影響機器學(xué)習(xí)訓(xùn)練的速度。因此,對C和γ的調(diào)參,是優(yōu)化SVM算法分類結(jié)果的重要步驟。
通過GridSearchCV函數(shù)對SVM算法的核函數(shù)、C和γ進行優(yōu)化調(diào)參,即對幾種參數(shù)在其被設(shè)定的取值范圍內(nèi)做依次循環(huán),選取獲得最優(yōu)結(jié)果時所對應(yīng)的參數(shù)取值。C的取值范圍在28~29,γ的取值范圍在2-20~2-10,模型的正確率計算公式如式(7)所示,不同核函數(shù)的分類結(jié)果如表1所示。
如表1所示,Linear核函數(shù)的分類正確率最高,其所對應(yīng)的C和γ值為422.32和0.000 9。雖然正確率高達93.84%,但這僅僅是針對其中一組數(shù)據(jù)的分類結(jié)果。為了更好地評估模型的優(yōu)劣,需要進行K折交叉驗證,即防止因訓(xùn)練樣數(shù)量少或復(fù)雜度高而造成過擬合現(xiàn)象。將數(shù)據(jù)分割成K個子樣本,一個單獨的子樣本作為驗證數(shù)據(jù),其他K-1個樣本用來訓(xùn)練。交叉驗證重復(fù)K次,每個子樣本驗證一次,本文采用20折交叉驗證識別故障特征的種類,平均正確率為76.77%。雖然正確率大幅下降,但是通過增加測試集的隨機性,更準(zhǔn)確和客觀地體現(xiàn)了模型的泛化能力。
2.3? ? SVM算法和傳統(tǒng)算法的比較
為了驗證上述觀點和體現(xiàn)SVM算法的優(yōu)勢,將IEC三比值法和無編碼比值法設(shè)定的缺省參數(shù)應(yīng)用于案例數(shù)據(jù)中,故障分類的正確率對比如表2所示。
由表2可知,傳統(tǒng)的三比值法正確率最低,僅為43.99%。無編碼比值法為54.72%,正確率提高了約10%。然而SVM算法的整體正確率高達76.77%,相比于傳統(tǒng)的三比值法,其正確率提高了約33%。這一結(jié)果充分證明了SVM算法在DGA故障診斷應(yīng)用中的先進性。
3? ? 結(jié)語
本文介紹了SVM算法,并將其應(yīng)用于變壓器的DGA和故障診斷中。在對SVM算法進行調(diào)參優(yōu)化后,通過算例分析得出SVM算法的故障診斷準(zhǔn)確率為76.77%,對比傳統(tǒng)算法提高了10%~33%。
本文的結(jié)果體現(xiàn)了機器學(xué)習(xí)算法在DGA和故障診斷中的優(yōu)勢,但是將先進算法應(yīng)用于電力設(shè)備運維中還處于初步嘗試階段。受限于數(shù)據(jù)質(zhì)量,算法模型的正確率還有較大的上升空間,更先進的算法也等待著被逐一嘗試與應(yīng)用,從而形成專業(yè)和完善的電力設(shè)備運行狀態(tài)評估體系。
[參考文獻]
[1] 操敦奎.變壓器油中氣體分析診斷與故障檢查[M].北京:中國電力出版社,2005.
[2] Mineral oil-filled electrical equipment in service-Guidance on the interpretation of dissolved and free gases analysis:IEC 60599—2015[S].
[3] 變壓器油中溶解氣體分析和判斷導(dǎo)則:DL/T 722—2014[S].
[4] 蘇鄭予希,唐小峰.基于三比值特征量與改進雞群算法優(yōu)化支持向量機的變壓器故障模型[J].科技創(chuàng)新導(dǎo)報,2018,15(29):5-7.
[5] 齊波,張鵬,徐茹枝,等.基于分布模型的變壓器差異化預(yù)警值計算方法[J].高電壓技術(shù),2016,42(7):2290-2298.
[6] 王永強,律方成,李和明.基于粗糙集理論和貝葉斯網(wǎng)絡(luò)的電力變壓器故障診斷方法[J].中國電機工程學(xué)報,2006,26(8):137-140.
[7] 張俊.基于灰色理論的變壓器故障預(yù)測與評估[D].成都:西華大學(xué),2012.
[8] 李江浩.基于改進神經(jīng)網(wǎng)絡(luò)的變壓器故障診斷方法的研究[D].北京:華北電力大學(xué),2015.
[9] 丁世飛,齊丙娟,譚紅艷.支持向量機理論與算法研究綜述[J].電子科技大學(xué)學(xué)報,2011,40(1):1-10.
[10] CRISTIANINI N,TAYLOR J S.支持向量機導(dǎo)論[M].李國正,王猛,曾華軍,譯.北京:電子工業(yè)出版社,2004.
[11] 劉曉津.基于支持向量機和油中溶解氣體分析的變壓器故障診斷[D].天津:天津大學(xué),2007.
[12] 張學(xué)工.關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機[J].自動化學(xué)報,2000,26(1):32-42.
[13] 王錦融.利用GSM資料收集模組與多層支持向量機分類器建構(gòu)電力變壓器故障診斷系統(tǒng)[D].高雄:國立高雄應(yīng)用科技大學(xué),2005.
[14] 周啟超,劉劍,劉麗,等.基于SVM的通風(fēng)系統(tǒng)故障診斷懲罰系數(shù)與核函數(shù)系數(shù)優(yōu)化研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2019,15(4):45-51.
收稿日期:2020-06-04
作者簡介:陸敏安(1983—),男,上海人,高級工程師,研究方向:變電運行。
任堂正(1990—),男,山東人,碩士,工程師,研究方向:變電設(shè)備檢修及電氣試驗。
肖遠兵(1991—),男,江西人,碩士,工程師,研究方向:繼電保護。