摘要:近幾年,對(duì)于變壓器故障診斷的研究逐漸增加,提高其診斷準(zhǔn)確率具有明確的價(jià)值。以往常用的診斷方法雖然具有一定準(zhǔn)確率,但效率較低,缺乏時(shí)效性。隨著對(duì)于機(jī)器學(xué)習(xí)的相關(guān)研究不斷深入,其在變壓器故障診斷中的應(yīng)用逐漸被發(fā)現(xiàn)?;跈C(jī)器學(xué)習(xí),分別在K鄰近(K-NearestNeighbors,KNN)算法、決策樹(shù)(DecisionTree,DT)算法、支持向量機(jī)(SupportVectorMachine,SVM)算法3方面搭建了診斷模型,并進(jìn)行了縱橫交叉優(yōu)化(CrisscrossOptimization,CSO)算法的超參數(shù)優(yōu)化模型搭建。最后,經(jīng)過(guò)仿真實(shí)驗(yàn)驗(yàn)證可知,經(jīng)CSO優(yōu)化后,3種診斷模型的準(zhǔn)確率和平均診斷時(shí)間均得到了有效提高。
關(guān)鍵詞:機(jī)器學(xué)習(xí)變壓器故障診斷優(yōu)化模型
ResearchonTtransformerFaultDiagnosisMethodBasedonMultipleMachineLearningAlgorithms
CHENGRongsen
XinyangAgricultureandForestryUniversity,Xinyang,He’nanProvince,464000China
Abstract:Inrecentyears,researchontransformerfaultdiagnosishasgraduallyincreased,andimprovingitsdiagnosticaccuracyhasclearvalue.Thecommonlyuseddiagnosticmethodsinthepasthaveacertainaccuracy,buttheirefficiencyislowandlacktimeliness.Withthecontinuousdeepeningofresearchonmachinelearning,itsapplicationintransformerfaultdiagnosisisgraduallybeingdiscovered.Thisarticlebuildsdiagnosticmodelsbasedonmachinelearninginthreeaspects:theK-NearestNeighbors(KNN)algorithm,theDecisionTree(DT)algorithm,andtheSupportVectorMachine(SVM)algorithm,andconstructsahyperparameteroptimizationmodelbyusingtheCrisscrossOptimization(CSO)algorithm.Finally,itwasverifiedthroughsimulationexperimentsthattheaccuracyandaveragediagnostictimeofthethreediagnosticmodelswereeffectivelyimprovedafterCSOoptimization.
KeyWords:Machinelearning;Transformer;Faultdiagnosis;Optimizationmodel
目前來(lái)說(shuō),變壓器故障診斷方法主要有三比值法、三查法、特征氣體法等,但也存在故障診斷效率不高、診斷實(shí)時(shí)性不強(qiáng)等問(wèn)題。機(jī)器學(xué)習(xí)被認(rèn)為是目前實(shí)現(xiàn)人工智能最為可行的方法,將其應(yīng)用于變壓器故障診斷中,對(duì)于加強(qiáng)變壓器故障診斷準(zhǔn)確率有著極為重要的現(xiàn)實(shí)意義。
1變壓器故障類(lèi)型
1.1變壓器熱性故障
變壓器熱性故障是由溫度異常升高引起的故障類(lèi)型,通常是由絕緣材料老化、過(guò)載運(yùn)行或冷卻系統(tǒng)失效等原因?qū)е?。按照過(guò)熱位置溫度,可將變壓器熱性故障分成3種類(lèi)型,如表1所示。
1.1.1低溫過(guò)熱
低溫過(guò)熱通常發(fā)生在過(guò)熱位置溫度不超過(guò)500℃(t≤500℃)的情況下,此類(lèi)故障多由絕緣油老化、輕微過(guò)載或冷卻系統(tǒng)部分失效引起[1]。低溫過(guò)熱雖然不會(huì)立即導(dǎo)致變壓器的嚴(yán)重?fù)p壞,但長(zhǎng)期運(yùn)行可能加速絕緣材料的老化,影響變壓器的使用壽命。對(duì)于低溫過(guò)熱故障的診斷,常用的技術(shù)包括油中溶解氣體分析和局部放電檢測(cè)。
1.1.2中溫過(guò)熱
中溫過(guò)熱發(fā)生在過(guò)熱位置溫度大于500℃且小于等于800℃的情況下(500℃<t≤800℃),通常由較嚴(yán)重的過(guò)載運(yùn)行、絕緣材料老化程度較高或冷卻系統(tǒng)效率顯著下降引起。
1.1.3高溫過(guò)熱
高溫過(guò)熱是指過(guò)熱位置溫度超過(guò)800℃(t>800℃)的情況,這種故障通常由嚴(yán)重的過(guò)載運(yùn)行、大面積絕緣損壞或冷卻系統(tǒng)完全失效引起。高溫過(guò)熱會(huì)導(dǎo)致絕緣材料快速分解,可能引發(fā)嚴(yán)重的電氣故障甚至火災(zāi)。
1.2變壓器電性故障
變壓器電性故障主要是在高電壓作用下,絕緣材料在劣化情況下發(fā)生的擊穿放電現(xiàn)象。從化學(xué)機(jī)理的角度來(lái)看,變壓器的電性故障與熱故障的機(jī)理基本相同,都是由于化學(xué)鍵的斷裂和重新結(jié)合所導(dǎo)致。然而,電性故障和熱故障在能量形式和表現(xiàn)特征上存在顯著差異。具體來(lái)說(shuō),在電性故障過(guò)程中,高電壓導(dǎo)致的電場(chǎng)作用會(huì)使絕緣材料中的分子鍵發(fā)生斷裂,形成自由基和離子,這些帶電粒子在電場(chǎng)作用下迅速運(yùn)動(dòng)并引發(fā)進(jìn)一步的分解反應(yīng),最終導(dǎo)致絕緣材料的擊穿和放電。而在熱故障過(guò)程中,主要是由于過(guò)高的溫度引起絕緣材料的熱分解,導(dǎo)致分子結(jié)構(gòu)的變化和劣化。
在不同類(lèi)型的故障情況下,變壓器產(chǎn)生的典型故障特征成分和速率也會(huì)有所不同。在不同故障類(lèi)型下,故障氣體的相對(duì)含量和生成規(guī)律也有所不同,這為變壓器故障診斷提供了重要的依據(jù)[2]。根據(jù)放電故障強(qiáng)度,將變壓器電性故障分為以下3類(lèi),如表2所示。
2基于機(jī)器學(xué)習(xí)的變壓器故障診斷方法
無(wú)論是熱故障還是其他常見(jiàn)故障,傳統(tǒng)的診斷方法在變壓器故障檢測(cè)中往往存在準(zhǔn)確率低和實(shí)時(shí)性差的問(wèn)題。針對(duì)這一情況,本文提出了基于機(jī)器學(xué)習(xí)的變壓器故障診斷方法,研究了K近鄰(K-NearestNeighbors,KNN)算法、決策樹(shù)(DecisionTree,DT)算法和支持向量機(jī)(SupportVectorMachine,SVM)算法3種機(jī)器學(xué)習(xí)算法在變壓器故障診斷中的應(yīng)用,以提高變壓器故障診斷的準(zhǔn)確性和實(shí)時(shí)性。
2.1K近鄰算法
KNN算法是一種簡(jiǎn)單且直觀的監(jiān)督學(xué)習(xí)算法,被廣泛用于分類(lèi)和回歸任務(wù)。其基本原理是通過(guò)計(jì)算待分類(lèi)樣本與訓(xùn)練集中所有樣本的距離,選擇距離最近的K個(gè)樣本(鄰居),然后根據(jù)這些鄰居的類(lèi)別或數(shù)值進(jìn)行預(yù)測(cè)。KNN算法具有無(wú)需訓(xùn)練過(guò)程、實(shí)現(xiàn)簡(jiǎn)單、效果直觀的優(yōu)點(diǎn),但在面對(duì)高維數(shù)據(jù)或樣本量較大時(shí),計(jì)算復(fù)雜度和存儲(chǔ)需求較高。為了提高效率,常使用KD樹(shù)、球樹(shù)等數(shù)據(jù)結(jié)構(gòu)進(jìn)行優(yōu)化。
在本文中,在m個(gè)特征向量的特征矩陣可設(shè)為:
其中n維特征向量為:
對(duì)應(yīng)m個(gè)樣本的標(biāo)簽為:
而對(duì)于樣本點(diǎn)之間的距離可采取Minkowskidistance定義,則二者間的距離定義為
式中:a表示為該算法的超參數(shù),a≥1。如果a數(shù)值處于2時(shí),則確定歐式距離,即:
由于KNN算法在計(jì)算各特征間的距離時(shí)需要保持相同的權(quán)重,所以,為了保證每個(gè)特征的計(jì)算距離一致,必須對(duì)每個(gè)特征進(jìn)行歸一化處理,以消除數(shù)據(jù)的量綱差異。
2.2決策樹(shù)算法
DT算法是一種常用的監(jiān)督學(xué)習(xí)算法,適用于分類(lèi)和回歸任務(wù)。它通過(guò)構(gòu)建樹(shù)狀模型來(lái)進(jìn)行決策,使數(shù)據(jù)可以被逐層細(xì)化并歸類(lèi)。DT的每個(gè)節(jié)點(diǎn)代表一個(gè)特征或?qū)傩?,每個(gè)分支代表該特征的一個(gè)可能值,葉節(jié)點(diǎn)則代表最終的預(yù)測(cè)結(jié)果或類(lèi)別。DT的構(gòu)建過(guò)程涉及選擇最優(yōu)特征進(jìn)行數(shù)據(jù)分割,以最大程度地減少數(shù)據(jù)的不純度。
DT的優(yōu)點(diǎn)包括易于理解和解釋、不需要數(shù)據(jù)歸一化、能夠處理多類(lèi)別數(shù)據(jù)及在處理大型數(shù)據(jù)集時(shí)的高效性。然而,DT也存在一些缺點(diǎn),如容易過(guò)擬合、對(duì)數(shù)據(jù)噪聲敏感及在數(shù)據(jù)維度較高時(shí)表現(xiàn)較差。因此,為了克服以上缺點(diǎn),本次使用剪枝技術(shù)來(lái)簡(jiǎn)化樹(shù)結(jié)構(gòu)。
2.3支持向量機(jī)算法
SVM算法是一種經(jīng)典的二分類(lèi)機(jī)器學(xué)習(xí)算法,其核心思想是尋找一個(gè)最優(yōu)超平面作為決策邊界,使決策邊界與兩類(lèi)最近的樣本點(diǎn)之間的距離最大化,從而提高模型的泛化能力。距離決策邊界最近的這些樣本點(diǎn)被稱(chēng)為支持向量,各樣本點(diǎn)到?jīng)Q策超平面的距離表示為d[3]。則,假設(shè)樣本點(diǎn)線性可分,如圖1所示。
使用n維空間中的距離計(jì)算公式,將圖1中支持向量的樣本點(diǎn)x到?jīng)Q策超平面的距離表示為
式中,為權(quán)重w的膜,b為超平面截距,可定義為
按照這一定義,可以將圖1中決策邊界上方的樣本點(diǎn)標(biāo)記為y=1,下方的樣本點(diǎn)標(biāo)記為y=-1,因此,所有樣本點(diǎn)xi與決策邊界的距離必然大于d,簡(jiǎn)化后,可得到。綜上,結(jié)合SVM算法核心思想,列出以下有條件最優(yōu)化問(wèn)題:
在結(jié)合上述優(yōu)化目標(biāo)函數(shù)的基礎(chǔ)上,SVM算法的首要任務(wù)是確保決策超平面可以完全區(qū)分兩類(lèi)特征樣本,然而,這樣會(huì)限制模型的泛化能力。為了解決這一問(wèn)題,以及處理數(shù)據(jù)樣本的線性可分性,可以通過(guò)求解拉格朗日對(duì)偶問(wèn)題來(lái)優(yōu)化目標(biāo)函數(shù),轉(zhuǎn)化為以下形式:
優(yōu)化后,公式大大增加了數(shù)據(jù)點(diǎn)線性可分概率。在SVM算法中,常用函數(shù)包括有限性核函數(shù)、多項(xiàng)式核函數(shù)與高斯核函數(shù)。在使用高斯核函數(shù)時(shí),y與C作為模型超參數(shù),可使用智能優(yōu)化算法解決。
3仿真結(jié)果分析
通過(guò)利用CSO算法對(duì)這3種機(jī)器學(xué)習(xí)算法的超參數(shù)進(jìn)行優(yōu)化,并通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了這些優(yōu)化模型的有效性[4]。在使用CSO算法對(duì)原模型進(jìn)行優(yōu)化前,可借助實(shí)例化模型將訓(xùn)練數(shù)據(jù)集平均劃分為5份,計(jì)算這5份驗(yàn)證集的平均誤差,并輪流使用,得到的差異值與實(shí)驗(yàn)數(shù)值作為實(shí)驗(yàn)度函數(shù)。在仿真實(shí)驗(yàn)中,分別建立了KNN算法、DT算法、SVM算法變壓器故障診斷模型,并與傳統(tǒng)三比值法的診斷準(zhǔn)確率進(jìn)行對(duì)比,得到F1分?jǐn)?shù)對(duì)比,如表3所示。
由表3可知,基于機(jī)器學(xué)習(xí)的3種模型在故障診斷準(zhǔn)確率和F1分?jǐn)?shù)方面明顯優(yōu)于傳統(tǒng)的三比值法。其中,DT算法模型的診斷準(zhǔn)確率最高,比三比值法高出9.53%;在F1分?jǐn)?shù)方面,3種機(jī)器學(xué)習(xí)模型均顯著提升,約提高了30%。這些數(shù)據(jù)表明,與三比值法相比,基于機(jī)器學(xué)習(xí)的3種模型在不同評(píng)價(jià)指標(biāo)下均表現(xiàn)出更優(yōu)越的故障診斷性能[5]。
4結(jié)論
本文基于機(jī)器學(xué)習(xí)算法構(gòu)建了KNN算法、DT算法和SVM算法3種變壓器故障診斷模型,通過(guò)理論研究與仿真實(shí)驗(yàn),得出以下結(jié)論。為了應(yīng)對(duì)傳統(tǒng)變壓器診斷準(zhǔn)確率低、實(shí)時(shí)性差的問(wèn)題,本文提出了一種基于機(jī)器學(xué)習(xí)的故障診斷模型。仿真實(shí)驗(yàn)表明,這些模型具有較高的診斷精度和快速的診斷速度,能夠有效滿足實(shí)際工程需求。此外,針對(duì)機(jī)器學(xué)習(xí)算法在特征穩(wěn)定性和提取能力方面的不足,本文采用CSO算法對(duì)3種模型進(jìn)行了優(yōu)化,優(yōu)化后的變壓器故障診斷模型在診斷準(zhǔn)確率和F1分?jǐn)?shù)方面均有顯著提升。
參考文獻(xiàn):
[1]李強(qiáng),張睿智,范曉丹,等.基于特征氣體和比值準(zhǔn)則的RAPO植物油變壓器故障診斷方法[J].高壓電器,2023,59(9):294-303.
[2]劉國(guó)柱.基于自注意力機(jī)制與1D-CNN的變壓器故障診斷方法[J/OL].重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版),1-8[2024-05-28].http://kns.cnki.net/kcms/detail/50.1155.N.20230726.1802.006.html.
[3]王爽,羅倩,唐波,等.考慮樣本類(lèi)內(nèi)不平衡的CHPOA-DBN變壓器故障診斷方法[J].中國(guó)電力,2023,56(10):133-144.
[4]萬(wàn)可力,馬宏忠,崔佳嘉,等.基于Mel-GADF與ConvNeXt-T的變壓器鐵心松動(dòng)故障診斷方法[J].電力自動(dòng)化設(shè)備,2024,44(3):217-224.
[5]宋輝,苑龍祥,郭雙權(quán).基于數(shù)據(jù)增強(qiáng)和特征注意力機(jī)制的灰狼優(yōu)化算法-優(yōu)化殘差神經(jīng)網(wǎng)絡(luò)變壓器故障診斷方法[J].現(xiàn)代電力,2024,41(2):392-400.