基于多種機(jī)器學(xué)習(xí)算法的變壓器故障診斷方法研究

2024-12-05 00:00:00程榮森

科技資訊 2024年21期

摘要：近幾年，對(duì)于變壓器故障診斷的研究逐漸增加，提高其診斷準(zhǔn)確率具有明確的價(jià)值。以往常用的診斷方法雖然具有一定準(zhǔn)確率，但效率較低，缺乏時(shí)效性。隨著對(duì)于機(jī)器學(xué)習(xí)的相關(guān)研究不斷深入，其在變壓器故障診斷中的應(yīng)用逐漸被發(fā)現(xiàn)?；跈C(jī)器學(xué)習(xí)，分別在K鄰近（K-NearestNeighbors，KNN）算法、決策樹(shù)（DecisionTree，DT）算法、支持向量機(jī)（SupportVectorMachine，SVM）算法3方面搭建了診斷模型，并進(jìn)行了縱橫交叉優(yōu)化（CrisscrossOptimization，CSO）算法的超參數(shù)優(yōu)化模型搭建。最后，經(jīng)過(guò)仿真實(shí)驗(yàn)驗(yàn)證可知，經(jīng)CSO優(yōu)化后，3種診斷模型的準(zhǔn)確率和平均診斷時(shí)間均得到了有效提高。

關(guān)鍵詞：機(jī)器學(xué)習(xí)變壓器故障診斷優(yōu)化模型

ResearchonTtransformerFaultDiagnosisMethodBasedonMultipleMachineLearningAlgorithms

CHENGRongsen

XinyangAgricultureandForestryUniversity，Xinyang，He’nanProvince，464000China

Abstract：Inrecentyears，researchontransformerfaultdiagnosishasgraduallyincreased，andimprovingitsdiagnosticaccuracyhasclearvalue.Thecommonlyuseddiagnosticmethodsinthepasthaveacertainaccuracy，buttheirefficiencyislowandlacktimeliness.Withthecontinuousdeepeningofresearchonmachinelearning，itsapplicationintransformerfaultdiagnosisisgraduallybeingdiscovered.Thisarticlebuildsdiagnosticmodelsbasedonmachinelearninginthreeaspects：theK-NearestNeighbors（KNN）algorithm，theDecisionTree（DT）algorithm，andtheSupportVectorMachine（SVM）algorithm，andconstructsahyperparameteroptimizationmodelbyusingtheCrisscrossOptimization（CSO）algorithm.Finally，itwasverifiedthroughsimulationexperimentsthattheaccuracyandaveragediagnostictimeofthethreediagnosticmodelswereeffectivelyimprovedafterCSOoptimization.

KeyWords：Machinelearning;Transformer;Faultdiagnosis;Optimizationmodel

目前來(lái)說(shuō)，變壓器故障診斷方法主要有三比值法、三查法、特征氣體法等，但也存在故障診斷效率不高、診斷實(shí)時(shí)性不強(qiáng)等問(wèn)題。機(jī)器學(xué)習(xí)被認(rèn)為是目前實(shí)現(xiàn)人工智能最為可行的方法，將其應(yīng)用于變壓器故障診斷中，對(duì)于加強(qiáng)變壓器故障診斷準(zhǔn)確率有著極為重要的現(xiàn)實(shí)意義。

1變壓器故障類(lèi)型

1.1變壓器熱性故障

變壓器熱性故障是由溫度異常升高引起的故障類(lèi)型，通常是由絕緣材料老化、過(guò)載運(yùn)行或冷卻系統(tǒng)失效等原因?qū)е?。按照過(guò)熱位置溫度，可將變壓器熱性故障分成3種類(lèi)型，如表1所示。

1.1.1低溫過(guò)熱

低溫過(guò)熱通常發(fā)生在過(guò)熱位置溫度不超過(guò)500℃（t≤500℃）的情況下，此類(lèi)故障多由絕緣油老化、輕微過(guò)載或冷卻系統(tǒng)部分失效引起[1]。低溫過(guò)熱雖然不會(huì)立即導(dǎo)致變壓器的嚴(yán)重?fù)p壞，但長(zhǎng)期運(yùn)行可能加速絕緣材料的老化，影響變壓器的使用壽命。對(duì)于低溫過(guò)熱故障的診斷，常用的技術(shù)包括油中溶解氣體分析和局部放電檢測(cè)。

1.1.2中溫過(guò)熱

中溫過(guò)熱發(fā)生在過(guò)熱位置溫度大于500℃且小于等于800℃的情況下（500℃<t≤800℃），通常由較嚴(yán)重的過(guò)載運(yùn)行、絕緣材料老化程度較高或冷卻系統(tǒng)效率顯著下降引起。

1.1.3高溫過(guò)熱

高溫過(guò)熱是指過(guò)熱位置溫度超過(guò)800℃（t>800℃）的情況，這種故障通常由嚴(yán)重的過(guò)載運(yùn)行、大面積絕緣損壞或冷卻系統(tǒng)完全失效引起。高溫過(guò)熱會(huì)導(dǎo)致絕緣材料快速分解，可能引發(fā)嚴(yán)重的電氣故障甚至火災(zāi)。

1.2變壓器電性故障

變壓器電性故障主要是在高電壓作用下，絕緣材料在劣化情況下發(fā)生的擊穿放電現(xiàn)象。從化學(xué)機(jī)理的角度來(lái)看，變壓器的電性故障與熱故障的機(jī)理基本相同，都是由于化學(xué)鍵的斷裂和重新結(jié)合所導(dǎo)致。然而，電性故障和熱故障在能量形式和表現(xiàn)特征上存在顯著差異。具體來(lái)說(shuō)，在電性故障過(guò)程中，高電壓導(dǎo)致的電場(chǎng)作用會(huì)使絕緣材料中的分子鍵發(fā)生斷裂，形成自由基和離子，這些帶電粒子在電場(chǎng)作用下迅速運(yùn)動(dòng)并引發(fā)進(jìn)一步的分解反應(yīng)，最終導(dǎo)致絕緣材料的擊穿和放電。而在熱故障過(guò)程中，主要是由于過(guò)高的溫度引起絕緣材料的熱分解，導(dǎo)致分子結(jié)構(gòu)的變化和劣化。

在不同類(lèi)型的故障情況下，變壓器產(chǎn)生的典型故障特征成分和速率也會(huì)有所不同。在不同故障類(lèi)型下，故障氣體的相對(duì)含量和生成規(guī)律也有所不同，這為變壓器故障診斷提供了重要的依據(jù)[2]。根據(jù)放電故障強(qiáng)度，將變壓器電性故障分為以下3類(lèi)，如表2所示。

2基于機(jī)器學(xué)習(xí)的變壓器故障診斷方法

無(wú)論是熱故障還是其他常見(jiàn)故障，傳統(tǒng)的診斷方法在變壓器故障檢測(cè)中往往存在準(zhǔn)確率低和實(shí)時(shí)性差的問(wèn)題。針對(duì)這一情況，本文提出了基于機(jī)器學(xué)習(xí)的變壓器故障診斷方法，研究了K近鄰（K-NearestNeighbors，KNN）算法、決策樹(shù)（DecisionTree，DT）算法和支持向量機(jī)（SupportVectorMachine，SVM）算法3種機(jī)器學(xué)習(xí)算法在變壓器故障診斷中的應(yīng)用，以提高變壓器故障診斷的準(zhǔn)確性和實(shí)時(shí)性。

2.1K近鄰算法

KNN算法是一種簡(jiǎn)單且直觀的監(jiān)督學(xué)習(xí)算法，被廣泛用于分類(lèi)和回歸任務(wù)。其基本原理是通過(guò)計(jì)算待分類(lèi)樣本與訓(xùn)練集中所有樣本的距離，選擇距離最近的K個(gè)樣本（鄰居），然后根據(jù)這些鄰居的類(lèi)別或數(shù)值進(jìn)行預(yù)測(cè)。KNN算法具有無(wú)需訓(xùn)練過(guò)程、實(shí)現(xiàn)簡(jiǎn)單、效果直觀的優(yōu)點(diǎn)，但在面對(duì)高維數(shù)據(jù)或樣本量較大時(shí)，計(jì)算復(fù)雜度和存儲(chǔ)需求較高。為了提高效率，常使用KD樹(shù)、球樹(shù)等數(shù)據(jù)結(jié)構(gòu)進(jìn)行優(yōu)化。

在本文中，在m個(gè)特征向量的特征矩陣可設(shè)為：

其中n維特征向量為：

對(duì)應(yīng)m個(gè)樣本的標(biāo)簽為：

而對(duì)于樣本點(diǎn)之間的距離可采取Minkowskidistance定義，則二者間的距離定義為

式中：a表示為該算法的超參數(shù)，a≥1。如果a數(shù)值處于2時(shí)，則確定歐式距離，即：

由于KNN算法在計(jì)算各特征間的距離時(shí)需要保持相同的權(quán)重，所以，為了保證每個(gè)特征的計(jì)算距離一致，必須對(duì)每個(gè)特征進(jìn)行歸一化處理，以消除數(shù)據(jù)的量綱差異。

2.2決策樹(shù)算法

DT算法是一種常用的監(jiān)督學(xué)習(xí)算法，適用于分類(lèi)和回歸任務(wù)。它通過(guò)構(gòu)建樹(shù)狀模型來(lái)進(jìn)行決策，使數(shù)據(jù)可以被逐層細(xì)化并歸類(lèi)。DT的每個(gè)節(jié)點(diǎn)代表一個(gè)特征或?qū)傩?，每個(gè)分支代表該特征的一個(gè)可能值，葉節(jié)點(diǎn)則代表最終的預(yù)測(cè)結(jié)果或類(lèi)別。DT的構(gòu)建過(guò)程涉及選擇最優(yōu)特征進(jìn)行數(shù)據(jù)分割，以最大程度地減少數(shù)據(jù)的不純度。

DT的優(yōu)點(diǎn)包括易于理解和解釋、不需要數(shù)據(jù)歸一化、能夠處理多類(lèi)別數(shù)據(jù)及在處理大型數(shù)據(jù)集時(shí)的高效性。然而，DT也存在一些缺點(diǎn)，如容易過(guò)擬合、對(duì)數(shù)據(jù)噪聲敏感及在數(shù)據(jù)維度較高時(shí)表現(xiàn)較差。因此，為了克服以上缺點(diǎn)，本次使用剪枝技術(shù)來(lái)簡(jiǎn)化樹(shù)結(jié)構(gòu)。

2.3支持向量機(jī)算法

SVM算法是一種經(jīng)典的二分類(lèi)機(jī)器學(xué)習(xí)算法，其核心思想是尋找一個(gè)最優(yōu)超平面作為決策邊界，使決策邊界與兩類(lèi)最近的樣本點(diǎn)之間的距離最大化，從而提高模型的泛化能力。距離決策邊界最近的這些樣本點(diǎn)被稱(chēng)為支持向量，各樣本點(diǎn)到?jīng)Q策超平面的距離表示為d[3]。則，假設(shè)樣本點(diǎn)線性可分，如圖1所示。

使用n維空間中的距離計(jì)算公式，將圖1中支持向量的樣本點(diǎn)x到?jīng)Q策超平面的距離表示為

式中，為權(quán)重w的膜，b為超平面截距，可定義為

按照這一定義，可以將圖1中決策邊界上方的樣本點(diǎn)標(biāo)記為y=1，下方的樣本點(diǎn)標(biāo)記為y=-1，因此，所有樣本點(diǎn)xi與決策邊界的距離必然大于d，簡(jiǎn)化后，可得到。綜上，結(jié)合SVM算法核心思想，列出以下有條件最優(yōu)化問(wèn)題：

在結(jié)合上述優(yōu)化目標(biāo)函數(shù)的基礎(chǔ)上，SVM算法的首要任務(wù)是確保決策超平面可以完全區(qū)分兩類(lèi)特征樣本，然而，這樣會(huì)限制模型的泛化能力。為了解決這一問(wèn)題，以及處理數(shù)據(jù)樣本的線性可分性，可以通過(guò)求解拉格朗日對(duì)偶問(wèn)題來(lái)優(yōu)化目標(biāo)函數(shù)，轉(zhuǎn)化為以下形式：

優(yōu)化后，公式大大增加了數(shù)據(jù)點(diǎn)線性可分概率。在SVM算法中，常用函數(shù)包括有限性核函數(shù)、多項(xiàng)式核函數(shù)與高斯核函數(shù)。在使用高斯核函數(shù)時(shí)，y與C作為模型超參數(shù)，可使用智能優(yōu)化算法解決。

3仿真結(jié)果分析

通過(guò)利用CSO算法對(duì)這3種機(jī)器學(xué)習(xí)算法的超參數(shù)進(jìn)行優(yōu)化，并通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了這些優(yōu)化模型的有效性[4]。在使用CSO算法對(duì)原模型進(jìn)行優(yōu)化前，可借助實(shí)例化模型將訓(xùn)練數(shù)據(jù)集平均劃分為5份，計(jì)算這5份驗(yàn)證集的平均誤差，并輪流使用，得到的差異值與實(shí)驗(yàn)數(shù)值作為實(shí)驗(yàn)度函數(shù)。在仿真實(shí)驗(yàn)中，分別建立了KNN算法、DT算法、SVM算法變壓器故障診斷模型，并與傳統(tǒng)三比值法的診斷準(zhǔn)確率進(jìn)行對(duì)比，得到F1分?jǐn)?shù)對(duì)比，如表3所示。

由表3可知，基于機(jī)器學(xué)習(xí)的3種模型在故障診斷準(zhǔn)確率和F1分?jǐn)?shù)方面明顯優(yōu)于傳統(tǒng)的三比值法。其中，DT算法模型的診斷準(zhǔn)確率最高，比三比值法高出9.53%；在F1分?jǐn)?shù)方面，3種機(jī)器學(xué)習(xí)模型均顯著提升，約提高了30%。這些數(shù)據(jù)表明，與三比值法相比，基于機(jī)器學(xué)習(xí)的3種模型在不同評(píng)價(jià)指標(biāo)下均表現(xiàn)出更優(yōu)越的故障診斷性能[5]。

4結(jié)論

本文基于機(jī)器學(xué)習(xí)算法構(gòu)建了KNN算法、DT算法和SVM算法3種變壓器故障診斷模型，通過(guò)理論研究與仿真實(shí)驗(yàn)，得出以下結(jié)論。為了應(yīng)對(duì)傳統(tǒng)變壓器診斷準(zhǔn)確率低、實(shí)時(shí)性差的問(wèn)題，本文提出了一種基于機(jī)器學(xué)習(xí)的故障診斷模型。仿真實(shí)驗(yàn)表明，這些模型具有較高的診斷精度和快速的診斷速度，能夠有效滿足實(shí)際工程需求。此外，針對(duì)機(jī)器學(xué)習(xí)算法在特征穩(wěn)定性和提取能力方面的不足，本文采用CSO算法對(duì)3種模型進(jìn)行了優(yōu)化，優(yōu)化后的變壓器故障診斷模型在診斷準(zhǔn)確率和F1分?jǐn)?shù)方面均有顯著提升。

參考文獻(xiàn)：

[1]李強(qiáng)，張睿智，范曉丹，等.基于特征氣體和比值準(zhǔn)則的RAPO植物油變壓器故障診斷方法[J].高壓電器，2023，59（9）：294-303.

[2]劉國(guó)柱.基于自注意力機(jī)制與1D-CNN的變壓器故障診斷方法[J/OL].重慶工商大學(xué)學(xué)報(bào)（自然科學(xué)版），1-8[2024-05-28].http：//kns.cnki.net/kcms/detail/50.1155.N.20230726.1802.006.html.

[3]王爽，羅倩，唐波，等.考慮樣本類(lèi)內(nèi)不平衡的CHPOA-DBN變壓器故障診斷方法[J].中國(guó)電力，2023，56（10）：133-144.

[4]萬(wàn)可力，馬宏忠，崔佳嘉，等.基于Mel-GADF與ConvNeXt-T的變壓器鐵心松動(dòng)故障診斷方法[J].電力自動(dòng)化設(shè)備，2024，44（3）：217-224.

[5]宋輝，苑龍祥，郭雙權(quán).基于數(shù)據(jù)增強(qiáng)和特征注意力機(jī)制的灰狼優(yōu)化算法-優(yōu)化殘差神經(jīng)網(wǎng)絡(luò)變壓器故障診斷方法[J].現(xiàn)代電力，2024，41（2）：392-400.

科技資訊2024年21期

科技資訊的其它文章: 基于R語(yǔ)言的主成分分析與聚類(lèi)分析在成績(jī)?cè)u(píng)價(jià)中的應(yīng)用; 基于在線評(píng)論的鄉(xiāng)村民宿服務(wù)質(zhì)量評(píng)價(jià)研究; 基于文獻(xiàn)計(jì)量和知識(shí)圖譜分析的元宇宙跨學(xué)科特性研究; 隨機(jī)事件獨(dú)立性的探究; 莫爾圓極點(diǎn)法的數(shù)學(xué)理論探源和工程應(yīng)用探討; 二階線性橢圓型方程廣義解的群對(duì)稱(chēng)分析