郭建鑫,趙玉順,王志宇,丁立健
(合肥工業(yè)大學(xué)電氣與自動(dòng)化工程學(xué)院,合肥 230009)
氣體絕緣組合電器(gas insulated switchgear,GIS)具有占地面積小、運(yùn)行穩(wěn)定性高等諸多優(yōu)點(diǎn),被廣泛應(yīng)用于各電壓等級(jí)的變電站中[1-2],其絕緣可靠性直接影響電力系統(tǒng)的安全穩(wěn)定運(yùn)行。盆式絕緣子是GIS的核心絕緣部件,受生產(chǎn)制造、安裝、運(yùn)行過(guò)程中眾多因素的影響,其表面和內(nèi)部可能存在多種絕緣缺陷,因此在運(yùn)行中容易發(fā)生局部放電,加速盆式絕緣子的絕緣損壞過(guò)程[3]。不同缺陷的局部放電帶有不同的故障信息,通過(guò)分析可以對(duì)不同類型的局部放電信號(hào)進(jìn)行分類[4-5]。但目前對(duì)于盆式絕緣子局部放電識(shí)別的研究較少,這為檢修排障工作帶來(lái)了困難,因此有必要針對(duì)盆式絕緣子典型缺陷局部放電的分類識(shí)別開展研究。
針對(duì)局部放電的分類識(shí)別,近年來(lái)國(guó)內(nèi)外學(xué)者在特征量提取方法和分類器優(yōu)化選擇兩方面開展了大量的研究,得到了較好的識(shí)別效果[6-8]。文獻(xiàn)[6]將S變換與譜峭度算法結(jié)合,提取出包含局放信號(hào)主要信息的時(shí)頻矩陣,并使用概率神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了分類識(shí)別。文獻(xiàn)[7]提取了局部放電信號(hào)的26個(gè)統(tǒng)計(jì)特征參量并進(jìn)行降維,通過(guò)多分類相關(guān)向量機(jī)進(jìn)行分類識(shí)別。文獻(xiàn)[8]利用在線序列極限學(xué)習(xí)機(jī)對(duì)局放信號(hào)的27個(gè)統(tǒng)計(jì)特征參量進(jìn)行訓(xùn)練,得到了較高的識(shí)別正確率。上述文獻(xiàn)大都先提取局部放電信號(hào)的特征矩陣或多個(gè)特征值,再對(duì)提取的特征進(jìn)行識(shí)別,不同特征參數(shù)和特征矩陣的選取對(duì)分類結(jié)果影響較大,一定程度上削弱了上述方法的魯棒性能。
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),能夠解決時(shí)間序列中的長(zhǎng)期依賴問(wèn)題,在時(shí)序信號(hào)分類方面有出色的表現(xiàn)[9-10]。但局部放電信號(hào)包含的信息復(fù)雜,且信號(hào)點(diǎn)繁多,無(wú)法直接使用LSTM進(jìn)行分類,因此關(guān)于LSTM在局部放電信號(hào)識(shí)別中應(yīng)用的研究相對(duì)較少。為了解決該問(wèn)題,本文引入局部均值分解(local mean decomposition, LMD)的方法,LMD是一種較新的自適應(yīng)分解方法,它能夠自適應(yīng)地將信號(hào)分解為若干個(gè)位于不同頻帶的分量[11-12],通過(guò)分割分量并提取其特征,形成滿足LSTM訓(xùn)練要求的特征矩陣,實(shí)現(xiàn)局部放電信號(hào)的分類。
本文提出一種基于LMD和LSTM的盆式絕緣子局部放電識(shí)別方法。首先在實(shí)驗(yàn)室中制作了帶有裂紋、氣泡、嵌件毛刺、表面金屬顆粒的缺陷樣品并建立了盆式絕緣子局部放電實(shí)驗(yàn)平臺(tái),通過(guò)實(shí)驗(yàn)采集了大量信號(hào),使用成對(duì)高斯白噪聲輔助的LMD方法分解局部放電信號(hào),再對(duì)分解得到的分量進(jìn)行分割,提取每個(gè)片段的特征形成特征矩陣,輸入LSTM中進(jìn)行訓(xùn)練和分類識(shí)別,以驗(yàn)證所提方法的有效性。研究結(jié)果可為盆式絕緣子局部放電的特征提取與分類識(shí)別提供參考。
局部均值分解是Jonathan S. Smith最早提出的一種新的自適應(yīng)非平穩(wěn)信號(hào)的分析處理方法[13]。LMD方法能夠自適應(yīng)地將原始信號(hào)分解為若干個(gè)乘積函數(shù)(product function,PF)與1個(gè)殘余分量之和。對(duì)于非平穩(wěn)信號(hào)X(t),其分解過(guò)程如下。
1)確定原信號(hào)X(t)的局部極值點(diǎn),計(jì)算相鄰兩個(gè)極值點(diǎn)的平均值以及包絡(luò)估計(jì)值。
(1)
式中:ni為原始信號(hào)X(t)的局部極值點(diǎn);mi為相鄰兩個(gè)極值點(diǎn)的均值;ai為包絡(luò)估計(jì)值。
使用移動(dòng)平均法處理局部均值mi和包絡(luò)估計(jì)值ai, 形成平滑變化的連續(xù)局部均值和包絡(luò)估計(jì)值曲線,得到局部均值函數(shù)m11(t)和包絡(luò)估計(jì)函數(shù)a11(t)。
2)從原信號(hào)X(t)中減去局部均值函數(shù)m11(t), 再除以包絡(luò)估計(jì)函數(shù)a11(t)對(duì)h11(t)解調(diào)。
(2)
3)將s11(t)作為原始數(shù)據(jù)重復(fù)步驟1)、2)中的迭代過(guò)程,即:
(3)
式中s1(n-1)(t)=h1(n-1)(t)/a1(n-1)(t)。
迭代是為了讓a1n(t)的值盡可能接近1,但實(shí)際計(jì)算時(shí)無(wú)法讓其無(wú)限迭代下去,因此迭代終止條件為a1n≈1。將迭代過(guò)程中產(chǎn)生的所有包絡(luò)估計(jì)函數(shù)相乘便可以得到第1個(gè)PF分量P1(t)的包絡(luò)信號(hào)a1(t), 再將包絡(luò)信號(hào)a1(t)與s1n(t)相乘得到第1個(gè)PF分量P1(t)。
(4)
式中q為循環(huán)迭代次數(shù)。
將P1(t)從信號(hào)X(t)中減去,得到1個(gè)新信號(hào)u1(t), 將u1(t)作為原始數(shù)據(jù)重復(fù)步驟1)、2)、3)k次,如式(5)所示。
4)最終原信號(hào)X(t)將被分解為k個(gè)PF分量與殘余分量uk(t)之和,如式(6)所示。
(5)
(6)
模態(tài)混疊和端點(diǎn)效應(yīng)是限制LMD應(yīng)用的主要問(wèn)題。本文使用成對(duì)高斯白噪聲輔助分解的方法減輕模態(tài)混疊和端點(diǎn)效應(yīng)[14-15],具體方法如下。
1)向原信號(hào)X(t)中加入正負(fù)成對(duì)的高斯白噪聲。
(7)
式中:ωi(t)為第i次加入的高斯白噪聲信號(hào);ε為高斯白噪聲的幅值。
(8)
3)循環(huán)步驟1)和2)N次,即i=1,2,3,…,N, 得到2N組PF分量和殘余分量的集合。
(9)
4)計(jì)算所有PF分量和殘余分量的平均值,即可得到LMD分解后的最終PF分量和殘余分量。
(10)
(11)
式中:Pj(t)即為L(zhǎng)MD分解得到的第j個(gè)PF分量;u(t)為最終的殘余分量。
局部放電信號(hào)的各個(gè)頻率分量中包含著豐富的信息,LMD可以自適應(yīng)地將局部放電信號(hào)分解為若干個(gè)位于不同頻帶的PF分量,但由于局部放電信號(hào)的序列較長(zhǎng),若不加處理直接進(jìn)行PF分量的特征提取會(huì)損失局部的特征細(xì)節(jié),使得提取的特征較為宏觀,無(wú)法有效表征局放信號(hào)包含的關(guān)鍵信息。為了充分利用LMD分解后PF分量中包含的特征信息,首先將PF分量分割成一個(gè)個(gè)小片段,考慮每個(gè)片段內(nèi)的特征。本文參考文獻(xiàn)[16-17]中的特征參量選取方法,從PF分量每個(gè)片段內(nèi)的能量、復(fù)雜度和變化趨勢(shì)3個(gè)方面進(jìn)行特征提取。對(duì)于信號(hào)片段的能量特征,最直接的方法是計(jì)算其能量值。但為了消除數(shù)值大小對(duì)后續(xù)分類識(shí)別的影響,本文選擇信號(hào)片段與其所屬PF分量的能量占比作為特征參量,定量反映信號(hào)能量的分布情況。時(shí)序信號(hào)的復(fù)雜度常用熵來(lái)表征,Renyi熵是香農(nóng)熵的推廣形式,適用范圍更廣;赫斯特指數(shù)(Hurst Exponent)是由H. E. Hurst最早提出的一種時(shí)間序列分析方法,工程上常用于評(píng)估時(shí)間序列的自相似性和長(zhǎng)期依賴程度,因此可以反映信號(hào)的變化趨勢(shì)。本文選擇能量占比、Renyi熵、赫斯特指數(shù)作為特征參數(shù),特征提取的具體過(guò)程如下。
1) 向預(yù)處理后的局部放電信號(hào)中加入成對(duì)的高斯白噪聲進(jìn)行集總分解,得到m個(gè)PF分量,記為Pm。
2) 設(shè)置片段長(zhǎng)度,將每個(gè)Pm分割成n個(gè)等長(zhǎng)的信號(hào)片段Pmn,Pmn表示第m個(gè)PF分量Pm分割產(chǎn)生的第n個(gè)信號(hào)片段。
3) 計(jì)算各個(gè)信號(hào)片段Pmn的能量占比。
(12)
式中:EPmn為信號(hào)片段Pmn的能量值;EPm為第m個(gè)PF分量Pm的能量值。
4) 計(jì)算各個(gè)信號(hào)片段Pmn的Renyi熵,得到相應(yīng)的熵值Rmn, Renyi熵的計(jì)算公式如式(13)所示。
(13)
式中:a為Renyi熵的階數(shù),當(dāng)a趨近于1時(shí)Renyi熵即為香農(nóng)熵,本文使用2階Renyi熵,即a=2;xi為時(shí)序信號(hào)各個(gè)點(diǎn)的幅值,i=1,2,…,n;p(xi)為信號(hào)每個(gè)點(diǎn)取值對(duì)應(yīng)的概率,且∑p(xi)=1。
5) 采用重標(biāo)極差(R/S)分析方法計(jì)算赫斯特指數(shù),計(jì)算方法如下。
假設(shè)有時(shí)間序列ξ(t), 其中t=1,2,3,…,N, 定義其均值序列為:
(14)
式中T=1,2,3,…,N。
序列ξ(t)的累計(jì)離差為:
(15)
式中t=1,2,3,…,T。
極差序列為:
(16)
標(biāo)準(zhǔn)差序列為:
(17)
赫斯特推得極差與標(biāo)準(zhǔn)差的比值R(T)/S(T)(用R/S表示)存在如下關(guān)系。
(18)
式中:a為常數(shù);H為赫斯特指數(shù)。對(duì)式(18)兩邊同時(shí)取對(duì)數(shù)可得:
log(R/S)=Hlog(T)+log(a)
(19)
由于log(a)為常數(shù),因此只需以log(T)為自變量、log(R/S)為因變量做回歸分析即可得到赫斯特指數(shù)值H。計(jì)算各個(gè)信號(hào)片段Pmn的赫斯特指數(shù),得到相應(yīng)的值Hmn。
6) 根據(jù)時(shí)間順序,將信號(hào)片段Pmn的能量占比Emn、Renyi熵Rmn、赫斯特指數(shù)Hmn分別合成能量占比序列Em、Renyi熵序列Rm和赫斯特指數(shù)序列Hm, 再將其合并,即可得到局部放電信號(hào)分解后分量Pm的特征矩陣Tm。
(20)
而對(duì)于單個(gè)局部放電信號(hào)來(lái)說(shuō),其最終特征矩陣T應(yīng)由所有PF分量的特征矩陣合并得到。
(21)
LSTM本質(zhì)上是循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),與RNN相比,LSTM通過(guò)設(shè)置多個(gè)門控結(jié)構(gòu)解決了RNN中存在的梯度爆炸和梯度消失問(wèn)題,使其具備了訓(xùn)練、學(xué)習(xí)序列中長(zhǎng)期依賴信息的能力[18]。遺忘門、輸入門和輸出門3個(gè)門控結(jié)構(gòu)組成了LSTM的基本單元,結(jié)構(gòu)如圖1所示。
圖1 LSTM的基本單元結(jié)構(gòu)Fig.1 Basic unit structure of LSTM
遺忘門決定信息需要被丟棄還是保留,通過(guò)將上一個(gè)單元的輸出ht-1和當(dāng)前狀態(tài)的輸入值xt送入Sigmoid函數(shù)σ來(lái)判斷是否保留上一個(gè)單元的狀態(tài)量ct-1, 若Sigmoid函數(shù)輸出0,則徹底刪除ct-1, 若輸出1,則完全保留ct-1, 遺忘門的輸出記為ft。
輸出門用來(lái)確定當(dāng)前單元輸出的信息。首先通過(guò)Sigmoid函數(shù)σ決定當(dāng)前單元狀態(tài)信息中需要輸出的部分,當(dāng)前單元的狀態(tài)信息ct通過(guò)tanh函數(shù)激活后,再與Sigmoid函數(shù)σ的輸出ot相乘即可得到當(dāng)前單元的輸出信息ht。相關(guān)公式如式(22)所示。
(22)
式中:xt為輸入值;Wf、Wi、Wc、Wo為每個(gè)單元內(nèi)各個(gè)門對(duì)應(yīng)的權(quán)值;bf、bi、bc、bo為相應(yīng)的偏置。
本文的局部放電識(shí)別模型及相應(yīng)的流程結(jié)構(gòu)如圖2所示。
圖2 局部放電識(shí)別模型結(jié)構(gòu)Fig.2 Structure of PD identification model
本文建立的LSTM局部放電識(shí)別模型主要包括信號(hào)預(yù)處理、LMD分解、時(shí)序特征提取、LSTM模型訓(xùn)練和分類識(shí)別5個(gè)部分。采集到的局部放電信號(hào)首先通過(guò)小波包去噪的方法進(jìn)行降噪預(yù)處理,再使用前文所述的成對(duì)高斯白噪聲輔助的LMD分解和特征提取方法對(duì)預(yù)處理后的局部放電信號(hào)進(jìn)行分解和時(shí)序特征提取。將特征矩陣匯總形成訓(xùn)練集帶入LSTM模型中進(jìn)行訓(xùn)練,為了實(shí)現(xiàn)不同類型局部放電信號(hào)的分類識(shí)別,在LSTM模型中加入了全連接層和Softmax層[19],訓(xùn)練完成后將測(cè)試集數(shù)據(jù)代入訓(xùn)練好的模型,得到最終的識(shí)別結(jié)果。
參照550 kV盆式絕緣子的實(shí)際尺寸并將其結(jié)構(gòu)適當(dāng)簡(jiǎn)化,建立了平面化的小型盆式絕緣子模型,如圖3所示。小型盆式絕緣子模型的外部為環(huán)氧樹脂,其外徑為120 mm,中間為直徑60 mm的金屬嵌件,嵌件中心有直徑16 mm的通孔便于裝配。在實(shí)驗(yàn)室中制作了帶有裂紋、氣泡、嵌件毛刺、表面金屬顆粒的小型盆式絕緣子樣品,其實(shí)物如圖4所示。圖中紅圈處為缺陷所在的位置,其中裂紋缺陷主要集中在金屬嵌件的周圍,有少數(shù)裂紋從嵌件周圍一直延伸到樣品的外邊緣,如圖4(a)所示;氣泡缺陷主要分布在樣品環(huán)氧樹脂部分的中間位置,如圖4(b)所示;嵌件毛刺缺陷通過(guò)環(huán)氧澆注前在嵌件上預(yù)先附著金屬尖端來(lái)實(shí)現(xiàn),如圖4(c)紅圈處所示;表面金屬顆粒缺陷通過(guò)在無(wú)缺陷的小型盆式絕緣子表面粘附鋁箔來(lái)模擬,其中鋁箔為邊長(zhǎng)為3 mm的正三角形,如圖4(d)紅圈處所示。
圖3 小型盆式絕緣子模型結(jié)構(gòu)圖Fig.3 Structure diagram of small basin insulator model
圖4 小型盆式絕緣子實(shí)物圖Fig.4 Pictures of small basin insulator
為了模擬盆式絕緣子缺陷局部放電的實(shí)際工況,同時(shí)兼顧實(shí)驗(yàn)開展的便利性,在實(shí)驗(yàn)室中設(shè)計(jì)并建立了實(shí)驗(yàn)腔體,主要由亞克力腔體外殼、高壓導(dǎo)桿、均壓球、小型盆式絕緣子、接地金屬環(huán)構(gòu)成,其結(jié)構(gòu)如圖5所示。
圖5 實(shí)驗(yàn)腔體結(jié)構(gòu)圖Fig.5 Structure diagram of experimental chamber
實(shí)驗(yàn)回路如圖6所示。其中T1、T2分別為調(diào)壓臺(tái)和YDTW10/100型無(wú)局放工頻試驗(yàn)變壓器,額定電壓為100 kV,容量為10 kVA;R為限流電阻,C1、C2構(gòu)成電容分壓器,C3為耦合電容,Z為檢測(cè)阻抗。采用接觸式聲發(fā)射傳感器檢測(cè)局部放電信號(hào),其諧振頻率為40 kHz,工作帶寬為30~140 kHz,靈敏度大于80 dB,信號(hào)放大器的增益為60 dB。
圖6 實(shí)驗(yàn)回路結(jié)構(gòu)圖Fig.6 Structure diagram of experimental circuit
將小型盆式絕緣子樣品安裝到實(shí)驗(yàn)腔體中,密封腔體后抽真空再充入0.3 MPa的SF6氣體。實(shí)驗(yàn)時(shí)聲發(fā)射傳感器使用耦合劑粘在實(shí)驗(yàn)腔體的外壁上,使用泰克DPO5204B示波器(帶寬2 GHz,最大采樣率10 GS/s)的2個(gè)通道同時(shí)采集局部放電的超聲波信號(hào)和電壓相位信號(hào)。采用緩慢升壓的方式直至示波器和局放儀上均出現(xiàn)穩(wěn)定的局部放電信號(hào),維持該電壓并保存示波器上采集到的信號(hào)。
利用前述的實(shí)驗(yàn)裝置與方法在實(shí)驗(yàn)室中采集大量不同缺陷的局部放電信號(hào),并將其根據(jù)工頻相位分成一個(gè)個(gè)完整工頻周期內(nèi)的信號(hào),不同類型局部放電的時(shí)域信號(hào)如圖7所示。
圖7 4種局部放電信號(hào)的時(shí)域波形圖Fig.7 Time domain waveforms of four types of PD signals
本文使用4層db10小波包分解對(duì)原始局放信號(hào)進(jìn)行去噪預(yù)處理,其中閾值選擇采用Stein無(wú)偏似然估計(jì)法。圖8為一個(gè)裂紋缺陷局部放電信號(hào)去噪前后的波形對(duì)比。
圖8 裂紋缺陷局部放電信號(hào)去噪前后的時(shí)域波形圖Fig.8 Time domain waveform of a PD signal of crack defect before and after denoising
向預(yù)處理后的局部放電信號(hào)中加入正負(fù)成對(duì)的高斯白噪聲,再使用LMD進(jìn)行集總分解。本文加入的高斯白噪聲幅值ε為0.2倍局部放電信號(hào)的標(biāo)準(zhǔn)差,集總分解次數(shù)為100次。仍以一個(gè)裂紋缺陷局部放電信號(hào)為例,經(jīng)加噪和集總分解后的結(jié)果如圖9所示。
圖9 裂紋缺陷局部放電信號(hào)分解結(jié)果圖Fig.9 Decomposition results of a PD signal of crack defect
由圖9可知,該裂紋缺陷局部放電信號(hào)最終被分解為8個(gè)PF分量,但從PF分量的波形和相應(yīng)的幅值大小來(lái)看,前幾個(gè)PF分量包含了局部放電信號(hào)的主要信息,如果對(duì)所有PF分量進(jìn)行特征提取將產(chǎn)生大量無(wú)效的特征參數(shù),不僅會(huì)增加計(jì)算負(fù)擔(dān),還會(huì)影響后續(xù)分類識(shí)別的正確率[20]。因此本文使用PF分量的能量占比作為選取主PF分量的評(píng)判標(biāo)準(zhǔn),相應(yīng)的公式為:
(23)
式中:Ei為PF分量Pi的能量占比;EPi為第i個(gè)PF分量Pi的能量值;EX為局部放電信號(hào)預(yù)處理后的總能量。
4種局部放電信號(hào)的PF分量能量占比如圖10所示。從圖中可知各類型局部放電信號(hào)的能量主要集中在前4個(gè)PF分量,因此選擇前4個(gè)PF分量作為主PF分量。
圖10 局部放電信號(hào)的PF分量能量占比Fig.10 Energy share of PF components of PD signals
此外,由于實(shí)驗(yàn)中采集的局部放電信號(hào)點(diǎn)數(shù)較多,若直接將分解得到的PF分量作為訓(xùn)練樣本代入LSTM模型中進(jìn)行訓(xùn)練,將導(dǎo)致訓(xùn)練時(shí)間大大增長(zhǎng),而且在很長(zhǎng)的序列里進(jìn)行反向傳播可能會(huì)導(dǎo)致梯度消失,這樣模型的可靠性會(huì)有所降低。因此設(shè)置了50、100、200、400、800共5個(gè)不同的片段長(zhǎng)度,將主PF分量分割成等長(zhǎng)的片段,計(jì)算每個(gè)主PF分量片段的能量占比、Renyi熵和赫斯特指數(shù)并形成特征矩陣T50、T100、T200、T400、T800。
從采集處理后得到的大量數(shù)據(jù)中隨機(jī)選取4類各1 000組局部放電信號(hào)作為樣本,按照8:1:1的比例隨機(jī)劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集,即每類局部放電樣本中訓(xùn)練集數(shù)量為800組,驗(yàn)證集和測(cè)試集各100組。
LSTM模型中相關(guān)參數(shù)的設(shè)置直接影響模型訓(xùn)練的效率和識(shí)別的正確率[21-22]。本文設(shè)置LSTM模型的隱藏單元個(gè)數(shù)為100,批尺寸(batch size)為80,采用Adam優(yōu)化算法對(duì)模型進(jìn)行訓(xùn)練[23],其中訓(xùn)練的初始學(xué)習(xí)率(learning rate)設(shè)為0.001,為了防止出現(xiàn)無(wú)法收斂的情況,設(shè)定每訓(xùn)練10輪(epoch)將學(xué)習(xí)率衰減為原來(lái)的0.2倍,訓(xùn)練的最大輪數(shù)為50,訓(xùn)練過(guò)程使用英偉達(dá)GTX850 4GB GPU完成。
為了確定最佳的片段長(zhǎng)度,使用不同片段長(zhǎng)度下局部放電樣本對(duì)應(yīng)的特征矩陣T50、T100、T200、T400、T800進(jìn)行訓(xùn)練和測(cè)試,對(duì)比了50、100、200、400、800共5個(gè)不同片段長(zhǎng)度下訓(xùn)練集、驗(yàn)證集和測(cè)試集的識(shí)別正確率,如圖11所示。
從圖11中數(shù)據(jù)可知,隨著片段長(zhǎng)度的增大,訓(xùn)練集、驗(yàn)證集、測(cè)試集的識(shí)別正確率均有所提升,這是因?yàn)橐环矫嫫伍L(zhǎng)度較小時(shí)特征序列會(huì)相對(duì)較長(zhǎng),不利于LSTM模型的訓(xùn)練,另一方面由于片段長(zhǎng)度較小,每個(gè)片段內(nèi)包含的信息相對(duì)較少,無(wú)效的特征會(huì)增多,從而降低了識(shí)別正確率。當(dāng)片段長(zhǎng)度為800時(shí),在訓(xùn)練集上的正確率達(dá)到了100%,驗(yàn)證集和測(cè)試集上的正確率均超過(guò)了99%,說(shuō)明該片段長(zhǎng)度下提取的特征能夠很好地表征局部放電信號(hào)的主要信息,因此選擇800作為最佳的片段長(zhǎng)度。最佳片段長(zhǎng)度下LSTM模型訓(xùn)練過(guò)程中訓(xùn)練集和驗(yàn)證集的正確率變化曲線如圖12所示。
圖12 最佳片段長(zhǎng)度下訓(xùn)練過(guò)程中正確率與損失變化曲線Fig.12 Changing curves of the accuracy and loss in the training process under the optimal fragment length
從圖12中可以看出,當(dāng)訓(xùn)練開始時(shí)訓(xùn)練集和驗(yàn)證集的正確率約為20%,隨著訓(xùn)練輪數(shù)的增加,正確率開始逐漸升高。經(jīng)過(guò)20輪訓(xùn)練后,訓(xùn)練集和驗(yàn)證集的正確率逐漸趨于穩(wěn)定,直至訓(xùn)練完成,此時(shí)訓(xùn)練集的正確率為100%,驗(yàn)證集的正確率為99.5%。雖然訓(xùn)練集上的正確率為100%,但驗(yàn)證集上的正確率沒(méi)有出現(xiàn)下降的情況,同時(shí)從損失的變化曲線可以看出,隨著訓(xùn)練的進(jìn)行訓(xùn)練集和驗(yàn)證集上的損失都在逐漸下降,最終隨著正確率的穩(wěn)定而趨于平穩(wěn),因此沒(méi)有過(guò)擬合的問(wèn)題。測(cè)試集上各類局放信號(hào)的識(shí)別正確率如表1所示。
表1 LSTM分類識(shí)別結(jié)果Tab.1 Classification recognition results of LSTM
由表中數(shù)據(jù)可以看出,裂紋、氣泡、嵌件毛刺、表面金屬顆粒4種不同缺陷下的盆式絕緣子局部放電信號(hào)識(shí)別正確率較高,其中裂紋和表面金屬顆粒缺陷下的局部放電信號(hào)識(shí)別正確率達(dá)到了100%,驗(yàn)證了本文提出的方法的可行性。
除了識(shí)別正確率,常用于評(píng)估分類效果的參數(shù)指標(biāo)還包括混淆矩陣、精確率、召回率和F1分?jǐn)?shù)。精確率(Precision)是被預(yù)測(cè)為某一類的所有樣本中確實(shí)為該類別的樣本所占的比例,召回率(Recall)是實(shí)際為該類別的樣本中被預(yù)測(cè)為該類別樣本所占的比例,F(xiàn)1分?jǐn)?shù)則是兩者的綜合,其公式為:
(24)
LSTM分類結(jié)果的混淆矩陣如圖13所示,各類缺陷分類結(jié)果的精確率、召回率和F1分?jǐn)?shù)如表2所示。
圖13 LSTM分類結(jié)果的混淆矩陣Fig.12 Confusion matrix for classification results of LSTM
表2 分類結(jié)果的精確率、召回率和F1分?jǐn)?shù)Tab.2 Accuracy, recall and F1 score of classification results
從圖13和表2中的數(shù)據(jù)可以看出,4種缺陷分類結(jié)果的精確率、召回率和F1分?jǐn)?shù)均為較高水平,其中表面金屬顆粒缺陷的識(shí)別精確率和召回率均達(dá)到了100%,說(shuō)明本文方法下表面金屬顆粒缺陷放電信號(hào)可以與其他3種信號(hào)完全區(qū)分,其他3種缺陷之間僅存在少量的誤判,體現(xiàn)了本文方法的有效性。
為了進(jìn)一步驗(yàn)證本文提出的基于LMD分解的特征提取方法的優(yōu)越性,使用預(yù)處理后的局部放電信號(hào)不經(jīng)過(guò)LMD分解直接進(jìn)行特征提取,片段長(zhǎng)度仍設(shè)置為800,使用相同設(shè)置參數(shù)的LSTM模型進(jìn)行了訓(xùn)練和識(shí)別。
此外,統(tǒng)計(jì)參數(shù)是局部放電信號(hào)識(shí)別中常用的特征參量[24-25],本文提取了最大放電量相位分布Hqmax(φ)、平均放電量相位分布Hqn(φ)、放電次數(shù)相位分布Hn(φ)圖譜的24個(gè)特征,如表3所示,其中Sk為偏斜度,Ku為峭度,Pe為峰值個(gè)數(shù),Asy為不對(duì)稱度,cc為互相關(guān)系數(shù),下標(biāo)+代表正半周期,下標(biāo)-代表負(fù)半周期。使用核主成分分析方法進(jìn)行降維,使用降維后的特征參數(shù)帶入支持向量機(jī)(SVM)進(jìn)行訓(xùn)練和識(shí)別,選擇C-SVC作為SVM模型,徑向基函數(shù)作為核函數(shù),訓(xùn)練時(shí)使用網(wǎng)格搜索算法對(duì)懲罰參數(shù)c和核函數(shù)參數(shù)g進(jìn)行尋優(yōu),最終的分類結(jié)果如表4所示。
表3 統(tǒng)計(jì)參數(shù)Tab.3 Statistical parameters
表4 不同識(shí)別方法的識(shí)別結(jié)果Tab.4 Recognition results of different recognition methods
由表4中數(shù)據(jù)可以看出,無(wú)LMD分解情況下的識(shí)別正確率超過(guò)了80%,表明本文選取的3種特征量能夠較好地表征局部放電信號(hào)的主要信息。對(duì)比表1和表4,無(wú)LMD分解情況下的識(shí)別正確率遠(yuǎn)低于使用成對(duì)高斯白噪聲輔助LMD分解的情況,主要原因是局部放電信號(hào)中包含多個(gè)不同頻帶的信息,如果直接對(duì)局部放電信號(hào)進(jìn)行特征提取會(huì)導(dǎo)致所提取的特征無(wú)法很好地反映局部放電信號(hào)不同頻帶內(nèi)的特性,從而降低了識(shí)別正確率。而基于統(tǒng)計(jì)參數(shù)和SVM的識(shí)別正確率為82.5%,同樣遠(yuǎn)低于本文所提方法的識(shí)別正確率,這一方面是因?yàn)榛诮y(tǒng)計(jì)參數(shù)的特征提取方法需要提取的特征過(guò)多,降低了特征參數(shù)的代表性,另一方面統(tǒng)計(jì)參數(shù)主要反映了信號(hào)時(shí)域正負(fù)半周的波形特性,較為宏觀,同時(shí)忽略了信號(hào)頻域的信息。本文方法對(duì)位于不同頻帶內(nèi)的PF分量進(jìn)行片段分割后再提取特征,兼顧了局放信號(hào)的頻域信息和時(shí)域的特征細(xì)節(jié),因此取得了良好的識(shí)別效果,雖然特征提取部分的算法復(fù)雜度較高,犧牲了一定的計(jì)算性能,但整體的分類正確率有明顯提高。
本文針對(duì)盆式絕緣子典型缺陷的局部放電,在實(shí)驗(yàn)室中建立了盆式絕緣子局部放電實(shí)驗(yàn)平臺(tái)并采集了大量數(shù)據(jù),提出了一種基于LMD和LSTM的盆式絕緣子局部放電識(shí)別方法,使用該方法對(duì)采集到的信號(hào)進(jìn)行分類識(shí)別,得到了如下結(jié)論。
1) 使用小波包去噪方法對(duì)局部放電信號(hào)進(jìn)行降噪,在LMD分解前向信號(hào)中添加了成對(duì)的高斯白噪聲,一定程度上抑制了模態(tài)混疊和端點(diǎn)效應(yīng)。分析發(fā)現(xiàn)信號(hào)經(jīng)LMD分解后的主要信息集中在前4個(gè)PF分量中,選擇前4個(gè)PF分量作為主PF分量,并將其根據(jù)不同的片段長(zhǎng)度進(jìn)行分割,提取了每個(gè)片段的能量占比、Renyi熵和赫斯特指數(shù)形成特征矩陣。
2) 為L(zhǎng)STM模型設(shè)置了合理的參數(shù),對(duì)比發(fā)現(xiàn)片段長(zhǎng)度為800時(shí)正確率最高,測(cè)試集上的綜合正確率達(dá)到99.25%,驗(yàn)證了本文特征提取與識(shí)別方法的可行性。
3) 對(duì)比無(wú)LMD分解直接進(jìn)行特征提取、統(tǒng)計(jì)參數(shù)結(jié)合SVM兩種識(shí)別方法,本文提出的方法對(duì)不同類型局部放電信號(hào)的分類正確率提升明顯,因此具有一定的應(yīng)用推廣價(jià)值。