車一鳴,王冬梅,王國興,管 華
(1.國網(wǎng)冀北電力有限公司 技能培訓(xùn)中心,河北 保定 071051; 2.國網(wǎng)冀北電力有限公司 遵化市供電公司,河北 遵化 064200;3.安徽同華新能源動力股份有限公司,安徽 宣城 242500)
作為控制、保護(hù)電網(wǎng)穩(wěn)定運(yùn)行的關(guān)鍵電氣設(shè)備,高壓斷路器的可靠性直接影響整個電網(wǎng)的安全。斷路器在動作過程中會產(chǎn)生振動信號,將其作為傳播媒介開展在線監(jiān)測診斷研究,對于及時準(zhǔn)確發(fā)現(xiàn)斷路器的異常工況、盡早排除潛在的安全隱患具有重要意義[1-2]。
斷路器振動信號具有非線性非平穩(wěn)特性,因此以傳統(tǒng)FFT為出發(fā)點的方法難以取得較好的分析效果[3],而熵值則可以有效反應(yīng)非線性非平穩(wěn)信號的動力學(xué)突變行為,能夠準(zhǔn)確刻畫信號的內(nèi)在狀態(tài)特征。文獻(xiàn)[4]提出使用近似熵(Approximate Entropy,AE)方法對心音信號進(jìn)行有效處理,但近似熵受信號長度影響較為嚴(yán)重。為此文獻(xiàn)[5]提出了樣本熵(Sample Entropy,SE)方法,并被成功應(yīng)用于電氣設(shè)備故障診斷[6]。與近似熵和樣本熵不同,文獻(xiàn)[7]提出的排列熵(Permutation Entropy,PE)算法具有計算效率高、影響參數(shù)少等優(yōu)點,也已被順利用于電氣設(shè)備特征提取[8]。最近,Rostaghi等[9]提出一種描述時間序列復(fù)雜度的散布熵(Dispersion Entropy,DE)算法,其計算效率及穩(wěn)定性要優(yōu)于傳統(tǒng)的近似熵、樣本熵及排列熵算法[10]。然而,散布熵算法只能檢測時域信號單一尺度上的動力學(xué)特征,而在多個尺度上衡量時域信號的復(fù)雜性和隨機(jī)性則更為科學(xué)合理[11]。因此,文獻(xiàn)[12]中進(jìn)一步開發(fā)出了多尺度散布熵(Multiscale Dispersion Entropy,MDE),但在多尺度分析過程中,由于需要進(jìn)行粗粒化處理操作,會導(dǎo)致計算結(jié)果穩(wěn)定性欠佳,存在計算精度不準(zhǔn)確的弊端。
在智能分類方面,由決策樹和Bagging重采樣算法構(gòu)成的隨機(jī)森林模型(Random Forest,RF)[13]能夠在小樣本條件下實現(xiàn)有效訓(xùn)練,避免了過擬合、局部優(yōu)化、收斂效率低等問題,對于噪聲及外在干擾的魯棒特性良好[14]。但模型中決策樹棵數(shù)和剪枝閾值參數(shù)的設(shè)置缺少理論支持,僅能依靠經(jīng)驗選取,對于最終分類精確度無疑會造成不利影響。
針對上述情況,文中提出了一種基于改進(jìn)多尺度散布熵(Improved Mutilscale Dispersion Entropy,IMDE)與遺傳算法(Genetic Algorithm,GA)優(yōu)化隨機(jī)森林模型的高壓斷路器工況識別方法,有望從拾取的斷路器機(jī)械振動信號中提取出關(guān)鍵的特征信息,并通過智能分類算法進(jìn)行狀態(tài)準(zhǔn)確區(qū)分。
時間序列的散布熵值計算過程如下[9]:
(1)對于長度為N的時域信號{x|x1,x2,···,xj,1≤j≤N},通過正態(tài)分布函數(shù)將其映射到{y|y1,y2,···,yj,1≤j≤N},yj∈(0,1) ,即:
(1)
式中,μ和σ分別為期望和標(biāo)準(zhǔn)差。
(2)通過線性變換將y映射到[1,2,···,c]范圍內(nèi):
(2)
其中,int和c分別為取整函數(shù)和類別個數(shù)。
(3)
其中,m和d分別為嵌入維數(shù)和時間延遲。
(5)根據(jù)如下公式計算每種散布模式的概率:
(4)
(6)根據(jù)香農(nóng)熵的定義,信號的散布熵定義為:
(5)
多尺度散布熵MDE定義為信號在不同尺度下的熵值,其中多尺度通過粗?;^程獲得,具體計算過程如下[12]:
(1)對原始時域信號{x|x1,x2,···,xj,1≤j≤N},通過式(6)構(gòu)造不同尺度τ下的粗粒化序列:
(6)
其中τ=1,2,···為尺度因子,若τ=1,則為原始時域信號。當(dāng)τ>1時,原始時域信號被分割為τ個長度為?N/τ」的粗?;蛄?。以尺度τ=2,τ=3為例,其粗粒化過程如圖1所示。
(7)
圖1 MDE粗粒化過程示意圖
與傳統(tǒng)的多尺度熵分析方法類似,雖然MDE可以在不同尺度上評價非線性非平穩(wěn)時域信號的動力學(xué)特性,但在其粗?;幚磉^程未采用連續(xù)平移平均操作運(yùn)算,此外隨著尺度因子的增大,粗?;幚砗笏眯滦蛄兄杏行?shù)據(jù)點數(shù)將明顯減少,這些因素的影響會導(dǎo)致獲取的熵值精確度降低,并且MDE的計算穩(wěn)定性也會大打折扣,為了克服上述缺陷,本文提出一種改進(jìn)多尺度散布熵IMDE方法,其實現(xiàn)過程如下:
(8)
圖2 IMDE粗?;^程示意圖
(9)
在IMDE算法中,連續(xù)計算了所有粗?;蛄械纳⒉检刂?,并通過求取均值來獲取最終的結(jié)果,該過程可有效提高所得熵值精確度及計算過程的穩(wěn)定性,更適合非線性非平穩(wěn)定信號的分析處理。
IMDE計算過程需要考慮類別個數(shù)c、嵌入維數(shù)m、時間延遲d以及尺度因子τ這4個關(guān)鍵影響參數(shù)。在選取嵌入維數(shù)m時,如果m取值過小則難以檢測信號的動力學(xué)特性,反之如果該參數(shù)設(shè)置過大,則無法有效區(qū)分信號微小的差異并且計算負(fù)擔(dān)過重,因此權(quán)衡特征信息檢測可靠性及運(yùn)算效率,參考文獻(xiàn)[15],本文取嵌入維數(shù)m=3。對于類別個數(shù)c的選取,當(dāng)類別個數(shù)設(shè)置過小時,差異較大的幅值容易被劃分為同一類別,而當(dāng)該參數(shù)設(shè)置過大時,則計算效率會大打折扣并且計算結(jié)果很容易受噪聲的干擾影響,通常類別取值為3~7,鑒于上述分析,本文取類別個數(shù)c=5來保證獲得可靠的分析結(jié)果。同多尺度樣本熵和多尺度排列熵算法類似,在IMDE算法中,時延參數(shù)λ對信號熵值的計算影響較小,參考文獻(xiàn)[16],為了運(yùn)算簡便本文直接取λ=1。至于尺度因子τ的選取,當(dāng)τ設(shè)置過小時,通過IMDE難以從拾取的斷路器振動信號中完整地提取出狀態(tài)特征信息,而當(dāng)τ取值較大時,由于信號粗?;幚砗笏眯滦蛄兄杏行?shù)據(jù)點數(shù)大幅減少,則容易導(dǎo)致計算結(jié)果不穩(wěn)定并且獲取的熵值不準(zhǔn)確。在文獻(xiàn)[17]中,作者指出散布模式c、嵌入維數(shù)m、待分析信號長度N及最大尺度因子τmax間需滿足條件cm
利用仿真高斯白噪聲和分?jǐn)?shù)階噪聲對IMDE及MDE算法的相關(guān)性能進(jìn)行比較分析。對于任意自相似隨機(jī)過程,功率譜幅值與頻率滿足比例關(guān)系S(f)∝1/fα,當(dāng)α=0時該隨機(jī)過程屬于高斯白噪聲,當(dāng)α=1時該隨機(jī)過程則屬于分?jǐn)?shù)階噪聲[18],幅值和頻率經(jīng)歸一化處理后,仿真生成的噪聲信號的波形和頻譜如圖3所示。
(a) 高斯白噪聲波形
(b) 高斯白噪聲頻譜
(c) 分?jǐn)?shù)階噪聲波形
(d) 分?jǐn)?shù)階噪聲頻譜 圖3 噪聲信號的波形及頻譜
計算圖3所示高斯白噪聲和分?jǐn)?shù)階噪聲信號的IMDE及MDE曲線,根據(jù)2.4節(jié)部分設(shè)置各項影響參數(shù),結(jié)果如圖4所示。通過對比可以發(fā)現(xiàn),與高斯白噪聲不同,分?jǐn)?shù)階噪聲具有長程相關(guān)特性,并且在多數(shù)尺度情況下,分?jǐn)?shù)階噪聲的散布熵值更大,表明分?jǐn)?shù)階噪聲信號更為復(fù)雜,這與實際情況相符。為了進(jìn)一步對比驗證IMDE與MDE的穩(wěn)定性,隨機(jī)生成20組獨立的分?jǐn)?shù)階噪聲信號,每組信號3000個數(shù)據(jù)點,利用這20組獨立的分?jǐn)?shù)階噪聲信號計算得到的IMDE及MDE誤差曲線,結(jié)果如圖5所示。誤差曲線給出了不同尺度下MDE和IMDE算法所得散布熵的均值及標(biāo)準(zhǔn)差,對比后可以發(fā)現(xiàn),IMDE計算所得分?jǐn)?shù)階噪聲的散布熵均值曲線同MDE所得結(jié)果相比,波動幅度略小,變化更為平緩,并且各分析尺度下散布熵的標(biāo)準(zhǔn)差明顯小于MDE所得結(jié)果,利用高斯噪聲信號進(jìn)行對比驗證也得到相同的結(jié)論,由此表明,IMDE算法在描述信號動力學(xué)特性方面表現(xiàn)更佳,運(yùn)算過程魯棒性更強(qiáng),能夠給出更準(zhǔn)確的熵值計算結(jié)果。
圖4 仿真信號的MDE及IMDE曲線
圖5 分?jǐn)?shù)階噪聲的MDE及IMDE誤差曲線
隨機(jī)森林模型(Random Forest,RF)具體理論可參考文獻(xiàn)[13],在此不再詳細(xì)闡述,其中剪枝閾值及決策樹棵數(shù)對整個模型的輸出具有一定影響,但是這兩個參數(shù)需要通過人為經(jīng)驗選取,缺少理論支持。遺傳算法通過選擇、交叉、變異等操作的模擬,能夠快速地選取最優(yōu)解,鑒于這一優(yōu)勢,本文通過將遺傳算法引入RF模型,對模型中的關(guān)鍵影響參數(shù)進(jìn)行迭代優(yōu)化,具體實現(xiàn)過程如下:
(1)確定算法的參數(shù)。設(shè)定決策樹棵數(shù)C和剪枝閾值g的取值范圍設(shè)置分別為[1,100]和[0,1000]。GA算法中最大迭代次數(shù)設(shè)置為30,種群個體數(shù)量為50,編碼方式為二進(jìn)制編碼,交叉概率為0.7,變異概率為0.035;
(2)采用Bootstrap 算法進(jìn)行采樣,隨機(jī)篩選若干個訓(xùn)練樣本,并從每個訓(xùn)練樣本集中隨機(jī)篩選出一半作為預(yù)測樣本;
(3)利用每個訓(xùn)練樣本集中其余的另一半樣本生成決策樹,其中每次進(jìn)行屬性確定前,從所有的屬性中選出5個屬性作為當(dāng)前結(jié)點的決策屬性;
(4)當(dāng)結(jié)點內(nèi)包含的樣本數(shù)少于剪枝閾值g時,將該結(jié)點作為葉結(jié)點,返回其目標(biāo)屬性的眾數(shù)作為該決策樹的分類結(jié)果;
(5)當(dāng)所有決策樹生成后,對每棵決策樹進(jìn)行預(yù)測試,并計算其權(quán)值;
(6)獲取RF模型訓(xùn)練樣本的分類結(jié)果后將分類準(zhǔn)確率作為適應(yīng)度函數(shù),采用遺傳算法對決策樹棵數(shù)C和剪枝閾值g進(jìn)行迭代優(yōu)化,確定最佳影響參數(shù)。
針對高壓斷路器狀態(tài)識別問題,本文提出一種基于IMDE和優(yōu)化隨機(jī)森林算法的診斷模型,實現(xiàn)流程如圖6所示,具體步驟如下:
(1)首先通過搭建的采集系統(tǒng)拾取高壓斷路器不同工況下的機(jī)械振動信號;
(2)利用IMDE對斷路器振動信號進(jìn)行分析時,并由此構(gòu)造訓(xùn)練樣本和測試樣本的特征向量;
(3)將計算所得訓(xùn)練樣本的特征向量作為RF模型的輸入,利用遺傳算法對RF的關(guān)鍵影響參數(shù)進(jìn)行優(yōu)化,將適應(yīng)度最大化作為遺傳算法的最終尋優(yōu)目標(biāo);
(4)滿足遺傳算法終止條件后獲得的優(yōu)化參數(shù)作為RF模型的相應(yīng)參數(shù),隨后將測試樣本的特征向量輸入到訓(xùn)練完成后的最優(yōu)RF模型中進(jìn)行斷路器狀態(tài)分類識別。
圖6 狀態(tài)識別流程
以永磁操作機(jī)構(gòu)35kV高壓斷路器為實驗對象,搭建了由傳感器、采集卡、下位機(jī)、通信單元和上位機(jī)組成的信號采集系統(tǒng)。在斷路器空載條件下摘除緩沖彈簧模擬彈簧失效故障,調(diào)節(jié)傳動桿長度模擬執(zhí)行機(jī)構(gòu)故障,擰開基座螺栓模擬螺栓松動故障。已有的現(xiàn)場經(jīng)驗表明,采用現(xiàn)有的線圈電阻及分合閘動作電流電壓等狀態(tài)監(jiān)測手段來判斷上述故障較為困難,本文則通過采集斷路器動作過程的振動信號開展其工況識別的研究。實驗過程中,選用的傳感器為北京東方振動研究所開發(fā)的D100S型壓電加速度傳感器,靈敏度為10mV/g ,量程為500g,頻響范圍為1~50kHz,需配有外接恒流電源。應(yīng)用NI公司的PXI采集卡配合傳感器拾取斷路器不同故障狀態(tài)下的振動信號,設(shè)置采樣頻率為20000Hz。下位機(jī)采用51單片機(jī)和 ADS8216數(shù)模轉(zhuǎn)換芯片,通信單元采用TRS416串行總線,上位機(jī)采用C語言平臺和數(shù)據(jù)庫開發(fā),實驗過程中,進(jìn)行多次實驗采集斷路器不同工況下的信號樣本,每個樣本長度為3000點。
將壓電加速度傳感器布置在斷路器分合閘過程中的碰撞點附近,該位置對所模擬的各類故障較為敏感,從而獲取的監(jiān)測信號更為可靠準(zhǔn)確。圖7a為斷路器正常狀態(tài)下分合閘過程拾取的振動信號,該信號具有非平穩(wěn)時變特征。圖7b~圖7d分別為斷路器不同故障狀態(tài)下拾取的振動信號,可以發(fā)現(xiàn)故障狀態(tài)下信號波形相比于正常工況出現(xiàn)了明顯的差別,幅值突變性更加顯著,但是不同類型故障狀態(tài)間的信號波形則差異性較小,單純通過人為經(jīng)驗難以進(jìn)行區(qū)分。
(a) 正常狀態(tài)
(b) 執(zhí)行機(jī)構(gòu)故障
(c) 基座螺栓松動
(d) 緩沖彈簧失效 圖7 不同狀態(tài)振動信號波形
實驗過程中,4種不同運(yùn)行狀態(tài)數(shù)據(jù)樣本各采集50個,數(shù)據(jù)樣本總量為200,其中正常狀態(tài)1種,故障狀態(tài)3種,每種狀態(tài)50個樣本量,從中隨機(jī)抽選10個樣本用于訓(xùn)練RF模型,其余40個樣本用于測試識別,則訓(xùn)練樣本總量為40,測試樣本總量為160,樣本具體描述如表1所示。
表1 采集信號樣本描述
利用IMDE算法計算各個樣本在不同尺度下的散布熵值,圖8為隨機(jī)選取的斷路器4種不同狀態(tài)信號樣本的IMDE曲線,可以發(fā)現(xiàn)正常狀態(tài)下振動信號的多尺度散布熵值最大,表明正常狀態(tài)下拾取的振動信號動力學(xué)特性較為復(fù)雜,而當(dāng)斷路器出現(xiàn)異常故障時,拾取的振動信號動力學(xué)發(fā)生突變,信號內(nèi)部特征規(guī)律性更強(qiáng),因此散布熵值有所減小。利用IMDE構(gòu)造特征向量后輸入到RF模型中進(jìn)行訓(xùn)練,并通過GA算法進(jìn)行模型參數(shù)尋優(yōu),利用訓(xùn)練好的最佳RF模型進(jìn)行狀態(tài)識別,所得分類結(jié)果如圖9所示,觀察可以發(fā)現(xiàn),訓(xùn)練樣本集和測試樣本集的分類準(zhǔn)確率均為100%,由此表明斷路器不同的工況狀態(tài)均被準(zhǔn)確識別。
圖8 斷路器不同工況振動信號IMDE曲線
圖9 本文方法分類識別結(jié)果
為了驗證本文方法的優(yōu)勢,利用未做改進(jìn)的MDE算法以及機(jī)械故障診斷中廣泛應(yīng)用的MPE算法[19]和MSE算法[20]來提取斷路器機(jī)械振動信號中的特征信息,并由此分別構(gòu)造特征向量輸入到參數(shù)優(yōu)化RF模型中進(jìn)行斷路器狀態(tài)分類識別。
利用MDE算法提取振動信號特征信息時,設(shè)置的參數(shù)均與IMDE算法一致。在MPE算法中,同樣需要考慮尺度因子τ、嵌入維數(shù)m以及時間延遲λ,為了使識別結(jié)果具有可比性,利用MPE構(gòu)造特征向量時,尺度因子τ=20,嵌入維數(shù)m=3,時間延遲λ=1,也與IMDE計算過程中設(shè)置的參數(shù)相同。而在MSE算法中,除了參數(shù)τ、m、λ以外,還需要設(shè)置相似容限參數(shù)r,一般r取值為0.1~0.25倍的信號標(biāo)準(zhǔn)差。若r數(shù)值設(shè)置過大會導(dǎo)致原始時間序列在進(jìn)行重構(gòu)時丟失信息相反,若r取值過小會導(dǎo)致信號容易受到噪聲的干擾,熵值計算結(jié)果不穩(wěn)定,綜合考慮本文取相似容限r(nóng)取值為0.2倍信號標(biāo)準(zhǔn)差。
三種對比方法的最終分類識別結(jié)果分別如圖10~圖12所示,表2給出了不同分類識別方法的準(zhǔn)確率統(tǒng)計。通過對比可以看出,無論是訓(xùn)練樣本集還是測試樣本集,基于IMDE-GA-RF方法的分類準(zhǔn)確度均要優(yōu)于MDE/MPE/MSE-GA-RF方法,其中MSE-GA-RF方法分類效果最差,整體分類準(zhǔn)確率僅為91%。MPE-GA-RF方法與未進(jìn)行改進(jìn)的MDE-GA-RF方法差別不大,準(zhǔn)確率分別為97.5%和96.5%,但是均不如本文提出的方法理想。實驗結(jié)果表明本文中提出的診斷方法不僅可以對高壓斷路器正常與異常工況狀態(tài)進(jìn)行有效區(qū)分,同時可以對不同類型的故障狀態(tài)進(jìn)行準(zhǔn)確識別,對于實際工程應(yīng)用來說可以提供一定的參考與借鑒。
圖10 基于MDE-RF分類識別結(jié)果
圖11 基于MPE-RF分類識別結(jié)果
圖12 基于MSE-RF分類識別結(jié)果
表2 不同識別方法的準(zhǔn)確率
為了驗證基于GA優(yōu)化RF模型分類能力,利用IMDE算法提取斷路器振動信號中的特征信息并構(gòu)造特征向量,在訓(xùn)練樣本、測試樣本比例不同條件下重復(fù)10次分類過程并計算分類結(jié)果的平均值,與支持向量機(jī)(SVM)、BP神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)(ELM)等廣泛應(yīng)用的分類器的識別準(zhǔn)確率進(jìn)行對比,其中對比使用的三種分類器中的影響參數(shù)也通過GA算法進(jìn)行優(yōu)化,最終對比結(jié)果如表3所示。可以看到,本文提出的GA-RF模型的分類能力最強(qiáng),即使在訓(xùn)練樣本數(shù)量很小的情況下,仍然能夠順利完成訓(xùn)練過程,獲得準(zhǔn)確的測試結(jié)果,并且在訓(xùn)練樣本、測試樣本比值不同情況下,所得結(jié)果均優(yōu)于其余三種傳統(tǒng)的分類器,表明提出的GA-RF模型在斷路器復(fù)雜工況條件下能夠進(jìn)行有效狀態(tài)甄別,可以更好地滿足實際工程中對于少量訓(xùn)練樣本的需求,具有更加廣闊的應(yīng)用前景。
表3 不同分類器的總體準(zhǔn)確率
本文提出了一種基于改進(jìn)多尺度散布熵與優(yōu)化隨機(jī)深林模型相結(jié)合的高壓斷路器工況識別方法,實驗結(jié)果表明,改進(jìn)后的多尺度散布熵方法計算結(jié)果更加精確、穩(wěn)定性更好,并且通過IMDE方法可以將振動信號劃分到多個尺度上實現(xiàn)內(nèi)在特征信息提取。利用遺傳算法對RF模型進(jìn)行優(yōu)化可以避免其關(guān)鍵影響參數(shù)需要人為設(shè)置的弊端,能夠獲得更準(zhǔn)確的分類識別結(jié)果。利用本文所述的診斷識別方法,可以進(jìn)行高壓斷路器不同工況狀態(tài)的準(zhǔn)確區(qū)分,對于實現(xiàn)在線狀態(tài)監(jiān)測、減低巡檢人員的作業(yè)負(fù)擔(dān)具有一定的參考借鑒價值。