楊曉楠 呂國強(qiáng) 侯鵬飛
摘 要:針對實(shí)際電能質(zhì)量擾動種類繁多、擾動信號差異不明顯、存在多種混合擾動,導(dǎo)致識別電能質(zhì)量非常困難的情況,提出一種基于極點(diǎn)對稱經(jīng)驗(yàn)?zāi)J椒纸夥椒ǎ‥SMD)和支持向量機(jī)(SVM)的電能質(zhì)量混合擾動信號分類識別新方法。首先,對加入白噪聲的混合擾動信號利用小波軟閾值去噪處理;其次,利用ESMD將信號分解為不同信號分量,對每類擾動的不同信號分量分別提取樣本熵和互樣本熵特征值,所有分量特征值構(gòu)成特征向量;最后利用SVM對擾動信號特征向量進(jìn)行分類和混合擾動識別。研究表明,該方法對混合擾動識別正確率很高,是一個有效的方法。
關(guān)鍵詞:樣本熵;互樣本熵;電能質(zhì)量混合擾動;極點(diǎn)對稱經(jīng)驗(yàn)?zāi)J椒纸夥椒?支持向量機(jī)
0 引言
智能電網(wǎng)的發(fā)展帶來電力電子設(shè)備的廣泛應(yīng)用,電力系統(tǒng)的電能質(zhì)量[1]擾動問題受到重視。實(shí)際的電能質(zhì)量擾動種類繁多,擾動信號差異不明顯,還存在多種混合擾動現(xiàn)象,導(dǎo)致電能質(zhì)量檢測與識別問題非常復(fù)雜[2]。單一擾動問題研究較多,復(fù)合擾動問題研究逐漸成為熱點(diǎn)。單一擾動分類時各種擾動類別信號特征之間是互斥和獨(dú)立的,而混合擾動時各類復(fù)合擾動信號的特征量之間相互重疊和交叉,給檢測和識別帶來極大困難,如特征失效、分類評價錯誤等。混合擾動識別[3-6]典型研究有:S變換+分類器[7]、小波變換+分類器[8]、獨(dú)立分量分析+分類器[9]和經(jīng)驗(yàn)?zāi)J椒纸?分類器[10]等。文獻(xiàn)[7]首先運(yùn)用S變換對暫態(tài)多擾動信號進(jìn)行時頻分析,然后提取擾動信號的特征量,最后生成對暫態(tài)多擾動信號進(jìn)行分類的決策樹分類辨識方法,以此實(shí)現(xiàn)對暫態(tài)多擾動信號的分類辨識;文獻(xiàn)[8]利用離散小波變換提取擾動信號的多種特征,采用主成分分析方法對信號最優(yōu)特征進(jìn)行選擇,然后利用小波神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識別;文獻(xiàn)[9]提出一種獨(dú)立分量進(jìn)行信號分解,并對每個分量提取特征,利用支持向量機(jī)對混合擾動信號進(jìn)行分類;文獻(xiàn)[10]將EEMD和多標(biāo)簽Rank-SVM相結(jié)合進(jìn)行電能質(zhì)量混合擾動識別。首先利用EEMD進(jìn)行混合擾動信號分解并提取各分量的標(biāo)準(zhǔn)能量差特征值,然后利用多標(biāo)簽Rank-SVM進(jìn)行電能質(zhì)量的混合擾動分類。
研究表明,改進(jìn)的經(jīng)驗(yàn)?zāi)J椒纸夥椒ㄗ鳛殡娔苜|(zhì)量混合擾動的信號分解方法,能將混合擾動信號進(jìn)行高質(zhì)量信號分解,有利于特征提取和信號分類。對信號分解后各分量選擇合適的特征量提取方法對復(fù)雜的分類問題至關(guān)重要?;诖?,本文提出一種極點(diǎn)對稱經(jīng)驗(yàn)?zāi)J椒纸夥椒ǎ‥SMD)與SVM結(jié)合,對混合擾動信號進(jìn)行分類與識別。首先,對加了白噪聲的混合擾動信號利用小波軟閾值去噪處理;其次,利用ESMD將信號分解為不同的信號分量,對每類擾動的不同信號分量分別提取樣本熵和互樣本熵特征值,所有分量的特征值構(gòu)成特征向量;最后利用SVM對擾動信號特征向量進(jìn)行分類和混合擾動識別。
1 電能質(zhì)量混合擾動信號分析
1.1 極點(diǎn)對稱模態(tài)分解(ESMD)
極點(diǎn)對稱模態(tài)分解(ESMD)是2013年由青島理工大學(xué)王宗良、李宗軍等[11]開發(fā)的一種新的數(shù)據(jù)處理方法,是著名的Hilbert-Huang變換新發(fā)展。與以往的經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)和集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)[12]一樣,ESMD方法能將復(fù)雜的信號進(jìn)行平穩(wěn)化處理,得到若干個具有不同特征尺度或固有周期的本征模態(tài)函數(shù)(IMF)。但ESMD方法將EMD方法中用于確定原始信號外部包絡(luò)線的三階樣條插值法改進(jìn)為內(nèi)部極點(diǎn)對稱插值法,并借用“最小二乘法”思想優(yōu)化最后剩余模態(tài),使其成為整個信號分解過程中的“自適應(yīng)全局均線”,以此確定分解過程中的最佳篩選次數(shù),有效解決了EMD方法分解中的“模態(tài)混疊”問題,是目前信號分析的最新方法之一。
1.2 混合擾動信號仿真
理想情況下,電網(wǎng)以恒定的額定電壓和恒定工頻的交流電為用戶供電。然而在實(shí)際生活中,電壓和頻率會發(fā)生變化,從而引起一系列電能質(zhì)量問題。電能質(zhì)量擾動有很多種,下面列出12種典型的電能質(zhì)量單一擾動類型[13],如表1所示。與單一電能質(zhì)量擾動信號相比,電能質(zhì)量混合擾動具有獨(dú)特之處,不同的混合擾動具有獨(dú)特的信號內(nèi)在特征?;旌蠑_動指包含兩種及以上單一擾動的電能質(zhì)量擾動形式。較為常見的混合擾動信號包括諧波與各種暫態(tài)擾動的混合、兩種暫態(tài)擾動的混合、各種穩(wěn)態(tài)擾動的混合等,本文對兩種單一擾動混合而成的7種混合擾動、3個典型信號進(jìn)行觀察和分析。為減少模態(tài)混疊現(xiàn)象,使仿真更貼近實(shí)際,3種混合擾動均加入40dB的高斯白噪聲,然后采用小波去噪方法獲得模擬信號,如圖1-圖3所示。
圖1-圖3是3種混合擾動信號的仿真波形圖,圖(a)是不進(jìn)行任何處理的原始信號,圖(b)是加了40dB白噪聲后的信號,圖(c)是對加了白噪聲的信號進(jìn)行小波去噪后的仿真信號。這里所有信號的采樣頻率都為6.4kHz。從以上幾個混合擾動的仿真可以看出,在加入白噪聲后,波形變得不光滑,但在小波去噪后,波形有一定改善。
1.3 擾動信號ESMD分解分析
對7種混合擾動信號進(jìn)行ESMD分解,得到各個模態(tài)分量IMF,選取200~1 000之間的801個點(diǎn),剩余模態(tài)極值點(diǎn)最少個數(shù)默認(rèn)設(shè)置為4,迭代次數(shù)默認(rèn)設(shè)置為40,分別得到7種混合擾動的經(jīng)驗(yàn)?zāi)@L圖,在此只圖示上述3種混合擾動的經(jīng)驗(yàn)?zāi)@L圖,如圖4-圖6所示。
圖4-圖6為7種混合擾動信號分解之后的經(jīng)驗(yàn)?zāi)@L圖,每個圖中的Data為原始數(shù)據(jù),下面的幾個為分解出來的分量,最后一個分量是余量。從圖中可以看出,各個擾動的分量不同,有最少6個分量(除原始數(shù)據(jù))最多7個分量的。ESMD根據(jù)極值點(diǎn)數(shù)確定模態(tài)分量的個數(shù),當(dāng)余量的極值點(diǎn)達(dá)到一定數(shù)量時,即得到余量的模繪圖。所以,對于同一擾動,當(dāng)改變擾動發(fā)生的起止時間或擾動幅值后,得到的經(jīng)驗(yàn)?zāi)@L圖也會不同。
2 電能質(zhì)量混合擾動信號特征提取
在電能質(zhì)量擾動識別中,提取和選擇有效特征向量非常重要,它直接影響到擾動是否能識別。常見的電能質(zhì)量信號提取特征類型有時間、頻率、幅度、波形、能量、相關(guān)系數(shù)和熵等特征。本文研究基于熵類型的改進(jìn)特征提取方法,即樣本熵和互樣本熵。
Pincus & Kalman[14]引入了一個基于信息理論的數(shù)學(xué)方法——近似熵,用來度量時間序列的復(fù)雜性或不規(guī)則性;Richman & Moorman[15]分析了近似熵存在兩個不足:近似熵的值依賴于數(shù)據(jù)長度,缺少相對一致性,對此提出一種更有效的可用來度量時間序列不規(guī)則性的熵:樣本熵。樣本熵是一種有別于近似熵的不計數(shù)自身匹配的統(tǒng)計量,是對于近似熵算法的改進(jìn)。樣本熵可以理解為條件概率的自然對數(shù)的相反數(shù),其中條件概率指兩個序列在窗寬為m時,相似的向量在窗寬增加1個長度時仍然相似的概率。樣本熵越小則序列規(guī)則性越強(qiáng);樣本熵越大則序列隨機(jī)性越強(qiáng)。與近似熵相比,樣本熵具有以下兩個優(yōu)點(diǎn):①樣本熵不包含自身數(shù)據(jù)段的比較,它是條件概率的負(fù)平均自然對數(shù)的精確值,因此樣本熵的計算不依賴數(shù)據(jù)長度;②樣本熵具有更好的一致性。即如一時間序列比另一時間序列有較高的值時,其對于其它m和r值也具有較高的值[16-17]。樣本熵在很大程度上不依賴于數(shù)據(jù)長度,樣本熵的一致性比近似熵高,在一定程度上彌補(bǔ)了近似熵的不足。為表達(dá)兩個信號的異步程度,即不相似程度,Pincus & Singer[18]提出了可以計算兩個時間序列異步程度的互近似熵。為克服計算互近似熵時與計算近似熵不一致和抗干擾能力弱問題,Richman & Moorman提出了針對兩個序列的互樣本熵(Cross-SampEn),對于給定的兩個序列,互樣本熵可以計算得到一個非負(fù)值?;颖眷卦酱?,兩個型號異步性越強(qiáng)?;颖眷卦谝欢ǔ潭壬峡朔嘶ソ旗氐牟蛔??;颖眷厥歉鶕?jù)樣本熵的概念而提出的,是對樣本熵算法的拓展。在實(shí)際應(yīng)用中,互樣本熵只需較少的數(shù)據(jù)量就可估計一個較為穩(wěn)定的值,有較好的抗噪聲能力和抗干擾能力,其分析效果優(yōu)于樣本熵。樣本熵和互樣本熵已經(jīng)在復(fù)雜生理等非線性信號處理中得到成功應(yīng)用,但在電能質(zhì)量信號分類方面的研究不多見。下面給出互樣本熵定義:
4 SVM識別結(jié)果與分析
根據(jù)電能質(zhì)量混合擾動模型產(chǎn)生7種混合擾動波形,使用MATLAB軟件進(jìn)行研究,疊加信噪比為40dB的噪聲信號以模擬實(shí)際情況,并利用小波軟閾值去噪處理獲得有用信號,共生成280個樣本,每種擾動分別為40個;其次,利用ESMD將信號分解為不同信號分量,對每類擾動的不同信號分量分別提取樣本熵和互樣本熵特征值,所有分量的特征值構(gòu)成特征向量,本文選取其中的幾個分量求其樣本熵和互樣本熵。綜合7種混合擾動的分解情況,大多分解出6個分量(除原始數(shù)據(jù)即第一個分量外),但為了避免求取過程中有0存在,本文選取最少的分量作為標(biāo)準(zhǔn),即5個分量,將多余的分量與第5個分量求和作為第5個分量。然后利用SVM對擾動信號特征向量進(jìn)行分類和混合擾動識別,選核函數(shù)類型為高斯徑向基核函數(shù),采用交叉驗(yàn)證選擇最佳的懲罰系數(shù)c和最佳核函數(shù)半徑g,用所獲得的最佳c和g對整個訓(xùn)練集進(jìn)行訓(xùn)練,獲得支持向量機(jī)模型;最后利用所得到的支持向量機(jī)模型對測試集進(jìn)行測試獲得識別和預(yù)測結(jié)果。每類擾動取20個作為訓(xùn)練樣本,其余20個作為測試樣本。其中,類型1表示電壓暫降+脈沖暫態(tài)的混合擾動,類型2表示電壓暫降+振蕩暫態(tài)的混合擾動,類型3表示電壓暫升+振蕩暫態(tài)的混合擾動,類型4表示諧波+電壓暫升的混合擾動,類型5表示諧波+電壓中斷的混合擾動,類型6表示諧波+振蕩暫態(tài)的混合擾動,類型7表示振蕩暫態(tài)+電壓中斷的混合擾動。
提取樣本熵的特征向量時,設(shè)置嵌入維度m=2,閾值r=0.2SD,對于互樣本熵,設(shè)置嵌入維度m=2,閾值r=0.2。因兩種特征值下的數(shù)據(jù)小而且維度小,所以將樣本數(shù)據(jù)讀入后,在SVM的人機(jī)交互界面上都選擇不進(jìn)行歸一化和不進(jìn)行PCA降維預(yù)處理。采用網(wǎng)格劃分(grid search)尋找最佳的懲罰系數(shù)c和最佳核函數(shù)半徑g,網(wǎng)格搜索能夠找到在CV意義下的最高分類準(zhǔn)確率,即全局最優(yōu)解。樣本熵的最佳懲罰系數(shù)c=0.003 906 3,最終CV意義下的最佳分類準(zhǔn)確率CVAccuracy=98.571 4%,最佳核函數(shù)半徑g=0.353 55,訓(xùn)練樣本的準(zhǔn)確率97.857 1%,測試樣本的識別準(zhǔn)確率為95%,即140個測試樣本中有133個樣本能正確識別。互樣本熵的最佳懲罰系數(shù)c=5.656 9,最終CV意義下的最佳分類準(zhǔn)確率CVAccuracy=99.285 7%,最佳核函數(shù)半徑g=22.627 4,訓(xùn)練樣本的準(zhǔn)確率99.285 7%,測試樣本的識別準(zhǔn)確率為98.571 4%,即140個測試樣本中有138個樣本能正確識別。利用SVM對7種擾動的互樣本熵和樣本熵的特征值進(jìn)行識別,以互樣本熵為例進(jìn)行分析,結(jié)果如圖7所示。
圖7包含7個類別標(biāo)簽、實(shí)際測試集和預(yù)測測試集,將實(shí)際測試集與預(yù)測集進(jìn)行對比,從圖中可以看出哪個樣本被正確識別,哪個樣本被錯誤識別。在此以互樣本熵為例,樣本熵的分析類似,互樣本熵分析如下:
(1)第6類中20個樣本有兩個識別錯誤,其中,有一個識別成第2類,另外一個識別成第3類,識別正確率為90%。
(2)其它幾類中20個樣本被完全識別,其識別準(zhǔn)確率為100%。
由于篇幅有限,近似熵的相關(guān)識別過程不再贅述,本文只給出識別結(jié)果,3種特征值的識別結(jié)果比較如表2所示。
從表中可以看出,相對于近似熵,提取樣本熵和互樣本熵的特征向量,然后利用SVM對混合擾動進(jìn)行識別,正確率達(dá)到95%以上,互樣本熵的識別正確率達(dá)到98.571 4%,表明利用樣本熵和互樣本熵的特征向量對電能質(zhì)量混合擾動識別具有很好的效果。
5 結(jié)語
本文提出一種基于ESMD和SVM的電能質(zhì)量混合擾動識別方法。按照信號分解、特征提取和擾動識別過程進(jìn)行研究,仿真測試結(jié)果表明:
(1)通過ESMD對混合信號分解的方法有效解決了EMD方法分解中的“模態(tài)混疊”問題,操作簡單,可以得到直觀的模繪圖,達(dá)到很好的分解效果。
(2)提取樣本熵和互樣本熵特征值,利用SVM具有結(jié)構(gòu)簡單和泛化能力較高的優(yōu)點(diǎn)對混合擾動進(jìn)行識別。大量仿真試驗(yàn)結(jié)果表明,該方法有效性高、實(shí)時性好、分類準(zhǔn)確度高。
后續(xù)研究將嘗試更多種類的混合擾動,同時將新方法拓展到實(shí)際電能質(zhì)量擾動信號分類和識別工作中,進(jìn)一步證明新方法的實(shí)用性。
參考文獻(xiàn):
[1] 張淑清,喬永靜,姜安琦,等. 基于CEEMD和GG聚類的電能質(zhì)量擾動識別[J]. 計量學(xué)報,2019,40(1):49-57.
[2] 瞿合祚,李曉明,陳陳,等.? 基于卷積神經(jīng)網(wǎng)絡(luò)的電能質(zhì)量擾動分類[J]. 武漢大學(xué)學(xué)報:工學(xué)版,2018(6):11-16.
[3] 王天偉,張厚江,路敦民,等. 基于小波去噪和經(jīng)驗(yàn)?zāi)B(tài)分解算法的足尺人造板動態(tài)稱重研究[J]. 計量學(xué)報,2017,38(3):300-303.
[4] 吳凱,施康明. 基于SVD和PNN的電能質(zhì)量擾動分析方法[J]. 浙江電力,2018,37(4):63-67.
[5] 張會敏,唐貴基. 基于CEEMD和奇異值差分譜的滾動軸承故障特征提取[J]. 電力科學(xué)與工程,2016,32(1):37-42.
[6] 劉志剛,張巧革,張揚(yáng). 電能質(zhì)量復(fù)合擾動分類的研究進(jìn)展[J]. 電力系統(tǒng)保護(hù)與控制,2013,41(13):147-153.
[7] 岳明道. 基于S變換和分類樹的電網(wǎng)暫態(tài)電能質(zhì)量擾動分類辨識[J]. 電力系統(tǒng)保護(hù)與控制,2011,39(9):33-37.
[8] MASOUM M A S, JAMALI S, GHAFFARZADEH N. Detection and classification of power quality disturbances using discrete wavelet transform and wavelet networks[J]. IET Science,Measurement& Technology,2010, 4(4):193-205.
[9] MARTA RUIZ-LLATA,GUILLERMO GUARNIZO,CARLOS BOYA.Embedded power quality monitoring system based on independent component analysis and SVMs[C]. Proceedings of International Joint Conference on Neural Networks,2011:2229-2234.
[10] LIU Z G, CUI Y, LI W H. A classification method for complex power quality disturbances using EEMD and rank wavelet SVM[J].? IEEE Transactions on Smart Grid, 2015(23):97431-97442.
[11] 王金良,李宗軍. 極點(diǎn)對稱模態(tài)分解方法[M]. 北京:高等教育出版社,2015.
[12] 鄧為權(quán). 基于EEMD和SVM的電能質(zhì)量擾動檢測與分析研究[D]. 昆明:昆明理工大學(xué),2015.
[13] 劉志剛. Hilbert-Huang變換及其在電力系統(tǒng)中的應(yīng)用[M]. 北京:科學(xué)出版社,2016.
[14] PINCUS S,KALMAN R E. Irregularity,volatility,risk,and financial market time series[J]. Proceedings of the National Academy of Science of the United States of America,2004(101):13709-13714.
[15] RICHMAN J S, MOORMAN J R.Physiological time-series analysis using approximate entropy and sample entropy[J].? American Journal of Physiology-Heart and Circulatory Physiology,2000,278(6):2039-2049.
[16] GASPARETTO A,LANZUTTI A,VIDONI R,et al. Experimental validation and comparative analysis of optimal time-jerk algorithms for trajectory planning[J]. Robotics and Computer-Integrated Manufacturing,2012( 28) : 164-181.
[17] PINCUS S,SINGER B H. Randomness and degrees of irregularity[J]. Proceedings of the National Academy of Science of the United States of America,1996(93):2083-2088.
[18] 朱永利,吳立増,李雪玉,等. 貝葉斯分類器與粗綻集相結(jié)合的變壓器綜合故障診斷[J]. 中國電機(jī)工程學(xué)報,2005,25(10):159-165.
[19] 司 莉,畢貴紅,魏永剛,等. 基于 RQA 與 SVM 的聲發(fā)射信號檢測識別方法[J]. 振動與沖擊,2016,35(2):98-103.
[20] CHANG C C,LIN C J. LIBSVM: a library for support vector machines[D]. Taiwan:Department of Computer Science National Taiwan University,2011.
(責(zé)任編輯:杜能鋼)