韓彤,楊正宇 ,,陳葉 ,趙振剛
(1.云南電網(wǎng)有限責任公司電力科學(xué)研究院,云南昆明 650217;2.昆明理工大學(xué)信息工程與自動化學(xué)院,云南昆明 650500)
電力系統(tǒng)的穩(wěn)定運行依賴于各種電力設(shè)備,其中電能表是電力系統(tǒng)運行中的重要計量設(shè)備,用于測量用電量以及傳輸數(shù)據(jù)。隨著電能表更新迭代越來越快,精密程度越來越高,其功能也更加多樣化、模塊化,倘若電能表故障得不到及時處理,將對電力系統(tǒng)穩(wěn)定運行產(chǎn)生嚴重影響,因此準確快速識別電能表故障類型對維護電力系統(tǒng)正常運行、提高電表檢修效率有重要意義。
目前主要采用的分類預(yù)測算法包括決策樹、支持向量機、人工神經(jīng)網(wǎng)絡(luò)和隨機森林等。文獻[4]中利用模型自適應(yīng)選擇融合方法,通過分別取各類樣本分類精度的最大值,計算樣本精度閾值和差值,利用閾值和差值比較標記后選擇融合模型,但是融合過程中計算過于繁瑣,參量太多,計算工作量較大。文獻[5]中利用排列熵(PE)具有抗噪能力強、計算效率高等優(yōu)點,通過提取故障信號的MPE作為特征向量輸入,將PSO與SVM結(jié)合起來建立模型,對SVM中參數(shù)進行優(yōu)化選擇,有著搜索速度快、效率高、算法簡單的優(yōu)點,但是對于離散的優(yōu)化問題處理不佳,容易陷入局部最優(yōu)。文獻[6]中研究基于膠囊網(wǎng)絡(luò)的診斷方法,特點是利用卷積神經(jīng)網(wǎng)絡(luò)強大的特征學(xué)習能力提取故障特征,建立特征和故障類型之間的映射關(guān)系,建立訓(xùn)練模型,結(jié)果表明診斷精度得到提高,但是編碼過程過于復(fù)雜。文獻[7]中充分分析特征與故障類型的相關(guān)性關(guān)系,基于實時數(shù)據(jù)與歷史數(shù)據(jù)的SVM相關(guān)性分類方法實現(xiàn)判別,得到高精度判別模型,但是此模型需要大量數(shù)據(jù)進行支持,提高了系統(tǒng)運行的復(fù)雜性。黃帥等人利用PSO-LSSVM模型進行鋼絲繩的故障診斷研究,相比于PSO-SVM速度明顯提升,但是測試精度上沒什么優(yōu)勢,而且相比之下不具有稀疏性。田干等人利用支持向量機回歸(SVR)與最小二乘估計法相結(jié)合,建立了液體火箭發(fā)動機故障預(yù)測模型(LS-SVR),并分別將其應(yīng)用于液體火箭發(fā)動機參數(shù)預(yù)測問題,但是分析選用的總樣本數(shù)量較少,不具有很強的說服力。
人工蜂群(Artificial Bee Colony,ABC)算法是基于蜜蜂采蜜機制的蜂群算法,具有算法參數(shù)少、易于實現(xiàn)、穩(wěn)定性好的優(yōu)點。作者針對傳統(tǒng)優(yōu)化算法易于陷入局部最優(yōu)的問題,利用Tent混沌搜索隨機、遍歷行的特點對ABC進行優(yōu)化,有利于使其跳出局部最優(yōu)解,通過不斷優(yōu)化支持向量機懲罰因子與核函數(shù),提高了分類器的性能。通過實驗仿真分析,驗證了CABC-SVM在電能表故障診斷方面的優(yōu)越性。
人工蜂群算法中,蜜蜂種類包含引領(lǐng)蜂、跟隨蜂以及偵查蜂,蜜蜂對蜜源的搜索過程如下:(1)引領(lǐng)蜂負責發(fā)現(xiàn)蜜源,并記錄蜜源信息;(2)跟隨蜂通過識別引領(lǐng)蜂提供的蜜源信息,隨機選擇一個蜜源;(3)當一個蜜源被放棄后,相應(yīng)的引領(lǐng)蜂變?yōu)閭刹榉?,繼續(xù)尋找新的蜜源。
在ABC算法過程中,蜜源的位置代表優(yōu)化問題的可行解,蜜源的質(zhì)量(適應(yīng)度值)代表可行解的質(zhì)量。首先,ABC算法隨機生成含有個解的初始種群,每個解(=1,2,…,)用一個維向量=(1,2,…,)來表示,是待優(yōu)化問題的特征參數(shù)的個數(shù)。初始解產(chǎn)生公式為
=+rand(0,1)(-)
(1)
其中:、分別為取值范圍的上、下限;rand(0,1)為0~1之間的隨機數(shù)。
跟隨蜂根據(jù)得到的蜜源信息按照概率進行選擇,質(zhì)量越高的蜜源被選擇的概率越大。引領(lǐng)蜂和跟隨蜂按照下式搜索蜜源
(2)
其中:∈{1,2,…,},∈{1,2,…,},和均為隨機選取,但是≠;為[-1,1]間的隨機數(shù)。
這里跟隨蜂選擇第個蜜源采蜜的概率為
fit=()
(3)
式中:為第個蜜源(解)被選擇的概率;fit為第個解的適應(yīng)度值;()為適應(yīng)度函數(shù)。
假定某個解未被更新的次數(shù)超過“l(fā)imit”,則表示這個解連續(xù)經(jīng)過有限次循環(huán)之后沒有得到改善,認為這個解陷入局部最優(yōu),那么這個解就要考慮被放棄,與這個解相對應(yīng)的引領(lǐng)蜂也轉(zhuǎn)變?yōu)閭刹旆?。計算公式如?/p>
(4)
Tent混沌映射(Chaos Optimization Algorithm)是利用混沌搜索的遍歷性特點,使混沌算法在計算過程中可以不重復(fù)地經(jīng)歷一定范圍狀態(tài),通過采用Tent映射模型系統(tǒng)產(chǎn)生混沌變量,并映射到相應(yīng)取值區(qū)間進行混沌搜索。Tent混沌映射表達式如下
(5)
Tent混沌映射經(jīng)貝努利變換后表達式如下
+1=(2)mod1
(6)
其中:表示(0,1)中隨機數(shù)。
傳統(tǒng)優(yōu)化算法中,種群初始化的質(zhì)量往往很大程度上決定著算法的尋優(yōu)效果。在以往的研究內(nèi)容中,通常采用隨機初始化來產(chǎn)生相應(yīng)的初始解,這種方法導(dǎo)致解空間的范圍得不到充分的應(yīng)用。通過Tent混沌映射初始化解,保證解在解空間內(nèi)均勻分布。
在算法運算后期,各解運算結(jié)果相對較近,很難避免運算結(jié)果陷入局部最優(yōu),本文作者利用Tent混沌映射的思想,將所解蜜源利用Tent混沌搜索進行刷新,產(chǎn)生新一組混沌序列后代入算法內(nèi)與現(xiàn)蜜源進行對比,保留最優(yōu)適應(yīng)度的解為最優(yōu)解。
支持向量機(SVM)最初是為二值分類而設(shè)計的,原理思想是將特征映射到高維空間,在此高維空間內(nèi)建立超平面,使得各特征向量距離次超平面距離最遠,也就是此時分類誤差越小。
文中電表故障一般屬于多分類非線性問題,成對分類方法(One-Against-One)是在每兩個類之間都構(gòu)建一個二進制分類器,共構(gòu)造(-1)/2個分類器,每個分類器根據(jù)兩個類的數(shù)據(jù)進行訓(xùn)練,對于第類和第類數(shù)據(jù),訓(xùn)練一個SVM即求解二次規(guī)劃問題,給定含個樣本的訓(xùn)練集=(,,…)(=1,2,…,),其中為特征向量維數(shù),(=1,2,…,)為標簽類數(shù)。
()()+≤-1,=
(7)
其中:上標表示是類和類之間SVM的參數(shù);下標表示類和類的并集中樣本的索引;()表示輸入空間到特征空間的非線性映射。
第類和第類之間SVM決策函數(shù)為
()=sign[()()+]
(8)
徑向基核函數(shù)RBF是常用的核函數(shù),其函數(shù)表達式為
(,)=exp(-‖-‖)
>0
(9)
針對改進人工蜂群算法優(yōu)化SVM對電表故障分類問題,包括數(shù)據(jù)預(yù)處理、Tent混沌映射優(yōu)化初始蜂群、SVM利用優(yōu)化參數(shù)分類等過程,具體步驟如下:
(1)對獲取數(shù)據(jù)進行預(yù)處理,并對數(shù)據(jù)進行歸一化。
(2)設(shè)定算法初始值,包括種群數(shù)量,蜜源數(shù)量,更新限制次數(shù)limit,最大迭代次數(shù),參數(shù)、取值范圍。
(3)以Tent混沌映射產(chǎn)生初始解,引領(lǐng)蜂根據(jù)式(2)進行領(lǐng)域搜索,以貪婪法選擇較好蜜源,以式(3)計算蜜源被跟隨蜂選擇的概率。
(4)跟隨蜂根據(jù)式(2)搜索選擇的蜜源,計算適應(yīng)度值。
(5)若有蜜源(解)經(jīng)limit次循環(huán)后沒有改善,將蜜源通過Tent混沌搜索產(chǎn)生新的蜜源來替代,計算其適應(yīng)度值,保留最優(yōu)解。
(5)達到最大迭代次數(shù)后,將最優(yōu)解賦值于SVM模型。
(7)利用數(shù)據(jù)集劃分訓(xùn)練集以及測試集,測試集代入通過最優(yōu)、訓(xùn)練好的模型,輸出分類結(jié)果。
改進人工蜂群算法優(yōu)化SVM方法流程如圖1所示。
圖1 模型整體流程
根據(jù)云南電網(wǎng)某公司監(jiān)測到的電能表故障數(shù)據(jù),以8∶2的比例劃分訓(xùn)練集以及測試集。由于各影響特征之間數(shù)值范圍相差較大,為了避免系統(tǒng)精度低或損失函數(shù)不收斂等問題,對數(shù)據(jù)進行歸一化處理,采用Min-Max標準化將其歸化至(0,1)區(qū)間內(nèi)。計算公式如下
(10)
對不同故障類別編號,由于終端上電、掉電等故障類型采集不到有效數(shù)據(jù),所以先不予以討論。經(jīng)數(shù)據(jù)研究整理,反映電能表故障的因素包括A相電壓、B相電壓、C相電壓、A相電流、B相電流、C相電流以及正向有功總功能。電能表故障類型與數(shù)據(jù)集樣本關(guān)系如表1所示,對優(yōu)化算法設(shè)置初值,CABC-SVM各參數(shù)設(shè)定如表2所示。
表1 故障編號以及樣本信息
表2 系統(tǒng)初始化參數(shù)
為了驗證提出的CABC-SVM模型的有效性,對建立的CABC-SVM優(yōu)化模型進行仿真實驗,利用MATLAB軟件建模和進行仿真實驗。圖2所示為系統(tǒng)迭代次數(shù)與適應(yīng)度函數(shù)值的關(guān)系。
圖2 系統(tǒng)迭代次數(shù)與適應(yīng)度函數(shù)值的關(guān)系
由圖2可知:隨著迭代次數(shù)的增加,當前解通過不斷更新獲得更優(yōu)的適應(yīng)度函數(shù)值,逐漸向最優(yōu)解逼近。為了更好地體現(xiàn)出CABC-SVM的分類效果,引入ABC-SVM、PSO-SVM以及GA-SVM模型做分類效果對比。相比于上面3種模型,在算法中期CABC-SVM明顯具有更好跳出局部最優(yōu)解的能力,獲得更優(yōu)適應(yīng)度并且CABC-SVM在第40代就完全收斂,而ABC-SVM、GA-SVM、PSO-SVM分別在89、70和79代才收斂,對比發(fā)現(xiàn)CABC-SVM模型具有更好的收斂能力。圖3為4種模型對測試集分類精度的情況。
如圖3所示:以50組數(shù)據(jù)作為測試數(shù)據(jù)進行分類,CABC-SVM出現(xiàn)了1個診斷錯誤,診斷精度達到98.0%;ABC-SVM在和CABC-SVM模型精度相同但運行時間更長;PSO-SVM與GA-SVM模型分別有3個和5個診斷錯誤,診斷精度分別為94.0%和90.0%。表3為各模型性能對比。
圖3 CABC-SVM、ABC-SVM、PSO-SVM和GA-SVM分類模型分類精度對比
表3 各模型性能對比
經(jīng)MATLAB建模仿真分析發(fā)現(xiàn)無論在精度以及收斂迭代次數(shù)和運行時間上,CABC-SVM模型都具有一定優(yōu)勢,尤其與傳統(tǒng)ABC-SVM算法相比運行時間縮短接近一倍。
提出一種基于改進人工蜂群算法優(yōu)化SVM的電能表故障診斷方法,通過分析故障數(shù)據(jù)的類型和規(guī)模,對數(shù)據(jù)進行預(yù)處理;利用改進人工蜂群算法對SVM分類器的懲罰因子和核函數(shù)參數(shù)進行優(yōu)化;最后將故障訓(xùn)練集作為輸入建立模型,測試集驗證模型性能;通過實驗仿真分析,對比文中4類模型對于故障數(shù)據(jù)的分類效果,證實了CABC-SVM在電能表故障診斷方面具有快速收斂、高精度的診斷效果,為電能表故障診斷提供了一種參考。