王海濤,陳 明,文 中,方 萌
(1.三峽大學(xué)電氣與新能源學(xué)院,湖北 宜昌 443002;2.國(guó)網(wǎng)西安供電公司,陜西 西安 710032)
隨著全球能源互聯(lián)網(wǎng)概念的提出,特高壓成為我國(guó)電力系統(tǒng)的發(fā)展方向,電力系統(tǒng)的安全性和穩(wěn)定性也迎來(lái)了更大的挑戰(zhàn)[1-4]。接地網(wǎng)是變電站必不可少的保護(hù)設(shè)備,承擔(dān)著保障人身和設(shè)備安全的重要角色[5-7]。接地網(wǎng)金屬部件常年埋于地下,極易發(fā)生表面腐蝕,腐蝕加劇后甚至發(fā)生斷裂,嚴(yán)重威脅電力系統(tǒng)的安全穩(wěn)定運(yùn)行[8-10]。目前接地網(wǎng)腐蝕狀態(tài)的檢查只能采取開(kāi)挖方式,費(fèi)時(shí)費(fèi)力卻收效甚微[11]。因此,對(duì)接地網(wǎng)腐蝕速率預(yù)測(cè)進(jìn)行研究,準(zhǔn)確掌握接地網(wǎng)運(yùn)行狀態(tài)具有重要意義。
在接地網(wǎng)腐蝕預(yù)測(cè)方面,BP 神經(jīng)網(wǎng)絡(luò)得到了廣泛應(yīng)用,文獻(xiàn)[12]以電阻率、含水量、含鹽量等6 個(gè)影響因素為輸入?yún)⒘浚⒘嘶贐P 神經(jīng)網(wǎng)絡(luò)的接地網(wǎng)腐蝕速率預(yù)測(cè)模型。文獻(xiàn)[13]采用遺傳算法對(duì)BP 神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化,對(duì)華南某地金屬腐蝕速率進(jìn)行了預(yù)測(cè)。上述文獻(xiàn)中腐蝕樣本容量均小于100,屬于典型小樣本,采用BP 神經(jīng)網(wǎng)絡(luò)并不合適。對(duì)于小樣本數(shù)據(jù),采用支持向量機(jī)(Support Vector Machine,SVM)的擬合效果更好[14],文獻(xiàn)[15]采用人工蜂群算法對(duì)SVM 參數(shù)進(jìn)行優(yōu)化,建立了接地網(wǎng)腐蝕速率預(yù)測(cè)模型,并用腐蝕試驗(yàn)數(shù)據(jù)驗(yàn)證了模型的實(shí)用性。文獻(xiàn)[16]采用擴(kuò)展記憶因子對(duì)粒子群算法進(jìn)行了改進(jìn),建立了基于改進(jìn)粒子群優(yōu)化LSSVM 的接地網(wǎng)腐蝕預(yù)測(cè)模型,該模型預(yù)測(cè)效果較好。但人工蜂群算法和改進(jìn)粒子群算法尋優(yōu)能力有限,因此接地網(wǎng)腐蝕速率預(yù)測(cè)精度還有待進(jìn)一步提高。
本文對(duì)接地網(wǎng)腐蝕影響因素進(jìn)行核主成分分析(Kernel Principal Component Analysis,KPCA),確定接地網(wǎng)腐蝕速率的關(guān)鍵影響因子,采用改進(jìn)斑點(diǎn)鬣狗算法(Improved Spotted Hyena Optimization,ISHO)對(duì)最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)進(jìn)行優(yōu)化,建立基于KPCA-ISHO-LSSVM 的接地網(wǎng)腐蝕速率預(yù)測(cè)模型,并用實(shí)際算例驗(yàn)證模型的正確性和優(yōu)越性。
1988 年,Sch?lkoph 團(tuán)隊(duì)在主成分分析(Principal Component Analysis,PCA)的基礎(chǔ)上提出了核主成分分析法,它是由PCA 非線(xiàn)性擴(kuò)展而得的[17]。相比于PCA,KPCA 利用核函數(shù)將樣本數(shù)據(jù)映射到高維空間,在高維空間尋找其子空間進(jìn)行降維處理,主元提取精度更高,數(shù)據(jù)降維效果更好。
KPCA 原理如下[18]:設(shè)原始數(shù)據(jù)集為X={X1,X2,…,Xn},Xi∈Rm,i=1,2,…,n,其中,m為數(shù)據(jù)維數(shù),Rm表示輸入空間。為了消除數(shù)據(jù)集中不同量綱的影響,將原始數(shù)據(jù)歸一化得到新數(shù)據(jù)集x={x1,x2,…,xn},xi∈Rm,i=1,2,…,n,歸一化公式為:
式中:xj為歸一化后的數(shù)據(jù);Xj為某一特征向量的原始數(shù)據(jù);分別為特征向量的最大值和最小值。
通過(guò)映射函數(shù)將新數(shù)據(jù)集映射到高維空間,可以得到φ={φ(x1),φ(x2),…,φ(xn)},i=1,2,…,n,在高維空間φ的協(xié)方差矩陣為:
令核函數(shù)為K=φTφ=(ki,j)n×n,其中ki,j=φ(xi)Tφ(xi),利用核函數(shù)可將協(xié)方差的特征多項(xiàng)式進(jìn)行化簡(jiǎn),可得:
式中:α為維數(shù)為n的列向量。
計(jì)算各因子累計(jì)貢獻(xiàn)率c,對(duì)貢獻(xiàn)率較高的q個(gè)主元素進(jìn)行提取,即可確定主要影響因子,h的計(jì)算公式為:
通常,當(dāng)累計(jì)貢獻(xiàn)率c大于85%即滿(mǎn)足要求。利用式(4)確定主成分,對(duì)任意樣本x,對(duì)其特征值α及特征向量ui進(jìn)行高維映射即可得到重構(gòu)后的非線(xiàn)性樣本Fi為:
1.2.1 斑點(diǎn)鬣狗優(yōu)化算法
2018 年,印度學(xué)者Gaurav Dhiman 受斑點(diǎn)鬣狗群體捕食行為的啟發(fā)提出了斑點(diǎn)鬣狗優(yōu)化算法(Spotted Hyena Optimizer,SHO),斑點(diǎn)鬣狗種群的捕食過(guò)程包括搜索、包圍、狩獵和攻擊獵物[19]。SHO 原理如下:
1)包圍過(guò)程
斑點(diǎn)鬣狗能夠敏銳察覺(jué)到獵物的位置,并包圍獵物,該過(guò)程的數(shù)學(xué)表達(dá)式為:
式中:Dh為獵物與斑點(diǎn)鬣狗個(gè)體之間的距離;t為迭代次數(shù);Pp為獵物位置;P(t)為斑點(diǎn)鬣狗個(gè)體位置;B為搖擺因子;r1為均勻分布的隨機(jī)數(shù),r1∈[0,1]。
斑點(diǎn)鬣狗個(gè)體位置更新公式為:
式中:E為收斂因子;r2意義同r1;h為控制因子;NI為最大迭代次數(shù)。
2)狩獵過(guò)程
斑點(diǎn)鬣狗屬于群居動(dòng)物,通過(guò)相互信賴(lài)和交換信息確定獵物位置完成狩獵。該過(guò)程的數(shù)學(xué)表達(dá)式為:
式中:Ph為斑點(diǎn)鬣狗的第一個(gè)最佳位置;Pk為其他斑點(diǎn)鬣狗的位置;N為斑點(diǎn)鬣狗的數(shù)量;Ch為包含N個(gè)最優(yōu)解的集合。
其中N的表達(dá)式為:
式中:M為介于[0.5,1]中的一個(gè)隨機(jī)向量;Count表示計(jì)數(shù);nos定義了可行解的個(gè)數(shù),并對(duì)所有候選解進(jìn)行計(jì)算,加上M后,它與給定搜索空間中的最優(yōu)解非常相似。
3)攻擊獵物過(guò)程(局部搜索)
在狩獵完成后,斑點(diǎn)鬣狗開(kāi)始攻擊獵物,攻擊獵物的條件為收斂因子 ||E<1,該過(guò)程的數(shù)學(xué)表達(dá)式為:
式中:Ph(t+1)為保存的最優(yōu)解。
4)搜索過(guò)程(全局搜索)
斑點(diǎn)鬣狗根據(jù)最優(yōu)解集合Ch中的位置搜索獵物,當(dāng)收斂因子滿(mǎn)足 ||E>1時(shí),斑點(diǎn)鬣狗將遠(yuǎn)離當(dāng)前獵物的位置,并分散搜尋位置更好的獵物,這種機(jī)制有利于SHO 開(kāi)展全局搜索。
相比于其他優(yōu)化算法,SHO 參數(shù)少、操作簡(jiǎn)單、穩(wěn)定性好,具有較高的求解精度。但其尋優(yōu)能力是依靠B、E兩個(gè)隨機(jī)參數(shù)進(jìn)行調(diào)節(jié)的,在尋優(yōu)過(guò)程中,SHO 也會(huì)出現(xiàn)陷入局部最優(yōu)值、求解精度不夠等現(xiàn)象。
1.2.2 斑點(diǎn)鬣狗優(yōu)化算法改進(jìn)策略
1)收斂因子非線(xiàn)性調(diào)整
在SHO 進(jìn)行迭代計(jì)算時(shí),控制因子h采用線(xiàn)性遞減的調(diào)整策略,但實(shí)際上h的變化是非線(xiàn)性的,為了更好地體現(xiàn)算法的尋優(yōu)過(guò)程,本文引入非線(xiàn)性調(diào)整策略,具體為:
式中:e 為自然對(duì)數(shù),Q為衰減系數(shù),Q∈Z且Q∈[0,10],Q越大,h衰減越厲害。
通過(guò)改進(jìn),隨著迭代次數(shù)的增大,控制因子h實(shí)現(xiàn)了從5 到0 的非線(xiàn)性遞減。在算法迭代初期,h呈緩慢遞減的狀態(tài),相比于原控制因子,衰減性更好,有利于算法進(jìn)行全局搜索。在迭代后期,改進(jìn)后的h衰減加快,使種群向最優(yōu)解靠攏,便于算法展開(kāi)局部搜索,快速找到最優(yōu)解[20]。
2)萊維飛行策略
萊維飛行是一種非高斯隨機(jī)過(guò)程,其隨機(jī)性較強(qiáng),能夠解釋自然界的某些隨機(jī)現(xiàn)象。研究發(fā)現(xiàn),萊維飛行前期采用大步長(zhǎng),后期采用小步長(zhǎng),這種步長(zhǎng)調(diào)整方式不僅能夠增加種群多樣性,也有助于種群收斂于全局最優(yōu)解。因此,在尋優(yōu)算法中引入萊維飛行策略有利于增加種群多樣性和擴(kuò)大搜索范圍,加快算法收斂。
為了增強(qiáng)斑點(diǎn)鬣狗的優(yōu)化性能,在SHO 中引入萊維飛行策略,并作用于SHO 的隨機(jī)因子r1,r2,具體為:
式中:B為搖擺因子;E為收斂因子;Levy為萊維搜索路徑。
LSSVM 是一種用于解決非線(xiàn)性回歸問(wèn)題的機(jī)器學(xué)習(xí)方法[21],LSSVM 的特點(diǎn)是所需樣本少、回歸精度高,目前廣泛于解決非線(xiàn)性回歸問(wèn)題。其回歸原理及核函數(shù)選擇可參考文獻(xiàn)[22]。懲罰參數(shù)C和核函數(shù)參數(shù)σ是LSSVM 的兩個(gè)非常重要的參數(shù),它們對(duì)LSSVM 回歸擬合效果影響很大,為了獲得更好的擬合效果,需要對(duì)C和σ進(jìn)行尋優(yōu)。
接地網(wǎng)常年埋于地下,所處環(huán)境復(fù)雜,其腐蝕速率影響因素眾多且各因素之間具有一定的相關(guān)性,為了減少接地網(wǎng)腐蝕預(yù)測(cè)模型建模工作量,提高腐蝕速率預(yù)測(cè)精度,采用KPCA 對(duì)接地網(wǎng)腐蝕速率影響因素進(jìn)行處理,在高維空間對(duì)樣本數(shù)據(jù)進(jìn)行降維,消除空間相關(guān)性和冗余數(shù)據(jù),提取主要數(shù)據(jù)的非線(xiàn)性特征主元。利用收斂因子非線(xiàn)性調(diào)整及萊維飛行策略對(duì)SHO 進(jìn)行改進(jìn),提高SHO 的尋優(yōu)性能,并采用ISHO 對(duì)LSSVM 進(jìn)行參數(shù)優(yōu)化,建立基于KPCA-ISHO-LSSVM 的接地網(wǎng)腐蝕速率預(yù)測(cè)模型,建模過(guò)程如圖1 所示。
圖1 接地網(wǎng)腐蝕速率預(yù)測(cè)模型Fig.1 Prediction model of grounding grid corrosion rate
具體步驟如下:
1)獲取樣本數(shù)據(jù)。根據(jù)接地網(wǎng)腐蝕速率影響因素,對(duì)相關(guān)數(shù)據(jù)進(jìn)行收集。
2)歸一化處理。為了消除各影響因素不同量綱帶來(lái)的誤差,對(duì)樣本數(shù)據(jù)歸一化后得到數(shù)據(jù)集x1,x2,…,xn。
3)KPCA 降維。利用KPCA 對(duì)數(shù)據(jù)集x1,x2,…,xn進(jìn)行降維,獲得重構(gòu)后的指標(biāo)F1,F2,…,Fm。
4)ISHO 參數(shù)尋優(yōu)。利用ISHO 對(duì)LSSVM 懲罰參數(shù)C和核函數(shù)參數(shù)σ進(jìn)行優(yōu)化,獲取C和σ的最優(yōu)值,ISHO 的尋優(yōu)流程如圖2 所示。
圖2 ISHO尋優(yōu)流程圖Fig.2 Optimization process of ISHO
5)設(shè)置懲罰參數(shù)C和核函數(shù)參數(shù)σ的初始值及搜索范圍,并設(shè)置斑點(diǎn)鬣狗的種群規(guī)模、最大迭代次數(shù)及迭代終止誤差,將參數(shù)h,B,E和斑點(diǎn)鬣狗種群位置初始化。
6)設(shè)置訓(xùn)練集的均方根誤差為適應(yīng)度函數(shù),計(jì)算斑點(diǎn)鬣狗種群中的個(gè)體適應(yīng)度值。
7)計(jì)算當(dāng)前斑點(diǎn)鬣狗最佳位置,并檢查是否有超出給定搜索空間邊界的斑點(diǎn)鬣狗個(gè)體,若有則進(jìn)行調(diào)整。
8)計(jì)算位置更新后的斑點(diǎn)鬣狗個(gè)體適應(yīng)度值,并與上一代適應(yīng)度值進(jìn)行比較,保留斑點(diǎn)鬣狗最佳位置。
9)更新斑點(diǎn)鬣狗的群組直到搜索到個(gè)體最優(yōu)的適應(yīng)度值下的斑點(diǎn)鬣狗位置。
10)若算法達(dá)到終止條件,則輸出最佳斑鬣狗位置,即C和σ的最優(yōu)解;否則重復(fù)步驟5)-步驟9)。
11)將C和σ的最優(yōu)解賦給LSSVM,利用LSSVM 對(duì)接地網(wǎng)腐蝕速率進(jìn)行預(yù)測(cè)。
預(yù)測(cè)完成后,需對(duì)預(yù)測(cè)模型進(jìn)行評(píng)價(jià),本文采用平均相對(duì)誤差、均方根誤差、全局最大相對(duì)誤差和決定系數(shù)對(duì)模型的預(yù)測(cè)效果進(jìn)行綜合評(píng)價(jià)[23],計(jì)算公式分別為:
式中:N為測(cè)試集樣本容量;yi為腐蝕速率實(shí)際值;yi*為腐蝕速率預(yù)測(cè)值;為腐蝕速率平均值。
對(duì)海南省境內(nèi)32 座變電站開(kāi)展接地網(wǎng)腐蝕試驗(yàn),共獲得32 組試驗(yàn)數(shù)據(jù)[24],部分原始數(shù)據(jù)如表1所示。
表1 腐蝕實(shí)驗(yàn)數(shù)據(jù)Table 1 Data of corrosion test
選擇泛化性能更好的徑向基核函數(shù)作為KPCA的核函數(shù),對(duì)32 組腐蝕試驗(yàn)數(shù)據(jù)進(jìn)行KPCA 計(jì)算,計(jì)算結(jié)果如圖3 所示。
圖3 KPCA計(jì)算結(jié)果Fig.3 Calculation results of KPCA
由圖3 可知,pH 值x1、氯離子含量x2和含水量x33 個(gè)主成分的累計(jì)貢獻(xiàn)率為85.8%,滿(mǎn)足超過(guò)85%的要求,因此選擇前3 個(gè)主成分進(jìn)行指標(biāo)重構(gòu),其表達(dá)式為:
利用式(23)確定32 組重構(gòu)指標(biāo)后,將32 組重構(gòu)指標(biāo)數(shù)據(jù)分為2 組,前27 組為訓(xùn)練集,用于模型的訓(xùn)練,后5 組為測(cè)試集,用于檢驗(yàn)?zāi)P偷念A(yù)測(cè)精度。利用訓(xùn)練集進(jìn)行訓(xùn)練,將訓(xùn)練集樣本的均方根誤差作為優(yōu)化目標(biāo)的適應(yīng)度函數(shù),采用改進(jìn)鬣狗算法對(duì)LSSVM 的C和σ進(jìn)行優(yōu)化,C和σ的初始值分別設(shè)置為100 和1,搜索范圍均為[0,1000],ISHO相關(guān)參數(shù)設(shè)置見(jiàn)文獻(xiàn)[25],設(shè)置最大迭代次數(shù)為300。ISHO 迭代曲線(xiàn)如圖4 所示。由圖4 可知,ISHO 經(jīng)過(guò)52 次迭代后,達(dá)到最小適應(yīng)度值,此時(shí)對(duì)應(yīng)的最優(yōu)解C和σ分別為63.26 和2.64。
圖4 ISHO迭代曲線(xiàn)Fig.4 Iterative curve of ISHO
為了對(duì)比ISHO 的優(yōu)化效果,采用粒子群算法(Particle Swarm Optimization,PSO)和SHO 分別對(duì)C和σ進(jìn)行優(yōu)化,最大迭代次數(shù)均設(shè)置為300,3 種優(yōu)化算法的計(jì)算結(jié)果如表2 所示。
表2 優(yōu)化算法對(duì)比Table 2 Comparison of optimization algorithms
從表3 可以看出,ISHO 在迭代次數(shù)、最優(yōu)值和收斂時(shí)間方面均優(yōu)于SHO 和PSO,可見(jiàn)本文提出的斑點(diǎn)鬣狗算法的改進(jìn)策略是成功的,ISHO 能夠有效減少迭代次數(shù),加快算法收斂。
將ISHO 尋找的最優(yōu)值C=63.26、σ=2.64 賦給LSSVM,對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖5所示。為了驗(yàn)證ISHO-LSSVM 模型的優(yōu)越性,采用相同的試驗(yàn)數(shù)據(jù)分別建立RBF、GA-BP 和SHOLSSVM 接地網(wǎng)腐蝕預(yù)測(cè)模型,圖5 同時(shí)給出了3 種模型對(duì)測(cè)試集數(shù)據(jù)的預(yù)測(cè)結(jié)果。從圖5 可以看出,ISHO-LSSVM 模型的預(yù)測(cè)結(jié)果更接近實(shí)際值。
圖5 4種模型預(yù)測(cè)結(jié)果Fig.5 Prediction results of four models
表3 給出了4 種預(yù)測(cè)模型對(duì)訓(xùn)練集和測(cè)試集預(yù)測(cè)結(jié)果的各類(lèi)預(yù)測(cè)誤差及模型的決定系數(shù),對(duì)于訓(xùn)練集數(shù)據(jù),相比于其他模型,ISHO-LSSVM 模型的誤差更小,決定系數(shù)更大,訓(xùn)練效果更好。對(duì)于測(cè)試集數(shù)據(jù),ISHO-LSSVM 模型的平均相對(duì)誤差、均方根誤差和全局最大相對(duì)誤差均小于其他3 種預(yù)測(cè)模型,其中,平均相對(duì)誤差為2.79%,較SHOLSSVM 模型減小49.8%,可見(jiàn)模型預(yù)測(cè)精度較高;均方根誤差和全局最大相對(duì)誤差分別為0.139 和3.53%,較SHO-LSSVM 模型分別減小45.3%和60.9%,可見(jiàn)模型預(yù)測(cè)時(shí)的波動(dòng)性較??;從決定系數(shù)上看,ISHO-LSSVM 模型的決定系數(shù)為0.995,大于其他3 種模型,可見(jiàn)模型的擬合效果較好。綜上所述,本文提出的基于KPCA-ISHO-LSSVM 的接地網(wǎng)腐蝕速率預(yù)測(cè)方法能夠進(jìn)一步提升腐蝕速率預(yù)測(cè)精度。
表3 預(yù)測(cè)誤差及決定系數(shù)Table 3 Prediction error and determination coefficient
本文采用KPCA 在高維空間對(duì)接地網(wǎng)腐蝕樣本數(shù)據(jù)進(jìn)行降維處理,消除了樣本數(shù)據(jù)之間的空間相關(guān)性和冗余數(shù)據(jù),簡(jiǎn)化了接地網(wǎng)腐蝕預(yù)測(cè)模型的建模過(guò)程。同時(shí)利用收斂因子非線(xiàn)性調(diào)整及萊維飛行策略對(duì)斑點(diǎn)鬣狗算法進(jìn)行改進(jìn),建立了基于KPCA-ISHO-LSSVM 的接地網(wǎng)腐蝕速率預(yù)測(cè)模型,仿真結(jié)果表明:(1)ISHO 能夠有效減少迭代次數(shù),加快算法收斂;(2)該模型預(yù)測(cè)效果較好,能夠進(jìn)一步提升接地網(wǎng)腐蝕速率預(yù)測(cè)精度。