趙冬梅,謝家康,王 闖,王浩翔,姜 威,王 怡
基于Bagging集成學(xué)習(xí)的電力系統(tǒng)暫態(tài)穩(wěn)定在線評(píng)估
趙冬梅1,謝家康1,王 闖1,王浩翔1,姜 威2,王 怡1
(1.華北電力大學(xué)電氣與電子工程學(xué)院,北京 102206;2.中國(guó)華能北方魏家峁煤電有限責(zé)任公司,內(nèi)蒙古 鄂爾多斯 010308)
針對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)在處理暫態(tài)穩(wěn)定評(píng)估時(shí)所表現(xiàn)出的穩(wěn)定性差、精度低等問(wèn)題以及離線訓(xùn)練的局限性,提出一種基于多模型融合Bagging集成學(xué)習(xí)方式的電力系統(tǒng)暫態(tài)穩(wěn)定在線評(píng)估模型。首先,結(jié)合人工智能前沿理論研究,分析了暫態(tài)穩(wěn)定評(píng)估中常用的7種機(jī)器學(xué)習(xí)算法的原理及實(shí)現(xiàn)方式,通過(guò)Bagging方法進(jìn)行集成,充分發(fā)揮各個(gè)模型的優(yōu)勢(shì)。其次,給出Bagging集成的數(shù)學(xué)實(shí)現(xiàn)方法并進(jìn)行了仿真實(shí)驗(yàn)。當(dāng)原系統(tǒng)拓?fù)浣Y(jié)構(gòu)發(fā)生改變時(shí),采用Boosting算法和遷移成分分析,分別對(duì)原電網(wǎng)歷史數(shù)據(jù)進(jìn)行樣本遷移和特征遷移,完成對(duì)所提模型的在線更新。通過(guò)采用IEEE10機(jī)39節(jié)點(diǎn)系統(tǒng)和IEEE16機(jī)68節(jié)點(diǎn)系統(tǒng)進(jìn)行分析,結(jié)果表明所提方法比傳統(tǒng)機(jī)器學(xué)習(xí)模型精度更高。當(dāng)數(shù)據(jù)中摻雜噪聲時(shí)能夠保持穩(wěn)定運(yùn)行,在系統(tǒng)拓?fù)涓淖儠r(shí)能夠通過(guò)遷移歷史數(shù)據(jù)進(jìn)行準(zhǔn)確的暫態(tài)穩(wěn)定評(píng)估。
Bagging集成學(xué)習(xí);電力系統(tǒng);機(jī)器學(xué)習(xí);暫態(tài)穩(wěn)定;遷移學(xué)習(xí);在線更新
電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估(Transient Stability Assessment, TSA)是保障電力系統(tǒng)安全性和提升電力系統(tǒng)經(jīng)濟(jì)性的重要手段[1-3]。隨著電網(wǎng)規(guī)模逐漸增大以及電網(wǎng)結(jié)構(gòu)日漸復(fù)雜,電力系統(tǒng)運(yùn)行工況更加接近穩(wěn)定極限,如何進(jìn)行電力系統(tǒng)的TSA,將成為電網(wǎng)設(shè)計(jì)人員在設(shè)計(jì)電網(wǎng)結(jié)構(gòu)時(shí)所要考慮的重要內(nèi)容。
由于電網(wǎng)中廣域測(cè)量系統(tǒng)(Wide Area Measurement System, WAMS)和電源管理單元 (Power Management Unit, PMU)的不斷普及,電力系統(tǒng)已經(jīng)擁有了獲取大量實(shí)時(shí)運(yùn)行時(shí)的電力數(shù)據(jù)的能力[4-5]。隨著新能源不斷并網(wǎng),系統(tǒng)規(guī)模越來(lái)越復(fù)雜,當(dāng)前電力系統(tǒng)的新發(fā)展對(duì)TSA提出了更高要求,傳統(tǒng)方法(如時(shí)域仿真法)在適用范圍、評(píng)估及預(yù)測(cè)的速度等方面面臨嚴(yán)峻挑戰(zhàn)。機(jī)器學(xué)習(xí)的發(fā)展為二者的突破提供了新的可能,基于機(jī)器學(xué)習(xí)的TSA方法成為電力系統(tǒng)研究領(lǐng)域的前沿課題[6]。
與傳統(tǒng)的TSA方法相比,機(jī)器學(xué)習(xí)方法從模式識(shí)別的角度出發(fā),通過(guò)自主訓(xùn)練模型建立電力系統(tǒng)物理量與評(píng)估結(jié)果之間的映射關(guān)系,然后用訓(xùn)練好的模型對(duì)系統(tǒng)中新產(chǎn)生的樣本進(jìn)行分析[7]。近年來(lái),國(guó)內(nèi)外已經(jīng)有眾多學(xué)者對(duì)基于機(jī)器學(xué)習(xí)的電力系統(tǒng)TSA進(jìn)行了分析與改進(jìn)。如文獻(xiàn)[8]基于支持向量機(jī)(Support Vector Machine, SVM)的TSA模型、文獻(xiàn)[9]的基于隨機(jī)森林(Random Forests, RF)、K值近鄰(K Nearest Neighbor, KNN)的TSA模型、文獻(xiàn)[10-11]建立的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)的TSA模型、梯度提升決策樹(shù)(Gradient Boosting Decision Tree, GBDT)、邏輯回歸(Logistic Regression, LR)、自適應(yīng)提升算法(Adaptive boosting machine, Adaboost)等。
但這些訓(xùn)練模型大部分是淺層學(xué)習(xí),對(duì)數(shù)據(jù)挖掘的能力有限,處理大型數(shù)據(jù)時(shí)的精度不高,除淺層學(xué)習(xí)之外,機(jī)器學(xué)習(xí)還有一個(gè)分支領(lǐng)域——深度學(xué)習(xí)[12],它強(qiáng)調(diào)從連續(xù)的層中進(jìn)行學(xué)習(xí),逐次改善模型的深度,以達(dá)到更好的預(yù)期效果。常見(jiàn)算法如卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network, CNN)[13]、堆疊變分自動(dòng)編碼器(Sparse Stacked Auto Encoder, SSAE)、長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short Term Memory network, LSTM)等。如文獻(xiàn)[14]提出的基于卷積神經(jīng)網(wǎng)絡(luò)的TSA模型,文獻(xiàn)[15]利用堆疊變分自動(dòng)編碼器進(jìn)行電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估,由于單一模型的預(yù)測(cè)結(jié)果存在偏好,不同學(xué)習(xí)器的預(yù)測(cè)結(jié)果存在差異,所以單一模型訓(xùn)練出的分類器存在一定的局限性。并且電網(wǎng)實(shí)時(shí)信息在傳輸時(shí)會(huì)產(chǎn)生噪聲,而單一模型的抗噪能力較弱,無(wú)法與深度學(xué)習(xí)算法相比較。故使用多模型的集成算法在近年來(lái)被廣泛研究,如文獻(xiàn)[16]建立的基于集成LSTM的TSA模型。文獻(xiàn)[17]基于在線Boosting集成連續(xù)極限學(xué)習(xí)機(jī)(Ensemble Online Sequential-extreme Learning Machine, EOS-ELM)的TSA模型。雖然以Boosting算法為代表的集成學(xué)習(xí)模型在TSA中取得了良好的應(yīng)用效果,但其單一算法Boosting集成的局限性依然存在,且單個(gè)深度學(xué)習(xí)模型的訓(xùn)練時(shí)間較長(zhǎng),多次訓(xùn)練Boosting集成將會(huì)降低TSA速度,使得模型效率降低。本文提出了一種對(duì)多種機(jī)器學(xué)習(xí)算法進(jìn)行二次學(xué)習(xí)的Bagging集成學(xué)習(xí)算法,經(jīng)過(guò)驗(yàn)證,基于多學(xué)習(xí)器融合方法的Bagging集成不僅能夠適應(yīng)大型系統(tǒng)的暫態(tài)穩(wěn)定訓(xùn)練,具有良好的抗噪性,而且與傳統(tǒng)深度學(xué)習(xí)方法相比,其精度、準(zhǔn)確度更高,模型性能更好。
由于電力系統(tǒng)是一個(gè)動(dòng)態(tài)時(shí)變的系統(tǒng),僅作為離線訓(xùn)練評(píng)估暫態(tài)穩(wěn)定結(jié)果還遠(yuǎn)遠(yuǎn)不夠,國(guó)內(nèi)外有不少學(xué)者對(duì)已有模型的在線更新方法進(jìn)行了研究,如文獻(xiàn)[17]利用Boosting算法原理對(duì)TSA模型進(jìn)行特征遷移,但在特征維度較大時(shí),這種利用弱分類器自主訓(xùn)練的貪婪算法會(huì)導(dǎo)致模型遷移時(shí)間過(guò)長(zhǎng)。本文針對(duì)遷移學(xué)習(xí)的兩大主流思想,提出基于特征遷移的遷移成分分析(Transfer Component Analysis, TCA)算法和基于樣本遷移的Boosting遷移算法,通過(guò)兩種不同的角度對(duì)所提模型進(jìn)行遷移,并通過(guò)IEEE10機(jī)39節(jié)點(diǎn)及IEEE16機(jī)68節(jié)點(diǎn)系統(tǒng)的仿真算例驗(yàn)證了所提方法的有效性。
1.1.1支持向量機(jī)
支持向量機(jī)是通過(guò)使數(shù)據(jù)符合某種未知但固定的分布時(shí),使得分類器的真實(shí)輸出與理想輸出的誤差盡可能小的算法。通過(guò)最大間隔法從特征空間內(nèi)找到最優(yōu)高維平面來(lái)解決分類或優(yōu)化問(wèn)題。適用于高維大型數(shù)據(jù)集。
要求同時(shí)滿足:
1.1.2人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)[18]是一種利用誤差函數(shù)反向傳播方式進(jìn)行學(xué)習(xí)的監(jiān)督式機(jī)器學(xué)習(xí)算法。
目標(biāo)函數(shù)使得輸入標(biāo)簽和輸出結(jié)果盡可能相似,可以采用歐式距離損失函數(shù)作為目標(biāo)函數(shù)進(jìn)行尋優(yōu),其表達(dá)式為
1.1.3隨機(jī)森林與梯度提升決策樹(shù)
隨機(jī)森林算法[19]是由多個(gè)決策樹(shù)集成而來(lái)的一種新興學(xué)習(xí)算法,依靠決策樹(shù)的投票來(lái)決定最后的分類結(jié)果,近年來(lái)在各個(gè)領(lǐng)域都得到了廣泛的應(yīng)用。
梯度提升決策樹(shù)也是一種基于決策樹(shù)的算法,由多個(gè)DT算法組成,樹(shù)的結(jié)論累加得到最終答案。與隨機(jī)森林算法類似,這里不再贅述。
1.1.4 K值近鄰法
K值近鄰采用多個(gè)維樹(shù)(K-dimensional Tree, KD Tree)的方法求取輸入樣本的方差,找到劃分的特征點(diǎn)后,將超平面分為多個(gè)部分,不同部分對(duì)應(yīng)不同標(biāo)簽所對(duì)應(yīng)的類別,從而達(dá)到訓(xùn)練分類的目的。
K值近鄰法判別樣本的權(quán)重公式為
1.1.5 Logistic回歸
Logistic算法是引入概率論中極大似然估計(jì)的方法,求得類似神經(jīng)網(wǎng)絡(luò)中的權(quán)值和偏移量參數(shù),進(jìn)而達(dá)到訓(xùn)練分類的目的。
1.1.6 Adaboost算法
4) 計(jì)算預(yù)測(cè)錯(cuò)誤率。
6) 更新權(quán)重系數(shù)。
7) 迭代完成后輸出預(yù)測(cè)結(jié)果。
在機(jī)器學(xué)習(xí)的有監(jiān)督學(xué)習(xí)算法中,其目的是訓(xùn)練出一個(gè)穩(wěn)定且在各個(gè)方面都表現(xiàn)較好的模型,但實(shí)際情況往往并不理想,有時(shí)只能得到一些有偏好的模型,這些模型在某些方面表現(xiàn)得比較好,屬于弱監(jiān)督模型。本文提出的集成學(xué)習(xí)模型通過(guò)組合這些已有的弱監(jiān)督模型得到一個(gè)性能更好、更全面的強(qiáng)監(jiān)督模型。這樣,即使某一個(gè)弱分類器在測(cè)試自己所不擅長(zhǎng)的數(shù)據(jù)集時(shí)發(fā)生錯(cuò)誤,其他弱分類器也能夠及時(shí)將錯(cuò)誤糾正過(guò)來(lái)。
集成學(xué)習(xí)[20]是將幾種機(jī)器學(xué)習(xí)技術(shù)組合成一個(gè)預(yù)測(cè)模型的元算法,以減小各個(gè)模型的方差、偏差,或改進(jìn)預(yù)測(cè)的效果。其總體結(jié)構(gòu):先通過(guò)訓(xùn)練多個(gè)基學(xué)習(xí)器,再用某種策略將這些基學(xué)習(xí)器結(jié)合。集成學(xué)習(xí)通過(guò)集成多個(gè)基學(xué)習(xí)器,取長(zhǎng)補(bǔ)短,可獲得比單一學(xué)習(xí)器更加優(yōu)越的性能。
由基學(xué)習(xí)器[21]的生成方式,集成學(xué)習(xí)可分為兩類:一類是以Boosting為代表的,各基學(xué)習(xí)器間存在依賴關(guān)系,必須串行生成的集成學(xué)習(xí)算法;另一類是以Bagging為代表的,各學(xué)習(xí)器間不存在依賴關(guān)系,可以并行生成的集成學(xué)習(xí)算法,如圖1所示。
圖1 Bagging集成學(xué)習(xí)結(jié)構(gòu)
Bagging算法[22]是并行集成學(xué)習(xí)的經(jīng)典算法。為了使集成的基學(xué)習(xí)器盡可能獨(dú)立。Bagging算法可以通過(guò)自助采樣法隨機(jī)從輸入的數(shù)據(jù)集中摘出多個(gè)訓(xùn)練子集,然后根據(jù)訓(xùn)練子集訓(xùn)練出多個(gè)基學(xué)習(xí)器,最后將基學(xué)習(xí)器結(jié)合,形成一個(gè)整體。
但是,自助采樣法主要是針對(duì)數(shù)據(jù)集較小的情況,當(dāng)數(shù)據(jù)量較大時(shí),采用自助采樣法反而會(huì)造成因數(shù)據(jù)量缺失而導(dǎo)致的學(xué)習(xí)器精度下降。所以,本文采用遍歷方法,將原始數(shù)據(jù)分別導(dǎo)入7個(gè)訓(xùn)練器中進(jìn)行訓(xùn)練,最終通過(guò)集成方法得到總分類器。
對(duì)于不同的集成學(xué)習(xí)而言,集成方法可以有很多。例如:可以將不同學(xué)習(xí)器得到的函數(shù)值求平均得到最終結(jié)果,也可以通過(guò)加權(quán)平均求得。本文通過(guò)不同模型的訓(xùn)練,得到不同模型樣本數(shù)據(jù)集的預(yù)測(cè)值,根據(jù)這些預(yù)測(cè)值與訓(xùn)練數(shù)據(jù)的標(biāo)簽,代入新的機(jī)器學(xué)習(xí)模型中進(jìn)行二次訓(xùn)練,最后用測(cè)試集對(duì)其進(jìn)行檢驗(yàn)。這就是本文對(duì)多分類器結(jié)果進(jìn)行集成的思路。集成學(xué)習(xí)訓(xùn)練流程部分的偽代碼如下。
輸出:Bagging集成學(xué)習(xí)模型
步驟2:對(duì)第一層7個(gè)基學(xué)習(xí)器進(jìn)行訓(xùn)練
end
步驟3:構(gòu)建新數(shù)據(jù)集
步驟5:將測(cè)試集導(dǎo)入模型得出預(yù)測(cè)結(jié)果
隨著智能電網(wǎng)的發(fā)展,電力系統(tǒng)所需要記錄的數(shù)據(jù)規(guī)模越來(lái)越大,系統(tǒng)特征越來(lái)越多。但是這些數(shù)據(jù)的利用率并不高,其主要原因在于電力系統(tǒng)是一個(gè)時(shí)變性系統(tǒng),其時(shí)變性體現(xiàn)在數(shù)據(jù)時(shí)變、系統(tǒng)結(jié)構(gòu)時(shí)變等多個(gè)方面。隨著深度學(xué)習(xí)的不斷發(fā)展,如何利用好歷史數(shù)據(jù)是提高暫態(tài)穩(wěn)定評(píng)估效率的一個(gè)重要問(wèn)題。
遷移學(xué)習(xí)在人工智能和機(jī)器學(xué)習(xí)中是指一種學(xué)習(xí)的思想和模式。機(jī)器學(xué)習(xí)解決的問(wèn)題是讓機(jī)器能夠自主的從數(shù)據(jù)中獲取知識(shí),通過(guò)輸入數(shù)據(jù)和結(jié)果得到數(shù)據(jù)與結(jié)果之間的映射關(guān)系。而遷移學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)重要分支,側(cè)重于將已經(jīng)學(xué)習(xí)過(guò)的知識(shí)遷移應(yīng)用到新的問(wèn)題當(dāng)中。其核心問(wèn)題在于找到新問(wèn)題和原問(wèn)題之間的相似性,才可以順利實(shí)現(xiàn)知識(shí)的遷移。那么,如何衡量源域和目標(biāo)域中相應(yīng)數(shù)據(jù)的相似性便成了解決該問(wèn)題的重要一步。
遷移學(xué)習(xí)的基本方法包括樣本遷移、特征遷移、模型遷移以及關(guān)系遷移。
本文就遷移學(xué)習(xí)中比較前沿的兩種方法進(jìn)行了實(shí)驗(yàn)。第一種是基于樣本的遷移學(xué)習(xí)方法,根據(jù)一定的權(quán)重生成規(guī)則,對(duì)數(shù)據(jù)樣本進(jìn)行重復(fù)使用來(lái)進(jìn)行遷移學(xué)習(xí),如TrAdaboost方法[23]。第二種是基于特征的遷移方法,是指通過(guò)特征變換的方式互相遷移,來(lái)減少源域與目標(biāo)域之間的差距,如文獻(xiàn)[24]所提出的遷移成分分析。
Boosting遷移算法[25]假設(shè)源域與目標(biāo)域的數(shù)據(jù)使用同樣的特征與標(biāo)簽,但是兩個(gè)領(lǐng)域上的數(shù)據(jù)分布不同。這樣使得一些源領(lǐng)域數(shù)據(jù)對(duì)目標(biāo)領(lǐng)域的影響也不同。如TrAdaBoost算法正是在AdaBoost算法的基礎(chǔ)上,對(duì)源域的特征進(jìn)行加權(quán)、迭代,每一次加權(quán)訓(xùn)練一個(gè)分類器,通過(guò)該分類器的性能好壞決定權(quán)重的更新策略,其算法流程如圖2所示。
圖2 TrAdaBoost算法結(jié)構(gòu)圖
遷移成分分析算法作為一種邊緣分布自適應(yīng)算法,其目標(biāo)在于減小源域和目標(biāo)域邊緣概率分布的距離,從而達(dá)成遷移學(xué)習(xí)的目的,屬于特征遷移方法。通過(guò)設(shè)定一個(gè)距離函數(shù)作為目標(biāo)值,并建立以該函數(shù)為目標(biāo)函數(shù)的優(yōu)化模型,進(jìn)而提取源域和目標(biāo)域之間相關(guān)度最高的特征。
而邊緣分布自適應(yīng)是利用源域與目標(biāo)域邊緣概率分布之間的距離來(lái)近似兩個(gè)領(lǐng)域之間的差異,即
TCA通過(guò)構(gòu)造最大均值差異(Maximum Mean Discrepancy, MMD)來(lái)衡量?jī)蓚€(gè)分布之間的相似程度。
電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估是一類典型的非平衡分類[26],對(duì)于失穩(wěn)的漏判或誤判顯然要比保持穩(wěn)定的誤判帶來(lái)的危害要大得多,采用單一的準(zhǔn)確率標(biāo)準(zhǔn)評(píng)價(jià)模型性能不夠客觀,因此引入故障率指標(biāo)綜合評(píng)價(jià)TSA模型的評(píng)估性能。其中,暫態(tài)穩(wěn)定評(píng)估的混淆矩陣如表1所示,TP、FN為穩(wěn)定樣本被正確或錯(cuò)誤評(píng)估的數(shù)量,F(xiàn)P、TN為失穩(wěn)樣本被正確或錯(cuò)誤評(píng)估的數(shù)目。
表1 混淆矩陣
根據(jù)混淆矩陣,可以采用以下4個(gè)指標(biāo)來(lái)綜合評(píng)估模型分類的性能。
第1個(gè)指標(biāo)是準(zhǔn)確率,代表分類器對(duì)測(cè)試樣本分類的總體情況,表達(dá)式為
第2個(gè)指標(biāo)是穩(wěn)定樣本查全率,指所有真實(shí)標(biāo)簽為穩(wěn)定的樣本中預(yù)測(cè)正確的比例,主要反映該分類器處理TSA問(wèn)題時(shí)的安全性,表達(dá)式為
第3個(gè)指標(biāo)是失穩(wěn)樣本查全率,指所有真實(shí)標(biāo)簽為失穩(wěn)的樣本中預(yù)測(cè)正確的比例,主要反映該分類器處理TSA問(wèn)題時(shí)的可靠性,表達(dá)式為
第4個(gè)指標(biāo)是上述兩個(gè)查全率的幾何平均數(shù),其表達(dá)式為
時(shí)域仿真法通過(guò)計(jì)算電力系統(tǒng)各電氣量進(jìn)行暫態(tài)穩(wěn)定評(píng)估,穩(wěn)定與否根據(jù)暫態(tài)穩(wěn)定指數(shù)(Transient Stability Index, TSI)進(jìn)行判斷。
本文選取樣本故障前某一時(shí)刻、故障發(fā)生時(shí)刻以及故障切除時(shí)刻的數(shù)據(jù),一共39條母線,取46條輸電線路電壓在故障前、故障中、故障后的電壓數(shù)值和相角大小以及各線路潮流有功、無(wú)功功率大小作為輸入特征,輸入數(shù)據(jù)的維度為448維。集成學(xué)習(xí)與遷移學(xué)習(xí)算法均在開(kāi)源機(jī)器學(xué)習(xí)庫(kù)scikit-learn環(huán)境下進(jìn)行,卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法在Tensorflow環(huán)境下進(jìn)行,編程語(yǔ)言為python,PC配置為Intel(R) Core(TM) i7-10875H CPU/16GB RAM。在集成學(xué)習(xí)模型中共使用了7種機(jī)器學(xué)習(xí)算法,分別為:支持向量機(jī)SVM,高斯核函數(shù);K值近鄰法KNN,近鄰個(gè)數(shù)取10;人工神經(jīng)網(wǎng)絡(luò)ANN,取層數(shù)分別為80、10的兩個(gè)隱藏層;隨機(jī)森林RF,森林決策樹(shù)數(shù)為10,尋找最佳分割時(shí)需要考慮的特征數(shù)目為3;梯度提升決策樹(shù)GBDT,需要使用到的決策樹(shù)的個(gè)數(shù)為100;Logistic算法正則化系數(shù)取0.01;Adaboost算法采用DT決策樹(shù)集成,決策樹(shù)個(gè)數(shù)為100。
為了得到最有效的集成方法,將7種集成學(xué)習(xí)算法得到的預(yù)測(cè)值作為訓(xùn)練集,得到6 530組7維特征的一組樣本訓(xùn)練集。遍歷7種算法以及以均值集成的8種模型,其中均值集成模型在表中用Mean表示,對(duì)其進(jìn)行訓(xùn)練后,測(cè)試得到以8種方法進(jìn)行集成的模型評(píng)估指標(biāo),如表2所示。
表2 不同集成方法的模型性能對(duì)比
從表2中可以發(fā)現(xiàn),采取RF算法時(shí)性能最優(yōu)。
對(duì)各種機(jī)器學(xué)習(xí)算法分別進(jìn)行仿真,各模型的性能評(píng)估見(jiàn)圖3。其中,用Ensemble代表利用RF集成多種學(xué)習(xí)器后,對(duì)同一測(cè)試集進(jìn)行測(cè)試后的評(píng)價(jià)指標(biāo)的值。
圖3 各模型性能評(píng)估
從圖3可以看出,RF集成學(xué)習(xí)模型的準(zhǔn)確率Ac和安全性參數(shù)TSR均為最高,分別為98.74%,99.05%,其輸出的混淆矩陣如圖4所示。
圖4 RF集成學(xué)習(xí)測(cè)試輸出的混淆矩陣
在TSA中,安全性TSR參數(shù)的重要程度顯然要高于可靠性TUR參數(shù)。所以,集成學(xué)習(xí)模型所表現(xiàn)出的性能明顯高于未集成之前的各分類器模型。
本文將所提出的集成學(xué)習(xí)算法與深度學(xué)習(xí)算法CNN、SSAE進(jìn)行比較,其中,CNN采用3個(gè)一維卷積層。卷積神經(jīng)元個(gè)數(shù)為32、64、64,卷積核大小為6,訓(xùn)練周期為60,SSAE共兩層,每層的隱含層數(shù)目為400、200,L1正則化系數(shù)為0.005、0.005,稀疏參數(shù)分別為0.15、0.05,訓(xùn)練周期為200??刂茰y(cè)試集和訓(xùn)練集的輸入一致,分析了二者性能,如圖5所示。
圖5 集成學(xué)習(xí)與深度學(xué)習(xí)的性能對(duì)比
從圖3、圖5中可以看出,所提集成學(xué)習(xí)算法無(wú)論是在準(zhǔn)確度還是安全性方面都優(yōu)于深度學(xué)習(xí)算法。
表3將所提模型與深度學(xué)習(xí)模型CNN和SSAE的訓(xùn)練速度進(jìn)行了對(duì)比。經(jīng)過(guò)比較后發(fā)現(xiàn),所提模型的訓(xùn)練速度更優(yōu),但預(yù)測(cè)單個(gè)樣本時(shí)長(zhǎng)稍長(zhǎng)。
表3 模型用時(shí)對(duì)比
實(shí)際系統(tǒng)運(yùn)行過(guò)程中,數(shù)據(jù)在測(cè)量以及傳輸途中可能會(huì)產(chǎn)生誤差,為了更好地模擬實(shí)際情況,本文通過(guò)向數(shù)據(jù)中添加符合高斯分布的噪聲,具體添加方式如式(23)所示。
圖6分別給出了集成學(xué)習(xí)模型以及參與集成的各分類器,在噪聲環(huán)境下的準(zhǔn)確率以及安全性參數(shù)值,其中RF、KNN算法在面對(duì)噪聲時(shí)的性能較低,為清晰地顯示集成學(xué)習(xí)算法的準(zhǔn)確性,將圖像適當(dāng)縱向放大。
圖6 模型抗干擾評(píng)估
從圖6可以看出,集成學(xué)習(xí)對(duì)噪音的抗干擾能力更強(qiáng),模型預(yù)測(cè)的準(zhǔn)確性始終維持在98.4%以上,并且隨著噪音的增大,兩者性能之間的差別也逐漸增大。除了圖中所出現(xiàn)的機(jī)器學(xué)習(xí)方法外,其余方法在噪音的干擾下精確度出現(xiàn)了較大程度的下降,尤其是KNN算法和RF算法的準(zhǔn)確率分別下降為89.8%和95.2%。
表4給出了在考慮噪音時(shí)不同算法的抗干擾能力,可以看到通過(guò)本文所提方法集成之后各類算法的準(zhǔn)確度都得到了明顯的提高,當(dāng)噪音較大時(shí),Bagging集成學(xué)習(xí)和其他算法的差異也更加明顯。
表4 含噪聲時(shí)的模型性能對(duì)比
當(dāng)系統(tǒng)母線9發(fā)生故障需要切除時(shí),系統(tǒng)變更為38節(jié)點(diǎn)系統(tǒng),并且線路數(shù)減少2條。IEEE10機(jī)39節(jié)點(diǎn)系統(tǒng)去掉第9條母線,與之相連的線路也一同缺失,38節(jié)點(diǎn)系統(tǒng)的拓?fù)浣Y(jié)構(gòu)如圖7所示。新產(chǎn)生的數(shù)據(jù)與原先的數(shù)據(jù)維度不符,原有分類器不能對(duì)新拓?fù)浣Y(jié)構(gòu)下的系統(tǒng)進(jìn)行暫態(tài)穩(wěn)定評(píng)估。并且當(dāng)系統(tǒng)拓?fù)浣Y(jié)構(gòu)發(fā)生改變后,沒(méi)有足夠的離線數(shù)據(jù)供分類器進(jìn)行訓(xùn)練。因此需要充分挖掘原有39節(jié)點(diǎn)的數(shù)據(jù)來(lái)進(jìn)行學(xué)習(xí),才能滿足在線更新的需求。
圖7 IEEE10機(jī)38節(jié)點(diǎn)系統(tǒng)拓?fù)浣Y(jié)構(gòu)
4.4.1基于Boosting集成的樣本遷移
通過(guò)Boosting集成的樣本遷移思想,將拓?fù)浣Y(jié)構(gòu)改變后產(chǎn)生的數(shù)據(jù)作為輔助訓(xùn)練樣本,將拓?fù)浣Y(jié)構(gòu)改變前的數(shù)據(jù)作為原訓(xùn)練樣本,進(jìn)行樣本遷移,設(shè)置迭代次數(shù)為10,迭代算法為本文所建立的Bagging集成分類器,對(duì)測(cè)試樣本進(jìn)行測(cè)試。
4.4.2基于TCA的特征遷移
通過(guò)TCA算法,利用拓?fù)浣Y(jié)構(gòu)改變后產(chǎn)生的數(shù)據(jù),與拓?fù)浣Y(jié)構(gòu)改變前的歷史數(shù)據(jù)進(jìn)行特征遷移,進(jìn)而獲得大量的仿真數(shù)據(jù)。本文采用的TCA方法取高斯核函數(shù)進(jìn)行計(jì)算,核函數(shù)寬度為1,特征維度為30,對(duì)于偏移量不同的樣本分別進(jìn)行遷移,得到不同的樣本集對(duì)模型進(jìn)行訓(xùn)練,測(cè)試結(jié)果如圖8所示。
圖8 遷移學(xué)習(xí)模型性能評(píng)估
4.4.3測(cè)試結(jié)果
對(duì)失去一條母線38節(jié)點(diǎn)的模型進(jìn)行同樣類型的暫態(tài)穩(wěn)定仿真,由于第8、9條線路以及一條母線的缺失,共得到了7 594組數(shù)據(jù),且數(shù)據(jù)維度變?yōu)?32,隨機(jī)取出其中2 253組數(shù)據(jù)作為測(cè)試集,其余5 341組數(shù)據(jù)作為輔助訓(xùn)練集備用。將之前39節(jié)點(diǎn)仿真得到的8 788組數(shù)據(jù)作為原始樣本集導(dǎo)入TrEnsemble模型,并取少量相對(duì)應(yīng)的38節(jié)點(diǎn)訓(xùn)練集數(shù)據(jù)作為輔助樣本集代入模型,將測(cè)試集導(dǎo)入訓(xùn)練后的模型進(jìn)行測(cè)試,模型正確率隨樣本數(shù)量的增加而變化的曲線如圖8中TrEnsemble所示;若將39節(jié)點(diǎn)數(shù)據(jù)集代入TCA進(jìn)行特征提取,重復(fù)上述工作,得到正確率隨樣本數(shù)量的增加而變化的曲線如圖8中TCA+Ensemble所示;而只將38節(jié)點(diǎn)的數(shù)據(jù)集作為訓(xùn)練集代入普通的Bagging集成算法進(jìn)行訓(xùn)練測(cè)試,對(duì)應(yīng)的結(jié)果如圖8中Ensemble所示。
通過(guò)對(duì)比發(fā)現(xiàn),TrEnsemble方法在只有少量訓(xùn)練樣本集時(shí)展現(xiàn)出較高的預(yù)測(cè)精度,并且在訓(xùn)練樣本增加的同時(shí),精度也隨之增加,而TCA法本質(zhì)上是特征遷移方法,所以對(duì)訓(xùn)練樣本大小其實(shí)并不敏感,其精度也基本保持穩(wěn)定,兩種方法均可適用于本文提出的暫態(tài)穩(wěn)定評(píng)估模型的在線更新。
表5 IEEE16機(jī)68節(jié)點(diǎn)仿真結(jié)果
由表5中數(shù)據(jù)可知,本文方法在IEEE16機(jī)68節(jié)點(diǎn)算例下依舊保持最高的性能和精度,說(shuō)明本文所提方法在不同的系統(tǒng)結(jié)構(gòu)下也能保持良好的通用性。
本文提出了一種多模態(tài)集成的Bagging集成學(xué)習(xí)算法,并將其引入電力系統(tǒng)的暫態(tài)穩(wěn)定評(píng)估中,在IEEE10機(jī)39節(jié)點(diǎn)系統(tǒng)以及IEEE16機(jī)68節(jié)點(diǎn)系統(tǒng)上進(jìn)行了仿真研究。
1) 區(qū)別于將多個(gè)相同模型進(jìn)行加權(quán)平均的傳統(tǒng)集成學(xué)習(xí)模型,本文將多個(gè)機(jī)器學(xué)習(xí)模型對(duì)應(yīng)的預(yù)測(cè)值進(jìn)行二次學(xué)習(xí)得到最后的預(yù)測(cè)結(jié)果。試驗(yàn)證明,所提模型在準(zhǔn)確度和安全性指標(biāo)上均優(yōu)于各子機(jī)器學(xué)習(xí)模型以及傳統(tǒng)深度學(xué)習(xí)模型。
2) 考慮噪聲的影響,對(duì)原有測(cè)試集加入高斯噪聲重復(fù)實(shí)驗(yàn)。結(jié)果表明,Bagging集成學(xué)習(xí)模型在各種噪聲環(huán)境下均能保持較高的準(zhǔn)確率,而其他機(jī)器學(xué)習(xí)模型則出現(xiàn)精度下降、性能降低等現(xiàn)象。
3) 當(dāng)系統(tǒng)拓?fù)浣Y(jié)構(gòu)發(fā)生變化時(shí),將所提模型與Boosting樣本遷移學(xué)習(xí)算法思想和TCA特征遷移學(xué)習(xí)算法相結(jié)合。提出兩種不同的暫態(tài)穩(wěn)定模型在線更新方法,并與傳統(tǒng)方法相比,證明所提算法能夠適應(yīng)暫態(tài)穩(wěn)定評(píng)估模型的在線化更新。
[1] 孫華東, 許濤, 郭強(qiáng), 等.英國(guó)“8·9”大停電事故分析及對(duì)中國(guó)電網(wǎng)的啟示[J].中國(guó)電機(jī)工程學(xué)報(bào), 2019, 39(21): 6183-6192.
SUN Huadong, XU Tao, GUO Qiang, et al.Analysis of "8·9" blackout accident in UK and its enlightenment to China's power grid[J].Proceedings of the CSEE, 2019, 39(21): 6183-6192.
[2] 朱朝陽(yáng).委內(nèi)瑞拉大停電事故的背后[J].國(guó)家電網(wǎng), 2019(5): 72-74.
ZHU Chaoyang.Behind the blackout in Venezuela[J].State Grid, 2019(5): 72-74.
[3] 易俊, 卜廣全, 郭強(qiáng), 等.巴西“3·21”大停電事故分析及對(duì)中國(guó)電網(wǎng)的啟示[J].電力系統(tǒng)自動(dòng)化, 2019, 43(2): 1-6.
YI Jun, PU Guangquan, GUO Qiang, et al.Analysis of the "March 21" blackout accident in Brazil and its enlightenment to China's power grid[J].Automation of Electric Power Systems, 2019, 43(2): 1-6.
[4] 王毅星.基于深度學(xué)習(xí)和遷移學(xué)習(xí)的電力數(shù)據(jù)挖掘技術(shù)研究[D].杭州: 浙江大學(xué), 2019.
WANG Yixing.Power data mining technology based on deep learning and transfer learning[D].Hangzhou: Zhejiang University, 2019.
[5] CHAO Ren, XU Yan, ZHANG Yuchen.Post-disturbance transient stability assessment of power systems towards optimal accuracy-speed tradeoff[J].Protection and Control of Modern Power Systems, 2018, 3(1): 1-10.
[6] WU Shuang, ZHENG Le, HU Wei, et al.Improved deep belief network and model interpretation method for power system transient stability assessment[J].Journal of Modern Power Systems and Clean Energy, 2020, 8(1): 27-37.
[7] 王亮, 韓冬, 王長(zhǎng)江, 等.基于MVEE和LSPTSVM的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[J].電力系統(tǒng)保護(hù)與控制, 2020, 48(17): 45-54.
WANG Liang, HAN Dong, WANG Changjiang, et al.Power system transient stability assessment based on MVEE and LSPTSVM[J].Power System Protection and Control, 2020, 48(17): 45-54.
[8] 田芳, 周孝信, 于之虹.基于支持向量機(jī)綜合分類模型和關(guān)鍵樣本集的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[J].電力系統(tǒng)保護(hù)與控制, 2017, 45(22): 1-8.
TIAN Fang, ZHOU Xiaoxin, YU Zhihong.Power system transient stability assessment based on comprehensive SVM classification model and key sample set[J].Power System Protection and Control, 2017, 45(22): 1-8.
[9] 張春.基于關(guān)聯(lián)規(guī)則的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法研究[D].北京: 華北電力大學(xué), 2017.
ZHANG Chun.Study on transient stability assessment method based on association rules[D].Beijing: North China Electric Power University, 2017.
[10] 王勝, 馮興明, 周宇, 等.基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的微網(wǎng)系統(tǒng)dq軸諧波阻抗的主動(dòng)測(cè)量策略[J].電測(cè)與儀表, 2021, 58(3): 118-125.
WANG Sheng, FENG Xingming, ZHOU Yu, et al.An active measurement strategy of dq-axis harmonic impedance in micro-grid system based on BP neural network prediction[J].Electrical Measurement & Instrumentation, 2021, 58(3): 118-125.
[11] MADHIARASAN M.Accurate prediction of different forecast horizons wind speed using a recursive radial basis function neural network[J].Protection and Control of Modern Power Systems, 2020, 5(3): 48-56.
[12] 劉謀海, 胡軍華, 丁國(guó)棟, 等.基于深度學(xué)習(xí)的電力監(jiān)控視頻超分辨率重建[J].電力系統(tǒng)保護(hù)與控制, 2021, 49(11): 181-187.
LIU Mouhai, HU Junhua, DING Guodong, et al.Super-resolution reconstruction of a power monitoring video based on deep learning[J].Power System Protection and Control, 2021, 49(11): 181-187.
[13] 鄭煒, 林瑞全, 王俊, 等.基于GAF與卷積神經(jīng)網(wǎng)絡(luò)的電能質(zhì)量擾動(dòng)分類[J].電力系統(tǒng)保護(hù)與控制, 2021, 49(11): 97-104.
ZHENG Wei, LIN Ruiquan, WANG Jun, et al.Power quality disturbance classification based on GAF and a convolutional neural network[[J].Power System Protection and Control, 2021, 49(11): 97-104.
[14] 田芳, 周孝信, 史東宇, 等.基于卷積神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)暫態(tài)穩(wěn)定預(yù)防控制方法[J].電力系統(tǒng)保護(hù)與控制, 2020, 48(18): 1-8.
TIAN Fang, ZHOU Xiaoxin, SHI Dongyu, et al.A preventive control method of power system transient stability based on a convolutional neural network[J].Power System Protection and Control, 2020, 48(18): 1-8.
[15] 王懷遠(yuǎn), 陳啟凡.基于堆疊變分自動(dòng)編碼器的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法[J].電力自動(dòng)化設(shè)備, 2019, 39(12): 134-139.
WANG Huaiyuan, CHEN Qifan.Power system transient stability assessment method based on stacked variational autoencoder[J].Electric Power Automation Equipment, 2019, 39(12): 134-139.
[16] SANER C B, YASLAN Y, GENC I.An ensemble model for wide-area measurement-based transient stability assessment in power systems[J].Electrical Engineering, 2021, 103: 2855-2869.
[17]李揚(yáng), 李國(guó)慶, 顧雪平, 等.基于集成OS-ELM的暫態(tài)穩(wěn)定評(píng)估方法[J].電工技術(shù)學(xué)報(bào), 2015, 30(14): 412-418.
LI Yang, LI Guoqing, GUO Xueping, et al.Transient stability assessment of power systems based on ensemble OS-ELM[J].Transactions of China Electrotechnical Society, 2015, 30(14): 412-418.
[18] HAMDI H, REGAYA C B, ZAAFOURI A.A sliding-neural network control of induction-motor-pump supplied by photovoltaic generator[J].Protection and Control of Modern Power Systems, 2019, 4(4): 306-322.
[19] LIU Songkai, LIU Lihuang, FANG Youping, et al.An integrated scheme for online dynamic security assessment based on partial mutual information and iterated random forest[J].IEEE Transactions on Smart Grid, 2020, 11(4): 3606-3619.
[20] 李寶琴, 吳俊勇, 邵美陽(yáng), 等.基于集成深度置信網(wǎng)絡(luò)的精細(xì)化電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[J].電力系統(tǒng)自動(dòng)化, 2020, 44(6): 17-26.
LI Baoqin, WU Junyong, SHAO Meiyang, et al.Refined transient stability assessment of power system based on integrated deep confidence network[J].Automation of Electric Power Systems, 2020, 44(6): 17-26.
[21] 史佳琪, 張建華.基于多模型融合Stacking集成學(xué)習(xí)方式的負(fù)荷預(yù)測(cè)方法[J].中國(guó)電機(jī)工程學(xué)報(bào), 2019, 39(14): 4032-4042.
SHI Jiaqi, ZHANG Jianhua.Load forecasting based on multi-model by Stacking ensemble learning[J].Proceedings of the CSEE, 2019, 39(14): 4032-4042.
[22] 杜涵瀟, 湯旻安.基于CEEMD-RSVPSO-KELM的用戶側(cè)微電網(wǎng)短期負(fù)荷預(yù)測(cè)[J].電測(cè)與儀表, 2020, 57(18): 69-76.
DU Hanxiao, TANG Min’an.Short-term load forecasting for user-side micro-grid based on CEEMD-RSVPSO- KELM model[J].Electrical Measurement & Instrumentation, 2020, 57(18): 69-76.
[23] 戴文淵.基于實(shí)例和特征的遷移學(xué)習(xí)算法研究[D].上海: 上海交通大學(xué), 2008.
DAI Wenyuan.Instance-based and feature-based transfer learning[D].Shanghai: Shanghai Jiao Tong University, 2008.
[24] PAN S J, WSANG I W, KWOK J T, et al.Domain adaptation via transfer component analysis[J].IEEE Transactions on Neural Networks, 2011, 22(2): 199-210.
[25] 張倩, 李海港, 李明程, 等.基于多源動(dòng)態(tài)TrAdaBoost的實(shí)例遷移學(xué)習(xí)方法[J].中國(guó)礦業(yè)大學(xué)學(xué)報(bào), 2014, 43(4): 713-720.
ZHANG Qian, LI Haigang, LI Mingcheng, et al.Instance transfer learning method based on multi-source dynamic Tradaboost[J].Journal of China University of Mining and Technology, 2014, 43(4): 713-720.
[26] WANG Huaiyuan, WANG Qingyin, CHEN Qifan.Transient stability assessment model with improved cost-sensitive method based on the fault severity[J].IET Generation, Transmission & Distribution, 2020, 14(20): 4605-4611.
On-line transient stability assessment of a power system based on Bagging ensemble learning
ZHAO Dongmei1, XIE Jiakang1, WANG Chuang1, WANG Haoxiang1, JIANG Wei2, WANG Yi1
(1.School of Electrical and Electronic Engineering, North China Electric Power University, Beijing 102206, China;2.China Huaneng North Weijiamao Power and Coal Co., Ltd., Erdos 010308, China)
To solve the problems of poor stability and low accuracy of traditional machine learning in transient stability assessment and the limitations of offline training, an online transient stability assessment model based on multi-model fusion Bagging ensemble learning method is proposed.First, in combination with research on the frontier theory of artificial intelligence, the principles and implement methods of seven machine learning algorithms commonly used in transient stability assessment are analyzed, and the Bagging method is used to integrate them to give full play to the advantages of each model.Secondly, the mathematical method of Bagging ensemble learning is given and a simulation experiment is carried out.When the topological structure of the original system changes, a Boosting algorithm and transfer component analysis are used to carry out sample and feature transfer of the original grid historical data to complete the online update of the proposed model.IEEE10-machine 39-bus system and IEEE16-machine 68-bus system are used in the simulation analysis, and the results show that the proposed method is more accurate than the traditional machine learning model.It can maintain stable operation when the data is mixed with noise, and accurately evaluate transient stability by transferring the historical data when the system topology changes.
Bagging ensemble learning; power system; machine learning; transient stability; transfer learning; on-line updating
10.19783/j.cnki.pspc.210817
2021-07-03;
2021-08-25
趙冬梅(1965—),女,博士,教授,研究方向?yàn)殡娏ο到y(tǒng)分析與控制、新能源發(fā)電與智能電網(wǎng);E-mail: zhao-dm@ ncepu.edu.cn
謝家康(1998—),男,通信作者,碩士研究生,研究方向?yàn)殡娏ο到y(tǒng)分析、機(jī)器學(xué)習(xí);E-mail: 1354667160@qq.com
王 闖(1997—),男,碩士研究生,研究方向?yàn)殡娏ο到y(tǒng)分析、機(jī)器學(xué)習(xí)。E-mail: wangchuang@ncepu.edu.cn
國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目資助(2017YFB0902600);國(guó)家電網(wǎng)公司科技項(xiàng)目資助(SGJS0000DKJS1700840)
This work is supported by the National Key Research and Development Program of China (No.2017YFB0902600).
(編輯 許 威)