王強,陳浩,劉煉
(三峽大學(xué) 電氣與新能源學(xué)院,宜昌 443000)
電力系統(tǒng)暫態(tài)穩(wěn)定是指電力系統(tǒng)在受到大擾動后,各發(fā)電機保持同步運行并過渡到穩(wěn)定運行狀態(tài)的能力[1]。暫態(tài)失穩(wěn)易引發(fā)連鎖故障進(jìn)而導(dǎo)致發(fā)生大面積停電事故[2],這不僅造成重大經(jīng)濟損失,而且對人們的生產(chǎn)、生活產(chǎn)生了不可預(yù)估的影響。快速、準(zhǔn)確的暫態(tài)穩(wěn)定評估(transient stability assessment,TSA)能及時為系統(tǒng)的緊急控制提供參考依據(jù),對維持系統(tǒng)的安全穩(wěn)定具有重要意義。
目前,TSA方法主要包括時域仿真法[3-4]、直接法[5-6]和人工智能法。時域仿真法,評估精度高,但由于計算速度的限制,難以應(yīng)用于在線評估;直接法,能快速提供TSA結(jié)果,但評估精度不高,難以應(yīng)用于復(fù)雜的大規(guī)模系統(tǒng)。人工智能法以機器學(xué)習(xí)為核心,它從離線數(shù)據(jù)中尋求系統(tǒng)狀態(tài)參數(shù)到暫態(tài)穩(wěn)定結(jié)果間的映射關(guān)系,基于該映射關(guān)系根據(jù)系統(tǒng)在線運行數(shù)據(jù)實現(xiàn)在線TSA,具有計算速度快、評估精度高等優(yōu)點[7-8]。隨著新一代智能電網(wǎng)的建設(shè),廣域測量系統(tǒng)(wide area measurement system,WAMS)/同步相量測量單元(phasor measurement units,PMU)迅速普及[9],為歷史數(shù)據(jù)的儲存和在線數(shù)據(jù)的采集提供了便利,基于機器學(xué)習(xí)的在線TSA成為了研究熱點[10]。
文獻(xiàn)[4]使用差分進(jìn)化算法改進(jìn)極限學(xué)習(xí)機,提高了TSA模型的準(zhǔn)確率和魯棒性。文獻(xiàn)[8]首先使用改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)和雙向長短時記憶網(wǎng)絡(luò)進(jìn)行特征提取,然后使用LightGBM算法預(yù)測系統(tǒng)暫態(tài)穩(wěn)定狀況。文獻(xiàn)[11]采用XGBoost算法進(jìn)行TSA,并利用注意力系數(shù)改進(jìn)XGBoost算法的損失函數(shù),提高了XGBoost算法的召回率。文獻(xiàn)[12]利用焦點損失函數(shù)改進(jìn)LightGBM算法,提升了在不平衡樣本上的評估精度。文獻(xiàn)[13]采用多個結(jié)構(gòu)相同、參數(shù)不同的CNN進(jìn)行TSA,評估結(jié)果綜合多個CNN模型的分析,并對評估結(jié)果為不確定的樣本采取時域仿真進(jìn)一步分析。
隨著現(xiàn)代電力系統(tǒng)迅速發(fā)展,在該領(lǐng)域的研究中仍面臨著以下問題:①現(xiàn)代電力系統(tǒng)的規(guī)模更大,需獲取的狀態(tài)參數(shù)特征迅速增加,分類器易陷入“維數(shù)災(zāi)難”[14],另外過多的冗余特征、無關(guān)特征,將損害TSA模型的泛化能力;②隨著大規(guī)模新能源并網(wǎng)以及新裝置的不斷應(yīng)用,電力系統(tǒng)的運行環(huán)境更加復(fù)雜、不確定性因素更多,這對TSA模型的精確性和泛化能力提出了更高要求;③由于設(shè)備故障、測量數(shù)據(jù)的遠(yuǎn)距離傳輸導(dǎo)致出現(xiàn)數(shù)據(jù)錯誤,常規(guī)TSA模型的魯棒性可能無法滿足要求。
針對以上問題,提出一種結(jié)合最大相關(guān)最小冗余(maximal relevance and minimal redundancy,mRMR)[15-16]集成方案和多個CatBoost(unbiased boosting with categorical features)[17-18]分類器的TSA方法。首先,運行多個mRMR特征選擇過程,充分挖掘輸入特征與暫態(tài)穩(wěn)定結(jié)果間的隱含關(guān)系,篩選出多個不同關(guān)鍵特征集;然后,訓(xùn)練多個CatBoost模型,并綜合多個CatBoost模型的分析。最后,在IEEE 39節(jié)點系統(tǒng)和某省級電力系統(tǒng)上進(jìn)行了性能測試實驗,并驗證了所提TSA方法的有效性。
應(yīng)用機器學(xué)習(xí)算法來建立系統(tǒng)狀態(tài)參數(shù)到暫態(tài)穩(wěn)定結(jié)果間的映射關(guān)系,首要任務(wù)是確定輸入特征和構(gòu)建暫態(tài)穩(wěn)定結(jié)果標(biāo)簽。
在基于機器學(xué)習(xí)的TSA建模中,輸入特征分為兩類[11]:第一類輸入特征由故障前和故障后的電氣量特征構(gòu)成;第二類輸入特征由故障前的電氣量特征構(gòu)成。故障前的特征可在電力系統(tǒng)穩(wěn)態(tài)運行時監(jiān)測到,而故障后的特征只有在故障發(fā)生后才能監(jiān)測到,系統(tǒng)的暫態(tài)過程極為短暫,這給電網(wǎng)操作人員的反應(yīng)時間極短。而根據(jù)系統(tǒng)的穩(wěn)態(tài)運行信息,預(yù)測系統(tǒng)的暫態(tài)穩(wěn)定性,電網(wǎng)操作人員能夠擁有更加充足的時間分析當(dāng)前系統(tǒng)的運行狀況,并能及時為后續(xù)控制措施的制定提供依據(jù),所以采用第二類輸入特征進(jìn)行建模。
如表1所示,列出了能夠反映電力系統(tǒng)的暫態(tài)穩(wěn)定狀況的部分穩(wěn)態(tài)運行電氣量信息。并且選擇使用這些電氣量信息來構(gòu)建輸入特征集D。
表1 電氣量特征
對于故障前的TSA,使用電力系統(tǒng)的暫態(tài)穩(wěn)定裕度(transient stability margin, TSM)來量化從當(dāng)前工作點到穩(wěn)定邊界的距離,常用的TSM表示方法有擴展等面積準(zhǔn)則法、能量函數(shù)法、極限切除時間法等。在極限切除時間法中,故障后的極限切除時間(critical clearing time,CCT)能夠反映電力系統(tǒng)的暫態(tài)穩(wěn)定性,CCT越長則系統(tǒng)保持暫態(tài)穩(wěn)定的能力越強,如果實際切除時間(actual clearing time,ACT)小于CCT,可認(rèn)為系統(tǒng)能夠穩(wěn)定運行,否則認(rèn)為系統(tǒng)不穩(wěn)定。因此,將事故i下的TSM定義為
(1)
式(1)中:CCTi為電力系統(tǒng)某個位置在事故i下的CCT;ACTi為故障點在事故i下的ACT;TSMi取值為(-1 1),因此,暫態(tài)穩(wěn)定結(jié)果標(biāo)簽可構(gòu)建為
(2)
2.1.1 mRMR準(zhǔn)則
互信息常用于評價兩個隨機變量間的相關(guān)性,互信息值越高則表示這兩個隨機變量的相關(guān)性越大。若對于兩個離散的隨機變量X與Y,其聯(lián)合概率密度函數(shù)為P(x,y),邊緣密度函數(shù)為P(x)、P(y),則互信息MI(X,Y)可定義為
(3)
基于互信息原理,關(guān)鍵特征集S與暫態(tài)穩(wěn)定結(jié)果間的最大相關(guān)性、關(guān)鍵特征集S中所有特征的最小冗余性可分別定義為
(4)
(5)
式中:|S|表示關(guān)鍵特征數(shù)目;MI(Fi,y)為特征Fi與暫態(tài)穩(wěn)定結(jié)果y間的互信息值;MI(Fi,Fj)為特征Fi與特征Fj間的互信息值。
mRMR的目標(biāo)是最大化特征與暫態(tài)穩(wěn)定結(jié)果間的相關(guān)性、最小化不同特征間的冗余性。通過對相關(guān)性和冗余性的權(quán)衡,并將式(4)與式(5)組合建立關(guān)鍵特征集S的mRMR準(zhǔn)則為
maxΦ(U,R),
Φ=U-R
(6)
2.1.2 增量搜索算法
在應(yīng)用中,mRMR采用增量搜索算法[16]選取式(6)中Φ(·)所定義的最優(yōu)近似特征。因而,采用增量搜索算法進(jìn)行特征選擇的具體流程如下。
步驟1定義關(guān)鍵特征集合S;
步驟2根據(jù)式(3)計算每個特征Fi與暫態(tài)穩(wěn)定結(jié)果間的相關(guān)性,并按相關(guān)性大小排序,選擇與暫態(tài)穩(wěn)定結(jié)果最相關(guān)的n(n≥1)個特征作為第一選擇特征,將其添加到集合S中。
步驟3在已選特征的基礎(chǔ)上,對于剩余特征,根據(jù)式(6)中的mRMR標(biāo)準(zhǔn)選擇下一個特征Fj,可表示為
(7)
步驟4將步驟3選擇的特征Fj添加到集合S中,重復(fù)步驟3直到得到所需特征數(shù)目的關(guān)鍵特征集S。
采用一種mRMR集成方案,其示意圖如圖1所示,在該過程中,并行生成m個不同的mRMR特征選擇過程。每個特征選擇過程首先選取不同的第一選擇特征。隨后,運行m個不同的增量搜索算法,篩選出m組不同的關(guān)鍵特征集。不同關(guān)鍵特征集間相互補充,增強TSA模型的魯棒性。
圖1 mRMR集成方案示意圖
CatBoost算法是梯度提升決策樹(gradient boosting decision tree,GBDT)框架下的新型改進(jìn)算法。它將對稱決策樹作為基學(xué)習(xí)器,對稱決策樹的對稱結(jié)構(gòu)使其參數(shù)更少、訓(xùn)練和測試速度更快。并且,在算法訓(xùn)練中采用排序提升方法來避免標(biāo)準(zhǔn)GBDT模型所存在的梯度偏差問題,進(jìn)而提升了算法的準(zhǔn)確性和泛化能力,保證了TSA的可靠性。
3.1.1 CatBoost的整體迭代過程
在模型訓(xùn)練中,每輪迭代生成一個弱學(xué)習(xí)器,并讓本輪迭代的損失函數(shù)最小。假設(shè)損失函數(shù)為L[y,f(x)],每輪迭代的目標(biāo)函數(shù)ht可定義為
(8)
式(8)中:ht是從一系列H函數(shù)中選擇的樹;E為期望函數(shù);Ft-1(x)為上一輪迭代中所獲得的強學(xué)習(xí)器。
(9)
隨后,得到本輪迭代的強學(xué)習(xí)器為
F(x)t=F(x)t-1+αht
(10)
式(10)中:α為學(xué)習(xí)率,即模型更新的步長。
3.1.2 排序提升
在迭代過程中,GBDT算法使用相同的訓(xùn)練樣本計算在每輪迭代的梯度,并將式(9)表示為
(11)
式(11)中:n為訓(xùn)練樣本數(shù)目;{xk,yk}為第k個訓(xùn)練樣本,k=1, 2,…,n,其中yk∈{0,1}。
因此,這導(dǎo)致根據(jù)訓(xùn)練樣本計算得到的梯度分布gt(xk,yk)|xk與數(shù)據(jù)空間中梯度的真實分布gt(x,y)|x相比存在偏差[17-18]。根據(jù)式(11)求得的目標(biāo)函數(shù)ht就與式(8)中ht的定義產(chǎn)生了偏差,進(jìn)而影響最終模型F(x)的準(zhǔn)確性和泛化能力。
CatBoost算法則采用了排序提升方法來進(jìn)行梯度的無偏計算,其基本原理為:對于每一個樣本xi,都使用不包含樣本xi的訓(xùn)練集單獨訓(xùn)練一個模型Mi,并使用模型Mi來計算樣本xi上的梯度。同時,文獻(xiàn)[17-18]證明了排序提升方法的有效性。
為最大限度地提升TSA模型的精確性,采用多個不同的關(guān)鍵特征集分別單獨訓(xùn)練多個CatBoost分類器,然后將它們集成到暫態(tài)穩(wěn)定分析中,并提出TSA綜合評估模型,其示意圖如圖2所示。
圖2 TSA綜合模型示意圖
構(gòu)建TSA綜合模型的具體流程為:通過采用mRMR集成方案,從輸入特征集中選取m組不同的關(guān)鍵特征集。以這m組關(guān)鍵特征集和相應(yīng)的暫態(tài)穩(wěn)定結(jié)果標(biāo)簽作為輸入,分別對m個CatBoost算法進(jìn)行訓(xùn)練和測試,并將訓(xùn)練好的CatBoost模型結(jié)合構(gòu)建TSA綜合模型。每個CatBoost模型的輸出分別為:y1、y2、…、ym,根據(jù)多數(shù)投票表決方式得到最終輸出結(jié)果。
基于多層CatBoost分類器的TSA流程圖(圖3),包括離線訓(xùn)練、在線應(yīng)用及模型更新。
圖3 TSA流程圖
離線訓(xùn)練步驟如下。
步驟1根據(jù)電網(wǎng)公司所儲存的PMU歷史監(jiān)測數(shù)據(jù)和預(yù)想事故集的模擬仿真獲取樣本集。其中,PMU歷史監(jiān)測數(shù)據(jù)包含了電力系統(tǒng)實際存在的運行狀態(tài)和大擾動事故下的安全信息;基于預(yù)想事故集的模擬仿真,針對每個故障,應(yīng)考慮系統(tǒng)的網(wǎng)絡(luò)拓?fù)渥兓⒇?fù)荷波動以及發(fā)電機出力變化等因素的影響,盡可能覆蓋更多的電力系統(tǒng)潛在運行行為。
步驟2采用mRMR集成方案進(jìn)行特征選擇。在該步驟中,生成多個不同的mRMR特征選擇過程,篩選出多組不同的關(guān)鍵特征集。
步驟3將多組關(guān)鍵特征集和相應(yīng)的暫態(tài)穩(wěn)定結(jié)果標(biāo)簽作為訓(xùn)練樣本,訓(xùn)練多個CatBoost模型,并結(jié)合不同的CatBoost訓(xùn)練模型構(gòu)建TSA綜合模型。
根據(jù)WAMS提供的電力系統(tǒng)在線運行數(shù)據(jù),結(jié)合mRMR特征選擇結(jié)果選取出相應(yīng)的電氣量特征輸入訓(xùn)練好的CatBoost模型,然后對多個CatBoost模型的分析結(jié)果進(jìn)行綜合,得到最終的評估結(jié)果。若判定為不穩(wěn)定則提示電網(wǎng)操作人員對系統(tǒng)運行狀況進(jìn)一步分析,考慮是否采取必要的控制措施,避免出現(xiàn)連鎖故障和發(fā)生大面積停電事故。
電網(wǎng)在實際運行中受到多種因素的影響。如電網(wǎng)緊急事故、經(jīng)濟調(diào)度以及檢修計劃等會導(dǎo)致電力網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的變化;對于負(fù)荷需求,天氣和季節(jié)是一個重要影響因素;同時隨著大規(guī)模新能源并網(wǎng)以及分布式發(fā)電技術(shù)的發(fā)展,根據(jù)實際電網(wǎng)的需求會造成發(fā)電機/負(fù)載功率分布的變化。因此,僅靠離線訓(xùn)練無法覆蓋電網(wǎng)所有可能存在的運行行為,為不斷完善TSA綜合模型的內(nèi)容,進(jìn)行更新步驟是必要的。
考慮上述影響因素,在系統(tǒng)出現(xiàn)故障、以及運行狀態(tài)發(fā)生顯著變化時,通過PMU裝置對電力系統(tǒng)運行數(shù)據(jù)實時采集,并選擇關(guān)鍵特征對CatBoost模型再訓(xùn)練。
分別在IEEE 39節(jié)點系統(tǒng)和某省級電力系統(tǒng)上進(jìn)行性能測試實驗,以驗證所提出的TSA綜合模型的有效性。所有測試在一臺裝有Intel Core i5 處理器和8 GB內(nèi)存的計算機上進(jìn)行。mRMR集成算法使用R語言mRMRe包搭建。CatBoost算法在Jupyter環(huán)境下基于Python開源機器學(xué)習(xí)庫catboost 0.24.2構(gòu)建設(shè)置基學(xué)習(xí)器數(shù)目為300,最大深度為5,學(xué)習(xí)率為0.05。
IEEE 39節(jié)點系統(tǒng)的拓?fù)鋱D如圖4所示,該系統(tǒng)由39條母線、10臺發(fā)電機(G1~G10)和46條輸電線路組成。
圖4 IEEE 39節(jié)點系統(tǒng)拓?fù)鋱D
5.1.1 樣本集的生成
使用PSS/E軟件進(jìn)行仿真,并調(diào)用Python程序控制PSS/E軟件進(jìn)行仿真數(shù)據(jù)的自動收集。發(fā)電機設(shè)置為GENROU模型,負(fù)載采用恒阻抗模型,使負(fù)載在70%~130%范圍隨機波動,并相應(yīng)調(diào)整發(fā)電機出力大小來模擬出不同的運行方式。記錄每種運行方式下的穩(wěn)態(tài)運行參數(shù)信息,針對不同運行方式,在節(jié)點、線路的不同位置設(shè)置三相短路接地故障,并計算不同故障的CCT。由于實際中存在樣本不平衡情況,在隨機剔除部分不穩(wěn)定樣本后,收集到4 152個樣本(包括:3 062個穩(wěn)定樣本,1 090個不穩(wěn)定樣本),每個樣本包含660個電氣量特征和一個相應(yīng)的暫態(tài)穩(wěn)定結(jié)果標(biāo)簽。
為保證測試結(jié)果的客觀性,將80%的樣本用于訓(xùn)練,20%的樣本用于測試,采用5倍交叉驗證法重復(fù)實驗,取5次測試結(jié)果的平均值。
5.1.2 模型性能評價指標(biāo)
針對不穩(wěn)定樣本漏判和穩(wěn)定樣本誤判的代價差別,使用準(zhǔn)確率Acc和召回率Rec指標(biāo)來衡量訓(xùn)練模型的好壞。準(zhǔn)確率和召回率的定義為
(12)
(13)
式中:TP為不穩(wěn)定樣本被正確分類的數(shù)量;TN為穩(wěn)定樣本被正確分類的數(shù)量;FP為穩(wěn)定樣本被錯誤分類的數(shù)量;FN為不穩(wěn)定樣本被錯誤分類的數(shù)量。
根據(jù)定義可知,準(zhǔn)確率為所有樣本中被正確分類的比例,召回率為不穩(wěn)定樣本中被正確分類的比例。
5.1.3 基于mRMR集成方案的特征選取
mRMR算法選擇的關(guān)鍵特征數(shù)目與CatBoost分類器的準(zhǔn)確率、訓(xùn)練時間的變化關(guān)系圖,如圖5所示??梢钥闯?,在選取150個關(guān)鍵特征時準(zhǔn)確率達(dá)到最大值,之后特征數(shù)目的增加準(zhǔn)確率不再升高,而且略有下降。另外訓(xùn)練時間與特征數(shù)目成正比,在特征數(shù)目減少時,訓(xùn)練時間也隨之降低。因此,使用mRMR算法來剔除冗余特征、無關(guān)特征,降低特征空間維數(shù),有助于提高計算效率和增強模型的泛化能力。
圖5 不同關(guān)鍵特征數(shù)目的訓(xùn)練時間和準(zhǔn)確率
mRMR集成方案設(shè)置為5個mRMR特征選擇過程(m=5),每個過程分別選擇150個關(guān)鍵特征。如表2所示,給出了mRMR集成方案選擇的部分關(guān)鍵特征。
表2 mRMR集成方案特征選擇結(jié)果
5.1.4 不同模型性能比較
使用仿真所獲得的樣本對支持向量機(support vector machine, SVM)模型、決策樹(decision tree, DT)模型、深度神經(jīng)網(wǎng)絡(luò)(deep neural networks, DNN)模型、XGBoost模型、單個CatBoost模型以及TSA綜合模型進(jìn)行TSA評估。其中,SVM模型采用高斯核函數(shù),并通過交叉驗證法和網(wǎng)格法尋找最優(yōu)的懲罰因子C和核參數(shù)γ;DT模型設(shè)置為默認(rèn)參數(shù);DNN模型包含5個隱含層,每層神經(jīng)元數(shù)依次為300-200-150-100-50;XGBoost模型采用與CatBoost模型相同的參數(shù)。不同模型的測試結(jié)果如表3所示。
由表3可知,TSA綜合模型的準(zhǔn)確率為0.995、召回率為0.997,遠(yuǎn)高于另外5種評估模型。由于使用多個不同的關(guān)鍵特征集訓(xùn)練多個CatBoost模型,能夠充分挖掘輸入特征與暫態(tài)穩(wěn)定結(jié)果間的映射關(guān)系,進(jìn)而提高了TSA的精確性。另外,對于SVM模型,在小規(guī)模系統(tǒng)上通常具有較好表現(xiàn),但當(dāng)系統(tǒng)規(guī)模過于龐大時,將耗費大量的機器內(nèi)存和運算時間;對于DT模型,當(dāng)樹的深度很大時,會建立過于復(fù)雜的規(guī)則,這易導(dǎo)致模型出現(xiàn)過擬合;DNN模型的計算成本過高,且存在黑箱問題,其做出判斷的機理難以被解釋;XGBoost模型實現(xiàn)了大規(guī)模并行梯度提升,但仍然存在梯度偏差問題,在泛化能力上不如CatBoost模型;CatBoost模型有效解決了梯度估計偏差問題,在預(yù)測精度上也具有一定的優(yōu)勢。
表3 IEEE 39節(jié)點系統(tǒng)上的測試結(jié)果
5.1.5 泛化能力測試
考慮實際運行中的電力網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)變化、發(fā)電機/負(fù)載功率分布變化以及負(fù)載特性變化,并將系統(tǒng)運行狀態(tài)改變后生成的新樣本用于測試,以驗證TSA綜合模型在新樣本中的適應(yīng)能力。
(1)拓?fù)浣Y(jié)構(gòu)變化。將原來電力網(wǎng)絡(luò)的完全拓?fù)浣Y(jié)構(gòu)改變?yōu)橄鄳?yīng)的N-1、N-2、N-3拓?fù)浣Y(jié)構(gòu),如表4所示。相應(yīng)的測試結(jié)果,如圖6所示。
圖6 不同拓?fù)浣Y(jié)構(gòu)變化測試
表4 不同拓?fù)浣Y(jié)構(gòu)變化類型
(2)發(fā)電機/負(fù)載功率分布變化。不同發(fā)電機/負(fù)載功率分布變化的測試結(jié)果如表5所示,變化范圍與原始分布相對應(yīng)。
表5 不同發(fā)電機/負(fù)載功率分布變化測試
(3)負(fù)載特性變化。設(shè)I為恒電流負(fù)載占比,Z為恒功率負(fù)載占比,其余為恒阻抗負(fù)載。不同負(fù)載特性變化下的測試結(jié)果如表6所示。
表6 不同負(fù)載特性變化測試
根據(jù)圖6、表5、表6可知,所提出的TSA綜合模型能夠為電力系統(tǒng)多變的運行環(huán)境提供理想的預(yù)測精度,并證明了該模型具有較強的泛化能力。
5.1.6 魯棒性分析
由于設(shè)備故障、測量數(shù)據(jù)的遠(yuǎn)距離傳輸?shù)?,可能?dǎo)致引入數(shù)據(jù)噪聲或異常值,實際中評估模型需具備較強的魯棒性。在測試中,通過在樣本集中添加不同數(shù)目的無關(guān)特征來評估TSA綜合模型的魯棒性,添加無關(guān)特征的數(shù)目分別為50、75、100、125、150,其中所添加的無關(guān)特征為高斯白噪聲,相應(yīng)的測試結(jié)果如圖7所示。
根據(jù)測試結(jié)果(圖7)可知,添加無關(guān)特征確實會影響評估的精確性,但在添加無關(guān)特征數(shù)目為150個時,TSA綜合模型的準(zhǔn)確率為0.965、召回率為0.963,仍然具有可接受的預(yù)測精度,表明TSA綜合模型具備較好的魯棒性。這是由于TSA綜合模型在基于mRMR的特征選擇過程中,能夠剔除了無關(guān)特征,并選擇出關(guān)鍵特征用于模型的訓(xùn)練和測試,這能一定程度上減少了數(shù)據(jù)噪聲對預(yù)測結(jié)果的影響。另外,在訓(xùn)練中所采用的排序提升方法也有助于對抗樣本集中的異常值[17-18]。
圖7 不同無關(guān)特征下的測試結(jié)果
為了進(jìn)一步驗證論文所提評估方法的有效性,將TSA綜合模型應(yīng)用于某省級電力系統(tǒng),該系統(tǒng)包含2 036條母線、149臺發(fā)電機、761條交流輸電線路和1條直流輸電線路,其500 kV主網(wǎng)框架圖如圖8所示。在實際區(qū)域電力系統(tǒng)中,大多數(shù)停電事故通常與特高壓輸電線路和超高壓輸電線路有關(guān),而低壓輸電線路故障對整個系統(tǒng)的暫態(tài)穩(wěn)定性影響相對較小[19]。因此,選取電壓等級在500 kV及以上的線路、母線進(jìn)行仿真,采用5.1節(jié)所述方法生成離線樣本,并從該系統(tǒng)上收集到8 862個樣本。
圖8 某省級電力系統(tǒng)500 kV主網(wǎng)框架圖
5.2.1 TSA綜合模型的構(gòu)建
使用mRMR算法分別選取出不同數(shù)目的關(guān)鍵特征重復(fù)試驗,確定最佳的關(guān)鍵特征數(shù)目。經(jīng)過多次試驗,當(dāng)選取350個關(guān)鍵特征時,能達(dá)到最佳的評估精度。在生成不同的關(guān)鍵特征集數(shù)目時,其相應(yīng)的評估準(zhǔn)確率如圖9所示。
由圖9可知,在IEEE 39節(jié)點系統(tǒng)上,設(shè)置5個及以上的mRMR特征選擇過程(m≥5)準(zhǔn)確率能達(dá)到0.995以上;在某省級電力系統(tǒng)上,設(shè)置為7個及以上的mRMR特征選擇過程(m≥7)準(zhǔn)確率能達(dá)到0.987以上。在實際應(yīng)用時,可供其他類似規(guī)模的電力系統(tǒng)參考。因此,在某省級電力系統(tǒng)上設(shè)置成7個mRMR特征選擇過程(m=7),篩選出7組關(guān)鍵特征集分別訓(xùn)練7個CatBoost模型,并將這7個離線訓(xùn)練模型結(jié)合構(gòu)建TSA綜合模型。
圖9 生成不同關(guān)鍵特征集數(shù)目的評估準(zhǔn)確率
5.2.2 性能測試
將80%的樣本用于訓(xùn)練,20%的樣本用于測試,采用5倍交叉驗證法重復(fù)實驗,取5次測試結(jié)果的平均值。對于SVM模型、DT模型、DNN模型、XGBoost模型和單個CatBoost模型,則使用原始樣本進(jìn)行性能評估測試。各個模型的測試結(jié)果如表7所示。
表7 某省級電力系統(tǒng)上的測試結(jié)果
某省級電力系統(tǒng)的高復(fù)雜性增加了TSA的難度,同時直流輸電線路的運行也使系統(tǒng)的動態(tài)特性發(fā)生了根本性變化[12]。因而,與IEEE 39節(jié)點系統(tǒng)上的測試結(jié)果相比,各個模型在某省級電力系統(tǒng)上的評估精度均有所降低。總體而言,TSA綜合模型的評估精度仍高于其他模型,其準(zhǔn)確率分別比SVM模型、DT模型、DNN模型、XGBoost模型和單個CatBoost模型提高了0.041、0.046、0.019、0.027、0.015,同時召回率也分別提升了0.044、0.049、0.02、0.031、0.012。因此,與其他模型相比,TSA綜合模型更能滿足在線TSA的實際需求。
為進(jìn)一步提升TSA模型的精確性和可靠性,提出一種將mRMR集成方案和多個CatBoost分類器相結(jié)合來構(gòu)建TSA綜合模型的思路。并在IEEE 39節(jié)點系統(tǒng)和某省級電力系統(tǒng)上對所提出的TSA綜合模型進(jìn)行了性能測試,根據(jù)測試結(jié)果,得出如下結(jié)論。
(1)所提出的TSA綜合模型,擁有比SVM模型、DT模型、DNN模型、XGBoost模型以及單個CatBoost模型更高的準(zhǔn)確率和召回率。因此,使用TSA綜合模型進(jìn)行TSA,能夠獲得更加精確、可靠的分析結(jié)果。
(2)在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)變化、發(fā)電機/負(fù)載功率分布變化以及負(fù)載特性變化的情況下TSA綜合模型仍能提供較高的預(yù)測精度,表明TSA綜合模型具有較強的泛化能力,能夠適應(yīng)電力系統(tǒng)運行環(huán)境的變化。
(3)由于PMU測量誤差而引入數(shù)據(jù)噪聲時,TSA綜合模型的準(zhǔn)確率和召回率都在0.960以上;表明TSA綜合模型具備良好的魯棒性,在噪聲下能夠提供有效的評估。