潘毓笙,秦 超
(天津大學(xué)電氣自動化與信息工程學(xué)院,天津市 300072)
高比例分布式能源接入是未來配電網(wǎng)的基本特征。為應(yīng)對分布式能源接入帶來的不確定性,需要對配電網(wǎng)絡(luò)進(jìn)行頻繁的拓?fù)渲貥?gòu),以保證配電網(wǎng)安全可靠經(jīng)濟(jì)運行[1-3]。配電網(wǎng)的拓?fù)湫畔⑹沁M(jìn)行潮流計算、電壓與無功優(yōu)化、阻塞分析等工作的重要前提[4]。頻繁變化的拓?fù)鋵ε潆娋W(wǎng)的管理提出了嚴(yán)峻挑戰(zhàn),如何準(zhǔn)確高效地辨識配電網(wǎng)拓?fù)湟殉蔀樨巾毥鉀Q的關(guān)鍵問題。
近年來,國內(nèi)外已有大量學(xué)者對配電網(wǎng)的拓?fù)浔孀R展開了研究,主要從2 種研究角度切入,分別是歷史時序數(shù)據(jù)和時間斷面數(shù)據(jù)。第1 種研究角度的基本思路是通過一段連續(xù)時間內(nèi)配電網(wǎng)的時序量測數(shù)據(jù),判斷不同節(jié)點的連接關(guān)系,從而構(gòu)建出網(wǎng)絡(luò)拓?fù)?。文獻(xiàn)[5-8]通過分析不同節(jié)點電壓間的相關(guān)性尋找節(jié)點連接關(guān)系。文獻(xiàn)[9-11]以系統(tǒng)的潮流計算、狀態(tài)估計功能為基礎(chǔ),對節(jié)點連接關(guān)系和線路參數(shù)進(jìn)行聯(lián)合辨識,但是要求大量且類型多樣的量測數(shù)據(jù)。上述方法需要數(shù)小時的量測數(shù)據(jù),無法實現(xiàn)配電網(wǎng)的在線拓?fù)浔孀R,若配電網(wǎng)拓?fù)湓跀?shù)據(jù)采樣期間發(fā)生變化,則無法保證算法的有效性。
為了解決上述問題,一些研究從時間斷面數(shù)據(jù)角度切入,通過建立配電網(wǎng)時間斷面量測數(shù)據(jù)到拓?fù)涞挠成潢P(guān)系辨識其網(wǎng)絡(luò)拓?fù)?。文獻(xiàn)[12]通過貝葉斯模型建立了光伏發(fā)電出力、負(fù)荷、節(jié)點電壓幅值到配電網(wǎng)拓?fù)涞挠成潢P(guān)系。文獻(xiàn)[13]通過深度置信網(wǎng)絡(luò)建立了節(jié)點電壓幅值到配電網(wǎng)所有開關(guān)狀態(tài)的映射關(guān)系。但是,這些工作僅考慮了輻射狀配電網(wǎng),對于高比例分布式能源接入的配電網(wǎng),需要考慮環(huán)狀與輻射狀拓?fù)浠旌线\行的場景[14-15]。文獻(xiàn)[16]通過深度神經(jīng)網(wǎng)絡(luò)直接擬合節(jié)點電壓幅值與混合運行拓?fù)涞挠成潢P(guān)系,但是無法區(qū)分在部分系統(tǒng)運行狀態(tài)下節(jié)點電壓分布相似的拓?fù)?對量測存在誤差的場景適應(yīng)性較弱。
目前,受限于成本因素,量測設(shè)備在配電網(wǎng)中的配置不足。大多數(shù)研究[5-13,15]未能對時間斷面的拓?fù)涮卣餍畔⑦M(jìn)行有效且充分的挖掘,一般需要全部量測的方式保證方法的有效性與適應(yīng)性。
為此,本文提出一種基于兩階段特征選擇和格拉姆角場(Gramian angular field,GAF)的配電網(wǎng)拓?fù)浔孀R方法。首先,基于XGBoost 計算每個量測的重要性,通過最大信息系數(shù)(maximal information coefficient,MIC)判定不同量測的相關(guān)性,從而篩選出重要且不冗余的量測數(shù)據(jù)。然后,基于GAF 特征變換,將一維時間斷面的量測數(shù)據(jù)變換為二維的GAF,利用三卷積層神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)準(zhǔn)確、穩(wěn)定的辨識拓?fù)洹T摲椒▋H需要部分節(jié)點電壓幅值量測的時間斷面數(shù)據(jù),適用于分布式能源接入、輻射狀拓?fù)浜铜h(huán)網(wǎng)拓?fù)浠旌线\行的配電網(wǎng)。
目前,配電網(wǎng)拓?fù)浔孀R問題中最為常用的量測數(shù)據(jù)是節(jié)點電壓幅值[5-8,12-13,16-17]?;跁r間斷面的節(jié)點電壓幅值進(jìn)行配電網(wǎng)拓?fù)浔孀R的原理如式(1)至式(3)所示。
式中:pi(t)、qi(t)和vi(t)分別為節(jié)點i在t時刻注入的有功功率、無功功率和電壓幅值;h(?)為潮流函數(shù);N為配電網(wǎng)節(jié)點總數(shù);εt為t時刻的拓?fù)浔孀R結(jié)果;C(t)為t時刻的節(jié)點電壓分布;g(?)為映射函數(shù)。
式(1)和式(2)表明,每個時間斷面的C(t)由pi(t)、qi(t)和εt共同決定。式(3)表明,對于一個由時間斷面的C(t)和相應(yīng)的εt組成的數(shù)據(jù)集,通過給定C(t)的相似規(guī)律,可從數(shù)據(jù)集中匹配對應(yīng)的ε(t),實現(xiàn)拓?fù)浔孀R[12-13,16-17]。
傳統(tǒng)的中壓配電網(wǎng)一般是輻射狀拓?fù)?當(dāng)不發(fā)生功率倒送或拓?fù)渲貥?gòu)時,配電網(wǎng)的潮流是單向的,方向從電源流向負(fù)荷[18],相應(yīng)的配電網(wǎng)各條線路節(jié)點電壓分布呈逐漸下降的趨勢。
分布式能源接入后,配電網(wǎng)的節(jié)點電壓分布變得更加復(fù)雜,可能引起饋線末端電壓抬升等[19]。輻射狀配電網(wǎng)閉合聯(lián)絡(luò)線形成弱環(huán)網(wǎng),不同合環(huán)點因電壓差的不同,會導(dǎo)致合環(huán)后對節(jié)點電壓的提升作用不同,甚至可能出現(xiàn)抑制作用[20]。下面將通過具體場景來說明分布式能源接入對C(t)的影響。
同一拓?fù)湎?考慮分布式能源隨機(jī)波動性前后的節(jié)點電壓分布特性如附錄A 圖A1 所示。不同拓?fù)湎?考慮分布式能源隨機(jī)波動性前后的節(jié)點電壓分布特性如圖A2 所示。可見,分布式能源隨機(jī)波動性會導(dǎo)致同一拓?fù)湎碌碾妷悍植继匦愿佣嘧?也可能導(dǎo)致不同拓?fù)湎碌碾妷悍植继匦猿尸F(xiàn)一定的相似性,增加準(zhǔn)確拓?fù)浔孀R的難度。
此外,受到量測噪聲的影響,節(jié)點電壓分布會因為局部數(shù)值發(fā)生偏差[21]而發(fā)生改變。若量測數(shù)據(jù)出現(xiàn)缺失,則大量有用的拓?fù)涮卣餍畔⒖赡軙G失[22]。
多種復(fù)雜因素使得配電網(wǎng)在不同拓?fù)湎碌碾妷悍植家?guī)律更為隱蔽。因此,建立時間斷面量測到配電網(wǎng)拓?fù)涞臏?zhǔn)確映射變得十分困難。為了實現(xiàn)基于節(jié)點電壓分布的相似規(guī)律辨識配電網(wǎng)拓?fù)?需要更為有效的數(shù)據(jù)挖掘方法提取在配電網(wǎng)電壓分布曲線中隱藏的拓?fù)涮卣餍畔ⅰ?/p>
本文提出了基于兩階段特征選擇和GAF 的配電網(wǎng)拓?fù)浔孀R方法,其框架如附錄A 圖A3 所示。該辨識方法由離線和在線這2 個階段組成。
1)離線階段。首先,將不同拓?fù)浣Y(jié)構(gòu)下的節(jié)點電壓幅值量測數(shù)據(jù)和相應(yīng)的運行拓?fù)錁?gòu)成樣本集。其次,對所有節(jié)點的量測數(shù)據(jù)進(jìn)行特征選擇,以篩選出不含冗余拓?fù)涮卣餍畔⒌牧繙y數(shù)據(jù)。最后,將量測數(shù)據(jù)進(jìn)行特征變換,即將一維的節(jié)點電壓幅值量測時間斷面數(shù)據(jù)轉(zhuǎn)變?yōu)槎S的GAF,傳輸至已設(shè)定的三卷積層神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行離線訓(xùn)練。
2)在線階段。采集配電網(wǎng)當(dāng)前時間斷面的節(jié)點電壓幅值量測數(shù)據(jù),并進(jìn)行特征變換,傳輸至訓(xùn)練好的拓?fù)浔孀R模型中辨識配電網(wǎng)當(dāng)前的運行拓?fù)?。其?節(jié)點電壓幅值量測數(shù)據(jù)可以通過數(shù)據(jù)采集與監(jiān) 控(supervisory control and data acquisition,SCADA)系統(tǒng)、智能電表或相量測量單元(phasor measurement unit,PMU)獲取。
特征選擇的目的是從配電網(wǎng)的全部量測數(shù)據(jù)中篩選出不含冗余拓?fù)涮卣餍畔⒌闹匾繙y數(shù)據(jù),指導(dǎo)配電網(wǎng)的量測優(yōu)化配置。篩選出的量測數(shù)據(jù)應(yīng)具備足夠的拓?fù)湫畔?保證拓?fù)浔孀R的準(zhǔn)確性。同時,量測數(shù)量應(yīng)盡可能少,以適應(yīng)配電網(wǎng)量測數(shù)據(jù)缺乏的實際。
XGBoost 是一種對梯度提升樹(gradient boosting decision tree,GBDT)模型進(jìn)行改進(jìn)和優(yōu)化的Boosting 集成學(xué)習(xí)算法,通過不斷擬合上一棵樹的殘差來迭代產(chǎn)生新樹,將所有樹模型組成準(zhǔn)確率更高、泛化能力更強(qiáng)的分類器[23]。此外,XGBoost還可以用于評價每個候選特征對于多分類問題的重要程度[23]。在本文中,拓?fù)浔孀R被處理為多分類問題,候選特征為節(jié)點電壓幅值量測數(shù)據(jù)。因此,本文將XGBoost 用于判定每個節(jié)點電壓量測對拓?fù)浔孀R問題的重要性,即通過決策樹計算每個節(jié)點電壓量測數(shù)據(jù)所有分裂子節(jié)點的信息增益。但是,依據(jù)重要度篩選出的量測數(shù)據(jù)可能包含大量冗余的拓?fù)涮卣餍畔ⅰ?/p>
MIC 是一種基于互信息和網(wǎng)格柵的關(guān)聯(lián)評價方法,可以捕捉變量之間的聯(lián)系并衡量相關(guān)關(guān)系[24]。其主要思想是,對于存在一定關(guān)聯(lián)的2 個變量,在二維平面繪制這2 個變量的網(wǎng)格柵,通過每個網(wǎng)格柵計算相應(yīng)的互信息值,將不同網(wǎng)格柵互信息的最大值作為MIC,常用于特征選擇。本文將MIC用于衡量不同節(jié)點電壓量測之間的相關(guān)程度,其優(yōu)勢是,對于相同噪聲水平的2 個不同量測的相關(guān)關(guān)系,可以客觀地給出相同或者相近的評價分?jǐn)?shù)。但是MIC 無法對候選量測的重要性進(jìn)行判斷。
因此,本文提出一種基于XGBoost 和MIC 的兩階段特征選擇方法,通過XGBoost 計算每個節(jié)點量測的重要性,基于MIC 判斷不同量測間的相關(guān)關(guān)系,刪除強(qiáng)相關(guān)且重要程度較低的量測數(shù)據(jù),將剩余量測數(shù)據(jù)作為特征選擇的結(jié)果。具體步驟如下:
步驟1:通過XGBoost 計算所有候選量測數(shù)據(jù)的重要度。
XGBoost 是由K棵決策樹組成的加法集成模型[23],如式(4)所示。
式中:SL、SR和SLR分別為葉子節(jié)點左決策子樹、右決策子樹和無分裂時式(6)的最優(yōu)解,用于衡量葉子節(jié)點對總體損失的貢獻(xiàn);D為信息增益,當(dāng)D<0時,表示決策樹停止分裂。
遍歷K棵決策樹,將各量測數(shù)據(jù)作為分裂量測時得出的信息增益進(jìn)行加權(quán)求和,作為該量測數(shù)據(jù)的重要程度。
步驟2:基于MIC 計算不同量測數(shù)據(jù)之間的相關(guān)關(guān)系[22]。
根據(jù)給定的網(wǎng)格柵,對vi和vj組成的二維空間進(jìn)行劃分,計算互信息值,表達(dá)式為:
由式(10)可知,當(dāng)Ii,j,MIC>τ時,表示vi和vj強(qiáng)相關(guān)。其中,τ為強(qiáng)相關(guān)閾值。
步驟3:判斷不同量測數(shù)據(jù)是否強(qiáng)相關(guān),若2 個候選量測數(shù)據(jù)強(qiáng)相關(guān),則刪除重要程度較低的量測數(shù)據(jù)。
將量測數(shù)據(jù)按重要程度降序排序,將排序結(jié)果記為量測組合M。令β=N,α=N-1。
對M進(jìn)行修正。對于M中第α個量測數(shù)據(jù)和第β個量測數(shù)據(jù)(α<β),若二者強(qiáng)相關(guān),則刪除第β個 量 測 數(shù) 據(jù),保 留 第α個 量 測 數(shù) 據(jù),α減 去1;若α=0,則β減去1,α=β-1。重復(fù)執(zhí)行,直至β=1結(jié)束,即排序結(jié)果中不再存在冗余量測數(shù)據(jù)。
特征變換的目的是在不破壞原有的拓?fù)涮卣鞯耐瑫r,將量測數(shù)據(jù)中隱藏的拓?fù)涮卣餍畔⑻崛〔⒈碚鞒鰜?。常用的特征變換方法包括主成分分析(principal component analysis,PCA)、小 波 變 換(wavelet transform,WT)和GAF 等。PCA 的本質(zhì)是降維,WT 的本質(zhì)是對信號序列的分解和再重構(gòu),二者在進(jìn)行特征變換的過程中,拓?fù)涮卣餍畔⒕嬖谝欢ǔ潭鹊膿p失。
GAF 是一種可以將一維信號序列編碼成二維圖譜的特征變換方法[25],包括格拉姆角求和場(Gramian summation angular field,GASF)和格拉姆角差分場(Gramian difference angular field,GADF),一般用于圖像分類問題。GAF 的本質(zhì)是升維,能夠充分挖掘樣本中的拓?fù)涮卣餍畔?以保證拓?fù)浔孀R效果。因此,本文考慮采用GAF 進(jìn)行特征變換,將一維的節(jié)點電壓量測數(shù)據(jù)轉(zhuǎn)換為圖像,通過深度學(xué)習(xí)模型進(jìn)行拓?fù)浞诸?。GAF 不僅可以保留節(jié)點電壓的分布規(guī)律,還可以提供節(jié)點之間的多種相對關(guān)系等其他拓?fù)涮卣餍畔?這對后續(xù)穩(wěn)定提取拓?fù)涮卣鞴ぷ髌鸬街匾饔谩?/p>
通過GAF 進(jìn)行特征變換的步驟如下:
步驟1:數(shù)值歸一化。對每個時刻的節(jié)點電壓量測數(shù)據(jù)進(jìn)行歸一化,表達(dá)式為:
若要同時包括GASF、GADF 中所表征的拓?fù)涮卣餍畔?只需保留GADF 的上三角元素和GASF的下三角元素。因此,本文結(jié)合GASF 和GADF,提出一種改進(jìn)的GAF 二維表示,記為改進(jìn)的GAF(Gramian angular field improved,GAFI),如式(17)所示。
在GAFI 中,主對角元素通過余弦函數(shù)關(guān)系保留節(jié)點電壓分布規(guī)律[25],v?i(t)和?i(t)的值可以通過余弦函數(shù)關(guān)系互相轉(zhuǎn)換。上三角元素采用余弦函數(shù)表征相對關(guān)系[25],由于余弦值在區(qū)間[0,π]內(nèi)單調(diào)遞減,表明不同節(jié)點的相對關(guān)系隨?i(t)值的增大而減弱。下三角元素采用正弦函數(shù)表征相對關(guān)系[25],由于正弦值在區(qū)間[-π/2,π/2]內(nèi)單調(diào)遞增,表明不同節(jié)點的相對關(guān)系隨?i(t)值的增大而增強(qiáng)。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)方法可有效提取圖像的高維空間關(guān)鍵特征[26]。因此,本文采用CNN 方法來提取二維GAF的有效拓?fù)涮卣餍畔?。具體步驟如下。
1)確定CNN 方法的基本結(jié)構(gòu)
CNN 方法的輸入為GAF,輸出為拓?fù)錁?biāo)簽。將單層卷積層、池化層和全鏈接層作為CNN 方法的基本結(jié)構(gòu)。采用Adam 算法[24]自適應(yīng)學(xué)習(xí),加速模型收斂,默認(rèn)學(xué)習(xí)率使用建議的0.001,神經(jīng)元個數(shù)設(shè)置為16。采用ReLu 函數(shù)作為卷積層的激活函數(shù),以增強(qiáng)模型的稀疏表示[26],采用Dropout 函數(shù)提升模型的泛化能力[27],采用Softmax 函數(shù)[27]將拓?fù)浔孀R結(jié)果輸出。
2)模型的超參數(shù)確定
本文通過交叉驗證的網(wǎng)格搜索法優(yōu)化和確定CNN 方法的超參數(shù)。首先,確定各超參數(shù)取值范圍,將各參數(shù)可能的離散取值進(jìn)行排列組合,構(gòu)建多個參數(shù)組合。其次,對于某個參數(shù)組合,采用6 折交叉驗證方法評估模型性能,即將樣本集隨機(jī)分為6 等份,每個回合不重復(fù)地選擇其中1 等份作為驗證集,其余5 等份作為訓(xùn)練集,分別訓(xùn)練和驗證CNN方法,并得到學(xué)習(xí)模型的性能分?jǐn)?shù),共6 個回合。然后,計算這6 個回合性能分?jǐn)?shù)的平均值作為該參數(shù)組合的最終性能分?jǐn)?shù)。最后,遍歷所有參數(shù)組合,取學(xué)習(xí)模型分?jǐn)?shù)最高的參數(shù)組合作為CNN 方法最優(yōu)的超參數(shù),如附錄A 圖A4 所示。圖中:卷積核尺寸為3,個數(shù)為32。3 次卷積和池化操作有效弱化了工程范圍內(nèi)噪聲數(shù)據(jù)的影響,并高度抽象了拓?fù)涮卣餍畔ⅰ?/p>
本文以改進(jìn)的IEEE 33 節(jié)點系統(tǒng)驗證所提方法的有效性。該系統(tǒng)的初始拓?fù)淙绺戒汚 圖A5 所示,線路參數(shù)可參考文獻(xiàn)[28]。在該系統(tǒng)中,分別接入2 組風(fēng)電機(jī)組和2 組光伏發(fā)電單元,接入位置和具體容量參考文獻(xiàn)[29]。使用Matpower 軟件仿真獲得所有節(jié)點的電壓量測數(shù)據(jù)[30]。假設(shè)光伏發(fā)電單元和風(fēng)機(jī)機(jī)組的出力曲線服從高斯分布,均值為每一時刻的實際出力,方差為實際出力的10%。假設(shè)負(fù)荷出力曲線也滿足高斯分布,均值為每一時刻的實際出力,方差設(shè)為實際出力的5%,負(fù)荷功率因數(shù)服從均勻分布U(0.75,0.85),其中,U(?)為平均分布函數(shù)。假設(shè)風(fēng)機(jī)能夠維持機(jī)端電壓恒定,將接入風(fēng)機(jī)的節(jié)點設(shè)置為有功功率-電壓(PV)節(jié)點,將接入光伏的節(jié)點設(shè)置為有功功率-無功功率(PQ)節(jié)點。
3.1.1 樣本生成
以附錄A 圖A5 所示的初始拓?fù)錇榛鶞?zhǔn),通過以下步驟生成典型拓?fù)錁?gòu)成待辨識的拓?fù)鋷?
步驟1:閉合任一或多個聯(lián)絡(luò)開關(guān)的同時,斷開相同數(shù)量的線路開關(guān)。
步驟2:直接閉合任一或多個聯(lián)絡(luò)開關(guān)。
形成的拓?fù)鋷熘邪?13 種輻射狀結(jié)構(gòu)和94 種環(huán)狀結(jié)構(gòu),樣本總數(shù)為240 574。每個樣本添加0.01%的零均值高斯噪聲[31]。數(shù)據(jù)缺失的模式參考文獻(xiàn)[32],數(shù)據(jù)缺失比例設(shè)置為5%,使用K近鄰(Knearest neighbor,KNN)方法填補(bǔ)缺失值[33]。訓(xùn)練集、驗證集、測試集數(shù)量的比例為8∶1∶1。采用精確率和召回率的調(diào)和平均值F1來評估拓?fù)浔孀R模型性能,計算公式如附錄A 式(A1)至式(A3)所示。
3.1.2 特征選擇方法驗證
采用XGBoost 計算量測數(shù)據(jù)的重要性,量測數(shù)據(jù)按重要程度降序排序結(jié)果如圖1 所示。不同量測數(shù)據(jù)之間的相關(guān)關(guān)系熱圖如附錄A 圖A6 所示。對量測組合進(jìn)行修正,GAF-CNN 方法測試集的F1與τ的關(guān)系如圖A7 所示。隨著強(qiáng)相關(guān)閾值的增加,特征選擇后所保留的量測數(shù)據(jù)個數(shù)也就越多。若采用全部特征進(jìn)行訓(xùn)練,測試集的F1值為99.03%。當(dāng)τ≥0.7 時,F1趨 于 穩(wěn) 定;當(dāng)τ<0.7 時,F1開 始 大 幅度下降。可見,當(dāng)τ=0.7 時,所篩選的量測組合為{V25,V18,V1,V22,V14,V33,V10,V7,V5,V29}已不含冗余拓?fù)涮卣餍畔?量測個數(shù)為10,測試集的F1值為97.16%。若未對量測組合進(jìn)行修正,直接選用降序排 序 結(jié) 果 中 前 10 的 量 測 組 合 為{V25,V18,V1,V22,V14,V33,V10,V12,V9,V7},測試集的F1為95.29%。其 中,V14與V12、V10與V9為 強(qiáng) 相關(guān)關(guān)系。這意味著,當(dāng)配電網(wǎng)量測數(shù)據(jù)不足時,不含冗余拓?fù)涮卣餍畔⒌牧繙y配置,要比直接選用XGBoost 降序結(jié)果中前10 位的量測數(shù)據(jù)更有效。
圖1 量測重要程度降序排序結(jié)果Fig.1 Sorting results in descending order of importance of measurements
3.1.3 GAF-CNN 方法驗證
為了驗證GAF-CNN 方法的有效性,選擇支持向量機(jī)(support vector machine,SVM)、深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)、CNN 等常用方法作為對照。
不同方法的拓?fù)浔孀R結(jié)果如表1 所示。表1 表明,在未進(jìn)行特征變換之前,CNN 方法的F1最高,為85.63%。DNN 方法的F1比CNN 方法小4.85%,SVM 方法的F1比CNN 方法小13.07 個百分點。在進(jìn)行特征變換之后,GASF-CNN 方法、GADF-CNN方法和GAFI-CNN 方法的F1分別為94.64%、95.01%、97.16%,相較于不采用特征變換的CNN方法分別提升了9.01、9.38、11.53 個百分點,表明GASF、GADF、GAFI 均能顯著提升CNN 方法的拓?fù)浔孀R性能,其中本文建立的GAFI 效果更為明顯。
表1 不同方法的拓?fù)浔孀R結(jié)果Table 1 Topology identification results with different methods
3.1.4 可視化解釋
為了直觀說明GAF 的有效性,本文將CNN 方法未能準(zhǔn)確辨識的部分樣本以熱圖形式描述,如附錄A 圖A8 所示。可以看出,GAF 可顯式地表達(dá)拓?fù)渲g的差異與共性。通過可視化工具t-SNE[34]將CNN 方法與GAFI-CNN 方法的最后一層輸出映射到二維平面上,可視化結(jié)果如圖2 所示。圖中:橫縱坐標(biāo)代表空間距離,每一個樣本映射為二維平面的一個點,點與點之間的距離表示樣本間的相似度。相似度高的點緊密聚合,相似度低的點距離疏遠(yuǎn)。每個點根據(jù)CNN 方法所擬合的映射關(guān)系,聚合成不同的簇。圖2 表明,與CNN 方法相比,GAFI-CNN方法的最后一層輸出存在更多的簇,簇間的層次更為分明??梢?GAF 能夠給CNN 方法提供更為明確的拓?fù)涮卣餍畔?包括節(jié)點電壓分布規(guī)律和節(jié)點之間隱藏的相對關(guān)系等。這些拓?fù)涮卣餍畔椭鶦NN 方法建立時間斷面量測到拓?fù)涞臏?zhǔn)確映射關(guān)系。
圖2 CNN 方法最后一層輸出的可視化結(jié)果Fig.2 Visualization results of last-layer outputs of CNN methods
本節(jié)采用的節(jié)點量測組合為{V25,V18,V1,V22,V14,V33,V10,V7,V5,V29},進(jìn)一步檢驗所提方法對于不同量測噪聲水平、不同數(shù)據(jù)缺失比例以及其他場景的適應(yīng)性。
3.2.1 不同噪聲水平
為了評估所提方法對不同量測噪聲水平的適應(yīng)性,本節(jié)在5 組不同程度的零均值高斯噪聲的樣本集進(jìn)行測試,噪聲的方差分別為0.01%、0.02%、0.03%、0.04%、0.05%,其余邊界條件與3.1.1 節(jié)保持一致。
不同量測噪聲水平對所提方法的影響如圖3 所示。圖3 表明,隨著噪聲水平的增加,GAF-CNN 方法的F1出現(xiàn)了不同程度的下降。但是,在最高0.05% 的量測噪聲水平下,F1仍可以維持在92%以上。
圖3 不同量測噪聲水平對所提方法的影響Fig.3 Influence of different noise levels on proposed method
量測數(shù)據(jù)的非同步性同樣會影響拓?fù)浔孀R的準(zhǔn)確性,體現(xiàn)為對真實值的偏移,即量測噪聲。本文考慮了多種量測噪聲的情況,能在一定程度上反映數(shù)據(jù)非同步性帶來的影響。本文的主要研究對象是中壓配電網(wǎng),其地理分布范圍較小,量測數(shù)據(jù)的非同步問題不突出。
3.2.2 不同數(shù)據(jù)缺失比例
為了評估所提方法對不同數(shù)據(jù)缺失比例的適應(yīng)性,本節(jié)在5 組不同數(shù)據(jù)缺失情況的樣本集進(jìn)行測試,數(shù)據(jù)缺失的比例分別為5%、10%、15%、20%、25%,其余邊界條件與3.1.1 節(jié)保持一致。
不同數(shù)據(jù)缺失比例的影響如附錄A 圖A9 所示。由圖可知,隨著數(shù)據(jù)缺失比例的增加,GAFCNN 方法的F1出現(xiàn)不同幅度的下降。但是在最高25%的數(shù)據(jù)缺失比例下,F1仍可以維持在95%以上,而CNN 方法的F1已下降至75.34%。
3.2.3 其他場景適應(yīng)性
本文選擇文獻(xiàn)[12-13]和文獻(xiàn)[16]所提的5 種場景,邊界條件如附錄A 表A1 所示。辨識結(jié)果的比較如表A2 所示。在場景1 中,所提方法的F1可達(dá)99.34%,在場景2 和場景5 中,所提方法的F1分別為99.62%和99.72%。這意味著,輸入僅包含節(jié)點電壓幅值量測可保證拓?fù)浔孀R性能,其他量測數(shù)據(jù)對最終性能提升有限。在場景3 和場景4 中,所提方法的F1超過98%。這表明,所提方法在其他場景下具備良好的適應(yīng)性。
本文提出一種基于兩階段特征選擇和GAF 的配電網(wǎng)拓?fù)浔孀R方法。通過算例分析,得到如下結(jié)論:
1)所提方法基于XGBoost 計算量測數(shù)據(jù)重要性,通過MICE 判定不同量測數(shù)據(jù)的相關(guān)性,可以指導(dǎo)篩選不含冗余拓?fù)涮卣餍畔⒌闹匾繙y組合,能夠給配電網(wǎng)配置量測數(shù)據(jù)提供更為合適的參考。
2)所提方法將一維的節(jié)點電壓幅值時間斷面量測數(shù)據(jù)變換為二維的GAF,結(jié)合三卷積層的神經(jīng)網(wǎng)絡(luò)模型,可實現(xiàn)配電網(wǎng)在線拓?fù)浔孀R。
3)改 進(jìn) 的GAF 二 維 表 示GAFI,與GASF 和GADF 相比,更能夠表征時間斷面中所蘊含的豐富的拓?fù)涮卣餍畔?顯著提升CNN 方法的辨識效果。
4)所提方法在不同噪聲水平、數(shù)據(jù)缺失比例以及其他場景下均具備良好的適應(yīng)性。
后續(xù)研究將考慮分布式電源接入的配電網(wǎng)進(jìn)行拓?fù)浜途€路參數(shù)的聯(lián)合辨識。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。