李保羅,孫華東,張恒旭,高 磊,徐式蘊(yùn),黃彥浩
(1. 電網(wǎng)智能化調(diào)度與控制教育部重點(diǎn)實(shí)驗(yàn)室(山東大學(xué)),山東省濟(jì)南市 250061;2. 中國電力科學(xué)研究院有限公司,北京市 100192)
隨著新能源滲透率不斷升高,電力系統(tǒng)的運(yùn)行面臨更復(fù)雜的動(dòng)態(tài)現(xiàn)象,暫態(tài)擾動(dòng)傳播速度快、范圍廣,一旦發(fā)生失穩(wěn),系統(tǒng)會(huì)遭受嚴(yán)重影響[1]。因此,針對新型電力系統(tǒng)時(shí)變性強(qiáng)、復(fù)雜度高等難題,提高暫態(tài)穩(wěn)定評估(transient stability assessment,TSA)方法的可靠性具有重要意義[2]。
數(shù)據(jù)驅(qū)動(dòng)法被廣泛應(yīng)用于TSA 的研究,并取得了良好的評估性能[3-5]。但這類研究假設(shè)訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)服從獨(dú)立同分布,一旦電網(wǎng)的運(yùn)行方式或拓?fù)浣Y(jié)構(gòu)發(fā)生較大變化,該假設(shè)難以成立,導(dǎo)致模型的評估性能受到極大影響。針對此問題,部分研究通過增強(qiáng)訓(xùn)練數(shù)據(jù)庫或采用先進(jìn)的建模技術(shù)來構(gòu)建通用的TSA 模型。文獻(xiàn)[6]定義重要線路集,將集合中線路停運(yùn)的拓?fù)浣Y(jié)構(gòu)數(shù)據(jù)加入訓(xùn)練數(shù)據(jù)庫,增強(qiáng)模型對拓?fù)渥兓膶W(xué)習(xí)。文獻(xiàn)[7]針對不同拓?fù)浣Y(jié)構(gòu)訓(xùn)練不同的子模型,利用馬氏距離和集成學(xué)習(xí)進(jìn)行綜合判穩(wěn)。文獻(xiàn)[8-9]將電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)集成到圖神經(jīng)網(wǎng)絡(luò),增強(qiáng)模型對拓?fù)浣Y(jié)構(gòu)變化的魯棒性。上述研究為通用模型的構(gòu)建提供了新思路,但相似的拓?fù)浣Y(jié)構(gòu)會(huì)增加數(shù)據(jù)庫的冗余,導(dǎo)致通用模型的訓(xùn)練難度增加。當(dāng)面對未知拓?fù)浣Y(jié)構(gòu)時(shí),圖神經(jīng)網(wǎng)絡(luò)的評估性能會(huì)下降,需要及時(shí)更新。因此,制定更新框架是必要的。為表述方便,將模型調(diào)整期稱為過渡期;將變化前和變化后的電力系統(tǒng)稱為源域和目標(biāo)域。
更新框架的研究可分為2 類:1)提高過渡期內(nèi)模型的可用性;2)縮短過渡期。第1 類研究采用短時(shí)間尺度仿真的無標(biāo)注樣本進(jìn)行更新,如文獻(xiàn)[10]利用遷移成分分析(transfer component analysis,TCA)法對源域樣本進(jìn)行遷移,得到大量可用數(shù)據(jù);文獻(xiàn)[11]采用樣本遷移和特征遷移實(shí)現(xiàn)了小樣本條件下的快速更新。該類研究旨在短時(shí)間內(nèi)將模型的性能提升至可用水平,但已有研究采用的傳統(tǒng)遷移學(xué)習(xí)技術(shù)難以滿足更新過程中端到端(end-to-end,E2E)的需求。第2 類研究采用長時(shí)間尺度仿真的標(biāo)注樣本進(jìn)行更新,如文獻(xiàn)[12]采用增量學(xué)習(xí)降低標(biāo)注樣本的需求量;文獻(xiàn)[13]采用持續(xù)學(xué)習(xí)使得更新后的模型保持原有知識(shí)不被遺忘;文獻(xiàn)[14]提出將最小均衡樣本集和微調(diào)技術(shù)應(yīng)用于更新框架;文獻(xiàn)[15]首先生成少量標(biāo)注樣本,通過改進(jìn)生成對抗網(wǎng)絡(luò)生成大量同分布樣本,然后將其與源域遷移樣本合并用來微調(diào)模型;文獻(xiàn)[16]利用主動(dòng)學(xué)習(xí)從無標(biāo)注樣本中篩選高價(jià)值樣本進(jìn)行仿真得到其標(biāo)注,并用于后續(xù)的更新過程。該類研究通過引入更多可用樣本或采用樣本需求量更小的算法來縮短過渡期。事實(shí)上,2 類研究具有互補(bǔ)性,完整的更新框架應(yīng)同時(shí)涵蓋2 類研究,分別實(shí)現(xiàn)模型可用性增強(qiáng)和過渡期優(yōu)化,綜合提高模型對電力系統(tǒng)的自適應(yīng)性。
基于此,本文將2 類研究融合,提出一種基于兩階段遷移學(xué)習(xí)的TSA 框架。在第1 階段,利用深度子領(lǐng)域自適應(yīng)網(wǎng)絡(luò)(deep subdomain adaptation network,DSAN)和少量無標(biāo)注樣本以E2E 的方式完成過渡期內(nèi)模型的初步更新;在第2 階段,通過樣本遷移和模型遷移將評估性能提升至較高水平,縮短過渡期。算例結(jié)果表明所提框架具有完備性,2 個(gè)階段具有良好的銜接性,能有效應(yīng)對電網(wǎng)的突發(fā)變化。
評估模型的構(gòu)建分為數(shù)據(jù)庫的建立、評估模型的設(shè)計(jì)和更新。數(shù)據(jù)庫的建立包括數(shù)據(jù)的生成和輸入特征的構(gòu)建。特征構(gòu)建可以從兩方面考慮:1)在表征能力方面,特征應(yīng)與暫態(tài)穩(wěn)定性強(qiáng)相關(guān);2)在魯棒性方面,若直接采用電氣量,一旦數(shù)據(jù)延時(shí)或拓?fù)渥兓?部分電氣量可能缺失,而殘缺的特征矩陣無法輸入模型獲取系統(tǒng)的穩(wěn)定狀態(tài)。因此,將故障后的母線電壓視為軌跡簇,根據(jù)幾何屬性定義29 個(gè)輸入特征[17-18],其構(gòu)建方法見附錄A 表A1。穩(wěn)定的判據(jù)參考暫態(tài)穩(wěn)定指數(shù)MTSI:
式中:Δδmax為仿真時(shí)長內(nèi)任意2 臺(tái)發(fā)電機(jī)轉(zhuǎn)子的最大相對角度。當(dāng)MTSI>0 時(shí),系統(tǒng)穩(wěn)定,樣本標(biāo)注為1;反之,樣本標(biāo)注為0。
評估模型的設(shè)計(jì)主要是根據(jù)任務(wù)的需求選擇算法的類型和超參數(shù),考慮到后續(xù)遷移學(xué)習(xí)的應(yīng)用,選擇具有靈活結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)作為TSA 模型,其結(jié)構(gòu)見附錄A 圖A1。由于電力系統(tǒng)存在嚴(yán)重的類別不平衡現(xiàn)象,CNN 采用焦點(diǎn)損失函數(shù),其詳情見文獻(xiàn)[19]。
評估模型的更新先根據(jù)系統(tǒng)的變化生成新數(shù)據(jù),再對模型進(jìn)行維護(hù)?;谏疃壬窠?jīng)網(wǎng)絡(luò)(deep neural network,DNN)的TSA 模型,其淺層網(wǎng)絡(luò)學(xué)習(xí)暫態(tài)特性的通用特征,而深層網(wǎng)絡(luò)學(xué)習(xí)與具體系統(tǒng)強(qiáng)相關(guān)的專用特征,屬于高階特征層。因此,固定淺層網(wǎng)絡(luò),僅調(diào)整深層網(wǎng)絡(luò)的參數(shù)即可完成更新。微調(diào)正是基于此對源域模型進(jìn)行遷移,既降低了訓(xùn)練時(shí)間,又無形中擴(kuò)充了訓(xùn)練數(shù)據(jù)。本文將DSAN和微調(diào)用于不同階段以提高更新框架的完備性。
第1 階段旨在提高過渡期內(nèi)模型的可用性,此時(shí)樣本匱乏且缺乏標(biāo)注,需要利用網(wǎng)絡(luò)的表征能力完成不同域的數(shù)據(jù)分布自適應(yīng),才能學(xué)習(xí)到最優(yōu)的目標(biāo)域模型。
式中:f*為目標(biāo)函數(shù);J(?)為損失函數(shù);f(?)為DNN的預(yù)測函數(shù);d(?)為遷移正則項(xiàng),通常表示源域和目標(biāo)域在網(wǎng)絡(luò)深層的全局?jǐn)?shù)據(jù)分布差異;λ為正則化參數(shù)。
由于系統(tǒng)變化后暫態(tài)穩(wěn)定性會(huì)減弱,導(dǎo)致源域和目標(biāo)域的類別分布出現(xiàn)差異性。全局領(lǐng)域自適應(yīng)后,不同類別的樣本處于混淆狀態(tài),難以準(zhǔn)確分類,如附錄A 圖A2(a)所示。考慮到同類別的子領(lǐng)域之間更具有相關(guān)性,應(yīng)利用類別關(guān)系進(jìn)行相關(guān)子領(lǐng)域?qū)R,使不同域的全局分布和局部分布同時(shí)被拉近,降低分類難度,如圖A2(b)所示。
式中:Ec(?)為類別c的數(shù)學(xué)期望函數(shù)。
領(lǐng)域自適應(yīng)的核心是選擇合適的遷移正則項(xiàng)來度量不同域的數(shù)據(jù)分布差異。最大均值差異(maximum mean discrepancy,MMD)是使用最廣泛的度量之一。定義H為由顯著核k定義的再生核希爾伯特空間(reproducing kernel Hillbert space,RKHS),dH(p,q)為數(shù)據(jù)分布p和q間的MMD,即
式中:L為網(wǎng)絡(luò)層的集合。
不同運(yùn)行方式或拓?fù)浣Y(jié)構(gòu)之間的暫態(tài)特性變化不清晰,導(dǎo)致不同域之間的差異性可能較大。因此,DSAN 結(jié)構(gòu)的設(shè)計(jì)思路如下:1)多層適配,暫態(tài)數(shù)據(jù)的復(fù)雜性使高層的可遷移性較差,僅調(diào)整單層難以消除差異性,故對多個(gè)高層進(jìn)行調(diào)整;2)采用多核-局部最大均值差異(multi-kernel-local maximum mean discrepancy,MK-LMMD),即采用多個(gè)不同σ的高斯核的線性組合來綜合衡量不同域之間的距離,增強(qiáng)高階特征層的可遷移能力。
圖1 DSAN 的網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Network structure of DSAN
根據(jù)時(shí)序關(guān)系,將更新框架分為離線階段、在線階段、第1 階段和第2 階段,如圖2 所示。
圖2 所提框架的整體更新流程Fig.2 Overall updating process of proposed framework
1)離線階段:以時(shí)域仿真為主來生成源域數(shù)據(jù)庫。其中,預(yù)想故障集包括拓?fù)浣Y(jié)構(gòu)、發(fā)電水平、負(fù)荷水平、故障位置、故障類型和故障持續(xù)時(shí)間。
2)在線階段:當(dāng)電網(wǎng)處于常規(guī)運(yùn)行狀態(tài)時(shí),直接利用評估模型對實(shí)時(shí)量測數(shù)據(jù)進(jìn)行判穩(wěn),稱為評估模式Ⅰ。當(dāng)電網(wǎng)出現(xiàn)預(yù)想故障集外的運(yùn)行方式或拓?fù)浣Y(jié)構(gòu)時(shí),需啟動(dòng)第1 階段進(jìn)行初步更新,將得到的目標(biāo)域模型Ⅰ用于評估模式Ⅱ。該模式先將實(shí)時(shí)測量數(shù)據(jù)輸入目標(biāo)域模型Ⅰ,計(jì)算分類概率。若分類概率值大于離線階段設(shè)定的分類閾值,則直接輸出評估結(jié)果;反之,利用時(shí)域仿真進(jìn)行判穩(wěn)。當(dāng)?shù)?階段完成時(shí),目標(biāo)域模型Ⅱ?qū)⑷〈繕?biāo)域模型Ⅰ,并恢復(fù)評估模式Ⅰ。
3)第1 階段:針對未知工況進(jìn)行短時(shí)間尺度仿真,生成少量無標(biāo)注樣本,時(shí)間尺度為故障開始后0.30 s。然后,利用源域數(shù)據(jù)庫、源域模型和目標(biāo)域數(shù)據(jù)庫對DSAN 進(jìn)行訓(xùn)練。當(dāng)分類損失和遷移損失的加權(quán)和達(dá)到最優(yōu)時(shí),將目標(biāo)域模型Ⅰ用于在線階段的評估模式Ⅱ。
4)第2 階段:將目標(biāo)域數(shù)據(jù)庫的容量擴(kuò)大,利用目標(biāo)域模型Ⅰ對其進(jìn)行分類概率的升序排列,選取前N個(gè)樣本進(jìn)行長時(shí)間尺度仿真獲取標(biāo)注,得到目標(biāo)域樣本集。實(shí)際應(yīng)用中根據(jù)系統(tǒng)需求選擇N。然后,采用歐氏距離對源域中不同類別的樣本進(jìn)行篩選,如式(13)所示。
式中:Dst為源域可遷移樣本集;E(?)為歐氏距離計(jì)算函數(shù);zs1和zs2分別為源域中穩(wěn)定和失穩(wěn)樣本的特征;θ為距離閾值。將源域可遷移樣本集與目標(biāo)域樣本集合并,利用微調(diào)進(jìn)行訓(xùn)練,直到分類損失達(dá)到最優(yōu),得到目標(biāo)域模型Ⅱ,結(jié)束本輪更新過程。
算例采用IEEE 10 機(jī)39 節(jié)點(diǎn)系統(tǒng)驗(yàn)證所提框架的有效性,在中國某省級電網(wǎng)上驗(yàn)證其泛化性能和時(shí)間成本。電力系統(tǒng)仿真軟件為PSD-BPA,深度學(xué)習(xí)框架為Pytorch。計(jì)算機(jī)配置為AMD Ryzen 7 5800 8 核3.40 GHz CPU,16 GB RAM 和NVIDIA GeForce RTX3060 顯卡。
本實(shí)驗(yàn)將系統(tǒng)按照線路功率的傳輸方向劃分為3 個(gè)區(qū)域,如附錄A 圖A3 所示。數(shù)據(jù)庫的設(shè)置見附錄A 表A2,其中S 表示源域數(shù)據(jù)庫,A 至F 和G 至I分別表示拓?fù)渥兓瓦\(yùn)行方式變化的目標(biāo)域數(shù)據(jù)庫,故障類型為三相短路,仿真時(shí)長為20 s。
為驗(yàn)證CNN 的評估性能,選擇4 種數(shù)據(jù)驅(qū)動(dòng)模型進(jìn)行對比:隨機(jī)森林(random forest,RF)、極限梯度提升機(jī)(extreme gradient boosting,XGB)、支持向量機(jī)(support vector machine,SVM)和DNN。RF和XGB 的基分類器個(gè)數(shù)為100;SVM 采用徑向基核函數(shù),懲罰系數(shù)為1;DNN 的結(jié)構(gòu)為512-256-128-64。激活函數(shù)均為Relu,初始學(xué)習(xí)率為0.001,動(dòng)量為0.95。同時(shí),為全面評估各模型的性能,選用以下4 種評估指標(biāo):
式中:fTP和fFP分別為穩(wěn)定樣本被正確和錯(cuò)誤分類的數(shù)量;fTN和fFN分別為失穩(wěn)樣本被正確和錯(cuò)誤分類的數(shù)量;PAcc為總體準(zhǔn)確率;PTSR和PTFR分別為正確識(shí)別失穩(wěn)樣本和穩(wěn)定樣本的準(zhǔn)確率;PGmean為綜合性能指標(biāo)。
將源域數(shù)據(jù)庫S 按4∶1 劃分為訓(xùn)練集和測試集,訓(xùn)練得到上述5 種模型,并在各數(shù)據(jù)庫上進(jìn)行測試。重復(fù)實(shí)驗(yàn)20 次,取均值作為最終結(jié)果,如附錄A 圖A4 所示。CNN 的覆蓋面積最大,說明其在源域和各目標(biāo)域上的評估性能均優(yōu)于對比模型。由圖A4(c)和(d)可知,系統(tǒng)的變化導(dǎo)致各模型的PTSR大幅度下降,而PTFR略有下降,其原因?yàn)?1)源域中穩(wěn)定樣本數(shù)量較多,模型充分學(xué)習(xí)了該類樣本的知識(shí);2)目標(biāo)域的類別比例發(fā)生變化,原分類邊界傾向?qū)⑹Х€(wěn)樣本誤判為穩(wěn)定。因此,后續(xù)將以PTSR和PGmean來衡量各階段的遷移效果。
在線階段中調(diào)度中心可能只得到部分母線的實(shí)時(shí)信息,此時(shí)基于母線電壓的TSA 模型已無法應(yīng)用,而軌跡簇特征仍保持維度不變,使模型可繼續(xù)工作。為驗(yàn)證軌跡簇特征的魯棒性,模擬母線信息缺失的情況對CNN 的性能進(jìn)行測試,結(jié)果如表1 所示,其中每種測試集均由隨機(jī)抽取的10 種不同母線缺失組合的數(shù)據(jù)構(gòu)成。
表1 缺失部分母線信息下模型的性能評估Table 1 Performance evaluation of model with missing partial bus information
由表1 可見,在缺失部分母線信息的情況下,模型仍能進(jìn)行精準(zhǔn)評估。直至缺失5 條母線信息時(shí),PAcc仍保持在95%以上。由此可見,基于電壓軌跡簇進(jìn)行TSA 可有效應(yīng)對信息缺失,具有獨(dú)特優(yōu)勢。
為驗(yàn)證DSAN 的有效性,本實(shí)驗(yàn)對源域模型CNN 進(jìn)行遷移,并選擇4 種深度遷移學(xué)習(xí)方法作為對比:深層域混淆(deep domain confusion,DDC)、深度 適 配 網(wǎng) 絡(luò)(deep adaptation network,DAN)、DCORAL(deep CORAL)、領(lǐng) 域 對 抗 神 經(jīng) 網(wǎng) 絡(luò)(domain adversarial neural network,DANN) 。DDC、DAN 和DCORAL 均 采 取DSAN 的 結(jié) 構(gòu)。DDC 將MMD 嵌 入FC3;DAN 將 多 核MMD 嵌 入FC1 至FC3;DCORAL 采 用CORAL 作 為 度 量 嵌 入FC3;DANN 的結(jié)構(gòu)見附錄A 圖A5。上述方法中遷移正則項(xiàng)λ為0.2,分類器和特征提取器的初始學(xué)習(xí)率分別為0.010 和0.001,每5 輪迭代學(xué)習(xí)率衰減10%。將各目標(biāo)域數(shù)據(jù)庫按4∶1 劃分為訓(xùn)練集和測試集。利用上述方法將CNN 遷移到各目標(biāo)域,重復(fù)實(shí)驗(yàn)20 次,將均值作為遷移結(jié)果,如表2 所示。其中,DSAN-1 和DSAN-3 分別表示DSAN 的單層和3 層適配。
表2 不同數(shù)據(jù)庫下各方法的遷移性能對比Table 2 Comparison of migration performance with each method in different databases
由表2 可知,DSAN-3 優(yōu)于其他方法。DCORAL 和DANN 分別利用空間對齊法和隱式距離量度來學(xué)習(xí)領(lǐng)域不變特征,在多個(gè)目標(biāo)域上取得了較好的遷移效果。以PTSR為準(zhǔn),在目標(biāo)域B、D、F上,DDC 和DAN 出現(xiàn)負(fù)遷移現(xiàn)象,這證明僅拉近全局分布距離會(huì)導(dǎo)致不同類別的子領(lǐng)域過于接近,而考慮相關(guān)子領(lǐng)域?qū)R是遷移過程的關(guān)鍵。DSAN可捕獲類別的細(xì)粒度信息,精準(zhǔn)完成遷移過程。此外,DSAN-3 優(yōu)于DSAN-1,說明增強(qiáng)高階特征層的適配能力可有效提升遷移效果。
為展示各方法的隨機(jī)性和差異性,將20 次遷移結(jié)果繪制成箱線圖,其中,箱子的上、下邊緣表示最大值和最小值,中間線表示中位數(shù),如圖3 所示。DSAN-3 的箱子整體處于最高水平。在目標(biāo)域E 上對比方法的遷移效果較差,這是因?yàn)榉诸愡吔绯霈F(xiàn)嚴(yán)重漂移,僅依靠全局域自適應(yīng)難以調(diào)整,導(dǎo)致遷移結(jié)果的規(guī)律存在隨機(jī)性。在目標(biāo)域H 上對比方法遷移后CNN 對穩(wěn)定樣本存在過擬合,導(dǎo)致DSAN的箱子下邊緣并未明顯高于其余箱子上邊緣。但DSAN 遷移后,PTSR接近PGmean,符合電力系統(tǒng)的誤判代價(jià)不同原則,故DSAN 更適用于過渡期的遷移任務(wù)。
圖3 重復(fù)實(shí)驗(yàn)下各遷移方法綜合性能的箱線圖Fig.3 Box plots of comprehensive performance for each transfer method in repeated tests
4.2 節(jié)中DSAN 利用大量樣本訓(xùn)練取得了良好的遷移效果,但過多的樣本數(shù)量會(huì)導(dǎo)致時(shí)間成本增加,故本節(jié)分析樣本數(shù)量對遷移結(jié)果的影響。將各目標(biāo)域數(shù)據(jù)庫按4∶1 劃分為訓(xùn)練集和測試集。以100 個(gè)樣本為間隔,從訓(xùn)練集中隨機(jī)抽取30 個(gè)不同規(guī)模的訓(xùn)練子集分別訓(xùn)練DSAN,利用測試集進(jìn)行測試,取20 次實(shí)驗(yàn)結(jié)果的均值作為最終結(jié)果,如圖4所示。
由圖4 可知,在各目標(biāo)域上,DSAN 僅需500 個(gè)樣本就能大幅提升模型的性能。這是因?yàn)楫?dāng)少量樣本能有效反映目標(biāo)域的數(shù)據(jù)分布時(shí),DSAN 就可以量度不同域的相似性,完成初步更新。當(dāng)樣本數(shù)量繼續(xù)增加時(shí),遷移效果不再顯著提升??紤]到時(shí)間成本和評估性能之間的平衡,IEEE 10 機(jī)39 節(jié)點(diǎn)系統(tǒng)選擇500 個(gè)樣本進(jìn)行遷移。
圖4 樣本數(shù)量對DSAN 的影響Fig.4 Impact of sample quantity on DSAN
雖然DSAN 具有時(shí)間優(yōu)勢,但目標(biāo)域模型Ⅰ的性能難以滿足TSA 的需求,須開啟分類閾值篩選。在附錄A 圖A1 中分類層由2 個(gè)神經(jīng)元組成,故輸出為二維向量[ε1,ε2],其中ε1和ε2分別為樣本屬于穩(wěn)定和失穩(wěn)的概率值。將ε1和ε2中的最大值記為εmax∈[0.5,1.0]。εmax越接近1,模型將樣本分類正確的概率越高;反之,分類正確的概率越低,此時(shí)屬于不確定情況,須利用時(shí)域仿真法進(jìn)行判穩(wěn)。定義樣本篩選率Pss為測試集中可由目標(biāo)域模型Ⅰ直接進(jìn)行判穩(wěn)的樣本比例,如式(18)所示。
式中:Nw為測試集中εmax大于分類閾值εt的樣本數(shù)量;Nt為測試集的樣本數(shù)量。為展示εt的作用,以遷移效果較差的目標(biāo)域H 為例,統(tǒng)計(jì)不同εt下目標(biāo)域模型Ⅰ的評估指標(biāo),如附錄B 圖B1 所示。隨著εt增大,Pss逐漸下降,評估性能大幅提升。這說明將分類概率低于εt的樣本視為不確定情況是合理的。考慮評估性能與Pss之間的平衡,設(shè)置最優(yōu)εt為0.9。為驗(yàn)證最優(yōu)εt的有效性,統(tǒng)計(jì)各目標(biāo)域上目標(biāo)域模型Ⅰ的性能變化,如表3 所示。
表3 中各評估指標(biāo)均在95%以上,Pss均在60%以上。這證明最優(yōu)εt設(shè)置為0.9 具有合理性,且與時(shí)域仿真法的結(jié)合可以增強(qiáng)目標(biāo)域模型Ⅰ的可用性,還能減少過渡期內(nèi)時(shí)域仿真的計(jì)算量。
表3 最優(yōu)εt下目標(biāo)域模型Ⅰ的性能Table 3 Performance of target domain model Ⅰwith optimal εt
為驗(yàn)證目標(biāo)域模型Ⅱ的評估性能,本實(shí)驗(yàn)設(shè)置如下方案進(jìn)行對比。
方案1:隨機(jī)生成目標(biāo)域樣本集和源域可遷移樣本集進(jìn)行微調(diào)。
方案2:僅利用高價(jià)值目標(biāo)域樣本集進(jìn)行微調(diào)。
方案3:利用高價(jià)值目標(biāo)域樣本集和源域可遷移樣本進(jìn)行微調(diào)。
上述方案中設(shè)置合適的距離閾值θ使得源域可遷移樣本集中包含穩(wěn)定和失穩(wěn)樣本各1 000 個(gè),設(shè)置目標(biāo)域數(shù)據(jù)庫的容量為1 000,目標(biāo)域樣本集選取前500 個(gè)樣本,取20 次實(shí)驗(yàn)的均值作為最終結(jié)果,如圖5 所示。
由圖5 可知,方案3 優(yōu)于方案1,這是因?yàn)槟繕?biāo)域模型Ⅰ已充分學(xué)習(xí)不同域之間的共性知識(shí),利用該模型篩選的樣本集能有效反映不同域之間的差異性,包含更多目標(biāo)域的專有知識(shí)。同時(shí)根據(jù)歐氏距離篩選與其相似性較高的源域樣本集也具有更強(qiáng)的可遷移性。方案3 優(yōu)于方案2 也說明從源域中遷移樣本能提升遷移效果。因此,方案3 充分利用目標(biāo)域模型Ⅰ優(yōu)化第2 階段的評估性能和時(shí)間成本,具有較高的可行性,可作為第2 階段的更新方案。
為驗(yàn)證所提框架的泛化性能和時(shí)間成本,本實(shí)驗(yàn)采用中國某省級電網(wǎng)進(jìn)行測試,其500 kV 主網(wǎng)接線圖和數(shù)據(jù)庫見附錄B 圖B2 和附錄A 表A2。其中,W 表示源域數(shù)據(jù)庫;T1、T2、T3 表示目標(biāo)域數(shù)據(jù)庫。在第1 階段,將目標(biāo)域模型Ⅰ與TCA 對比,先確定DSAN 和TCA 所需的無標(biāo)注樣本數(shù)量,數(shù)據(jù)集的劃分與4.3 節(jié)相同,結(jié)果分別見附錄B 圖B3 和圖B4。在目標(biāo)域T1、T2 和T3 上,DSAN 所需樣本均為800,TCA 所需樣本分別為1 200、1 300 和1 600,特征提取維度均為100。在第2 階段,將目標(biāo)域模型Ⅱ與主動(dòng)學(xué)習(xí)對比,設(shè)置目標(biāo)域數(shù)據(jù)庫的容量為2 000,目標(biāo)域樣本集選取前800 個(gè)樣本,源域遷移樣本集為2 000 個(gè)樣本;主動(dòng)學(xué)習(xí)的查詢策略為最小置信度,查詢樣本數(shù)量為1 100,其過程見圖B5。統(tǒng)計(jì)各方法的評估性能和時(shí)間成本,分別如表4 和表5 所示,其中,TCA 的特征遷移時(shí)間計(jì)入訓(xùn)練時(shí)間。
表4 中國某省級電網(wǎng)內(nèi)不同方法的性能對比Table 4 Performance comparison of different methods in a provincial power grid of China
表5 中國某省級電網(wǎng)內(nèi)不同方法的時(shí)間成本對比Table 5 Time cost comparison of different methods in a provincial power grid of China
由 表4 和 表5 可 知,與TCA 相 比,DSAN 僅需210 s 左右即可完成更新得到目標(biāo)域模型Ⅰ。同時(shí),DSAN 利用DNN 的表征能力提取更具表現(xiàn)力的特征,在評估性能上也取得較大優(yōu)勢。與主動(dòng)學(xué)習(xí)相比,目標(biāo)域模型Ⅱ直接學(xué)習(xí)不同域的差異性信息,無須多次迭代,且樣本遷移也充分?jǐn)U充了訓(xùn)練數(shù)據(jù),故取得了較好的評估性能。綜上,在時(shí)間上所提框架的2 個(gè)階段具有良好的銜接性,且綜合性能均優(yōu)于現(xiàn)有框架。
本文提出一種基于兩階段遷移學(xué)習(xí)的TSA 框架,在2 套系統(tǒng)上生成了多種拓?fù)浣Y(jié)構(gòu)和運(yùn)行方式的數(shù)據(jù)庫進(jìn)行測試,結(jié)論如下:
1)區(qū)別于非深度遷移學(xué)習(xí)方法,第1 階段中,DSAN 以E2E 的方式完成細(xì)粒度遷移,克服了不同域的類別分布變化,有效增強(qiáng)了模型的可用性;
2)第2 階段以目標(biāo)域模型Ⅰ為基礎(chǔ),利用高價(jià)值樣本集、樣本遷移和模型遷移技術(shù)有效提升模型的評估性能,降低了更新框架的時(shí)間成本;
3)相比已有研究,所提框架更具完備性。在不同的時(shí)間節(jié)點(diǎn),采用無監(jiān)督和有監(jiān)督深度遷移學(xué)習(xí)技術(shù)更新模型,既提高了過渡期內(nèi)模型的可用性,也縮短了過渡期,綜合提高了數(shù)據(jù)驅(qū)動(dòng)模型對電力系統(tǒng)的跟蹤能力。
本文初步探索了將無監(jiān)督和有監(jiān)督深度遷移學(xué)習(xí)技術(shù)同時(shí)引入更新框架的可能性,為增強(qiáng)框架的完備性提供了新思路,但在更新樣本生成方面仍有提升的空間和可能。后續(xù)的研究重點(diǎn)是開發(fā)高效樣本的生成策略和增強(qiáng)技術(shù),用以完善更新數(shù)據(jù)庫的多樣性,進(jìn)一步提高更新模型的性能,并降低更新框架的時(shí)間成本。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。