杜仲耀,陳曉英,鄧 宇,孫麗穎
(遼寧工業(yè)大學(xué)電氣工程學(xué)院,遼寧錦州 121001)
隨著大規(guī)模具有不確定性的光伏發(fā)電機(jī)組接入電網(wǎng),電力系統(tǒng)調(diào)度運(yùn)行的難度也在不斷增加[1]。2020 年12 月我國發(fā)布IEC 首個可再生能源功率預(yù)測國際標(biāo)準(zhǔn)——《可再生能源發(fā)電功率預(yù)測》(IEC TR 63043:2020),標(biāo)志著可靠的光伏發(fā)電功率預(yù)測(PVPF)將成為智能電網(wǎng)建設(shè)至關(guān)重要的組成部分。
由于受太陽運(yùn)動、環(huán)境條件、季節(jié)變化和地理位置等因素影響,光伏發(fā)電功率會有很大波動,融合深度學(xué)習(xí)建模和時間相關(guān)原理的日前光伏功率預(yù)測可以解決傳統(tǒng)人工智能方法對復(fù)雜非線性系統(tǒng)存在過擬合、泛化能力差的弊端[2]。由于深度學(xué)習(xí)對大量歷史數(shù)據(jù)的依賴性,在新建光伏電站數(shù)據(jù)不足的情況下,預(yù)測模型無法滿足調(diào)度機(jī)構(gòu)對預(yù)測精度的要求。
針對上述問題,本文研究日輻照度特征分析,引入t-SNE流形學(xué)習(xí)對氣象數(shù)據(jù)進(jìn)行特征提取,構(gòu)建基于日輻照度特征、光伏電池溫度、氣象數(shù)據(jù)特征的預(yù)測模型特征矩陣;建立遷移學(xué)習(xí)的GRU 神經(jīng)網(wǎng)絡(luò),使用長期運(yùn)行電站的歷史數(shù)據(jù)作為源域數(shù)據(jù)集進(jìn)行預(yù)測模型預(yù)訓(xùn)練,以新建光伏電站少量運(yùn)行數(shù)據(jù)作為任務(wù)域數(shù)據(jù)集,對光伏電站出力預(yù)測模型微調(diào),實現(xiàn)預(yù)測模型本地化。
光伏發(fā)電系統(tǒng)輸出功率受太陽輻照度、環(huán)境溫度、濕度等氣象因素的影響,面向太陽能資源的氣象數(shù)據(jù)集可為光伏功率預(yù)測提供多種可靠的數(shù)據(jù)支撐。由于太陽輻照度是影響光伏電站發(fā)電功率最重要的因素,精確地識別輻照度的數(shù)據(jù)特征對于時間序列的預(yù)測至關(guān)重要[3]。另一方面,氣象數(shù)據(jù)維數(shù)過高會增加預(yù)測特征的識別難度[4]。為降低歷史數(shù)據(jù)復(fù)雜度,本文構(gòu)建包括日輻照度特征、光伏電池溫度和氣象數(shù)據(jù)特征的預(yù)測特征矩陣F。
根據(jù)太陽輻照度隨天氣和季節(jié)變化波動的特點(diǎn)[5],在預(yù)測模型預(yù)訓(xùn)練和遷移學(xué)習(xí)過程中,使用天氣特征系數(shù)ME、季節(jié)特征系數(shù)SE和C.V日離散系數(shù)提取總輻照度GHI 數(shù)據(jù)特征,實現(xiàn)對源域和任務(wù)域數(shù)據(jù)的日輻照度特征輔助識別功能。
1.1.1 天氣特征系數(shù)
天氣特征系數(shù)描述的是預(yù)測日實際輻照度與理想輻照度的相關(guān)性,該系數(shù)越小輻照度受當(dāng)前工況氣象因素影響越明顯,實際輻照度波動性越強(qiáng)。天氣特征系數(shù)ME如式(1)所示:
式中:Xi為當(dāng)日第i時刻實際輻照度;X為當(dāng)日平均實際輻照度;Ci為當(dāng)日第i時刻實際輻照度;C為當(dāng)日平均理想輻照度,理想輻照度根據(jù)“晴空模型”計算[6]。
1.1.2 季節(jié)特征系數(shù)
季節(jié)特征系數(shù)對季節(jié)變化進(jìn)行量化,該系數(shù)越大越接近下一季節(jié)。季節(jié)特性系數(shù)SE如式(2)所示:
式中:Ni為不同季節(jié)平均輻照度等級,將不同季節(jié)平均輻照度從小到大分別取1 到4 級;Cimax為當(dāng)前季節(jié)理想最大輻照度。
1.1.3 日離散系數(shù)
為對不同日輻照度時間序列離散程度進(jìn)行區(qū)別,采用離散系數(shù)進(jìn)行度量而不是常見的標(biāo)準(zhǔn)差。離散系數(shù)C.V即標(biāo)準(zhǔn)差與平均值的比值,如式(3)所示:
光伏電池溫度的物理模型將神經(jīng)網(wǎng)絡(luò)的特征識別簡化[7],最大程度地發(fā)揮弱相關(guān)變量作用的同時降低了輸入變量復(fù)雜性。光伏電池組件溫度τ 如式(4)所示:)
式中:τ 為光伏電池組件溫度,℃;τair為環(huán)境溫度,℃;τNOCT為標(biāo)稱工作電池溫度,℃,在20 ℃,800 W/m2下確定;E為環(huán)境溫度下的輻照度,W/m2,此處視為總輻射GHI。
對于處理非線性強(qiáng)、弱相關(guān)變量多的問題[8],對光伏電站歷史運(yùn)行數(shù)據(jù)使用t 分布隨機(jī)近鄰嵌入(t-SNE)算法[9]進(jìn)行特征提取,通過降低數(shù)據(jù)特征復(fù)雜性,提高預(yù)測模型對數(shù)據(jù)特征的識別能力。t-SNE 算法提取氣象數(shù)據(jù)特征的具體步驟如下:
(1)設(shè)n個高維系統(tǒng)運(yùn)行數(shù)據(jù)集合S={x1,x2,…,xn},高維空間的數(shù)據(jù)點(diǎn)兩兩之間服從高斯分布,描述高斯中心相似的條件概率為Gj|i,如式(5)所示:
式中:σi為數(shù)據(jù)點(diǎn)xi的高斯分布方差。
(2)根據(jù)式(5)計算空間中任意兩個數(shù)據(jù)點(diǎn)的聯(lián)合概率分布Gij,如式(6)所示:
(3)設(shè)T={α1,α2,…,αm}為集合S在低維空間中服從自由度為l的t 分布的映射,則系統(tǒng)運(yùn)行數(shù)據(jù)任意兩個特征矩陣聯(lián)合概率分布Qij,如式(7)所示:
(4)t-SNE 將映射正確性用Kullback-Leibler 離散度DKL表示,如式(8)所示:
(5)利用梯度下降法迭代求最小離散度,使氣象特征矩陣T正確率最高。設(shè)最大迭代次數(shù)為S,則基于t-SNE 算法對高維數(shù)據(jù)區(qū)分?jǐn)?shù)據(jù)特征的流程,如圖1 所示。
圖1 利用t-SNE算法進(jìn)行高維數(shù)據(jù)降維流程
長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)作為時間序列預(yù)測領(lǐng)域最受關(guān)注的方案,由于其模塊參數(shù)多、結(jié)構(gòu)復(fù)雜、計算速度慢且處理大數(shù)據(jù)問題容易過擬合。門控循環(huán)單元(GRU)[9]只有更新門和重置門,保持LSTM 基本性能的同時具有更簡單結(jié)構(gòu),這在大數(shù)據(jù)預(yù)測領(lǐng)域具有重要意義。GRU 單元結(jié)構(gòu)如圖2所示。
圖2 門控循環(huán)單元結(jié)構(gòu)
GRU 單元傳遞方程如下:
令Zt為t時刻GRU 的更新門,Rt為t時刻GRU 的重置門,如式(9)和(10)所示:
式中:σ 為激勵函數(shù)Sigmoid;Xt和ht-1分別為當(dāng)前時刻輸入和上一時刻隱藏狀態(tài);Wr為輸入權(quán)重矩陣;Ur為回路連接的權(quán)重矩陣。
令ht為t時刻GRU 的當(dāng)前隱藏狀態(tài),如式(11)所示:
式中:⊙表示Hadamard 積。
上一時刻隱藏狀態(tài)ht′如式(12)所示:
式中:tanh 為雙曲正切函數(shù)。
綜上所述,當(dāng)更新門Zt=0 時完全遺忘上一時刻狀態(tài),當(dāng)Zt=1 時不再學(xué)習(xí)新數(shù)據(jù),即更新門的激活控制神經(jīng)網(wǎng)絡(luò)的長時期記憶能力。當(dāng)Rt=0 時只與當(dāng)前輸入有關(guān),當(dāng)Rt=1 時失去遺忘能力,即重置門的頻繁激活來控制短期記憶能力。
為解決新建光伏電站本地數(shù)據(jù)(目標(biāo)任務(wù)域)DT匱乏的問題,使用遷移學(xué)習(xí)將長期運(yùn)行的光伏電站歷史數(shù)據(jù)(源域)DS對新建電站預(yù)測模型預(yù)訓(xùn)練,本地數(shù)據(jù)完成預(yù)測模型的微調(diào),克服了傳統(tǒng)機(jī)器學(xué)習(xí)需滿足相同數(shù)據(jù)分布的問題。遷移學(xué)習(xí)的GRU 神經(jīng)網(wǎng)絡(luò)(TL-GRU)結(jié)構(gòu)如圖3 所示。
圖3 遷移學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
GRU 神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)主要分為2 個階段:
(1)模型預(yù)訓(xùn)練。基于TL-GRU 的預(yù)測模型,由1 個輸入層、2 個隱藏層和2 個全連接層(FC)組成;隨機(jī)初始化輸入權(quán)重和閾值;使用源域進(jìn)行預(yù)訓(xùn)練,產(chǎn)生初始網(wǎng)絡(luò)中隱藏狀態(tài)ht并在源域和目標(biāo)域之間共享。
(2)遷移學(xué)習(xí)。在預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,根據(jù)目標(biāo)域?qū)C 層進(jìn)行微調(diào)(Fine-tune)以限制遷移學(xué)習(xí)過擬合[10],完成模型本地化?;赥L-GRU 的預(yù)測輸出Pt如式(13)所示:
式中:Pt為目標(biāo)任務(wù)域中預(yù)測發(fā)電功率;Whj為隱藏層與第一層FC 的權(quán)重矩陣;W1i為第一層FC 與輸出層的權(quán)重矩陣;b1為第一層FC 的偏置量;b2為輸出層的偏置量。
本文研究的特征提取和遷移學(xué)習(xí)的GRU 神經(jīng)網(wǎng)絡(luò)預(yù)測模型(FTL-GRU)具體實現(xiàn)步驟總結(jié),基于特征遷移的光伏發(fā)電功率短期預(yù)測流程如圖4 所示。
圖4 光伏電站出力預(yù)測模型
基于特征遷移的光伏功率短期預(yù)測具體步驟如下:
(1)模型特征構(gòu)建:根據(jù)式(1)~(4)計算太陽輻照度的日天氣特征ME、季節(jié)特征SE、日離散系數(shù)C.V和光伏電池組件溫度τ;將氣象數(shù)據(jù)使用t-SNE 算法進(jìn)行特征提取,得到氣象特征矩陣T以提取源域和任務(wù)域公共特征。綜上確定基于特征遷移的GRU 神經(jīng)網(wǎng)絡(luò)預(yù)測模型的輸入特征矩陣F,如式(14)所示:
(2)訓(xùn)練樣本選?。涸慈蝿?wù)特征集FS作為預(yù)訓(xùn)練數(shù)據(jù)集。
(3)預(yù)訓(xùn)練模型:根據(jù)FS對預(yù)測模型進(jìn)行預(yù)訓(xùn)練,學(xué)習(xí)率設(shè)置為0.9;建立基于遷移學(xué)習(xí)的GRU 神經(jīng)網(wǎng)絡(luò)。
(4)遷移學(xué)習(xí)樣本選?。焊鶕?jù)目標(biāo)特征集FT對預(yù)訓(xùn)練預(yù)測模型進(jìn)行遷移學(xué)習(xí)。
(5)參數(shù)微調(diào):根據(jù)式(13)對GRU 神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào),學(xué)習(xí)率設(shè)置為0.01。
(6)功率預(yù)測:使用自適應(yīng)矩估計(Adam)作為求解優(yōu)化器,根據(jù)標(biāo)準(zhǔn)化輸出與實際功率計算損失函數(shù)MSE,利用完成遷移學(xué)習(xí)的預(yù)測模型,根據(jù)未來24 h 數(shù)值天氣預(yù)報數(shù)據(jù),預(yù)測未來24 h 光伏發(fā)電功率。
光伏電站出力預(yù)測誤差對于評估模型的預(yù)測精度至關(guān)重要,本文選用NRMSE和NMAPE作為光伏功率預(yù)測評價指標(biāo),如式(15)(16)所示:
式中:yi和pi為光伏功率的實際測量值和相應(yīng)的預(yù)測值。
為驗證基于FTL-GRU 的光伏功率短期預(yù)測模型性能,首先選用DKA 太陽能研究中心數(shù)據(jù)作為DS[11]共35 136 個數(shù)據(jù)點(diǎn)366 d,使用我國中部某光伏電站歷史數(shù)據(jù)為DT共2 880 個數(shù)據(jù)點(diǎn)30 d。時間分辨率為15 min,預(yù)測時間為日前24 h,預(yù)測數(shù)據(jù)集DP?DT共96 個數(shù)據(jù)點(diǎn),代碼編輯器采用PyCharm。
為消除變量間數(shù)量級差異對神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)增益的影響,將數(shù)據(jù)歸一化,以保持發(fā)電功率與各變量之間的相關(guān)性。除發(fā)電功率外其他變量均使用一般歸一化公式,標(biāo)準(zhǔn)發(fā)電功率PNormal如式(17)所示:
式中:P為功率值;PCapacity為當(dāng)前在線光伏裝機(jī)容量。輻照度過低而功率倒灌時P為0。
為量化t-SNE 算法特征提取的性能,引入Spearman 相關(guān)性系數(shù)對氣象特征矩陣T與原始數(shù)據(jù)S=DS∪DT各向量相關(guān)性進(jìn)行比較。原始數(shù)據(jù)S包括:光伏電站實際發(fā)電功率(Power)、風(fēng)速(WS)、環(huán)境溫度(WT)、環(huán)境濕度(WRH)、地面水平輻照度(GHI)、散射輻照度(DHI)、風(fēng)向(WD)、和日降水量(WDR)共8 個向量。
將傳統(tǒng)主成分分析(PCA)和t-SNE 算法特征提取能力進(jìn)行比較,如表1 所示。
表1 特征提取能力對比
由表1 可知,與原始數(shù)據(jù)相比,特征提取后各變量與功率的相關(guān)性明顯加強(qiáng),且t-SNE 算法性能明顯優(yōu)于PCA。t-SNE算法所構(gòu)建特征矩陣T和原始數(shù)據(jù)各變量相關(guān)性系數(shù)如表2。
表2 相關(guān)性系數(shù)
在原始數(shù)據(jù)S 中,GHI 與發(fā)電功率相關(guān)性系數(shù)為0.991,對功率具有決定性作用,其他因素相關(guān)性不明顯且變量較多,不利于神經(jīng)網(wǎng)絡(luò)預(yù)測模型的特征識別。氣象特征矩陣T各向量與功率輸出相關(guān)性分別為-0.498、0.582 和0.641,均呈現(xiàn)強(qiáng)相關(guān)且復(fù)雜性更低。
為精確對比預(yù)測性能,本文將特征遷移的GRU 神經(jīng)網(wǎng)絡(luò)預(yù)測模型(FTL-GRU)與其他預(yù)測模型進(jìn)行比較,如圖5 所示。
圖5 各預(yù)測模型對照
其中,LSTM 和GRU 模型表示使用DS對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練及預(yù)測;F-GRU 模型表示使用FS對GRU 網(wǎng)絡(luò)訓(xùn)練及預(yù)測;FN-GRU 模型表示使用FS完成訓(xùn)練并對DP進(jìn)行預(yù)測。
由圖5(a)和表3 可知,相比于LSTM,由于GRU 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)較為簡單,在處理光伏功率預(yù)測這類復(fù)雜問題時,能夠?qū)?shù)據(jù)波動特征更精準(zhǔn)地捕捉。
表3 不同模型性能指標(biāo)對比 %
GRU 與F-GRU 模型進(jìn)行比較如圖5(b),F(xiàn)-GRU 預(yù)測精度NMAPE為8.772%,NRMSE為11.012%,均優(yōu)于單獨(dú)的GRU 網(wǎng)絡(luò)模型。據(jù)此可知,建立特征矩陣能有效提高預(yù)測模型的特征識別精度,提高預(yù)測性能。
FN-GRU 模型的NMAPE為15.291%,NRMSE為15.223%,預(yù)測精度和穩(wěn)定性都低于其他模型。這表明,直接使用其他光伏電站預(yù)測模型用于DP的預(yù)測任務(wù),其泛化能力不足以滿足預(yù)測要求。
如圖5(c)及表3 所示,本文所研究的FTL-GRU 預(yù)測模型,NMAPE為6.236%,NRMSE為9.325%。遷移學(xué)習(xí)的預(yù)測模型能夠在缺乏歷史數(shù)據(jù)的新任務(wù)上微調(diào)預(yù)訓(xùn)練的網(wǎng)絡(luò),預(yù)測模型具有較好的適應(yīng)能力。不同預(yù)測模型可靠性誤差如表3 所示。
本文使用日輻照度特征、光伏電池溫度和t-SNE 算法對氣象數(shù)據(jù)進(jìn)行特征提取,構(gòu)建光伏功率預(yù)測特征矩陣。相比于直接輸入光伏電站歷史運(yùn)行數(shù)據(jù),構(gòu)建預(yù)測特征矩陣F可以更好地捕捉氣象特征,降低數(shù)據(jù)復(fù)雜度以提升模型對高維數(shù)據(jù)特征的識別能力。為解決新建光伏電站時神經(jīng)網(wǎng)絡(luò)預(yù)測模型所需訓(xùn)練數(shù)據(jù)不足的問題,采用遷移學(xué)習(xí)對GRU 神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使用長期運(yùn)行光伏電站數(shù)據(jù)完成預(yù)訓(xùn)練,少量新建光伏電站數(shù)據(jù)對預(yù)訓(xùn)練模型進(jìn)行微調(diào),完成預(yù)測模型本地化。仿真結(jié)果表明,采用該方案的新建光伏電站預(yù)測精度與基于本地大數(shù)據(jù)的預(yù)測模型精度相當(dāng),達(dá)到預(yù)訓(xùn)練模型本地化的目標(biāo),為調(diào)度機(jī)構(gòu)提供可靠信息。