李建林,張海軍,龐俊強(qiáng)
(國華(河北)新能源有限公司, 張家口 07500)
大力發(fā)展可再生能源,增加可再生能源發(fā)電量是實(shí)現(xiàn)能源安全和環(huán)境保護(hù)可持續(xù)發(fā)展的根本途徑。2020年全國風(fēng)電新能裝機(jī)達(dá)到111 GW,伴隨著國家3060任務(wù)目標(biāo)的提出,“十四五”期間風(fēng)電裝機(jī)規(guī)模將進(jìn)一步提升,預(yù)計(jì)到2030年風(fēng)電裝機(jī)容量達(dá)12億千瓦時,2050年達(dá)24億千瓦時[1]。電力系統(tǒng)新能源接入進(jìn)入中高比例后,系統(tǒng)在穩(wěn)定控制、運(yùn)行、規(guī)劃等不同時間尺度將面臨多重挑戰(zhàn),準(zhǔn)確預(yù)報風(fēng)電場的送出功率對于高比例可再生能源的電力系統(tǒng)經(jīng)濟(jì)調(diào)度和安全運(yùn)行具有重要意義[2]。因此,在多尺度上提供高精度的風(fēng)速及功率預(yù)測方法是必需的。由于風(fēng)力發(fā)電機(jī)的輸出功率與風(fēng)速的立方成正比,準(zhǔn)確估計(jì)風(fēng)力發(fā)電機(jī)的輸出功率至關(guān)重要。近年來,許多研究文獻(xiàn)提出了功率預(yù)測模型,以期在實(shí)際應(yīng)用中找到一種有效的方法。這些模型大多依賴于復(fù)雜的統(tǒng)計(jì)和人工智能技術(shù),以及大量的氣象和地形數(shù)據(jù)[3]。理想情況下,這些方法能夠?qū)⒛茉聪到y(tǒng)內(nèi)的故障風(fēng)險降至最低,并通過建?;蚰M未來情景來預(yù)測其可靠性。但是,其可靠性取決于所用預(yù)測技術(shù)的準(zhǔn)確性,目前這一領(lǐng)域的研究和開發(fā)工作仍在繼續(xù)。
風(fēng)速預(yù)測是一項(xiàng)非常復(fù)雜的任務(wù),因?yàn)榫扰c不斷增加的預(yù)測時間幀之間存在負(fù)相關(guān),風(fēng)速時間序列數(shù)據(jù)的混沌特性導(dǎo)致預(yù)測精度在很大程度上依賴于時間間隔。根據(jù)氣象資料和應(yīng)用的時間尺度,文獻(xiàn)[4-6]總結(jié)了多種風(fēng)及功率預(yù)測方法,風(fēng)速預(yù)測一般分為短期、中期和長期預(yù)測三類。風(fēng)速預(yù)測模型常規(guī)包含物理方法、統(tǒng)計(jì)方法、人工智能方法和混合方法。物理方法由一些基于物理的方程組成,將某一時刻的氣象數(shù)據(jù)轉(zhuǎn)換為某一地點(diǎn)的預(yù)報風(fēng)速,是一種有效的長期預(yù)測方法[7]。統(tǒng)計(jì)方法是一種基于模式的短期預(yù)測技術(shù),其多利用曲線擬合等參數(shù)設(shè)計(jì)風(fēng)速預(yù)測模型,然后將近期實(shí)際數(shù)據(jù)與預(yù)測數(shù)據(jù)進(jìn)行比較,對設(shè)計(jì)模型進(jìn)行修正[8]。然而,統(tǒng)計(jì)方法不能單獨(dú)用于長期預(yù)測。相反,其他方法,如數(shù)值天氣預(yù)報、人工智能技術(shù)和混合方法,應(yīng)予以考慮。人工智能方法也是預(yù)測風(fēng)速數(shù)據(jù)的一種有效方法,優(yōu)點(diǎn)是不需要任何預(yù)定義的數(shù)學(xué)模型就可以預(yù)測未來的時間序列數(shù)據(jù),當(dāng)滿足相同或相似的模式時,可以達(dá)到最小的錯誤概率,缺點(diǎn)是隨著時間范圍擴(kuò)大,精確度顯著下降[9]。近年來人工神經(jīng)網(wǎng)絡(luò)作為一種非線性系統(tǒng)的預(yù)測和函數(shù)逼近方法得到了廣泛的應(yīng)用[10-15],由于其處理噪聲和不完全數(shù)據(jù)的能力,許多研究人員將人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于不同時間尺度的氣候變量時間序列預(yù)測,結(jié)果表明預(yù)測效果優(yōu)于傳統(tǒng)方法,一經(jīng)訓(xùn)練,可以以更高的速度執(zhí)行預(yù)測任務(wù)[16]?;旌戏椒ㄔ陬A(yù)測過程中使用一種或多種模型,以獲得最佳的預(yù)測性能并可減小誤差,與其他方法相比,混合方法看起來更準(zhǔn)確,常被用來預(yù)測未來一年的每小時風(fēng)速。
本研究應(yīng)用統(tǒng)計(jì)和神經(jīng)網(wǎng)絡(luò)組合方法,通過研究特定區(qū)域的風(fēng)速特征以期找到風(fēng)速變化的模式來預(yù)測下一年的每小時風(fēng)速數(shù)據(jù),長期預(yù)測區(qū)域內(nèi)的平均小時風(fēng)速及發(fā)電量。為了識別風(fēng)速趨勢,將一組識別子模式應(yīng)用于月平均預(yù)測,將神經(jīng)網(wǎng)絡(luò)應(yīng)用于與位置的識別模式相關(guān)聯(lián)的時間序列數(shù)據(jù),以優(yōu)化預(yù)測。
使用河北省張家口地區(qū)張北某風(fēng)電場數(shù)據(jù)和內(nèi)蒙烏蘭察布地區(qū)某風(fēng)電場數(shù)據(jù)測試,兩風(fēng)電場差距約300 km。河北省風(fēng)能資源豐富區(qū)主要分布在張家口、承德壩上地區(qū)和沿海秦皇島、唐山、滄州地區(qū)。張家口地區(qū)10 m高年平均風(fēng)速可達(dá)5.4~8 m/s,主風(fēng)向?yàn)槲鞅憋L(fēng),風(fēng)能資源十分豐富。張北風(fēng)電場安裝33臺1.5 MW風(fēng)機(jī),輪轂高度70 m,葉輪直徑82 m,功率曲線如圖1所示。烏蘭察布風(fēng)電場一期同樣安裝33臺1.5 MW風(fēng)機(jī),葉輪直徑87 m。圖2為張北風(fēng)電場2010~2020年間的70 m高度風(fēng)資源數(shù)據(jù),該圖顯示了月平均風(fēng)行為和風(fēng)速模式的季節(jié)性因素,通過研究風(fēng)場的風(fēng)速特征來預(yù)測下一年的風(fēng)速走勢,然后預(yù)測每小時風(fēng)速,繼而考慮電網(wǎng)等各種損失,預(yù)測風(fēng)電場發(fā)電量。
圖1 功率曲線
圖2 場址多年風(fēng)資源
對誤差進(jìn)行綜合評價是風(fēng)速及風(fēng)電功率預(yù)測理論研究的一項(xiàng)重要內(nèi)容。評價指標(biāo)能夠從各方面反映預(yù)測算法的運(yùn)行情況,本文選取平均絕對誤差來評價模型性能。平均絕對誤差是絕對誤差的平均值(MAE-mean absolute error)。它被用作衡量預(yù)測誤差的常用指標(biāo)。
式中:
N—數(shù)據(jù)個數(shù);
Pf—預(yù)測值;
Pa—實(shí)際值。
模型預(yù)測流程如圖3所示,主要是通過研究特定區(qū)域的風(fēng)速特征并找到風(fēng)速變化的模式來預(yù)測下一年的每小時風(fēng)速數(shù)據(jù),繼而預(yù)測發(fā)電量。上一年的總體趨勢作為輸入,實(shí)際小時數(shù)為目標(biāo),以訓(xùn)練網(wǎng)絡(luò)并更新神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的權(quán)重,然后使用神經(jīng)網(wǎng)絡(luò)模擬預(yù)測數(shù)據(jù)。模型詳細(xì)預(yù)測過程如下:
圖3 模型設(shè)計(jì)過程
步驟1:年風(fēng)速預(yù)測。使用ANN網(wǎng)絡(luò)架構(gòu)預(yù)測下一年月平均風(fēng)速。通過存儲獲得的輸出值作為反饋和輸入來預(yù)測序列。預(yù)測流程如圖4所示。本研究中的模型以過去10年(2010~2020年)的月平均月風(fēng)速數(shù)據(jù)為訓(xùn)練網(wǎng)絡(luò)(4年為輸入,2年為延遲,4年為目標(biāo)),輸出預(yù)測未來4年的月平均風(fēng)速。為了找到最佳的預(yù)測,對結(jié)果進(jìn)行檢驗(yàn),如果過去3年的誤差小于0.6 m/s,則接受第4年的預(yù)測值;否則,將重復(fù)訓(xùn)練,直到達(dá)到預(yù)期輸出。圖5為年預(yù)測風(fēng)速與實(shí)際數(shù)據(jù)的對比。
圖4 年度風(fēng)速預(yù)測
圖5 預(yù)測風(fēng)速與實(shí)際數(shù)據(jù)
步驟2:月風(fēng)速預(yù)測。由于風(fēng)速模式可能與上一年的風(fēng)速有很大的差異,統(tǒng)計(jì)方法無法幫助發(fā)現(xiàn)或預(yù)測風(fēng)速模式。由圖6月平均速度曲線可以發(fā)現(xiàn)每個月風(fēng)速存在周期性特征。鑒于模式存在一定的周期性變化,因此可以應(yīng)用神經(jīng)網(wǎng)絡(luò)對每個月的模式進(jìn)行預(yù)測。圖7是兩種網(wǎng)絡(luò)架構(gòu)示意圖,具體根據(jù)預(yù)測結(jié)果精度選擇使用,本例中,選用兩個前饋反向傳播網(wǎng)絡(luò)來預(yù)測每月的風(fēng)速形態(tài),兩層分別有7個和16個神經(jīng)元。選擇之前需要測試訓(xùn)練數(shù)據(jù)集數(shù)量對ANN預(yù)測結(jié)果精度的影響。用于訓(xùn)練模型的數(shù)據(jù)越多,獲得的準(zhǔn)確度就越高。兩層網(wǎng)絡(luò)情況下,第一個網(wǎng)絡(luò)利用上一年前6個月的平均風(fēng)速值訓(xùn)練后預(yù)測下一年前6個月的平均風(fēng)速值,同理,第二個網(wǎng)絡(luò)利用上一年后6個月的平均風(fēng)速值訓(xùn)練后預(yù)測下一年后6個月的平均風(fēng)速值示。僅單層網(wǎng)絡(luò)時,與其他訓(xùn)練數(shù)據(jù)集(一個月數(shù)據(jù)、兩個月數(shù)據(jù)等)相比,十一個月的數(shù)據(jù)給出了更準(zhǔn)確的預(yù)測。
圖6 每月風(fēng)速特征
圖7 ANN神經(jīng)網(wǎng)絡(luò)的架構(gòu)(級聯(lián)和反饋)
研究過程中同時需要觀察特征設(shè)計(jì)的效果以及隱藏層和隱藏神經(jīng)元的數(shù)量,并找出哪種模式的準(zhǔn)確率最高。測試流程與訓(xùn)練數(shù)據(jù)量測試流程相同,使用經(jīng)過測試的最佳數(shù)據(jù)集數(shù)量,本次使用11個月數(shù)據(jù)集合,不同的是在第二步中每個模型創(chuàng)建不同的 ANN 層架構(gòu),設(shè)置多種 層 架 構(gòu)(Layer_5_5,Layer_5_5_5,Layer_5_5_5_5,L a y e r_5_5_5_5_5,L a y e r_1 0_1 0_1 0_1 0_1 0,Layer_20_20,Layer_20_20_20,Layer_20_20_20_20,Layer_20_20_20_20_20等),然后使用訓(xùn)練數(shù)據(jù)集訓(xùn)練所有 ANN 模型,最后使用經(jīng)過訓(xùn)練的 ANN 模型的輸出作為能量估算應(yīng)用程序的輸入來獲得預(yù)測的發(fā)電量。對于給定的模式,ANN 層架構(gòu)越復(fù)雜,結(jié)果就越好。對于三種模式,與其余層(layer_5、layer_10、Layer_20 等)相比,layer 20_20_20_20_20 顯示出更好的結(jié)果。模式 3與layer_20_20_20_20_20組合對四個變量(風(fēng)速、溫度、風(fēng)向和功率)的預(yù)測吻合度最高,同時也說明輸入特征設(shè)計(jì)的復(fù)雜性越多,ANN 模型的準(zhǔn)確性就越高。
圖8 為網(wǎng)絡(luò)訓(xùn)練回歸結(jié)果,通常,經(jīng)過更多次訓(xùn)練后,誤差會減少,但隨著網(wǎng)絡(luò)開始過度擬合訓(xùn)練數(shù)據(jù),驗(yàn)證數(shù)據(jù)集上的誤差可能會開始增加,訓(xùn)練在驗(yàn)證錯誤連續(xù)6 次增加后停止,最佳性能取自驗(yàn)證錯誤最低的時期。
圖8 網(wǎng)絡(luò)訓(xùn)練回歸結(jié)果
為了更好地預(yù)測,需要對數(shù)據(jù)進(jìn)行一些修改。在本研究中,訓(xùn)練網(wǎng)絡(luò)之前使用了兩種數(shù)據(jù)修正方法。研究表明,在時間序列數(shù)據(jù)中,當(dāng)滿足相同或相似的模式時,可以實(shí)現(xiàn)最小的錯誤概率[14]。因此,將下半年的數(shù)據(jù)顛倒,用于訓(xùn)練和模擬的網(wǎng)絡(luò)輸入將變得幾乎相似,降低錯誤概率。樣本關(guān)聯(lián)函數(shù)可以識別神經(jīng)網(wǎng)絡(luò)中輸入和目標(biāo)之間的偏移量,使時間序列更加對稱。通過對不同時間段的數(shù)據(jù)遷移和不同神經(jīng)網(wǎng)絡(luò)的測試,發(fā)現(xiàn)該方法與鏡像函數(shù)(逆函數(shù))相結(jié)合,可使時間序列數(shù)據(jù)的誤差降低50 %。訓(xùn)練中時間序列數(shù)據(jù)移動約1個月,使時間序列數(shù)據(jù)對稱1年,在訓(xùn)練和模擬之后,將原點(diǎn)移回原始位置。
步驟3:每日風(fēng)速預(yù)測。從上一年的每小時風(fēng)速數(shù)據(jù)中提取每日風(fēng)速模式,如圖9所示。利用往年的氣象資料計(jì)算出每天每小時的平均小時風(fēng)速。然后,使用等式(2)對數(shù)據(jù)集進(jìn)行歸一化處理。式中,Vh,p計(jì)算每小時風(fēng)速,Va為平均小時風(fēng)速,Vh為逐小時風(fēng)速。
圖9 每月風(fēng)速特征
步驟4:模式識別。如圖10所示,一整年的一般趨勢是使用以上1~3步驟識別,用于從上一年每小時的風(fēng)速數(shù)據(jù)中提取日風(fēng)速的一般趨勢特征。
圖10 趨勢識別流程
步驟5:每小時風(fēng)速預(yù)測。如圖11所示,將去年的每小時的實(shí)際數(shù)據(jù)用作輸入和目標(biāo)來訓(xùn)練網(wǎng)絡(luò)并更新神經(jīng)元的權(quán)重。
圖11 日風(fēng)速預(yù)測
使用張北地區(qū)某風(fēng)電場和烏蘭察布某風(fēng)電場數(shù)據(jù)進(jìn)行測試,并與前饋,時延,分層遞歸和非線性自回歸神經(jīng)網(wǎng)絡(luò)進(jìn)行了比較。使用MAE作為不確定性度量指標(biāo)評估模型性能。通過使用帶有外部輸入的非線性自回歸網(wǎng)絡(luò)來預(yù)測年風(fēng)速,使用兩層前饋反向傳播網(wǎng)絡(luò)(中間層和輸出層具有8和30個神經(jīng)元)預(yù)測風(fēng)速的月度模式。
對于長期預(yù)測,前饋反向傳播網(wǎng)絡(luò)的性能要優(yōu)于時間序列神經(jīng)網(wǎng)絡(luò)[17]。從過去的數(shù)據(jù)中提取風(fēng)速的每日模式,兩層前饋反向傳播網(wǎng)絡(luò)分別具有30和12個神經(jīng)元,使用6~8年的平均每月風(fēng)速數(shù)據(jù)和僅1年的每小時數(shù)據(jù)來開發(fā)和優(yōu)化神經(jīng)網(wǎng)絡(luò)。對于MAE,本測試獲得的最佳配置精度約為0.6~0.8 m/s。
測試結(jié)果同時與文獻(xiàn)[18]中開發(fā)的幾種風(fēng)速預(yù)測方法進(jìn)行了比較。前饋網(wǎng)絡(luò)可以使用隱藏層中的神經(jīng)元來擬合輸入和輸出,具有外部輸入的非線性自回歸神經(jīng)網(wǎng)絡(luò)是一種遞歸動態(tài)網(wǎng)絡(luò),使用輸出作為輸入的反饋[19]。循環(huán)層網(wǎng)絡(luò)在除最后一層之外的每層均具有一個單個延遲的反饋環(huán)路,該環(huán)路可用于建模和過濾應(yīng)用程序,可以用于長期風(fēng)速預(yù)測[20]。
隱藏神經(jīng)單元數(shù)據(jù)采用反復(fù)實(shí)驗(yàn)法確定,由少到多,逐漸增加到26個神經(jīng)元,同時訓(xùn)練網(wǎng)絡(luò),直到達(dá)到最低的誤差。經(jīng)測試,本次前饋網(wǎng)絡(luò)的最佳神經(jīng)元數(shù)在輸入層和隱藏層分別為5和9,時間延遲和自回歸網(wǎng)絡(luò)則為11。由表1可以看出,與其他預(yù)測方法比較,本方法的最小絕對誤差最小,說明通過該方法可以獲得較好的預(yù)測結(jié)果。但同時,該方法有一定的局限性,根據(jù)獲得的數(shù)據(jù),風(fēng)速變化與相關(guān)性誤差增加之間存在正相關(guān),仍然需要繼續(xù)改進(jìn)以提高預(yù)測的準(zhǔn)確性。
表1 平均絕對誤差結(jié)果
圖12 是風(fēng)速預(yù)測值與實(shí)際值比較曲線,大部分誤差在0.5 m/s之內(nèi)。神經(jīng)網(wǎng)絡(luò)得出的性能在不同的運(yùn)行情況下會略有不同,張北風(fēng)電場的平均每月風(fēng)速的MAE結(jié)果約為0.27~0.37 m/s,內(nèi)蒙風(fēng)電場的平均每月風(fēng)速的MAE結(jié)果約為0.18~0.34 m/s,表明與現(xiàn)有工程相比有所改善。兩個場址皆超過50 %的估計(jì)值顯示誤差小于1 m/s,但是在某些情況下,兩風(fēng)電場的最大誤差接近2 m/s,這不是我們希望看到的,并且會嚴(yán)重影響風(fēng)電功率的預(yù)測。為了盡可能的避免此類錯誤,使用目標(biāo)年份相近的預(yù)測風(fēng)速值與實(shí)際風(fēng)速值之間的差值來定期更新預(yù)測模型,以提高長期時間序列預(yù)測的準(zhǔn)確性,目前正在研究測試中。
圖12 典型月風(fēng)速預(yù)測曲線和實(shí)際曲線對比
圖13 顯示了風(fēng)電場發(fā)電量功率預(yù)測,如圖所示,預(yù)測值與有功功率的吻合趨與風(fēng)速預(yù)測相似,說明模型提供了有效的預(yù)測能力。功率預(yù)測基本流程:首先將數(shù)據(jù)集劃分為多月組合的訓(xùn)練數(shù)據(jù)集合和單月的對比測試數(shù)據(jù)集,其次使用 ANN 預(yù)測應(yīng)用程序創(chuàng)建 ANN 模型,繼而使用相同的 ANN 層架構(gòu)訓(xùn)練創(chuàng)建ANN 模型,使用經(jīng)過訓(xùn)練的 ANN 模型為測試數(shù)據(jù)集創(chuàng)建預(yù)測,最后使用經(jīng)過訓(xùn)練的 ANN 模型的預(yù)測輸出作為能量估算應(yīng)用程序的輸入來獲得預(yù)測的發(fā)電量。能量估算需要考慮電網(wǎng)、風(fēng)電場、設(shè)備等過程中能量損失,模型中嵌入相應(yīng)損失因子,包括歐姆損耗、變壓器損耗、尾跡損耗、地形特征摩擦系數(shù)等,其中尾流損耗使用Jensen Wake模型,考慮風(fēng)機(jī)間布置及距離,為便于比較,兩風(fēng)電場能量估算使用相同的損失系數(shù)。由圖可以看出,超過50 %的預(yù)測誤差在10 %以內(nèi),烏蘭察布風(fēng)電場超過70 %誤差在10 %以內(nèi),烏蘭察布風(fēng)電場2~4月預(yù)測趨勢與風(fēng)速趨勢相比存在不一致,主要考慮風(fēng)電場的風(fēng)向因素,其中可能存在設(shè)備利用率問題導(dǎo)致數(shù)據(jù)有誤,需要進(jìn)一步排查。鑒于風(fēng)速預(yù)測使用的是風(fēng)電場中測風(fēng)塔單點(diǎn)數(shù)據(jù),而風(fēng)電場功率或發(fā)電量預(yù)測需要綜合考慮風(fēng)電場地形、風(fēng)電機(jī)組間的排布、設(shè)備等眾多因素,后續(xù)需要建立更為全面的預(yù)測模型,提高模型預(yù)測精度。同時,研究中 發(fā)現(xiàn)訓(xùn)練樣本參數(shù)多少和周期對預(yù)測精度影響較大,需要更多的數(shù)據(jù)訓(xùn)練以尋找建立工程可用的通用數(shù)據(jù)標(biāo)準(zhǔn)范圍,及開發(fā)基于神經(jīng)網(wǎng)絡(luò)的時間序列預(yù)測模型及通用預(yù)測平臺。
圖13 典型風(fēng)電場發(fā)電量預(yù)測曲線和實(shí)際曲線對比
基于統(tǒng)計(jì)方法和神經(jīng)網(wǎng)絡(luò)方法,通過設(shè)計(jì)一個多神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)融合算法識別過去的風(fēng)速特征來預(yù)測下一年的每小時風(fēng)速及發(fā)電量。為了確定來年的風(fēng)速趨勢,識別數(shù)據(jù)模式特征并將其相應(yīng)地應(yīng)用于年/月/日平均風(fēng)速預(yù)測,同時將時間序列數(shù)據(jù)應(yīng)用于與位置識別模式相關(guān)聯(lián)的神經(jīng)網(wǎng)絡(luò),以訂正預(yù)測。利用張北和烏蘭察布地區(qū)某風(fēng)電場的風(fēng)速及功率測量樣本對數(shù)據(jù)集進(jìn)行訓(xùn)練和測試,結(jié)果顯示平均絕對誤差(MAE)很小,預(yù)測效果較好。研究結(jié)果表明,風(fēng)速及功率預(yù)測值與實(shí)際值比較趨勢較一致,所采用的模型方法提升了長期風(fēng)速及功率預(yù)測結(jié)果,說明混合技術(shù)可以很好的預(yù)測實(shí)際的數(shù)據(jù)序列,鑒于其較好的預(yù)測了整體趨勢,可以用于長期風(fēng)速預(yù)測任務(wù)的替代模型,后評估預(yù)測結(jié)果可作為中長期發(fā)電量預(yù)測的依據(jù),未來可以進(jìn)一步結(jié)合氣象數(shù)據(jù)建立中長期電量預(yù)測模型,為風(fēng)電中長期交易提供參考及風(fēng)電場制定檢修計(jì)劃提供輔助決策。