任建龍 ,趙巧娥,嚴志偉,高金城
(1.山西大學(xué) 電力工程系,太原 030013;2.國網(wǎng)山西省電力公司檢修分公司,太原030006;3.中國電纜工程有限公司,北京100079)
大數(shù)據(jù)是一種避免隨機分析(即抽樣調(diào)查)而采用所有數(shù)據(jù)進行處理的一種捷徑[1]。如果我們通過分析全部的數(shù)據(jù)得到風(fēng)力發(fā)電實際運行風(fēng)速數(shù)據(jù)和輸出功率數(shù)據(jù)之間的函數(shù)關(guān)系,并通過預(yù)測風(fēng)速映射之后實現(xiàn)風(fēng)力發(fā)電輸出功率的預(yù)測,那么具有大數(shù)據(jù)4V特性的風(fēng)力發(fā)電實際運行大數(shù)據(jù)勢必會使我們投入大量的人力、物力以及時間,甚至最后都得不到準確的結(jié)果[2]。
研究風(fēng)速、功率預(yù)測的文獻很多,如文獻[3]利用帶有核函數(shù)的極限學(xué)習(xí)機(KELM)對風(fēng)速預(yù)測,通過給定核函數(shù)的參數(shù)就可以避免由于隨機設(shè)置初始權(quán)值造成極限學(xué)習(xí)機 (ELM)性能不穩(wěn)定的問題,但是沒有對核函數(shù)的參數(shù)進行尋優(yōu)設(shè)置,導(dǎo)致最后的預(yù)測誤差很大;文獻[4]利用混沌學(xué)中的相空間重構(gòu)(PSR)理論對風(fēng)速進行預(yù)處理,然后再利用ELM預(yù)測風(fēng)速,雖然考慮了風(fēng)速數(shù)據(jù)空間及時間上的相關(guān)性,提高了預(yù)測精度,但是并沒有考慮ELM初始權(quán)值隨機設(shè)定造成ELM學(xué)習(xí)性能不穩(wěn)定給最后預(yù)測精度帶來的影響,也沒有對相空間重構(gòu)中的延遲時間τ和重構(gòu)維數(shù)m進行尋優(yōu)處理;文獻[5]利用粒子群算法(PSO)對PSR理論中的延遲時間τ和重構(gòu)維數(shù)m進行尋優(yōu)處理,嘗試尋找相空間重構(gòu)參數(shù)和的優(yōu)化值,但是并沒有從全局考慮,很容易得到局部最優(yōu)解;文獻[6]利用PSO對正則化參數(shù)γ和核函數(shù)寬度σ進行尋優(yōu),再用KELM預(yù)測,雖然對核函數(shù)參數(shù)進行了優(yōu)化處理,但是并沒有考慮風(fēng)速數(shù)據(jù)空間及時間上的相關(guān)性,也沒有克服PSO容易陷入局部最優(yōu)解這一缺點。本文考慮風(fēng)電場實際運行數(shù)據(jù)異質(zhì)值的存在,利用優(yōu)化粒子群算法(IPSO)優(yōu)化模糊PSR-KELM模型預(yù)測風(fēng)速,同時提出改進移動平均平滑算法(IMASA)濾除異質(zhì)值擬合風(fēng)速-功率曲線。根據(jù)山西北部某風(fēng)電場(簡稱晉北風(fēng)場)的實際運行數(shù)據(jù)進行風(fēng)速及功率的預(yù)測分析。
大數(shù)據(jù)背景下的風(fēng)力發(fā)電運維數(shù)據(jù)的主要特點是那些偏離正常運行主體數(shù)據(jù)的異質(zhì)值會對風(fēng)力發(fā)電的研究造成嚴重的影響,并不能被隨意忽略或者刪除[7]。
由于風(fēng)的隨機性、間歇性和不確定性,風(fēng)電場的實際運行風(fēng)速-功率數(shù)據(jù)可以看作是大量數(shù)據(jù)組成的波動序列{ys(i)},其呈條帶狀分布在標準風(fēng)速-功率曲線兩側(cè)[8]。為了方便研究,可將風(fēng)電場視為一個輸入風(fēng)速、輸出功率的簡化系統(tǒng)[9]。
移動平均平滑算法(MASA)通過跨度內(nèi)定義的相鄰數(shù)據(jù)點的平均值代替每個數(shù)據(jù)點來平滑數(shù)據(jù)[10]。這個算法的通用表達如式(1)所示:
式中:ys(i)是第 i個數(shù)據(jù)的平滑值;N 是 ys(i)鄰近數(shù)據(jù)點的個數(shù);2N+1是跨度。
考慮到風(fēng)電場實際運行數(shù)據(jù)異質(zhì)值對擬合風(fēng)速-功率曲線準確度的影響[11]以及MASA存在的不足,提出(IMASA),即為跨度內(nèi)的數(shù)據(jù)點定義一個權(quán)重函數(shù),通過權(quán)重函數(shù)值判斷要平滑的數(shù)據(jù)點是否具有最大權(quán)重值以及對擬合曲線的影響程度。通過把跨度以外的數(shù)據(jù)點的權(quán)重值定義為零來避免異質(zhì)值對擬合曲線準確度的影響,其數(shù)學(xué)表達如式(2)、式(3)所示:
式中:x是與數(shù)據(jù)點平滑相關(guān)的平滑值;xi是x通過跨度定義的最鄰近數(shù)據(jù)點;d(x)是x沿橫軸到跨度內(nèi)最遠的距離。
最后,利用最小二乘法將所得平滑值點擬合成一條映射曲線如式(4)所示:
總結(jié)以上算法,其原理流程如圖1所示。
圖1 擬合風(fēng)速-功率曲線原理Fig.1 Principle of fitting wind speed power curve
在風(fēng)速樣本數(shù)據(jù)進行分組劃分時,采用常規(guī)的K-means聚類算法雖然也能對風(fēng)速樣本數(shù)據(jù)進行分類劃分,但是由于大數(shù)據(jù)下風(fēng)速數(shù)據(jù)具有空間和時間相關(guān)性,對具有高相關(guān)性的風(fēng)速數(shù)據(jù)進行聚類劃分時,很容易產(chǎn)生不穩(wěn)定的聚類結(jié)果,對準確劃分風(fēng)速數(shù)據(jù)具有一定的影響。模糊C均值聚類算法(FCM)能夠有效地改善風(fēng)速數(shù)據(jù)的空間和時間的相關(guān)性對最后聚類結(jié)果的影響,改善風(fēng)速數(shù)據(jù)聚類劃分結(jié)果的合理性。
FCM是經(jīng)典聚類算法之一,它通過隸屬度矩陣表示每個樣本與各個分類之間的關(guān)系[12],其原理如圖2所示。
但是FCM也有不足的地方:①聚類中心隨機選取,比較難確定,且聚類中心的選取對聚類結(jié)果影響很大;②容易得到次優(yōu)解??梢?,模糊C均值聚類算法雖然在風(fēng)速預(yù)測中得到了應(yīng)用,但仍需改進。
風(fēng)電場不同機組采集的風(fēng)速可以看作一組按照一定時間分辨率記錄的多變量時間序列數(shù)值[13],即:
式中:時間 t=1,2,…,n;變量 i=1,2,…,m;變量 vi(t)表示第i臺風(fēng)機在t時刻的捕獲值。所以可將風(fēng)電場不同機組捕獲的風(fēng)速數(shù)據(jù)記為一個m×n的多變量時間序列矩陣M,即
式中:t=1,2,…,n(n 為時間點數(shù));i=1,2,…,m(m為風(fēng)機編號);對M進行相空間重構(gòu),其空間中的相點可以表示為 vq,如式(7)所示:
Guang-Bin Huang在2004年率先提出ELM,其實質(zhì)是單隱層前饋神經(jīng)網(wǎng)絡(luò)(SLFN)學(xué)習(xí)算法的一種[14]。而以強大的非線性映射能力著稱的核函數(shù)在處理非線性映射問題上具有很好的應(yīng)用[15]。將Huang所提ELM隱含層結(jié)點映射用核函數(shù)等效代替,便可得到穩(wěn)健性和非線性逼近能力更好的KELM。求解KELM 如式(8)、式(9)所示:
令ELM隱含層輸出矩陣如式(10)所示:
從而可以將求解ELM寫成式(11):
令
那么基于核函數(shù)的ELM就可以用式(13)表示:
通常,工程上選取的核函數(shù)為高斯核函數(shù),其數(shù)學(xué)表達式如下所示:
針對Kennedy和Eberhart先前提出的PSO[16-17]在工程應(yīng)用中存在搜索精度不高,容易陷入局部最優(yōu)解等不足,本文率先利用IPSO克服以上算法存在的不足并應(yīng)用到風(fēng)速預(yù)測的實踐當(dāng)中[18]。粒子移動的下一時刻的速度如式(15)所示:
式中,vd′(t+1)表示任一粒子在維度d上下一時刻的速度;xd(t)表示任一粒子在維度d上t時刻的位置;w為慣性權(quán)重;pd(t)為任一粒子當(dāng)前搜索到的最優(yōu)解;pgd(t)為整個粒子群當(dāng)前的最優(yōu)解;c1、c2是可以改變 pd(t)和 pgd(t)相對重要性的學(xué)習(xí)因子;rand()為隨機數(shù),取值一般在0~1之間。式(15)中常數(shù)能對慣性權(quán)重值、學(xué)習(xí)因子進行權(quán)衡,避免c1、c2過增,避免粒子更新偏向粒子局部或粒子整體,同時也避免了速度過增,使粒子群算法表現(xiàn)出更好地搜索性和收斂性還不增加計算量。粒子移動的下一位置為vd′(t+1)=xd(t)+vd(t)。
在利用IPSO進行優(yōu)化時,以ARE作為衡量優(yōu)化效果的標準。那么
為了降低程序迭代次數(shù)和計算量,設(shè)定尋優(yōu)參數(shù)的約束條件如下所示:
最后,編寫程序,利用IPSO進行優(yōu)化處理。具體程序原理如圖3所示。
本文根據(jù)晉北風(fēng)場現(xiàn)場實際運行數(shù)據(jù)進行實例分析。晉北風(fēng)場位于山西盛風(fēng)嶺地區(qū),總跨度約12.2 km,平均海拔在 1692~2120 m 之間,場址中心位于東經(jīng) 114°~116°之間, 北緯 114°~116°之間,分為一、二期,共66臺機組,總裝機容量99 MW。由于該風(fēng)電場位于山西以北典型山嶺地帶,所處地理環(huán)境復(fù)雜,綜合考慮,該風(fēng)電場的地理位置布置情況如圖4所示。
圖3 IPSO優(yōu)化模糊PSR-KELM模型預(yù)測風(fēng)功率流程Fig.3 Flow chart of IPSO optimized fuzzy PSR-KELM model for predicting wind power
圖4 晉北風(fēng)場風(fēng)機地理分布圖Fig.4 Geographical distribution map of the north wind fan
晉北風(fēng)場在不同時間段內(nèi)的2個月實際運行風(fēng)速-功率數(shù)據(jù)統(tǒng)計散點結(jié)果如圖5所示。
圖5 晉北風(fēng)場實際運行風(fēng)速-功率散點圖Fig.5 Actual wind speed power dispersion diagram of Shanxi north wind field
本文以晉北風(fēng)場10天的數(shù)據(jù)為例,根據(jù)晉北風(fēng)場每10 min采集一次、總長度1440個的實際運行數(shù)據(jù)樣本點進行實例分析,前十分之九的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),后十分之一的風(fēng)速數(shù)據(jù)作為測試數(shù)據(jù)。利用IPSO優(yōu)化模糊PSR-KELM模型預(yù)測風(fēng)速并將預(yù)測結(jié)果與實際運行數(shù)據(jù)、不同模型 (模糊PRS-KELM模型和PRS-KELM四參數(shù)優(yōu)化模型)進行比較,如圖6所示。
圖6 不同模型的風(fēng)速預(yù)測結(jié)果Fig.6 Wind speed prediction results of different models
將IPSO優(yōu)化模糊PSR-KELM模型、不同模型(模糊PRS-KELM模型和PRS-KELM四參數(shù)優(yōu)化模型)預(yù)測風(fēng)速與實際運行數(shù)據(jù)進行比較,分析誤差結(jié)果如圖7所示。
圖7 不同模型的風(fēng)速預(yù)測誤差分析結(jié)果Fig.7 Analysis results of wind speed prediction error of different models
將預(yù)測風(fēng)速映射到利用IMASA濾除異質(zhì)值后擬合的風(fēng)速-功率曲線上預(yù)測功率并與MASA、不濾除異質(zhì)值處理預(yù)測結(jié)果比較如圖8所示。
圖8 基于映射不同擬合曲線預(yù)測功率結(jié)果Fig.8 Predicting power results based on different fitting curves
利用式(16)計算晉北風(fēng)場利用不同模型預(yù)測風(fēng)速及功率的平均相對誤差如表1所示。
表1 風(fēng)速及功率的預(yù)測ARE值Tab.1 ARE value of wind speed and power
通過分析表1可以看出,基于IPSO優(yōu)化模糊PSR-KELM模型預(yù)測風(fēng)速的預(yù)測誤差值較小,IPSO優(yōu)化模糊PSR-KELM模型與模糊PRS-KELM模型和PRS-KELM四參數(shù)優(yōu)化模型相比,精確度大大提高,說明IPSO優(yōu)化模糊PSR-KELM模型的有效性。同時,預(yù)測功率誤差說明IMASA濾除風(fēng)電場實際運行風(fēng)速-功率數(shù)據(jù)異質(zhì)值的必要性和有效性。
根據(jù)晉北風(fēng)場的實際運行數(shù)據(jù)分析,利用PSR-KELM四參數(shù)優(yōu)化模型訓(xùn)練IPSO優(yōu)化模糊C均值聚類算法生成的模糊樣本進行風(fēng)速預(yù)測,克服了大數(shù)據(jù)下風(fēng)電場實際運行數(shù)據(jù)中的異質(zhì)值對風(fēng)速預(yù)測模型準確度和穩(wěn)定性的影響。另外,由于大數(shù)據(jù)下風(fēng)電場運行數(shù)據(jù)異質(zhì)值的存在,通過分析晉北風(fēng)場實際運行數(shù)據(jù)發(fā)現(xiàn),IMASA可以很好的避免異質(zhì)值的影響并準確的擬合出一條基于實際運行數(shù)據(jù)的風(fēng)電場風(fēng)速-功率曲線。
另外,通過表1中不同模型對風(fēng)速以及功率的預(yù)測誤差對比還可以看出,利用本文提出的風(fēng)功率預(yù)測模型完全可以對風(fēng)電場出力變化趨勢進行準確預(yù)測,并對風(fēng)電場的運行并網(wǎng)目標實現(xiàn)可預(yù)測調(diào)控監(jiān)視。