杜俊賢
(煙臺汽車工程職業(yè)學(xué)院 電子工程系, 山東 煙臺 265500)
電力系統(tǒng)在經(jīng)濟(jì)發(fā)展中作用重大,迅速發(fā)展的經(jīng)濟(jì)促使各產(chǎn)業(yè)的發(fā)展水平及國民生活水平得到快速提升,日常生產(chǎn)生活對用電量的需求隨之不斷提高,激增的用電量需求促使電力系統(tǒng)整體規(guī)模不斷擴(kuò)大,一些新增發(fā)電項目在保障和促進(jìn)經(jīng)濟(jì)穩(wěn)步發(fā)展中發(fā)揮著重要作用。為了促進(jìn)電力系統(tǒng)的運行穩(wěn)定性,必須要保證電網(wǎng)供需平衡。而目前調(diào)度計劃的制定需基于電力供應(yīng)量及電力負(fù)荷的有效預(yù)測,準(zhǔn)確的負(fù)荷預(yù)測是提升制定調(diào)度計劃準(zhǔn)確度的重要手段,使由預(yù)測不準(zhǔn)確帶來的棄電損失問題被有效避免。
電力供應(yīng)在日常生產(chǎn)生活中起到重要作用,隨著國民經(jīng)濟(jì)發(fā)展對用電需求的不斷提升,對穩(wěn)定的電力供應(yīng)提出了更高的要求,仍然存在不同程度的供需矛盾,因此需對電力供求進(jìn)行科學(xué)合理的規(guī)劃,并結(jié)合實際情況作出合理決策,促進(jìn)經(jīng)濟(jì)的穩(wěn)定發(fā)展?;诮y(tǒng)計學(xué)習(xí)理論的支持向量機(jī)屬于一種小樣本學(xué)習(xí)算法,分類與回歸分析的應(yīng)用非常廣泛,支持向量機(jī)回歸因而在眾多領(lǐng)域(包括糧食產(chǎn)量、股市、氣象、電力負(fù)荷等方面的預(yù)測)得以廣泛應(yīng)用。電力供應(yīng)量的影響因素通常表現(xiàn)出較大的不確定性和復(fù)雜性,在統(tǒng)計電力產(chǎn)量時通常以季度或年作為時間標(biāo)度,預(yù)測電力供應(yīng)量屬于典型小樣本的非線性問題,但是支持向量機(jī)很難對樣本的特征屬性進(jìn)行評價,所以在對模型進(jìn)行訓(xùn)練和檢驗過程中易受到一些次要屬性的干擾和影響,進(jìn)而影響到最終的預(yù)測精度,因此對支持向量機(jī)的優(yōu)化和完善仍然是研究重點,例如,通過對輸入樣本的權(quán)重或特征屬性進(jìn)行優(yōu)化處理,實現(xiàn)預(yù)測精準(zhǔn)度的有效提高,在獲取樣本數(shù)據(jù)屬性的本質(zhì)關(guān)系具有較大的優(yōu)勢,對于知識的不確定性、信息的冗余程度具有較強(qiáng)的包容性,只要找到最小預(yù)測規(guī)則集即可[1]。因此本文在支持向量機(jī)回歸的基礎(chǔ)上結(jié)合運用粗糙集屬性約簡方法對數(shù)據(jù)樣本進(jìn)行預(yù)處理和預(yù)測,針對電力相關(guān)歷史數(shù)據(jù)(包括產(chǎn)量及其主要影響因素)樣本建立回歸分析模型。
電網(wǎng)供需平衡是確保電力系統(tǒng)穩(wěn)定運行的基礎(chǔ),目前相關(guān)超大容量電能存儲技術(shù)仍處于研究階段,隨著用電需求和電力負(fù)荷的影響及制約因素的增加(如電價高低、區(qū)域經(jīng)濟(jì)、氣候等關(guān)聯(lián)影響因素),電力系統(tǒng)的穩(wěn)定運行需通過相應(yīng)發(fā)電調(diào)度計劃的有效實施實現(xiàn),電力供應(yīng)量及負(fù)荷預(yù)測在電力系統(tǒng)中起到非常重要的支持作用,電力規(guī)劃及日常生產(chǎn)運行等工作均離不開電力供應(yīng)量及負(fù)荷預(yù)測(主要是對年最大負(fù)荷及用電量進(jìn)行預(yù)測),不斷增加的用電量對預(yù)測電力負(fù)荷的精準(zhǔn)度提出了更高的要求,受到有限歷史數(shù)據(jù)的限制,電力負(fù)荷受不確定因素的影響較大,通過準(zhǔn)確的電力負(fù)荷預(yù)測可以為社會效益的穩(wěn)定發(fā)展提供保障。
(1)
約束條件為式(2)。
(2)
針對非線性支持向量回歸問題,往往會將數(shù)據(jù)通過某一非線性映射的引入實現(xiàn)到更高維Hilbert空間的映射,線性回歸(對應(yīng)原空間的非線性回歸)在此空間完成。為使高維空間內(nèi)點積運算的復(fù)雜程度得到有效降低,針對低維空間輸入完成到高維特征空間的點積(通過核函數(shù)技術(shù)),即K(xi,xj)=<Φ(xi),Φ(xj)>。
對于非線性回歸,其最優(yōu)超平面解析的表達(dá)式[2],如式(3)。
(3)
常用核函數(shù)包括p階多項式核函數(shù) 、高斯徑向基核函數(shù)、Sigmoid核函數(shù),對應(yīng)表達(dá)式如式(4)—式(6)。
K(xi,xj)=(<(xi,xj>+c)p(p∈N,c≥0)
(4)
K(xi,xj)=exp {-‖xi,xj‖2/2σ2}
(5)
K(xi,xj)=tanh(θ+υ
(6)
實際在對樣本數(shù)據(jù)采用粗集理論進(jìn)行分析時,通常以決策表作為處理對象。
(1) 決策表的定義:由知識表達(dá)系統(tǒng)構(gòu)成決策表,其信息表具體由四元組構(gòu)成表達(dá)式為S=(U,A,V,f),U(非空有限對象集) 表示論域;V的集合由屬性a∈A的值域構(gòu)成;A(非空有限屬性集)取值為C∪D;C表示條件屬性集;D(非空集) 表示決策屬性集;f表示信息函數(shù)各對象在指定論域U中各屬性的取值(U×A→V)。在D僅有一個決策屬性j5i0abt0b的情況下則為單一決策表。
(2) 上 、下近似集的定義:對任意XU及其上由B表示的等價關(guān)系,X在此關(guān)系下的上 、下近似集定義表達(dá)式如式(7)、式(8)。
B-(X)={x|x∈U∧ [x]B∩X≠?}
(7)
B-(X)={x|x∈U∧ [x]B?X}
(8)
X在B-(X)同B-(X)取值不同的情況下稱為一個B粗集。
(3) 正域的定義:由P、Q表示U上的兩個等價關(guān)系,定義Q的P正域表達(dá)式如式(9)(即以U|P的信息為依據(jù)能夠完成到Q的等價類中開集的集合的準(zhǔn)確劃分)。
POSP(Q)=UX∈U|QP-(X)
(9)
(4) 約簡的定義:設(shè)論域U上的兩個等價關(guān)系簇由P、Q表示,?r∈S、POSS(Q) =POSP(Q)且POSS /{r}(Q) 同POSS(Q)的取值不同則S?P是P的Q獨立子集,滿足S是P的Q約簡的條件[2]。
各屬性在決策表信息系統(tǒng)中均與某個等價關(guān)系相對應(yīng),對于論域樣本上的論域通過使用條件屬性集和決策屬性集完成劃分及對應(yīng)分類知識 的形成,對于條件屬性集則通過運用屬性約簡實現(xiàn)部分必要屬性的獲取,這部分必要屬性的分類能力不同于決策屬性同全部條件屬性相同。假設(shè),S=(U,A,V,f)表示決策表;U表示論域取值為{x1,x2, …,xn};A=C∪ j5i0abt0b,[ mina,maxa]表示屬性a(aA是一個連續(xù)屬性) 的值域。粗集理論的處理對象適用于離散屬性,在決策表含有連續(xù)屬性的情況下需進(jìn)行離散化處理,本文使用凝聚層次聚類法完成離散化處理過程使負(fù)荷預(yù)測的精準(zhǔn)度得到顯著提高,根據(jù)定義(4)完成C(條件屬性集合) 的約簡的獲取,由Cred表示C的相對約簡即C的最大獨立子集(相對于決策屬性j5i0abt0b)[3]。
電力供應(yīng)量會受到生活水平、經(jīng)濟(jì)水平等多種因素的影響,本文選擇電力產(chǎn)量(億千瓦小時)、國內(nèi)生產(chǎn)總值(億元)、第一產(chǎn)業(yè)、第二產(chǎn)業(yè)、第三產(chǎn)業(yè)(億元)、人均國內(nèi)生產(chǎn)總值(元 / 人)、原油產(chǎn)量、生鐵 產(chǎn)量、鐵路貨運量(萬噸)、原煤產(chǎn)量(億噸)因素作為代表,分別由d、a1、a2、a3、a4、a5、a6、a7、a8、a9表示[4]。
根據(jù)實際需要選取某一時間段的電力供應(yīng)量的歷史數(shù)據(jù)進(jìn)行處理,主要步驟如下。
通用MATLABSVMToolbox的使用完成對支持向量機(jī)回歸的處理過程,核函數(shù)為K(xi,xj)=exp{-‖xi,xj‖2/2σ2}; 以線性ε-insensitive 函數(shù)作為損失函數(shù),表達(dá)式為L(f(x),y)=max(0, |f(x)-y|-ε)[6]。通過交叉驗證確定參數(shù)C,σ,ε的選擇。將原樣本上述步驟(4)和(5)進(jìn)行處理以便后續(xù)比較。兩種回歸的相關(guān)參數(shù)和結(jié)果,如表1—表3所示。
表1 參數(shù)值和支持向量個數(shù)
表2 電力產(chǎn)量預(yù)測值與實際值
表3 模型預(yù)測精度比較
其中,RMSE為式(10)。
(10)
THEIL_IC為式(11)。
(11)
取值范圍通常在 0—1之間的希爾不等系數(shù)同預(yù)測精度成反比,即希爾不等系數(shù)越小精度越高,如式(12)。
(12)
通常在MAPE的值不超過10 的情況下表示預(yù)測精度較高,如式(13)。
(13)
本文的RS &SVR 模型在支持向量個數(shù)方面類似于SVR模型,僅多了兩個支持向量。由表2—表3可知, RS &SVR 模型的希爾不等系數(shù)以及均方根誤差更小,預(yù)測值更加接近實際值,說明擬合效果及預(yù)測效果良好,充分證明了本文所構(gòu)建模型應(yīng)用于電力供應(yīng)量回歸預(yù)測過程的有效性,在滿足用電需求、降低發(fā)電成本及確保電網(wǎng)安全穩(wěn)定運行中具有較高的實用性[7]。
在對電力供應(yīng)量進(jìn)行分析過程中采用支持向量機(jī)回歸能夠構(gòu)建起較為理想的預(yù)測模型,而在對不確定的、冗余的信息進(jìn)行處理時粗糙集理論表現(xiàn)出了強(qiáng)大的優(yōu)勢,通過在數(shù)據(jù)預(yù)處理過程中使用屬性約簡方法可使電力相關(guān)數(shù)據(jù)樣本的特征維得到有效簡化。結(jié)合運用支持向量機(jī)回歸同粗糙集理論間構(gòu)建的RS&SVR模型使電力供應(yīng)量智能預(yù)測效果得到顯著提升,使用屬性約簡算法完成約簡處理,將電力供應(yīng)量的預(yù)測結(jié)果同實際情況進(jìn)行實驗對比,本文基于屬性約簡方法構(gòu)建的預(yù)測模型能夠?qū)^少的主要預(yù)測因子的信息進(jìn)行充分利用, 預(yù)測結(jié)果的精準(zhǔn)度得到顯著提高。