曹渝昆, 帥 浩
(上海電力學院 計算機科學與技術學院, 上海 200090)
基于多因素改進型PSOSVM算法的中長期負荷預測
曹渝昆, 帥 浩
(上海電力學院 計算機科學與技術學院, 上海 200090)
中長期負荷預測作為電力規(guī)劃與調度中的重要一環(huán),其影響因素有著多樣性和不確定性等特點.選取支持向量機作為中長期負荷預測的核心算法,篩選多種區(qū)域宏觀經濟因素,利用粒子群(PSO)尋優(yōu)與循環(huán)尋優(yōu)的改進型算法對支持向量機(SVM)的參數(shù)進行優(yōu)化及負荷預測.仿真結果顯示,改進型PSOSVM算法有著較高的預測精度.
中長期負荷預測; 宏觀影響因素; 粒子群與循環(huán)尋優(yōu); 改進型PSOSVM算法; 支持向量機
中長期負荷預測主要研究方向有灰度預測[1]、回歸分析[2]、組合預測[3]、神經網絡算法[4-5]與支持向量機(Support Vector Machine,SVM)算法[6-10]等,其中灰度預測與回歸的研究對象主要是歷史負荷數(shù)據,組合預測國內研究的較多,國外研究相對較少,而神經網絡算法與支持向量機是目前研究最多的兩種方法.
文獻[1]對過度依賴歷史數(shù)據的灰度算法做了改進,結合了一定未來波動趨勢,但不能解決其他影響因素的干擾,穩(wěn)定性不高;文獻[2]的回歸預測存在著同樣的問題,不能很好地處理干擾量;文獻[3]的組合預測結合了多種算法的優(yōu)點,但容易產生誤差傳遞;文獻[4]和文獻[5]提高了預測的收斂速度,但預測精度不夠高;文獻[6]提出了粒子群(Particle Swarm Optimization,PSO)優(yōu)化魯棒支持向量回歸的方法,提高了支持向量機的穩(wěn)定性,但容易出現(xiàn)樣本集的過擬合;文獻[7]和文獻[8]分別提出了經驗模態(tài)分解和主成分分析支持向量機,在一定程度上考慮了影響因素的權重,但不夠全面,造成相應的預測精度與穩(wěn)定度有限;文獻[9]提出季節(jié)型最優(yōu)灰度支持向量機的算法,對季度負荷進行了很好的預測,并應用最小二乘支持向量機,但精度同樣受限.
中長期負荷預測系統(tǒng)結構主要包括經濟、社會因素,以及能源環(huán)境、人口、技術和電力需求等6個子系統(tǒng)[10].這些因素中部分變量對負荷波動的影響非常大,但由于部分指標只能定性估計,無法量化形成非常準確的樣本集.支持向量機算法具有小樣本學習、處理非線性數(shù)據的特點.因此,本文選取經濟、社會因素,以及能源環(huán)境、人口、電力需求等5個方面的主要指標進行量化,利用支持向量機進行預測.為了在提高支持向量機預測精度的同時避免出現(xiàn)過擬合,采用二重尋優(yōu)與PSO算法對支持向量機的懲罰系數(shù)與gamma參數(shù)進行優(yōu)化,利用訓練完成的模型對未來3年用電量進行預測,得到了較好的效果.
電力負荷中長期預測本身有著復雜的內在系統(tǒng),與外界因素的聯(lián)系又形成了外界系統(tǒng).預測對象的未來發(fā)展是系統(tǒng)整體的動態(tài)發(fā)展,與各個組成部分和影響因素之間相互作用、密切相關.電力負荷中長期預測系統(tǒng)的影響因素主要有以下幾種.
(1) 經濟因素 主要包括區(qū)域經濟發(fā)展水平、產值單耗等內容.在多數(shù)理論與實證研究中,國內生產總值(Gross Domestic Product,GDP)被認為是電力消費的最重要的決定因素.
(2) 用電結構 地區(qū)用電結構的內容包括第1產業(yè)、第2產業(yè)、第3產業(yè)和城鄉(xiāng)居民生活需求電量、重點行業(yè)需求電量即行業(yè)用電結構、重點用戶需求電量等.隨著我國產業(yè)結構的轉型,第1產業(yè)和第2產業(yè)所占國內生產總值的比重會下降,第3產業(yè)的比重將會有較多的上升.
(3) 社會因素 包括人口基數(shù)和增長率等.人口增加對于電力消費起著很重要的作用,人口增長與電力需求之間呈現(xiàn)了非常強的正相關關系.
(4) 能源市場 從整個能源消耗市場來看,電力市場只是其中的一個組成部分.電力消耗與其他能源的消耗之間有著密切的關系,用戶選擇電力消費和其他能源消費的比重可能會發(fā)生變化,有時甚至會發(fā)生逆轉.
(5) 電力彈性系數(shù) 是指一定時期內電力消費的年平均增長率與國民經濟年平均增長率的比值.電力工業(yè)與國民經濟之間發(fā)展速度的比例關系通常用電力彈性系數(shù)表示,它是國民經濟諸多數(shù)量關系中的一個重要變量.
影響因素的簡要說明如表1所示(數(shù)據來源于上海市各年統(tǒng)計年鑒網絡).
表1 影響因素說明
2.1 支持向量機算法
假設有訓練樣本集G={(xi,di)},i=1,2,3,…,N,xi∈Rn,di∈R.其中xi為第i個n維輸入,di為輸出.支持向量機回歸的基本原理是尋找一個輸入空間到輸出空間的非線性映射ψ(x),通過映射將數(shù)據x映射到一個高維特征空間F,并在特征空間中用下述估計函數(shù)進行線性回歸:
(1)
式中:ω——權值向量,ω∈Rk; ψ(x)——輸入向量在高維空間上映射函數(shù);
b——常數(shù),b∈R.
其函數(shù)逼近問題等價于如下函數(shù)最小:
(2)
(3)
通過引入兩個松弛變量ξ,ξ*,上述函數(shù)可以變?yōu)?
(4)
求解上述問題最終可得到支持向量機回歸函數(shù):
(5)
因此,利用支持向量機進行負荷預測需要確定的參數(shù)c和σ.
2.2 粒子群尋優(yōu)模型
粒子群算法(PSO) 是由KENNEDY J等人于1995年提出的一種基于種群搜索的自適應進化技術.算法隨機產生一個初始種群并賦予每個粒子一個隨機速度,在飛行過程中,粒子的速度通過自身以及同伴的飛行經驗來動態(tài)調整整個群體飛向更好的搜索區(qū)域的能力.在每代中的速度和評價函數(shù)位置的計算式為:
(6)
(7)
式中:i=1,2,3,…m; d=1,2,3,…D; ω——慣性因子,為非負數(shù);c1,c2——加速常數(shù),為非負常數(shù); r1,r2——[0,1]范圍內變換的隨機數(shù); α——約束因子,用于控制速度的權重.
2.3 改進型PSOSVM預測模型
改進型PSOSVM算法主要以支持向量機為主體,由于標準型支持向量機的參數(shù)設置不能符合預測要求,造成預測精度不高,而使用PSO算法尋優(yōu)得到的參數(shù)是訓練樣本全局最優(yōu)解,預測模型陷入過擬合,因此將二重尋優(yōu)與粒子群尋優(yōu)算法結合,對支持向量機參數(shù)進行優(yōu)化.二重尋優(yōu)能夠很好地找到基本最優(yōu)解,而PSO算法的尋優(yōu)參數(shù)則可以作為微調量與二重尋優(yōu)結合,最終結果作為支持向量機的最優(yōu)輸入參數(shù).二重尋優(yōu)算法簡要過程為:
Begin
Forc,gfroma1toa2,step=a3;
{cmd=(c,g);
If svmtrian(trainfactors trainload cmd) cbest=c; gbest=g;} End. 其中,a1,a2為SVM參數(shù)c和g的尋優(yōu)范圍;a3為尋優(yōu)步長;E為允許誤差;cbest與gbest分別為二重尋優(yōu)最優(yōu)參數(shù).二重尋優(yōu)是事先設置參數(shù)范圍與尋優(yōu)步長,通過交叉驗證,遍歷參數(shù)范圍內的各種參數(shù)組合.尋優(yōu)精度受尋優(yōu)步長影響,步長越小,精度越高,但運行時長越長.根據多次實驗結果選取[2-5,25]為c,g的尋優(yōu)范圍,尋優(yōu)步長為20.5. 支持向量機的主要優(yōu)化參數(shù)是c和g,即懲罰系數(shù)與gamma參數(shù).二重尋優(yōu)即給定c和g的范圍,并規(guī)定每次尋優(yōu)步長,通過嵌套循環(huán)來尋找最優(yōu)c和g.二重尋優(yōu)參數(shù)精度主要與c和g的尋優(yōu)范圍和步長有關,范圍過大,易使懲罰系數(shù)過大,模型過擬合,而步長過長則會導致算法運行時間過長,同時精度實際提高并不明顯.為了降低粒子群尋優(yōu)的過擬合程度,設定支持向量機的初始懲罰系數(shù)最小為0.1,最大為100. 設二重尋優(yōu)結果分別為c1與g1,PSO尋優(yōu)結果為c2與g2,則SVM的參數(shù)為: (8) g=g1+k2g2 (9) 式中:k1,k2——PSO尋優(yōu)結果的微調權重. 為了進一步提高模型的準確度,在將影響因素作為輸入樣本的同時,選取預測年前3年的歷史負荷加入輸入樣本.多次實驗結果表明,改進型PSOSVM的預測精度和穩(wěn)定性較其他算法要高. 在確定并量化影響因子后,通過改進型PSOSVM算法對數(shù)據集進行訓練,算法設計結構如圖1所示. 圖1 改進型PSOSVM算法結構 步驟1 根據中長期負荷預測系統(tǒng)的復雜性,對歷史數(shù)據及影響因素有選擇性地提取,并計算各個指標與預測值的相關度,剔除相關度較低的指標; 步驟2 將剩下相關度較高的宏觀因素指標結合預測年前3年的歷史負荷作為輸入樣本; 步驟3 初始化PSO算法與SVM算法,分別利用PSO尋優(yōu)和循環(huán)尋優(yōu)進行SVM參數(shù)尋優(yōu); 步驟4 取二重循環(huán)尋優(yōu)結果為基本最優(yōu)解,PSO尋優(yōu)結果取相應的權重值對基本最優(yōu)解進行微調,獲得SVM模型參數(shù)最優(yōu)解; 步驟5 將最優(yōu)c和g帶入SVM,輸入樣本數(shù)據,進行訓練; 步驟6 進行負荷預測,并與實際值比較,計算均方根誤差. 我們選取上海市2000~2010年的GDP,第1產業(yè)產值,第2產業(yè)產值,第3產業(yè)產值,能源消耗量,常住人口,預測年前3年負荷,共9個指標作為SVM的訓練樣本輸入變量,初始化粒子群算法,c的尋優(yōu)范圍為0.1~100,g的尋優(yōu)范圍0.01~1.根據多次實驗結果,二重尋優(yōu)選取c和g的尋優(yōu)范圍為[2-5,25],步長為20.5;微調系數(shù)k1為0.5,k2為0.001.圖2為各個算法訓練集得出的結果(rmse為絕對誤差的均方根誤差). 圖2 各算法(2000~2010年)訓練集結果 本文選擇樣本輸入變量指標主要包括:GDP,第1產業(yè)產值,第2產業(yè)產值,第3產業(yè)產值,常住人口總數(shù),能源消耗量,電力消費彈性系數(shù),預測年前3年的歷史負荷,共10個變量指標.具體數(shù)據見表2. 由于各個影響因素指標是選取各類宏觀因素中的主要指標,因此在影響因素確定后,需要進行相關度計算.本次實驗的相關度計算是通過SPSS軟件計算得出的.將樣本數(shù)值輸入SPSS軟件得到相應的相關系數(shù)與顯著性水平,計算結果見表3. 表2 2000~2013年10個指標的具體數(shù)據 表3 各變量相關系數(shù) 注:**在0.01水平(雙側上)顯著相關;統(tǒng)計數(shù)據范圍為2000~2013年. 由圖2可以看出,相對于灰度算法,神經網絡與支持向量機算法對于訓練集的學習程度都要高.在得到訓練模型后,利用各個算法的模型分別對上海市2011~2013年的用電量進行預測,各個算法的預測結果如圖3所示. 灰度算法3年預測值均方根誤差為15.39%,BP神經網絡3年預測值均方根誤差為5.19%,標準SVM算法3年預測值均方根誤差為3.31%,多因素改進型PSOSVM算法3年預測值均方根誤差為0.41%. 由此表明,灰度算法由于僅僅是在歷史負荷的基礎上進行相關預測,沒有考慮宏觀的影響因素,因此預測結果并不理想;而BP算法和通過二重尋優(yōu)SVM算法,由于考慮了多種因素,并將多種宏觀因素作為訓練集的輸入,因此相對于灰度算法,其精度有了一定的提高.本文提出的多因素改進型PSOSVM算法在SVM尋優(yōu)參數(shù)的基礎上,引入PSO尋優(yōu)算法對參數(shù)結果進行微調,使該算法預測結果精度得到了進一步的提高. 圖3 各算法(2011~2013年)預測結果比較 電力負荷中長期預測是一個系統(tǒng)有機整體,在規(guī)劃區(qū)域電力發(fā)展藍圖時,從地區(qū)的實際出發(fā),需考慮自然、經濟、社會、人文的各種要素.本文通過不同算法的比較可知:是否考慮宏觀因素對負荷預測結果影響很大;簡單PSOSVM預測算法容易出現(xiàn)過擬合預測,從而影響預測準確性;而通過對參數(shù)值的改進尋優(yōu),可提高預測精度并保證預測的準確性. [1] 李紅偉,毛文晉.基于雙向差分建模的優(yōu)化GM(1,1)模型及其在中長期電力負荷預測中的應用[J].電力系統(tǒng)保護與控制,2011,39(13):56-61. [2] 李钷,李敏,劉滌塵.基于改進回歸法的電力負荷預測[J].電網技術,2006,30(1):99-104. [3] 蔣燕,王少楊,封蕓.基于遞歸等權組合模型的中長期電力負荷預測[J].電力系統(tǒng)及其自動化學報,2012,24(1):151-155. [4] 陳澤淮,張堯,武志剛.RBF神經網絡在中長期負荷預測中的應用[J].電力系統(tǒng)及其自動化學報,2006,18(1):15-19. [5] 陸寧,周建中,何耀耀.粒子群優(yōu)化的神經網絡模型在短期負荷預測中的應用[J].電力系統(tǒng)保護與控制,2010,38(12):65-68. [6] 張雪君,陳剛,周杰,等.基于粒子群優(yōu)化魯棒支持向量回歸機的中長期負荷預測[J].電力系統(tǒng)保護與控制,2009,37(21):76-80. [7] GHELARDONI L,GHIO A,ANGUITA D.Energy load forecasting using empirical mode decomposition and support vector regression[J].Smart Grid,IEEE Transactions on,2013,4(1):549-556. [8] 王志征,余岳峰,姚國平.主成份分析法在電力負荷預測中的應用[J].電力需求側管理,2003,5(3):21-24. [9] 吳鈺,王杰.綜合最優(yōu)灰色支持向量機模型在季節(jié)型電力負荷預測中的應用[J].華東電力,2012,40(1):18-21. [10] 崔和瑞,劉冬.區(qū)域電力負荷中長期預測復雜性研究[J].華東電力,2011,39(8):1 233-1 237. (編輯 胡小萍) Medium and Long-term Load Forecasting Based onMulti-factors Modified Psosvm Algorithm CAO Yukun, SHUAI Hao (SchoolofComputerScienceandTechnology,ShanghaiUniversityofElectricPower,Shanghai200090,China) Medium and long-term load forecasting as an important part of the electric power planning and scheduling,its influence factors have diversity,uncertainty,etc.Article selection of support vector machine (SVM) is the core of the medium and long-term load forecasting algorithm,screening of a variety of regional macroeconomic factors uses particle swarm optimization (PSO) and the improved algorithm of loop optimization of support vector machine (SVM) parameters optimization,load forecasting.The simulation results show that the modified PSOSVM algorithm has a high prediction precision. medium and long-term load forecasting; macro factors; PSO and cross validation optimization; modified PSOSVM algorithm; support vector machine 10.3969/j.issn.1006-4729.2016.06.021 2016-01-16 簡介:帥浩(1991-),男,在讀碩士,江蘇江都人.主要研究方向為電力大數(shù)據下的負荷預測.E-mail:shuaihao23@126.com. TM715;TP18 A 1006-4729(2016)06-0603-063 算法預測流程
4 實例仿真
5 結 語