王帥 杜欣慧 姚宏民
摘 要: 密度峰值聚類算法具有收斂速度快、魯棒性強(qiáng)、無需人為確定最佳聚類數(shù)等特點(diǎn),具備較好的應(yīng)用前景。為提高光伏功率預(yù)測(cè)的精度,提出一種將密度峰值聚類算法應(yīng)用于短期光伏功率預(yù)測(cè)的方法,并進(jìn)行了必要優(yōu)化。該方法首先通過類間距離優(yōu)化增強(qiáng)氣象數(shù)據(jù)的可分性;然后利用密度峰值聚類對(duì)其進(jìn)行無標(biāo)簽歸類,通過灰色關(guān)聯(lián)度匹配出與待預(yù)測(cè)日相關(guān)度最高的類別;最后將其作為Elman神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,得到預(yù)測(cè)結(jié)果。Matlab仿真結(jié)果表明,該方法能夠明顯提高氣象數(shù)據(jù)的聚類效果,并有效提高光伏功率的短期預(yù)測(cè)精度。
關(guān)鍵詞: 密度峰值聚類; 光伏發(fā)電; 灰色關(guān)聯(lián)度; 相似日匹配; Elman神經(jīng)網(wǎng)絡(luò); 短期功率預(yù)測(cè)
中圖分類號(hào): TN830.4?34; TM715 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)20?0141?05
Abstract: The density peak clustering algorithm has the characteristics of fast convergence speed, strong robustness, and no need to manually determine the optimal clustering numbers, which has a good application prospect. Therefore, a method of applying the density peak clustering algorithm to short?term photovoltaic power prediction is proposed and necessarily optimized to improve the accuracy of photovoltaic power prediction. In the method, the separability of meteorological data is enhanced by means of inter?class distance optimization. The density peak clustering is adopted to classify the meteorological data without using labels. The category that has the highest degree of correlation with to?be predicted days is matched by using the grey correlation degree, and finally taken as the training sample of the Elman neural network to obtain the prediction results. The Matlab simulation results show that the method can significantly improve the clustering effect of meteorological data and short?term prediction accuracy of photovoltaic power.
Keywords: density peak clustering; photovoltaic power generation; grey correlation degree; similar day matching; Elman neural network; short?term power prediction
光伏發(fā)電系統(tǒng)因其電能可控性強(qiáng),調(diào)度管理便捷、調(diào)峰性能良好、響應(yīng)迅速等優(yōu)點(diǎn)而得到了廣泛應(yīng)用。但由于其輸出功率受風(fēng)速、氣溫、陽光輻射度、日降雨量、氣壓等氣象因素影響存在較大隨機(jī)波動(dòng)性[1?3],致使有功功率不穩(wěn)定而對(duì)電網(wǎng)造成干擾。因此,精準(zhǔn)的光伏發(fā)電功率預(yù)測(cè)有助于降低對(duì)電網(wǎng)的影響,也便于電力工作人員的調(diào)度管理工作。
目前,采用較多的預(yù)測(cè)方法是神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法[4?5]。即使用歷史發(fā)電量與氣象數(shù)據(jù)組成的訓(xùn)練樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)能力,將待預(yù)測(cè)日的氣象特征(通過數(shù)值天氣預(yù)報(bào)獲得)輸入網(wǎng)絡(luò)后得到預(yù)測(cè)結(jié)果。其中,提高訓(xùn)練樣本與待預(yù)測(cè)日的相關(guān)性極其重要。訓(xùn)練樣本越精確、合理,神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果就越準(zhǔn)確[6]。
文獻(xiàn)[7]通過相關(guān)性分析,確定出影響電量的主要?dú)庀笠蛩?。利用傳統(tǒng)的SOM算法對(duì)天氣類型進(jìn)行聚類,然后使用對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。但僅選取氣溫與濕度作為氣象特征輸入量,其氣象特征的綜合代表性較差。當(dāng)聚類數(shù)據(jù)集的特征量較多時(shí),SOM算法又易陷入局部最優(yōu)。文獻(xiàn)[8]在提高訓(xùn)練樣本準(zhǔn)確性時(shí)使用了常規(guī)算法K?Means聚類,但未解決常規(guī)聚類算法收斂速度慢、需指定聚類個(gè)數(shù)、對(duì)噪聲點(diǎn)敏感等問題。文獻(xiàn)[9]提出一種全新聚類算法(密度峰值聚類),幾乎無需設(shè)定參數(shù)且在大規(guī)模數(shù)據(jù)集中具有魯棒性,能夠較好地克服以上問題,具備較好的應(yīng)用前景。
本文將密度峰值聚類算法應(yīng)用于短期光伏功率預(yù)測(cè),首先基于直方圖均衡化原理實(shí)現(xiàn)類間距離優(yōu)化,提高密度峰值聚類算法的有效性。然后根據(jù)聚類結(jié)果計(jì)算灰色關(guān)聯(lián)度,匹配到更加準(zhǔn)確合理的訓(xùn)練樣本。最后,基于Elman神經(jīng)網(wǎng)絡(luò)得出預(yù)測(cè)結(jié)果,并對(duì)其誤差進(jìn)行分析。
1.1 密度峰值聚類算法原理
密度峰值聚類算法首先明確了聚類中心的特點(diǎn)[9]:聚類中心的局部密度較大,其周圍被一些較低密度的鄰居所包圍;聚類中心距離那些局部密度更大的數(shù)據(jù)點(diǎn)相對(duì)較遠(yuǎn)。
1.2 基于直方圖均衡化的類間距離優(yōu)化
1.2.1 距離矩陣[D]的定義
可將直方圖均衡化思想擴(kuò)展至本文的聚類問題,即通過均衡化類簇之間的距離增強(qiáng)數(shù)據(jù)對(duì)比度,并提高數(shù)據(jù)可分性。
1.2.3 優(yōu)化過程
密度峰值聚類后各類均有唯一的中心,以類簇為整體,在保證每個(gè)類簇內(nèi)部結(jié)構(gòu)不變的前提下進(jìn)行類間距離均衡化,能夠增強(qiáng)數(shù)據(jù)可分性。距離擴(kuò)散的程度基于式(8),示意圖如圖2所示。
1.2.4 算法實(shí)現(xiàn)
由于每次被替換的元素僅屬某兩個(gè)類別,既不會(huì)影響其他類間距離,也不會(huì)影響任何類內(nèi)距離。[D′]即為類間優(yōu)化后的全新距離矩陣。
2.1 結(jié)合灰色關(guān)聯(lián)分析法的相似日樣本匹配
在得到聚類結(jié)果后,通過灰色關(guān)聯(lián)分析法選取待預(yù)測(cè)日的相似日樣本。將各類簇的氣象特征向量作為比較數(shù)列,將待預(yù)測(cè)日的氣象特征向量(通過數(shù)值天氣預(yù)報(bào)獲得)作為參考數(shù)列。
2.2 Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型
Elman網(wǎng)絡(luò)可以看作是一個(gè)具有局部記憶單元和局部反饋連接的遞歸神經(jīng)網(wǎng)絡(luò),其基本結(jié)構(gòu)如圖3所示。
3.1 聚類結(jié)果分析
構(gòu)建光伏系統(tǒng)的氣象特征量:平均風(fēng)速、氣溫、陽光輻射度、日降雨量、最大風(fēng)速和氣壓。每個(gè)特征量在5:00—19:00內(nèi)每隔1 h采集1次,每日15個(gè)點(diǎn),共180天。歸一化后形成[180×90]維的特征矩陣,計(jì)算距離矩陣后進(jìn)行聚類分析。
首先執(zhí)行傳統(tǒng)密度峰值聚類算法如圖4所示。聚類中心過少,需進(jìn)行優(yōu)化以挖掘隱含中心。
此時(shí),應(yīng)重新選取包括更多“疑似中心”在內(nèi)的點(diǎn)作為初始中心。經(jīng)1.2.4節(jié)優(yōu)化后得到全新距離矩陣,作出決策圖與[γ]曲線,如圖5所示,優(yōu)化后聚類中心增多至5個(gè)。由此表明,經(jīng)過類間距離優(yōu)化后,某些“隱藏類簇”被挖掘出來。
3.2 聚類算法的性能分析
本文采用3種典型指標(biāo)對(duì)不同時(shí)間跨度的10個(gè)數(shù)據(jù)集進(jìn)行聚類有效性評(píng)價(jià),評(píng)價(jià)結(jié)果如圖7~圖9所示。其中:SSE(誤差平方和)代表一個(gè)子類到所在類簇的聚類中心的歐氏距離,該值越小聚類效果越好;DBI(Davies?Bouldin Index)代表所有類之間最大相似度的均值,該值越小聚類效果越好;SC(輪廓系數(shù))結(jié)合了類簇內(nèi)聚度和類間分離度兩個(gè)計(jì)算指標(biāo),該值越接近1聚類效果越好。
圖7比較了在優(yōu)化前后的SSE指標(biāo),優(yōu)化后SSE明顯下降;圖8比較了優(yōu)化前后的DBI指標(biāo),優(yōu)化后DBI下降同樣較為明顯;圖9比較了優(yōu)化前后的SC指標(biāo),優(yōu)化后SC出現(xiàn)了明顯提高。由此可見,優(yōu)化算法的優(yōu)化性能顯著,能夠有效提升聚類的有效性。
3.3 相似日匹配與功率預(yù)測(cè)分析
得到聚類結(jié)果后,通過2.1節(jié)相似日匹配方法計(jì)算出待預(yù)測(cè)日與各類簇之間的灰色關(guān)聯(lián)度[Rl]。其的計(jì)算結(jié)果,如表2所示。類簇2的關(guān)聯(lián)度最高,分別將其對(duì)應(yīng)的氣象數(shù)據(jù)與發(fā)電數(shù)據(jù)作為訓(xùn)練集,經(jīng)Elman模型學(xué)習(xí)后得出預(yù)測(cè)結(jié)果,如圖10所示。傳統(tǒng)算法的預(yù)測(cè)結(jié)果如圖11所示。
結(jié)合表3分析圖10、圖11可知,相較于傳統(tǒng)算法,優(yōu)化算法的功率預(yù)測(cè)曲線與實(shí)測(cè)曲線的契合度更高、預(yù)測(cè)誤差更?。▋H為2.35%),預(yù)測(cè)整體精度得到了明顯提高。
本文提出一種基于密度峰值聚類的短期光伏功率預(yù)測(cè)方法,詳細(xì)闡述了聚類算法的原理、優(yōu)化過程的具體實(shí)現(xiàn)步驟,以及利用聚類結(jié)果實(shí)現(xiàn)短期光伏功率預(yù)測(cè)的過程。實(shí)驗(yàn)結(jié)果表明,類間距離優(yōu)化能夠有效提高密度峰值聚類算法的有效性,且算法在優(yōu)化后能有效提高光伏功率的短期預(yù)測(cè)精度。
參考文獻(xiàn)
[1] 嵇靈,牛東曉,汪鵬.基于相似日聚類和貝葉斯神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電功率預(yù)測(cè)研究[J].中國(guó)管理科學(xué),2015,23(3):118?122.
JI Ling, NIU Dongxiao, WANG Peng. Photovoltaic load forecasting based on the similar day and Bayesian neural network [J]. Chinese journal of management science, 2015, 23(3): 118?122.
[2] 楊金煥,于化叢,葛亮.太陽能光伏發(fā)電應(yīng)用技術(shù)[M].北京:電子工業(yè)出版社,2009.
YANG Jinhuan, YU Huacong, GE Liang. Application technology of solar photovoltaic power generation [M]. Beijing: Publishing House of Electronics Industry, 2009.
[3] 周念成,閆立偉,王強(qiáng)鋼.光伏發(fā)電在微電網(wǎng)中接入及動(dòng)態(tài)特性研究[J].電力系統(tǒng)保護(hù)與控制,2010,38(14):119?127.
ZHOU Niancheng, YAN Liwei, WANG Qianggang. Research on dynamic characteristic and integration of photovoltaic generation in microgrids [J]. Power system protection and control, 2010, 38(14): 119?127.
[4] 王曉蘭,葛鵬江.基于相似日和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的光伏陣列輸出功率預(yù)測(cè)[J].電力自動(dòng)化設(shè)備,2013,33(1):100?103.
WANG Xiaolan, GE Pengjiang. PV array output power forecasting based on similar day and RBFNN [J]. Electric power automation equipment, 2013, 33(1): 100?103.
[5] 傅美平,馬紅偉,毛建容.基于相似日和最小二乘支持向量機(jī)的光伏發(fā)電短期預(yù)測(cè)[J].電力系統(tǒng)保護(hù)與控制,2012,40(16):65?69.
FU Meiping, MA Hongwei, MAO Jianrong. Short?term photovoltaic power forecasting based on similar days and least square support vector machine [J]. Power system protection and control, 2012, 40(16): 65?69.
[6] 程啟明,張強(qiáng),程尹曼,等.基于密度峰值層次聚類的短期光伏功率預(yù)測(cè)模型[J].高電壓技術(shù),2017,43(4):1214?1222.
CHENG Qiming, ZHANG Qiang, CHENG Yinman, et al. Short?term photovoltaic power prediction model based on hierarchical clustering of density peaks [J]. High voltage engineering, 2017, 43(4): 1214?1222.
[7] 代倩,段善旭,蔡濤,等.基于天氣類型聚類識(shí)別的光伏系統(tǒng)短期無輻照度發(fā)電預(yù)測(cè)模型研究[J].中國(guó)電機(jī)工程學(xué)報(bào),2011,31(34):28?35.
DAI Qian, DUAN Shanxu, CAI Tao, et al. Short?term PV generation system forecasting model without irradiation based on weather type clustering [J]. Proceedings of the CSEE, 2011, 31(34): 28?35.
[8] 丁志勇,楊蘋,楊曦,等.基于連續(xù)時(shí)間段聚類的支持向量機(jī)風(fēng)電功率預(yù)測(cè)方法[J].電力系統(tǒng)自動(dòng)化,2012,36(14):131?135.
DING Zhiyong, YANG Ping, YANG Xi, et al. Wind power prediction method based on sequential time clustering support vector machine [J]. Automation of electric power systems, 2012, 36(14): 131?135.
[9] RODRIGUEZ A, LAIO A. Clustering by fast search and find of density peaks [J]. Science, 2014, 344(6191): 1492?1496.
[10] HAN J W, KAMBER M.數(shù)據(jù)挖掘:概念與技術(shù)[M].范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2001.
HAN J W, KAMBER M. Data mining: concepts and techniques [M]. FAN Ming, MENG Xiaofeng, translation. Beijing: China Machine Press, 2001.