劉曉悅 孫玉容
摘 要: 為了應(yīng)對(duì)大規(guī)模電動(dòng)汽車充電站負(fù)荷的調(diào)度管理,提出一種基于Hadoop的模糊灰色GA?BP神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測(cè)模型。在云平臺(tái)上,運(yùn)用模糊聚類及灰色關(guān)聯(lián)度分析選取相似日,將相似日負(fù)荷代入MapReduce架構(gòu)下的GA?BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行學(xué)習(xí),獲得待測(cè)日的預(yù)測(cè)負(fù)荷。以城市轄區(qū)快換式充電站實(shí)測(cè)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果證明,此方法在快換式充電站的負(fù)荷預(yù)測(cè)上兼具高效性與精確性。
關(guān)鍵詞: Hadoop架構(gòu); 模糊聚類; 灰色關(guān)聯(lián)分析; 負(fù)荷預(yù)測(cè); BP神經(jīng)網(wǎng)絡(luò); 快換式電動(dòng)汽車充電站
中圖分類號(hào): TN711?34; TM734 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)13?0074?04
Abstract: A fuzzy gray GA?BP neural network load forecasting model based on Hadoop is proposed to deal with the load dispatch management of large?scale electric vehicle charging station. The fuzzy clustering and gray relational analysis are used in the cloud platform to select the similar days, and then the similar daily loads are brought into the GA?BP neural network prediction model under MapReduce architecture for learning, so as to obtain the forecasting load of the testing day. The experiment was performed for the measured data of quick?change charging station in city area. The experimental results show this method both has efficiency and accuracy for the load forecasting of the quick?change charging station.
Keywords: Hadoop architecture; fuzzy clustering; gray relational analysis; load forecasting; BP neural network; quick?change electric vehicle charging station
電動(dòng)汽車行業(yè)迅速發(fā)展,電動(dòng)汽車負(fù)荷數(shù)據(jù)逐年增加,導(dǎo)致充電站負(fù)荷數(shù)據(jù)量急劇增漲,對(duì)電網(wǎng)系統(tǒng)及基礎(chǔ)設(shè)施產(chǎn)生重大的影響[1?3]。眾多數(shù)據(jù)和實(shí)例表明,精準(zhǔn)的負(fù)荷預(yù)測(cè)保障了快換式電動(dòng)汽車的平穩(wěn)運(yùn)行和能源的合理調(diào)度,對(duì)國(guó)家電網(wǎng)調(diào)度、能源管理有著重要意義[4?6]。
目前,針對(duì)電動(dòng)汽車充電站負(fù)荷預(yù)測(cè)的方法還存在著局限性,文獻(xiàn)[7]提出基于模糊聚類分析和BP神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)負(fù)荷預(yù)測(cè),通過(guò)模糊聚類分析選擇相似日,建立BP網(wǎng)絡(luò)模型。但是通過(guò)模糊聚類得到的只是與預(yù)測(cè)日影響因素相似的負(fù)荷數(shù)據(jù),不具備良好的負(fù)荷曲線相似性[8],并且訓(xùn)練樣本復(fù)雜,容易陷入局部極小值。文獻(xiàn)[9]運(yùn)用模糊聚類灰色關(guān)聯(lián)分析法選擇相似日,根據(jù)負(fù)荷特點(diǎn)分時(shí)建立網(wǎng)絡(luò)模型預(yù)測(cè),但BP網(wǎng)絡(luò)存在收斂速度慢、權(quán)重初始化隨機(jī)等問(wèn)題。
對(duì)于定點(diǎn)定線大密度行駛的通勤班車,電池快換式電動(dòng)汽車充電站適合車輛大負(fù)荷運(yùn)轉(zhuǎn)的電能補(bǔ)給方式。為了使轄區(qū)諸多充電站組成的負(fù)荷網(wǎng)進(jìn)行科學(xué)合理的能源調(diào)度管理,本文分析了快換式電動(dòng)汽車充電站日負(fù)荷特性及氣象等相關(guān)因素,結(jié)合負(fù)荷數(shù)據(jù)海量的特點(diǎn),引入以Hadoop分布式平臺(tái)為代表的可實(shí)現(xiàn)并行計(jì)算和分布式處理的云計(jì)算[10]。研究一種滿足海量數(shù)據(jù)要求的短期、快速、精準(zhǔn)的快換式充電站負(fù)荷預(yù)測(cè)方法,為城市建立大規(guī)模電動(dòng)汽車充電網(wǎng)提供了理論依據(jù)和數(shù)據(jù)支撐。
1.1 模糊聚類
為明確影響快換式充電站負(fù)荷變化的因素,對(duì)歷史負(fù)荷數(shù)據(jù)進(jìn)行記錄研究,結(jié)果表明日類型、氣象因素和公交調(diào)度因素等對(duì)負(fù)荷的影響較大。在云平臺(tái)下,通過(guò)模糊化規(guī)則表1將歷史日的主要影響因素轉(zhuǎn)化為數(shù)值構(gòu)成一組特征向量,與待測(cè)日模糊化數(shù)值相同的日期入選相似日粗集。
1.2 灰色關(guān)聯(lián)分析
上述方法只是粗略得到了相似日,作為預(yù)測(cè)的數(shù)據(jù)需要的是與預(yù)測(cè)日更加接近的數(shù)據(jù)。在云平臺(tái)上,將日最高氣溫、日最低氣溫、日累計(jì)充電車數(shù)量作為特征向量進(jìn)行灰色關(guān)聯(lián)分析。
6) 根據(jù)關(guān)聯(lián)度選取待測(cè)日的相似日樣本,本文選取日粗集中所有關(guān)聯(lián)度[≥]0.9的樣本作為相似日。
2.1 遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性函數(shù)逼近能力和自學(xué)習(xí)能力,但也存在學(xué)習(xí)收斂速度太慢、易陷入局部最小、權(quán)重初始化隨機(jī)等缺點(diǎn)[11]。遺傳算法模擬了大自然的生物進(jìn)化過(guò)程,能并行隨機(jī)搜尋最優(yōu)解,具有很強(qiáng)的全局搜索能力。用遺傳算法來(lái)優(yōu)化BP網(wǎng)絡(luò)最初的權(quán)值和閾值[12?13],能夠加快學(xué)習(xí)收斂速度,提高模型預(yù)測(cè)精度。
2.2 基于MapReduce框架的GA?BP神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測(cè)模型
傳統(tǒng)的BP網(wǎng)絡(luò)訓(xùn)練方法在海量數(shù)據(jù)出現(xiàn)時(shí)暴露了很多問(wèn)題,如耗時(shí)過(guò)多,速度緩慢,甚至因內(nèi)存不足而無(wú)法訓(xùn)練。針對(duì)這些問(wèn)題,提出基于MapReduce框架的GA?BP網(wǎng)絡(luò)負(fù)荷預(yù)測(cè)模型。
本文使用當(dāng)前最流行的開(kāi)源云計(jì)算Hadoop平臺(tái),首先將文件并行化處理,大大節(jié)約了操作時(shí)間。Hadoop由分布式文件系統(tǒng)HDFS和MapReduce組成。HDFS提供高吞吐量來(lái)訪問(wèn)應(yīng)用數(shù)據(jù),對(duì)海量數(shù)據(jù)的處理具有很高的效率。HDFS是主從架構(gòu)模式,其架構(gòu)圖如圖1所示。
HDFS由一個(gè)Namenode(管理節(jié)點(diǎn))和多個(gè)Datanode(數(shù)據(jù)節(jié)點(diǎn))構(gòu)成,Namenode記錄Datanode的信息,Datanode以文件的形式存儲(chǔ)HDFS數(shù)據(jù)。每個(gè)普通PC機(jī)都可以成為一個(gè)節(jié)點(diǎn)。
MapReduce是Hadoop的核心,包括Map和Reduce兩個(gè)階段,是一種并行編程模式。用鍵值對(duì)
在MapReduce框架下,GA?BP網(wǎng)絡(luò)預(yù)測(cè)具體的流程如圖2所示。
首先在Map函數(shù)中讀取訓(xùn)練樣本及權(quán)值閾值,加載到內(nèi)存。然后進(jìn)行遺傳算法尋優(yōu),經(jīng)過(guò)多次迭代達(dá)到次數(shù)要求后得到優(yōu)化的權(quán)值及閾值。將優(yōu)化的權(quán)值及閾值代入BP神經(jīng)網(wǎng)絡(luò),所有Map任務(wù)并行進(jìn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),調(diào)整網(wǎng)絡(luò)的連接權(quán)值及閾值,經(jīng)過(guò)迭代后如果訓(xùn)練次數(shù)或輸出誤差達(dá)到設(shè)定值,輸出當(dāng)前權(quán)值及閾值[14]。
接收Map函數(shù)輸出的權(quán)值及閾值,累計(jì)所有Map端相同個(gè)體的權(quán)值與閾值并求均值即為最優(yōu)權(quán)值和閾值。更新網(wǎng)絡(luò)權(quán)值,寫入HDFS,供下次迭代訓(xùn)練使用。
經(jīng)過(guò)多次MapReduce任務(wù)運(yùn)行后,如果精度滿足要求或迭代次數(shù)達(dá)到要求,訓(xùn)練結(jié)束。
3.1 實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置
實(shí)驗(yàn)選用由5臺(tái)PC機(jī)搭建的Hadoop云平臺(tái),3臺(tái)PC機(jī)為雙核2.6 GHz,4 GB內(nèi)存,2臺(tái)為雙核2.4 GHz,2 GB內(nèi)存。Hadoop版本為2.6.0,使用千兆網(wǎng)卡,通過(guò)交換機(jī)連接。
初始化神經(jīng)網(wǎng)絡(luò)參數(shù):輸入層節(jié)點(diǎn)數(shù)[S1=1],隱層節(jié)點(diǎn)數(shù)[S2=8],輸出層節(jié)點(diǎn)數(shù)[S3=1],輸入層到隱層采用雙曲正切S型函數(shù)tansig,隱層到輸出層采用線性函數(shù)purelin,網(wǎng)絡(luò)訓(xùn)練采用trainlm算法。初始權(quán)值設(shè)置為[0,0.2]間的隨機(jī)數(shù),初始閾值選取為[0,0.5]間的隨機(jī)數(shù),學(xué)習(xí)速率取0.1。遺傳交叉率為0.5,變異率為0.003,進(jìn)化代數(shù)為200。
3.2 實(shí)驗(yàn)過(guò)程及結(jié)果分析
唐山市整個(gè)轄區(qū)分為5個(gè)區(qū)域,每個(gè)區(qū)域內(nèi)又包含20~30個(gè)快換式充電站不等,選取轄區(qū)內(nèi)某區(qū)域的一個(gè)快換式充電站站點(diǎn)(站1)進(jìn)行實(shí)驗(yàn),采集2016年一整年的負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù),選取2017年5月15日為待測(cè)日,待預(yù)測(cè)日的實(shí)際負(fù)荷數(shù)據(jù)如表2所示。
橫向?qū)Ρ确ㄐ拚惓v史負(fù)荷數(shù)據(jù)。模糊聚類選擇相似日粗集,模糊化規(guī)則下共得到37個(gè)相似日入選相似日粗集。將日粗集的最高氣溫、最低氣溫、日累計(jì)充電車數(shù)量構(gòu)成子向量,運(yùn)用灰色關(guān)聯(lián)度分析選擇相似日,首先利用式(2)進(jìn)行初始化變換,消除數(shù)量級(jí)影響,利用式(3)求得差序列得到差矩陣,找出最大差與最小差,利用式(5)求取灰色關(guān)聯(lián)矩陣系數(shù),最后,利用式(6)得到關(guān)聯(lián)度,篩選出關(guān)聯(lián)度[≥]0.9的相似日共21日,這21個(gè)相似日的負(fù)荷數(shù)據(jù)即為樣本。對(duì)每日20個(gè)時(shí)刻(5時(shí)充電站開(kāi)始運(yùn)行,24時(shí)充電站關(guān)閉)分別建立GA?BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)。將訓(xùn)練樣本代入BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行學(xué)習(xí),預(yù)測(cè)結(jié)果如圖3所示。
為了驗(yàn)證本文所提方法的精確性與高效性,建立單機(jī)GA?BP網(wǎng)絡(luò)模型對(duì)同一日負(fù)荷進(jìn)行預(yù)測(cè)。
利用式(7),式(8)計(jì)算平均相對(duì)誤差和預(yù)測(cè)精度來(lái)衡量預(yù)測(cè)結(jié)果的好壞,表3為單機(jī)GA?BP神經(jīng)網(wǎng)絡(luò)模型方法與本文MapReduce模型方法統(tǒng)計(jì)對(duì)比表。
由表3可以看出,MapReduce模型比單機(jī)模型平均相對(duì)誤差百分比下降了1.08%,預(yù)測(cè)精度則高出2.07%,說(shuō)明MapReduce架構(gòu)下的GA?BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法具有更精準(zhǔn)的預(yù)測(cè)效果。
分別取20 MB,100 MB,1 024 MB,5 120 MB數(shù)據(jù)分成4組,進(jìn)行處理效率對(duì)比。為了避免偶然因素產(chǎn)生的誤差,取10次測(cè)試的平均值作為最終結(jié)果,如表4所示。
在數(shù)據(jù)量較少時(shí),單機(jī)的效率優(yōu)于MapReduce模型的效率。這是由于,當(dāng)數(shù)據(jù)量較少時(shí),算法執(zhí)行期間節(jié)點(diǎn)間信息的交互消耗了一定的時(shí)間。隨著數(shù)據(jù)量的增加,MapReduce模型的效率越來(lái)越高,優(yōu)勢(shì)越來(lái)越顯著,體現(xiàn)了Hadoop在處理海量數(shù)據(jù)方面更具有高效性。
根據(jù)快換式電動(dòng)汽車充電站的負(fù)荷特性與負(fù)荷數(shù)據(jù)特點(diǎn),提出基于Hadoop的GA?BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。在云平臺(tái)下,結(jié)合模糊聚類灰色關(guān)聯(lián)分析提取相似日,對(duì)相似日負(fù)荷數(shù)據(jù)進(jìn)行GA?BP網(wǎng)絡(luò)預(yù)測(cè)模型學(xué)習(xí)訓(xùn)練。通過(guò)對(duì)某轄區(qū)實(shí)際區(qū)域內(nèi)快換式充電站的負(fù)荷進(jìn)行預(yù)測(cè),證明該方法兼具精確性和高效性,為快換式充電站的負(fù)荷預(yù)測(cè)問(wèn)題提供了新思路。
[1] 田立亭,史雙龍,賈卓.電動(dòng)汽車充電功率需求的統(tǒng)計(jì)學(xué)建模方法[J].電網(wǎng)技術(shù),2010,34(11):126?130.
TIAN Liting, SHI Shuanglong, JIA Zhuo. A statistical modeling method for charging power requirements of electric vehicles [J]. Power system technology, 2010, 34(11): 126?130.
[2] 周逢權(quán),連湛偉,王曉雷,等.電動(dòng)汽車充電站運(yùn)營(yíng)模式探析[J].電力系統(tǒng)保護(hù)與控制,2010,38(21):63?66.
ZHOU Fengquan, LIAN Zhanwei, WANG Xiaolei, et al. Analysis of operation modes of electric vehicle charging stations [J]. Power system protection and control, 2010, 38(21): 63?66.
[3] 李瑞生,王曉雷,周逢權(quán),等.靈巧潮流控制的電動(dòng)汽車智能化充電站[J].電力系統(tǒng)保護(hù)與控制,2010,38(21):87?90.
LI Ruisheng, WANG Xiaolei, ZHOU Fengquan, et al. Smart charging stations for smart electric vehicles [J]. Power system protection and control, 2010, 38(21): 87?90.
[4] 康重慶,夏清,劉梅.電力系統(tǒng)負(fù)荷預(yù)測(cè)[M].北京:中國(guó)電力出版社,2007.
KANG Chongqing, XIA Qing, LIU Mei. Power system load forecast [M]. Beijing: China Electric Power Press, 2007.
[5] 牛東曉,曹樹(shù)華,盧建昌,等.電力負(fù)荷預(yù)測(cè)技術(shù)及其應(yīng)用[M].北京:中國(guó)電力出版社,2009.
NIU Dongxiao, CAO Shuhua, LU Jianchang, et al. Power load forecasting technology and its application [M]. Beijing: China Electric Power Press, 2009.
[6] 廖旎煥,胡智宏,馬瑩瑩,等.電力系統(tǒng)短期負(fù)荷預(yù)測(cè)方法綜述[J].電力系統(tǒng)保護(hù)與控制,2011,39(1):147?152.
LIAO Yihuan, HU Zhihong, MA Yingying, et al. Review of short?term load forecasting methods for power systems [J]. Power system protection and control, 2011, 39(1): 147?152
[7] 姚李孝,宋玲芳,李慶宇,等.基于模糊聚類分析與BP網(wǎng)絡(luò)的電力系統(tǒng)短期負(fù)荷預(yù)測(cè)[J].電網(wǎng)技術(shù),2005,29(1):20?23.
YAO Lixiao, SONG Lingfang, LI Qingyu, et al. Short?term load forecasting of power system based on fuzzy clustering analysis and BP neural network [J]. Power system technology, 2005, 29(1): 22?23.
[8] 莫維仁,張伯明,孫宏斌,等.短期負(fù)荷預(yù)測(cè)中選擇相似日的探討[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,44(1):106?109.
MO Weiren, ZHANG Boming, SUN Hongbin, et al. Discussion on selecting similar days in short?term load forecasting [J]. Journal of Tsinghua University (natural science edition), 2004, 44(1): 106?109.
[9] 張平,潘學(xué)萍,薛文超.基于小波分解模糊灰色聚類和BP神經(jīng)網(wǎng)絡(luò)的短期負(fù)荷預(yù)測(cè)[J].電力自動(dòng)化設(shè)備,2012,32(11):121?125.
ZHANG Ping, PAN Xueping, XUE Wenchao. Short?term load forecasting based on wavelet decomposition fuzzy grey clustering and BP neural network [J]. Electric power automation equipment, 2012, 32(11): 121?125.
[10] 王意潔,孫偉東,周松,等.云計(jì)算環(huán)境下的分布存儲(chǔ)關(guān)鍵技術(shù)[J].軟件學(xué)報(bào),2012,23(4):962?986.
WANG Yijie, SUN Weidong, ZHOU Song, et al. Key technologies of distributed storage in cloud computing environment [J]. Journal of software, 2012, 23(4): 962?986.
[11] HE Kaiming, SUN Jian, TANG Xiaoou. Guided image filtering [C]// Proceedings of the 11th European Conference on Computer Vision. Crete, Greece: Springer, 2010: 402?409.
[12] 陳國(guó)良,王煦法,莊鎮(zhèn)泉,等.遺傳算法及其應(yīng)用[M].北京:人民郵電出版社,2001.
CHEN Guoliang, WANG Xufa, ZHUANG Zhenquan, et al. Genetic algorithm and its application [M]. Beijing: People′s Posts and Telecommunications Press, 2001.
[13] JOBSON D J, RAHMAN Z, WOODELL G A. The statistics of visual representation [C]// Proceedings of International Society for Optical Engineering Visual Information Proceeding. Washington D. C., USA: SPIE Press, 2002: 25?35.
[14] 朱晨杰,楊永麗.基于MapReduce的BP神經(jīng)網(wǎng)絡(luò)算法研究[J].微型電腦應(yīng)用,2012,28(10):9?12.
ZHU Chenjie, YANG Yongli. Research on BP neural network algorithm based on MapReduce [J]. Microcomputer applications, 2012, 28(10): 9?12.