徐國(guó)鋒,鐘曉紅
(國(guó)網(wǎng)杭州市蕭山區(qū)供電公司,浙江 杭州 311201)
隨著計(jì)算機(jī)數(shù)據(jù)儲(chǔ)存能力的提升,電力數(shù)據(jù)的儲(chǔ)存量也快速增加。數(shù)據(jù)分類(lèi)和整理的可視化預(yù)處理工作變得至關(guān)重要,給電力數(shù)據(jù)的可視化分析帶來(lái)了挑戰(zhàn)[1]。
可視化技術(shù)有著強(qiáng)大的數(shù)據(jù)計(jì)算能力和數(shù)據(jù)處理能力,方便人們從海量的數(shù)據(jù)中提取有價(jià)值的信息[2]。劉冬蘭等[3]采用深度受限玻爾茲曼機(jī)將不同格式的異構(gòu)數(shù)據(jù)映射到統(tǒng)一的嵌入式向量空間,實(shí)現(xiàn)了異構(gòu)數(shù)據(jù)的融合。吳文宣等[4]提出一種多系統(tǒng)融合的移動(dòng)電力巡檢系統(tǒng),實(shí)現(xiàn)關(guān)聯(lián)系統(tǒng)之間的實(shí)時(shí)數(shù)據(jù)交互。胡健雄等[5]針對(duì)電力系統(tǒng) 4 種典型數(shù)據(jù)-物理融合模型分析了其相對(duì)應(yīng)的應(yīng)用場(chǎng)景,對(duì)比分析了并聯(lián)模式與單一物理模型和單一數(shù)據(jù)模型的泛化誤差。JI等[6]開(kāi)發(fā)了基于數(shù)據(jù)融合的輸電塔監(jiān)測(cè)系統(tǒng),并通過(guò)測(cè)試運(yùn)行,驗(yàn)證了該系統(tǒng)能夠安全穩(wěn)定運(yùn)行,能夠獲得準(zhǔn)確可靠的測(cè)量數(shù)據(jù),從而實(shí)現(xiàn)了塔架傾斜在線(xiàn)監(jiān)測(cè)的功能。當(dāng)前,關(guān)于基于智能數(shù)據(jù)可視化的數(shù)據(jù)融合研究較少。智能數(shù)據(jù)在最后的場(chǎng)景展示前,需要先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)數(shù)據(jù)進(jìn)行分類(lèi)融合,再進(jìn)行篩選,為可視化工作減輕壓力。神經(jīng)網(wǎng)絡(luò)具有函數(shù)逼近能力,具有一定的數(shù)據(jù)處理優(yōu)勢(shì),例如具有較好的容錯(cuò)率和強(qiáng)大高效的數(shù)據(jù)分析功能,且數(shù)據(jù)處理效率較高,還具有自主學(xué)習(xí)能力[7]。充分利用神經(jīng)網(wǎng)絡(luò)的功能特征和結(jié)構(gòu)特征,對(duì)數(shù)據(jù)進(jìn)行融合,通過(guò)不斷修正神經(jīng)網(wǎng)絡(luò)權(quán)值,可達(dá)到網(wǎng)絡(luò)性能和軟件服務(wù)的最佳優(yōu)化程度[8]。
為提高電力數(shù)據(jù)融合性能,增強(qiáng)系統(tǒng)軟件服務(wù)功能,在原有數(shù)據(jù)融合基礎(chǔ)上,引入BP(back propagation)神經(jīng)網(wǎng)絡(luò)技術(shù),形成基于BP神經(jīng)網(wǎng)絡(luò)的電力數(shù)據(jù)可視化融合軟件系統(tǒng),以某風(fēng)電場(chǎng)電力數(shù)據(jù)為研究對(duì)象,對(duì)基于BP神經(jīng)網(wǎng)絡(luò)的電力數(shù)據(jù)可視化融合軟件系統(tǒng)進(jìn)行性能測(cè)試和分析。
可視化是利用計(jì)算機(jī)感知能力對(duì)數(shù)據(jù)進(jìn)行可視化表達(dá)。利用計(jì)算機(jī)的圖形分析功能,將抽象化的數(shù)據(jù)轉(zhuǎn)換為詳細(xì)、清晰的圖形,使數(shù)據(jù)意義更直觀[9]。數(shù)據(jù)可視化技術(shù)使用圖形描述復(fù)雜數(shù)據(jù)信息,將數(shù)字?jǐn)?shù)據(jù)轉(zhuǎn)換成視覺(jué)模式,篩選和去除多余數(shù)據(jù),最終以視圖方式呈現(xiàn)[10]。通過(guò)將數(shù)據(jù)信息轉(zhuǎn)換為計(jì)算機(jī)可處理的格式,并以視覺(jué)方式展示,以便挖掘數(shù)據(jù)背后的深層含義。
電力數(shù)據(jù)融合技術(shù)是將多個(gè)電源和無(wú)組織的電網(wǎng)信息結(jié)合起來(lái),準(zhǔn)確、全面地感知電網(wǎng)場(chǎng)景的一種技術(shù)[11]。數(shù)據(jù)融合的理論最初是起源于多種傳感器的綜合應(yīng)用。參與融合的數(shù)據(jù)由于來(lái)源多樣化和數(shù)據(jù)格式多樣化,因而具有多源異構(gòu)性特點(diǎn)[12]。電力融合數(shù)據(jù)也具有自己獨(dú)特的優(yōu)點(diǎn),比如容錯(cuò)性、全面性、準(zhǔn)確性、有效利用性以及低成本性[13]。電力數(shù)據(jù)融合包括數(shù)據(jù)級(jí)、特征級(jí)和決策級(jí)3個(gè)級(jí)別[14]:數(shù)據(jù)級(jí)融合是對(duì)最初數(shù)據(jù)的融合,保留原始信息,減少數(shù)據(jù)損失,精度較高;特征級(jí)融合可以處理異構(gòu)數(shù)據(jù)源,通過(guò)特征提取和關(guān)聯(lián)分析,融合數(shù)據(jù)量減小,得到重要的特征向量;決策級(jí)數(shù)據(jù)融合是最高層次的融合,通過(guò)識(shí)別、特征提取和關(guān)聯(lián),合并判決結(jié)論,計(jì)算量最小。
1.3.1 神經(jīng)網(wǎng)絡(luò)模式識(shí)別
模式識(shí)別是利用理論和方法,采用技術(shù)實(shí)現(xiàn)模式的解決與分類(lèi)。人工神經(jīng)網(wǎng)絡(luò)模式識(shí)別具有智能性,在數(shù)據(jù)處理方面比其他算法更強(qiáng)大,具有較強(qiáng)的計(jì)算和自適應(yīng)學(xué)習(xí)能力,能提取和分類(lèi)識(shí)別特征[15]。模式識(shí)別包括數(shù)據(jù)獲取、預(yù)處理、特征提取、數(shù)據(jù)訓(xùn)練和學(xué)習(xí)判定等部分。數(shù)據(jù)獲取包括未經(jīng)識(shí)別的訓(xùn)練樣本或未知對(duì)象,分類(lèi)決策在識(shí)別過(guò)程中起重要作用,對(duì)數(shù)據(jù)進(jìn)行分類(lèi)決策后得出結(jié)果,數(shù)據(jù)訓(xùn)練通過(guò)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)后輸出權(quán)值。
1.3.2 神經(jīng)網(wǎng)絡(luò)模型
神經(jīng)網(wǎng)絡(luò)模型當(dāng)前研究的熱點(diǎn)包括不準(zhǔn)確融合決策、統(tǒng)計(jì)的融合決策等。BP神經(jīng)網(wǎng)絡(luò)是比較常用的反向傳播網(wǎng)絡(luò)模型,分為輸入層、隱含層和輸出層[16]。在BP網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中,設(shè)輸入層X(jué)=(x1,x2,…,xN),輸出層Y=(Y1,Y2,…,YM),以Sigmoid函數(shù)作為隱含層的激活函數(shù)[17]:
(1)
式中:x為輸入的數(shù)據(jù);e為自然常數(shù)。
神經(jīng)元的輸入值X為:
(2)
式中:H為隱藏層層數(shù);W為權(quán)值;i為神經(jīng)元;j為神經(jīng)網(wǎng)絡(luò)的層數(shù);n為信息量。
神經(jīng)元的輸出值Y為:
(3)
式中:f為激活函數(shù)。
在誤差逆向回傳時(shí),Yj為預(yù)期輸出,j∈[1,N],則誤差e為:
(4)
BP網(wǎng)絡(luò)的均方誤差E為:
(5)
式中:R為層與層之間的距離;Yq為輸出需要計(jì)算的層數(shù)。
由式(5)可得權(quán)值調(diào)整式:
(6)
式中:η為學(xué)習(xí)率;t為當(dāng)前層的輸出。
當(dāng)輸出值與期望值不相符時(shí),可根據(jù)式(4)計(jì)算誤差。對(duì)網(wǎng)絡(luò)的誤差值在網(wǎng)絡(luò)各層之間進(jìn)行反向傳遞,當(dāng)誤差梯度發(fā)生改變時(shí),各層權(quán)值也隨之發(fā)生改變。
數(shù)據(jù)融合體系結(jié)構(gòu)包括數(shù)據(jù)層、數(shù)據(jù)融合層、數(shù)據(jù)選擇層和可視化層。數(shù)據(jù)層匯集了多種類(lèi)型的數(shù)據(jù),包括半結(jié)構(gòu)化、非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù),融合多源異質(zhì)數(shù)據(jù)變得更加困難。數(shù)據(jù)融合層使用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)數(shù)據(jù)進(jìn)行初步分類(lèi),并挖掘隱藏的數(shù)據(jù)特征[18]。數(shù)據(jù)選擇層進(jìn)一步處理融合后的數(shù)據(jù),篩選需要展示的部分,并通過(guò)減少數(shù)據(jù)量降低可視化的工作量。最后是可視化層,在這一層實(shí)現(xiàn)不同種類(lèi)和形式數(shù)據(jù)的融合展示,分析數(shù)據(jù)之間的內(nèi)在聯(lián)系,并對(duì)系統(tǒng)性能進(jìn)行測(cè)試和驗(yàn)證。
1.5.1 實(shí)驗(yàn)測(cè)試及誤差標(biāo)準(zhǔn)分析
為驗(yàn)證所提方法,對(duì)風(fēng)電機(jī)組多狀態(tài)電力系統(tǒng)調(diào)度中的應(yīng)用性能進(jìn)行實(shí)驗(yàn)測(cè)試。實(shí)驗(yàn)針對(duì)風(fēng)電場(chǎng)發(fā)電的功率預(yù)測(cè)采用均方根誤差RMSE和平均絕對(duì)百分誤差MAPE作為最終結(jié)果的分析標(biāo)準(zhǔn):
(7)
(8)
式中:M為輸出層神經(jīng)元的數(shù)量;N為輸入層神經(jīng)元的數(shù)量;Xpi為預(yù)測(cè)值;XMi為實(shí)際值。RMSE值和MAPE值越小,預(yù)測(cè)越精確,預(yù)測(cè)效果越好。
1.5.2 測(cè)試運(yùn)行環(huán)境
測(cè)試數(shù)據(jù)來(lái)自2020年7月某風(fēng)力發(fā)電場(chǎng)的歷史監(jiān)測(cè)數(shù)據(jù),數(shù)據(jù)量總大小為100GB,利用BP神經(jīng)網(wǎng)絡(luò)算法對(duì)電力系統(tǒng)風(fēng)電場(chǎng)功率數(shù)據(jù)進(jìn)行迭代訓(xùn)練,將設(shè)計(jì)算法與其他方法進(jìn)行對(duì)比分析,對(duì)風(fēng)電場(chǎng)功率進(jìn)行預(yù)測(cè)。系統(tǒng)運(yùn)行環(huán)境包括系統(tǒng)硬件配置和軟件配置,具體如表1所示。
表1 系統(tǒng)配置表
BP神經(jīng)網(wǎng)絡(luò)算法下的權(quán)值元素迭代法和矩陣迭代法訓(xùn)練的精確度對(duì)比如圖1~圖2所示。
圖1 權(quán)值元素迭代法訓(xùn)練下的權(quán)值準(zhǔn)確度
圖2 矩陣迭代法訓(xùn)練下的權(quán)值準(zhǔn)確度
由圖1可知,BP神經(jīng)網(wǎng)絡(luò)算法下的權(quán)值元素迭代法得出的數(shù)據(jù)預(yù)測(cè)值與真實(shí)值對(duì)比,經(jīng)過(guò)400次的迭代訓(xùn)練,權(quán)值大小趨于接近狀態(tài)。在前期的迭代訓(xùn)練中,權(quán)值精度存在一定的差距,尤其是當(dāng)?shù)螖?shù)在50和350時(shí),真實(shí)值與預(yù)測(cè)值偏差更為明顯。由圖2可知,矩陣迭代法得出的數(shù)據(jù)預(yù)測(cè)值更接近真實(shí)值,偏差較小,能夠進(jìn)一步確定權(quán)值。經(jīng)過(guò)400次迭代后預(yù)測(cè)值接近真實(shí)值。BP神經(jīng)網(wǎng)絡(luò)算法下基于矩陣迭代法訓(xùn)練神經(jīng)網(wǎng)絡(luò)達(dá)到了更好的收斂效果,更能逼近真實(shí)值,其性能優(yōu)于基于元素迭代法訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
將設(shè)計(jì)算法與貝葉斯推理法、聚類(lèi)分析法進(jìn)行對(duì)比,將不同算法下的預(yù)測(cè)曲線(xiàn)與實(shí)際功率曲線(xiàn)作比較,結(jié)果如圖3所示。
圖3 不同算法下的功率預(yù)測(cè)對(duì)比
由圖3可知,設(shè)計(jì)算法的輸出功率預(yù)測(cè)最接近實(shí)際值,其次是貝葉斯推理法,最后是聚類(lèi)分析法。設(shè)計(jì)算法輸出功率相比其他算法更接近于真實(shí)值。由此可知,設(shè)計(jì)算法對(duì)風(fēng)電場(chǎng)功率預(yù)測(cè)具有較高的準(zhǔn)確度。
對(duì)數(shù)據(jù)結(jié)果進(jìn)行均方根誤差(RMSE)和平均絕對(duì)百分誤差(MAPE)分析,對(duì)比不同算法下的誤差結(jié)果,結(jié)果如圖4~圖5所示。
圖4 不同融合算法的RMSE對(duì)比
圖5 不同融合算法的MAPE對(duì)比
由圖4可知,設(shè)計(jì)算法、貝葉斯推理法、聚類(lèi)分析法的均方根誤差分別為1.264 8、2.531 2和2.818 7,設(shè)計(jì)算法的均方根誤差最小。由圖5可知,設(shè)計(jì)算法的平均絕對(duì)百分誤差值波動(dòng)范圍較小,而貝葉斯推理法誤差值波動(dòng)較大,聚類(lèi)分析法誤差值波動(dòng)最大??傮w上設(shè)計(jì)算法的誤差值相對(duì)于其他算法均有所下降,誤差更小。
利用不同的算法計(jì)算數(shù)據(jù)量,分析不同算法對(duì)不同數(shù)據(jù)量的處理時(shí)間,結(jié)果如圖6所示。
圖6 不同算法下的數(shù)據(jù)處理時(shí)間比較
由圖6可知,當(dāng)數(shù)據(jù)量相同時(shí),貝葉斯推理法、聚類(lèi)分析法的數(shù)據(jù)處理時(shí)間均大于設(shè)計(jì)算法的數(shù)據(jù)處理時(shí)間,隨著數(shù)據(jù)量不斷增加,數(shù)據(jù)處理時(shí)間逐漸加大,設(shè)計(jì)算法的處理時(shí)間幅度變化較小,而貝葉斯推理法、聚類(lèi)分析法的數(shù)據(jù)處理時(shí)間增長(zhǎng)幅度較大。尤其是當(dāng)數(shù)據(jù)量超過(guò)40 GB以后,時(shí)間差距逐漸增大。整體上設(shè)計(jì)算法數(shù)據(jù)處理時(shí)間增加趨勢(shì)較為減緩,當(dāng)數(shù)據(jù)量達(dá)到100 GB時(shí)設(shè)計(jì)算法處理時(shí)間不到600 s,而其他算法處理時(shí)間均超過(guò)1 100 s。
人工神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)和自組織能力,可以充分利用其功能和結(jié)構(gòu)特征對(duì)數(shù)據(jù)進(jìn)行融合,提高數(shù)據(jù)可視化能力。研究在原有數(shù)據(jù)融合基礎(chǔ)上,引入BP神經(jīng)網(wǎng)絡(luò)技術(shù),形成基于BP神經(jīng)網(wǎng)絡(luò)的電力數(shù)據(jù)可視化融合系統(tǒng)。通過(guò)實(shí)驗(yàn)測(cè)試,分析不同訓(xùn)練方法下的BP神經(jīng)網(wǎng)絡(luò)算法精度,風(fēng)電場(chǎng)功率預(yù)測(cè)準(zhǔn)確度,不同算法下的均方根誤差和平均絕對(duì)百分誤差,最后對(duì)數(shù)據(jù)處理時(shí)間進(jìn)行對(duì)比分析。結(jié)果表明:經(jīng)矩陣迭代法訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在風(fēng)電場(chǎng)功率預(yù)測(cè)方面表現(xiàn)出更好的收斂性。經(jīng)過(guò)400次迭代訓(xùn)練后,BP神經(jīng)網(wǎng)絡(luò)算法的預(yù)測(cè)值更接近真實(shí)值,數(shù)據(jù)訓(xùn)練效果更優(yōu)。與貝葉斯推理法和聚類(lèi)分析法相比,設(shè)計(jì)算法具有更高的準(zhǔn)確度。該算法在均方根誤差和平均絕對(duì)百分誤差上的誤差范圍更小,且達(dá)到最小誤差值。此外,設(shè)計(jì)算法能夠高效處理大數(shù)據(jù),在100 GB數(shù)據(jù)量下的處理時(shí)間不到600 s,遠(yuǎn)快于其他算法超過(guò)1 100 s的處理時(shí)間。在智能數(shù)據(jù)可視化和電力數(shù)據(jù)融合方面,設(shè)計(jì)算法表現(xiàn)出較好的性能和效率。未來(lái)還將擴(kuò)大數(shù)據(jù)量,為處理更大規(guī)模的數(shù)據(jù)提供實(shí)驗(yàn)依據(jù),并研究非結(jié)構(gòu)化數(shù)據(jù)的融合和處理策略。