唐 毅 祁甘露 池坤鵬 馬璐瑤 姬長建
(1) 中共國網(wǎng)安徽省電力有限公司黨校,230031,合肥; 2) 齊魯師范學(xué)院物理與電子工程學(xué)院,250200,濟(jì)南 )
隨著物聯(lián)網(wǎng)的不斷滲入以及人工智能、云—邊大數(shù)據(jù)等技術(shù)的廣泛應(yīng)用,傳統(tǒng)電網(wǎng)逐漸朝著電力物聯(lián)網(wǎng)高速發(fā)展.電力物聯(lián)網(wǎng)末端不斷接入傳感器、智能電表等電力設(shè)備,使得多源數(shù)據(jù)在傳統(tǒng)電力數(shù)據(jù)中的比重越來越大,針對異構(gòu)電力數(shù)據(jù)集的存儲與分析變得越來越復(fù)雜.同時(shí),隨著電網(wǎng)數(shù)字化程度越來越大以及用戶側(cè)用電情況日益復(fù)雜,調(diào)度側(cè)及時(shí)獲取用戶側(cè)用電數(shù)據(jù)的難度加大,因此,針對如何及時(shí)獲取與分析用戶側(cè)用電數(shù)據(jù)并識別的研究具有重要的意義.
現(xiàn)階段,不少學(xué)者針對用戶側(cè)的用電數(shù)據(jù)研究主要從用戶的用電負(fù)荷辨識展開研究.文獻(xiàn)[1]提出利用分布式存儲和計(jì)算集群處理能源大數(shù)據(jù),電力公司可以在百萬用戶規(guī)模上進(jìn)行居民用戶用電負(fù)荷分析研究.文獻(xiàn)[2]基于大數(shù)據(jù)技術(shù)對海量的居民用電數(shù)據(jù)進(jìn)行分析,首先對海量用電數(shù)據(jù)進(jìn)行解耦分析,然后基于大數(shù)據(jù)分析對用戶用電行為進(jìn)行分析及管理.文獻(xiàn)[3]提出了一種數(shù)據(jù)驅(qū)動的概率凈負(fù)荷預(yù)測方法,采用基于相關(guān)分析和網(wǎng)格搜索的最大信息系數(shù)對電表后的光伏容量進(jìn)行估計(jì),從而將凈負(fù)荷曲線分解為三個(gè)部分(光伏輸出、實(shí)際負(fù)荷和剩余負(fù)荷),并分別進(jìn)行預(yù)測.文獻(xiàn)[4]基于用電信息采集系統(tǒng)的海量用電數(shù)據(jù),開展用戶用電負(fù)荷分析與用電優(yōu)化策略研究,主要從對缺失的用電數(shù)據(jù)修復(fù)、行業(yè)典型負(fù)荷曲線辨識以及用電多目標(biāo)優(yōu)化三個(gè)方面對用戶用電數(shù)據(jù)進(jìn)行了分析辨識.有學(xué)者利用人工智能算法對用戶側(cè)的用電數(shù)據(jù)進(jìn)行識別,文獻(xiàn)[5]利用深度學(xué)習(xí)與邊緣計(jì)算相結(jié)合,從特征提取、負(fù)荷分解等方面對采集的用電數(shù)據(jù)進(jìn)行分析研究,依據(jù)神經(jīng)網(wǎng)絡(luò)構(gòu)建用電數(shù)據(jù)特征框架,最后基于邊緣計(jì)算對數(shù)據(jù)特征進(jìn)行分解,對用電負(fù)荷進(jìn)行辨識.文獻(xiàn)[6]考慮海量電力數(shù)據(jù)的存儲方式,基于云—邊—端協(xié)同的用戶側(cè)數(shù)據(jù)構(gòu)建了電力物聯(lián)網(wǎng)的用戶側(cè)數(shù)據(jù)應(yīng)用框架,實(shí)現(xiàn)了用戶側(cè)用電數(shù)據(jù)深度挖掘.
上述研究多數(shù)是假設(shè)提取的用戶側(cè)用電數(shù)據(jù)為單一用電負(fù)荷數(shù)據(jù)并且多為歷史用電數(shù)據(jù),而由于歷史用電數(shù)據(jù)的時(shí)間滯后性,當(dāng)現(xiàn)場用電負(fù)荷數(shù)據(jù)產(chǎn)生變化時(shí),調(diào)度終端不能及時(shí)地獲取更新后的用電負(fù)荷情況,不能及時(shí)地對用戶負(fù)荷進(jìn)行有效的調(diào)度,可能造成某一臺區(qū)內(nèi)出現(xiàn)過負(fù)荷情況,甚至可能造成火災(zāi)發(fā)生,比如電動車入戶充電發(fā)生火災(zāi)事故,所以對多臺區(qū)多負(fù)荷狀況進(jìn)行實(shí)時(shí)監(jiān)測具有重要意義.同時(shí),隨著電力物聯(lián)網(wǎng)建設(shè)的規(guī)模擴(kuò)大,電力數(shù)據(jù)的來源往往是多渠道的,用戶側(cè)作為電網(wǎng)大數(shù)據(jù)的主要源頭之一,是調(diào)度計(jì)算賦能電力物聯(lián)網(wǎng)的重要一環(huán).由于多來源用戶側(cè)數(shù)據(jù)之間的差異,使得數(shù)據(jù)的分析處理變得復(fù)雜,若要實(shí)現(xiàn)負(fù)荷數(shù)據(jù)的在線識別,需要對多源數(shù)據(jù)進(jìn)行融合同步處理,然而現(xiàn)有研究尚未以電力物聯(lián)網(wǎng)用戶側(cè)多源負(fù)荷數(shù)據(jù)為中心研究,對此,本文提出基于三維時(shí)空特性的數(shù)據(jù)融合的電力物聯(lián)網(wǎng)用戶側(cè)負(fù)荷數(shù)據(jù)辨識方法,構(gòu)建用戶側(cè)多源負(fù)荷數(shù)據(jù)應(yīng)用框架,基于GIS(Geographic Information System)平臺結(jié)合聚類分析算法對多用戶側(cè)負(fù)荷數(shù)據(jù)進(jìn)行在線識別,為電網(wǎng)實(shí)現(xiàn)海量電力數(shù)據(jù)的分級、分布地存儲和處理提供參考,為針對用戶側(cè)用電負(fù)荷辨識提供新思路.
三維空間數(shù)據(jù)模型是對現(xiàn)實(shí)世界的抽象、歸納和映射,其通過描述現(xiàn)實(shí)世界的各實(shí)體對象之間的相互關(guān)系為空間數(shù)據(jù)模型的構(gòu)建提供理論依據(jù).建立電力物聯(lián)網(wǎng)的空間數(shù)據(jù)模型主要考慮的因素有:建模的目的、建模對象的特征、空間關(guān)系、三維模型的構(gòu)建方法.電力物聯(lián)網(wǎng)三維模型構(gòu)建的目的,是能夠?qū)τ脩魝?cè)各用戶的用電負(fù)荷進(jìn)行在線識別.
2.1三維空間數(shù)據(jù)模型三維空間數(shù)據(jù)模型是研究現(xiàn)實(shí)生活中實(shí)體對象的數(shù)據(jù)架構(gòu)的集合,用于表述實(shí)體對象之間的數(shù)學(xué)關(guān)系與位置關(guān)系,主要包括幾何數(shù)據(jù)模型和語義數(shù)據(jù)模型[7].早期的三維模型主要從CAD(Computer Aided Design)等幾何體發(fā)展而來,通過研究現(xiàn)實(shí)世界空間實(shí)體構(gòu)建三維模型的幾何特征,本文采用基于層次細(xì)節(jié)模型構(gòu)建三維數(shù)據(jù)算法,當(dāng)視點(diǎn)離物體近時(shí),能觀察到的模型細(xì)節(jié)豐富;視點(diǎn)遠(yuǎn)離模型時(shí),觀察到的細(xì)節(jié)逐漸模糊.層次細(xì)節(jié)模型技術(shù)(簡稱LOD(Levels of Detail)技術(shù))的思想最早出現(xiàn)于1976年,其基本思想是構(gòu)建原始模型的一系列不同程度的簡化模型,并在滿足觀察者對分辨率要求的前提下,調(diào)用適合的簡化模型替代原始模型予以顯示.算法的“連續(xù)”特性包含了:1)幀更新時(shí),地形表面保持連續(xù)性,即“時(shí)間的連續(xù)性”;2)不同分辨率的地形分塊之間保持連續(xù)性,沒有裂縫,即空間連續(xù)性;3)算法的實(shí)時(shí)構(gòu)網(wǎng)能力很強(qiáng),以保持較高的屏幕刷新率.
2.2基于時(shí)空序列的電力物聯(lián)網(wǎng)拓?fù)錁?gòu)建電力物聯(lián)網(wǎng)下的用戶類型眾多,為了能夠迅速準(zhǔn)確地識別出各用戶之間的區(qū)別,快速分辨出電力物聯(lián)網(wǎng)下各用戶分布區(qū)域,基于空間多尺度規(guī)則拓?fù)渌阉饕噪娏ξ锫?lián)網(wǎng)中多用戶之間電氣量數(shù)據(jù)為基礎(chǔ),同時(shí)結(jié)合序列多時(shí)間截面規(guī)則,對用戶和負(fù)荷之間、負(fù)荷和臺區(qū)之間構(gòu)建拓?fù)潢P(guān)系.
在實(shí)際情況下,由于電力物聯(lián)網(wǎng)的復(fù)雜性以及用戶負(fù)荷的多樣性,各臺區(qū)配變的分布狀況具有不規(guī)則性和隨機(jī)性,網(wǎng)絡(luò)內(nèi)部的具體臺區(qū)形狀和區(qū)域地形、環(huán)境和建筑等情況有關(guān),構(gòu)建的電力物聯(lián)網(wǎng)的臺區(qū)分布形狀可能為矩形、圓形、扇形或者“兩點(diǎn)式”,例如一臺變壓器只對一棟辦公大樓供電,一臺變壓器為多個(gè)電動汽車充電樁供電等.所以,定義電力物聯(lián)網(wǎng)內(nèi)的各用戶為N=(n1,n2,n3…,ns),用戶用電負(fù)荷為C,臺區(qū)為P,其中每一臺區(qū)對應(yīng)一種用電負(fù)荷,定義配變到最遠(yuǎn)用戶的距離為d,定義半徑r,使得針對任意形狀的臺區(qū)都有以配變?yōu)閳A心,半徑為r的圓可以將屬于該臺區(qū)內(nèi)的用戶包含在內(nèi),即
?d∈R,?r∈R,對于ni∈N且ni∈C,?D(ni)∈P.
通過空間拓?fù)湫:朔椒ù_認(rèn)用戶與臺區(qū)之間的從屬關(guān)系,但是若配電臺區(qū)中出現(xiàn)重合的負(fù)荷區(qū)域,則需要進(jìn)一步對用戶和臺區(qū)之間的拓?fù)潢P(guān)系進(jìn)行校核.
基于時(shí)間截面序列的校核,是指在利用多個(gè)時(shí)間斷面下的用戶與用戶、用戶和配變之間的電壓電氣量序列信息,對用戶與臺區(qū)之間的拓?fù)潢P(guān)系進(jìn)行校核.
假設(shè)某一用戶在某一時(shí)間斷面下的電壓向量表示為xi,xi中的樣本用s個(gè)屬性A1,A2,…,As表示,則該用戶的電壓序列樣本為xi=(A1,A2,…,As);假設(shè)重疊區(qū)域內(nèi)有m個(gè)用戶,m個(gè)用戶構(gòu)成該區(qū)域內(nèi)的電壓特征序列集為X={xn|n=1,2,…,m},則xi和xj之間的相似性可以利用其之間的距離d決定,距離越小,兩者越相似;距離越大,兩者差異越大.計(jì)算距離的方法通常有歐氏距離等,本文不作詳細(xì)介紹.
根據(jù)上述方法計(jì)算特征相似性,利用主成分分析法PCA(Principal Component Analysis),將相同性質(zhì)的特征做主成分方向映射,最終將高維特征轉(zhuǎn)化為主成分特征,從而降低特征的維數(shù)的方法.
配電網(wǎng)中下層節(jié)點(diǎn)和上層節(jié)點(diǎn)的聯(lián)系,反映著能量之間的傳遞關(guān)系,下層節(jié)點(diǎn)的能量之和,就是對上層節(jié)點(diǎn)的映射.上層節(jié)點(diǎn)反映著下層節(jié)點(diǎn)能量波動變化的趨勢,上層節(jié)點(diǎn)的方向就是下層節(jié)點(diǎn)主成分的方向.
定義由上層節(jié)點(diǎn)和下層節(jié)點(diǎn)的電量序列共同構(gòu)成特征矩陣D=(D1,D2,…,Dq,Dq+1,…,Dn),D1~Dq反映n維上層節(jié)點(diǎn)電量序列,Dq+1~Dn反映n-q維下層節(jié)點(diǎn)電量序列.
圖1為構(gòu)建電力物聯(lián)網(wǎng)的三維拓?fù)淇蚣軋D.基于三維拓?fù)潢P(guān)系,構(gòu)建用戶側(cè)多源負(fù)荷數(shù)據(jù)應(yīng)用框架,如圖2所示.
圖1 三維拓?fù)淇驁D
邊緣計(jì)算是一種采用網(wǎng)絡(luò)云端技術(shù)對海量數(shù)據(jù)進(jìn)行處理的一種計(jì)算方式,通過對靠近物體或者數(shù)據(jù)源頭的一側(cè)采用網(wǎng)絡(luò)、計(jì)算、存儲、應(yīng)用等手段實(shí)現(xiàn)數(shù)據(jù)及相關(guān)應(yīng)用的就地/就近處理,減輕云端的數(shù)據(jù)流量壓力,提高數(shù)據(jù)處理的速度,高效快速地推動電力物聯(lián)網(wǎng)的發(fā)展.
3.1邊緣計(jì)算與遠(yuǎn)端數(shù)據(jù)交互在云邊端協(xié)同中,云端負(fù)責(zé)處理復(fù)雜度高的數(shù)據(jù)業(yè)務(wù),邊緣側(cè)則對海量數(shù)據(jù)進(jìn)行前期的預(yù)處理,剔除無用數(shù)據(jù)或錯(cuò)誤數(shù)據(jù).云邊協(xié)同配合數(shù)據(jù)處理的效率高,經(jīng)濟(jì)性高.電網(wǎng)用戶側(cè)作為數(shù)據(jù)源頭,可以給云邊端提供海量多元電力數(shù)據(jù),用以支撐上層精確分析和精準(zhǔn)決策,幫助電網(wǎng)實(shí)現(xiàn)智能、便捷、個(gè)性的數(shù)據(jù)分析.
1) 在云邊協(xié)同過程中,用戶側(cè)上傳智能電表采集的電氣量數(shù)據(jù)、地理氣象數(shù)據(jù)等至邊緣節(jié)點(diǎn),邊緣節(jié)點(diǎn)將處理后的實(shí)時(shí)數(shù)據(jù)和已存儲的相關(guān)歷史數(shù)據(jù)作為輸入數(shù)據(jù),通過訓(xùn)練好的負(fù)荷模型得到融合后的數(shù)據(jù),為邊緣節(jié)點(diǎn)實(shí)現(xiàn)區(qū)域用戶負(fù)荷辨識提供依據(jù).邊緣節(jié)點(diǎn)承擔(dān)了個(gè)性化數(shù)據(jù)處理的訓(xùn)練任務(wù),該模型可下放至相應(yīng)用戶端的本地控制中心完成離線處理,幫助用戶端實(shí)現(xiàn)自治管理.
2) 在云邊協(xié)同過程中,各邊緣節(jié)點(diǎn)將處理后的相關(guān)數(shù)據(jù)傳輸至云中心,云中心利用已部署的多區(qū)域負(fù)荷特征模型完成對各區(qū)域負(fù)荷識別,將識別結(jié)果用于電力物聯(lián)網(wǎng)的用戶側(cè)負(fù)荷識別結(jié)果三維可視.
3) 云端協(xié)同主要負(fù)責(zé)云中心與負(fù)荷用戶之間的數(shù)據(jù)交互.
3.2數(shù)據(jù)處理在采集存儲多源用戶電氣量數(shù)據(jù)后,將收集的數(shù)據(jù)進(jìn)行預(yù)處理.采用邊緣計(jì)算對數(shù)據(jù)進(jìn)行處理,去除數(shù)據(jù)中附著的干擾因素,基于時(shí)間序列相似匹配算法[8]將處理后的數(shù)據(jù)進(jìn)行匹配,數(shù)據(jù)匹配過程如圖3所示.
圖2 用戶側(cè)多源負(fù)荷數(shù)據(jù)應(yīng)用框架
圖3 數(shù)據(jù)匹配圖
通過匹配原則,將匹配成功的數(shù)據(jù)進(jìn)行重組,保證數(shù)據(jù)操作可行性.分析數(shù)據(jù)處理?xiàng)l件,注重對異常數(shù)據(jù)的管理,若出現(xiàn)數(shù)據(jù)異常情況,應(yīng)將異常數(shù)據(jù)去除,保證數(shù)據(jù)系統(tǒng)正常運(yùn)行.對處理后的電力物聯(lián)網(wǎng)的多源數(shù)據(jù)進(jìn)行存儲,選取存儲樣本內(nèi)用電負(fù)荷數(shù)量較多區(qū)域進(jìn)行負(fù)荷聚類分析.
由于電力物聯(lián)網(wǎng)的復(fù)雜性,電網(wǎng)內(nèi)含有多種用電負(fù)荷類型,可采用聚類的方法,將多源負(fù)荷進(jìn)行分類,選擇層次聚類算法對電力物聯(lián)網(wǎng)內(nèi)的負(fù)荷進(jìn)行聚類辨識.
4.1負(fù)荷聚類電力物聯(lián)網(wǎng)內(nèi)負(fù)荷種類復(fù)雜多樣,包括居民用電、商業(yè)用電、工業(yè)用電等,由于用電負(fù)荷類型眾多,數(shù)量巨大,使得構(gòu)建的負(fù)荷模型具有時(shí)變性、隨機(jī)性和復(fù)雜性.因此對于電力物聯(lián)網(wǎng)的負(fù)荷建模,通過聚類分析將具有相同特性的用電負(fù)荷歸為一類,每一類用電負(fù)荷歸為一類構(gòu)建通用負(fù)荷模型有利于電力物聯(lián)網(wǎng)的穩(wěn)定運(yùn)行.
首先對用電負(fù)荷構(gòu)建靜態(tài)負(fù)荷模型,如式(1)所示,
(1)
不考慮電網(wǎng)頻率變化,只計(jì)算節(jié)點(diǎn)電壓影響,模型為式(2),
(2)
其中,待辨識的參數(shù)有Pu、Qu、Pf、Qf,四個(gè)參數(shù)為有功和無功的電壓和頻率特性指數(shù).定義電力物聯(lián)網(wǎng)總負(fù)荷模型為
(3)
其中,P1、P2、…、Pn表示n個(gè)用電負(fù)荷.
對負(fù)荷進(jìn)行聚類前需要進(jìn)行特征向量的提取,由于特征向量中包含多種影響因素(如氣候、時(shí)間、實(shí)際采集量測量等),采用考慮負(fù)荷成分構(gòu)成比的特征向量提取方法.若特征向量中的各分量的量綱或單位不統(tǒng)一,可能會使各分量的參數(shù)相差很大,會使得聚類結(jié)果偏差過大,所以聚類前需要對特征向量進(jìn)行標(biāo)準(zhǔn)化處理,采用常用的最大最小標(biāo)準(zhǔn)化方法.
設(shè)x=(x1,x2,...,xm),映射f:
(4)
4.2基于層次聚類算法的負(fù)荷識別層次聚類法是一種按照不同樣本之間的距離大小將樣本聚為多個(gè)簇的方法,其特點(diǎn)是不需要設(shè)定類的個(gè)數(shù),并能以層次樹狀圖的方式呈現(xiàn)出聚類過程及結(jié)果.對n個(gè)樣本進(jìn)行分層聚類的步驟為:
1)S為樣本集合,將樣本S={s1,s2,...,sn}劃分為X={x1,x2,...,xn},其中,
Xi={xi}且滿足?i=1:n,Xi=S.
(5)
2) 進(jìn)行樣本間的距離度量計(jì)算,采用歐式距離計(jì)算,有
(6)
其中x1,x2代表樣本1和樣本2,也代表樣本1和樣本2中的第i個(gè)特征向量.
3) 進(jìn)行簇之間的距離度量,常用的度量標(biāo)準(zhǔn)有單鏈接標(biāo)準(zhǔn)、全鏈接標(biāo)準(zhǔn)和均鏈接標(biāo)準(zhǔn),構(gòu)造距離度量n階矩陣[9].
4) 聚類完成后,距離度量矩陣的維數(shù)變?yōu)閚-1,此時(shí)返回步驟3,重復(fù)以上步驟直至滿足結(jié)束條件,算法結(jié)束.
圖4 層次聚類法流程圖
對電力物聯(lián)網(wǎng)內(nèi)的多種用戶負(fù)荷數(shù)據(jù)進(jìn)行層次聚類分析,考慮到電力網(wǎng)內(nèi)負(fù)荷類型的復(fù)雜性,為了方便說明聚類結(jié)果,本文選取居民用電負(fù)荷、商業(yè)用電負(fù)荷和工業(yè)用電負(fù)荷三種負(fù)荷類型進(jìn)行層次聚類分析.
1) 基于前述的三維時(shí)空序列特性算法對采集到的電量數(shù)據(jù)進(jìn)行處理融合,經(jīng)過數(shù)據(jù)融合后的三類樣本數(shù)據(jù)如表1所示.
表1 數(shù)據(jù)融合后的三類樣本數(shù)據(jù)
2) 計(jì)算樣本間的歐氏距離,如圖5所示.
36個(gè)元素分別代表樣本數(shù)據(jù)的第1點(diǎn)與2-6點(diǎn)、第2點(diǎn)與3-6點(diǎn),......這樣的距離.那么對于M個(gè)點(diǎn)的數(shù)據(jù)集,歐氏距離之后的將具有M*(M-1)/2個(gè)元素.
圖5 樣本數(shù)據(jù)的歐氏距離
3) 使用層次聚類算法進(jìn)行聚類分析,結(jié)果如圖6所示.
圖6 層次聚類樹
層次分析結(jié)果如圖6所示,可知數(shù)據(jù)點(diǎn)2、7、5、3、4為工業(yè)用電類,數(shù)據(jù)點(diǎn)1、9為商業(yè)用電類,數(shù)據(jù)點(diǎn)6、8為居民用電類.
基于三維時(shí)空特性的電力物聯(lián)網(wǎng)用戶側(cè)識別方法能夠克服單維度識別過程之中的局限性,可以較大程度地融合各維度校核中的優(yōu)勢.本文同時(shí)融合邊緣計(jì)算和云計(jì)算,能夠?qū)崿F(xiàn)自下而上的多級數(shù)據(jù)融合挖掘數(shù)據(jù)特征,為后期的電力物聯(lián)網(wǎng)用戶側(cè)數(shù)據(jù)分級、分布地存儲和處理識別提供新思路.