石少青,張樂平 ,張本松,吳昊文,連新凱,杜書帥
(1.中國南方電網(wǎng)有限責(zé)任公司,廣東 廣州 510080:2.南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司,廣東 廣州 510663:3.河南許繼儀表有限公司,河南 許昌 461000)
隨著新一代智能電表的推廣和應(yīng)用,非侵入式負(fù)荷辨識技術(shù)作為一種新興的智能化負(fù)荷監(jiān)測手段,越來越受到國家電力公司等單位的青睞。電力公司通過智能電表非侵入式負(fù)荷辨識技術(shù)收集用戶側(cè)用電比例構(gòu)成[1],了解各個負(fù)荷的用電特點及潛在用電規(guī)律[2],可以充分挖掘用戶的互動潛力,進(jìn)而為實現(xiàn)電網(wǎng)透明化[3]奠定基礎(chǔ)。
智能電表非侵入式負(fù)荷感知系統(tǒng)主要由數(shù)據(jù)采集、特征選取和負(fù)荷辨識3個模塊組成[4]。其中,特征選取和負(fù)荷辨識是負(fù)荷識別技術(shù)的關(guān)鍵。負(fù)荷特征是反映負(fù)荷運行狀態(tài)的關(guān)鍵信息,通??蓪⑵浞譃殡娏刻卣骱头请娏刻卣?。常見的電量特征包括:有功功率[5]、無功功率、電流諧波[6]和V—I軌跡[7]等穩(wěn)態(tài)特征[8],以及尖峰特征、電壓噪聲等暫態(tài)特征[9];而非電量特征則包括時間特征[10]、天氣、溫度等表達(dá)用戶用電行為的外界特征[11]?;谶@些特征,文獻(xiàn)[12]中首先使用聚類算法將負(fù)荷按有功功率和無功功率進(jìn)行分類實現(xiàn)粗辨識,再將二維V—I軌跡圖作為卷積神經(jīng)網(wǎng)絡(luò)模型的輸入,完成精細(xì)化識別。在文獻(xiàn)[13]中提出了一種融合排列熵算法和Yamamoto算法的暫態(tài)特征采樣方法,并結(jié)合特征權(quán)重,采用基于模糊c均值聚類實現(xiàn)非侵入式負(fù)荷辨識。然而僅使用電量特征會因為負(fù)荷種類的增多而需要不斷加入新的特征提升辨識能力,難免會造成計算量過大的問題。文獻(xiàn)[14]通過考慮電器運行過程與時間的關(guān)聯(lián)關(guān)系,結(jié)合負(fù)荷運行模式的時間尺度信息和信號幅值構(gòu)建序列翻譯模型,將待分解的能量翻譯為狀態(tài)碼,實現(xiàn)負(fù)荷能耗分解。
考慮到不同的負(fù)荷特征獲取方式,負(fù)荷辨識方法通常可分為基于負(fù)荷事件型和基于負(fù)荷運行狀態(tài)型[15]兩種?;谪?fù)荷事件的辨識方法提取隨負(fù)荷狀態(tài)變化產(chǎn)生的負(fù)荷特征變化,并將其作為辨識依據(jù),而基于負(fù)荷運行狀態(tài)的辨識方法將負(fù)荷工作時間內(nèi)的特征狀態(tài)作為辨識依據(jù)。文獻(xiàn)[16]在負(fù)荷事件的基礎(chǔ)上提取負(fù)荷特征,然后通過融合Fisher得分和主成分分析算法的Fisher主元分析法剔除掉區(qū)分性較差的無效特征,同時降低有效特征之間的關(guān)聯(lián)性,然后采用遺傳算法(genetic algorithm,GA)對模型參數(shù)進(jìn)行尋優(yōu),從而完成負(fù)荷識別。而文獻(xiàn)[17]首先采用基于B樣條曲線擬合算法提取負(fù)荷運行狀態(tài)的互補特征,然后用支持向量機(support vector machine,SVM)算法構(gòu)建分類器對負(fù)荷進(jìn)行辨識。一般來說,基于負(fù)荷事件的辨識方法無需了解負(fù)荷整個運行狀態(tài)的情況,且負(fù)荷特征數(shù)據(jù)易于獲取、方便計算和存儲,具有準(zhǔn)確率較高的特點。
基于此,本文通過負(fù)荷事件檢測提取負(fù)荷事件的有功-無功功率、時間等特征,并對時間特征進(jìn)行細(xì)化建模??紤]到用戶用電行為的規(guī)律性,采用Mean-shift聚類對具有相同時間特征的負(fù)荷進(jìn)行聚類,進(jìn)而引入孿生神經(jīng)網(wǎng)絡(luò)進(jìn)行負(fù)荷細(xì)分,最終實現(xiàn)負(fù)荷辨識。最后,通過實際數(shù)據(jù)測試驗證文中方法的有效性。
負(fù)荷特征是用于區(qū)分不同類型負(fù)荷的內(nèi)在特性,合理的選取負(fù)荷特征對后續(xù)的負(fù)荷辨識具有重要意義。本文選取的電量特征包括有功功率和無功功率特征;非電量特征則包括負(fù)荷運行時長特征、運行時刻等特征。
1.1.1 有功功率特征
有功功率P作為一種易于獲取的穩(wěn)態(tài)特征,能直觀地反映負(fù)荷的能耗且也是負(fù)荷投切時最為明顯的特征。在現(xiàn)有智能電表中,負(fù)荷辨識模塊可直接與計量芯通信讀取實時的有功功率值。
1.1.2 無功功率特征
無功功率Q與有功功率P相對應(yīng),也是一種表現(xiàn)負(fù)荷內(nèi)在性質(zhì)的穩(wěn)態(tài)特征。同樣地,無功功率可直接從計量芯實時獲取。
通常,負(fù)荷可根據(jù)無功和有功功率將負(fù)荷劃分為阻性、容性以及感性等類別。
非電量特征,例如時間、溫度、節(jié)假日等,是反映用戶用電行為的特征,可作為負(fù)荷不易區(qū)分時潛在的輔助特征。時間特征應(yīng)用較為廣泛[18-19],主要包括負(fù)荷運行時長和啟動時刻。
1.2.1 負(fù)荷運行時長特征
負(fù)荷運行時長是對負(fù)荷單次運行時間長短的描述,不同的負(fù)荷通常運行時間長短不一。圖1為某負(fù)荷運行時長特征示意圖,圖中t1為負(fù)荷開啟事件發(fā)生時刻點,t2為該負(fù)荷關(guān)閉事件發(fā)生時刻點,兩時刻點的差值即為負(fù)荷運行時長L的值。
圖1 負(fù)荷運行時長特征示意圖Fig.1 Feature of load running time
對于常見的家用電器,大致可將其分為兩類,其中建模方式以高斯和均勻分布為主,如表1所示。因此對負(fù)荷的運行時長L,其概率密度分布可描述為
表1 負(fù)荷運行時間分布Tab.1 Distribution of time length
式中:N(μ,σ2)為高斯分布;l為常數(shù),代表均勻分布。
一般而言,負(fù)荷運行時長的統(tǒng)計依賴于負(fù)荷自身的特性以及用戶的用電行為。本文在負(fù)荷事件檢測的基礎(chǔ)上,對某家庭用戶各負(fù)荷運行時長進(jìn)行了統(tǒng)計,如圖2所示,其中各圖形上方的數(shù)字表示各負(fù)荷的平均運行時長。
圖2 負(fù)荷運行時長特征統(tǒng)計結(jié)果Fig.2 The length of statistical time of load running
從圖2中可以看出,各負(fù)荷運行時長之間具有一定的區(qū)分性,例如空調(diào)通常是長時間運行,電視機平均運行時長在2 h左右,而微波爐、電水壺、電磁爐以及洗衣機的運行時長較短,僅為幾min或十幾min,且分布相對較為集中。
1.2.2 負(fù)荷運行時刻特征
負(fù)荷運行時刻特征通常與用戶作息、行為習(xí)慣有較大關(guān)聯(lián)。圖3為統(tǒng)計某家庭用戶各負(fù)荷運行時刻特征統(tǒng)計熱力圖,圖右側(cè)刻度條顏色表示對應(yīng)的運行次數(shù)。圖中色塊的位置反映各負(fù)荷處于運行狀態(tài)的時間段,顏色越深代表負(fù)荷在該時間段內(nèi)使用頻率越高。例如,冰箱幾乎處于全天運行狀態(tài),而熱水器通常在晚上19∶00—20∶00之間運行。此外,從圖中也可以看出空調(diào)的運行時段也較為固定,均為夜里22∶00以后開啟到次日早晨關(guān)閉,這與用戶睡眠時間有關(guān),而電視機則通常在中午和晚上運行。這些也從側(cè)面反映了用戶對負(fù)荷的使用習(xí)慣。因此,可將一天24 h分為若干個時間段,并用二值函數(shù)表示在某時間段(t1,t2)內(nèi)是否有負(fù)荷事件發(fā)生,即
圖3 負(fù)荷運行時刻特征統(tǒng)計結(jié)果Fig.3 Statistical running time of load
lt=1表示發(fā)生負(fù)荷事件;lt=0表示未發(fā)生負(fù)荷事件。
1.2.3 間歇性變化特征
除了上述一些特征之外,還存在一些工作波形特征。圖4所示為洗衣機工作時所展現(xiàn)的波形曲線特性。不難看出,該特征具有較好的區(qū)分性,因此在非電量特征中可直接進(jìn)行負(fù)荷判別,即
圖4 負(fù)荷運行間歇性變化特征示意圖Fig.4 Vairation feature of load during running
考慮到用戶用電行為通常具有統(tǒng)計規(guī)律,因此時間特征是除電量特征以外能夠有效地提高負(fù)荷辨識準(zhǔn)確率的特征。本文首先對負(fù)荷時間特征進(jìn)行統(tǒng)計以及細(xì)化建模。
采用負(fù)荷運行時長特征進(jìn)行分類,最為直接的方式是按運行時長的長短進(jìn)行劃分。為了確定具體的運行時長的細(xì)分類型數(shù)和分類閾值,本文對所有負(fù)荷的運行時長采用核密度估計方法,得到負(fù)荷時長特征概率密度分布函數(shù)f(x)。對f(x)進(jìn)行積分,并令積分結(jié)果滿足:
根據(jù)ε值的不同,可將負(fù)荷按運行時長分為若干個類型,使得每個類型包含的負(fù)荷種類數(shù)大致相等,同時得到時長閾值x的值。
考慮到負(fù)荷在一天中的運行時刻具有不確定性,可能存在多負(fù)荷同時運行的高峰期(晚上下班后),也存在幾乎無負(fù)荷運行的低谷期(在白天的工作時間),因此負(fù)荷運行時間特征的分段往往不是均勻等距的,需要根據(jù)具體的場景進(jìn)行劃分。
對于不同用戶的不同用電行為規(guī)律,為進(jìn)一步確定具體劃分時間段的時間點,本文采用一種最優(yōu)化的方法,規(guī)定所有負(fù)荷所占的時間段數(shù)總和最少即為最優(yōu)的時間區(qū)間劃分結(jié)果,這能很大程度地將不同運行時刻的負(fù)荷區(qū)分開來。
令NTi表示第i個負(fù)荷占用的時間段數(shù),i?1~s,s為總的負(fù)荷類型數(shù),則目標(biāo)函數(shù)的表達(dá)式如下式所示:
對于具有s類負(fù)荷的環(huán)境而言,可以用稀疏二值矩陣LTs×24表示各負(fù)荷的運行時段(下標(biāo)24代表一天24 h),矩陣中1代表存在負(fù)荷運行,0代表不存在負(fù)荷運行,結(jié)合式(2)可將某一天的各負(fù)荷運行時刻分布情況表示為
其中,矩陣的每一行代表各負(fù)荷存在運行狀態(tài)的時間段,每一列代表該小時內(nèi)運行的負(fù)荷類型。若將時刻tm1,tm2,…,tmt(1 式中:j為時刻點,j?[1,24]。 定義符號函數(shù)sgn(·)為 將式(7)、式(8)計算結(jié)果代入式(5)即可求得m1,…,mt的值。 在智能電表非侵入式負(fù)荷辨識研究中,時間特征和電量特征具有一定的差異性。本文對時間特征采用Mean-shift聚類,得到用戶在相同時間特征下所使用的負(fù)荷,同時利用孿生神經(jīng)網(wǎng)絡(luò),通過與數(shù)據(jù)庫負(fù)荷匹配辨識出所使用的負(fù)荷類型。 Mean-shift算法作為一種非參數(shù)化聚類算法,其基本思想是假設(shè)不同簇類的數(shù)據(jù)集符合不同的概率密度分布,通過找到任一樣本點密度增大的最快方向,那么樣本密度高的區(qū)域?qū)?yīng)于該分布的最大值,這些樣本點最終會在局部密度最大值處收斂,且收斂到同一局部最大值的樣本點就被認(rèn)為是同一簇類。相比于其他聚類算法如K-means算法,Mean-shift算法無需預(yù)先設(shè)置聚類中心數(shù),其可以借助數(shù)據(jù)分布概率密度自適應(yīng)地選取聚類中心數(shù)[20],這對一天內(nèi)使用的負(fù)荷類別的快速確定具有重要意義。 假定給定d維空間的n個樣本點xi(i=1,…,n),空間中任一點x的Mean-shift漂移向量的基本形式為 式中:y為在空間尺度h內(nèi)的變量;K為n個樣本點中分布在區(qū)域Sh內(nèi)的個數(shù);Sh為以x為中心、h為半徑的高維球域區(qū)域。 在聚類的過程中,按照下式不斷地計算漂移向量進(jìn)行迭代,最終獲得聚類中心。 為了優(yōu)化聚類效果,引入核函數(shù)K(xi-x)[21],則均值偏移向量更新為 式中:ω(xi)為樣本xi的權(quán)重,由其概率分布決定。 在聚類之后,本文采用如圖5所示的孿生網(wǎng)絡(luò)的方法對負(fù)荷進(jìn)行細(xì)分類。 圖5 孿生網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.5 Siamese network framework 孿生網(wǎng)絡(luò)主要用來衡量兩個輸入的相似程度,其有兩個輸入(X1和X2),將兩個輸入分別輸入兩個神經(jīng)網(wǎng)絡(luò)(Network1和Network2),通常兩個神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)一般是相同的,它們分別將輸入映射到新的空間形成新的特征,并最終通過計算距離來評價兩個輸入的相似度。 圖5中,X1,X2為負(fù)荷特征和數(shù)據(jù)庫中負(fù)荷特征;GW表示神經(jīng)網(wǎng)絡(luò)模型,下角W表示權(quán)重,GW的作用就是將電量和非電量特征數(shù)據(jù)X轉(zhuǎn)換為一組特征向量;EW則用于衡量特征向量之間的距離,距離越小,則代表越相似。 本文采用彈性BP神經(jīng)網(wǎng)絡(luò)[22](resilient back propagation,RPROP)作為孿生神經(jīng)網(wǎng)絡(luò)中的GW。假設(shè)分類對象為Ψi(i=1,2,…,p),每個對象Ψi對應(yīng)有q個樣本Ψij(j=1,2,…,q),其中樣本特征維數(shù)為r,即 則特征集的個數(shù)為p×q,此時將這些樣本輸入神經(jīng)網(wǎng)絡(luò),得到p×q個輸出矢量: 式中:u為輸出層數(shù)據(jù)維度。 則生成的特征矩陣為 為了降低計算量,對矩陣Y進(jìn)行主成分分析。令Y的協(xié)方差矩陣的最大特征值對應(yīng)的特征矢量為t,則在第一主元方向的投影所得數(shù)據(jù)為 即第i類對象的第j個樣本對應(yīng)于第一主元方向上的投影數(shù)據(jù)αij。假定當(dāng)?shù)趎個主元成分上投影的方差和占總方差超過某個閾值(文中設(shè)置為0.90),則確定了對應(yīng)的n個特征向量,從而生成特征集。 為了判別神經(jīng)網(wǎng)絡(luò)輸入屬于具體某個負(fù)荷類別,將數(shù)據(jù)庫中負(fù)荷類別特征作為孿生神經(jīng)網(wǎng)絡(luò)輸入,其中孿生神經(jīng)網(wǎng)絡(luò)輸出的距離度量采用K-means分類方法。 圖6給出了本文方法的具體流程框架。在該框架中,首先對負(fù)荷事件通過時間特征進(jìn)行聚類,獲得相應(yīng)的負(fù)荷類別,然后通過孿生神經(jīng)網(wǎng)絡(luò),將與數(shù)據(jù)庫中與之具有相同時間特征的負(fù)荷進(jìn)行匹配,最終得到負(fù)荷辨識結(jié)果。 圖6 本文方法模型結(jié)構(gòu)圖Fig.6 Frame chart of proposed method 為了驗證文中方法的有效性,本文以某一家庭用戶作為具體的研究對象,連續(xù)對該家庭用戶監(jiān)測30 d的負(fù)荷數(shù)據(jù)進(jìn)行離線分析,并從中分析提取出負(fù)荷運行的特征數(shù)據(jù),構(gòu)建負(fù)荷特征數(shù)據(jù)庫。用戶使用的負(fù)荷包括空調(diào)、電飯煲、微波爐、電水壺、電磁爐、電視機、熱水器、洗衣機和電冰箱。為此,本文將該9種負(fù)荷作為研究對象進(jìn)行辨識,表2給出了該用戶負(fù)荷有功-無功功率特征和間歇性特性數(shù)據(jù)庫,運行時長和投切時刻統(tǒng)計圖見圖2、圖3。文中設(shè)置Meanshift算法中時長尺度為10 min,投切時刻尺度為相差30 min。 表2 負(fù)荷特征數(shù)據(jù)庫Tab.2 Database of load signature 4.1.1 負(fù)荷運行時長分段閾值 按照1.2.1中的方法,為確定具體的運行時長分類閾值,圖7給出了負(fù)荷時長特征概率密度分布結(jié)果。為了獲得時長分類的界限,本文對概率密度函數(shù)進(jìn)行積分,取積分結(jié)果中值處作為負(fù)荷運行時長分界線。為了方便表示,令t0表示時長分類閾值點,設(shè)置式(4)中ε=1/2,計算得到分類閾值t0≈40 min,由此可將t0作為負(fù)荷事件分類的運行時長閾值,即短時長為0 圖7 負(fù)荷運行時長特征統(tǒng)計示意圖Fig.7 Statistical length of running time 4.1.2 負(fù)荷運行時刻特征分段閾值 在統(tǒng)計獲得負(fù)荷特征數(shù)據(jù)庫的基礎(chǔ)上,對用戶某一天的用電數(shù)據(jù)作為測試數(shù)據(jù)進(jìn)行實驗。 首先,對該用戶的日用電功率曲線進(jìn)行負(fù)荷事件檢測,并提取負(fù)荷事件的有功-無功功率特征和時間特征信息,測試數(shù)據(jù)如圖8所示,負(fù)荷事件特征信息如表3所示。由時間特征分類可知,該日負(fù)荷事件分為5類,與之匹配的在數(shù)據(jù)庫中得到的負(fù)荷類別如表4所示。然后,與數(shù)據(jù)庫中的時間特征采用Mean-shift聚類后,得到聚類匹配結(jié)果如表5所示。顯然,從數(shù)據(jù)庫中聚類得到的結(jié)果可以發(fā)現(xiàn),時間特征上相似的負(fù)荷設(shè)備可能存在多個,因此需要進(jìn)一步細(xì)分。 表3 負(fù)荷事件特征信息Tab.3 Information of feature of load event 表4 負(fù)荷時間特征匹配信息Tab.4 Information of time feature of load in matching 表5 時間特征Mean-shift聚類結(jié)果Tab.5 Reuslt of Mean-shift clustering of load event 圖8 測試數(shù)據(jù)日負(fù)荷事件檢測結(jié)果Fig.8 Detect result of test data in one day of home 為了最終判斷負(fù)荷類型,將電量特征和時長特征作為孿生網(wǎng)絡(luò)中彈性BP神經(jīng)網(wǎng)絡(luò)1的輸入,同時,將數(shù)據(jù)庫中訓(xùn)練的負(fù)荷類別的特征信息輸入到BP神經(jīng)網(wǎng)絡(luò)2,通過生成的特征進(jìn)行K-means聚類,最終得到的匹配結(jié)果如表6所示,與實際負(fù)荷投切運行結(jié)果一致。 表6 孿生神經(jīng)網(wǎng)絡(luò)匹配聚類結(jié)果Tab.6 Matching reuslt of siamese neural network 為了進(jìn)一步驗證本文方法的有效性,本文與文獻(xiàn)[22]中的神經(jīng)網(wǎng)絡(luò)負(fù)荷辨識方法進(jìn)行比較,其中輸入特征為有功、無功,辨識結(jié)果如表7所示。從表中可以發(fā)現(xiàn),在沒有時間特征細(xì)分情況下,單一地采用神經(jīng)網(wǎng)絡(luò)進(jìn)行負(fù)荷辨識,因特征存在混疊導(dǎo)致其錯誤率較高;而本文方法首先通過對時間特征的細(xì)分,并采用Mean-shift算法與數(shù)據(jù)庫中的負(fù)荷進(jìn)行聚類,選擇具有相似的時間特征,然后通過孿生神經(jīng)網(wǎng)絡(luò)進(jìn)行細(xì)分,實現(xiàn)了較高的辨識準(zhǔn)確率。在該用戶場景下,其平均辨識準(zhǔn)確率為0.976 3。 表7 對比分析結(jié)果Tab.7 Reuslts of comparsion 針對實際家庭用電場景中用戶使用的負(fù)荷類型辨識問題,文中提出了基于Mean-shift聚類和孿生網(wǎng)絡(luò)的負(fù)荷辨識方法,該方法按家庭負(fù)荷時間特征分布情況統(tǒng)計結(jié)果,將負(fù)荷事件按運行時長和運行時刻特征通過Mean-shift聚類方法,獲得相似時間特征的負(fù)荷,然后采用孿生網(wǎng)絡(luò)進(jìn)行負(fù)荷匹配辨識,提高辨識準(zhǔn)確率。實驗結(jié)果證明,該方法可有效彌補因有功-無功特征混疊而引起的負(fù)荷辨識準(zhǔn)確率低的問題。在下一步工作中,我們也將通過采集其他不同家庭用戶負(fù)荷特征,將文中算法進(jìn)行應(yīng)用推廣。3 Mean-shift負(fù)荷事件聚類和孿生網(wǎng)絡(luò)判斷
3.1 Mean-shift聚類
3.2 孿生網(wǎng)絡(luò)判斷負(fù)荷類型
3.3 實現(xiàn)流程
4 實驗結(jié)果與分析
4.1 參數(shù)設(shè)置
4.2 測試案例分析
5 結(jié)論