王家駒, 萬忠兵, 何仲瀟, 汪佳, 謝智, 王梟
(1. 國網(wǎng)四川省電力公司計量中心,四川 成都 610000;2. 清華四川能源互聯(lián)網(wǎng)研究院,四川 成都 610000)
智能電網(wǎng)是近些年來電力工業(yè)最重大的變革與創(chuàng)新,也是智慧城市建設(shè)的重要組成部分之一[1]。同時,智能電網(wǎng)的快速發(fā)展也對配電網(wǎng)側(cè)的精細(xì)化管理提出了更高的要求[2]。然而配電臺區(qū)普遍存在線損計算異常等問題,導(dǎo)致臺區(qū)運行、規(guī)劃等多個高級應(yīng)用難以推進,難以對整個臺區(qū)實現(xiàn)智能化管控,會對用戶的安全用電造成直接的影響[3]。終端用戶難以和臺區(qū)管控的配電變壓器準(zhǔn)確配準(zhǔn)是造成該問題的主要成因。因此,提出精準(zhǔn)且高效的臺戶關(guān)系辨識方法,對實現(xiàn)智能配電臺區(qū)“信息化、自動化、互動化”的具有重要意義。
傳統(tǒng)配電臺戶關(guān)系辨識主要分為如下兩種方法:①人工抄表統(tǒng)計方式,巡檢人員沿火線尋找變壓器各相對應(yīng)的終端用戶,并在臺區(qū)檔案上進行記錄。顯然,該方法存在工作量大、準(zhǔn)確率低、信息更新不及時等問題,隨著用戶數(shù)量與日俱增,弊病也越來越突出;②基于電力線通訊方式的統(tǒng)計方式,將電力通信作為傳輸信息,并在用戶端將信號解調(diào)為相位信號,實現(xiàn)所屬臺區(qū)和相位辨識[4]。然而該方法存在辨識不穩(wěn)定和不準(zhǔn)確的問題,會出現(xiàn)串線的等情況[5]。為此,文獻[6]提出了一種基于擾動技術(shù)的工頻通信配電臺區(qū)用戶組網(wǎng)辨識改進方法,實現(xiàn)臺戶關(guān)系的“一鍵式”定位。文獻[7]利用電能計量數(shù)據(jù)與資產(chǎn)數(shù)據(jù)實現(xiàn)臺區(qū)用戶的識別。文獻[8]搭建了基于BP(back propagation)神經(jīng)網(wǎng)絡(luò)算法,以多次通信信號為分析對象,從而減少串臺區(qū)的情況,但是對于設(shè)備的要求較高,存在一定的實施成本。
然而,隨著大數(shù)據(jù)智能電網(wǎng)的發(fā)展,大數(shù)據(jù)為臺戶關(guān)系辨識提供了一種全新途徑。在配電網(wǎng)的海量運行數(shù)據(jù),如配變出口電壓、電流可間接反映配電網(wǎng)的線變關(guān)系。目前,針對該方面的研究成果較少。文獻[9]通過分析電壓數(shù)據(jù)存在于時間和空間的相關(guān)度,對各臺區(qū)的用戶進行劃分,其準(zhǔn)確度還有待提高。文獻[10]以三相負(fù)荷不平衡臺區(qū)配變出口電壓的歸算結(jié)果作為線網(wǎng)關(guān)系的校驗核心,但不適用于抵押用戶所屬臺區(qū)校驗。實際電力系統(tǒng)中,電氣距離越近[11],用戶的電壓變化趨勢約接近?;诖?,文中提出了基于多維尺度分析(muti-dimensional scaling, MDS)算法和改進K-means聚類算法的臺戶關(guān)系辨別方法。首先通過MDS算法對所采集的電壓數(shù)據(jù)進行降維處理,以降低整體算法計算量,提高算法效率,再利用改進K-means算法實現(xiàn)用戶聚類,最后根據(jù)聚類結(jié)果確定用戶的所述臺區(qū)及相別。最終算例分析證明了文中方法的有效性。
當(dāng)待識別智能電表數(shù)目眾多,且電表數(shù)據(jù)維度特別龐大時,會造成算法耗時嚴(yán)重,效率低下。而考慮到應(yīng)用MDS進行數(shù)據(jù)降維時能夠保證所有數(shù)據(jù)點在低維空間中的相似度等于在高維空間中的相似度,從而在降低數(shù)據(jù)維度提升算法效率的同時不會對辨識準(zhǔn)確度造成影響。因此,本文在利用改進K-means聚類算法進行臺戶關(guān)系辨識之前,首先利用MDS算法對采集到的電壓數(shù)據(jù)進行降維處,從而降低整體算法計算量,提高算法效率。
文中采用MDS算法對用戶及變壓器低壓側(cè)的電壓數(shù)據(jù)進行降維處理。MDS算法基于數(shù)據(jù)的相似性及相異性,以保持變量在高維空間與低維空間中歐式距離不變?yōu)樵瓌t,將變量從高維空間映射到低維空間,挖掘變量的潛在結(jié)構(gòu)。
(1)
算法目標(biāo)為獲得樣本d′在維空間的表示Z,其中d′ (2) 式中:zi為d′維空間中的第i個坐標(biāo)點。 定義矩陣T=ZZT,T矩陣中的元素為tij,矩陣Z的距離矩陣D中的元素為dij,其元素值為: (3) 則可得到: (4) D中元素和T中元素的關(guān)系如式(5)所示。 (5) 最后對T進行特征值分解,如式(6)所示。 (6) 式中:U為特征向量;Λ為特征值矩陣。 基于MDS算法,使得降維后數(shù)據(jù)能很好地表達(dá)原多維數(shù)據(jù)的核心部分信息,從而在不影響聚類準(zhǔn)確度的情況下,極大提升算法效率。 典型臺區(qū)變與用戶電表之間的拓?fù)溥B接如圖1所示。同一相的臺區(qū)變壓器和用戶的電表之間具有確定的電氣連接,因此用戶側(cè)的電壓會與臺區(qū)變出口電壓的變化趨勢高度一致。處于同一臺區(qū)同一相別的用戶,電壓波動規(guī)律具有很強的相似性,而屬于不同臺區(qū)的用戶,其電氣距離遠(yuǎn),電壓波動相似性較差。而聚類分析作為一種被廣泛應(yīng)用的數(shù)據(jù)挖掘算法,可以按照事物的某些相似屬性,把事物聚集成類,使類間的相似性盡可能小,類內(nèi)相似性盡可能大。為此,文中采用改進K-means算法對臺區(qū)用戶及變壓器低壓側(cè)電壓數(shù)據(jù)進行聚類,從而實現(xiàn)臺區(qū)用戶的準(zhǔn)確識別。 K-means算法的核心思想是找出K個聚類中心c1,c2,…,ck,通常以歐式距離作為樣本相似程度的評估指標(biāo),并使得類間的相似性盡可能小,類內(nèi)相似性盡可能大。傳統(tǒng)K-means算法流程如圖2所示。 K-means算法簡單,收斂速度快,但存在聚類個數(shù)難以確定、初始質(zhì)心選取不準(zhǔn)確、歐式距離作為評估樣本相似程度的有效性有限,常常出現(xiàn)聚類結(jié)果陷入局部最優(yōu)的情況[12]。為此,文中針對上述問題,結(jié)合實際應(yīng)用場景的特點,對K-means算法做出如下改進,從而達(dá)到提升辨別準(zhǔn)確度和縮短計算時間的目的。 1)聚類個數(shù)的選取 由于變壓器的個數(shù)N是已知的,因此可明確獲知最終的聚類個數(shù)為變壓器的總相數(shù)3N。這是臺區(qū)用戶辨識場景下的天然優(yōu)勢。 2)K-means初始聚類中心的選取 由于變壓器各相出口電壓數(shù)據(jù)是明確的,一方面不同變壓器各相的電壓數(shù)據(jù)正好隸屬不同的類,另一方面變壓器各相出口電壓能夠較好地反映各類數(shù)據(jù)的分布特征,作為聚類中心更有利于平方誤差準(zhǔn)則函數(shù)的收斂。因此,本文算法將變壓器出口電壓作為K-means的初始聚類中心,從而避免由于初始聚類中心選擇的隨機性帶來結(jié)果陷入局部最優(yōu)的僵局,實現(xiàn)準(zhǔn)確聚類。 3)重新定義相似度評估標(biāo)準(zhǔn) 經(jīng)典K-means聚類算法以歐式距離作為樣本相似度的評估指標(biāo)。歐式距離的計算公式如下: (7) 式中:Lpq為第p個樣本到第q個樣本的距離;n為樣本的數(shù)據(jù)維度;zpd為第p個行向量的第d維坐標(biāo);zqd為第q個行向量的第d維坐標(biāo)。 然而,由于歐式距離衡量的是多維空間中各個點之間的絕對距離,體現(xiàn)個體數(shù)值特征的絕對差異。而本文的理論基礎(chǔ)是同一臺區(qū)同一相變壓器和用戶電壓數(shù)據(jù)變化趨勢的一致性,更強調(diào)電壓波動規(guī)律的一致性。因此歐式距離不是非常適合此場景。為此,文中引入相關(guān)系數(shù)作為評估相似度的標(biāo)準(zhǔn),從而提高算法的準(zhǔn)確率。相似系數(shù)的計算公式如式(8)所示。 (8) 同時,通過中心化和標(biāo)準(zhǔn)化對原始的電壓數(shù)據(jù)進行數(shù)據(jù)預(yù)處理,以避免噪聲數(shù)據(jù)所引起的誤差。 綜上,應(yīng)用流程如圖3所示。 以下述臺區(qū)樣本數(shù)據(jù)為例進行算例分析。在該臺區(qū)內(nèi)某臺變壓器下共接入88戶用戶,并以1小時為采樣頻率對用戶側(cè)電壓進行了7天的數(shù)據(jù)采樣。因此,最終聚類個數(shù)為3類。為驗證文中所提方法的有效性,算例進行如下三個仿真,并校驗不同方法下的正確率。 方法1:設(shè)定最終聚類個數(shù),不設(shè)定初始聚類中心,仍采用歐式距離作為衡量相似度的標(biāo)準(zhǔn)。 方法2:設(shè)定最終聚類個數(shù),設(shè)定初始聚類中心,仍采用歐式距離作為衡量相似度的標(biāo)準(zhǔn)。 方法3:設(shè)定最終聚類個數(shù),設(shè)定初始聚類中心,采用相似系數(shù)作為衡量相似度的標(biāo)準(zhǔn)(文中所提方法)。 各個算法下的辨識準(zhǔn)確率如表1所示。比較方法1和方法2可知,設(shè)定K-means的初始聚類中心能夠?qū)⒂脩舯孀R的準(zhǔn)確度提升了近1.5倍。比較方法2和方法3可知,將相似系數(shù)代替歐式距離,作為相似度的衡量標(biāo)準(zhǔn),能夠?qū)崿F(xiàn)辨識精度由于87.5%到100%的提升。上述數(shù)據(jù)一定程度上證明了文中通過對K-means算法進行改進,能夠有效提升用戶的辨識準(zhǔn)確度。 表1 不同方法下的用戶辨識準(zhǔn)確率 為驗證文中方法的通用性,算例2針對不同數(shù)據(jù)量在以上3個場景下進行反復(fù)10次的仿真測試,并取測試平均值作為最終的辨識結(jié)果。針對不同的數(shù)據(jù)量,以上3種方法的辨識準(zhǔn)確率如表2所示。 由表2可知,所采集到的數(shù)據(jù)量越大,算法的準(zhǔn)確度越高。方法3在低密度數(shù)據(jù)的情況下,依舊能夠保持100%的準(zhǔn)確度,并且精度不會隨復(fù)雜度增強(變壓器臺數(shù)增多)而降低。然而,方法1與方法2在相同數(shù)據(jù)體量下,隨著變壓器臺數(shù)的增加,其精度有明顯的下降,可見方法1與方法2受外界因素影響較大,用戶辨識結(jié)果不穩(wěn)定。 表2 不同數(shù)據(jù)量下的用戶辨識準(zhǔn)確率 因此,文中所提方法通過對配網(wǎng)運行過程中產(chǎn)生的海量數(shù)據(jù)進行降維聚類分析,能夠有效解決配網(wǎng)中線變不匹配的問題。該方法無需增加任何的設(shè)備成本投入,且效果穩(wěn)定,具備大規(guī)模應(yīng)用的潛力。 文中提出了一種基于MDS和改進K-means算法的臺戶關(guān)系辨識方法。該方法通過MDS算法實現(xiàn)數(shù)據(jù)降維,提升了后期聚類分析的計算速度。根據(jù)實際應(yīng)用場景特點對K-means算法進行3個方面的改進,從而實現(xiàn)提升臺區(qū)用戶辨識準(zhǔn)確率與辨識穩(wěn)定度的目的。 算例結(jié)果分析表明,文中所提方法能夠有效提升臺區(qū)用戶辨識準(zhǔn)確率,在低密度數(shù)據(jù)、問題復(fù)雜度增加的情況下依舊能保持極高的準(zhǔn)確率,效果穩(wěn)定,具備在實際場景中大規(guī)模運用的潛力。2 臺戶關(guān)系辨識
2.1 K-means算法
2.2 改進K-means算法
3 算例分析
3.1 算例1
3.2 算例2
4 結(jié)束語