鄒時(shí)容, 陸慧,洪梓銘,黃杰棟,陳琳韜,廖志偉
(1.廣東電網(wǎng)有限責(zé)任公司廣州供電局,廣東 廣州 510620;2.華南理工大學(xué) 電力學(xué)院,廣東 廣州 510641)
泛在電力物聯(lián)網(wǎng)以電網(wǎng)為樞紐,將電力用戶、電網(wǎng)企業(yè)、發(fā)電企業(yè)、供應(yīng)商、電力客戶、人及相關(guān)設(shè)備連接起來(lái)共享數(shù)據(jù),為全行業(yè)和更多市場(chǎng)主體發(fā)展創(chuàng)造機(jī)遇和提供價(jià)值服務(wù)。電網(wǎng)正從設(shè)備管理模式向數(shù)據(jù)管理模式發(fā)生轉(zhuǎn)型,電網(wǎng)的模型數(shù)據(jù)管理至關(guān)重要[1-3]。低壓配電網(wǎng)結(jié)構(gòu)復(fù)雜,缺乏技術(shù)手段進(jìn)行網(wǎng)絡(luò)拓?fù)洚惓z測(cè)及校驗(yàn),大多依賴人工方式進(jìn)行維護(hù),導(dǎo)致更新不及時(shí)、數(shù)據(jù)質(zhì)量較差,進(jìn)而使得電力信息系統(tǒng)(如:營(yíng)銷管理系統(tǒng)、計(jì)量自動(dòng)化系統(tǒng)、GIS系統(tǒng)、配電網(wǎng)生產(chǎn)系統(tǒng)等)中拓?fù)湮锢砟P秃托畔⒛P图皵?shù)據(jù)不匹配的問題較為突出;因而通過技術(shù)手段在運(yùn)行過程對(duì)低壓配電網(wǎng)的拓?fù)浣Y(jié)構(gòu)進(jìn)行校核成為電力物聯(lián)網(wǎng)的信息及數(shù)據(jù)共享必須解決的難點(diǎn)之一。
當(dāng)前國(guó)內(nèi)對(duì)低壓配電網(wǎng)拓?fù)湫:说难芯看蠖技杏谠黾酉鄳?yīng)的智能設(shè)備。文獻(xiàn)[4]提出利用智能分布式存儲(chǔ)拓?fù)涞男畔⑦M(jìn)行拓?fù)渥R(shí)別;文獻(xiàn)[5]提出利用智能終端單元借助通信網(wǎng)絡(luò)查詢局部拓?fù)湫畔?,更新主站間的連接關(guān)系;文獻(xiàn)[6]利用μPMU設(shè)備實(shí)現(xiàn)全網(wǎng)電壓電流等數(shù)據(jù)的采樣,從而實(shí)現(xiàn)拓?fù)渥R(shí)別的方式。
國(guó)外有學(xué)者提出了多種算法,利用已有的電網(wǎng)信息對(duì)拓?fù)浣Y(jié)構(gòu)進(jìn)行校核,文獻(xiàn)[7]利用電壓諧波在1 d之內(nèi)的變化規(guī)律,分析用戶所處的拓?fù)湮恢?文獻(xiàn)[8]基于主成分分析法的拓?fù)湫:朔椒?,?duì)上送的負(fù)荷數(shù)據(jù)進(jìn)行奇異值分解,達(dá)到降維的目的,從而得到電網(wǎng)的實(shí)際拓?fù)洹Mㄟ^算法識(shí)別網(wǎng)絡(luò)拓?fù)淇梢院芎玫亟鉀Q依靠物理設(shè)備帶來(lái)的高費(fèi)用及設(shè)備維護(hù)問題等,但對(duì)于數(shù)據(jù)的精確記錄要求更高。
為確保泛在能源互聯(lián)網(wǎng)各種配用電設(shè)備廣泛互聯(lián)、信息深度采集,近年來(lái)智能臺(tái)區(qū)、寬帶載波、5G等技術(shù)推廣覆蓋,使得智能電表采集大量海量數(shù)據(jù)[9](如:電量類、負(fù)荷類、事件類、電能質(zhì)量及費(fèi)控類等)的獲取成為可能。多年積累的長(zhǎng)時(shí)間尺度的電壓、電流、功率時(shí)間序列信息為配電網(wǎng)拓?fù)浞治龅於〝?shù)據(jù)基礎(chǔ)[10]。
本文以網(wǎng)絡(luò)中電壓序列具有相關(guān)性為理論基礎(chǔ),提出一種基于動(dòng)態(tài)時(shí)間序列分割的電壓相關(guān)性分析方法用于低壓配電網(wǎng)的拓?fù)湫:恕?/p>
電壓相關(guān)性原理是指電流經(jīng)過阻抗時(shí)產(chǎn)生電壓降,系統(tǒng)阻抗兩端相近點(diǎn)的電壓曲線具有相似的波形序列。通過判斷2個(gè)計(jì)量點(diǎn)之間電壓變化曲線的相似性,即可判斷兩者在電氣上的耦合程度。
圖1、2為在不同的電氣距離測(cè)點(diǎn)得出的電壓分布圖,橫縱坐標(biāo)為所分析2個(gè)計(jì)量點(diǎn)的電壓,可明顯得知:電氣距離相近程度不同,其電壓的數(shù)值分布和相關(guān)程度存在較大差異,其中圖1耦合系數(shù)為0.916 5,而圖2耦合系數(shù)為0.531 4。
常用歐式距離、動(dòng)態(tài)時(shí)間規(guī)整(dynamic time warping,DTW)以及皮爾遜相關(guān)系數(shù)等作為定量衡量時(shí)間序列相關(guān)性的度量指標(biāo)。歐式距離及DTW缺乏歸一化的判斷依據(jù),需要進(jìn)行數(shù)據(jù)的對(duì)比分析才能實(shí)現(xiàn)判斷,而皮爾遜系數(shù)是歸一化的相關(guān)判據(jù)。
皮爾遜相關(guān)系數(shù)R(X,Y)是反映2個(gè)序列X、Y之間的線性相關(guān)程度的統(tǒng)計(jì),其值介于-1到1之間,值的絕對(duì)值大小反映兩者之間線性相關(guān)程度的強(qiáng)弱,絕對(duì)值越大兩者的相關(guān)性越強(qiáng),負(fù)號(hào)表示兩者之間是負(fù)相關(guān)的關(guān)系,計(jì)算式為
圖1 高相關(guān)性
圖2 低相關(guān)性
(1)
式中:cov(X,Y)為2個(gè)序列的協(xié)方差;σX、σY分別為序列X、Y的標(biāo)準(zhǔn)差。本文利用皮爾遜系數(shù)判斷用戶與臺(tái)區(qū)之間連接正確是否。設(shè)定兩者之間相關(guān)性強(qiáng)弱的閾值δ,若所得相關(guān)性R(X,Y)>δ,則說明兩者之間在差異性較大處仍具有強(qiáng)的相關(guān)性,用戶與臺(tái)區(qū)之間具有正確的拓?fù)渎?lián)系;若所得的R(X,Y)<δ,則說明兩者之間的相關(guān)性關(guān)系較差,用戶與臺(tái)區(qū)之間拓?fù)浣Y(jié)構(gòu)連接關(guān)系存在錯(cuò)誤,需要進(jìn)行現(xiàn)場(chǎng)檢驗(yàn)。
本次案例分析使用的數(shù)據(jù)是某供電局中A、B、C 3個(gè)臺(tái)區(qū)的電壓數(shù)據(jù),分析用戶時(shí)以A的用戶作為例子進(jìn)行分析,判斷這些用戶與臺(tái)區(qū)之間的電壓關(guān)系。選擇1月30日22:45至1月31日22:45的全部電壓數(shù)據(jù)進(jìn)行分析,由于采樣器每15 min采樣1次,共計(jì)每一相有96個(gè)數(shù)據(jù)點(diǎn),包括3個(gè)臺(tái)區(qū)配電變壓器(簡(jiǎn)稱“配變”)的電壓數(shù)據(jù),以及臺(tái)區(qū)下所采集的20名用戶的用電數(shù)據(jù)。皮爾遜相關(guān)系數(shù)的閾值可以根據(jù)不同用戶類型進(jìn)行設(shè)置,以提高分辨的正確率。
分析臺(tái)區(qū)低壓用戶與配變電壓數(shù)據(jù)的相關(guān)性,A臺(tái)區(qū)用戶電壓曲線如圖3所示。
圖3 A臺(tái)區(qū)20個(gè)用戶電壓曲線
3個(gè)臺(tái)區(qū)配變的三相電壓曲線如圖4所示。
圖4 3個(gè)臺(tái)區(qū)變壓器電壓曲線
計(jì)算兩者之間電壓數(shù)據(jù)的相關(guān)性,結(jié)果見表1(表1中只給出部分用戶)。
分析表1可知,用戶與所連接的臺(tái)區(qū)之間的電壓相關(guān)性高于與其他臺(tái)區(qū)之間的相關(guān)性,因此猜測(cè)設(shè)置相應(yīng)的相關(guān)性的閾值可以作為驗(yàn)證用戶與臺(tái)區(qū)連接是否正確的依據(jù)。對(duì)此,檢驗(yàn)由2月1日至2月27日共計(jì)60名用戶與各臺(tái)區(qū)之間的數(shù)據(jù)相關(guān)性系數(shù),并對(duì)不同的相關(guān)系數(shù)閾值得出其準(zhǔn)確率,結(jié)果見表2。
由表2可知:通過選擇合理的相關(guān)系數(shù)閾值,可以判明其與所示臺(tái)區(qū)的正確連接關(guān)系,提高閾值可以區(qū)分出用戶與其連接不正確的臺(tái)區(qū),但是過高的閾值又可能導(dǎo)致將連接正確的臺(tái)區(qū)誤判為不正確;因此閾值的合理選擇對(duì)判定結(jié)果的正確與否十分重要。
表1 用戶與臺(tái)區(qū)的相關(guān)性系數(shù)
表2 閾值選擇及準(zhǔn)確率
本案例分析表明了利用相關(guān)性數(shù)據(jù)對(duì)用戶與所連接臺(tái)區(qū)進(jìn)行識(shí)別校驗(yàn)的可行性,為后續(xù)的分析提供基本的理論依據(jù)。
為提高拓?fù)湫:藴?zhǔn)確度及快速性,有必要對(duì)用戶電壓時(shí)間序列進(jìn)行分割,提取其中最能表征不同用戶用電特征的子序列,進(jìn)而研究臺(tái)區(qū)與用戶在該時(shí)間段內(nèi)對(duì)應(yīng)子序列之間的相關(guān)性。
目前常用的子序列分割方法主要有等長(zhǎng)序列分割、滑動(dòng)時(shí)間窗口分割和特定的序段分割算法等。
對(duì)所取的一整段數(shù)據(jù)劃分為長(zhǎng)度為m的一系列序段。該分段方式簡(jiǎn)單,但對(duì)序列的信息分割不夠完整,易造成子序列所含的信息紊亂并產(chǎn)生較大的誤差。
利用1個(gè)長(zhǎng)度為m的時(shí)間窗口[11]在完整序列上滑動(dòng),得到n-m+1個(gè)子序列(n為完整序列長(zhǎng)度),該方法得到的子序列信息完整,但是數(shù)據(jù)量較大,計(jì)算過程復(fù)雜;同時(shí)在截取過程中,部分子序段所含信息不具研究?jī)r(jià)值;此外,長(zhǎng)度m的選取,對(duì)于序段子序列的分析也具有重要的影響。
在時(shí)間序列當(dāng)中,數(shù)據(jù)的變化趨勢(shì)[12]、曲線斜率變化以及數(shù)據(jù)的極值點(diǎn)[13-14]等可以反映出數(shù)據(jù)的重要特征,體現(xiàn)數(shù)據(jù)中不同的局部特征;因此,以極值點(diǎn)或者曲率為序列子段劃分的算法在序列劃分中具有重要作用。
本文針對(duì)低壓用戶及臺(tái)區(qū)配變之間的電壓數(shù)據(jù),利用極值點(diǎn)分段算法對(duì)數(shù)據(jù)進(jìn)行分段并進(jìn)行相關(guān)性研究,同時(shí)與滑動(dòng)時(shí)間窗口的分析結(jié)果進(jìn)行比較,檢驗(yàn)所提算法對(duì)低壓拓?fù)湫:说挠行浴?/p>
在時(shí)間序列數(shù)據(jù)中,容易引起人為關(guān)注的通常為序列中的一些特征點(diǎn),這些特征點(diǎn)往往能夠表示序列的局部特征,反映出序列不同分段之間的趨勢(shì)變化[15-20]。通過對(duì)時(shí)間序列的分段,可以去除無(wú)關(guān)序列的干擾,達(dá)到對(duì)時(shí)間序列的精確分析;為此,在這里提出利用極值點(diǎn)對(duì)序列的分段算法。
假設(shè)有序列X={x1,x2,…,xc,…,xn},其長(zhǎng)度為n,xc為X序列中的第c點(diǎn)序列項(xiàng)值。設(shè)k為c的領(lǐng)域,對(duì)c點(diǎn)進(jìn)行如下判斷:
a)若xc-k≤xc且xc≥xc+k,則判斷為領(lǐng)域內(nèi)的極大值點(diǎn),用1表示。
b)若xc-k≥xc且xc≤xc+k,則判斷為領(lǐng)域內(nèi)的極小值點(diǎn),用-1表示。
c)若不能夠滿足上述表達(dá)式,則判斷該點(diǎn)在領(lǐng)域內(nèi)不是極值點(diǎn),用0表示。
利用極值點(diǎn)判定算法對(duì)序列中的數(shù)據(jù)進(jìn)行判定后,再應(yīng)用重要性標(biāo)記算法對(duì)序列中的每一個(gè)點(diǎn)判定其重要性標(biāo)志等級(jí),得到序列點(diǎn)的重要性標(biāo)記序列TAG={t1,t2,…,tn}。設(shè)定其極值點(diǎn)的判斷領(lǐng)域?yàn)镵(整數(shù)),在點(diǎn)i的領(lǐng)域范圍內(nèi)(i=1,2,3,…,n),判斷xi是否為極值,并更新TAG,具體流程如下:
a)初始化TAG,其中t1和tn為K,其余值為0。
b)對(duì)于k=1,判斷TAG序列和原始時(shí)間序列X的每一個(gè)對(duì)應(yīng)值是否滿足如下判別式:①若ti=k-1且xi在其領(lǐng)域k內(nèi)是極大值,則ti=ti+1;②若ti=-(k-1)且xi在其領(lǐng)域k內(nèi)是極小值,則ti=ti-1;③若不滿足上述的判定,則ti不變。
c)令k=k+1,返回步驟b),直到k=K,并得到重要性標(biāo)記序列TAG。
在序列TAG中,其值與原始時(shí)間序列X的值一一對(duì)應(yīng),表示在序列X中的點(diǎn)的重要性,其值越大相應(yīng)的重要程度越高。利用點(diǎn)重要性的序列分段算法得到基于重要性的序列分段,分段方法如下:
a)輸入TAG序列和原始時(shí)間序列X,在領(lǐng)域L內(nèi)判斷其分段,記錄為CP。
b)對(duì)TAG序列中的每一個(gè)值ti,判斷ti≥K或者ti≤-K;滿足判定條件,則將xi記錄為分段點(diǎn),并得到有關(guān)序列分段點(diǎn)的CP序列。
由圖4可以發(fā)現(xiàn):在大約50個(gè)數(shù)據(jù)點(diǎn)之后,3個(gè)臺(tái)區(qū)的電壓數(shù)據(jù)發(fā)生了比較大的變化;因此考慮以12 h作為1個(gè)時(shí)間段(即48個(gè)數(shù)據(jù)點(diǎn)),研究在滑動(dòng)時(shí)間窗口下,不同臺(tái)區(qū)之間相關(guān)性系數(shù)的變化。為此提取3個(gè)臺(tái)區(qū)變壓器(2月1日至2月27日)由每天00:00至23:45的電壓數(shù)據(jù),利用時(shí)間窗口分析其相關(guān)性系數(shù)隨時(shí)間段的變化,得到如圖5所示的數(shù)個(gè)典型日的相關(guān)性變化曲線。
圖5橫坐標(biāo)以00:00為基準(zhǔn),1個(gè)數(shù)據(jù)點(diǎn)為15 min。由圖5可以看出:不同臺(tái)區(qū)在夜間的電壓數(shù)據(jù)其相關(guān)性系數(shù)可達(dá)到0.9以上;但隨時(shí)間逐漸下降,大約在第30點(diǎn)(即07:00)過后各臺(tái)區(qū)的相關(guān)性達(dá)到最低,然后又出現(xiàn)上升狀態(tài)。
上述分析表明:低壓用戶與臺(tái)區(qū)之間的連接關(guān)系可以由其電壓的相關(guān)系數(shù)來(lái)闡明;同時(shí),基于其相關(guān)性隨每日時(shí)間序列的變化,對(duì)電壓時(shí)間序列的分段分析是提高相關(guān)性分析過程準(zhǔn)確率的一種有效手段。因用戶電壓序列與臺(tái)區(qū)配變電壓序列十分相似,下述將以臺(tái)區(qū)配變電壓序列相關(guān)性為例進(jìn)行分析。
針對(duì)本案例所選的3個(gè)臺(tái)區(qū)電壓數(shù)據(jù)曲線(2月1日至2月27日),將B、C臺(tái)區(qū)與A臺(tái)區(qū)電壓數(shù)據(jù)進(jìn)行相關(guān)性分析,相關(guān)性系數(shù)見表3。
圖5 典型日相關(guān)性變化
由表3數(shù)據(jù)可知:根據(jù)設(shè)定的閾值,對(duì)于大部分的時(shí)間,序列分割時(shí)間法具有比較好的劃分能力;但是仍有部分時(shí)間內(nèi),B、C臺(tái)區(qū)與A臺(tái)區(qū)電壓數(shù)據(jù)的相關(guān)系數(shù)超過了閾值,這顯然是不正確的;因此考慮利用序列分段的方法,提高區(qū)分的正確性。
利用時(shí)間窗口法分析2月每天的相關(guān)性變化,取出其相關(guān)性系數(shù)最低值以及其出現(xiàn)時(shí)間,結(jié)果見表4。
根據(jù)表4繪出其最小值出現(xiàn)時(shí)間的直方圖如圖6所示(左圖表示B臺(tái)區(qū),右圖為C臺(tái)區(qū)),其中以1 h作為時(shí)間的分段,可發(fā)現(xiàn)大部分的相關(guān)性最低點(diǎn)都出現(xiàn)在05:00往后的時(shí)間段。對(duì)每日的相關(guān)性系數(shù)進(jìn)行比較得出:以05:00作為研究時(shí)段則其相關(guān)系數(shù)能保持在0.9之下,具有良好的辨識(shí)度;而對(duì)于該時(shí)段之前出現(xiàn)最小值的情況,進(jìn)一步研究可發(fā)現(xiàn)其出現(xiàn)時(shí)間為國(guó)內(nèi)節(jié)假日時(shí)期,可猜測(cè)節(jié)假日時(shí)期用戶用電習(xí)慣與平時(shí)不同是導(dǎo)致其電壓曲線出現(xiàn)差異的根本原因。
利用滑動(dòng)時(shí)間窗口分析可有效地提高基于相關(guān)性在鑒別用戶拓?fù)浞矫娴哪芰?,但是其運(yùn)算時(shí)間長(zhǎng),對(duì)于擁有龐大用戶數(shù)量的電網(wǎng)必然會(huì)出現(xiàn)計(jì)算量過大情況,而且時(shí)間長(zhǎng)度選擇的不科學(xué),也可能致使信息的冗余。
表3 每日數(shù)據(jù)相關(guān)性系數(shù)表
表4 2月份相關(guān)性系數(shù)最小值表
圖6 B、C臺(tái)區(qū)最小相關(guān)系數(shù)出現(xiàn)時(shí)間直方圖
為解決利用滑動(dòng)窗口分析時(shí)間過長(zhǎng)的問題,利用極值點(diǎn)分段算法對(duì)時(shí)間序列進(jìn)行分段分析,利用不同分段的相似性變化規(guī)律,提高相關(guān)性分析時(shí)的速度。選擇A臺(tái)區(qū)作為被比較臺(tái)區(qū),分析B、C臺(tái)區(qū)與A臺(tái)區(qū)之間的相關(guān)關(guān)系,分析結(jié)果見表5。
可見利用極值點(diǎn)分割算法同樣能夠區(qū)分序列中表現(xiàn)模式不同的分段,在一定程度上起到降低序列相關(guān)性,提高序列區(qū)分的能力。
與時(shí)間窗口分析法相比較,序列的分段分析同樣可以取出序列中表現(xiàn)有差異的時(shí)間段,并且具有更快的分析速度,但在分析工程中,并未直接比較序列以提取序段;因此,在分析相關(guān)性的下降程度上不如應(yīng)用滑動(dòng)時(shí)間窗口分析法。
表5 相關(guān)性分段分析表
本次案例分析利用python語(yǔ)言編寫,機(jī)器配置為3.6 GHz處理器、8 GB內(nèi)存以及windows 10系統(tǒng)。利用均值求取分析使用不同方法27 d內(nèi)計(jì)算相關(guān)性的耗時(shí),結(jié)果見表6。
表6 不同方法計(jì)算時(shí)間
結(jié)合表3—6可知:相比較利用全日數(shù)據(jù)分析,時(shí)間序列分段分析在計(jì)算耗時(shí)上增加并不多,但能夠起到有效提高區(qū)分過程準(zhǔn)確性的作用;滑動(dòng)時(shí)間窗口分析法在分析的準(zhǔn)確性上是最高的,但其耗時(shí)是分段分析方法的50倍,對(duì)于擁有數(shù)百萬(wàn)用戶的電網(wǎng)而言,其計(jì)算耗時(shí)太多,因而時(shí)間序列分段分析方法具有更好的應(yīng)用前景。為了完善其閾值選擇相對(duì)較高的缺陷,可設(shè)置雙閾值檢驗(yàn),對(duì)于準(zhǔn)確性在0.90至0.95之間可能存在誤判的少數(shù)用戶,利用判定閾值相對(duì)高的滑動(dòng)時(shí)間窗口進(jìn)行檢驗(yàn),則可以降低誤判的可能性和減少使用計(jì)算資源。
a)在低壓配電網(wǎng)中,位于同一線路的配變以及低壓用戶的電壓波形相近,利用皮爾遜系數(shù)可以判斷在臺(tái)區(qū)與低壓用戶之間的連接關(guān)系是否正確。
b)為了提高序列相似性計(jì)算過程的準(zhǔn)確性,需要對(duì)序列進(jìn)行分段;利用序列的趨勢(shì)變化模式、曲率、極值點(diǎn)等均可以將序列分為多個(gè)子片段,其中極值點(diǎn)保留了用戶變化信息,故其分段價(jià)值更大。
c)對(duì)比全日數(shù)據(jù)統(tǒng)計(jì)結(jié)果,利用滑動(dòng)時(shí)間窗口和基于極值點(diǎn)序列分段方法均可以提高相似性識(shí)別的準(zhǔn)確性,且具有更快的計(jì)算速度。