• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于自適應分段聚合近似的戶變關系聚類識別方法

      2023-03-15 02:56:14尹善耀肖毅許曉春任洪男何奕楓
      廣東電力 2023年2期
      關鍵詞:電表臺區(qū)聚類

      尹善耀,肖毅,許曉春,任洪男,何奕楓

      (1.南方電網(wǎng)廣東惠州供電局,廣東 惠州 516003;2.杭州沃瑞電力科技有限公司,浙江 杭州 310012)

      近年來,隨著經(jīng)濟的發(fā)展和城市化進程的不斷推進,低壓臺區(qū)的用戶數(shù)量增長迅速,導致網(wǎng)絡結構愈加復雜,加之大量施工改造導致臺區(qū)戶變關系變動頻繁,但因為排查效率低,臺區(qū)管理檔案中的信息未能及時更新,造成部分用戶的真實戶變關系與檔案記載不相符的情況發(fā)生[1-3]。正確的戶變關系是負荷平衡管理、臺區(qū)線損計算以及線路改造等業(yè)務開展的保障[4-5],因此戶變關系識別成為一個亟待解決的關鍵問題。

      現(xiàn)場停電校驗和載波通信校驗[6-7]是當前一線工作中常用的2種方式,均需要人工現(xiàn)場排查?,F(xiàn)場停電校驗方式需要對現(xiàn)場線路拉閘驗電,會影響居民用電,目前無法大范圍實施。載波通信校驗方式對硬件設備要求較高,且載波通信易受到噪聲干擾,在波動較大的臺區(qū)效果不好。

      隨著配電網(wǎng)用戶信息采集系統(tǒng)的完善和用戶側(cè)智能電表的安裝和普及,電力公司能夠獲取到如電壓、電流、用電量等海量電氣數(shù)據(jù),這為開展基于數(shù)據(jù)驅(qū)動的配電臺區(qū)戶變關系識別研究提供了信息基礎[8-9]。文獻[10]根據(jù)電壓數(shù)據(jù)的時間和空間相關性分別訓練2個分類器,通過計算各智能電表與每個分類器的歸屬概率判定臺區(qū)歸屬關系;文獻[11]通過整合低壓臺區(qū)信息系統(tǒng)數(shù)據(jù)構建臺區(qū)圖譜體系,從中挖掘戶變關系信息;文獻[12-15]通過皮爾遜相關系數(shù)判斷戶表之間的電壓序列曲線相似性,從而得到戶變關系結論;文獻[16]根據(jù)高級量測體系(advanced metering infrastructure,AMI)提供的配電臺區(qū)各耦合節(jié)點電壓和電流,進行戶變關系分析;文獻[17]利用K-Means聚類對采集到的電壓時序數(shù)據(jù)進行聚類分析,得到戶變關系情況;文獻[18-19]采用灰色關聯(lián)方法計算用戶與臺區(qū)變壓器二者的電壓數(shù)據(jù)相似度,由此識別用戶所屬的臺區(qū)及相位;文獻[20]采用離散弗雷歇距離比較電表之間的電壓曲線相似度,從而形成準確的戶變關系;文獻[21]使用主成分分析(principal component analysis,PCA)法對數(shù)據(jù)降維,而后采用模糊C均值聚類法辨識臺區(qū)電壓與用戶的關系;文獻[22]首先利用深度學習提取諧波譜特征,然后利用皮爾遜相關系數(shù)計算用戶與配電變壓器(以下簡稱“配變”)低壓側(cè)之間的相關程度,實現(xiàn)臺區(qū)與相位的雙重識別。綜上發(fā)現(xiàn),同一臺區(qū)下的用戶電壓曲線波動具有一定的相似性,可據(jù)此進行臺區(qū)戶變關系識別研究。

      本文依據(jù)臺區(qū)變壓器和用戶電壓曲線相似性的原理,采用自適應分段聚合近似(adaptive piecewise aggregate approximation,APAA)算法[23-24]和譜聚類算法實現(xiàn)戶變關系識別。相較于分段聚合近似(piecewise aggregate approximation,PAA)算法,APAA算法在特征提取過程中增加了形狀特征和變化趨勢的分析,提高了特征提取的精確度。依據(jù)零均值標準化和APAA算法降維得到的結果,利用譜聚類算法將具有高相似度的變壓器和用戶電壓曲線聚成一類,實現(xiàn)臺區(qū)戶變關系的智能識別。

      1 電壓時序數(shù)據(jù)特征提取

      1.1 電壓數(shù)據(jù)標準化

      研究用戶與臺區(qū)變壓器電壓之間的關系是基于歷史數(shù)據(jù),本文使用的電壓數(shù)據(jù)由智能電表采集而來,采用插值法對電壓數(shù)據(jù)缺失值進行處理后得到原始電壓矩陣

      (1)

      式中:N為用戶端和配變端對應的電表總數(shù);l為電表采集的電壓數(shù)據(jù)連續(xù)時段長度;ui,t為電表i在t時刻的電壓測量值。U的行向量U′i表示單個電表i在每一時刻的電壓測量值,列向量U″t表示所有電表在t時刻的電壓測量值。

      由于原始電壓數(shù)據(jù)間差異相對較小且分布相對集中,直接進行數(shù)據(jù)特征提取的效果可能不佳。為了提高后續(xù)特征提取以及聚類算法的結果精度,采用標準化方法對原始電壓數(shù)據(jù)進行預處理。數(shù)據(jù)標準化處理常用的方法有小數(shù)定標標準化、最大/最小值標準化、零均值標準化等[25]。本文采用零均值標準化方法,通過調(diào)整參數(shù)能夠達到放大數(shù)據(jù)間差異并保持其分布特性的效果,標準化后的矩陣

      (2)

      其中

      (3)

      1.2 APAA算法提取特征

      1.2.1 APAA與PAA的區(qū)別

      APAA是PAA的改良算法。PAA是用低維序列數(shù)據(jù)近似表示高維序列數(shù)據(jù)的方法,將高維序列數(shù)據(jù)平均分成若干連續(xù)的子序列數(shù)據(jù)段,對每一子序列數(shù)據(jù)段求取均值后用均值取代子序列數(shù)據(jù)段,從而達到降維效果。整個過程可表示為:

      (4)

      (5)

      (6)

      采用PAA算法雖然能夠起到降維效果,但由于對每個子序列數(shù)據(jù)段進行無差別均值化處理,導致部分子序列數(shù)據(jù)段內(nèi)的重要數(shù)據(jù)特征信息丟失,其結果不能很好地代替原高維序列數(shù)據(jù)。APAA算法從數(shù)據(jù)變化趨勢的角度分析每一子序列數(shù)據(jù)段,由具體限定條件決定特征提取結果,結果可分為2種:一是保留該段整體數(shù)據(jù),二是依照PAA算法進行降維。

      1.2.2 特征提取條件

      (7)

      (8)

      對于N個電表,在該子序列數(shù)據(jù)段內(nèi),電壓爬坡事件數(shù)

      (9)

      在子序列數(shù)據(jù)段內(nèi),電表i標準化后t時刻電壓與t-1、t+1時刻電壓線段斜率分別為k1、k2,將二者的差值與閾值ε相比較,判斷電表i在t時刻是否存在電壓波動事件βi,t,定義:

      (10)

      在子序列數(shù)據(jù)段的左右邊界時刻不進行電壓波動事件判斷,電表i在子序列段中的電壓波動事件總數(shù)βi為除邊界時刻外的其余時刻電壓波動事件和。對于N個電表,在該子序列數(shù)據(jù)段內(nèi),電壓波動事件數(shù)

      (11)

      1.2.3 APAA算法具體步驟

      利用APAA算法對標準化后電壓矩陣進行重構具體過程如下。

      步驟2:輸入閾值γ和ε,計算每個子序列矩陣的電壓爬坡事件數(shù)α和電壓波動事件數(shù)β。

      步驟3:輸入閾值δ和η,若α<δ、β<η則表明該段數(shù)據(jù)變化特征不明顯,不具有提取價值,利用每一電表該段數(shù)據(jù)的均值取代原數(shù)據(jù),將該段維數(shù)降為1;反之,說明該段數(shù)據(jù)包含重要變化特征,保留原有數(shù)據(jù)。

      步驟4:計算現(xiàn)有數(shù)據(jù)集維度,若維度達到預期效果ζ,則轉(zhuǎn)至步驟5,若維度未達到預期效果,則轉(zhuǎn)至步驟2,重新調(diào)整閾值γ和ε的大小,當二者可選調(diào)整數(shù)值均遍歷后,數(shù)據(jù)維度仍未達預期效果時轉(zhuǎn)至步驟3,重新調(diào)整閾值δ和η的大小。

      2 基于譜聚類的戶變關系識別算法

      2.1 譜聚類算法

      譜聚類算法源于圖論思想,將所有數(shù)據(jù)看作空間中的點,將數(shù)據(jù)之間的關系看作點與點之間邊的權重,從而構建出整個關系圖。若兩數(shù)據(jù)間關系緊密,則二者邊的權重值較大,反之較小,由此可通過切圖的方式,使子圖間邊的權重和盡可能低,子圖內(nèi)邊的權重和盡可能高,每一子圖即為1個類別,從而達到聚類目的。本文采用譜聚類算法的具體步驟如下。

      步驟1:利用高斯核函數(shù)構建電表間的關系圖,即權重矩陣W。

      (12)

      步驟3:計算L的特征值和特征向量,并將特征值由小到大排列,取前f個特征值,將其對應的f個特征列向量ξ1,ξ2,…,ξf組成矩陣Y=[ξ1ξ2…ξf]。

      步驟4:記Y的行向量分別為y1,y2,…,yf,依次對每一行向量進行單位化處理后按原位置重新構成矩陣Q。

      步驟5:以Q的每一行向量為1個f維樣本,將p個樣本作為K-Means算法的輸入,聚類數(shù)同樣設定為f,進行聚類。

      步驟6:輸出聚類結果。

      2.2 戶變關系識別算法流程

      低壓臺區(qū)戶變關系識別整體流程如圖1所示。

      圖1 戶變關系識別算法流程

      3 算例驗證及分析

      本文以中國南方電網(wǎng)有限責任公司用電信息采集系統(tǒng)獲取的廣東省惠州市下轄的某3個臺區(qū)(A、B、C)的用戶數(shù)據(jù)作為輸入進行算例分析。算例數(shù)據(jù)的采樣間隔為1 h,時間跨度為連續(xù)20 d,A、B、C這3個臺區(qū)下分別有80、20和40個用戶(3個臺區(qū)變壓器低壓側(cè)統(tǒng)一當作相應臺區(qū)下用戶處理)。本章首先驗證最佳聚類數(shù)是否與實際臺區(qū)數(shù)相符,檢查數(shù)據(jù)的準確性;然后運用APAA以及譜聚類算法對該數(shù)據(jù)集進行戶變關系識別;接著將本文所提方法與其他方法就戶變關系準確率進行比較,證明本文所提方法的優(yōu)勢。

      3.1 聚類評價指標

      聚類評價指標是對聚類結果進行定量分析的必要數(shù)據(jù),本文從聚類的有效性和準確性入手,采用Silhouette(SIL)、Calinski-Harabasz(CH)、Davies-Bouldin index(DBI)、adjusted rand index(ARI)和Fowlkes Mallows index(FMI)這5種指標來進行聚類結果評價,其中前3種指標用于評價聚類有效性,后2種指標用于評價聚類準確度。

      3.1.1 SIL指標

      對于單個樣本c的SIL指標值ISIL,c,其計算公式為

      (13)

      式中:e1為該樣本到同類別中其余樣本的平均距離;e2為該樣本到類別最近的所有樣本的平均距離。樣本集的SIL指標值為該樣本集下所有單個樣本SIL指標值的算數(shù)平均值,取值范圍為[-1,1],其值越接近1說明聚類效果越好。

      3.1.2 CH指標

      CH指標通過計算類中各點與類中心的距離平方和構建類內(nèi)離差矩陣度量類內(nèi)緊密度,通過構建類間離差矩陣度量類間分離度。其指標值ICH計算公式為

      (14)

      式中:Bz和tr(Bz)分別為類間離差矩陣和其對應的的跡;Wz和tr(Wz)分別為類內(nèi)離差矩陣和其對應的跡;z為類別個數(shù)。ICH越大代表類自身越緊密,類與類之間越分散,即聚類結果最優(yōu)。

      3.1.3 DBI

      DBI用于計算類內(nèi)距離之和與類外距離之比,其值IDBI的計算公式為

      (15)

      式中:so、sj分別為第o類和第j類中所有樣本到其聚類中心的平均距離;Moj為第o類與第j類聚類中心的距離;q為類別個數(shù)。IDBI越小,聚類效果更佳。

      3.1.4 ARI

      ARI是RI(rand index)基于概率正則化的一種改進。RI計算的是聚類結果和實際信息對應對中聚類準確對數(shù)占所有對應對的比例。采用RI的期望值和最大值來修正RI,從而得到ARI值IARI的計算公式

      (16)

      式中:IRI為RI值;E(IRI)為其期望值;max(IRI)為其最大值。IARI的取值范圍為[-1,1],其值越接近1說明聚類準確率越高。

      3.1.5 FMI

      FMI將召回率和準確率結合在一起,其值IFMI的計算公式為

      (17)

      式中:NTP為聚類結果與實際信息均為同一類的樣本個數(shù);NFP為聚類結果為同一類但實際信息不為同一類的樣本個數(shù);NFN為實際信息為同一類但聚類結果不為同一類的樣本個數(shù)。FMI關注分類正確與分類錯誤樣本間的相對比例,取值范圍為[0,1],其值越接近1說明聚類準確率越高。

      3.2 驗證最佳聚類數(shù)與降維效果

      本文采用肘部法則[26]來測試驗證最佳聚類數(shù)。肘部法是基于K-Means聚類算法的聚類數(shù)預計算,不同的聚類數(shù)測試值v對應不同的成本函數(shù)值。成本函數(shù)值

      (18)

      式中:Cj為第j個聚類簇;xi為Cj中任一樣本;cj為Cj的聚類中心。

      隨著v的增加,每類樣本數(shù)減少,樣本距其聚類中心的距離減小,平均畸變程度降低。在v值增大過程中,成本函數(shù)下降幅度變化最大的位置即為肘部,對應的v值即為最佳聚類數(shù)。圖2所示為不同聚類數(shù)測試值下的成本函數(shù)值。

      圖2 不同聚類數(shù)測試值下的成本函數(shù)值

      由圖2可知,當v=3時,成本函數(shù)值曲線變化幅度最大,故根據(jù)肘部法則,最佳聚類數(shù)為3。通過將其與樣本進行比對后發(fā)現(xiàn),最佳聚類數(shù)與樣本臺區(qū)數(shù)剛好吻合,故在進行算例分析時,譜聚類中聚類數(shù)設定為3。

      本文依據(jù)交叉驗證的思想進行參數(shù)調(diào)節(jié),特征提取部分的參數(shù)調(diào)節(jié)設定如下:每個子序列數(shù)據(jù)段包括的數(shù)據(jù)點數(shù)m的選定范圍為8~24,步長為4;子序列數(shù)據(jù)段最大差值閾值γ的選定范圍為0.5~3,步長為0.2;電壓爬坡事件數(shù)閾值δ的選定范圍60~130,步長為7;子序列電壓線段斜率閾值ε的選定范圍為3~6,步長為0.3,電壓波動事件數(shù)閾值η的選定范圍為500~800,步長為20;預期維度ζ的選定范圍為94~98,步長為1。經(jīng)過交叉驗證后,確定輸入?yún)?shù)如下:m=12、γ=1.5、δ=109、ε=4.5、η=600、ζ=95。

      對數(shù)據(jù)集歸一化處理后,從3個臺區(qū)各取出2個用戶數(shù)據(jù),歸一化后波動曲線如圖3所示,分別采用PAA算法和APAA算法得到其歸一化后波動曲線,如圖4、圖5所示。

      圖3 不同臺區(qū)用戶電壓波動曲線

      圖4 PAA降維后用戶電壓波動曲線

      圖5 APAA降維后用戶電壓波動曲線

      由圖3—5可知,原6個用戶的480維數(shù)據(jù)經(jīng)PAA算法后降為40維,經(jīng)APAA算法后降為95維。與原始數(shù)據(jù)相比,經(jīng)PAA算法降維后的曲線效果不佳,而經(jīng)APAA算法降維后仍較好地反映了曲線形態(tài)特征及變化規(guī)律。

      3.3 算例結果

      3.3.1 戶變關系識別結果

      譜聚類過程中聚類數(shù)f設定為3,高斯核函數(shù)參數(shù)σ設定為0.1。本文識別結果為:B臺區(qū)識別出20戶且全部識別正確,A臺區(qū)中一用戶錯誤識別到C臺區(qū),C臺區(qū)中一用戶錯誤識別到A臺區(qū)。本文算法結果與實際情況比較見表1。

      表1 戶變關系識別結果

      3.3.2 不同算法結果對比分析

      綜合比較本文算法、K-Means算法、PAA與譜聚類組合算法,以及PCA與使用層次結構的平衡迭代減少和聚類(balanced iterative reducing and clustering using hierarchies,BIRCH)組合算法這4種算法的性能,以證明本文算法所提算法的準確性。每種算法均重復聚類10次,并取該10次指標結果的平均值為最終結果,以保證算法比較的客觀性,結果見表2。

      表2 不同算法識別性能對比

      從聚類的有效性指標來看,PAA與譜聚類的結合算法與其他算法綜合相比,ISIL與ICH更大,IDBI更小,聚類效果更佳;原因是降維程度大,導致樣本差異大的部分易被忽略,從而縮短樣本間距離,提高了聚類效果,但不能保證良好的準確性。從聚類的準確性指標來看,APAA和譜聚類的結合算法最佳,較其他算法提高程度較大。

      綜合來看,APAA和譜聚類結合算法明顯優(yōu)于其他算法,APAA算法充分考慮了各時間段的電壓變化特征,特征提取效果更佳,在提升聚類效果的同時可提升聚類結果的準確性。

      3.4 不同采樣間隔和噪聲下戶變關系識別分析

      在工程實際中,由于地域不同,不同臺區(qū)電表數(shù)據(jù)的采樣間隔也不同,并且電表采集數(shù)據(jù)時普遍存在噪聲影響,導致精度各有偏差。本文從這2個方面入手,分析所提算法在采樣間隔和噪聲影響下的聚類有效性和準確性。

      分別將采樣間隔設定為1 h、2 h、4 h和8 h,并為所有電壓測試量額外增加標準高斯分布噪聲,測得的結果見表3。

      表3 不同采樣間隔和噪聲下的性能對比

      對比3.3節(jié)與3.4節(jié)結果可知,本文所提算法能有效克服小噪聲的干擾,聚類有效性和準確性均不受影響。

      4 結論

      針對低壓配電變壓器臺區(qū)廣泛存在戶變關系不準確的問題,本文提出基于自適應分段聚合近似和譜聚類算法的戶變關系智能識別方法。該方法具有以下特點:

      a)采用APAA算法能夠達到準確描述電壓曲線形態(tài)特征和降低數(shù)據(jù)維度的效果,降低后續(xù)聚類算法的計算量,節(jié)省算力成本。

      b)結合圖論思想,采用譜聚類算法度量電壓序列間的相似性,自動進行戶變關系識別。聚類算法不僅分析了臺變和用戶電壓序列之間的相似性,還分析了用戶電壓序列之間的相似性,使聚類結果更加準確。

      c)本文所提算法在不同采樣間隔和噪聲下均具有良好的性能指標,且在一定的采樣間隔范圍內(nèi),識別準確率能夠保持不變,算法穩(wěn)定性強。

      但本文所提算法仍有一定的改進空間,其研究對象為僅安裝單相電表的用戶臺區(qū),未考慮具有三相四線電表的情況,未能更加全面地反映現(xiàn)實臺區(qū)的復雜情況。未來將結合該點對所提方法作進一步改進和完善。

      猜你喜歡
      電表臺區(qū)聚類
      巧判電表測量對象
      電表“對”與“錯”歸類巧掌握
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      看電表
      降低臺區(qū)實時線損整治工作方法
      電子制作(2017年2期)2017-05-17 03:55:22
      基于改進的遺傳算法的模糊聚類算法
      一種層次初始的聚類個數(shù)自適應的聚類方法研究
      三合一集中器作為臺區(qū)線損考核表計的探討
      多功能低壓臺區(qū)識別設備的研制
      提升臺區(qū)線損正確可算率的措施與實踐
      枣庄市| 广饶县| 维西| 三门峡市| 南京市| 收藏| 射阳县| 九龙城区| 寿光市| 卢湾区| 贞丰县| 新安县| 财经| 常熟市| 城口县| 长治县| 固始县| 碌曲县| 德化县| 陆川县| 兰州市| 集安市| 阿勒泰市| 无锡市| 新平| 涞源县| 灌云县| 乌恰县| 云林县| 平谷区| 涿鹿县| 海淀区| 武乡县| 忻州市| 潞城市| 沈丘县| 常宁市| 樟树市| 闵行区| 淮阳县| 罗江县|