• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于LSSVM的用戶異常用電行為辨識研究

      2021-07-21 03:18:28梁廣明黃水蓮
      青海電力 2021年2期
      關鍵詞:臺區(qū)用電量用電

      梁 捷,梁廣明,黃水蓮

      (1. 廣西電網(wǎng)有限責任公司計量中心,廣西 南寧 530023;2.南寧百會藥業(yè)集團有限公司,廣西 南寧 530003)

      0 引言

      在電力系統(tǒng)中,惡意竊電或計量設備故障會導致用戶用電數(shù)據(jù)質(zhì)量下降〔1〕。此外,低壓臺區(qū)表計等設備的故障目前主要由客戶自行發(fā)現(xiàn)和報修,電力客服再安排現(xiàn)場工作人員進行處理,這一方面增加95598業(yè)務量,另一方面處理周期長,易導致客戶投訴。為了辨識出異常用電的用戶或故障電表,需進行用電數(shù)據(jù)異常識別。目前常見的主動識別方法是通過在計量自動化主站采用人工方法排查異常數(shù)據(jù),存在計量數(shù)據(jù)管理工作負擔重,且異常數(shù)據(jù)識別效率低的問題。

      文獻〔2〕首先通過嶺回歸模型對用電數(shù)據(jù)進行訓練,然后將訓練好的模型用于異常用電行為的自動檢測。但回歸模型訓練時若建模參數(shù)選擇不當,易出現(xiàn)過擬合的問題。對此,本文提出了一種基于最小二乘支持向量機(Least Square Support Vector Machine,LSSVM)的用戶用電異常識別模型。它首先通過LSSVM算法對用戶的用電狀態(tài)進行分類,然后將相應的分類結果與典型低壓用戶用電異常指標進行匹配,最后通過案例分析驗證了本文算法的可行性。

      1 用電異常特征分析

      南方電網(wǎng)費控電能表目前支持低壓居民用戶多種類型用電數(shù)據(jù)的自動采集并上傳到計量主站。計量主站可實時監(jiān)控并存儲各用戶的電流、電壓、有功/無功功率以及功率因數(shù)等信息〔3〕。當用戶正常用電時,這些用電數(shù)據(jù)以時間序列的格式存儲在計量主站中,數(shù)據(jù)具有一定規(guī)律性,例如表碼連續(xù)平穩(wěn)增加,電壓圍繞額定值小幅上下波動等;當用戶用電行為不正常時,電表采集到的用電數(shù)據(jù)通常會出現(xiàn)某些數(shù)值突變,或波形中出現(xiàn)明顯峰谷等異常特征〔4〕,這里電力客服關注的用電異常原因主要是未查明的計量設備故障和用戶的竊電行為等。

      本文建立了包含4種特征指標的用電異常行為典型特征庫I,用于在大量數(shù)據(jù)中區(qū)分出存在異常用電行為的用戶及其異常出現(xiàn)的時段,其定義如下:

      (1)I1表示用電量突變指標,表示當前和歷史用電數(shù)據(jù)之間的差距,定義為最近α天用電量除以最近β個月的平均用電量,即:

      (1)

      其中:α、β和T分別為當前待分析的日、月和小時時間段數(shù),j∈α,l∈β,k∈T;mi為第i個用戶的用電數(shù)據(jù)。

      (2)I2表示單位用電數(shù)據(jù)采集時間片內(nèi)用電數(shù)據(jù)變化的指標,定義為當前用電數(shù)據(jù)采集時間片內(nèi)用電量與歷史同期用電數(shù)據(jù)采集時間片內(nèi)平均用電量的差距,即:

      (2)

      其中:v代表歐氏距離,不同v值的差異表示絕對用電量之差。

      (3)I3表示具有類似特征的用戶之間用電數(shù)據(jù)差別的指標,定義為在單位時間段內(nèi),當前用戶i的用電數(shù)據(jù)與具有類似特征的用戶集群之間的差距,即

      (3)

      其中:Ri表示與用戶i具有相似特征的用戶集,r∈Ri。

      (4)I4表示具有“候鳥”特征的用戶用電數(shù)據(jù)差別的指標,定義為在I4特征周期內(nèi),當前用戶i的用電數(shù)據(jù)與具有“候鳥”典型特征的用戶集群之間的差距。

      “候鳥”用戶多為外出務工人員,其特征為每年春節(jié)等長假前后,該類用戶中的外地務工人員像“候鳥”一樣返鄉(xiāng),形成用電高峰,其他時候的用電空窗期用戶家中無人或僅有留守老幼??梢?,該類用戶的月用電量均值僅在每年的1~3月春節(jié)期間達到用電量高峰,同時負荷出現(xiàn)正常波動,其余月份無用電或用電量極少。據(jù)此,本文選擇用戶用電量時間序列數(shù)據(jù)集的月均值和月標準差作為異常識別的特征指標,以月為I4特征周期對待分析數(shù)據(jù)集中各個特征指標ni進行提取。

      I4根據(jù)原始用電數(shù)據(jù)的上述特征指標。以歐氏距離作為相似測度,即

      (4)

      其中:Rq表示“候鳥”典型特征用戶集,可通過用戶抽樣調(diào)查確定,p∈Rq。

      2 基于客戶標簽的數(shù)據(jù)清洗

      由于異常用電行為識別的原始數(shù)據(jù)來源于電網(wǎng)公司計量自動化主站的自動抄表數(shù)據(jù),可能存在數(shù)據(jù)采集缺失,采集異常(零電量,負值或個別偏離曲線過遠的異常點)等數(shù)據(jù)質(zhì)量問題。其中零電量采集異常表現(xiàn)為整個時間段內(nèi)用電量為0或缺失嚴重,其原因主要包括候鳥用戶等特殊用戶的空窗期,現(xiàn)場檢修或計劃停電,欠費停電或欠費停電但繳費后系統(tǒng)未自動復電,表計失壓、失流、斷相、功率因數(shù)過低、電流極性接反等表計故障,時鐘超差,檔案不一致等計量終端故障,或者進戶線等計量設備故障等四個方面的非竊電情況,以及竊電情況。

      值得注意的是,對這些采集異常的數(shù)據(jù),無法通過它判斷用戶的用電異常與否,且這些數(shù)據(jù)若直接作為異常識別模型的輸入數(shù)據(jù),還可能增加訓練難度,影響模型的識別準確性。為了通過數(shù)據(jù)分析辨識出反竊電等客服關注的信息,需通過數(shù)據(jù)清洗來提高數(shù)據(jù)的可用性。數(shù)據(jù)清洗包括檢查數(shù)據(jù)一致性,處理異常值和缺失值等步驟,缺失值、負值以及偏離曲線過遠的異常值處理參考文獻〔5〕。根據(jù)零電量異常的各種情況,本文針對該類異常值給出如下方案進行數(shù)據(jù)清洗:

      (1)讀取客戶標簽:客戶標簽包括該類用戶的戶號、電能表編號、購電記錄、運維記錄、所屬區(qū)縣、線路和臺區(qū)等用于確認客戶身份的信息,同時確定分析時間范圍。

      (2)分類甄別:a.從營銷信息系統(tǒng)導出或由運維人員提供停電數(shù)據(jù),匹配客戶標簽,確定停電影響的用戶和時段范圍,在后續(xù)處理中將其排除。必要時可將該部分異常用戶數(shù)據(jù)以文件形式導出,然后依據(jù)用戶標簽,通過人工復檢的方式來判斷該用戶是否異常。若發(fā)現(xiàn)零電量異常值并不屬于計劃停電或檢修停電,可以將其設定為待分析故障進入下一步。b.類似a過程核對剩余電量和購電記錄,客戶該時段情況的查詢結果為“欠費停電”則排除,若客戶實際電費余額不為零且有欠費停電操作,則分析為“系統(tǒng)未自動復電”,若查詢結果為客戶電費余額為零,且無欠費停電操作則進入下一步。c.根據(jù)“候鳥”用戶特征指標,通過本文第1節(jié)“候鳥”特征指標和本文LSSVM模型識別出是否屬于候鳥用戶。d.類似a過程識別已知的故障用戶,即結合系統(tǒng)監(jiān)測到的信息,例如配電線路或配電變壓器是否發(fā)生過載或失壓的情況,以及近期計量故障運維工單信息識別出是否屬于計量設備故障。

      (3)數(shù)據(jù)修正:對上述a、b和c類和其他不屬于上述類別的異常數(shù)據(jù)進行刪除。對d類數(shù)據(jù),按故障時段取同期時段的平均值補全。

      3 基于支持向量機的電力數(shù)據(jù)異常識別

      用戶用電異常行為識別從數(shù)據(jù)挖掘理論的角度可視作對用戶用電狀態(tài)的分類問題。但隨著用電異常行為典型特征庫I的完善,數(shù)據(jù)異常識別時對所有用戶逐一計算各指標時工作量較大。故本文基于用戶用電信息,首先利用LSSVM建立異常用電識別模型,然后通過該模型對各用戶的用電狀態(tài)開展快速異常識別。該識別的目的是根據(jù)用戶數(shù)據(jù)樣本曲線間的相似程度將數(shù)據(jù)進行初步篩選,根據(jù)當前數(shù)據(jù)與歷史數(shù)據(jù)的差距大小辨識出正常和異常的數(shù)據(jù)。

      異常用電識別模型的輸入是用戶用電數(shù)據(jù)。與其他分類方法相比,支持向量機的優(yōu)點是對輸入空間和訓練集的維數(shù)不敏感,故本文模型基于LSSVM算法,其基本原理如圖1。

      圖1 LSSVM的基本原理

      在圖1中,實心點和空心點分別表示正常和異常用電數(shù)據(jù)的特征點。H是分類面。H1和H2分別是通過最接近分類面且平行于正常和異常數(shù)據(jù)特征點的直線。H1和H2之間的距離稱為分類邊距。支持向量機的目標是找到最佳分類面,使正常和異常數(shù)據(jù)點集之間的差距最大。分類面方程如下:

      (wx)+b=0

      (5)

      其中:x是用電數(shù)據(jù)的特征點,w,b是分類平面方程系數(shù)。

      LSSVM進行異常識別,研究對象為歷史日訓練特征樣本集(x1,x2,...,xn),g,h∈n。為找到最優(yōu)分類面,使其對所有樣本均能夠正確分類且距離之和最小,應滿足以下條件:

      yg[(wx)+b]≥1

      (6)

      其中:yg為用電數(shù)據(jù)的序列標簽。由圖1可知,分類邊距為2/‖w‖,則問題變?yōu)橐允?7)為目標函數(shù),式(6)為約束的優(yōu)化問題:

      minΦ(w)=1/2‖w‖2

      (7)

      為了求解該問題,由Lagrange乘數(shù)法,建立輔助函數(shù)L

      L=1/2‖w‖2-a{y[(w·x)+b]-1}

      (8)

      式中:a>0為Lagrange算子。為了使得該模型與歷史數(shù)據(jù)的結果差距最小,本文采用最小二乘法對模型進行訓練,目的是確定模型參數(shù)w*和b*。最小二乘法通過尋找該模型不同參數(shù)下的最小方差以獲得最優(yōu)模型參數(shù)〔6〕。由于上述二次規(guī)劃問題的約束最優(yōu)解必然使得在該鞍點處對w和b的偏導為0,則由線性規(guī)劃的對偶理論,該問題的對偶問題如下:

      (9)

      (10)

      對偶問題的優(yōu)化解為

      (11)

      a*對應的參數(shù)值為

      (12)

      (13)

      則可得最優(yōu)分類函數(shù)為

      f(x)=sgn{w*·x+b*}

      (14)

      其中:sgn函數(shù)返回一個0~1整型變量,表示識別模型輸入的用戶用電數(shù)據(jù)是否異常。

      綜上,本文用戶異常用電識別的主要步驟如下:

      (1)根據(jù)異常用電用戶識別的目的和用電信息采集平臺的大數(shù)據(jù)來源,將所獲取的用戶用電量測數(shù)據(jù)分為訓練樣本與測試數(shù)據(jù),構建LSSVM識別模型的輸入數(shù)據(jù)集,并調(diào)整該模型的輸入數(shù)據(jù)種類和數(shù)據(jù)密度,確定最終的特征輸入數(shù)據(jù)集,以平衡算法性能和識別準確度需求。

      (2)數(shù)據(jù)清洗。按第2節(jié)所述對缺失點和異常值進行處理。

      (3)根據(jù)歷史數(shù)據(jù)對LSSVM模型進行訓練,確定最優(yōu)分類函數(shù),然后根據(jù)該函數(shù)將測試數(shù)據(jù)分辨出異常數(shù)據(jù)組;

      (4)從異常數(shù)據(jù)組中提取各類數(shù)據(jù)的特征曲線,根據(jù)專家經(jīng)驗和聚類理論分析其與前文介紹的四類指標的匹配情況,判別是否存在用電異常行為。

      4 案例分析

      4.1 識別結果分析

      為驗證本文算法的有效性,以廣西某地市的三個低壓居民臺區(qū)為測試樣本。該樣本包括945個用戶1 095天用電量的真實數(shù)據(jù)。根據(jù)本文方法進行異常識別,結果見表1。

      表1 樣本數(shù)據(jù)清洗和異常識別結果

      由表1可見:根據(jù)本文第2節(jié)方法對原始測試樣本中的異常數(shù)據(jù)進行分類甄別后,各臺區(qū)的有效樣本規(guī)模均下降,平均下降幅度約為13 %,有利于排除正常用戶,減少后續(xù)用電行為異常檢測的誤差;各臺區(qū)中臺區(qū)1具有候鳥特征的用戶數(shù)占比較高,達到19.6 %,其它兩個小區(qū)的該類用戶均不超過10 %,結合客戶標簽和臺區(qū)信息,占比情況與臺區(qū)1是商業(yè)樓盤,臺區(qū)2和3是企事業(yè)單位的職工生活小區(qū)的實際情況相符;對各臺區(qū)的測試樣本,本文方法均能有效辨識出異常用電用戶,辨識結果示例見圖2。

      圖2 本文算法辨識結果示例

      圖2為本文LSSVM算法辨識結果示例,其中黑線為案例中某用電正常用戶的月用電量曲線,紅線為某異常用戶的曲線。從圖2可見,用電正常用戶的月用電量曲線整體的變化趨勢較為平穩(wěn),波動較小,使得用電量突變指標較??;而用電異常用戶的用電曲線月初為較小的值,但月中旬突然出現(xiàn)較大的用電量波動,用電量突變指標較大,故辨識為異常。查詢營銷系統(tǒng)發(fā)現(xiàn)該用戶月中旬有換表記錄,進一步調(diào)查發(fā)現(xiàn),用電異常的原因是換表時更新客戶檔案有誤,系統(tǒng)檔案中的表編號與實際不符造成的。

      為比較不同異常識別算法的區(qū)別,定義分類準確度評價指標γ如下:

      (15)

      其中:NTP、NTY、NFP、NFY分別表示算法正確識別的異常電表、正確識別的正常電表、錯誤識別的異常電表、錯誤識別的正常電表數(shù)量。

      圖3為k-NN算法〔7〕、隨機森林(RF)算法〔8〕和所提LSSVM算法對同一樣本集的分類準確度。由圖3可見,與k-NN和RF算法相比,本文算法的分類精度比k-NN和RF算法分別高出約4 %和5 %。由于本文算法區(qū)別于文獻〔8〕的人工智能算法,不涉及隨機搜索過程,優(yōu)化質(zhì)量不受隨機測度的影響,同時區(qū)別于文獻〔7〕的k-NN算法,優(yōu)化結果不受到k值初始取值的影響。本文方法理論基礎堅實,故能獲得更好的分類效果。

      圖3 不同算法的分類精度

      4.2 執(zhí)行效率分析

      為比較不同算法的執(zhí)行效率,采用文獻〔7-8〕和本文算法對上節(jié)的樣本集進行用戶用電數(shù)據(jù)異常識別。圖4為不同算法被執(zhí)行10次過程中每次執(zhí)行所用的計算時間。

      圖4 不同算法的執(zhí)行用時

      由圖4可見,識別相同數(shù)目的電表,本文方法與文獻〔7-8〕中的方法相比,算法的平均執(zhí)行時間可分別節(jié)省約7 %和40 %。本文提出的識別算法基于最小二乘支持向量機算法,該方法算法的復雜性主要取決于輸入向量的數(shù)目,受樣本空間的維數(shù)影響較小。本文方法在形成輸入樣本前對樣本規(guī)模做了控制,使算法在二次規(guī)劃問題求解時的矩陣的階數(shù)在可以承受的范圍內(nèi),故LSSVM算法與其他兩種算法,尤其是與基于隨機人工智能搜索的RF算法相比具有較高的執(zhí)行效率。

      5 結論

      研究了一種基于最小二乘支持向量機的低壓用戶用電異常識別模型。通過利用LSSVM算法區(qū)分電力量測量數(shù)據(jù)是否存在異常,并將異常數(shù)據(jù)組的特征數(shù)據(jù)與典型用戶用電異常指標進行匹配,有利于數(shù)據(jù)運維人員及時發(fā)現(xiàn)惡意竊電或計量設備故障。案例分析結果表明,該算法具有較高的分類精度和執(zhí)行效率。如何推廣本文算法的適用范圍和建立更豐富的典型異常用電特征庫,值得進一步研究。

      猜你喜歡
      臺區(qū)用電量用電
      用電安全
      02 國家能源局:1~7月全社會用電量同比增長3.4%
      01 國家能源局:3月份全社會用電量同比增長3.5%
      用煤用電用氣保障工作的通知
      安全用電知識多
      用電安全要注意
      1~10月全社會用電量累計56552億千瓦時同比增長8.7%
      降低臺區(qū)實時線損整治工作方法
      電子制作(2017年2期)2017-05-17 03:55:22
      2014年全社會用電量
      三合一集中器作為臺區(qū)線損考核表計的探討
      松潘县| 尚义县| 施甸县| 昆山市| 栖霞市| 神木县| 分宜县| 健康| 怀化市| 玛曲县| 隆尧县| 大冶市| 双峰县| 潮州市| 庄河市| 汝阳县| 商都县| 桑植县| 抚州市| 鹿邑县| 牡丹江市| 葵青区| 瑞安市| 承德县| 海宁市| 翁源县| 青州市| 黔西| 重庆市| 尖扎县| 观塘区| 三门峡市| 扶沟县| 乐亭县| 沙湾县| 邵阳县| 兴山县| 灵武市| 焦作市| 南雄市| 永和县|