• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于熱重啟隨機梯度下降和一類支持向量機信息融合的戶變關系辨識方法

      2023-06-15 10:39:50馬洲俊牛軍偉孫國強臧海祥
      關鍵詞:查全率查準率臺區(qū)

      馬洲俊,黃 偉,牛軍偉,朱 紅,韋 磊,孫國強,臧海祥

      (1.國網(wǎng)江蘇省電力有限公司 南京供電分公司,江蘇 南京 210019;2.河海大學 能源與電氣學院,江蘇 南京 211100)

      隨著社會經(jīng)濟的大力發(fā)展和人民生活水平的提高,用電量增大,低壓臺區(qū)線損治理變得日益復雜[1]。為了加快智能電網(wǎng)的建設,充分挖掘配電側數(shù)據(jù)資源,提高供電服務質量和客戶滿意度[2-3],傳統(tǒng)的管理方式已經(jīng)不再適用,精益化管理方式成了一種新趨勢[4];然而,臺區(qū)在經(jīng)過線路改造和市政工程時經(jīng)常出現(xiàn)配變的增換,導致臺區(qū)間線路交叉,系統(tǒng)中戶變檔案未及時更新而出錯,嚴重制約著精益化管理[5]。

      為了解決上述臺區(qū)中存在的戶變關系檔案錯誤問題,電力公司主要通過人工排查,傳統(tǒng)的排查方法有現(xiàn)場停電校驗[6]和載波通信校驗[7]兩種?,F(xiàn)場停電校驗是通過使各個變壓器在短時間內(nèi)停電,然后抄讀電表停電記錄,再通過電表的停電時間來判斷各個電表的戶變關系,不過這種方式需要拉閘驗電,影響了人們正常的用電生活、用電體驗和供電可靠性。載波通信校驗方法是使用載波通信終端和用戶側接收端進行載波通信,通過分析報文特性來判斷戶變關系[8],該方法魯棒性較差,易受干擾,識別的準確率僅為70%~80%,不能夠在負荷波動較大的臺區(qū)進行。因此,研究一種可靠、自動的戶變關系辨識方法十分重要[9-10]。

      近年來,我國全面建設堅強智能電網(wǎng)[11],基本實現(xiàn)了臺區(qū)智能電表的全覆蓋,積累了大量的數(shù)據(jù)并且提升了采集數(shù)據(jù)的質量[12],為臺區(qū)拓撲結構的分析提供了基礎[13-15]。目前,已有大量學者對臺區(qū)戶變關系的識別進行研究,文獻[16]利用多個臺區(qū)的數(shù)據(jù),構建知識配電臺區(qū)圖譜體系來判斷戶變關系;文獻[17]通過皮爾遜相關系數(shù)和K(特征空間數(shù)量)最近鄰方法判斷戶變之間的電壓曲線相似性,從而進行戶變關系的辨識;文獻[18]提出了一種結合主成分分析和圖論的方法,利用節(jié)點間的相關性進行戶變關系識別。以上方法在戶變關系識別領域均取得一定的成績,但上述研究沒能實現(xiàn)物聯(lián)配電網(wǎng)理念下的信息物理的深度融合,只針對單一的特征信息進行戶變關系識別,缺少根據(jù)用戶多特征信息進行綜合判斷,沒能充分發(fā)掘出用戶側采集的數(shù)據(jù)價值,且對于海量的低壓臺區(qū),無法兼顧每個臺區(qū)的特點,適用性和有效性不高。

      在此背景下,綜合考慮用電量和電壓兩種特征信息,提出了一種基于用電量和電壓信息融合的戶變關系辨識方法,首先,提出了熱重啟隨機梯度下降法(SGDR),并應用于戶變關系識別,根據(jù)臺區(qū)總表用電量和用戶用電量守恒,構建臺區(qū)用電量參數(shù)化模型,利用隨機梯度迭代和學習率自調(diào)整方法求全局最優(yōu)解進行初步辨識,并利用滑動時間窗多次判斷得到初步戶變識別結果;然后,基于初步識別結果,使用戶變關系正常用戶的電壓數(shù)據(jù)構成訓練樣本,利用一類支持向量機(OC-SVM),學習臺區(qū)戶變關系正常用戶的電壓特征,構建戶變關系識別模型,得到最終戶變關系檔案錯誤的用戶,實現(xiàn)對低壓臺區(qū)戶變關系的正確辨識;最后,通過對實際臺區(qū)數(shù)據(jù)進行測試,結果表明所提方法可以對臺區(qū)戶變關系有效識別,驗證了該方法的實用性和可靠性。

      1 基于熱重啟隨機梯度下降的戶變關系識別

      電力系統(tǒng)臺區(qū)之間的交叉線路十分復雜,由于線路改造等原因,未及時更新臺區(qū)戶變關系檔案,可能存在不屬于該臺區(qū)的用戶,即戶變關系檔案出現(xiàn)錯誤[19],造成營銷計量系統(tǒng)中臺區(qū)總表用電量和用戶用電量不一致,出現(xiàn)臺區(qū)線損異常,因此要對戶變關系進行識別,重新調(diào)整檔案,有利于臺區(qū)線損的精益化管理。

      1.1 熱重啟隨機梯度下降法

      臺區(qū)用電量數(shù)據(jù)為累積量,可以反映戶變的邏輯加和關系[20],因此根據(jù)能量守恒定律建立關口表用電量和各用戶用電量之間的關系模型,如式(1)所示。

      (1)

      在同一臺區(qū)里,總線損和關口表總用電量是正相關的,而總的用電量是由各用戶用電量相加而成,其總線損在計算時可以近似分攤給各用戶,總線損由n個用戶的分線損組成,各個用戶的分線損與其用電量相關,如式(2)所示。

      (2)

      式中:bi為線損系數(shù),表示該用戶分線損在用電量中的占比,實際中bi近似為固定值。

      而ai和bi均為用電量系數(shù),可用ci=ai+bi簡化用電量系數(shù),式(1)可以簡寫成式(3)。

      (3)

      在用電量守恒的條件下,如果能找到一組數(shù)據(jù)使得式(3)成立,那么此時的ci表示的就是這個臺區(qū)正確的戶變關系。由于待求解方程式(3)維度較大,沒有固定的求解方法,只能用迭代求解的方法逼近可行解,常用的方法是以最小化方程組誤差的平方為目標函數(shù),使用梯度下降的方法逐漸逼近可行解。

      因此,構造目標函數(shù)E,即每個時間段臺區(qū)用電總量減去用戶用電量的平方和,如式(4)所示,當E最小時,ci即為模型的最優(yōu)解。

      (4)

      式中:Xt為第t天n個用戶構成的用電量矩陣;Cs為第s次迭代所對應的用電量系數(shù)矩陣。

      此時,基于用電量的戶變關系識別問題轉化為求解目標函數(shù)E最小值的優(yōu)化問題,使用熱重啟隨機梯度下降法[21]求解該問題,將隨機梯度下降優(yōu)化算法與熱重啟機制、余弦退火相結合,在保證較快訓練速度的前提下,反復重啟來促使模型快速收斂找到全局最優(yōu)解,從而在提高模型性能的同時也降低訓練成本。

      求解目標函數(shù)E對用戶用電量系數(shù)的梯度,如式(5)所示。

      (5)

      式中:X′t為修正后的第t天n個用戶構成的用電量矩陣。

      根據(jù)當前的步長和梯度方向,更新用電量的系數(shù),如式(6)所示。

      (6)

      式中:η為學習率。

      因為該模型的目標函數(shù)是多峰的,除了全局最優(yōu)解外還有多個局部最優(yōu)解,當陷入局部最優(yōu)時,通過熱重啟方式突然提高學習率η,離開局部最優(yōu)處,繼續(xù)尋找全局最優(yōu)解。余弦退火方法使用余弦函數(shù)作為周期函數(shù),在每個周期最大值時重新開始學習,一開始的學習率較大,模型不會陷入局部最優(yōu),而是快速尋找最優(yōu)解,隨著學習率變小,模型會最終收斂到最優(yōu)解處。熱重啟結合余弦退火的學習率調(diào)整公式如式(7)所示。

      (7)

      式中:j為迭代次數(shù);ηmax為學習率調(diào)整過程中的上限;ηmin為學習率調(diào)整過程中的下限;Tcur為每次重啟開始到結束這一區(qū)間學習率的迭代次數(shù);Tj為重啟周期,其學習率隨迭代次數(shù)自適應調(diào)整,如圖1所示[22]。

      圖1 熱重啟機制結合余弦退火的學習率變化

      綜上,即為基于用電量的熱重啟隨機梯度下降模型,迭代的終值Ci即為得出的戶變關系結果。

      1.2 基于滑動時間窗的多次判斷方法

      在第1.1節(jié)用電量模型的基礎上,每個用戶的用電量會受到隨機用電行為的影響,利用熱重啟隨機梯度下降法,若只在一個時間窗內(nèi)進行計算會產(chǎn)生較大的誤差,會遺漏識別戶變關系錯誤的用戶。因此,采用基于滑動時間窗的多次判斷方法,將歷史數(shù)據(jù)劃分為多個時間窗,每次取不同的起始日期進行多次求解,如圖2所示。

      Di為第i天的用戶用電特性

      為了避免因用戶用電特性差異導致的核查遺漏問題,每個時間窗進行優(yōu)化求解后得到一組戶變關系識別結果,然后將所有結果取并集,得到最終的戶變隸屬關系。

      2 信息融合的臺區(qū)戶變關系識別

      在識別臺區(qū)戶變關系檔案錯誤的用戶時,檔案錯誤的用戶數(shù)量應該相較于正常用戶占比非常少,這就屬于一個不均衡樣本數(shù)據(jù)。對不均衡樣本進行異常數(shù)據(jù)的檢測時,為了防止過擬合,不能采用二類的算法。因此,對臺區(qū)戶變關系的識別就屬于非均衡樣本數(shù)據(jù)分類或者是異常用戶的檢測,應采用一類的算法。

      2.1 基于一類支持向量機的戶變關系識別

      由于低壓臺區(qū)數(shù)量極多且每個臺區(qū)的用電信息特點不同,使用個別標注有正確戶變關系的臺區(qū)數(shù)據(jù)進行機器學習訓練得到的模型,無法適應所有臺區(qū)戶變關系檔案錯誤用戶的識別。因此,用來測試的數(shù)據(jù)集是不提供標簽的,識別的方法屬于無監(jiān)督學習方法。一類支持向量機(OC-SVM)是在傳統(tǒng)支持向量機基礎上,為解決一類問題所設計出的一種無監(jiān)督學習方法。OC-SVM會自動尋找能夠包含絕大多數(shù)原始數(shù)據(jù)的超平面,在超平面邊界外的數(shù)據(jù)會被判定為異常數(shù)據(jù)。

      OC-SVM將輸入的數(shù)據(jù)通過核函數(shù)映射到對應的特征空間中,利用特征空間的數(shù)據(jù)建立一個超平面,并最大限度將它們與原點分離,該算法利用決策函數(shù)f(x)評估測試樣本數(shù)據(jù)x落在特征空間中超平面的哪一側來確定其為正樣本或負樣本。為了從原點分離數(shù)據(jù)集,OC-SVM算法的實質為求解式(8)的二次規(guī)劃問題[23]。

      s.t.ωφ(xi)-ρ≥-ξiξi≥0

      (8)

      式中:ω為法向量;ν和l分別為用來調(diào)整比例上限和數(shù)量下限的參數(shù);ρ為截距;φ為非線性映射函數(shù);ωφ(xi)-ρ=0為超平面;‖·‖ 為歐幾里得范數(shù);ξi為松弛變量。

      由于ξi在目標函數(shù)中受到懲罰,使用ω和ρ來處理,決策函數(shù)f(x)可以表示為式(9)。

      f(x)=sgn(ωφ(x)-ρ)

      (9)

      f(x)對于訓練集中的大多數(shù)數(shù)據(jù)來說將是積極的,而支持向量類型的正則化項‖ω‖仍然很小。這兩個目標之間的實際權衡由ν控制。引入拉格朗日乘子(αi,βi≥0),可得式(10)。

      (10)

      分別對ω、ξ與ρ求偏導,并令其為0,可得式(11)。

      (11)

      {xi:i∈[l],αi>0}是支持向量,將其進行核展開,決策函數(shù)變?yōu)槭?12)。

      (12)

      將式(11)以及核函數(shù)k代入式(10),可將式(8)轉化為對偶問題,如式(13)所示。

      (13)

      決策函數(shù)中,ρ可由任何一個對應拉格朗日乘子αi非零的樣本xj求得,如式(14)所示。

      (14)

      則決策函數(shù)為

      f(x)=sgn(ωTφ(x)-ρ)=

      (15)

      對于決策函數(shù)f(x),當樣本x被分類器識別為該臺區(qū)用戶時,取值+1;被識別為異常用戶時,取值-1[24]。

      基于電壓信息判斷戶變關系的方法,使用的數(shù)據(jù)為用戶24 h(采集頻率為1 h/次)的電壓采樣數(shù)據(jù)Uij(j=1,2,…,24),根據(jù)不同臺區(qū)用戶電壓曲線之間的差異,利用OC-SVM方法,實現(xiàn)臺區(qū)戶變關系的識別。臺區(qū)用戶24 h的電壓曲線如圖3所示。

      圖3 某臺區(qū)用戶24 h的電壓曲線

      由圖3可以看出:臺區(qū)戶變關系正確用戶的電壓曲線具有相同的趨勢,錯誤用戶的電壓曲線則不同。選用用戶48 h的電壓采集數(shù)據(jù)作為算法的輸入數(shù)據(jù),既避免了用戶的隨機用電行為對戶變關系識別的影響,也會放大戶變關系正確用戶和錯誤用戶電壓曲線之間的差異。臺區(qū)用戶48 h的電壓曲線如圖4所示。

      圖4 某臺區(qū)用戶兩天的電壓曲線

      2.2 用電量和電壓信息融合

      考慮到OC-SVM法對異常值較為敏感,其訓練集樣本應盡可能不被異常值污染或含有較少比例的異常值數(shù)據(jù);然而,在無法準確獲取原始數(shù)據(jù)分布假設的情況下,實現(xiàn)高維度異常值檢測極具挑戰(zhàn)。此外,基于用電量的SGDR法進行戶變關系識別時,需要利用滑動時間窗進行多個時間段綜合判斷,但是其最優(yōu)時間窗選取難以確定;隨著時間窗個數(shù)增多,查全率和查準率無法兼顧,且計算時間成本增加。因此,提出了用電量和電壓信息融合的戶變關系識別方法,根據(jù)經(jīng)驗選取固定個數(shù)的時間窗,基于用電量信息,利用SGDR法進行戶變關系的初步識別,根據(jù)識別結果剔除異常用戶,以減少樣本中的異常值,提高OC-SVM法的識別率和準確率。

      基于用電量和電壓信息融合的戶變關系識別方法的流程如圖5所示。

      圖5 算法流程

      3 結果與討論

      為了驗證方法的準確性,選取江蘇省南京市下轄臺區(qū)2020年4月份用采系統(tǒng)中的用電量和電壓數(shù)據(jù)作為數(shù)據(jù)集,分別在模擬和真實場景中進行測試。

      3.1 SGDR方法算例結果

      3.1.1 SGDR在模擬場景下的測試

      在模擬場景中對熱重啟隨機梯度下降法進行測試,模擬場景中所用的數(shù)據(jù)都來自江蘇省南京市臺區(qū)A和B。臺區(qū)A原有103個用戶,提前經(jīng)人工排查確認不存在戶變關系錯誤,現(xiàn)從臺區(qū)B的非零電量用戶中隨機挑選4個放到臺區(qū)A中作為檔案出錯的用戶。使用查全率和查準率兩個指標來評價戶變關系識別方法的效果,兩個指標的計算如式(16)和(17)所示。

      (16)

      (17)

      基于SGDR的滑動時間窗多次判斷方法,將歷史數(shù)據(jù)劃分成多個時間窗,每次取不同的起始日期進行多次求解。而具體應該使用幾個時間窗進行綜合判斷,才能保證較高的查全率和查準率,這在實際每個臺區(qū)的戶變關系識別中是不確定的。因此,在模擬場景中選用了不同時間窗數(shù)量做測試,選用4月1日—4月6日為一個時間窗,4月2日—4月7日為一個時間窗,以此類推,對比查全率和查準率,測試結果如表1所示。

      表1 SGDR選用不同時間窗數(shù)量的測試結果

      由表1可以看出:選用5、6、7個時間窗測試的查全率都是100%,而選用3、4個時間窗的查全率不高,這是因為增加時間窗的個數(shù)進行綜合判斷,會盡可能把戶變關系錯誤的用戶識別出來,從而保證了查全率;但是選用的時間窗個數(shù)越多,其查準率也在逐漸下降,并且會造成戶變關系識別的時間成本增加。在實際應用中,選用多少個時間窗進行判斷得到效果最好是不確定的,所以只能根據(jù)經(jīng)驗選擇。根據(jù)表1的結果,為了能夠保證較高的查全率和查準率,之后測試選取的時間窗為6個。

      在實際應用中,戶變關系錯誤的用戶個數(shù)是隨機的,為了更真實的模擬實際情況,得到更具信服力的測試結果。因此,在測試過程中,從臺區(qū)B的非零電量用戶中,分別隨機挑選3、4、5個放到臺區(qū)A中,作為檔案錯誤的用戶,并且對檔案錯誤戶數(shù)不同的各種情況分別進行5次測試,最后取各自的平均查全率和平均查準率。模擬場景下的測試結果如表2所示。

      表2 模擬場景下5次測試的平均水平

      由表2可知:在模擬場景中,本文提出的熱重啟隨機梯度下降法在基于用電量的情況下,模擬場景可以達到約96.40%的查全率和91.80%的查準率。

      3.1.2 SGDR在實際場景下的測試

      在實際場景中,對基于熱重啟隨機梯度下降法進行測試,真實場景中所用的數(shù)據(jù)來自江蘇省南京市的臺區(qū)C、D和E。臺區(qū)C為某農(nóng)網(wǎng)臺區(qū),實際共2戶,現(xiàn)因戶變關系錯誤,有其他臺區(qū)的2個用戶。臺區(qū)D為某農(nóng)網(wǎng)臺區(qū),實際共6戶,現(xiàn)因戶變關系錯誤,有其他臺區(qū)的1個用戶。臺區(qū)E為某城網(wǎng)臺區(qū),實際共103戶,無戶變關系錯誤。下面利用SGDR算法進行臺區(qū)戶變關系校驗,測試結果如表3所示。

      表3 真實場景測試結果

      上述兩個農(nóng)網(wǎng)臺區(qū)測試的查全率和查準率都為100.0%,城網(wǎng)臺區(qū)的查全率為100.0%,查準率為99.0%,表明該方法在真實場景中具有一定的可行性。

      SGDR法在多次模擬場景中的測試結果表明:雖然會誤判致使查準率不高,但平均能達到96%以上的查全率,基本可以找出不屬于該臺區(qū)的用戶。在真實場景中也表明該方法有較高的查準率和查全率,可以配合人工糾正檔案關系,大大縮小人工排查范圍和提高工作效率。

      3.2 SGDR+OC-SVM方法與其他方法的比較

      在實際情況中,為了解決基于用電量的SGDR方法進行多個時間窗綜合判斷時,查全率和查準率的矛盾以及時間成本增加等問題,提出了基于用電量和電壓信息融合的戶變關系識別方法。為驗證方法的可靠性,同樣在模擬場景下做測試,場景與第3.1節(jié)相同,由于選用時間段數(shù)為5、6、7個時,使用SDGR方法得到的測試結果相同,因此,使用SDGR+OC-SVM方法做測試時,僅選取時間段數(shù)為3、4、5個,測試結果如表4所示。

      表4 選用不同時間段數(shù)的SGDR+OC-SVM測試結果

      由表4可知:使用SDGR+OC-SVM聯(lián)合判斷的方法,無論進行幾個時間段的判斷,查全率總能達到100%,并且查準率均在95%以上,平均查準率為96.7%,在實際情況中,對于臺區(qū)戶變關系的識別具有很高的適應性和可行性。

      同時,為了進一步說明提出的信息融合的戶變關系識別方法的有效性,將所提方法和其他方法進行對比。將SGDR法、OC-SVM法、孤立森林、傳統(tǒng)隨機梯度下降法的測試結果分別與SGDR+OC-SVM方法的測試結果進行比較,結果如表5所示。

      表5 不同方法測試結果比較

      由表5可以看出:基于SGDR+OC-SVM信息融合的戶變關系識別方法效果最好,不僅提高了查全率和查準率,在臺區(qū)戶變關系識別的魯棒性和可靠性上也很好,可以較好地應用于臺區(qū)戶變關系識別。

      4 結論

      為了充分利用配電網(wǎng)用戶側的海量數(shù)據(jù)資源,提高低壓臺區(qū)的精益化管理。基于采集的臺區(qū)用電量和電壓數(shù)據(jù),提出了一種用電量和電壓信息融合的臺區(qū)戶變關系識別糾錯方法。對實際臺區(qū)數(shù)據(jù)進行測試,得到以下結論:

      1)對單個臺區(qū)進行戶變關系辨識,本文方法的查全率能達到100%,查準率能達到96%以上,提高了戶變關系識別的有效性和效率。

      2)基于用電量和電壓數(shù)據(jù)聯(lián)合進行戶變關系識別,達到了信息融合和充分利用配電側數(shù)據(jù)資源的目的,提高了辨識結果的可靠性。

      3)聯(lián)合SGDR和OC-SVM對戶變關系進行辨識糾錯,既解決了基于SGDR方法求解戶變關系模型進行多個時間段聯(lián)合判斷時查全率和查準率的矛盾以及時間成本增加的問題,又解決了訓練樣本中異常數(shù)據(jù)的比例對OC-SVM模型識別準確度的影響。

      猜你喜歡
      查全率查準率臺區(qū)
      海量圖書館檔案信息的快速檢索方法
      基于數(shù)據(jù)挖掘技術的網(wǎng)絡信息過濾系統(tǒng)設計
      基于詞嵌入語義的精準檢索式構建方法
      大數(shù)據(jù)環(huán)境下的文本信息挖掘方法
      降低臺區(qū)實時線損整治工作方法
      電子制作(2017年2期)2017-05-17 03:55:22
      基于深度特征分析的雙線性圖像相似度匹配算法
      三合一集中器作為臺區(qū)線損考核表計的探討
      多功能低壓臺區(qū)識別設備的研制
      提升臺區(qū)線損正確可算率的措施與實踐
      中文分詞技術對中文搜索引擎的查準率及查全率的影響
      弋阳县| 绥芬河市| 常州市| 平度市| 天镇县| 怀集县| 东方市| 耒阳市| 长宁县| 滦南县| 富锦市| 陵川县| 班戈县| 怀远县| 阳山县| 嘉峪关市| 福鼎市| 嘉禾县| 桦南县| 抚远县| 富锦市| 民乐县| 鹿泉市| 枞阳县| 石狮市| 永登县| 西丰县| 吕梁市| 凭祥市| 临邑县| 拉萨市| 合山市| 甘南县| 阳高县| 资阳市| 巴彦淖尔市| 五河县| 额尔古纳市| 罗定市| 河北省| 钟祥市|