程軍照,徐敏,馮磊,劉虹吟,李晨,郭祚剛
(1. 云南電網有限責任公司電網規(guī)劃建設研究中心,昆明 650011;2. 南方電網科學研究院,廣州 510663)
供電可靠性指標是供電企業(yè)供電能力和服務質量的直接反映,是配電網規(guī)劃運維水平的重要考察指標之一。提高配電網供電可靠性不僅是電力行業(yè)發(fā)展的大勢所趨, 更是發(fā)展新型電力系統的強烈需要[1-3]。可靠性水平的合理設置和評價,決定了能否實現電網合理投資和有效激勵。如果可靠性評價過于嚴苛,會導致目標難以實現,資源投入浪費;可靠性評價過于寬松,則不利于電網運行水平的提高。因此,挖掘影響供電可靠性的關鍵因素,對不同地區(qū)的可靠性水平進行準確的評價,對于電網建設及管理具有重要指導意義。
在制定地區(qū)配電網可靠性發(fā)展目標時,應綜合考慮可靠性影響因素,對不同地區(qū)制定不同評價標準。配電網規(guī)劃導則中,針對不同負荷密度地區(qū)提出了不同的供電可靠性要求,文獻[4]進一步指出,不同地區(qū)配電網發(fā)展水平、發(fā)展階段各有差異,應選擇合適的供電可靠性改善措施和方案實現配電網的經濟投資。文獻[5-6]主要通過經濟、負荷等方面的多項指標,對區(qū)域進行網格劃分,實現差異化管理和規(guī)劃。然而,隨著新型電力系統的發(fā)展,影響供電可靠性的因素愈發(fā)復雜多樣化,需要進行更為全面的綜合考慮。
目前鮮見統籌各類因素進行區(qū)域可靠性水平評價的研究,對影響因素中經濟等外部因素,目前也缺乏有效的數學建模方法[7-9]。近年來隨著IT技術、信息采集存儲技術成熟發(fā)展,灰色關聯算法(grey relation analysis, GRA)和K-means 聚類算法廣泛應用于電氣領域中。文獻[10-12]從規(guī)劃和運維層面,選取多個常見的供電可靠性影響因素,采用GRA 算法量化這些因素的影響程度。但上述研究僅探討因素的影響程度,既缺乏對外部因素的考慮,也未涉及可靠性水平的目標設定與評價。文獻[13-14]研究了基于K-means 的負荷分類方法,提煉用戶日負荷曲線之間的共性特征與差異特征,對用電習慣相似的用戶進行劃分,文獻[15]基于Kmeans 進行負荷分類,并根據聚類結果劃分用戶群體,對不同的群體提出了差異化電價方案,文獻[16]提出了基于K-means 聚類算法的電能表評價方法,根據分類指標對不同廠商的電能表進行聚類,針對性對各類廠商的電能表質量進行評價。上述研究均能較好實現對象的聚類,進而進行差異化目標制定和評價。然而原始K-means 算法可能會由于初始聚類中心過近而導致算法收斂到次優(yōu)解,文獻[17]在此基礎上提出了K-means++算法,該算法采用一種特殊的概率分布選取聚類中心以確保聚類集群的分散性,從而改善了原算法的不足。
因此,本文提出了一種基于GRA-K-means++算法的可靠性水平評價方法。通過構建供電可靠性綜合影響因素集,并采用GRA 量化外部因素、電網規(guī)劃運維因素對地區(qū)可靠性水平的影響程度,應用K-means++算法模型對影響可靠性的外部因素進行加權聚類,實現外部條件相近地區(qū)的聚合和分類,提出偏移距離指標以差異化地評價地區(qū)可靠性水平;最后,評價地區(qū)的電網規(guī)劃運維因素水平,針對性地提出地區(qū)供電可靠性的提升方向。
地區(qū)電網規(guī)劃部門進行規(guī)劃時,通常采用供電可靠性指標RS-3 衡量供電可靠程度,即在統計期間內,不計系統電源不足限電時,對用戶有效供電時間總小時數與統計期間小時數之比。RS-3主要受兩方面的因素影響:1)電網所處地區(qū)的外部因素。即無法通過自身管理和技術的干預進行調控的因素,其決定了規(guī)劃運維的難度,據此可對地區(qū)可靠性水平進行合理評價。2)電網因素。即配電網在規(guī)劃和運行過程中,從不同角度制定表征配電網特性的技術指標。這些指標體現地區(qū)電網在外部客觀條件下的運行水平,電網公司可通過規(guī)劃或運維措施完善,從而提高供電可靠性。
供電可靠性的外部因素構成了電網規(guī)劃運維的基礎條件,充分挖掘這部分因素與供電可靠性的聯系,有利于確定地區(qū)可靠性建設條件,從而差異化評價地區(qū)可靠性水平。對供電可靠性影響較大的外部客觀因素主要有地區(qū)經濟特征、地區(qū)用戶特征和新型電力系統要素3個方面。
地區(qū)經濟特征反映了地區(qū)自身的發(fā)展水平。一方面,地區(qū)經濟特征可通過地區(qū)的產業(yè)結構表現,具體包括第一產業(yè)、第二產業(yè)、第三產業(yè)生產總值比例等指標,不同產業(yè)對供電可靠性的要求不同。另一方面,地區(qū)經濟特征也體現為該地區(qū)的科技發(fā)展水平,科技水平的提高使得該地區(qū)電網部門在對電網建設、管理投入同等資金時能夠取得更高的收益,具體可由單位電量經濟效益和人均GDP 等指標進行衡量。
地區(qū)用戶特征可以采用負荷密度來表征,根據《中低壓配電網改造技術導則》[18]規(guī)定,地區(qū)電網供電分區(qū)可按負荷重要程度和負荷密度從高到低可依次劃分為A+類、A 類、B 類、C 類、D 類、E 類,各分區(qū)劃分方法如表1所示。
表1 供電分區(qū)劃分原則Tab.1 Principle of division of power supply areas
新型電力系統中的柔性負荷為電網的調度提供了更多的可能性,使其有機會更好地應對電網中的各種風險[19-21]。
綜上所述,外部因素可提煉為表征地區(qū)經濟特征的產業(yè)結構與科技發(fā)展水平因素指標、表征地區(qū)用戶特征的供電分區(qū)因素指標以及表征新型電力系統要素特點的柔性負荷比例。
供電可靠性的電網因素指標受電網公司調控,表征配電網的規(guī)劃、運行水平,可分為電網規(guī)劃水平和電網運維水平兩個方面。
地區(qū)規(guī)劃水平主要包括網架結構水平、設備水平等方面因素。比如對線路進行多分段,可在發(fā)生故障時避免大范圍失電,減少停電影響的用戶數,進而提升供電可靠性。合理地設置線路聯絡,提高線路的線路聯絡率和可轉供電率,能避免故障點下游用戶陷入長時間停電。而選擇典型接線方式可以有效提高配電網的管理效率。提高網架的配電自動化覆蓋率,可以快速有效隔離故障區(qū)間,避免大面積停電。同時,采用絕緣導線或電纜線路,能夠一定程度避免部分外部因素導致的停電,降低線路的故障率。新型電力系統通過接入智能軟開關、能量路由器、固態(tài)變壓器、新型換流器等柔性可控智能裝備,能提高電能的輸送和分配效率,并有助于電力系統對電網事件的準確識別和迅速響應,從而有效提高供電可靠性。
地區(qū)的運維水平主要指運維效率,即平均預安排停電時間與平均故障修復時間。平均預安排時間體現了地區(qū)電網運維班組對電網進行日常檢修的效率,平均故障修復時間體現了地區(qū)電網運維班組對電網進行故障修復的效率,運維班組工作效率越高,其維護區(qū)域的用戶的停電時間越短,在故障發(fā)生時能夠有效減少停電時間,從而提高供電可靠性。新型電力系統中接入的新能源增加了電網的不確定性,同時增加了電網運維的難度。
綜上所述,電網因素方面主要從網架結構水平、設備水平、運維效率等多個方面選取不同因素指標。綜合考慮外部因素與電網運維規(guī)劃因素,從供電分區(qū)比例、國民經濟水平、網架結構水平、設備水平、運維效率、線路負載水平等方面,選取共計25 個影響因素作為供電可靠性綜合影響因素集,如表2所示,以此作為灰色關聯算法的輸入。
表2 供電可靠性綜合影響因素集Tab.2 The set of comprehensive influencing factors of power supply reliability
為了分析供電分區(qū)面積比例、地區(qū)產業(yè)結構和地區(qū)科技發(fā)展水平對電網規(guī)劃管理的影響,建立外部因素指標體系后,引入GRA-K-means++算法,通過量化權重和聚類分析,研究各因素與可靠性指標之間的關聯性,對外部條件相近的地區(qū)進行劃分并評價其可靠性水平。對于可靠性水平評價偏低地區(qū),為明確可靠性提升方向,精準制定電網公司改善可靠性的措施,還需要結合電網因素指標關聯度進一步進行量化分析。
基于GRA-K-means++算法的配電網供電可靠性水平評價方法主要流程步驟如圖1所示。
圖1 基于GRA-K-means++算法的可靠性水平評價模型Fig.1 Model of reliability level evaluation based on GRA-Kmeans++ algorithm
灰色關聯分析模型可根據大量數據樣本中指標數據變化情況,獲取指標間的關聯程度,無需進行繁瑣復雜的建模和仿真過程,即可實現對不同指標間關聯程度的量化[22-25]。為了綜合量化因素集中各因素與可靠性指標之間關聯性的強弱,本文建立灰色關聯分析模型,研究各指標間的關聯度,具體計算過程如下。
1) 序列數據無量綱化處理
以各地區(qū)可靠性指標組成參考序列,其他指標作為若干比較序列。為了消除各個指標量綱不同造成的影響,在進行量化分析時,對每個序列的數據進行MIN-MAX 歸一化處理。歸一化后的數據分布在0到1之間。
2) 依據地區(qū)面積設立樣本權重
灰色關聯算法默認各樣本的重要程度是等價的,事實上,面積較大地區(qū)相比于面積較小地區(qū)更具有統計學意義,因此需參考地區(qū)的供電面積確定地區(qū)樣本的權重。設共有m個地區(qū),樣本權重計算如下:
式中:ωi為第i個地區(qū)樣本的樣本權重;Si為第i個地區(qū)的面積。
3) 計算各指標樣本的關聯系數
設每個地區(qū)有n個待分析的可靠性影響因素指標,則關聯系數為:
式中:ξi(k)為第i個地區(qū)的第k個指標的關聯系數;Ri為第i個地區(qū)歸一化后的可靠性RS-3 指標值;xi(k)為第i個地區(qū)的第k個指標歸一化后的值;ρ為分辨系數,用來減弱最大值過大導致關聯系數失真的影響,以提高關聯系數之間的分辨力,ρ取值區(qū)間為(0,1),本文取值為0.5。
4) 計算關聯度
關聯度的計算公式為:
式中r(k)為第k個指標的關聯度。
關聯度r(k)反映了第i個比較序列與參考序列在整體上的接近程度。指標的關聯度r(k)越大,表明該指標與可靠性指標關聯程度越大。對外部指標因素、電網指標因素分別進行灰色關聯分析,即可得到指標各自的關聯度,以此作為精準定位電網運維規(guī)劃薄弱點的依據。
K-means 是機器學習中最為常用的聚類算法之一,能夠實現樣本空間中相近樣本的無監(jiān)督聚類,具有直觀、算法時間復雜度低等優(yōu)點[26-28]。Kmeans++算法在K-means 聚類的基礎上,提出了新的聚類中心選取方法,改進了K-means 聚類可能存在次優(yōu)解收斂的缺點。其聚類步驟如下。
1)設置指標權重
設外部因素指標有n1個,xi=[xi(1),xi(2),xi(3),…,xi(n1)]為第i個地區(qū)歸一化后的外部指標向量。K-means++聚類算法默認任何指標信息同等重要,事實上,由于指標與地區(qū)可靠性的關聯程度不同,其信息參考價值也不同,即指標本身的信息熵不同,因此有必要為各指標設置合適的組合權重。
(1)依據GRA指標關聯度求取指標權重
不同外部因素對供電可靠性影響程度不同,指標與供電可靠性關聯越密切,其影響程度越大,在綜合評價中比重也應越大。故以指標灰色關聯度作為其中一個權重W1(k)。
(2)依據熵權法求取指標權重
香農在信息論中指出,若某指標的信息熵越小,表明指標數值的變異程度越大,所提供信息量也越大,該指標在綜合評價中起的作用也應該越大,需要為該指標賦予越大的權重。所以在進行Kmeans++聚類分析分析之前,根據指標數據所含信息熵確立另一指標權重W2(k),計算方法如下。
式中:xi(k)為歸一化后第i個地區(qū)第k個指標的指標數據;Pi(k)為第i個地區(qū)下第k個指標所占比重;e(k)為第k個指標的熵值;g(k)為第k個指標的差異系數;W2(k)第k個指標的熵權法權重;n1為外部指標個數。
(3)計算綜合權重。結合熵權法權重和灰色關聯度權重,計算第k個指標的綜合權重系數W(k)。
2)對樣本指標加權,即求取權重向量與歸一化后的指標向量的Hadamard乘積。
式中xi′=[xi′(1),xi′(2),xi′(3),…,xi′(n1)] 為帶權重的地區(qū)樣本第i個指標向量;xi=[xi(1),xi(2),xi(3),…,xi(n1)]為未帶權重的地區(qū)樣本第i個指標向量;W=[W(1),W(2),W(3),…,W(n1)]為權重向量。
3)假設將m個地區(qū)劃分為L個類群,首先選擇初始聚類中心,具體方法如下。
(1)從數據集中隨機地選擇一個中心點c1。
(3)重復上述步驟,直到L個中心點被選擇。
4) 針對數據集中每個樣本xi′,計算其到L個聚類中心的距離,并將該樣本分到距離最小的聚類中心所對應的類別中。
5) 針對每個類別,重新計算屬于該類的所有樣本的質心,即新的聚類中心。
式中:cp為Kp的聚類中心;Kp為第p個聚類集;kp為Kp集中樣本的數量。
6) 重復步驟4、5,直至兩次迭代間簇內誤差平方和(within-cluster sum of squared errors,SSE)下降量小于0.0001。
簇內誤差平方和SSE 是指每個樣本與其最近之聚類中心之間的均方根距離,即:
7) 設置不同的聚類族群數L會得到不同的聚類結果,為了確定最接近真實分類情況的聚類族群數,可繪制SSE-L值圖。SSE 會隨著L的增大單調遞減,然而,當L小于真實聚類數時,增大L會使SSE 值急速下降;當L大于真實聚類數時,增大L時SSE 值的下降幅度會明顯減少。當SSE-L值函數曲線出現明顯拐點時,表明當前L值接近于最優(yōu)的真實值。進一步地,通過圖像拐點附近的輪廓系數S(xi′)確定最優(yōu)L值,即:
式中:a(xi′)為簇內距離;b(xi′)為簇間距離;Kq為Kp以外使得簇間距離最小的聚類集。
可見,輪廓系數取值范圍為[-1,1],其越趨近于1 代表聚類結果的內聚度和分離度越優(yōu),即分類效果越好。故繪制拐點附近L值的平均輪廓系數-L值圖以及輪廓圖,選取平均輪廓系數最高的L值作為本模型的聚類族群數。
對于同類地區(qū),其可靠性建設難度相近,指標聚類中心即同類樣本的中心點,代表了外部條件相近地區(qū)該指標的平均水平??疾焯囟ǖ貐^(qū)指標值與同類其他地區(qū)的指標中心距離,即可精準衡量地區(qū)在電網的建設管理上的水平和差距。當xi′∈Kp時,設Ri為xi′對應地區(qū)的可靠性指標值,定義可靠性的指標偏移距離為地區(qū)可靠性指標與同類其他地區(qū)可靠性指標中心的距離,即:
式中di(R)為地區(qū)i的可靠性指標偏移距離,其值為正則代表該地區(qū)可靠性水平優(yōu)于同等條件的其他地區(qū);其值為負則代表該地區(qū)可靠性水平不如同等條件的其他地區(qū)。借助di(R)即可對地區(qū)的可靠性作出差異化的合理評價。
此外,還可通過電網指標因素進一步考察其電網建設管理薄弱點,提出相應的改善措施??紤]到不同電網指標因素對供電可靠性重要程度不同,以GRA 模型所得的關聯度為權重,依次計算指標的偏移距離,設n2為電網指標個數,yi=[yi(1),yi(2),yi(3),…,yi(n2)]為第i個地區(qū)歸一化后的電網指標向量,則電網指標偏移距離計算公式如下。
式中:di(k)為地區(qū)i的第k個電網指標的偏移距離;權重系數r(k)為基于GRA 算法得到的相應指標關聯度。最后根據偏移距離di(k)的排序,篩選偏移距離絕對值較大的指標,指標偏移距離絕對值越大代表該地區(qū)相應因素的建設管理水平與其他地區(qū)差距越大,可考慮采取一定措施提升或降低相應指標以實現該地區(qū)可靠性的提升。
選取某地區(qū)下屬14 個縣級電網數據進行配電網供電可靠性水平研究,以該地區(qū)供電可靠性數據作為參考序列{x0(k)|k=1,2,…,14}。選取表2的24 個影響因素,生成25 個比較序列{xi(k)|k=1,2,…,14;i=1,2,…,25},構建供電可靠性影響因素集。
將以上參考序列與比較序列進行MIN-MAX 歸一化。計算面積權重系數如表3所示。
表3 地區(qū)面積權重設置(部分)Tab.3 Regional area weight setting(partly)
結合面積權重,根據樣本分別計算外部因素指標與電網因素指標的灰色關聯度如表4—5所示。
表4 可靠性影響外部因素關聯度Tab. 4 Relevance of reliability influencing external factors
表5 電網因素關聯度Tab. 5 Power grid factor correlation
由表4—5 可知,通過考慮權重的灰色關聯度分析,外部因素中與可靠性關聯程度較高的因素有柔性負荷占比、第二產業(yè)比例、第三產業(yè)比例等。電網因素中與可靠性關聯程度較高的因素有可轉供電率、絕緣化率、新能源接入容量占比等。該結論與直觀經驗相符,說明關聯度分析結果基本準確。
綜合指標的信息熵和灰色關聯度,求取Kmeans++聚類的綜合權重,結果如表6所示。
表6 K-means聚類指標權重系數Tab.6 K-means clustering index weight coefficient
根據權重的指標數據進行K-means++聚類,生成不同聚類數的簇內誤差平方和,繪制SSE-L 曲線,如圖2所示。
圖2 SSE-L值變化圖Fig.2 SSE response of L
可見,SSE 曲線在L=3 時出現了明顯的拐點,繪制拐點附近的輪廓圖以及平均輪廓系數-L值圖,如圖3、圖4所示。
圖3 L=2,3,4,5時的輪廓圖Fig.3 Silhouette diagram at L=2,3,4,5
圖4 平均輪廓系數-L值變化圖Fig.4 Average silhouette score response of L
圖3 的輪廓圖中,各形狀的寬度表示分類簇中包含的實例數,形狀的長度表示簇中地區(qū)的已排序輪廓系數,虛線表示整體平均輪廓系數。圖4 表示平均輪廓系數與L值的變化規(guī)律,可以看到,當L值為3 時,整體輪廓系數最高,故最終選取L值為3?;贙-means++算法對地區(qū)進行三分類,每個類別中的各地區(qū)即為外部條件相近的地區(qū)。對于每個類別,分別計算每類地區(qū)中可靠性的偏移距離,結果如表7所示。
表7 各地區(qū)可靠性指標偏移距離Tab. 7 Offset distance of reliability index in each region
從表7 中可以看到,地區(qū)5、地區(qū)4、地區(qū)9 的可靠性偏移距離較大,說明以上地區(qū)可靠性水平在同等條件地區(qū)中較高;而地區(qū)8、地區(qū)12、地區(qū)2、地區(qū)7 的可靠性指標偏移距離為負且絕對值較大,說明以上地區(qū)可靠性水平在同等條件地區(qū)中處在較低水平。
對于可靠性水平評價偏低的地區(qū),可進一步挖掘其原因和改造措施。其中,類別3 中的地區(qū)7 的偏移距離為負且絕對值較大,為-0.858 6,以灰色關聯分析結果為權重,依次計算地區(qū)7 的指標偏移距離,如表8所示。
表8 地區(qū)7的指標偏移距離Tab.8 Indicator offset distance for region 7
可見,地區(qū)7 的配電自動化覆蓋率、典型接線比率、線路平均分段數、平均預安排停電時間偏低,新能源接入容量占比偏高。其中,新能源接入容量占比偏移距離為0.372 2,說明該地區(qū)相比同類型地區(qū)接入了較多新能源。此外,典型接線比率指標與配電自動化覆蓋率的負偏移距離較大,分別為-0.292 2 和-0.283 6,說明該地區(qū)與同類型地區(qū)的典型接線率和自動化覆蓋率的差距較大。由此可見,為了有效提升該地區(qū)的供電可靠性水平,在配電網規(guī)劃改造過程中,應著重完善中壓網架結構,采用典型接線方式,并通過配網自動化改造,加強對新能源的監(jiān)控,加強配電網的控制與保護。
針對現有配電網供電可靠性水平評價不深入、對相關因素考慮不全面且部分相關因素難以通過傳統方法建模分析的情況,本文提出了一種基于GRA-K-means++算法的配電網供電可靠性水平評價方法。主要工作和結論如下。
1) 綜合分析地區(qū)外部因素、電網規(guī)劃與運維因素等多個影響因素,構建了全面、有效的供電可靠性影響因素集,所選指標既能反映地區(qū)的經濟特征和用戶特征,又能充分表征電網規(guī)劃建設、運維管理水平,為差異化地評價供電可靠性水平以及提出提升配電網供電可靠性方法提供了理論依據。
2) 計及地區(qū)供電范圍,挖掘供電可靠性影響要素與供電可靠性關聯程度。通過含權重的灰色關聯分析,揭示各因素對供電可靠性的影響程度,分析表明,對供電可靠性影響程度較高的外部因素有柔性負荷占比、第二產業(yè)比例、第三產業(yè)比例等。對供電可靠性影響程度較高的電網因素有可轉供電率、絕緣化率、新能源接入容量占比等。
3) 根據外部因素指標的差異為其設置組合權重,采用K-means++算法對地區(qū)電網進行帶權重聚類,隨后根據同類地區(qū)中電網可靠性指標的差異對地區(qū)可靠性水平作出合理評價。
根據影響因素關聯度分析,精準挖掘電網建設、管理中導致地區(qū)電網可靠性偏低的主要原因,可有效指導該地區(qū)可靠性提升方向。
4) 通過實際地區(qū)電網的算例,證明所提方法的有效性和可行性。