蔡 毅,廖紹成,楊 培,李 璟,郭 倩,趙立美
(1.國網(wǎng)浙江新昌縣供電有限公司,浙江 紹興 312500;2.中國計量大學 機電工程學院,杭州 310018;3.浙江華云信息科技有限公司,杭州 310008)
電力工業(yè)是關系國計民生的基礎性產(chǎn)業(yè),現(xiàn)代電能計量是電力用戶與供電單位之間的結算依據(jù),因此,對電能計量異常分析與處理就愈發(fā)重要[1-2]。計量異常報警是用電信息采集系統(tǒng)的一個重要功能模塊,異常報警功能對用電現(xiàn)場的異常情況設置報警標志,報警標志可以由系統(tǒng)實時查詢或由終端主動上報[3]。正確分析判斷用電信息采集平臺上所反映出來的異常事件和異常數(shù)據(jù),就能夠實時監(jiān)測和監(jiān)控用電現(xiàn)場的運行狀況,有針對性地判斷用戶的用電情況是否有異常,降低由電能計量故障所帶來的損失[4]。針對單個計量異常告警事件,通過異常原因分類、處理流程、異?,F(xiàn)象及處理步驟的研究總結,已經(jīng)有較規(guī)范統(tǒng)一的處理流程和方法[5-10]。然而,日常運行中的計量異常種類繁多、情況復雜,用電信息采集系統(tǒng)發(fā)出的事件告警信息混雜在一起,僅對單個計量異常報警事件進行分析,常常造成誤報、漏報等問題,導致工作量大,難以進行有效地分析處理及應用。因此,對計量異常事件之間的關系進行研究,建立計量異常事件關聯(lián)度的計算模型,將存在關聯(lián)的異常事件組合視為并發(fā)異常事件處理,是提高計量異常事件分析效率和準確性的關鍵所在。
在電力系統(tǒng)中,常用的關聯(lián)分析方法主要有皮爾遜相關分析法和灰色關聯(lián)度分析法。皮爾遜相關分析法是一種計算線性相關性的方法,其基本原理是通過變量之間的協(xié)方差和標準差的商來計算皮爾遜相關系數(shù);灰色關聯(lián)分析方法的基本思想是根據(jù)序列曲線幾何形狀間的相似程度來判斷其聯(lián)系是否緊密,曲線越接近,相應序列之間的關聯(lián)度就越大,反之就越小。文獻[11]在大數(shù)據(jù)應用原則和大數(shù)據(jù)思維的指導下,融合電力設備故障統(tǒng)計數(shù)據(jù)和電能質量監(jiān)測數(shù)據(jù),采用皮爾遜相關分析法對二者的關聯(lián)度進行了分析;文獻[12]針對電網(wǎng)安全運行評價的需要,采用灰色面積關聯(lián)分析法確定評價模型的分辨系數(shù),提出了一種基于多層次灰色面積關聯(lián)分析法的電網(wǎng)安全綜合評價模型;文獻[13]采用灰色關聯(lián)規(guī)則分析方法對變壓器故障信息數(shù)據(jù)進行挖掘,對變壓器故障與特征量之間的可信度進行分析,揭示了變壓器故障與特征量的相關程度。這些關聯(lián)度分析方法均對分析數(shù)據(jù)有要求,需要具體采樣數(shù)據(jù),并不適用基于異常事件發(fā)生時間的關聯(lián)度分析。
本文通過對用電信息采集系統(tǒng)中的歷史告警數(shù)據(jù)進行分析,提出一種基于異常事件發(fā)生日期間隔天數(shù)的兩兩計量異常事件關聯(lián)度計算方法,對現(xiàn)有數(shù)據(jù)進行分析,明確關聯(lián)分析方法,選取異常發(fā)生日期間隔天數(shù)對關聯(lián)度進行計算;構造關聯(lián)系數(shù)函數(shù),確定關聯(lián)分析流程,設置閾值,實現(xiàn)對并發(fā)異常事件的甄別;對關聯(lián)分析結果進行分析。實例計算結果表明,該方法能夠準確計算出兩兩計量異常事件之間的關聯(lián)度,對存在關聯(lián)的計量異常事件組合進行有效篩選。
現(xiàn)有數(shù)據(jù)為某市2015—2016年專用變壓器(以下簡稱“專變”)用戶和低壓用戶同月同一用戶出現(xiàn)多種異常的歷史告警數(shù)據(jù)。每條告警記錄都包含了用戶編號、異常類型名稱、異常發(fā)生時間、異?;謴蜁r間和異常歸檔時間等信息,其具體記錄方式如表1所示。
表1 異常告警數(shù)據(jù)記錄
由表1可知,異?;謴蜁r間和異常歸檔時間相同,異?;謴蜁r間和異常發(fā)生時間有一定間隔,但間隔時間長短不一,原因是異?;謴蜁r間受人為因素影響。對于要納入考核的計量異常事件,一般會在一周內進行人工恢復;而對于不進行考核的異常事件,恢復時間視現(xiàn)場運行情況和工人工作安排而定。對于恢復時間與發(fā)生時間相差過大的異常,其恢復時間多為后期歸檔時填寫的歸檔時間,并非實際恢復時間。因此,在歷史告警數(shù)據(jù)中實際可用來進行關聯(lián)度分析的數(shù)據(jù)只有異常發(fā)生時間,而異?;謴蜁r間受人為因素影響較大,并不準確。本文在對現(xiàn)有數(shù)據(jù)進行充分剖析的基礎上,以異常事件發(fā)生時間為參考,構建了基于異常發(fā)生時間間隔天數(shù)的關聯(lián)度計算模型。
令A1為異常事件1,A2為異常事件2,通過對大量歷史數(shù)據(jù)進行分析發(fā)現(xiàn),A1和A2總是同時或者前后緊接著發(fā)生,可以初步認為這2種異常事件可能有關聯(lián);再根據(jù)異常發(fā)生日期間隔天數(shù)構造關聯(lián)系數(shù)函數(shù),分別求出每一次的關聯(lián)系數(shù)r,如果關聯(lián)系數(shù)波動較小,集中分布在某一區(qū)間內,則認為A1與A2有關聯(lián),對該區(qū)間的關聯(lián)系數(shù)取均值即可求出A1和A2的關聯(lián)度;反之,如果關聯(lián)系數(shù)分散分布,則認為A1和A2的關聯(lián)度為0。
2.2.1 關聯(lián)系數(shù)函數(shù)構造
對于同一用戶,2個異常事件之間的關聯(lián)系數(shù)r與異常發(fā)生日期間隔天數(shù)d成反比關系,即隨著間隔天數(shù)d的增大,關聯(lián)系數(shù)r逐漸減小。由理論上分析知,如果A1與A2為一組并發(fā)異常事件組合,則A1與A2應該由同一異常原因引發(fā)。通過對填寫了異常原因的檔案數(shù)據(jù)進行分析發(fā)現(xiàn),當2個異常事件發(fā)生日期間隔超過15天時,由同一原因引起的概率小于5%。統(tǒng)計學上通常將發(fā)生概率小于5%(即1/20)的事件稱為小概率事件[14]。因此,排除小概率事件,將異常發(fā)生日期間隔天數(shù)d的閾值定為15:當d>15時,認為無關聯(lián),不進行關聯(lián)系數(shù)計算;當d≤15時,一個異?;謴秃罅硪粋€異常才發(fā)生,也認為無關聯(lián),不進行關聯(lián)系數(shù)計算;當d≤15且一個異?;謴颓傲硪粋€異常發(fā)生,關聯(lián)系數(shù)計算式為:
2.2.2 確定可能存在關聯(lián)的兩兩異常事件組合
首先,對歷史告警數(shù)據(jù)進行分析處理,得到2年來所有出現(xiàn)過的計量異常事件種類共K類,分別求出每種異常事件在2年內出現(xiàn)的次數(shù)nk;其次,對所有的異常事件進行兩兩組合,分別求出第i種異常與第j種異常組合時,間隔天數(shù)d≤15,一個異常恢復前另一個異常發(fā)生且為同一用戶的次數(shù)nij;最后,設置閾值η,當nij大于閾值η時,可初步判斷2種異常事件可能有關聯(lián)。該閾值應排除小概率事件,即當nij大于單異常事件在2年內出現(xiàn)的總數(shù)的1/20時,認為2種異常事件可能有關聯(lián)。閾值η的計算公式為:
式中:ni表示第i種異常在2年內出現(xiàn)的總次數(shù);nj表示第j種異常在2年內出現(xiàn)的總次數(shù)。
2.2.3 對可能存在關聯(lián)的異常事件組合進行關聯(lián)分析
初步確定兩計量異常事件可能具有關聯(lián)后,根據(jù)式(1)分別計算出這nij次每次的關聯(lián)系數(shù)rs(s=1, 2, 3, …, nij), 令l=0,1, …,15)為關聯(lián)系數(shù)rs在區(qū)間[0,1]上所有可能取值,pl=l=0,1,…,15)為關聯(lián)系數(shù)在每個取值處的概率,其中nl為rs=xl的總數(shù)。對求得的pl按照從大到小的順序排列,記為pl′,對應的關聯(lián)系數(shù)取值為xl′。關聯(lián)度Rij計算公式為:
式中:k為分散程度系數(shù),根據(jù)統(tǒng)計學經(jīng)驗以及反復的數(shù)據(jù)分析發(fā)現(xiàn),當隨機變量rs在某取值處的概率大于0.7時,可認為rs主要集中分布在該取值處,設a為使得≥0.7的最小取值,當0≤a≤10時 k=1-0.1a, 當 10<a≤15時 k=0; m 為關聯(lián)系數(shù) rs所有取值為 x0′, …, xa′的總個數(shù); rs′為關聯(lián)系數(shù) rs中所有取值為 x0′,…,xa′的部分。
根據(jù)式(3)計算出關聯(lián)度 Rij的范圍為[0,1],即說明Rij越接近1,關聯(lián)性越強;越接近0,關聯(lián)性越弱。通過設定閾值ξ對存在關聯(lián)的并發(fā)異常事件組合進行篩選,當Rij>ξ時,認為2個異常事件存在關聯(lián)。相關系數(shù)與關聯(lián)性強弱的對應關系[11]如表2所示。
表2 相關系數(shù)與關聯(lián)性強弱的對應關系
根據(jù)相關系數(shù)與關聯(lián)性強弱關系將閾值ξ設定為0.4,即認為關聯(lián)強弱在中等程度及以上的2個異常事件組合有關聯(lián)。異常事件關聯(lián)分析流程如圖1所示。
根據(jù)第2節(jié)方法,基于某市2015年、2016年2年的歷史告警數(shù)據(jù)分別對專變用戶和低壓用戶的兩兩異常事件組合進行關聯(lián)分析。為了證明該方法的準確性和可靠性,選取電能表示值不平與電能表飛走、需量超容與反向電量2組異常組合進行關聯(lián)分析。
電能表示值不平和電能表飛走這2種異常既面向低壓用戶又面向專變用戶,因此,分別對低壓用戶和專變進行關聯(lián)分析。
圖1 關聯(lián)分析流程
3.1.1 低壓用戶電能表示值不平與電能表飛走關聯(lián)分析
低壓用戶2年來電能表示值不平與電能表飛走發(fā)生的次數(shù)如表3所示。
表3 低壓用戶發(fā)生次數(shù)統(tǒng)計
(1)初步判斷低壓用戶電能表示值不平與電能表飛走是否具有關聯(lián),由式(2)求得:
由于η<7 388,因此認為低壓用戶電能表示值不平與電能表飛走可能存在關聯(lián)。
(2)關聯(lián)度計算。 根據(jù)式(1)計算出7 388組中每組的關聯(lián)系數(shù)rs(s=1,2,…,7 388),其分布結果如圖2所示。
p0′=p1=0.61<0.7, p0′+p1′=p1+p0=0.93>0.7, 所以a=1,k=0.9,rs′為關聯(lián)系數(shù) rs中所有取值為 x15和x14的部分,最終關聯(lián)度由式(3)計算得到:
由于R>0.4,因此認為專變用戶電能表示值不平與電能表飛走有關聯(lián),且屬于極強關聯(lián)。
圖2 低壓用戶關聯(lián)系數(shù)分布
3.1.2 專變用戶電能表示值不平與電能表飛走關聯(lián)分析
專變用戶2年來電能表示值不平與電能表飛走發(fā)生的次數(shù)如表4所示。
表4 專變用戶發(fā)生次數(shù)統(tǒng)計
(1)初步判斷專變用戶電能表示值不平與電能表飛走是否具有關聯(lián),由式(2)求得:
由于η<606,因此認為專變用戶電能表示值不平與電能表飛走可能存在關聯(lián)。
(2)關聯(lián)度計算。根據(jù)式(1)計算出606組每組的關聯(lián)系數(shù)大小,關聯(lián)系數(shù)rs(s=1,2,…,606)分布結果如圖3所示。
圖3 專變用戶關聯(lián)系數(shù)分布
p0′=p1=0.73>0.7,所以 a=0, k=1,rs′為關聯(lián)系數(shù)rs中所有取值為x1=0.93的部分,最終關聯(lián)度由式(3)計算得到:
由于R>0.4,因此認為專變用戶電能表示值不平與電能表飛走具有關聯(lián)性,且屬于極強關聯(lián)。
3.1.3 結果分析
電能表示值不平是指電能表總電能示值與各費率電能示值之和不等。引起電能表示值不平的主要原因有采集數(shù)據(jù)錯誤、電能表故障和終端故障等;電能表飛走是指電能表日電量明顯超過正常值。引起電能表飛走的主要原因有超過合同約定容量用電、電能表故障、終端故障和采集數(shù)據(jù)錯誤等。電能表示值不平和電能表飛走都屬于電量異常,二者均可由采集數(shù)據(jù)錯誤、電能表故障和終端故障引發(fā)。因此,可以認為電能表示值不平和電能表飛走之間具有較高的關聯(lián)。由本文提出的關聯(lián)算法求出的低壓用戶關聯(lián)度為0.86、專變用戶關聯(lián)度為0.93,均大于0.80,屬于極強關聯(lián),說明該關聯(lián)算法求出的關聯(lián)度值與實際結果相符合。
由于需量超容只面向專變用戶,此處對專變用戶進行關聯(lián)分析。2年來專變用戶需量超容與反向電量異常發(fā)生的次數(shù)如表5所示。
表5 專變用戶發(fā)生次數(shù)統(tǒng)計
(1)初步判斷需量超容與反向電量異常是否有關聯(lián),由式(2)求得:
因為η>10,所以認為需量超容與反向電量異常無關聯(lián)。
(2)結果分析。需量超容是指按最大需量計算基本電費的專變用戶,電能表記錄的最大需量超出用戶合同。引起需量超容的主要原因為需量算費用戶用電負荷過大,超過用戶合同約定需量;反向電量異常是指非發(fā)電用戶電能表反向有功總示值大于0,且每日反向有功總示值有一定增量。引起反向電量異常的原因主要有:計量回路接線錯誤、電能表故障、用戶負荷特性和載波信號干擾等。需量超容屬于負荷異常;反向電量異常屬于接線異常。二者無論是異常屬性還是引發(fā)異常的原因都無相同之處,理論上可以認為需量超容與反向電量異常無關聯(lián),與本文提出的關聯(lián)算法求出的結果一致。
經(jīng)過實例分析證明,本文提出的基于異常發(fā)生日期間隔天數(shù)的關聯(lián)度算法,能夠簡捷準確地計算出兩兩異常事件之間的關聯(lián)度。設置適當?shù)年P聯(lián)度閾值能有效地甄別和篩選出具有關聯(lián)的并發(fā)計量異常事件組合,為后續(xù)有效地利用異常告警數(shù)據(jù)對異常原因和異常用電行為進行分析診斷奠定了基礎。