陽 浩,向 真,張 林,余 英,魏恩偉
(1.深圳供電局有限公司,廣東 深圳 518001)(2.南方電網(wǎng)深圳數(shù)字電網(wǎng)研究院有限公司,廣東 深圳 518053)
電力公司的管理方式非常重要,細致入微地管理配電網(wǎng)絡(luò)有利于減少線損異?,F(xiàn)象。異常事件可歸納為三大類:誤操作造成的事故事件、惡意破壞造成的事故事件、麻痹大意和僥幸心理造成的事故事件。在管理過程中要減少線損異?,F(xiàn)象,控制異常事件的發(fā)生??刂飘惓J录陌l(fā)生則要規(guī)范處理和解決困難的方式,提高辦事的效率,有效地解決各種問題,保障事件發(fā)生的可控性。
早期研究文獻中,對異常事件的控制方法來自對電網(wǎng)運行數(shù)據(jù)的深度挖掘,即在電網(wǎng)運行基本參數(shù)(電壓電流負荷、設(shè)備運行狀態(tài)等)中發(fā)現(xiàn)異常事件在系統(tǒng)運行狀態(tài)中的數(shù)據(jù)表達。如史文博等[1]以云南電網(wǎng)為例,論證了異步電網(wǎng)調(diào)頻備用指標在機器學習中如何進行統(tǒng)計分析以及應(yīng)用;鄭福民等[2]以緬北為例,針對電網(wǎng)故障的診斷通過大數(shù)據(jù)分析,提前對故障進行判斷,解決了故意診斷的問題。但是該數(shù)據(jù)挖掘方案信噪比較低,相關(guān)研究敏感度只能保持在70%~85%,難以對所有異常事件做出有效預(yù)警。直接反映人為因素的數(shù)據(jù)來自人事系統(tǒng)、調(diào)度發(fā)令系統(tǒng)等,相關(guān)研究文獻認為此類數(shù)據(jù)的異構(gòu)化水平較高,數(shù)據(jù)歸一化難度較大,因此該研究方向難以獲得有效突破。本文通過引入模糊神經(jīng)網(wǎng)絡(luò),使用模糊矩陣對數(shù)據(jù)強制歸一化后導入多列模糊神經(jīng)網(wǎng)絡(luò),最終在有針對性的加權(quán)規(guī)則下實現(xiàn)基于調(diào)度發(fā)令系統(tǒng)原始大數(shù)據(jù)的數(shù)據(jù)預(yù)警。
本文通過開發(fā)配網(wǎng)發(fā)令系統(tǒng)數(shù)據(jù)的多列模糊神經(jīng)網(wǎng)絡(luò)機器學習算法來實現(xiàn)異常事件約束及預(yù)警,該系統(tǒng)在仿真環(huán)境下測得更高的敏感度和特異度,且具有更高的響應(yīng)效率。這證明在異常事件約束人工智能算法中,使用法令系統(tǒng)數(shù)據(jù)具有更高的數(shù)據(jù)挖掘效率。發(fā)令系統(tǒng)中直接反映管理效率和人員工作狀態(tài)的數(shù)據(jù)包括復(fù)誦錯誤率、執(zhí)行錯誤率,同時還應(yīng)考察調(diào)度令的重復(fù)次數(shù)[3]。早期的發(fā)令系統(tǒng)并不能比較調(diào)度令的重復(fù)度,因此本文并不考察該指標,僅對調(diào)度令發(fā)令、復(fù)誦、回復(fù)3個時間節(jié)點的2個時間周期進行控制,同時對調(diào)度令復(fù)誦、執(zhí)行和回復(fù)錯誤的概率進行控制,本文使用上述5項指標實現(xiàn)對異常事件風險的約束。其數(shù)據(jù)邏輯如圖1所示。
圖1中,使用9列模糊神經(jīng)網(wǎng)絡(luò)配合二值化模塊輸出9個結(jié)果,每個結(jié)果均為充分二值化的介于[0,1]區(qū)間的輸出結(jié)果,當結(jié)果接近1.000時,認為存在對應(yīng)異常事件的風險,當結(jié)果接近0.000時,認為不存在對應(yīng)異常事件的風險。其中5項控制指標分別歸納為以下2點:
圖1 基于模糊神經(jīng)網(wǎng)絡(luò)的異常事件約束算法
1)回復(fù)時間周期為調(diào)度令執(zhí)行完成并回復(fù)上級調(diào)度的時間點(回復(fù)時間)與調(diào)度發(fā)令復(fù)誦確認完成的時間點(復(fù)誦時間)的時間差;復(fù)誦時間周期為調(diào)度令首次發(fā)令時間點(發(fā)令時間)與復(fù)誦確認完成的時間點(復(fù)誦時間)的時間差。2列數(shù)據(jù)均為時間型變量(date-time型),這兩個變量需要進行強制歸一化后轉(zhuǎn)化為浮點型變量(double型),歸一化方法為Z-score算法,其基函數(shù)如式(1)所示:
(1)
2)復(fù)誦錯誤率為因為復(fù)誦與調(diào)度令不一致導致上級調(diào)度單位重復(fù)下達調(diào)度令并要求復(fù)誦的次數(shù)與調(diào)度令總次數(shù)的比值;執(zhí)行錯誤率為調(diào)度令執(zhí)行階段因為任何原因被上級調(diào)度單位叫停的調(diào)度令數(shù)量與調(diào)度令總次數(shù)的比值;回復(fù)錯誤率為因任何原因?qū)е禄貜?fù)調(diào)度令不被上級調(diào)度單位接受而要求重新整改或重新回復(fù)的調(diào)度令數(shù)量與調(diào)度令總數(shù)的比值。上述3列數(shù)據(jù)均為浮點型變量(double型),所以無需歸一化即可被模糊神經(jīng)網(wǎng)絡(luò)接收并利用。
模糊神經(jīng)網(wǎng)絡(luò)指使用深度迭代回歸函數(shù),將多個數(shù)據(jù)進行卷積壓縮,最終輸出1個雙精度變量的統(tǒng)計算法[4]。上述5列數(shù)據(jù)均為一定周期內(nèi)的一維矩陣數(shù)據(jù),根據(jù)深圳供電局有限公司日常運行日志可知,地級市一級配網(wǎng)管理單位的調(diào)度令總量為每天80~150條,調(diào)度令執(zhí)行時間長度各異,多處于1~45 h,該算法的統(tǒng)計窗口設(shè)定為最近300條已完成回復(fù)歸檔的調(diào)度令。算法執(zhí)行過程中顯示的5列數(shù)據(jù)向每列模糊神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點量均為5×300條數(shù)據(jù),數(shù)據(jù)節(jié)點總量為1 500節(jié)點,將該5列輸入節(jié)點卷積成1個浮點型變量來完善算法過程。雖然9列模糊神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)相同,但卻使用不同的數(shù)據(jù)進行訓練,實現(xiàn)機器學習過程中模糊神經(jīng)網(wǎng)絡(luò)的構(gòu)建。
如圖1所示,模糊神經(jīng)網(wǎng)絡(luò)分為兩段,前段使用多項式迭代回歸函數(shù)作為節(jié)點基函數(shù),如式(2)所示,后段使用二值化函數(shù)作為節(jié)點基函數(shù),如式(3)所示。
(2)
(3)
式中:A,B為回歸系數(shù);Xi為前一層神經(jīng)網(wǎng)絡(luò)的第i個輸入數(shù)據(jù)的元素值。
多項式數(shù)據(jù)調(diào)試中,使用2018年—2020年深圳供電局有限公司管轄的全市6個縣、市、區(qū)全部配網(wǎng)調(diào)度節(jié)點在調(diào)度發(fā)令系統(tǒng)中的全部數(shù)據(jù)作為調(diào)試數(shù)據(jù),在MATLAB仿真環(huán)境中按照上述算法對整個多列模糊神經(jīng)網(wǎng)絡(luò)機器學習系統(tǒng)進行訓練調(diào)試,并利用2021年的數(shù)據(jù)進行算法效能驗證。異常事件相關(guān)數(shù)據(jù)來自調(diào)度系統(tǒng)中的事故追查記錄數(shù)據(jù),采用的是人工統(tǒng)計的方法,對所有相關(guān)調(diào)度令進行手工標記,作為訓練結(jié)果。上述算法輸出的9個評估值,分別對應(yīng)國家電網(wǎng)《異常事件管理規(guī)定》中9類異常事件[5]。
在MATLAB仿真環(huán)境中構(gòu)建該算法模型,并按照前文所述的調(diào)試方法獲得充分收斂的機器學習模塊,利用較新的2021年數(shù)據(jù)進行仿真驗證[6]。因為所有數(shù)據(jù)均為往期數(shù)據(jù),調(diào)度令執(zhí)行過程中是否出現(xiàn)對應(yīng)的異常事件均有顯著且高置信度的標記,所以可以實現(xiàn)對該算法支持的軟件系統(tǒng)進行敏感度和特異度的有效標記。仿真中,同時構(gòu)建以往基于電網(wǎng)負荷和設(shè)備運行狀態(tài)的機器學習算法,觀察其對異常事件預(yù)警特異度和敏感度的預(yù)警效能,作為對比組數(shù)據(jù)。
神經(jīng)網(wǎng)絡(luò)模擬人腦神經(jīng)元功能,具有強大的數(shù)據(jù)處理能力和模擬學習能力,而模糊邏輯方法則是模擬人腦的邏輯思維方式進行模糊綜合判斷,推理解決常規(guī)方法難于應(yīng)付的結(jié)構(gòu)性知識表達問題[7]。模糊神經(jīng)網(wǎng)絡(luò)將人腦的結(jié)構(gòu)和思維方法結(jié)合起來,取長補短,克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)邊界模糊數(shù)據(jù)不好處理的問題。模糊神經(jīng)網(wǎng)絡(luò)算法可以根據(jù)不完備數(shù)據(jù)的隱藏規(guī)律,建立被統(tǒng)計數(shù)據(jù)和控制策略之間的隱藏邏輯關(guān)系。
表1、表2分別為機器學習算法和模糊神經(jīng)網(wǎng)絡(luò)算法的特異度、敏感度表達結(jié)果統(tǒng)計表。
表1 預(yù)警算法特異度仿真測試結(jié)果
表2 預(yù)警算法敏感度仿真測試結(jié)果
表中,敏感度指所有真陽性預(yù)警結(jié)果在所有陽性狀態(tài)中的比例,特異度指所有真陰性結(jié)果在所有陰性狀態(tài)中的比例,領(lǐng)先度是該算法對應(yīng)的敏感度或特異度與兩種算法的統(tǒng)計值差與機器學習算法統(tǒng)計值之間的比值[8]。t值與P值來自數(shù)據(jù)分析軟件SPSS中的雙變量t校驗結(jié)果,雙變量為機器學習算法統(tǒng)計值與該算法統(tǒng)計值,t值為雙變量t校驗輸出結(jié)果中的value值,當t<10.000時認為兩列數(shù)據(jù)存在統(tǒng)計學差異,且t值越小,統(tǒng)計學差異越顯著,P值為雙變量t校驗輸出結(jié)果中的對數(shù)值,當P<0.050時,認為統(tǒng)計學結(jié)果處于置信空間內(nèi),當P<0.010時,認為統(tǒng)計學結(jié)果具有顯著的統(tǒng)計學差異,且P值越小,認為統(tǒng)計學意義越顯著。
由表可知,第3類異常事件(因人為惡意破壞造成的異常事件)差異性最大,其次為第4類異常事件(因操作者麻痹大意造成的異常事件)。機器學習算法的這兩類異常事件的預(yù)警敏感度分別為42.3%和49.6%,經(jīng)過模糊神經(jīng)網(wǎng)絡(luò)算法變更數(shù)據(jù)源并使用新型機器學習架構(gòu)后,預(yù)警敏感度提升至85.6%和88.7%;機器學習算法的預(yù)警特異度分別為35.2%和52.7%,模糊神經(jīng)網(wǎng)絡(luò)算法將預(yù)警特異度提升至86.3%和91.8%。9項預(yù)警中,機器學習算法的特異度和敏感度除第3類和第4類外,均穩(wěn)定在90%以上,而使用模糊神經(jīng)網(wǎng)絡(luò)算法后將除第3類和第4類外的異常事件的敏感度和特異度均提升到95%以上,且兩組數(shù)據(jù)的雙變量t校驗結(jié)果均存在t值小于10.000、P值小于0.010的顯著統(tǒng)計學差異。
算法響應(yīng)效率指問題數(shù)據(jù)出現(xiàn)后至系統(tǒng)預(yù)警發(fā)出時間點的時間差。該響應(yīng)效率受到物聯(lián)網(wǎng)、云計算硬件的制約,在仿真環(huán)境下,模擬完全支持相應(yīng)系統(tǒng)運行的硬件環(huán)境,即在假定響應(yīng)效率不受制于硬件的前提下仿真計算兩套算法的響應(yīng)效率[9]。機器學習算法的數(shù)據(jù)源是電網(wǎng)配網(wǎng)系統(tǒng)中的設(shè)備運行狀態(tài),以電能質(zhì)量監(jiān)測系統(tǒng)的遠程抄表數(shù)據(jù)為原始數(shù)據(jù),所以數(shù)據(jù)源并非由調(diào)度令觸發(fā),其特點為數(shù)據(jù)量較大、數(shù)據(jù)間隔周期較短。相關(guān)文獻排除使用基于調(diào)度令的機器學習算法的重要原因是,認為調(diào)度令驅(qū)動的預(yù)警系統(tǒng)因為數(shù)據(jù)量較小且數(shù)據(jù)間隔周期較長,影響了預(yù)警算法的響應(yīng)效率。而根據(jù)安全管理基本原則,故障、隱患發(fā)展為事故需要一定時間,越早發(fā)現(xiàn)故障和隱患,越有充分時間在故障、隱患發(fā)展為事故之前解決問題[10]。基于上述假設(shè),對兩套系統(tǒng)的響應(yīng)效率進行仿真,得到表3。
表3 預(yù)警算法響應(yīng)效率的仿真測試結(jié)果
對比上述兩種算法的兩列數(shù)據(jù),發(fā)現(xiàn)與預(yù)警特異度和敏感度表現(xiàn)相同,兩種算法對第3類和第4類異常事件的預(yù)警過程占用較大算力或數(shù)據(jù)量,機器學習算法對第3類和第4類異常事件的耗時約為其他類型異常事件的18~21倍,模糊神經(jīng)網(wǎng)絡(luò)算法對第3類和第4類異常事件的耗時約為其他類型異常事件的9~12倍。但模糊神經(jīng)網(wǎng)絡(luò)算法并未如同相關(guān)文獻中提出的,因為以調(diào)度令執(zhí)行情況等小規(guī)模、大間隔數(shù)據(jù)作為分析數(shù)據(jù)源而帶來更大響應(yīng)周期。從統(tǒng)計因果論角度分析,機器學習算法雖然使用了高密度數(shù)據(jù),但其元數(shù)據(jù)與分析目標之間缺少直接邏輯關(guān)系,即其運行在極端不完備數(shù)據(jù)體系下,數(shù)據(jù)信噪比極低,所以機器學習統(tǒng)計分析過程中運算量較大,從而導致其算法響應(yīng)周期更長[11]。模糊神經(jīng)網(wǎng)絡(luò)算法以出現(xiàn)問題的調(diào)度令為預(yù)警激發(fā)條件,而機器學習算法不存在明顯的激發(fā)條件,所以機器學習算法可能存在激發(fā)條件的模糊性與滯后性。
本文將傳統(tǒng)的異常事件約束算法的原始數(shù)據(jù)從配網(wǎng)系統(tǒng)運行數(shù)據(jù)(電能質(zhì)量監(jiān)測數(shù)據(jù)、設(shè)備狀態(tài)監(jiān)測數(shù)據(jù))轉(zhuǎn)向更貼近人為因素的調(diào)度發(fā)令系統(tǒng)數(shù)據(jù),使數(shù)據(jù)邏輯關(guān)系更為直接,數(shù)據(jù)信噪比更高[12]。因此本文設(shè)計的異常事件約束算法擁有更高的敏感度和特異度、更短的響應(yīng)周期(更高的響應(yīng)效率)。但是,機器學習算法中特異度與敏感度較低的第3類異常事件和第4類異常事件預(yù)警結(jié)果,在模糊神經(jīng)網(wǎng)絡(luò)算法系統(tǒng)中雖然有較大幅度的算法效力提升,但敏感度與特異度仍未達到較為理想的95%以上。后續(xù)研究中將進一步優(yōu)化相關(guān)算法,實現(xiàn)更高效的異常事件預(yù)警結(jié)果。