周 敏
(國網(wǎng)江西省電力公司撫州供電公司,江西 撫州 344000)
在現(xiàn)代電力系統(tǒng)中,油色譜在線監(jiān)測裝置得到了廣泛應用,成為保障電力系統(tǒng)安全、穩(wěn)定運行的重要工具。對油色譜在線監(jiān)測裝置本身的故障,目前應用較多的診斷方法是油中溶解氣體分析(DGA),但是從實際應用來看,由于溶解氣體成分復雜,因此故障診斷的準確率不高。目前,通過數(shù)據(jù)建模進行裝置故障識別成為一種主流趨勢,利用數(shù)學模型可以對在線監(jiān)測數(shù)據(jù)進行降噪處理、擬合處理以及缺失值處理,讓最終的故障診斷結果更加可靠。其中,基于最近鄰編輯采樣法(ENN)的故障識別算法可以準確、全面地識別油色譜在線監(jiān)測裝置的隱蔽故障,在該裝置的日常維護和故障檢修等方面發(fā)揮了重要作用。
該裝置的核心模塊包括油氣分離模塊、氣體組分檢測模塊、網(wǎng)絡通信模塊以及故障診斷模塊等,整體結構如圖1所示。
圖1 變壓器油色譜在線監(jiān)測裝置
油氣分離模塊的功能是將溶解在油中并且將包括故障特征的氣體分離出來,為下一步的氣體檢測提供有利條件。如果該模塊發(fā)生故障,無法正常實現(xiàn)油氣分離,則油色譜在線監(jiān)測裝置無法在線監(jiān)測和準確識別變壓器的運行故障。氣體組分檢測模塊的功能是對油氣分離、氣體組分分離后的特征氣體進行濃度檢測,然后通過數(shù)模轉換器將物理信號變成電信號,以便于下一步進行計算機分析。電信號經(jīng)通信網(wǎng)絡傳輸至主控計算機,利用各種算法、數(shù)學模型等完成故障診斷。
為進一步提高在線監(jiān)測的即時性和準確性,現(xiàn)階段的油色譜在線監(jiān)測裝置結構更精密,故障類型也更多樣。根據(jù)以往的裝置檢修與維護經(jīng)驗可以將其故障大體分為4個類型:1) 載氣欠壓故障,可能與氣瓶未完全打開、載氣端口漏氣等有關。如果載氣壓力不足,就會導致分離出來的特征氣體在色譜柱內停留時間偏短,特征氣體的分析不徹底,影響故障診斷的精確性。2) 倒油故障,可能與廢油箱排油不暢、倒油管路堵塞等有關。如果廢油無法順利倒入廢油箱,也會導致該裝置無法正常運行。3) 色譜電氣故障,可能與相關電子器件的老化、短路等有關。在發(fā)生該故障后,無法進行正常的色譜分析,故障識別和診斷也會受到影響。4) 數(shù)據(jù)中斷故障,可能與通信網(wǎng)絡的硬件損壞有關。在發(fā)生該故障后,主控計算機無法正常接收氣體檢測數(shù)據(jù),從而不能識別和診斷該裝置的運行工況。
由于油色譜在線監(jiān)測裝置的各類故障具有隱蔽性、突發(fā)性等特點,如果采集樣本數(shù)量偏少,就會導致識別準確率不高。因此,需要擴大樣本數(shù)量,獲得包括大量樣板的訓練集,通過計算機的深度學習和訓練提高對故障的診斷精度。將故障發(fā)現(xiàn)時間點與假設故障發(fā)生時間點之間的時間間隔定義為故障時間窗口(),然后采集內的油色譜在線監(jiān)測裝置的所有歷史數(shù)據(jù),并保存到訓練集中??紤]訓練集中存在不平衡數(shù)據(jù),還要對基于最近鄰編輯算法(ENN)對得到的訓練集進行重采樣。具體方法如下。
首先,設訓練集={,,…,p,…,p},將中的所有樣本按照“數(shù)量”與“標簽”分成2類,分別是多數(shù)類和少數(shù)類。從集合中任意選擇一個樣本p,用最近鄰算法求得p的3個最近鄰樣本,則待計算樣本p與其余樣本q的關系如公式(1)所示。
其次,將3個最近鄰樣本分別作為待計算樣本,繼續(xù)運用最近鄰算法求其余樣本。
最后,在集合中所有樣本全部計算完畢后,得到一個新的樣本集,則中多數(shù)類樣本和少數(shù)類樣本的數(shù)量達到平衡狀態(tài),在該基礎上開展故障分類識別既可以提高故障分析速度,又能保證故障診斷精度?;贓NN的采樣流程如圖2所示。
圖2 最近鄰編輯算法采樣流程圖
基于故障識別算法的油色譜在線監(jiān)測裝置故障分類識別流程如下:1) 獲取故障工作清單(xi),輸入變壓器編號j。2) 對在故障時間窗口內的歷史數(shù)據(jù)進行重采樣,得到數(shù)據(jù)集(aj)。3) 將(aj)加入故障訓練集中,添加故障標簽。4) 在中運用基于ENN算法進行重采樣處理,得到新的數(shù)據(jù)集。5) 把中的所有數(shù)據(jù)輸入隨機森林數(shù)學模型中。6) 采取“有放回取樣”的方法從中隨機抽選個樣本。7) 將每個獨立樣本構成1個決策樹,獲得個決策樹。8) 分別對個決策樹進行歸類,得到故障分類結果,完成故障識別。
隨機森林模型是一種由多個弱分類器組合形成的集成模型。該文基于Sklearn庫對隨機森林模型進行參數(shù)優(yōu)化。從Sklearn庫中調取以下調優(yōu)函數(shù):1) 決策樹數(shù)量函數(shù)(n_estimators),利用該模型并使用有放回抽樣的方式從收集到的原始數(shù)據(jù)中獲得數(shù)據(jù),以生成決策樹,n_estimators表示決策樹的數(shù)量。該函數(shù)能保證決策樹的數(shù)量適中,既避免了決策樹數(shù)量過多導致算法運行速度變慢的問題,又解決了決策樹數(shù)量太少導致分類識別精度不高的問題。2) 決策樹最大深度函數(shù)(max_depth),在樣本數(shù)量以及樣本特征較多的情況下,運用該函數(shù)能夠有效提高模型的泛化性能和運算速度。3) 最大特征數(shù)量函數(shù)(max_features),當隨機森林模型生成分類決策樹時,需要考慮其最大特征數(shù)是否合適。如果最大特征數(shù)≥原始數(shù)據(jù)集,則需要重新調整隨機森林模型,保證其產(chǎn)生的決策樹<原始數(shù)據(jù)集,縮短生成決策樹的時間,進而提高故障識別效率。
該試驗以Windows10系統(tǒng)作為平臺,所選數(shù)據(jù)來自于30臺220 kV電力變壓器的油色譜在線監(jiān)測數(shù)據(jù),樣本數(shù)據(jù)共82 850條,特征氣體包括H、CO、CH和總烴等,詳細的氣體類型及監(jiān)測數(shù)據(jù)見表1。
表1 電力變壓器油色譜在線監(jiān)測數(shù)據(jù)(單位:μL/L)
對獲取到的油色譜在線監(jiān)測裝置相關數(shù)據(jù),使用遺傳算法進行參數(shù)優(yōu)化。尋化標準設定如下:1) 決策樹的數(shù)量以[1,50]為尋優(yōu)空間。2) 決策樹的最大深度以[1,10]為尋優(yōu)空間。3) 最大特征數(shù)量以[1,8]為尋優(yōu)空間。4) 節(jié)點可分的最小樣本數(shù)以[1,50]為尋優(yōu)空間。5) 葉子節(jié)點最小權重以[0,0.2]為尋優(yōu)空間。
基于上述標準,使用CostFuction函數(shù)進行迭代尋優(yōu),迭代次數(shù)設定為100次,基于尋求結果繪制參數(shù)尋優(yōu)曲線圖,如圖3所示。
圖3 遺傳算法參數(shù)優(yōu)化
該試驗將故障時間窗口設定為20,選擇油色譜在線監(jiān)測裝置的4項典型故障(倒油故障、載氣欠壓、數(shù)據(jù)中斷以及色譜電氣故障)展開分類預測。將優(yōu)化后的數(shù)據(jù)輸入基于ENN的隨機森林模型中,根據(jù)模型計算結果繪制故障識別混淆矩陣,如圖4所示。
圖4 故障識別混淆矩陣
該試驗共選擇4項評價指標,分別是準確率、查準率、查全率以及查準率和查全率的加權平均值。各指標如公式(2)~公式(5)所示。
式中:為正確識別的正類樣本數(shù)量;為正確識別的負類樣本數(shù)量;為預測正類樣本的數(shù)量;為實際正類樣本的數(shù)量。
各項評價指標的計算結果見表2。
表2 分類評價指標統(tǒng)計
結合上表數(shù)據(jù)可以發(fā)現(xiàn),該算法模型平均分類正確率在90%以上,明顯高于人工判斷水平。在該基礎上,另外選擇2項指標TPR(真正例率)和FPR(假正例率)來判斷數(shù)學模型在故障識別方面的應用效果。2項指標如公式(6)、公式(7)所示。
根據(jù)公式(6)、公式(7)的計算結果繪制多分類的ROC曲線圖。二維圖以作為軸,以作為軸,如圖5所示。
圖5 多分類的ROC曲線
在多分類ROC曲線圖中,引入作為模型性能的評價指標。表示曲線的線下面積,越大,說明模型性能越好。其中,的取值范圍為[0,1]。由圖5可知,4條曲線的數(shù)值基本都維持在0.9左右,說明該算法模型對油色譜在線監(jiān)測裝置的4種常見故障均有良好的識別效果。綜合表2和圖5的數(shù)據(jù)可知,該文提出的基于ENN的故障識別算法能夠精準識別油色譜在線監(jiān)測裝置常見的倒油故障、載氣欠壓、色譜電氣故障和數(shù)據(jù)中斷故障,在輔助設備管理人員開展日常檢修和故障排查方面發(fā)揮了實用價值。
油色譜在線監(jiān)測裝置是保證電力變壓器穩(wěn)定、可靠運行的關鍵設備,如果該裝置發(fā)生故障,就不利于變壓器的檢修維護,增加了變壓器發(fā)生故障的概率。經(jīng)試驗證明,該文提出的一種基于最近鄰編輯采樣法的故障識別技術可以對油色譜在線監(jiān)測裝置的幾種常見故障進行準確識別,識別精度維持在90%以上。該技術的應用可以及時發(fā)現(xiàn)油色譜在線監(jiān)測裝置的異常工況和潛在故障,可以保證在線監(jiān)測裝置的正常運行。