趙志新,趙宗羅,趙 穎,王子凌,俞建飛,李忠民
(1.國網(wǎng)浙江富陽市供電有限公司,杭州 311400;2.國網(wǎng)浙江省電力有限公司電力科學研究院,杭州 310014;3.西安交通大學 電氣工程學院,西安 710049)
作為電力系統(tǒng)的重要組成部分,配電網(wǎng)承擔了由電網(wǎng)主干部分向各實際用電客戶分配電能的重要任務。與主網(wǎng)相比,配電網(wǎng)發(fā)展相對落后,整體架構較為薄弱,網(wǎng)絡拓撲結構較為單一,故障率較高。據(jù)相關統(tǒng)計,配電網(wǎng)故障造成的電網(wǎng)區(qū)域性停電事故占比達80%以上[1]。因此,保障配電網(wǎng)的穩(wěn)定運行,是進一步提升電網(wǎng)可靠性及供電質(zhì)量的重要途徑[2]。對于配電變壓器各類故障的檢修工作,目前仍以預防性檢修及故障后搶修方式為主。上述方式存在明顯的弊端:定期檢修方式存在檢修不及時、檢修過度等問題;故障后搶修屬應急維修手段,故障問題已經(jīng)造成實際經(jīng)濟損失。隨著電網(wǎng)投資逐步向配電網(wǎng)傾斜[3],各類多運用于主網(wǎng)的設備在線監(jiān)測技術,如油中溶解氣體分析、電能質(zhì)量檢測、局部放電監(jiān)測及紅外成像監(jiān)測技術,逐步在配電網(wǎng)設備運維工作中推廣使用。集成配電網(wǎng)設備狀態(tài)監(jiān)測、運行調(diào)度等數(shù)據(jù)的統(tǒng)一化信息平臺也已初步建立,但相關技術在配電網(wǎng)設備狀態(tài)檢修中的應用仍處于起步階段。
就配電變壓器而言,實現(xiàn)其狀態(tài)檢修的關鍵在于開展設備故障預測與診斷工作,以準確判斷其運行狀態(tài),并依此輔助制定檢修策略。
配電變壓器故障一般可按故障發(fā)生位置劃分為外部故障和內(nèi)部故障兩大類,外部故障即變壓器油箱、套管及引線等裸露部分出現(xiàn)的故障,內(nèi)部故障包括各類變壓器箱體內(nèi)部的放電及過熱故障[4]。目前,配電變壓器故障監(jiān)測及診斷手段包括絕緣油試驗、局部放電試驗及紅外成像試驗等,其中DGA(溶解氣體分析)技術由于不受外部環(huán)境因素的干擾,是有效的內(nèi)部故障監(jiān)測手段。DGA 基于油中溶解氣體類型與內(nèi)部故障的對應關系,采用氣相色譜儀分析溶解于油中的氣體,根據(jù)氣體的組分和含量來判斷變壓器內(nèi)部有無異常情況,并判斷故障類型、大概部位、嚴重程度和發(fā)展趨勢,能夠?qū)崿F(xiàn)變壓器的不停電檢測和早期故障診斷,并在此基礎上發(fā)展出了三比值法和特征氣體判別法等故障判斷方法。另一方面,隨著信息智能化處理技術的廣泛應用,國內(nèi)外學者結合數(shù)據(jù)挖掘技術,如ANN(人工神經(jīng)網(wǎng)絡)[5-7]、SVM(支持向量機)[8-11]及貝葉斯網(wǎng)絡[12-15]等,提出了許多基于DGA 的變壓器智能故障診斷方法。其中以基于ANN 方法的設備故障診斷技術應用最為廣泛,但目前該類方法存在一些共性問題,包括網(wǎng)絡訓練時的收斂速度較慢、分類結果易陷入局部最優(yōu)值等[16-17],不利于實際應用。
針對目前基于ANN 方法的變壓器故障診斷技術存在的主要問題,本文提出一種基于MapReduce 并行化的BP(反向傳播)神經(jīng)網(wǎng)絡算法——MR-BPNN 算法,以實現(xiàn)對于配電變壓器故障的快速診斷,并借助Hadoop 平臺實現(xiàn)MR-BPNN的優(yōu)化運行。最后,基于所采集的某電力公司配電變壓器油中溶解氣體數(shù)據(jù),驗證所提方法運用于設備故障診斷時的有效性。
ANN 按學習策略可粗略地分為兩大類:有監(jiān)督的ANN 和無監(jiān)督的ANN。
BP 神經(jīng)網(wǎng)絡是一種典型的有監(jiān)督前饋型ANN,由非線性變換神經(jīng)單元組成,一般呈現(xiàn)多層結構,具備優(yōu)秀的非線性映射逼近能力與預測性能。
神經(jīng)元(Neuron)也稱為節(jié)點(Node),是ANN的基本單元,同層中的神經(jīng)元具有相同的非線性轉(zhuǎn)換函數(shù),不同層的神經(jīng)元則可能具有相同或不同的非線性轉(zhuǎn)換函數(shù)。組成BP 神經(jīng)網(wǎng)絡的神經(jīng)元模型如圖1 所示,主要由5 部分組成:
圖1 BP 神經(jīng)網(wǎng)絡神經(jīng)元模型
1)輸入。x1,x2,x3,…,xp為神經(jīng)元的p 個輸入變量。
2)網(wǎng)絡權值與閾值。x1,x2,x3,…,wp為網(wǎng)絡權值;b 為神經(jīng)元的閾值(或者稱為偏置值)。
3)求和模塊。
4)傳遞函數(shù)f。對求和模塊的計算結果進行函數(shù)運算,得到神經(jīng)元的輸出。
5)輸出。輸入變量經(jīng)神經(jīng)元加權求和,得到最終的輸出o=f(wx+b)。
BP 神經(jīng)網(wǎng)絡一般由輸入層、隱含層和輸出層組成。圖2 描述了典型的3 層BP 神經(jīng)網(wǎng)絡的拓撲結構,其中圓圈表示神經(jīng)元。
圖2 三層BP 神經(jīng)網(wǎng)絡的拓撲結構
數(shù)據(jù)經(jīng)過標準化處理后,由BP 神經(jīng)網(wǎng)絡的輸入層輸入,再經(jīng)施以權重后傳輸?shù)诫[含層,數(shù)據(jù)在隱含層進行權值和閾值的調(diào)整以及激勵函數(shù)的運算,并將處理好的數(shù)據(jù)傳輸?shù)捷敵鰧?,由輸出層輸出?shù)據(jù)的預測值,將此預測值和期望值相比,如果有誤差,則將誤差從輸出層反向傳播,根據(jù)誤差的大小對權值和閾值進行相應的調(diào)整,使BP 神經(jīng)網(wǎng)絡的輸出逐漸與期望值一致。
直接采用BP 神經(jīng)網(wǎng)絡進行色譜數(shù)據(jù)分析時,學習過程誤差收斂速度較慢,權值的調(diào)整可能需要數(shù)萬次才能收斂,計算量龐大,故本文提出采用Hadoop 集群計算平臺,從而實現(xiàn)BP 神經(jīng)網(wǎng)絡的并行化計算,大幅度提升訓練效率。
Hadoop 是 由Apache Software Foundation 公司開發(fā)的開源集群計算平臺軟件框架,可以讓用戶在廉價的計算機集群上部署運行。Hadoop 為程序的分布式運行提供了大量的接口和服務。Hadoop 由9 個項目構成,如圖3 所示,每個項目的功能如表1 所示。
表1 Hadoop 組成項目功能
圖3 Hadoop 的組成結構
Hadoop 集群計算平臺中的MapReduce 模型是本文的應用重點,其由Map 和Reduce 兩階段組成,Map 階段對任務進行分解,Reduce 階段對子任務結果進行匯總。HDFS(分布式文件系統(tǒng))負責數(shù)據(jù)存儲,當獲得大型數(shù)據(jù)集后,首先要存儲到HDFS 中,實際文件存儲到集群中的多個節(jié)點上,然后再經(jīng)MapReduce 將數(shù)據(jù)集分成更小的數(shù)據(jù)塊進行處理。
對于BP 神經(jīng)網(wǎng)絡而言,MapReduce 并行化包括兩個過程:第一個是Map 過程,該過程將數(shù)據(jù)集分成多個數(shù)據(jù)塊,每個數(shù)據(jù)塊作用于一個計算節(jié)點中的神經(jīng)網(wǎng)絡,計算節(jié)點中的神經(jīng)網(wǎng)絡訓練數(shù)次后滿足收斂條件則輸出神經(jīng)網(wǎng)絡權值;第二個過程是Reduce 過程,匯總Map 過程輸出的神經(jīng)網(wǎng)絡權值,若權值偏移量小于一定的閾值,則停止迭代,輸出最終結果。以下對上述過程的設計進行詳細闡述。
在Map 過程中,計算節(jié)點從HDFS 中讀取神經(jīng)網(wǎng)絡初始權值,然后根據(jù)初始權值設定一個BP 神經(jīng)網(wǎng)絡,并讀取訓練樣本數(shù)據(jù)塊,訓練BP神經(jīng)網(wǎng)絡,當訓練達到收斂條件后,就認為在該計算節(jié)點上基于該訓練樣本數(shù)據(jù)塊訓練的網(wǎng)絡收斂。Map 以一組鍵值對
圖4 BP 神經(jīng)網(wǎng)絡的Map 流程
Reduce 過程的輸入是Map 過程輸出的鍵值對組,獲取Map 輸出的網(wǎng)絡權值,并根據(jù)value的數(shù)目和value 的累加和計算權值的算術平均值,然后讀取HDFS 中存儲的神經(jīng)網(wǎng)絡權值,將其與更新的權值對比,求差值。如果差值小于設定的閾值,則停止迭代,輸出權值;否則用訓練后的權值替代HDFS 中的權值,作為下次Map 迭代訓練任務的初始權值。并行化BP 神經(jīng)網(wǎng)絡的Reduce 流程如圖5 所示。
圖5 BP 神經(jīng)網(wǎng)絡的Reduce 流程
為了測試本文所提方法的性能,以下通過針對配電變壓器的故障診斷實例進行說明,所使用的數(shù)據(jù)來自于某電力公司2015—2020 年的配電變壓器檢測數(shù)據(jù),挑選其中的357 臺配電變壓器共計2 642 條數(shù)據(jù)作為樣本數(shù)據(jù)集。
初始化階段首先選取配電變壓器油中溶解氣體H2,CO,CO2,CH4,C2H6,C2H4,C2H2和 總 烴的含量數(shù)據(jù)作為網(wǎng)絡的輸入。對于所采集的任意類型氣體數(shù)據(jù),均采用極大-極小法進行歸一化:
式中:xi為任意種類的氣體含量值;為xi經(jīng)歸一化處理后的值;max(xi)為所有該類氣體含量值中的最大值;min(xi)為所有該類氣體含量值中的最小值。
在運用MR-BPNN 算法前,首先根據(jù)數(shù)據(jù)集特性確定隱含層節(jié)點的選擇方法。隱含層節(jié)點是為了從樣本數(shù)據(jù)中抽象出并存儲其隱含信息,節(jié)點數(shù)越少,神經(jīng)網(wǎng)絡的學習時間越短,學習過程中忽略的隱含信息越多,對樣本變化規(guī)律描述性能越差;相應地,隱含層節(jié)點數(shù)越多,存儲的信息就越多,但過多的節(jié)點數(shù)會導致神經(jīng)網(wǎng)絡的學習時間過長,學習過程中可能出現(xiàn)過度擬合問題,即將噪聲作為知識進行識別。隱含層節(jié)點數(shù)的確定取決于樣本的個數(shù)與維度,目前常用的方法為試湊法,即采用不同隱含層節(jié)點數(shù)進行訓練,選擇網(wǎng)絡誤差最小時的節(jié)點數(shù)。
通過計算不同隱含層節(jié)點數(shù)網(wǎng)絡的收斂性可以發(fā)現(xiàn),就本例而言,當隱含層節(jié)點數(shù)為10 時誤差曲線振蕩較小、收斂速度最快,因此確定隱含層節(jié)點數(shù)為10。測試過程在Hadoop 集群計算平臺上進行編程實現(xiàn),每種情況循環(huán)運行10 次,取各指標相應的均值。
設置隱含層節(jié)點數(shù)后,利用百葉窗分組策略將原始數(shù)據(jù)集隨機劃分為訓練集(占比80%)和驗證集(占比20%),訓練集用于訓練神經(jīng)網(wǎng)絡權值分配,驗證集用于評估模型分類性能。隨后需要確定輸出特征向量,為簡化說明,選擇過熱和電弧放電這兩個變壓器典型故障類型的發(fā)生概率作為神經(jīng)網(wǎng)絡的輸出向量,以0~1 的數(shù)值表示對應的故障程度,數(shù)值越大表示發(fā)生此類故障的概率越大,并設定該網(wǎng)絡輸出層神經(jīng)元節(jié)點數(shù)為2。
MR-BPNN 算法執(zhí)行過程中的參數(shù)變化情況如圖6 所示,包括均方誤差隨迭代次數(shù)變化曲線(性能曲線)、梯度變化曲線、檢驗錯誤數(shù)曲線以及學習率變化曲線等。
圖6 MR-BPNN 算法執(zhí)行過程中的參數(shù)變化情況
完成數(shù)據(jù)初始化及網(wǎng)絡訓練過程后,運用基于溶解氣體驗證集數(shù)據(jù),評估MR-BPNN 算法針對配電變壓器故障診斷的性能,并將診斷結果與特征氣體法、三比值法的診斷結果進行對比。表2 給出了不同方法針對部分典型樣本和部分特征氣體的故障診斷結果示例,表3 對比了MRBPNN 與BP 神經(jīng)網(wǎng)絡基于相同油中溶解氣體數(shù)據(jù)集實現(xiàn)故障診斷時的運行時間。
表3 MR-BPNN 與BP 神經(jīng)網(wǎng)絡實現(xiàn)配電變壓器故障
實驗結果顯示,基于給定驗證集,應用MRBPNN 算法、特征氣體法、三比值法對配電變壓器故障診斷的準確率分別為91.67%,58.33%和75%。由表2 中典型診斷結果可見:由于三比值法中提供的編碼是由實際案例總結得到,應用過程中編碼缺失問題較為嚴重,許多情況下無法得到診斷結果;特征氣體法存在無法全面反映故障狀況的問題,易產(chǎn)生誤判;相比其他兩種方法,采用MR-BPNN 算法對同一故障性質(zhì)進行判斷的準確率有顯著提高。另一方面,MapReduce 的引入將數(shù)據(jù)集進行了拆解,并為每個數(shù)據(jù)塊分配單獨的處理單元,同時集合Map 過程、Reduce 過程實現(xiàn)迭代過程的并行化,從而在相同故障診斷準確率的前提下提升收斂速度。
表2 典型故障診斷結果對比
通過對部分故障變壓器進行拆解檢修,進一步驗證了所提方法用于配電變壓器故障診斷時的準確性。以表2 中最后一行色譜數(shù)據(jù)所對應配電變壓器為例,其出現(xiàn)故障運行狀態(tài)后,油箱外觀正常,套管瓷瓶無破損,壓力釋放閥正常,油位計顯示油量不足。試驗人員首先對設備本體進行了多項試驗,結果表明:配電變壓器高壓側直流電阻、變比試驗及空載損耗測試結果不合格。通過對配電變壓器進行離線油色譜分析,發(fā)現(xiàn)H2,C2H2及總烴含量不合格,初步提示故障類型為電弧放電。隨后,對故障變壓器進行了吊芯解體,發(fā)現(xiàn)B 相繞組高壓側與下鐵軛之間有銅屑,切開后發(fā)現(xiàn)第5 層線圈開始出現(xiàn)擊穿部位,油道位于第5、第6 層線圈之間,證實故障類型為電弧放電,與本文方法診斷結果一致。
本文針對配電網(wǎng)設備狀態(tài)檢修工作中的設備故障快速診斷問題,提出了一種基于MapReduce并行化的BP 神經(jīng)網(wǎng)絡算法——MR-BPNN 算法。相比于傳統(tǒng)的特征氣體法和三比值法,該方法的故障判斷準確率明顯改善,且Map 和Reduce 過程的引入使其在相同故障診斷準確性前提下的算法執(zhí)行效率相較傳統(tǒng)BP 神經(jīng)網(wǎng)絡有顯著提升。MR-BPNN 算法可實現(xiàn)配電變壓器狀態(tài)的快速識別與診斷,為開展其狀態(tài)檢修工作打下良好的基礎。