郭宏宇,霍志紅,許 昌,吾買爾·吐爾遜,周華建,程志明
(1.河海大學(xué) 能源與電氣學(xué)院,江蘇 南京 211100;2.新疆農(nóng)業(yè)大學(xué) 水利與土木工程學(xué)院,新疆 烏魯木齊830052;3.河海大學(xué) 水利水電學(xué)院,江蘇 南京 210098)
作為一種清潔能源,風(fēng)能已在世界范圍內(nèi)被廣泛應(yīng)用[1]。世界風(fēng)能協(xié)會(huì)(WWEA)于2021年初公布的風(fēng)力發(fā)電統(tǒng)計(jì)相關(guān)數(shù)據(jù)顯示,2020年全球風(fēng)力發(fā)電總裝機(jī)容量已達(dá)744GW,其中我國以累計(jì)總裝機(jī)容量290GW位居榜首[2]。
風(fēng)電機(jī)組通常處于惡劣且復(fù)雜多變的工作環(huán)境,易受不穩(wěn)定載荷等不可控因素的影響,這增加了風(fēng)電機(jī)組發(fā)生故障的概率。故障診斷技術(shù)能幫助運(yùn)行維護(hù)人員及時(shí)發(fā)現(xiàn)異常并做出相應(yīng)的處理,從而延長風(fēng)電機(jī)組的運(yùn)行壽命。風(fēng)電場監(jiān)控與數(shù)據(jù)采集系統(tǒng)(SCADA)多被用來采集風(fēng)電機(jī)組運(yùn)行的關(guān)鍵參數(shù),為風(fēng)電機(jī)組狀態(tài)運(yùn)行分析與故障診斷提供可靠的數(shù)據(jù)支撐[3]。
在風(fēng)電機(jī)組故障診斷領(lǐng)域的傳統(tǒng)算法中,人工神經(jīng)網(wǎng)絡(luò)(ANN)是通過模仿人類大腦神經(jīng)處理信息的方式搭建訓(xùn)練網(wǎng)絡(luò);支持向量機(jī)(SVM)是一種以統(tǒng)計(jì)學(xué)習(xí)理論為理論框架的機(jī)器學(xué)習(xí)算法;極限學(xué)習(xí)機(jī)(ELM)以單隱含層前饋神經(jīng)網(wǎng)絡(luò)為理論基礎(chǔ)。TuerxunW[4]采用SSA對(duì)SVM的參數(shù)選取進(jìn)行優(yōu)化后,構(gòu)建了SSA-SVM分類模型,提高了模型的故障分類準(zhǔn)確率。
隨著大數(shù)據(jù)、深度神經(jīng)網(wǎng)絡(luò)等新技術(shù)的出現(xiàn),誕生了許多基于深度神經(jīng)網(wǎng)絡(luò)的風(fēng)電機(jī)組故障診斷方法。王洪斌[5]利用深度置信網(wǎng)絡(luò)(DBN)算法對(duì)風(fēng)電機(jī)組主軸承狀態(tài)進(jìn)行分類,并有效提高了分類的準(zhǔn)確率。吳定會(huì)[6]在卷積神經(jīng)網(wǎng)絡(luò)(CNN)算法的基礎(chǔ)上,提出了風(fēng)電機(jī)組軸承狀態(tài)分辨模型,提高了模型的分辨精度,縮短了網(wǎng)絡(luò)的訓(xùn)練時(shí)間。王超[7]提出了基于長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTMNN)算法的風(fēng)力機(jī)齒輪箱軸承故障診斷模型,用數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證,表明該模型明顯提高了齒輪箱軸承故障的分類精度。
深度神經(jīng)網(wǎng)絡(luò)的深層結(jié)構(gòu)模型復(fù)雜,涉及到大量的超參數(shù),使得網(wǎng)絡(luò)的迭代次數(shù)較多,網(wǎng)絡(luò)訓(xùn)練緩慢,且易陷入局部最優(yōu)解。深度神經(jīng)網(wǎng)絡(luò)為了獲得更高的精度,不斷疊加深層結(jié)構(gòu)的層數(shù),導(dǎo)致整個(gè)模型結(jié)構(gòu)復(fù)雜且難以進(jìn)行深層結(jié)構(gòu)的理論分析。為了克服這些問題,文獻(xiàn)[8],[9]提出了寬度學(xué)習(xí)系統(tǒng)(BLS),它不僅結(jié)構(gòu)簡單、訓(xùn)練速度快、準(zhǔn)確率高,而且還具有增量學(xué)習(xí)的優(yōu)勢(shì)[10]。本文在BLS算法的基礎(chǔ)上,提出了一種基于BLS的風(fēng)電機(jī)組故障診斷方法,并以風(fēng)電機(jī)組故障數(shù)據(jù)作為試驗(yàn)數(shù)據(jù)進(jìn)行分類診斷測試,分別比較了BP,SVM,ELM,DBN和BLS診斷模型的故障分類性能。
BLS是基于隨機(jī)向量函數(shù)連接神經(jīng)網(wǎng)絡(luò)提出的一種新型學(xué)習(xí)方法,在網(wǎng)絡(luò)結(jié)構(gòu)上與深度神經(jīng) 網(wǎng)絡(luò)有很大的不同,其結(jié)構(gòu)如圖1所示。
圖1 BLS結(jié)構(gòu)圖Fig.1 Structure of BLSmodel
式中:X為輸入層數(shù)據(jù);Wfi,Bfi分別為隨機(jī)權(quán)重和偏置,一般通過稀疏自動(dòng)編碼器進(jìn)行微調(diào)產(chǎn)生最優(yōu)值;θi為線性或非線性激活函數(shù);Zi為含有p個(gè)神經(jīng)元的第i組特征節(jié)點(diǎn)。
獲得Zn之后,利用它可計(jì)算Hm。
式中:Hj為含有q個(gè)神經(jīng)元的第j組增強(qiáng)節(jié)點(diǎn);ξj為非線性激活函數(shù);Whj,Bhj分別為隨機(jī)權(quán)重和偏置。
通過進(jìn)一步計(jì)算可以得到寬度學(xué)習(xí)模型。
式中:A為Zn和Hm聯(lián)合構(gòu)成的隱藏層矩陣;Wm為由A到輸出層Y之間的權(quán)值。
在寬度學(xué)習(xí)系統(tǒng)網(wǎng)絡(luò)中,Wfi,Bfi,Whj,Bhj等參數(shù)是隨機(jī)產(chǎn)生的,并通過稀疏自動(dòng)編碼器進(jìn)行微調(diào),而且在訓(xùn)練過程中保持不變。在網(wǎng)絡(luò)結(jié)構(gòu)中,只有Wm是需要訓(xùn)練學(xué)習(xí)的。BLS的目標(biāo)函數(shù)為
式中:λ為正則化系數(shù);Y為輸出量;AT為A的轉(zhuǎn)置矩陣;I為單位矩陣;A+為A的偽逆矩陣。
‖A Wm-Y‖用于控制訓(xùn)練誤差最小化,λ‖Wm‖用于防止模型過擬合。
Residue determination of dioxane in cosmetics by GC-QQQ-MS/MS with standard addition-internal standard correction method 4 24
風(fēng)電機(jī)組故障寬度學(xué)習(xí)診斷模型的計(jì)算步驟如下所示。
①導(dǎo)入SCADA數(shù)據(jù):首先對(duì)原SCADA數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行特征選擇,歸一化后導(dǎo)入到診斷模型中。
②訓(xùn)練集、測試集的劃分:根據(jù)研究情況對(duì)導(dǎo)入的SCADA數(shù)據(jù)進(jìn)行劃分,導(dǎo)入數(shù)據(jù)的70%為訓(xùn)練集,30%為測試集。
③設(shè)置BLS網(wǎng)絡(luò)的相關(guān)參數(shù):主要包括特征點(diǎn)數(shù)量n、增強(qiáng)點(diǎn)數(shù)量m、某一個(gè)特征點(diǎn)Zi的p、某一個(gè)增強(qiáng)點(diǎn)Hj的q和λ。
④訓(xùn)練集Zn和Hm計(jì)算:利用式(1),(2)采用訓(xùn)練集作為輸入量計(jì)算BLS的Zn和Hm。
⑤計(jì)算Wm和相關(guān)誤差(‖Y?-Y‖2):利用式(3),(4)計(jì)算BLS隱藏層到輸出層之間的Wm和‖Y?-Y‖2。
⑥若誤差滿足要求則執(zhí)行⑦,否則跳轉(zhuǎn)執(zhí)行③。
⑦測試集Zn和Hm計(jì)算:利用式(1),(2)采用測試集輸入量計(jì)算BLS的Zn和Hm。
⑧故障分類計(jì)算:Ytest=HtestWm。
⑨輸出結(jié)果:以圖表形式輸出故障分類結(jié)果并與實(shí)際結(jié)果進(jìn)行對(duì)比。
計(jì)算流程如圖2所示。
圖2 寬度學(xué)習(xí)算法的計(jì)算流程圖Fig.2 BLS flow chart
本文采用內(nèi)蒙古某風(fēng)電場20160531-20170430連續(xù)365 d的SCADA數(shù)據(jù)作為故障分析樣本數(shù)據(jù)。對(duì)這些數(shù)據(jù)進(jìn)行消除、清洗、篩選等預(yù)處理后,選取風(fēng)電機(jī)組的發(fā)電機(jī)過熱(S1)、變流器冷卻系統(tǒng)故障(S2)、勵(lì)磁故障(S3)、饋電故障(S4)和正常(S5)5種狀態(tài)作為分類診斷狀態(tài)。每個(gè)狀態(tài)選取200個(gè)樣本,其中140個(gè)樣本用于訓(xùn)練、60個(gè)樣本用于測試,共選取700個(gè)訓(xùn)練樣本,300個(gè)測試樣本。在風(fēng)電機(jī)組的5種狀態(tài)下,用隨機(jī)森林的袋外估計(jì)功能,對(duì)SCADA數(shù)據(jù)的特征量進(jìn)行重要性排序后,最終提取環(huán)境溫度、平均風(fēng)速等27個(gè)具有代表性的特征量。樣本歸一化后的部分特征值如表1所示。
表1 風(fēng)電機(jī)組5種狀態(tài)下的樣本特征值Table 1 Samples of five states characteristics of wind turbines
續(xù)表1
在BLS中,通過調(diào)整{n,p,m,q}和λ等參數(shù)可以提高模型精度。其中,{n,p,m,q}與BLS網(wǎng)絡(luò)的結(jié)構(gòu)有關(guān),可隨機(jī)選取,一般采用網(wǎng)格搜索法找到合適的取值范圍;λ一般取很小的值。在{n,p,m,q}值不變的前提下,通過調(diào)整模型的λ,得到了BLS模型的故障分類準(zhǔn)確率(圖3)。由圖3可知,當(dāng)λ=2-30時(shí),BLS模型的故障分辨精度最高。
圖3 λ參數(shù)變化對(duì)模型分類準(zhǔn)確率的影響Fig.3 Changes ofλand BLSmodel classification accuracy
在使用BLS模型時(shí),{n,p,m,q}與λ的選取如下,n取值為100,m取值為600,p設(shè)定為20,q取80,λ的取值則是選用上述在模型調(diào)整過程中能達(dá)到模型故障分辨精度最高的值,即λ=2-30。
為了直觀地體現(xiàn)BP,SVM,ELM,DBN和BLS模型的故障識(shí)別能力,分別繪制每一種診斷模型的混淆矩陣(圖4)。混淆矩陣對(duì)角線元素表示能準(zhǔn)確分類的樣本個(gè)數(shù),對(duì)角線元素?cái)?shù)量越多,則模型的分類性能越好。非對(duì)角線元素表示錯(cuò)分類的樣本個(gè)數(shù),如果元素全為零,則是一個(gè)完美的分類器。
圖4 5種診斷模型的混淆矩陣Fig.4 Confusionmatrices of the five diagnosticmodels
由圖4可知:BP模型能夠準(zhǔn)確地分類S2和S5,但會(huì)把部分實(shí)際的S1預(yù)測為S3,實(shí)際的S3預(yù)測為S4,實(shí)際的S4預(yù)測為S2,在300個(gè)測試樣本中,能準(zhǔn)確分類269個(gè);SVM模型能準(zhǔn)確分類282個(gè),對(duì)于S1和S3存在部分故障數(shù)據(jù)的類別判斷錯(cuò)誤;ELM模型能準(zhǔn)確分類287個(gè),同樣對(duì)于S1和S3存在部分?jǐn)?shù)據(jù)的判斷錯(cuò)誤,但判斷錯(cuò)誤的組數(shù)少于SVM,分類性能稍優(yōu);DBN模型對(duì)于S1和S3仍不能做到全部準(zhǔn)確分類,但分類錯(cuò)誤較少,能準(zhǔn)確分類294個(gè);BLS模型只有S3的兩個(gè)樣本錯(cuò)判為S4,在300個(gè)測試樣本中,能準(zhǔn)確分類298個(gè),分類效果最好。
為了進(jìn)一步評(píng)價(jià)模型的診斷性能,計(jì)算每一種模型的精度、召回率、F1值、準(zhǔn)確率和算法運(yùn)行時(shí)間(表2)。
表2 故障診斷模型的性能指標(biāo)表Table 2 Performance indicators of fault diagnosticmodel
由表2可知:BLS模型的精度、召回率、F1值等性能指標(biāo)均高于其它診斷模型,模型的分類性能較好,且由于寬度學(xué)習(xí)系統(tǒng)采用的是高效的增量學(xué)習(xí),整個(gè)算法的運(yùn)行時(shí)間遠(yuǎn)小于其他算法;BLS模型診斷準(zhǔn)確率為99.33%,運(yùn)行時(shí)間為0.329 s,能夠較好地完成對(duì)風(fēng)電機(jī)組故障的診斷。
本文結(jié)合風(fēng)電機(jī)組SCADA故障數(shù)據(jù)的時(shí)空相關(guān)性,提出了基于BLS的故障診斷模型。首先,對(duì)風(fēng)電場SCADA數(shù)據(jù)進(jìn)行預(yù)處理、特征選擇后構(gòu)成故障樣本集;然后,采用BLS模型對(duì)這些故障樣本進(jìn)行分類。結(jié)果表明,該模型的分類準(zhǔn)確率以及運(yùn)行速度,均優(yōu)于BP,SVM,ELM和DBN模型,最后在測試集上的分類準(zhǔn)確率達(dá)到了99.33%,運(yùn)行時(shí)間僅為0.329 s。