曹力,潘巧波,王明宇,馬東
(華電電力科學(xué)研究院有限公司,杭州310030)
近年來(lái),風(fēng)電事業(yè)得到了長(zhǎng)足的發(fā)展,但風(fēng)電機(jī)組長(zhǎng)期工作在惡劣環(huán)境中,其中齒輪箱、發(fā)電機(jī)、葉輪等大部件的工作狀態(tài)直接影響整機(jī)的運(yùn)行性能[1-3]。因此采取有效的狀態(tài)監(jiān)測(cè)與故障診斷方法對(duì)關(guān)鍵部件進(jìn)行分析研究,預(yù)警故障并盡早開(kāi)展排查檢修工作,對(duì)于風(fēng)電機(jī)組的健康管理及能效提升有重要的指導(dǎo)意義。
發(fā)電機(jī)是風(fēng)電機(jī)組工作的關(guān)鍵環(huán)節(jié),承擔(dān)著機(jī)械能轉(zhuǎn)化為電能的功能,其工況比較復(fù)雜,發(fā)生故障后檢修周期長(zhǎng)、檢修難度大,許多專(zhuān)家針對(duì)發(fā)電機(jī)狀態(tài)監(jiān)測(cè)與故障診斷開(kāi)展了相應(yīng)的研究。文獻(xiàn)
[4]闡述了雙饋發(fā)電機(jī)組機(jī)械類(lèi)故障和電氣類(lèi)故障常用的信號(hào)分析技術(shù)。文獻(xiàn)[5]使用改進(jìn)粒子群優(yōu)化-反向傳播(IPSO-BP)算法建立齒輪箱正常工作狀態(tài)下的溫度模型并用于故障預(yù)測(cè),通過(guò)殘差分析實(shí)現(xiàn)預(yù)警。文獻(xiàn)[6]將極端梯度提升(XGBoost)模型與其他4類(lèi)回歸預(yù)測(cè)模型分別進(jìn)行齒輪箱溫度預(yù)測(cè)模型試驗(yàn),結(jié)果表明XGBoost 模型在齒輪箱溫度預(yù)測(cè)中綜合性能要優(yōu)于其他4 類(lèi)模型。文獻(xiàn)[7]提出一種堆疊自編碼網(wǎng)絡(luò)深度方法,使用自適應(yīng)閾值監(jiān)測(cè)重構(gòu)誤差的趨勢(shì)變化,實(shí)現(xiàn)對(duì)故障的判定。上述文獻(xiàn)在研究時(shí)或用信號(hào)分析手段,或用機(jī)器學(xué)習(xí)算法,從機(jī)理角度及數(shù)據(jù)角度對(duì)風(fēng)電機(jī)組齒輪箱、發(fā)電機(jī)工作狀態(tài)進(jìn)行了分析,均取得了一定的研究成果,但都存在建模學(xué)習(xí)難度大,狀態(tài)劣化時(shí)間點(diǎn)定位不準(zhǔn)確的問(wèn)題[8-10]。
支持向量機(jī)(SVM)是一類(lèi)按監(jiān)督學(xué)習(xí)方式對(duì)數(shù)據(jù)進(jìn)行二元分類(lèi)的廣義線性分類(lèi)器。它易于建模,對(duì)于風(fēng)電機(jī)組數(shù)據(jù)采集與監(jiān)視控制(SCADA)系統(tǒng)的數(shù)據(jù)有良好的適應(yīng)性,核函數(shù)支持向量機(jī)(KSVM)常用的有2 類(lèi)核函數(shù):多項(xiàng)式核函數(shù)(Polynomial Kernel)和 高 斯 核 函 數(shù)(Gaussian Kernel)[11-13]。高斯核函數(shù)可以把特征映射到無(wú)限多維,計(jì)算比較簡(jiǎn)單;但是高斯核函數(shù)存在計(jì)算速度慢,容易過(guò)擬合的缺點(diǎn)[14-15]。多項(xiàng)式核函數(shù)泛化能力強(qiáng),但是學(xué)習(xí)能力較弱。故可以將2 種核函數(shù)結(jié)合起來(lái),發(fā)揮各自的優(yōu)點(diǎn)。
本文提出一種基于混合核函數(shù)支持向量機(jī)(HK-SVM)的方法來(lái)對(duì)風(fēng)電機(jī)組發(fā)電機(jī)溫度進(jìn)行建模,計(jì)算理想值和實(shí)際值的差值,通過(guò)歷史良好的樣本數(shù)據(jù)確定監(jiān)測(cè)指標(biāo)閾值,再實(shí)時(shí)通過(guò)滑動(dòng)窗口計(jì)算有關(guān)指標(biāo),完成預(yù)警工作。
本文研究對(duì)象為河北某風(fēng)電場(chǎng)#134 和#74 機(jī)組,型號(hào)均為華銳SL1500/82,額定功率為1 500 kW,額定風(fēng)速為10.5 m/s。
選取#134機(jī)組2018年10月10日至2019年3月2 日共178 865 條數(shù)數(shù)據(jù)及#74 機(jī)組2018 年8 月10日至2019年3月2日共248 125條數(shù)據(jù)進(jìn)行研究,采集頻率均為1 min/次。2 臺(tái)機(jī)組故障檢修記錄見(jiàn)表1。
表1 2臺(tái)機(jī)組故障檢修記錄Tab.1 Troubleshooting records of the two units
支持向量機(jī)通過(guò)尋找一個(gè)超平面將2類(lèi)樣本點(diǎn)切割開(kāi),可用于回歸問(wèn)題。給定訓(xùn)練數(shù)據(jù)集
式中:xi和yi分別代表樣本點(diǎn)的輸入和輸出,i=1,2,…,m。訓(xùn)練以期望得到一個(gè)回歸模型f(x)=ωTx+b,使得f(x)與y的差值盡可能小,ω和b是表征超平面的參數(shù)。和傳統(tǒng)模型計(jì)算輸出f(x)與y的差值來(lái)衡量損失不同,支持向量回歸(SVR)假設(shè)我們能允許f(x)與y之間最多存在ε的誤差,當(dāng)且僅當(dāng)f(x)與y之間差的絕對(duì)值大于ε時(shí)才計(jì)算損失。SVR 問(wèn)題可寫(xiě)作
式中:C為正則化常數(shù);lε表示損失函數(shù),表達(dá)式為
引入松弛變量ξi,,則式(2)變?yōu)?/p>
滿(mǎn)足約束條件:
引入拉格朗日乘子:
得到下面的拉格朗日函數(shù):
令式(5)對(duì)ω,b,ξi,的偏導(dǎo)數(shù)為0,可得
將式(6)代入式(5),得到SVR對(duì)偶問(wèn)題:
滿(mǎn)足約束條件:
上述過(guò)程滿(mǎn)足的庫(kù)恩塔克條件(KKT)為
SVR解為
完成以上求解的一個(gè)基礎(chǔ)是使用核函數(shù)將樣本點(diǎn)映射到高緯度特征空間。傳統(tǒng)向量機(jī)選用核函數(shù)要求必備一定的先驗(yàn)知識(shí),否則只能憑借經(jīng)驗(yàn)或者湊試法來(lái)選擇誤差最小的核函數(shù)。本研究使用多項(xiàng)式核函數(shù)、高斯核函數(shù)的混合核函數(shù)進(jìn)行處理。表達(dá)式為
式中:kGauss為高斯核函數(shù);xGauss為高斯核函數(shù)的輸入值;x'Gauss為高斯核函數(shù)輸入值的特定變換值;kPoly為多項(xiàng)式核函數(shù);xPoly為多項(xiàng)式核函數(shù)的輸入值;x'Poly為多項(xiàng)式核函數(shù)輸入值的特定變換值。
選用混合核函數(shù)支持向量機(jī)進(jìn)行發(fā)電機(jī)預(yù)警,流程如圖1所示。
圖1 發(fā)電機(jī)預(yù)警流程Fig.1 Flowchart of the generator warning system
2.2.1 輸入?yún)?shù)的確定
回歸問(wèn)題需要確定輸入量及輸出量,本研究的輸出量為發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度。選取輸入量時(shí)應(yīng)考慮其對(duì)于輸出量的影響程度。用相關(guān)系數(shù)r表征為
式中:x和y為2 個(gè)不同的樣本集;σx和σy分別為x和y的標(biāo)準(zhǔn)差,σxy為x和y的協(xié)方差,n為樣本容量。
分別計(jì)算#134 機(jī)組和#74 機(jī)組的SCADA 數(shù)據(jù)中42 個(gè)參數(shù)與發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度兩兩相關(guān)的系數(shù),選取部分參數(shù)的相關(guān)系數(shù),見(jiàn)表2。
表2 發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度與部分參數(shù)的相關(guān)系數(shù)Tab.2 Correlation coefficient of the generator bearingtemperature at driving end and some parameters
考慮冗余性能,最終確定輸入?yún)?shù)為發(fā)電機(jī)轉(zhuǎn)速、機(jī)艙溫度、風(fēng)速、非驅(qū)動(dòng)端軸承溫度。
2.2.2 各類(lèi)核函數(shù)支持向量機(jī)訓(xùn)練
選用#134 機(jī) 組2018 年10 月10 日至11 月10 日共35 848 條數(shù)據(jù)及#74 機(jī)組2018 年8 月5 日至10 月10 日共71 893 條數(shù)據(jù)進(jìn)行支持向量機(jī)回歸訓(xùn)練。分別選用高斯核函數(shù)、多項(xiàng)式核函數(shù)、混合核函數(shù)來(lái)進(jìn)行訓(xùn)練。需要說(shuō)明的是,原始數(shù)據(jù)在訓(xùn)練時(shí)需要經(jīng)過(guò)去除異常值(如超正常范圍點(diǎn)、零點(diǎn)值等)的處理;同時(shí),考慮到不同參數(shù)之間量綱不同,取值范圍存在較大差異,整個(gè)訓(xùn)練分析過(guò)程中均對(duì)所有數(shù)據(jù)進(jìn)行歸一化處理,確保建模的有效性。
訓(xùn)練過(guò)程中采用KFold 函數(shù)交叉驗(yàn)證,將原始數(shù)據(jù)分成k組,將每個(gè)子集數(shù)據(jù)分別做一次驗(yàn)證集,其余的k-1組子集數(shù)據(jù)作為訓(xùn)練集,這樣會(huì)得到k個(gè)模型。這k個(gè)模型分別在驗(yàn)證集中評(píng)估,結(jié)果用泛化誤差表示。將泛化誤差加權(quán)平均得到交叉驗(yàn)證誤差,然后使用泛化誤差和交叉驗(yàn)證誤差計(jì)算每個(gè)模型的平均泛化誤差,選擇平均泛化誤差最小的模型作為結(jié)果模型。
最后,使用若干指標(biāo)評(píng)定不同核函數(shù)的訓(xùn)練效果,見(jiàn)表3。表3中,R2為決定系數(shù),值越接近1,說(shuō)明模型擬合效果越好;RMSE 為均方根誤差,值越小說(shuō)明擬合值和實(shí)際值越接近。
表3 幾類(lèi)核函數(shù)支持向量機(jī)訓(xùn)練效果Tab.3 Training performance of support vector machines using various kernel functions
訓(xùn)練結(jié)果說(shuō)明如下:
(1)使用混合核函數(shù)的支持向量機(jī)的R2及RMSE 指標(biāo)接近于使用高斯核函數(shù)的支持向量機(jī),兩者均優(yōu)于使用多項(xiàng)式核函數(shù)的支持向量機(jī);
(2)使用多項(xiàng)式核函數(shù)的支持向量機(jī)訓(xùn)練時(shí)間與使用高斯核函數(shù)的支持向量機(jī)接近,均短于使用混合核函數(shù)的支持向量機(jī)。
研究過(guò)程中選用的訓(xùn)練數(shù)據(jù)經(jīng)查驗(yàn)無(wú)故障停機(jī)記錄,數(shù)據(jù)本身也能覆蓋機(jī)組大部分正常工作區(qū)間。當(dāng)機(jī)組參數(shù)位于正常工作區(qū)間時(shí),輸入與發(fā)電機(jī)軸承溫度有關(guān)的4 個(gè)參數(shù),應(yīng)該能輸出1 個(gè)處于正常范圍的發(fā)電機(jī)軸承溫度值。當(dāng)發(fā)電機(jī)軸承溫度發(fā)生異常,實(shí)際值與模型輸出的預(yù)測(cè)值的差值會(huì)變大,通過(guò)監(jiān)測(cè)這種殘差的變化,對(duì)發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度的狀態(tài)進(jìn)行分析。
選用上一節(jié)訓(xùn)練好混合核函數(shù)支持向量機(jī)對(duì)全段數(shù)據(jù)集進(jìn)行測(cè)試,測(cè)試結(jié)果如圖2、圖3所示。
圖2 #134機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度趨勢(shì)圖(混合核函數(shù))Fig.2 Temperature trend of the bearing at the driving end of generator in No.134 unit(hybrid kernel)
圖3 #74機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度趨勢(shì)圖(混合核函數(shù))Fig.3 Temperature trend of the bearing at the driving end of generator in No.74 unit(hybrid kernel)
圖2 和圖3 中橫坐標(biāo)點(diǎn)數(shù)代表按照時(shí)間排列的數(shù)據(jù)序列位置(文中其余示意圖橫坐標(biāo)為點(diǎn)數(shù)的意義也相同)。由圖2 可知#134 機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度預(yù)測(cè)值和實(shí)際值的情況??梢?jiàn)在95 000 點(diǎn)(對(duì)應(yīng)時(shí)間為2018年12月15日)左右殘差已經(jīng)有增大趨勢(shì)。113 429 點(diǎn)(對(duì)應(yīng)時(shí)間為2018 年12 月28日)為臺(tái)賬報(bào)發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度過(guò)高的點(diǎn)。結(jié)果表明殘差分析能提前13 d 發(fā)現(xiàn)發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度的異常變化。由圖3 可知#74 機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度預(yù)測(cè)值和實(shí)際值的情況。可見(jiàn)在175 035 點(diǎn)(對(duì)應(yīng)時(shí)間為2019 年1 月3 日)左右殘差已經(jīng)有增大且波動(dòng)加劇的趨勢(shì)。195 233點(diǎn)(對(duì)應(yīng)時(shí)間為2019年1月17日)為臺(tái)賬報(bào)發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度過(guò)高的點(diǎn)。結(jié)果表明,殘差分析能提前14 d 發(fā)現(xiàn)發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度的異常變化。
作為對(duì)比,選用上一節(jié)訓(xùn)練好的高斯核函數(shù)支持向量機(jī)對(duì)全段數(shù)據(jù)進(jìn)行測(cè)試,測(cè)試結(jié)果如圖4、圖5所示。
圖4 #134機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度趨勢(shì)圖(高斯核函數(shù))Fig.4 Temperature trend of the bearing at the driving end of generator in No.134 unit(Gaussian kernel)
圖5 #74機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度趨勢(shì)圖(高斯核函數(shù))Fig.5 Temperature trend of the bearing at the driving end of generator in No.74 unit(Gaussian kernel)
由圖4可知#134機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度預(yù)測(cè)值和實(shí)際值的情況??梢?jiàn)在95 000 點(diǎn)(對(duì)應(yīng)時(shí)間為2018 年12 月15 日)左右殘差沒(méi)有明顯增大的趨勢(shì)。原因?yàn)楦咚购撕瘮?shù)支持向量機(jī)訓(xùn)練存在過(guò)擬合,導(dǎo)致軸承溫度升高時(shí)殘差的變化沒(méi)有被捕捉到。由圖5 可知#74 機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度預(yù)測(cè)值和實(shí)際值的情況??梢?jiàn)在175 035 點(diǎn)(對(duì)應(yīng)時(shí)間為2019 年1 月3 日)左右殘差沒(méi)有明顯增大的趨勢(shì),并且臺(tái)賬報(bào)警點(diǎn)附近除了波動(dòng)較大,使得殘差分布較“稠密”外,殘差絕對(duì)值并不明顯區(qū)別于前期數(shù)據(jù)。同樣軸承溫度升高時(shí)殘差的變化沒(méi)有被捕捉到。
上述分析表明,混合核函數(shù)支持向量機(jī)能有效避免過(guò)擬合的情況發(fā)生,及時(shí)定位到狀態(tài)異常點(diǎn),綜合性能優(yōu)于高斯核函數(shù)支持向量機(jī)。
3.2.1 模型構(gòu)建
從上一節(jié)研究可知,如果選用發(fā)電機(jī)歷史良好的數(shù)據(jù)作為樣本訓(xùn)練,當(dāng)發(fā)電機(jī)軸承工作狀態(tài)發(fā)生變化時(shí),實(shí)際溫度會(huì)偏移訓(xùn)練模型給出的“理想值”。通過(guò)對(duì)二者的殘差進(jìn)行分析可以實(shí)現(xiàn)發(fā)電機(jī)軸承工作異常變化的預(yù)警。選取某時(shí)間段,發(fā)電機(jī)軸承溫度的殘差序列
式中:εi為某時(shí)間點(diǎn)殘差,i=1,2,…,n。
選擇長(zhǎng)度為N的滑動(dòng)窗口,連續(xù)計(jì)算窗口內(nèi)殘差的均值及標(biāo)準(zhǔn)差
選用滑動(dòng)窗口計(jì)算殘差序列的原因如下:
(1)采用滑動(dòng)窗口計(jì)算殘差序列,便于實(shí)時(shí)監(jiān)測(cè)發(fā)電機(jī)軸承溫度的動(dòng)態(tài)變化;
(2)滑動(dòng)窗口計(jì)算殘差序列的統(tǒng)計(jì)參數(shù),可以抑制孤立差值增大點(diǎn)的影響,排除偶然因素導(dǎo)致的誤判;
(3)通過(guò)合理的窗口設(shè)置,可以及時(shí)、迅速地發(fā)現(xiàn)發(fā)電機(jī)軸承工作狀態(tài)的變化,消除隨機(jī)影響。
除了殘差均值和標(biāo)準(zhǔn)差以外,還對(duì)窗口內(nèi)N個(gè)殘差計(jì)算超出閾值的比例,這個(gè)閾值包括上限閾值εmax及下限閾值εmin,均根據(jù)訓(xùn)練數(shù)據(jù)計(jì)算得來(lái)。為了較好地符合工程實(shí)際,應(yīng)用中可根據(jù)經(jīng)驗(yàn)進(jìn)行調(diào)整,即閾值標(biāo)準(zhǔn)為
式中:k1,k2是為運(yùn)行人員根據(jù)工程實(shí)際情況進(jìn)行調(diào)整的系數(shù)。
3.2.2 殘差統(tǒng)計(jì)分析
選擇窗口長(zhǎng)度為1 天(1 440 min),采樣頻率為1 min/次,閾值調(diào)整系數(shù)k1,k2均為1.5。對(duì)上述2 臺(tái)機(jī)組的殘差序列進(jìn)行窗口計(jì)算,結(jié)果如圖6、圖7所示。
由圖6 可知,#134 機(jī)組預(yù)警模型殘差超限比例在80 000 點(diǎn)(對(duì)應(yīng)時(shí)間為2018 年12 月5 日)附近開(kāi)始超過(guò)50%,90 000 點(diǎn)(對(duì)應(yīng)時(shí)間為2018 年12 月12日)后持續(xù)超過(guò)50%,大約提前23 d 實(shí)現(xiàn)預(yù)警。由圖7 可知,#74 機(jī)組預(yù)警模型殘差超限比例在150 000 點(diǎn)(對(duì)應(yīng)時(shí)間為2018 年12 月17 日)后開(kāi)始增加,在160 000點(diǎn)(對(duì)應(yīng)時(shí)間為2018年12月24日)附近開(kāi)始超過(guò)50%,大約提前24 d實(shí)現(xiàn)預(yù)警。
圖6 #134機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度殘差分析Fig.6 Analysis on the temperature residual of the bearing at generator driving end in No.134 unit
圖7 #74機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承溫度殘差分析Fig.7 Analysis on the temperature residual of the bearing at generator driving end in No.74 unit
上述例子證明殘差超限比例檢查方法可以自動(dòng)實(shí)現(xiàn)狀態(tài)變化點(diǎn)定位,有效預(yù)警發(fā)電機(jī)軸承的異常。
本文針對(duì)河北某風(fēng)電場(chǎng)1.5 MW 風(fēng)電機(jī)組的SCADA 數(shù)據(jù),利用了基于高斯核函數(shù)、多項(xiàng)式核函數(shù)、混合核函數(shù)的支持向量機(jī)進(jìn)行訓(xùn)練,比較了3種核函數(shù)的各項(xiàng)訓(xùn)練指標(biāo),確定混合核函數(shù)在支持向量機(jī)訓(xùn)練中綜合性能優(yōu)于其他2類(lèi)。隨后使用機(jī)組歷史良好的運(yùn)行工況數(shù)據(jù)進(jìn)行訓(xùn)練建模,確定合適的閾值進(jìn)行預(yù)警。以2臺(tái)機(jī)組發(fā)電機(jī)驅(qū)動(dòng)端軸承故障為例,分析了殘差超限比例的增長(zhǎng)趨勢(shì)。結(jié)果表明該模型可以提前20 d 左右發(fā)現(xiàn)異常,較好地實(shí)現(xiàn)了提前預(yù)警功能。