陳萬志,李昊哲,劉恒嘉,王天元
(1.遼寧工程技術(shù)大學 軟件學院,遼寧 葫蘆島 125105;2.遼寧工程技術(shù)大學 電子與信息工程學院,遼寧 葫蘆島 125105;3.長春理工大學 計算機科學技術(shù)學院,吉林 長春 130022;4.國網(wǎng)遼寧省電力有限公司 營口供電公司,遼寧 營口 115000)
風力發(fā)電機組的故障多源于發(fā)電機、齒輪箱、傳動軸、葉片及變槳系統(tǒng)、偏航系統(tǒng)、電控系統(tǒng)等關(guān)鍵部件,可通過檢測分析振動、應(yīng)力、扭矩、溫度、潤滑油和電氣等參數(shù)進行判別.風電場的SCADA(supervisory control and data acquisition)系統(tǒng)可實現(xiàn)對風電機組的監(jiān)測監(jiān)控功能.但基于SCADA數(shù)據(jù)的分析挖掘應(yīng)用較少或僅用于人工統(tǒng)計,無法預(yù)測風電機組故障可能發(fā)生的情況[1-4].
由于對SCADA系統(tǒng)數(shù)據(jù)的分析已無法滿足安全的需求,研究者們將SCADA系統(tǒng)數(shù)據(jù)與機器學習模型結(jié)合,對風電機組進行故障預(yù)測和診斷.文獻[5]提出結(jié)合 ITD(intrinsic time-scale decomposition)和LS-SVM(least square-support vector machine)的風力發(fā)電機組軸承故障診斷方法.文獻[7]提出一種基于粒子群優(yōu)化 KFCM(kernel fuzzy c-means clustering)的風電齒輪箱故障診斷方法.文獻[8]提出一種基于小波包變換BP(back propagation)神經(jīng)網(wǎng)絡(luò)的齒輪箱故障診斷方法.文獻[9]提出一種基于小波包分析與 SVM 相結(jié)合的故障診斷新方法.文獻[10]提出一種基于隱半 Markov模型的故障診斷和預(yù)測方法.目前利用SCADA數(shù)據(jù)進行分析挖掘還存在精準度不高、實時效果差等問題.
本文以某風場SCADA系統(tǒng)數(shù)據(jù)為基礎(chǔ),通過分析發(fā)電機溫度、室外溫度以及風速等參數(shù),在SVM 模型的基礎(chǔ)上融合 LSTM(long short-term memory)和SSA(sparrow search algorithm)優(yōu)化SVM的方法實現(xiàn)風力發(fā)電機組短期故障預(yù)測.
所提出風電機組故障預(yù)測模型的系統(tǒng)整體框架見圖1.即通過同步風電機組SCADA系統(tǒng)小電機溫度、液壓溫度、大電機3種溫度、高速軸溫度、齒輪油溫度、風速以及室外溫度等數(shù)據(jù),并對其進行數(shù)據(jù)預(yù)處理,處理后的測試數(shù)據(jù)分別用于LSTM和SSA優(yōu)化的SVM模型訓練與測試;其次利用優(yōu)化后的SVM對LSTM的短期預(yù)測數(shù)據(jù)進行分類判定,得到風電機組故障預(yù)測結(jié)果.最終實現(xiàn)基于SCADA實時和歷史數(shù)據(jù)的風電機組未來短期故障的預(yù)測,為故障診斷與預(yù)測分析提供系統(tǒng)模型基礎(chǔ),為保障風電機組的安全可靠運行、適時運維保養(yǎng)和故障危害最小化提供科學依據(jù).
圖1 系統(tǒng)整體框架Fig.1 overall framework of system
LSTM網(wǎng)絡(luò)是采用時間先后順序開展反向誤差傳播算法進行網(wǎng)絡(luò)訓練的,適于處理時間序列變量的預(yù)測問題,而風電機組SCADA系統(tǒng)數(shù)據(jù)是與時間密切相關(guān)的,故LSTM模型適合風電機組數(shù)據(jù)的相關(guān)預(yù)測分析.
LSTM模型的輸入為同步風電機組SCADA系統(tǒng)數(shù)據(jù)中9個關(guān)鍵數(shù)據(jù)字段的短期連續(xù)時間段內(nèi)的實時和歷史數(shù)據(jù),輸出是對應(yīng)9個特征下一時間點的預(yù)期數(shù)據(jù),見圖2.
圖2 LSTM模型的輸入與輸出Fig.2 input and output of LSTM
SVM在解決二分類問題上具有良好的性能,適于LSTM模型的短期預(yù)測進行是否故障判別.
SVM模型的輸入為同步風電機組SCADA系統(tǒng)數(shù)據(jù)中9個關(guān)鍵數(shù)據(jù)字段,將每種特征參數(shù)作為一個輸入向量x,輸入向量定義為
式中,An(n= 1,… ,9 )為特征參數(shù)的值.SCADA系統(tǒng)數(shù)據(jù)中風電機組運行狀態(tài)有故障和正常兩種.
C-SVM的約束式為
式中,ω,b為超平面定義的參數(shù);l為SVM訓練集數(shù)據(jù)中的幀數(shù);iξ為松弛系數(shù).
由于SCADA數(shù)據(jù)的特征參數(shù)非線性,故使用徑向基函數(shù)RBF(radial basis function)作為內(nèi)核函數(shù)K進行數(shù)據(jù)空間映射.K定義為
式中,γ為內(nèi)核函數(shù)的預(yù)定義參數(shù).
SCADA數(shù)據(jù)運行狀態(tài)(x,y)的訓練集從R9×R映射到Hilbert空間×R為
根據(jù)下式確定超平面(ω?xi) +b= 0 ,
式中,C為懲罰系數(shù).
SVM模型由超平面的唯一解進行定義.其中
對于每條SCADA數(shù)據(jù)輸入向量,由SVM模型預(yù)測判別結(jié)果輸出為
SVM模型的分類過程原理見圖3,其中N是支持向量ω的數(shù)量.
圖3 SVM模型的輸入與輸出Fig.3 input and output of SVM
麻雀搜索算法SSA是一種源于麻雀覓食和反捕食行為的種群智能優(yōu)化算法,具有尋優(yōu)能力強、收斂速度快等優(yōu)點,適合對SVM模型進行優(yōu)化.
在模擬測試實驗中,利用虛擬麻雀模擬尋找食物,由n只麻雀組成的種群為
式中,d為風電機組運行狀態(tài)的因變量維數(shù),d的值為9,表示9個特征參數(shù).
所有麻雀的適應(yīng)度值F表示為
在每次迭代過程中,發(fā)現(xiàn)者的位置更新為
式中,t為當前迭代次數(shù);item-max為最大迭代次數(shù);Xi,j為第i個麻雀在第j維中的位置;α為隨機數(shù);R2和ST分別為預(yù)警值和安全值;Q為服從正態(tài)分布的隨機數(shù);L為1×9矩陣,每個元素均為1.
在覓食過程中,一些加入者會監(jiān)視尋找食物的發(fā)現(xiàn)者并去爭奪更好的食物,加入者的位置為
式中,XP和Xworst分別為最優(yōu)位置和最差位置.A為一個 1×9的矩陣,元素隨機賦值為 1或-1,且A+=AT(AAT)?1.
在模擬測試實驗中,設(shè)意識到危險的麻雀占總量的10%至20%,這些麻雀的位置為
式中,Xbest為當前的全局最優(yōu)位置;β為服從均值為0、方差為1的正態(tài)分布控制步長;K∈[-1,1]是一個隨機數(shù);fi為麻雀個體i的適應(yīng)度值;fg和fw分別為當前全局最佳和最差的適應(yīng)度值;ε為常數(shù),避免分母為0.
實驗數(shù)據(jù)集為某風電場的 MADE型號風機的SCADA系統(tǒng)后臺數(shù)據(jù),其中基礎(chǔ)數(shù)據(jù)包括風機型號、風機類型、記錄時間等靜態(tài)數(shù)據(jù),以及通過傳感器采集的溫度、風速、功率等共計10個特征值,詳細說明見表1.
首先對數(shù)據(jù)進行清洗及預(yù)處理,刪除數(shù)據(jù)集中的異常樣本,消除人為停機維護、調(diào)試等操作的主觀影響,其次采用統(tǒng)計分析軟件SPSS對特征進行主成分分析并得出特征權(quán)重,明確找出對因變量有影響的特征,進一步提高模型的準確度,具體分析結(jié)果見表2.
由特征重要性排序可知,液壓溫度、小電機溫度及大電機溫度特征權(quán)重較大,同時也是風機監(jiān)測的重要指標,對于故障預(yù)測結(jié)果有著重要的影響,同時也從另一個側(cè)面說明通過溫度等參數(shù)預(yù)測風機故障狀況是可行的,同時其他參數(shù)的特征權(quán)重也均在8%以上,因此選取這9個特征作為算法及模型的特征參數(shù).
實驗測試為云虛擬機模擬環(huán)境,硬件配置為Intel Xeon Gold 6266C@3.00GHz CPU,8.00GB內(nèi)存,系統(tǒng)軟件為64位Windows Server 2016 Standard操作系統(tǒng),應(yīng)用軟件為Pycharm2020.1.
(1)采集數(shù)據(jù)并對數(shù)據(jù)進行預(yù)處理.
(2)利用歷史數(shù)據(jù)訓練 LSTM 模型,通過模型對未來短期數(shù)據(jù)進行預(yù)測,得到短期預(yù)測數(shù)據(jù).
(3)利用歷史數(shù)據(jù)訓練SVM模型并使用SSA算法對SVM模型優(yōu)化,得到的優(yōu)化SVM模型能夠判別風機運行狀態(tài).
(4)通過優(yōu)化的SVM模型對LSTM得到的短期預(yù)測數(shù)據(jù)進行運行狀態(tài)判別.
(5)將(4)中得到的運行狀態(tài)與風力發(fā)電機組實際運行狀態(tài)作比較,得到模型故障預(yù)測準確率.
實驗數(shù)據(jù)集為某風力發(fā)電場SCADA系統(tǒng)收集的歷史后臺運維數(shù)據(jù),共包含電機溫度、液壓溫度、齒輪油溫度、高速軸溫度、齒輪油溫度、室外溫度、風速和功率等10個維度,采樣周期為30 s,為避免季節(jié)因素對實驗的影響,選取某風機2018年7月、8月的SCADA數(shù)據(jù)共63 319條,手動刪除異常值6 814條,其中包含停機維護、調(diào)試數(shù)據(jù),以及不符合常理的無效數(shù)據(jù).經(jīng)處理后共計56 478條有效數(shù)據(jù),將功率為正數(shù)的樣本作為正常數(shù)據(jù),將功率為0的樣本標記為故障數(shù)據(jù).
分別對9個參數(shù)進行LSTM短期預(yù)測,再將其預(yù)測得到的值結(jié)合到一起,得到新的SCADA數(shù)據(jù)的短期預(yù)測數(shù)據(jù).取10臺運行的MADE型號風機各1 100條數(shù)據(jù),共11 000條數(shù)據(jù).劃分數(shù)據(jù)集,各取前 1 000條 SCADA數(shù)據(jù)為訓練集,剩下 100條SCADA數(shù)據(jù)為測試集.
首先采用訓練集進行模型訓練,并通過訓練集后 50條數(shù)據(jù)預(yù)測一條新數(shù)據(jù),其次把這條新的數(shù)據(jù)添加到訓練集的末尾并另存為預(yù)測結(jié)果,再通過訓練集新生成的后50條數(shù)據(jù)再預(yù)測一條新數(shù)據(jù).重復進行100次,最終得到10臺風機預(yù)測結(jié)果各100條,并與測試集中的實際數(shù)據(jù)作對比.圖4和圖5分別為1號風機大電機溫度和液壓溫度預(yù)測值與實際值的對比.
圖5 液壓溫度預(yù)測值與實際值對比Fig.5 comparison between predicted and actual hydraulic temperature
為測試經(jīng)SSA改進后模型的性能和準確率,將其和未進行改進的 SVM 模型進行比較,分別使用SSA-SVM 和SVM 對相同數(shù)據(jù)集進行分類預(yù)測對比實驗結(jié)果見圖6和圖7.SSA-SVM預(yù)測結(jié)果準確率為98.80%,SVM 預(yù)測結(jié)果準確率為 93.65%.經(jīng)過 SSA改進的SVM模型的預(yù)測效果相比傳統(tǒng)SVM效果有明顯地提升.
圖6 SSA-SVM預(yù)測結(jié)果散點Fig.6 scatter plot of SSA-SVM prediction results
圖7 SVM預(yù)測結(jié)果散點Fig.7 scatter plot of SVM prediction results
LSTM短期預(yù)測得到10臺MADE型號風機各100條新數(shù)據(jù),使用優(yōu)化的SVM對1 000條預(yù)測數(shù)據(jù)運行狀態(tài)進行分類預(yù)測,并將分類預(yù)測得到的結(jié)果與該時間段的風電機組的實際運行狀態(tài)作比較,預(yù)測正確的數(shù)據(jù)所占整體數(shù)據(jù)的百分比,即為LSTM-SSA-SVM模型預(yù)測風電機組故障的準確率.將1 000條預(yù)測數(shù)據(jù)加入訓練好的SSA-SVM模型中進行測試,最終得到測試集準確率為97.90%,結(jié)果見圖8.
圖8 LSTM-SSA-SVM預(yù)測結(jié)果散點圖Fig.8 scatter plot of LSTM-SSA-SVM prediction results
將本文模型與原始SVM模型和其他文獻提出的風機故障預(yù)測模型作對比,對比結(jié)果見表3.
表3 模型預(yù)測準確率對比Tab.3 comparison of model prediction accuracy
通過對比可知,本文模型的準確率均略高于其他故障預(yù)測模型,證明其可行性和有效性,在一定程度上提升風電機組故障預(yù)測的精度.
在傳統(tǒng) SVM 的基礎(chǔ)上,提出一種 SSA優(yōu)化SVM模型,結(jié)合LSTM預(yù)測風電機組短期數(shù)據(jù)對風電機組運行狀態(tài)進行分類預(yù)測.現(xiàn)場數(shù)據(jù)測試實驗結(jié)果表明,該融合模型預(yù)測準確率可達97.90%,相比其他故障預(yù)測方法精度更高.
當前所研究的風電機組故障來源僅是溫度等特征對故障的影響,在后續(xù)的研究中,還應(yīng)該將振動、器件老化等因素結(jié)合在一起進行分析,使風電機組的故障預(yù)測準確度更高.