鄧玉敏,張雪桂,馬 歷,嚴(yán)耀亮,李超順
(1.中國長江三峽集團(tuán)有限公司,武漢 430000;2.華中科技大學(xué)土木與水利工程學(xué)院,武漢 430074)
水電機(jī)組作為水力發(fā)電的關(guān)鍵設(shè)備,機(jī)組的安全穩(wěn)定運(yùn)行至關(guān)重要,其運(yùn)行狀態(tài)信息通常表征在機(jī)組的一系列監(jiān)測物理量中。因此可以通過采集到的監(jiān)測數(shù)據(jù)進(jìn)行分析,并通過預(yù)測模型對設(shè)備在未來某一時期狀態(tài)趨勢進(jìn)行預(yù)測[1]。
水電機(jī)組的狀態(tài)信息蘊(yùn)藏于振動信號中。在工程實(shí)際中,振動擺度信號蘊(yùn)含了約80%的機(jī)組性能狀態(tài)信息,通過分析振動信號可以獲取機(jī)組的健康狀態(tài)[2,3]。水電機(jī)組振動趨勢預(yù)測是一個非線性非平穩(wěn)的序列預(yù)測問題[4],針對狀態(tài)趨勢的預(yù)測,例如,文獻(xiàn)[5]通過對機(jī)組水導(dǎo)軸承X 方向建立了BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行預(yù)測,但此方法需要大量長時間的機(jī)組振動數(shù)據(jù)做基礎(chǔ);文獻(xiàn)[6]通過支持向量回歸機(jī)(SVR)的預(yù)測模型完成對上機(jī)架振動、水導(dǎo)擺度歷史數(shù)據(jù)進(jìn)行趨勢預(yù)測,但此方法容易出現(xiàn)“過學(xué)習(xí)”現(xiàn)象;文獻(xiàn)[7]采用時間序列模型預(yù)測法中的自回歸滑動平均(ARMA)模型,分別預(yù)測抽水和發(fā)電工況下的機(jī)組上導(dǎo)軸承和上機(jī)架的振動趨勢,證明了時間序列預(yù)測法可實(shí)現(xiàn)不同機(jī)械設(shè)備的振動趨勢的預(yù)測;文獻(xiàn)[8]針對水電機(jī)組信號的復(fù)雜非平穩(wěn)特性,提出了一種基于能量熵重構(gòu)(EER)與支持向量回歸(SVR)的混合預(yù)測模型,通過對信號的重構(gòu)從而降低復(fù)雜度,最后得到最優(yōu)SVR,提高了預(yù)測模型精度;文獻(xiàn)[9]使用神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的預(yù)測方法,雖取得較好的效果,但對于水電機(jī)組這種非常復(fù)雜的系統(tǒng)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練時,因其系統(tǒng)復(fù)雜規(guī)模龐大,神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)訓(xùn)練需要較長的時間,降低了神經(jīng)網(wǎng)絡(luò)的實(shí)用性。
文獻(xiàn)[10]采用WTD方法對振動信號數(shù)據(jù)進(jìn)行降噪處理,再采用BiGRU 網(wǎng)絡(luò)建立振動信號預(yù)測模型,完成振動信號的趨勢預(yù)測;文獻(xiàn)[11]針對水電機(jī)組的振動信號的非平穩(wěn)性、非線性的特點(diǎn),提出了基于VMD 的CNN-LSTM 混合神經(jīng)網(wǎng)絡(luò)的趨勢預(yù)測方法,與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,CNN 可以更好地提取數(shù)據(jù)內(nèi)在特征,構(gòu)建網(wǎng)絡(luò)時所需參數(shù)更少,在保證精度的同時提高了計(jì)算速度。
為了進(jìn)一步提高水電機(jī)組振動預(yù)測精度,針對目前單一模型難以獲得最優(yōu)預(yù)測結(jié)果的問題,提出了一種CNN-BiGRU 模型組合的水電機(jī)組振動預(yù)測方法,并構(gòu)造出CNN-BiGRU 網(wǎng)絡(luò)組合預(yù)測模型。利用CNN 提取數(shù)據(jù)局部特征,實(shí)現(xiàn)了對數(shù)據(jù)潛在特征關(guān)系的挖掘。又因水電機(jī)組振動信號在時間序列中存在聯(lián)系,為完成時序信號的特征挖掘預(yù)測,故將CNN 網(wǎng)絡(luò)和BiGRU 網(wǎng)絡(luò)進(jìn)行并行預(yù)測,通過多模型組合預(yù)測來避免單一模型難以獲得最優(yōu)結(jié)果的問題,從而提高水電機(jī)組振動預(yù)測精確度與可靠性。實(shí)驗(yàn)結(jié)果證明提出的模型有效的提高了預(yù)測精度,取得了較好的預(yù)測結(jié)果。
CNN 是典型的多層前饋神經(jīng)網(wǎng)絡(luò),常用于圖像處理領(lǐng)域,因它可以避免層間因完全連接而造成的參數(shù)冗余,通過局部的連接方式,降低了訓(xùn)練的難度和對數(shù)據(jù)的依賴性。CNN 主要包含三種層:卷積層、池化層和全連接層。卷積層將特征向量經(jīng)過卷積運(yùn)算傳遞給池化層,池化層對數(shù)據(jù)進(jìn)行降維處理,通過卷積層和池化層的交替使用能夠有效的提取數(shù)據(jù)局部特征并降低局部特征維度,經(jīng)過多個卷積層池化層交替運(yùn)算,最終,將得到的高級特征信息通過全連接層輸入下一層網(wǎng)絡(luò)進(jìn)行下一步預(yù)測。通常,CNN 在處理二維圖像問題時需要三個維度的數(shù)據(jù):寬度、高度和通道數(shù)。而一維CNN 可看作是輸入數(shù)據(jù)高度為1時的特殊情境。一維卷積運(yùn)算如式(1)所示:
GRU 是一種特殊的RNN,與LSTM 相比,它具有快速收斂和參數(shù)更少的優(yōu)點(diǎn),在保證預(yù)測性能的前提下,簡化了復(fù)雜的結(jié)構(gòu),提高了運(yùn)算速度。因此,GRU 比LSTM 網(wǎng)絡(luò)更簡單、更有效。GRU結(jié)構(gòu)如圖1所示。
圖1 GRU網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 GRU network structure diagram
設(shè)xt為輸入,ht為隱藏層輸出,則GRU計(jì)算流程如下式:
式中:rt為重置門;ht-1為前一時刻隱藏單元的輸出;σ為sigmoid的激活函數(shù);Wr、Ur、br、Wh、Uh、bh、Wz、Uz、bz分別為可訓(xùn)練的權(quán)重參數(shù)和偏置。
BiGRU 是GRU的改進(jìn),基于正反2層GRU神經(jīng)網(wǎng)絡(luò)構(gòu)造分別處理數(shù)據(jù),即使用一個GRU 神經(jīng)網(wǎng)絡(luò)來計(jì)算過去的信息,并同時使用另一個相同且方向相反的GRU來計(jì)算未來的信息,通過前向與反向的GRU 單元學(xué)習(xí)歷史與未來時刻對當(dāng)前信息的影響。其結(jié)構(gòu)如圖2所示。
圖2 BiGRU網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 BiGRU network structure diagram
CNN-BiGRU 組合預(yù)測模型網(wǎng)絡(luò)結(jié)構(gòu)見圖3。本模型中保留了CNN 提取非線性特征能力并與BiGRU 處理長序列的數(shù)據(jù)挖掘能力相結(jié)合,從而避免有用信息丟失,發(fā)掘序列的長依賴性。
圖3 基于CNN-BiGRU組合預(yù)測模型Fig.3 Based on the CNN-BiGRU combination prediction model
水電機(jī)組振動信號具有強(qiáng)烈的非線性,而CNN 具有強(qiáng)大的非線性特征獲取能力,故由CNN 層提取相應(yīng)特征進(jìn)行學(xué)習(xí)預(yù)測。CNN 模型網(wǎng)絡(luò)中選用兩層重復(fù)卷積,目的是盡早提取到信號的高級特征,避免信號在通過池化層時失去重要特征;池化層選用最大池化操作,對卷積層所提取特征進(jìn)行向下采樣,從而精簡模型參數(shù);最后將數(shù)據(jù)輸入全連接層,CNN 中全連接層的作用是把池化后的特征向量進(jìn)行重新組裝擬合,并通過激活函數(shù)增加模型的非線性能力,與其他激活函數(shù)相比,ReLU 輸出的特征具有稀疏性,使得網(wǎng)絡(luò)具有較好的泛化能力。此外,在輸入大于0時,ReLU的導(dǎo)數(shù)恒為1,使得網(wǎng)絡(luò)計(jì)算速度較快且不易出現(xiàn)梯度彌散。
水電機(jī)組振動信號機(jī)組振動信號本身具有時序關(guān)系,而Bi-GRU 在時序序列的預(yù)測中具有良好效果。BiGRU 網(wǎng)絡(luò)中選用兩層BiGRU 層,完成時序信息的有效提取,但當(dāng)BiGRU 模型參數(shù)過多時,容易產(chǎn)生過擬合現(xiàn)象。為防止訓(xùn)練過度,BiGRU 層采Dropout 機(jī)制,隨機(jī)丟棄一部分神經(jīng)元節(jié)點(diǎn)使其暫時不參與模型訓(xùn)練,使得BiGRU 網(wǎng)絡(luò)不會過度依賴部分特征提升模型的泛化能力。最后將處理后的數(shù)據(jù)輸入BiGRU的全連接層。
數(shù)據(jù)經(jīng)過CNN 模型和BiGRU 模型分別處理后并行拼接作為全連接層輸入,考慮到模型結(jié)構(gòu)的非線性,構(gòu)建了3 個Dense層,分別有32個16個和1個神經(jīng)元,完成模型的輸出。
將測試集輸入數(shù)據(jù)矩陣化處理后依次輸入訓(xùn)練好的網(wǎng)絡(luò)中,將網(wǎng)絡(luò)的輸出與測試集的輸出數(shù)據(jù)進(jìn)行比較,計(jì)算結(jié)果的平均絕對誤差(Mean Absolute Error,MAE),平均絕對百分誤差(Mean Absolute Percentage Error,MAPE)和均方根誤差(Root Mean Square Error,RMSE),計(jì)算公式如下所示:
式中:xi是真實(shí)值為模型輸出值;n為序列的長度。
相關(guān)研究表明,波形的標(biāo)準(zhǔn)差或峰峰值可以較好的反應(yīng)機(jī)組的狀態(tài)[12-14],因此本實(shí)驗(yàn)中使用振動信號峰峰值作為實(shí)驗(yàn)數(shù)據(jù)。本實(shí)驗(yàn)以某電站3 號機(jī)組的上導(dǎo)X方向擺度與下導(dǎo)X方向擺度數(shù)據(jù)峰峰值作為研究對象,實(shí)際生產(chǎn)中,機(jī)組振擺采樣頻率較高,短時間會產(chǎn)生大量高密度數(shù)據(jù)[15],為有效進(jìn)行預(yù)測,為避免機(jī)組啟停時刻的異常值影響,研究選取機(jī)組2019年3月2日0 時至2019年9月1日0 時發(fā)電穩(wěn)態(tài)(機(jī)組開機(jī)后一小時,停機(jī)前10 min)采集到的監(jiān)測數(shù)據(jù),選取時間間隔為5 min 的數(shù)據(jù),最終選取機(jī)組穩(wěn)態(tài)峰峰值共5 080 條,實(shí)驗(yàn)中,選取前4 500條數(shù)據(jù)作為訓(xùn)練集,后580條數(shù)據(jù)作為測試集。
首先將數(shù)據(jù)進(jìn)行劃分為訓(xùn)練集和測試集,后對數(shù)據(jù)進(jìn)行歸一化處理,歸一到區(qū)間[0,1]中,歸一化公式:
式中:xmax,xmin分別為數(shù)據(jù)中的最大值和最小值。
為保證模型的訓(xùn)練具有良好的精度與泛化能力,因此在網(wǎng)絡(luò)訓(xùn)練中需要選取合適的參數(shù),CNN-BiGRU 模型中的參數(shù)設(shè)置詳情如下:
(1)損失函數(shù)。損失函數(shù)用于評價模型訓(xùn)練過程中真實(shí)值與預(yù)測值之間的差距,損失函數(shù)值越小,表示模型訓(xùn)練時的表現(xiàn)越好。常見的損失函數(shù)主要包括:MAE和MSE等。而MSE是常用于回歸預(yù)測問題中的損失函數(shù),因此,本文采用MSE作為CNN-BiGRU網(wǎng)絡(luò)的損失函數(shù)。
(2)網(wǎng)絡(luò)學(xué)習(xí)率與迭代次數(shù)。學(xué)習(xí)率控制了模型的訓(xùn)練步長,決定了模型能否收斂與收斂的速度。在CNN-BiGRU 網(wǎng)絡(luò)中,通過試錯法網(wǎng)絡(luò)學(xué)習(xí)率為0.01,全連接層中dropout 值設(shè)置為0.2。
(3)優(yōu)化算法。優(yōu)化算法的正確使用可有效提升模型的訓(xùn)練速度和預(yù)測精度。目前應(yīng)用較多的優(yōu)化算法有Adam、RMSprop、SGD,本文分別使用3 種優(yōu)化算法對CNN-BiGRU 模型進(jìn)行150 次訓(xùn)練,實(shí)驗(yàn)結(jié)果如圖4 所示。從圖4 中可以看出Adam訓(xùn)練的網(wǎng)絡(luò)效果最好,RMSprop 則相對滯后,SGD 的效果最差。因此最終本模型選用Adam作為模型優(yōu)化器。
圖4 優(yōu)化算法對比Fig.4 Optimize algorithm comparison
為驗(yàn)證所提方法的有效性,以上導(dǎo)擺度X向振動峰峰值數(shù)據(jù)分別多次訓(xùn)練和測試模型,將其與GRU 模型、BiGRU 模型、CNN-GRU 并行網(wǎng)絡(luò)、CNN-LSTM 并行網(wǎng)絡(luò)進(jìn)行對比分析,結(jié)果如表1 所示。根據(jù)預(yù)測結(jié)果可知,所提組合模型效果最佳,而CNN-LSTM 網(wǎng)絡(luò)效果最差。
從表1可以看出:
表1 上導(dǎo)擺度X向振動峰峰值預(yù)測結(jié)果對比Tab.1 The up-guided slew X is compared to the prediction results of vibration peaks and peaks
(1)所提組合模型相較于GRU、BiGRU 單一預(yù)測模型,MAE分別降低了53.09%、51.87%,MAPE 分別降低了52.83%、51.39%,RMSE 分別降低了64.28%、62.77%,可以看出當(dāng)使用CNN 模塊提取數(shù)據(jù)特征后,水電機(jī)組振動峰峰值預(yù)測精度大幅提升,這表明并聯(lián)CNN 模塊可有效提升水電機(jī)組振動信號的預(yù)測精度。
(2)所提組合模型相較于CNN-GRU、CNN-LSTM 組合預(yù)測模型,MAE分別降低了49.05%、56.86%,MAPE 分別降低了48.42%、56.22%,RMSE 分別降低56.76%、64.35%,這表明了采用BiGRU 同時學(xué)習(xí)未來和歷史信息,可以增強(qiáng)模型的對時間序列的學(xué)習(xí)能力,使得預(yù)測的更加準(zhǔn)確。
本實(shí)驗(yàn)所提模型與對比模型在相同工況下的上導(dǎo)擺度X方向上的測試結(jié)果如圖5、6所示??梢钥闯鰧Ρ饶P皖A(yù)測結(jié)果整體趨勢與實(shí)際值保持一致,但是局部誤差較大。而CNN-BiGRU 模型預(yù)測結(jié)果可表示出真實(shí)值的整體趨勢與局部特征的變化,除個別極值點(diǎn)外,模型的預(yù)測值與實(shí)際值基本吻合,可最大程度的反映水電機(jī)組振動的波動情況。
圖5 上導(dǎo)擺度X方向本模型與單一模型預(yù)測對比圖Fig.5 The up-guided slew X direction of this model is compared with the single model prediction
為進(jìn)一步證明所提模型的有效性,將各模型應(yīng)用于下導(dǎo)擺度X向振動峰峰值預(yù)測。圖7、8展示了所提模型與對比模型在相同工況下的下導(dǎo)擺度X方向上的多次測試結(jié)果。表2展示了不同模型對下導(dǎo)擺度X方向的預(yù)測結(jié)果,可以看出CNN-BiGRU 模型相較于其他模型預(yù)測精度更高,誤差更小。證明了該模型在機(jī)組振動預(yù)測方向上的優(yōu)越性。
表2 下導(dǎo)擺度X向振動峰峰值預(yù)測結(jié)果對比Tab.2 The hemline X contrasts with the prediction results of vibration peaks and peaks
圖6 上導(dǎo)擺度X方向與組合模型預(yù)測對比圖Fig.6 The up-guided slew X direction of this model is compared with the combined model prediction
圖7 下導(dǎo)擺度X方向本模型與單一模型預(yù)測對比Fig.7 Hemline X direction This model compares with a single model prediction
針對水電機(jī)組振動信號非平穩(wěn)和非線性問題,提出一種基于CNN-BiGRU 組合模型的水電機(jī)組振動預(yù)測方法,首先利用CNN 提取數(shù)據(jù)有效局部特征,再運(yùn)用BiGRU 模型處理時序性特征數(shù)據(jù),深度挖掘水電機(jī)組振動數(shù)據(jù)的非線性以及時序性特征。通過與傳統(tǒng)預(yù)測模型進(jìn)行對比,結(jié)果表明本文提出的混合模型有更高的預(yù)測精度,證明該模型可充分提取輸入數(shù)據(jù)的特征并利用數(shù)據(jù)的時序性特征進(jìn)行振動信號預(yù)測。
圖8 下導(dǎo)擺度X方向與組合模型預(yù)測對比圖Fig.8 Hemline X direction This model compares with the combined model prediction