劉可興,黃海于
在地鐵運(yùn)營(yíng)信號(hào)系統(tǒng)中,當(dāng)列車(chē)遇到分叉路口時(shí),需通過(guò)扳動(dòng)道岔來(lái)選擇不同路線(xiàn),因此轉(zhuǎn)轍機(jī)的控制和維護(hù)極其重要,其動(dòng)作的正常與否直接影響地鐵行車(chē)安全。由于轉(zhuǎn)轍機(jī)機(jī)械結(jié)構(gòu)復(fù)雜,且處于室外,容易受外界環(huán)境的影響,據(jù)統(tǒng)計(jì)在信號(hào)設(shè)備發(fā)生的故障中,轉(zhuǎn)轍機(jī)故障約占信號(hào)故障總數(shù)的30%[1],故障率較高。
近年來(lái),國(guó)內(nèi)外學(xué)者對(duì)道岔轉(zhuǎn)轍機(jī)的故障診斷做了許多研究,如:劉新發(fā)等[2]以道岔轉(zhuǎn)轍機(jī)的功率數(shù)據(jù)作為輸入,提取不同故障模式下的特征矩陣,采用模糊聚類(lèi)算法,從上述特征矩陣中求解模糊等價(jià)矩陣,并將其轉(zhuǎn)變?yōu)椴紶柧仃嚕玫絼?dòng)態(tài)聚類(lèi)圖后完成故障診斷;LEE 等[3]利用所采集的轉(zhuǎn)轍機(jī)音頻數(shù)據(jù)作為提取特征,采用聲學(xué)分析法對(duì)轉(zhuǎn)轍機(jī)進(jìn)行故障診斷,試驗(yàn)證明該方法具有較高的準(zhǔn)確率;黃世澤等[4]總結(jié)不同轉(zhuǎn)轍機(jī)故障的功率曲線(xiàn)特點(diǎn),采用基于弗雷歇距離定義的相似函數(shù)完成故障診斷。上述方法主要是依靠人工提取故障信號(hào)特征,但道岔轉(zhuǎn)轍機(jī)結(jié)構(gòu)復(fù)雜,影響因素繁多,導(dǎo)致相同故障模式下信號(hào)有不同的表現(xiàn)形式,所以很難提取到有效特征,造成這些算法在實(shí)際情況下泛化能力不強(qiáng)。
隨著深度學(xué)習(xí)的發(fā)展,非線(xiàn)性函數(shù)自動(dòng)映射能力已廣泛應(yīng)用于故障診斷領(lǐng)域,如:唐維華等[5]構(gòu)建了LSTM 網(wǎng)絡(luò)形成道岔故障,但需要大量有標(biāo)簽數(shù)據(jù)集進(jìn)行訓(xùn)練;陳欣昌等[6]構(gòu)建了深度自編碼器模型,實(shí)現(xiàn)機(jī)械故障診斷,通過(guò)試驗(yàn)驗(yàn)證方法有效;薛嫣等[7]通過(guò)對(duì)故障信號(hào)提取時(shí)頻域以及熵特征,構(gòu)建堆疊稀疏自編碼網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,來(lái)提高故障診斷準(zhǔn)確率,但自編碼網(wǎng)絡(luò)在特征提取階段,僅僅是無(wú)監(jiān)督地對(duì)原始輸入數(shù)據(jù)進(jìn)行重構(gòu),無(wú)法保證所提取的抽象特征與所識(shí)別的故障類(lèi)型的關(guān)聯(lián)性;習(xí)晨博等[8]采用堆疊去噪自動(dòng)編碼器與BP 神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,試驗(yàn)證明準(zhǔn)確率更高;徐子弘等[9]采用自編碼器提取不同故障信號(hào)的高階抽象特征,并將該特征作為其他分類(lèi)器的輸入,完成了早期的故障診斷。
基于以上研究,本文以S700K 型道岔轉(zhuǎn)轍機(jī)作為研究對(duì)象,應(yīng)用深度學(xué)習(xí)技術(shù),對(duì)信號(hào)集中監(jiān)測(cè)系統(tǒng)中所收集的功率數(shù)據(jù)進(jìn)行分析,利用深度卷積降噪自編碼器與循環(huán)神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,完成轉(zhuǎn)轍機(jī)故障診斷。此外,由于自編碼器中的隱藏層采用全連接神經(jīng)神經(jīng)網(wǎng)絡(luò),訓(xùn)練時(shí)間復(fù)雜度偏高,而卷積神經(jīng)網(wǎng)絡(luò)因其權(quán)值共享等特點(diǎn),訓(xùn)練時(shí)間復(fù)雜度較低,因此將自編碼器改進(jìn)為一維卷積神經(jīng)網(wǎng)絡(luò),經(jīng)試驗(yàn)證明該方法可以進(jìn)一步提高準(zhǔn)確率。
S700K型道岔轉(zhuǎn)轍機(jī)三相交流電動(dòng)機(jī)的工作拉力為
式中:η為電動(dòng)機(jī)效率;Re為轉(zhuǎn)轍機(jī)傳動(dòng)系統(tǒng)等效力臂;p為輸出功率;n為電動(dòng)機(jī)轉(zhuǎn)速。
由式(1)可得,S700K 轉(zhuǎn)轍機(jī)的動(dòng)力與其功率呈線(xiàn)性關(guān)系,功率值的改變反映了工作拉力的變化,所以轉(zhuǎn)轍機(jī)的運(yùn)行情況可以通過(guò)其輸出工作拉力的變化表示[10]。據(jù)此,本文選取功率數(shù)據(jù)作為研究對(duì)象,通過(guò)研究轉(zhuǎn)轍機(jī)正常功率數(shù)據(jù)和不同故障模式下的功率數(shù)據(jù),完成S700K 型道岔轉(zhuǎn)轍機(jī)的故障診斷。
通過(guò)對(duì)SDAE-BiLSTM 算法的堆疊式降噪自編碼網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),提出了深度卷積降噪自編碼器——雙向長(zhǎng)短期記憶網(wǎng)絡(luò)DCDAE-BiLSTM(Deep Convolutional denoised autoencoder and Bidirectional Long Short-Term Memory)算法,用于對(duì)轉(zhuǎn)轍機(jī)的故障診斷,具體流程見(jiàn)圖1。該方法主要包含:①數(shù)據(jù)預(yù)處理,由于一次道岔動(dòng)作在不同的階段,其功率數(shù)據(jù)值差異較大,因此需先對(duì)功率數(shù)據(jù)進(jìn)行歸一化,便于不同量級(jí)的功率能夠進(jìn)行計(jì)算;②DCDAE 網(wǎng)絡(luò)預(yù)訓(xùn)練,對(duì)大量數(shù)據(jù)進(jìn)行自監(jiān)督學(xué)習(xí),復(fù)用編碼層參數(shù)后,進(jìn)入下一階段的分類(lèi)任務(wù);③BiLSTM 網(wǎng)絡(luò)微調(diào),當(dāng)上述自編碼器訓(xùn)練完成后,將BiLSTM 網(wǎng)絡(luò)接入到卷積自編碼器編碼層,開(kāi)始訓(xùn)練帶有標(biāo)簽的數(shù)據(jù)集,最終完成故障診斷。
圖1 診斷流程圖
數(shù)據(jù)歸一化方法主要分為線(xiàn)性函數(shù)歸一化(Min-Max Scaling) 和零均值歸一化 (Z-score standardization),本文采用線(xiàn)性函數(shù)歸一化方法,具體計(jì)算公式為
式(2) 將訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)歸一化到[0,1]區(qū)間內(nèi),然后把歸一化后的數(shù)據(jù)作為自編碼器模型的輸入,先進(jìn)行無(wú)監(jiān)督深層特征提取,再開(kāi)始微調(diào)整個(gè)網(wǎng)絡(luò)。
傳統(tǒng)深度降噪自編碼器見(jiàn)圖2,包括編碼層和解碼層[11]。其中降噪主要是對(duì)輸入數(shù)據(jù)加入噪聲,模擬數(shù)據(jù)被損壞的情況,從損壞的數(shù)據(jù)中重構(gòu)出原始數(shù)據(jù),提高模型的魯棒性。
圖2 深度降噪自編碼結(jié)構(gòu)示意圖
傳統(tǒng)自編碼器的隱藏層采用全連接神經(jīng)網(wǎng)絡(luò),雖然有一定的特征提取能力,但因參數(shù)較多,訓(xùn)練復(fù)雜;而卷積神經(jīng)網(wǎng)絡(luò)具有局部鏈接、權(quán)值共享等優(yōu)點(diǎn),減少了訓(xùn)練參數(shù),因此本文將傳統(tǒng)自編碼器中的隱藏層改為一維卷積神經(jīng)網(wǎng)絡(luò),見(jiàn)圖3。卷積自編碼器編碼網(wǎng)絡(luò)與解碼網(wǎng)絡(luò)具體參數(shù)見(jiàn)表1。將上述編碼網(wǎng)絡(luò)的最后一層(max_pool 層),通過(guò)ReShape 操作改變其維度為(1,396)后,作為BiLSTM網(wǎng)絡(luò)的輸入。
表1 卷積自編碼器網(wǎng)絡(luò)模型結(jié)構(gòu)參數(shù)
圖3 深度卷積降噪自編碼結(jié)構(gòu)示意圖
LSTM 神經(jīng)網(wǎng)絡(luò)核心單元見(jiàn)圖4。其中,xt表示t時(shí)刻的輸入序列,Ct表示第t時(shí)刻的記憶單元,ht表示t時(shí)刻LSTM 神經(jīng)網(wǎng)絡(luò)細(xì)胞的輸出值,ft、it、Ot分別表示遺忘門(mén)、輸入門(mén)以及輸出門(mén)的值,具體計(jì)算方式如下。
圖4 LSTM 核心單元結(jié)構(gòu)
式中wf、wi以及wo表示遺傳門(mén)、輸入門(mén)、輸出門(mén)的權(quán)重,bf、bi、bo分別表示各個(gè)門(mén)的偏置。
由于反映轉(zhuǎn)轍機(jī)工作狀態(tài)的功率曲線(xiàn)下一階段的動(dòng)作緊挨著上一階段,具有時(shí)序性,因此將上述自編碼器所提取的特征作為循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入,最終完成故障診斷,具體的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)見(jiàn)表2。
表2 Bi LSTM 網(wǎng)絡(luò)模型結(jié)構(gòu)
真實(shí)數(shù)據(jù)及模擬數(shù)據(jù)共同組成模型訓(xùn)練測(cè)試數(shù)據(jù),其中訓(xùn)練集數(shù)量總共為3 600 個(gè),每種類(lèi)型各600 個(gè);測(cè)試數(shù)量總共為1 200 個(gè),每種類(lèi)型各200個(gè)。
為了評(píng)估本文所提算法的性能,采用準(zhǔn)確率、精確率、誤報(bào)率、漏報(bào)率以及ROC 曲線(xiàn)等指標(biāo)進(jìn)行驗(yàn)證,其中各指標(biāo)計(jì)算公式如下:
式中:ACC為測(cè)試準(zhǔn)確率;TP表示實(shí)際為正類(lèi)別,預(yù)測(cè)為正類(lèi)別;FN表示實(shí)際為正類(lèi)別,預(yù)測(cè)為負(fù)類(lèi)別;TN表示實(shí)際為負(fù)類(lèi)別,預(yù)測(cè)為負(fù)類(lèi)別;FP表示實(shí)際為負(fù)類(lèi)別,預(yù)測(cè)為正類(lèi)別。ROC曲線(xiàn)為接受者操作特性曲線(xiàn)(Receiver Operating Characteristic Curve ROC),ROC 曲線(xiàn)的橫坐標(biāo)是FPR,縱坐標(biāo)是TPR,表示將正樣本預(yù)測(cè)為正的比例,ROC 曲線(xiàn)與橫縱坐標(biāo)封閉的區(qū)域面積稱(chēng)為AUC(Area under roc Curve),面積越大,表示模型越好。
在確定網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,為了使試驗(yàn)結(jié)果的差異來(lái)自不同的神經(jīng)網(wǎng)絡(luò)模型,設(shè)置了同樣的超參數(shù),包括優(yōu)化器使用Ndam 算法,訓(xùn)練批次大小32,學(xué)習(xí)率設(shè)置為0.001,epoch設(shè)置為200時(shí)。對(duì)輸入采用dropout 降噪方式,本文比例設(shè)置為0.1,最后在Win10 64 位環(huán)境下試驗(yàn),并采用keras 3.6版本的深度學(xué)習(xí)框架。
1)基于DCDAE_BiLSTM 模型的故障診斷試驗(yàn)結(jié)果。本課題采用預(yù)訓(xùn)練階段和微調(diào)階段訓(xùn)練策略,即先將預(yù)訓(xùn)練的深度卷積降噪自編碼器模型,作為微調(diào)階段編碼網(wǎng)絡(luò)的初始化參數(shù);然后加入雙向循環(huán)神經(jīng)網(wǎng)絡(luò),開(kāi)始微調(diào)整個(gè)分類(lèi)網(wǎng)絡(luò),圖5 表示訓(xùn)練準(zhǔn)確率ACC曲線(xiàn)。其中ACC表示樣本被正確分類(lèi)的個(gè)數(shù)占總樣本個(gè)數(shù)的比例,可以看到本文最終準(zhǔn)確率達(dá)到了98.82%,為了更加細(xì)致地觀(guān)察試驗(yàn)結(jié)果,畫(huà)出如圖6 所示的ROC 曲線(xiàn),該曲線(xiàn)中有每一類(lèi)別的AUC值,即為圖中area 值所示,而表3為每類(lèi)的精確率等指標(biāo)。
圖5 測(cè)試準(zhǔn)確率
圖6 ROC曲線(xiàn)
表3 分類(lèi)試驗(yàn)結(jié)果
2)與其他算法的對(duì)比。隨著對(duì)道岔轉(zhuǎn)轍機(jī)故障診斷的大量研究,已出現(xiàn)了許多不錯(cuò)的研究成果,如文獻(xiàn)[13]中構(gòu)建了多層CNN 模型來(lái)完成轉(zhuǎn)轍機(jī)故障診斷,文獻(xiàn)[14]采用CNN-GRU 聯(lián)合神經(jīng)網(wǎng)絡(luò)的方法來(lái)完成故障診斷等。此外,為了驗(yàn)證本文所提算法的有效性,還搭建了SDAEBiLSTM模型來(lái)作為對(duì)比。
幾種算法進(jìn)行比較的試驗(yàn)結(jié)果見(jiàn)表4。采用多層CNN 模型時(shí),其準(zhǔn)確率95.14%,誤報(bào)率4.26%,漏報(bào)率4.83%;采用CNN-GRU 模型時(shí),其故障診斷的準(zhǔn)確率為95.85%,誤報(bào)率為3.06%,漏報(bào)率為3.17%;而采用SDAE-BiLSTM 模型,其故障診斷的正確率為97.16%,誤報(bào)率為1.87%,漏報(bào)率為2.99%。相比于上述算法,本文所提的模型故障診斷正確率更高。
表4 算法對(duì)比結(jié)果
通過(guò)分析S700K 型道岔轉(zhuǎn)轍機(jī)故障功率數(shù)據(jù),總結(jié)歸納出需要診斷的故障類(lèi)型,在此基礎(chǔ)上,提出深度卷積降噪自編碼器與雙向長(zhǎng)短期記憶網(wǎng)絡(luò)相結(jié)合(DCDAE-BiLSTM)的方法,完成轉(zhuǎn)轍機(jī)故障診斷,試驗(yàn)結(jié)果表明該算法的準(zhǔn)確率可達(dá)到98.82%。相比于其他算法,該算法具有更高的準(zhǔn)確率。