磨巧梅
文章針對鋼軌裂紋聲發(fā)射信號特性人工提取效率低的問題,應(yīng)用CNN與BiLSTM手段進(jìn)行鋼軌裂紋聲發(fā)射信號提取的研究,通過預(yù)處理采集的實際鋼軌裂紋聲發(fā)射信號,對其特征信息進(jìn)行提取及分類,分別構(gòu)建基于一維CNN、二維CNN鋼軌裂紋檢測模型,證明前者效果優(yōu)于后者。根據(jù)鋼軌裂紋信號擁有時序的特性,構(gòu)建不同遞歸網(wǎng)絡(luò)鋼軌裂紋檢測模型,并對比RNN與LSTM模型檢測鋼軌裂紋的性能,優(yōu)化BiLSTM鋼軌裂紋檢測模型的方法證明能夠應(yīng)用于鋼軌裂紋的檢測。
鋼軌裂紋;聲發(fā)射信號;BiLSTM;一維CNN
U216.4A371304
0 引言
近年來,高速鐵路的發(fā)展已成為全球發(fā)展的一個重要趨勢。我國在鐵路里程數(shù)上取得了全球第一的成績,創(chuàng)下全球最高列車時速的傲人紀(jì)錄,令世界嘆服。隨著速度的一次次提升,人們更加注重列車運行的安全性。在高速列車運行過程中,容易形成輪軌間長期的反復(fù)接觸,使得鋼軌受重載擠壓力大于普通鋼軌,造成鋼軌出現(xiàn)裂紋的幾率變大。鋼軌裂紋容易出現(xiàn)擴(kuò)展,若不及時進(jìn)行檢測并采取防治措施,繼續(xù)在承受強(qiáng)大外力的作用下使用,就會形成鋼軌斷裂,發(fā)生安全事故。因此,及時對鋼軌裂紋進(jìn)行檢測成為了鐵路安全運營中最重要的一步[1]。
國外針對鋼軌裂紋的研究相比國內(nèi)要早,美國某公司早在1928年就利用磁感應(yīng)[2]對鋼軌裂紋進(jìn)行檢測,成為了當(dāng)今最早使用鐵路檢測技術(shù)的國家。隨著鋼軌裂紋檢測技術(shù)的深入研究和深度學(xué)習(xí),其運用在故障檢測中的次數(shù)增多,研究學(xué)者們提出一種深度卷積網(wǎng)絡(luò)[3](深度CNN),對鋼軌裂紋進(jìn)行檢測,為此利用深度學(xué)習(xí)對鋼軌裂紋聲發(fā)射技術(shù)的研究便慢慢興起。接著美國學(xué)者用二維信號表示鋼軌裂紋聲發(fā)射信號[4],并基于卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)了很好的分類。國內(nèi)對鋼軌裂紋檢測技術(shù)于1951年開始探索,由國內(nèi)鐵路部門開展,鐵路部門用超聲波技術(shù)對鋼軌裂紋進(jìn)行檢測,最常用的檢測技術(shù)是超聲檢測與渦流檢測。但這兩種檢測方式不能實現(xiàn)實時的軌道探測,所以我國大多通過結(jié)合手推式軌道檢測與全自動檢測技術(shù)作為主要的探測方式進(jìn)行探測,這種情況反映出國內(nèi)對聲發(fā)射鋼軌裂紋檢測技術(shù)的深度學(xué)習(xí)和研究較少。為此,國內(nèi)學(xué)者利用卷積神經(jīng)網(wǎng)絡(luò)識別鋼軌裂紋所處階段,并選取多次網(wǎng)絡(luò)輸出共同判斷檢測結(jié)果[5]。中國科技技術(shù)大學(xué)[6]建立了基于BP神經(jīng)網(wǎng)絡(luò)的模型,并采用深度神經(jīng)網(wǎng)絡(luò),建立一套智能監(jiān)測模型。
綜上國內(nèi)外研究發(fā)現(xiàn),將聲發(fā)射信號利用于鋼軌裂紋信號的檢測是可行的,但由于其特征信息提取的復(fù)雜性,研究如何在沒有標(biāo)簽數(shù)據(jù)下進(jìn)行網(wǎng)絡(luò)訓(xùn)練成為一項重點任務(wù)。因此,本文對鋼軌裂紋檢測方法進(jìn)行進(jìn)一步研究:提取與分類預(yù)處理的鋼軌裂紋數(shù)據(jù)信息,分別基于一維CNN和二維CNN建立檢測模型,證明CNN適合處理鋼軌裂紋信號;建立監(jiān)督學(xué)習(xí)研究內(nèi)容,利用不同遞歸神經(jīng)網(wǎng)絡(luò)對鋼軌裂紋進(jìn)行識別,獲得最佳檢測效果BiLSTM;對鋼軌裂紋檢測模型進(jìn)行優(yōu)化,得到能夠?qū)崿F(xiàn)鋼軌裂紋檢測的方法。
1 鋼軌裂紋檢測
本節(jié)詳細(xì)介紹了鋼軌裂紋聲發(fā)射信號的采集及預(yù)處理過程,并引用此數(shù)據(jù)構(gòu)造分幀樣本集,將樣本集通過時域、頻域與時頻域提取特征信息和分類,最后對樣本進(jìn)行端到端的訓(xùn)練,比較分別嘗試用一維CNN、二維CNN構(gòu)建鋼軌裂紋檢測模型的效果。
1.1 聲發(fā)射信號采集及預(yù)處理
鋼軌裂紋進(jìn)行檢測時需保持鋼軌裂紋信號的質(zhì)量,才能構(gòu)造裂紋信號與噪聲信號的分幀樣本集,但實際高速鐵路情況復(fù)雜,獲得的數(shù)據(jù)有多種干擾信號。因此,想要提供更優(yōu)質(zhì)的鋼軌裂紋聲發(fā)射信號給后續(xù)實驗,就需要搭建實驗室系統(tǒng)才能滿足要求,而不能直接使用采集到的鋼軌裂紋信號。
(1)數(shù)據(jù)采集:實驗所采用的數(shù)據(jù)源于某試驗場與實驗室,在試驗場地鋼軌上施加裂紋信號,當(dāng)列車經(jīng)過實驗系統(tǒng)時采集數(shù)據(jù),將得到的鋼軌裂紋數(shù)據(jù)進(jìn)行檢測研究。本實驗系統(tǒng)裝置分為模擬裂紋信號的產(chǎn)生與鋼軌裂紋信號采集兩部分,由這兩部分組成的實驗系統(tǒng)裝置可得到模擬裂紋信號時域圖、模擬裂紋信號小波圖,通過觀察小波圖又可獲得裂紋持續(xù)時間及模擬裂紋信號頻率范圍,為下一步實際鐵路工況下進(jìn)行實驗做準(zhǔn)備工作。隨后觀察整趟列車聲發(fā)射信號幅值-時間圖,得到最大幅值為90 mv,信噪比為-28 db,該數(shù)據(jù)使模擬裂紋信號完全被覆蓋,且噪聲不斷增加衰減為檢測帶來巨大困難,所以需要對數(shù)據(jù)進(jìn)行去噪處理。
(2)數(shù)據(jù)去噪:模擬裂紋信號擁有其自身的頻譜特點,根據(jù)頻譜特點觀察環(huán)境噪聲與裂紋信號的小波圖,得到應(yīng)選用200~800 kHz內(nèi)的數(shù)據(jù)進(jìn)行研究。使數(shù)據(jù)能夠固定頻率、帶的信號及去除范圍外的信號。本節(jié)選用FIR濾波器作為帶通濾波器進(jìn)行計算,F(xiàn)IR濾波器函數(shù)如式(1)所示。通過觀察濾波器函數(shù)計算后頻率內(nèi)帶通濾波器去噪后的信號圖可以發(fā)現(xiàn),整段信號峰值由90 mv降至24 mv,信噪比由-28 db升高至16.5 db,證明了帶通濾波器的效果。
H(z)=a(z)b(z)=∑N-1n=0h(n)z-n(1)
(3)樣本采集設(shè)計:本文需選取鋼軌裂紋信號與不同類型的噪聲構(gòu)建鋼軌裂紋檢測實驗的數(shù)據(jù)集,才能提取鋼軌裂紋的特征信息及提供后續(xù)訓(xùn)練、測試鋼軌裂紋檢驗的算法。本節(jié)對裂紋信號與5類噪聲進(jìn)行數(shù)據(jù)分幀,單個樣本長度選取量為1 024個,最后得到48 681個樣本,并采用獨熱編碼進(jìn)行分類標(biāo)記,如表1所示。
1.2 鋼軌裂紋特征提取
基于時域、頻域與時頻域的特征分析可發(fā)現(xiàn),需要設(shè)計一分類器將三者合在一起才能實現(xiàn)區(qū)分噪聲與裂紋信號。因此,本文采用具有很好的非線性擬合能力、可以擬合不同的函數(shù)及適應(yīng)于多分類任務(wù)的BP網(wǎng)絡(luò)進(jìn)行任務(wù)的多分類。各類噪聲以裂紋信號在BP網(wǎng)絡(luò)中的準(zhǔn)確率如表2所示。
由表2可以發(fā)現(xiàn),BP網(wǎng)絡(luò)信號能很好地識別常規(guī)噪聲,但面對裂紋信號時信號精度會下降,表明鋼軌裂紋與噪聲特征提取與各種噪聲的干擾有關(guān),側(cè)面反映出現(xiàn)有技術(shù)在解決鋼軌裂紋檢測方面不能很好地體現(xiàn)出其優(yōu)異之處,因此,需通過提升鋼軌裂紋檢測的精度來實現(xiàn)鋼軌裂紋有效特征信息的提取。
1.3 CNN模型搭建及實驗對比與分析
CNN與現(xiàn)有人工設(shè)計提取方法不同,因為CNN可以實現(xiàn)特征的自動化提取[7],及一維特性是鋼軌裂紋信號特有的表現(xiàn)方式這一特點,所以采用一維CNN對其進(jìn)行處理所得結(jié)果的解釋性更強(qiáng)。本節(jié)將采用一維CNN來構(gòu)建鋼軌裂紋模型與二維CNN構(gòu)建模型進(jìn)行對比,分析兩種方法的檢測效果。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
一維CNN鋼軌裂紋檢測模型樣本尺寸數(shù)據(jù)為1 024×1,數(shù)據(jù)集包括裂紋信號和5種噪聲,共6類信號,所以輸入層尺寸數(shù)據(jù)為1 024×1,輸出層尺寸數(shù)據(jù)為6×1。一維CNN模型如圖2所示。為了適應(yīng)二維CNN構(gòu)建,需將一維樣本尺寸1 024×1的維度更換為二維矩陣32×32后再進(jìn)行數(shù)據(jù)的輸入,二維CNN數(shù)據(jù)集包括裂紋信號和5種噪聲,共6類信號,輸出層為6×1。二維CNN模型如圖3所示。
為了更好地驗證模型的有效性,本實驗基于Tensorflow框架[8]運用Python語言和計算機(jī)應(yīng)用完成網(wǎng)絡(luò)模型的構(gòu)建,從中選取樣本的信號,并選取7/10作為樣本進(jìn)行訓(xùn)練,其余3/10檢測網(wǎng)絡(luò)性能,學(xué)習(xí)率設(shè)定0.001。整個CNN的檢測效果可以通過誤差的收斂曲線很好地反映,因此通過對比一維CNN與二維CNN建立模型的損失函數(shù)和準(zhǔn)確率曲線,可以評估兩類模型的鋼軌裂紋檢測效果。損傷函數(shù)如圖4所示。準(zhǔn)確率曲線如圖5所示。
由圖4和圖5可以看出,一維CNN模型損失函數(shù)下降快,且最終收斂時損失函數(shù)值也明顯小于二維CNN模型,最終準(zhǔn)確率為84.51%,要高于BP分類器的準(zhǔn)確率,可以看出一維CNN檢測性能要優(yōu)于二維CNN。
2 BiLSTM的鋼軌裂紋檢測
鋼軌裂紋聲發(fā)射信號是一種具有上下聯(lián)系的時序信號,為此基于RNN與LSTM的遞歸網(wǎng)絡(luò)來捕捉鋼軌裂紋時序信號[9],將準(zhǔn)確率進(jìn)行對比分析,得到適合的測試方法。
2.1 構(gòu)建網(wǎng)絡(luò)模型
根據(jù)遞歸神經(jīng)網(wǎng)絡(luò)可以很好地解決鋼軌裂紋時序信號檢測的問題這一理論[10],構(gòu)建RNN、LSTM、BiLSTM三種遞歸網(wǎng)絡(luò),并對比鋼軌裂紋信號檢測的效果。選取前文鋼軌裂紋輸入的6類信號,選擇幀長128,幀移32,網(wǎng)絡(luò)輸入128×1來減少循環(huán)網(wǎng)絡(luò)神經(jīng)結(jié)構(gòu)。構(gòu)建RNN模型結(jié)構(gòu)如圖6所示;構(gòu)建LSTM模型結(jié)構(gòu)如圖7所示;構(gòu)建BiLSTM模型結(jié)構(gòu)如圖8所示。
2.2 實驗數(shù)據(jù)對比
RNN、LSTM、BiLSTM三種網(wǎng)絡(luò)程序的運行配置與鋼軌裂紋特征提取配置一致,設(shè)置7/10進(jìn)行訓(xùn)練,3/10檢測網(wǎng)絡(luò)性能,學(xué)習(xí)率為0.001。三類模型訓(xùn)練損失函數(shù)如圖9所示;各模型準(zhǔn)確率曲線如圖10所示。由圖9~10可以看出,RNN損失函數(shù)小于另外兩者,但損失值最大。而BiLSTM與LSTM對比,前者損失函數(shù)值下降最快,且最終損失函數(shù)值要小于后者,所以BiLSTM檢測性能要比LSTM性能好,準(zhǔn)確率也高于LSTM。三類模型的準(zhǔn)確率隨著迭代次數(shù)的增加逐漸提高,在對比三類模型后發(fā)現(xiàn)僅有BiLSTM的準(zhǔn)確率在不斷提升,其最終準(zhǔn)確率為87.57%,證明了BiLSTM檢測效果要優(yōu)于其余兩者。
為了進(jìn)一步探索得到最優(yōu)的模型參數(shù),并提高檢測準(zhǔn)確率,使其達(dá)到檢測效果,繼續(xù)對檢測模型進(jìn)行優(yōu)化,發(fā)現(xiàn)網(wǎng)絡(luò)層數(shù)與每層隱藏節(jié)點數(shù)為檢測模型待優(yōu)化的參數(shù)?,F(xiàn)對三種模型中具有最佳檢測效果的BiLSTM模型進(jìn)行分析,先構(gòu)造兩層BiLSTM層,再分別選用64、128、256、512作為模型的隱藏節(jié)點,實驗對比結(jié)果如表3所示。由表3可以看出,節(jié)點512與256對比,僅提升了0.1%,沒有發(fā)生很大的變化,所以根據(jù)成本,隱藏節(jié)點選用256為最優(yōu)。
其次選用隱藏節(jié)點數(shù)為256,分別對LSTM與BiLSTM進(jìn)行分析。對前者網(wǎng)絡(luò)層數(shù)設(shè)置為4層,后者設(shè)置為3層,構(gòu)造網(wǎng)絡(luò)并進(jìn)行訓(xùn)練,比較兩種模型不同層數(shù)對鋼軌裂紋檢測準(zhǔn)確率的影響。如表4所示。
由表4可以看出,LSTM準(zhǔn)確率隨網(wǎng)絡(luò)層次數(shù)目的增加,先上升后下降,在4層的時候準(zhǔn)確率最大,為88.81%,超過4層又下降,所以LSTM選用隱藏節(jié)點256,網(wǎng)絡(luò)層數(shù)4層時為最佳檢測效果;BiLSTM準(zhǔn)確率增加到一定程度后繼續(xù)下降,在3層的時候準(zhǔn)確率最大,為89.15%,僅比2層高了0.23%,而4層時的準(zhǔn)確率均比2、3層時準(zhǔn)確率小,且用時也會延長。為此考慮成本與檢測精度,BiLSTM網(wǎng)絡(luò)層選用隱藏節(jié)點256,網(wǎng)絡(luò)層數(shù)2層時為最佳檢測效果。
3 優(yōu)化雙向長短時記憶網(wǎng)絡(luò)的鋼軌裂紋檢測模型
3.1 改進(jìn)BiLSTM模型的搭建
相比較BP網(wǎng)絡(luò)分類器,鋼軌裂紋信號的一維特性能很好地被一維CNN模型適應(yīng),提取鋼軌裂紋局部特性信號,但沒考慮到鋼軌裂紋信號的時序信息。而BiLSTM考慮了裂紋信號時序信息,可以捕捉長期依賴關(guān)系,擁有比一維CNN更高的準(zhǔn)確度,但提取特性信息的能力較弱。為此通過將兩者結(jié)合,提出一種改進(jìn)的BiLSTM結(jié)構(gòu),更好地進(jìn)行鋼軌裂紋檢測,并構(gòu)建全連接層對鋼軌裂紋檢測進(jìn)行預(yù)測。網(wǎng)絡(luò)模型如圖11所示。
3.2 實驗結(jié)果與分析
采用預(yù)處理裂紋聲發(fā)射信號作為輸入數(shù)據(jù),根據(jù)與前文相同的計算方法進(jìn)行計算,通過數(shù)據(jù)圖分析得到平均準(zhǔn)確率為91.24%,隨后將表現(xiàn)最好的不同模型準(zhǔn)確率進(jìn)行對比,如表5所示,可以看出,一維CNN與BiLSTM結(jié)合模型的準(zhǔn)確率相比前四者都有提升,且達(dá)到了最高準(zhǔn)確率,為91.24%。將此數(shù)據(jù)導(dǎo)入混淆矩陣進(jìn)行評估,得到每類信號準(zhǔn)確率均為90%以上,證明改進(jìn)的BiLSTM模型可以對復(fù)雜情況下的鋼軌裂紋信號進(jìn)行檢測。
4 結(jié)語
本文通過真實情況下采集得到鋼軌裂紋聲發(fā)射信號,經(jīng)過預(yù)處理后進(jìn)行分類與特征提取,針對CNN和BiLSTM的鋼軌裂紋檢測方法進(jìn)行研究,并提出一種基于一維CNN和BiLSTM結(jié)合的有監(jiān)控鋼軌裂紋檢測模型,優(yōu)化BiLSTM鋼軌裂紋檢測模型,實現(xiàn)更好的鋼軌裂紋信號檢測。主要結(jié)論如下:
(1)利用預(yù)處理采集的聲發(fā)射信號構(gòu)建分幀樣本集,提取鋼軌裂紋和5種噪聲的特征,通過BP網(wǎng)絡(luò)設(shè)計檢測模型,得到73.62%的準(zhǔn)確率。結(jié)果表明,鋼軌裂紋與噪聲特征提取與各種噪聲的干擾有關(guān),需通過提升鋼軌裂紋檢測的精度,才能實現(xiàn)鋼軌裂紋有效特征信息的提取。
(2)分別構(gòu)建基于一維CNN與二維CNN的鋼軌裂紋檢測模型,對比兩種方法,采用一維CNN可以有效地檢測鋼軌裂紋信息,且準(zhǔn)確率為84.51%。證明了一維CNN效果優(yōu)于二維CNN。
(3)針對鋼軌裂紋時序信息,分別構(gòu)建基于RNN、LSTM、BiLSTM的鋼軌裂紋檢測模型,對其進(jìn)行檢測分析與模型的進(jìn)一步優(yōu)化。結(jié)果表明,有且僅有隱藏節(jié)點為256、網(wǎng)絡(luò)層次為2層時,BiLSTM模型檢測效果最佳,準(zhǔn)確率為88.92%。
(4)基于一維CNN提取特征信號的特性及BiLSTM擁有時序信息與捕捉長期依賴關(guān)系的特性,得到一維CNN與BiLSTM相結(jié)合的高效率檢測性能的模型,檢測準(zhǔn)確率達(dá)到91.24%,能實現(xiàn)復(fù)雜情況下鋼軌裂紋的檢測工作。
[1]顧桂梅,賈文晶.鋼軌軌底裂紋紅外熱波無損檢測數(shù)值模擬分析[J].紅外技術(shù),2018,40(3):294-299.
[2]高運來.鐵路鋼軌裂紋的在線高速漏磁巡檢[D].南京:南京航空航天大學(xué),2013.
[3]X.Ding,Q.He,Energy-fluctuated multiscale feature learning with deepconvnet for intelligent spindle bearing fault diagnosis[J].IEEE Transactions on Instrumentation and Measurement,2017,66(8):1 926-1 935.
[4]于金濤.直升機(jī)復(fù)合材料試件聲發(fā)射信號處理算法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2012.
[5]韓瑞東.基于卷積網(wǎng)絡(luò)與長短時記憶網(wǎng)絡(luò)的鋼軌裂紋檢測方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2019.
[6]林 楊,高思煜,劉同舜,等.基于深度學(xué)習(xí)的高速銑削刀具磨損狀態(tài)預(yù)測方法[J].機(jī)械與電子,2017,35(7):12-17.
[7]顏 荔.基于卷積神經(jīng)網(wǎng)絡(luò)的遙感圖像飛機(jī)目標(biāo)識別研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2018.
[8]袁群勇.深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練優(yōu)化方法研究[D].廣州:華南理工大學(xué),2020.
[9]周長義,孫 偉.基于聲發(fā)射檢測的鋼軌斷裂實時監(jiān)測及定位方法研究[J].鐵道科學(xué)與工程學(xué)報,2020,17(1):232-238.
[10]徐東坡.遞歸神經(jīng)網(wǎng)絡(luò)梯度學(xué)習(xí)算法的收斂性[D].大連:大連理工大學(xué),2009.
[11]劉禮文,俞 弦.循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及應(yīng)用研究[J].科技視界,2019(32):54-55.