田粉霞,楊世武,崔 勇,武 沛
(北京交通大學(xué) 電子信息工程學(xué)院, 北京 100044)
截至2019 年底,我國(guó)高速鐵路里程已達(dá)3.5 萬(wàn)km。作為高鐵基礎(chǔ)設(shè)備,ZPW-2000 系列無(wú)絕緣軌道電路完成全線列車占用檢查,并向車載設(shè)備發(fā)送連續(xù)信息,其功能完整性直接影響列車安全和運(yùn)行效率,其故障診斷的實(shí)時(shí)性具有重要意義。在軌道電路故障診斷方面已開(kāi)展了較多研究[1-2]。調(diào)諧區(qū)作為實(shí)現(xiàn)相鄰兩軌道區(qū)段軌道電路信號(hào)的隔離,且該部分設(shè)備在軌旁1.5 m 的位置[3],受列車震動(dòng)以及環(huán)境影響,極易發(fā)生故障。當(dāng)調(diào)諧區(qū)設(shè)備發(fā)生故障時(shí),相鄰兩區(qū)段的信號(hào)會(huì)發(fā)生混頻,機(jī)車可能接收到相鄰軌道區(qū)段的信號(hào),造成錯(cuò)誤解碼,從而影響列車安全運(yùn)行。當(dāng)列車占用區(qū)間的發(fā)送端調(diào)諧區(qū)設(shè)備故障時(shí),列車可接收運(yùn)行前方區(qū)段的軌道電路信號(hào),最嚴(yán)重情況下可能發(fā)生列車追尾事故;當(dāng)列車占用區(qū)間的接收端調(diào)諧區(qū)設(shè)備故障時(shí),列車可接收運(yùn)行后方區(qū)段的軌道電路信號(hào),最嚴(yán)重情況下可能導(dǎo)致本區(qū)段及后方區(qū)段列車停車,影響行車效率。因此,調(diào)諧區(qū)設(shè)備是否正常運(yùn)行對(duì)列車運(yùn)行安全及效率將產(chǎn)生直接影響。
文獻(xiàn)[4-5]采用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)調(diào)諧區(qū)設(shè)備的故障診斷,其特征提取方法是通過(guò)對(duì)前4 個(gè)補(bǔ)償電容區(qū)間內(nèi)的信號(hào)進(jìn)行曲線擬合,將擬合結(jié)果輸入到神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)故障分類,其前期特征提取過(guò)程較復(fù)雜;文獻(xiàn)[6]采用定性趨勢(shì)分析的方法,當(dāng)噪聲較小時(shí)診斷正確率可達(dá)到96.3%,當(dāng)信噪比達(dá)到40 dB 時(shí),診斷正確率降至65.4%,其診斷結(jié)果易受噪聲的影響;文獻(xiàn)[7]針對(duì)小波閾值去噪可能造成直接去除故障信號(hào)中較小幅度信號(hào)的影響,通過(guò)CEEMD 方法進(jìn)行軌面電壓信號(hào)的特征提取,但僅提取故障特征,需要與分類算法結(jié)合,才能實(shí)現(xiàn)故障診斷。
深度學(xué)習(xí)工具-卷積神經(jīng)網(wǎng)絡(luò)能同時(shí)實(shí)現(xiàn)特征提取及特征分類,且分類準(zhǔn)確率高,在語(yǔ)音識(shí)別、圖像處理、自然語(yǔ)言處理、信息抽取及故障診斷中應(yīng)用廣泛[8-10]。鑒于調(diào)諧區(qū)設(shè)備故障對(duì)機(jī)車信號(hào)電壓的影響與圖像分類中邊緣特征的提取相類似,因此本文采用卷積神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)調(diào)諧區(qū)設(shè)備的故障診斷,該算法可以在集中監(jiān)測(cè)設(shè)備上實(shí)現(xiàn),當(dāng)設(shè)備未發(fā)生完全松斷時(shí)便可預(yù)測(cè)診斷出故障隱患,實(shí)時(shí)性及預(yù)防效果較好。
利用軌道電路地面采集的數(shù)據(jù),信號(hào)集中監(jiān)測(cè)系統(tǒng)只能實(shí)現(xiàn)部分故障的診斷。為實(shí)現(xiàn)完整的故障診斷,需進(jìn)一步結(jié)合車載設(shè)備采集的數(shù)據(jù)。機(jī)車采集的數(shù)據(jù)存儲(chǔ)在車載列車運(yùn)行監(jiān)控記錄裝置LKJ 中,通過(guò)無(wú)線通信,可將這些數(shù)據(jù)傳輸至地面設(shè)備,由地面設(shè)備完成故障診斷,車地結(jié)合故障診斷[4,11]的實(shí)現(xiàn)過(guò)程如圖1 所示。
圖1 車地結(jié)合故障診斷示意
為獲取機(jī)車信號(hào)電壓,建立分路狀態(tài)下機(jī)車信號(hào)電壓模型[12-14],如圖2 所示。
圖2 分路狀態(tài)下機(jī)車信號(hào)電壓模型
圖2 中,Vs為發(fā)送器輸出電平;x為分路點(diǎn)在鋼軌的位置;F(x)為發(fā)送器至分路點(diǎn)間設(shè)備的四端網(wǎng)傳輸矩陣;IR為分路電流;Rf為分路電阻;T(x)為分路點(diǎn)至接收端的傳輸矩陣;ZR為接收器的輸入阻抗;Zi為分路點(diǎn)向接收端的輸入阻抗。
機(jī)車分路電流為:
機(jī)車信號(hào)電壓為:
其中,α為接近于常數(shù)的系數(shù)。
通過(guò)仿真得到調(diào)諧區(qū)無(wú)故障時(shí)機(jī)車信號(hào)電壓,如圖3a 所示;現(xiàn)場(chǎng)從LKJ 中截取的波形如圖3b 所示,信號(hào)-時(shí)間關(guān)系曲線可通過(guò)采樣頻率與速度的關(guān)系轉(zhuǎn)換為信號(hào)-位置關(guān)系[6]。由圖3 可知,仿真值與現(xiàn)場(chǎng)數(shù)據(jù)基本一致;由于仿真模型中發(fā)送端到接收端的方向與現(xiàn)場(chǎng)的方向相反,因此波形的趨勢(shì)相反。
不同故障模式(BA2、SVA、BA1)下機(jī)車信號(hào)電壓如圖4 所示。仿真實(shí)驗(yàn)獲取的數(shù)據(jù)中,各類故障模式的嚴(yán)重程度見(jiàn)表1。
圖3 機(jī)車信號(hào)電壓
圖4 不同故障類型時(shí)機(jī)車信號(hào)電壓
表1 故障模式嚴(yán)重程度
考慮到機(jī)車信號(hào)電壓補(bǔ)償電容故障及道砟電阻大小等因素的影響,對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充,以補(bǔ)償電容C3 及C9 故障為例說(shuō)明,如圖5a 所示。不同道砟電阻對(duì)機(jī)車信號(hào)電壓的影響如圖5b 所示。
圖5 不同現(xiàn)場(chǎng)條件對(duì)機(jī)車信號(hào)電壓的影響
由調(diào)諧區(qū)的結(jié)構(gòu)組成可知,調(diào)諧區(qū)4 種故障模式對(duì)應(yīng)CNN 分類層4 個(gè)輸出神經(jīng)元的輸出;激活函數(shù)輸出值為1 時(shí),則輸入信號(hào)屬于該類故障;激活函數(shù)輸出值為0 時(shí),激活函數(shù)不屬于該類故障。調(diào)諧區(qū)4 類故障模式對(duì)應(yīng)的編碼見(jiàn)表2。
表2 故障模式編碼
相對(duì)于前饋神經(jīng)網(wǎng)絡(luò)及BP 神經(jīng)網(wǎng)絡(luò),CNN 在輸入層后增加了卷積層及池化層,用來(lái)實(shí)現(xiàn)輸入信號(hào)的特征提取及降維。采用BP 神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)調(diào)諧區(qū)的故障診斷時(shí),若直接將采集信號(hào)輸入到算法中,會(huì)導(dǎo)致節(jié)點(diǎn)數(shù)量多,算法復(fù)雜度上升,內(nèi)存占用率高;若降低輸入信號(hào)的維度,則需要人為確定故障特征顯著的區(qū)域, 并通過(guò)擬合等方法確定故障特征,數(shù)據(jù)前期處理過(guò)程較為繁瑣。通過(guò)CNN 實(shí)現(xiàn)故障診斷時(shí),卷積層可實(shí)現(xiàn)輸入信號(hào)的特征提取,并通過(guò)設(shè)置池化層參數(shù)實(shí)現(xiàn)輸入信號(hào)的降維。
試驗(yàn)中區(qū)間軌道電路每隔1 m 生成一組數(shù)據(jù),卷積神經(jīng)網(wǎng)絡(luò)單個(gè)輸入數(shù)據(jù)維度為1×1 200,輸出信號(hào)的維度為1×w;其中,w的計(jì)算公式為:
其中,m為卷積核的大小,p為補(bǔ)零的圈數(shù),s為卷積層的采樣步長(zhǎng)。輸出信號(hào)值的計(jì)算公式[10]為:
yl,k,i為第l 層卷積層第k個(gè)卷積核的第i個(gè)輸出,W為第l 層卷積層的第k個(gè)卷積核的權(quán)值,xj為第l層卷積層的輸入信號(hào),為第l 層卷積層的第k個(gè)神經(jīng)元的偏置。卷積層的激活函數(shù)f常采用relu 函數(shù):
原始輸入數(shù)據(jù)經(jīng)卷積層進(jìn)行特征提取后,其特征向量維度較高;因此,在盡量保持原特征的條件下,通過(guò)池化層降低特征向量的維度。常用的池化層方法有平均池化、最大池化和重疊池化,本文選擇最大池化。若池化層的采樣步長(zhǎng)為s2,池化的區(qū)間大小為k2,輸出信號(hào)的維度為1×((w+2p)/s2),則第S層池化層中輸入為第k個(gè)卷積核的輸出的第j個(gè)輸出值的計(jì)算公式為:
池化后特征向量的維度通常大于分類層輸入信號(hào)的維度。因此,池化后增加全連接層,以實(shí)現(xiàn)池化層到分類層的維度轉(zhuǎn)換。分類層通過(guò)softmax 函數(shù)實(shí)現(xiàn)輸入特征的分類,函數(shù)形式為:
其中,F(xiàn)(Xi)為輸入信號(hào)xi屬于每種故障的概率值,各元素之和為1,F(xiàn)5j為全連接層的輸出。
通過(guò)目標(biāo)函數(shù)的最小化實(shí)現(xiàn)權(quán)值及偏置的優(yōu)化,目標(biāo)函數(shù)為:
其中,y′i為實(shí)際標(biāo)簽中的第i個(gè)值。
權(quán)值及偏置的更新過(guò)程分別為式(9)和式(10):
其中,α為學(xué)習(xí)率。為保證快速得到一個(gè)較優(yōu)的解,開(kāi)始訓(xùn)練時(shí)使用較大學(xué)習(xí)率,然后通過(guò)迭代逐步減小學(xué)習(xí)率,使模型在訓(xùn)練后期更加穩(wěn)定;加入指數(shù)衰減學(xué)習(xí)率,其計(jì)算公式為:
其中,α0為初始學(xué)習(xí)率,取值范圍為[0,1];r為衰減系數(shù);c為當(dāng)前迭代次數(shù);s為衰減速度。
鑒于輸入信號(hào)維度較高,采用兩層卷積層及兩層池化層實(shí)現(xiàn)輸入信號(hào)的特征提取;第2 池化層后連接兩層全連接層,第1 層全連接層實(shí)現(xiàn)特征向量到輸出向量間的個(gè)數(shù)轉(zhuǎn)換,第2 層全連接層用來(lái)實(shí)現(xiàn)故障分類。在模型訓(xùn)練過(guò)程中,采用dropout 函數(shù)提高模型的泛化能力,防止模型出現(xiàn)過(guò)擬合,同時(shí)減少需要訓(xùn)練的參數(shù),可縮短模型的訓(xùn)練時(shí)間。
通過(guò)Matlab 仿真,獲取軌道電路正常情況下以及不同故障在不同故障嚴(yán)重程度條件下的數(shù)據(jù)總共2 112 條,仿真實(shí)驗(yàn)中相關(guān)參數(shù)設(shè)置見(jiàn)表3。訓(xùn)練集數(shù)據(jù)越多,模型精度越高。因此,按照訓(xùn)練集:測(cè)試集=9:1的比例對(duì)模型進(jìn)行訓(xùn)練,訓(xùn)練步驟為1 500步,初始學(xué)習(xí)率為0.001。
表3 測(cè)試參數(shù)設(shè)置
基于TensorFlow 框架實(shí)現(xiàn)CNN,仿真及訓(xùn)練過(guò)程中使用的計(jì)算機(jī)處理器為Intel(R) Core(TM)i5-4200U CPU@1.60 GHz。
故障診斷中使用的數(shù)據(jù)集標(biāo)簽是人為標(biāo)記的,因而難免存在數(shù)據(jù)標(biāo)簽錯(cuò)誤的情況。當(dāng)上述情況發(fā)生時(shí),loss 值較正常值偏差較大,會(huì)對(duì)參數(shù)的學(xué)習(xí)過(guò)程產(chǎn)生影響,如圖6 所示。
圖6 含錯(cuò)誤標(biāo)簽數(shù)據(jù)的損失函數(shù)變化
numpy 中的remove 函數(shù)無(wú)法刪除二維數(shù)組中的一維數(shù)據(jù),因此采用構(gòu)建錯(cuò)誤標(biāo)簽數(shù)據(jù)集的方法,可減小錯(cuò)誤標(biāo)簽數(shù)據(jù)對(duì)訓(xùn)練過(guò)程的影響,實(shí)現(xiàn)流程如圖7 所示。
圖7 訓(xùn)練集中錯(cuò)誤標(biāo)簽數(shù)據(jù)識(shí)別流程
訓(xùn)練過(guò)程中加入圖7 所示的流程后,Loss 值的變化如圖8 中曲線l1 所示,波動(dòng)明顯減小,消除了錯(cuò)誤標(biāo)簽在下一次訓(xùn)練過(guò)程中對(duì)訓(xùn)練過(guò)程的影響;曲線l2 為刪除上述錯(cuò)誤標(biāo)簽數(shù)據(jù)后的Loss 圖。由圖8 可知,兩條曲線基本一致,即可以減小錯(cuò)誤數(shù)據(jù)標(biāo)簽對(duì)診斷結(jié)果的影響。
圖8 去除錯(cuò)誤標(biāo)簽數(shù)據(jù)損失函數(shù)變化
在CNN 中,特征提取通過(guò)卷積層實(shí)現(xiàn),卷積核的個(gè)數(shù)、大小及采樣長(zhǎng)度對(duì)診斷準(zhǔn)確率及模型訓(xùn)練時(shí)間有直接影響。因此,通過(guò)對(duì)該些參數(shù)的對(duì)比分析,選擇當(dāng)前條件下最優(yōu)的參數(shù)。
3.2.1 卷積核個(gè)數(shù)對(duì)診斷結(jié)果的影響
當(dāng)卷積核大小為1×2,采樣步長(zhǎng)為1×1,不同卷積核個(gè)數(shù)時(shí)的診斷結(jié)果見(jiàn)表4。
表4 卷積核個(gè)數(shù)對(duì)診斷結(jié)果的影響
由表4 可知,當(dāng)?shù)? 層(第1 卷積層)和第3 層(第2 卷積層)的卷積核個(gè)數(shù)分別大于8 和16 時(shí),診斷準(zhǔn)確率基本保持不變,訓(xùn)練時(shí)間變長(zhǎng),即算法復(fù)雜度的繼續(xù)增加對(duì)診斷結(jié)果無(wú)正向影響;因此,第1層和第3 層的卷積核個(gè)數(shù)分別選擇為8 和16。
3.2.2 卷積核大小對(duì)采樣結(jié)果的影響
當(dāng)?shù)? 層(第1 卷積層)和第3 層(第2 卷積層)的卷積核個(gè)數(shù)分別為8 和16、采樣步長(zhǎng)為1×1 時(shí),不同卷積核大小對(duì)應(yīng)的診斷結(jié)果見(jiàn)表5。
表5 卷積核大小對(duì)診斷結(jié)果的影響
由表5 可知,卷積核越大,需要訓(xùn)練的參數(shù)越多,模型訓(xùn)練的時(shí)間越長(zhǎng),且卷積核越大,容易造成局部特征的損失,故障診斷準(zhǔn)確率降低。
3.2.3 采樣步長(zhǎng)對(duì)診斷結(jié)果的影響
當(dāng)?shù)? 層(第1 卷積層)和第3 層(第2 卷積層)的卷積核分別為8 和16、卷積核大小為1×2 時(shí),不同采樣步長(zhǎng)對(duì)應(yīng)的診斷結(jié)果見(jiàn)表6。
表6 采樣步長(zhǎng)對(duì)診斷結(jié)果的影響
由式(3)可知,采樣步長(zhǎng)對(duì)卷積層輸出信號(hào)維度的影響按比例變化;當(dāng)采樣步長(zhǎng)變長(zhǎng)時(shí),輸出信號(hào)的個(gè)數(shù)減少,可訓(xùn)練參數(shù)的個(gè)數(shù)也減少,算法的復(fù)雜度降低,訓(xùn)練時(shí)間迅速減少,但輸入信號(hào)及第1層池化層的局部特征量損失嚴(yán)重,診斷準(zhǔn)確率降低。
通過(guò)對(duì)比分析上述參數(shù),在保證診斷準(zhǔn)確率的條件下,為降低算法復(fù)雜度,縮短模型訓(xùn)練時(shí)間,最終確定卷積層的參數(shù)為:第1 層(第1 卷積層)的卷積核個(gè)數(shù)為8,大小為1×2,采樣長(zhǎng)度為1×2;第3層(第2 卷積層)的卷積核個(gè)數(shù)16,大小為1×2,采樣步長(zhǎng)為1×2。對(duì)應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型如圖9 所示。
圖9 卷積神經(jīng)網(wǎng)絡(luò)模型
圖9 中,f1(x) 為卷積層激活函數(shù),本文采用ReLU 函數(shù);f2(x) 為池化層運(yùn)算函數(shù),本文采用Max_pool 函數(shù);全連接層F5中增加Dropout 函數(shù),以防止模型在訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合,神經(jīng)元被選中的概率值設(shè)置為0.5;f3(x)為分類層激活函數(shù),本文中用softmax 函數(shù)。當(dāng)信噪比為60 dB 時(shí),診斷結(jié)果見(jiàn)表7。
表7 訓(xùn)練集及測(cè)試集診斷結(jié)果
由表8 可知,當(dāng)SNR=60 dB 時(shí),測(cè)試集診斷準(zhǔn)確率可達(dá)到98.96%。由于軌道電路讀取器(TCR,Track Circuit Receiver)通過(guò)電磁感應(yīng)的方式接受軌道電路中的差模信號(hào)電流,易受不平衡牽引電流及環(huán)境噪聲的影響,因此對(duì)比分析不同信噪比條件下的診斷準(zhǔn)確率。
由表8 可知,卷積神經(jīng)網(wǎng)絡(luò)對(duì)噪聲具有較強(qiáng)的承受能力,在上述仿真實(shí)驗(yàn)條件中,當(dāng)噪聲由60 dB增大到40 dB 時(shí),測(cè)試集診斷正確率下降約為1%,即在噪聲干擾條件下,測(cè)試數(shù)據(jù)仍具有較高診斷正確率。
表8 信噪比對(duì)診斷結(jié)果的影響
采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)軌道電路調(diào)諧區(qū)進(jìn)行故障診斷研究,得出如下結(jié)論:
(1)在補(bǔ)償電容故障、不同道砟電阻的情況下仍然能識(shí)別出故障。針對(duì)現(xiàn)場(chǎng)不同道砟電阻及可能出現(xiàn)的補(bǔ)償電容故障對(duì)機(jī)車信號(hào)電壓的影響,對(duì)機(jī)車信號(hào)電壓數(shù)據(jù)集進(jìn)行補(bǔ)充,診斷結(jié)果表明算法可以實(shí)現(xiàn)不同環(huán)境下故障模式的識(shí)別。
(2)錯(cuò)誤數(shù)據(jù)標(biāo)簽的處理。對(duì)算法進(jìn)行訓(xùn)練的數(shù)據(jù)是人為標(biāo)記的,其中可能存在故障數(shù)據(jù)與標(biāo)簽不一致的現(xiàn)象,對(duì)模型參數(shù)訓(xùn)練及診斷準(zhǔn)確率均會(huì)造成影響。通過(guò)建立錯(cuò)誤標(biāo)簽數(shù)據(jù)集,并在下一次訓(xùn)練過(guò)程中剔除該數(shù)據(jù)集,可以減小錯(cuò)誤標(biāo)簽的影響,診斷結(jié)果表明該方法的有效性。
(3)噪聲環(huán)境下故障診斷的有效性。TCR 通過(guò)電磁感應(yīng)的方式獲取軌道電路信號(hào),會(huì)受到不同程度噪聲的影響;對(duì)不同噪聲程度下的故障進(jìn)行分類,結(jié)果表明:當(dāng)噪聲達(dá)到40 dB 時(shí),診斷準(zhǔn)確率為97.92%,即該診斷方法對(duì)噪聲具有較強(qiáng)的承受能力。