張友鵬,張 迪,楊 妮,魏智健
(1.蘭州交通大學 自動化與電氣工程學院,甘肅 蘭州 730070;2.武漢地鐵集團有限公司 武漢地鐵運營有限公司,湖北 武漢 430070)
隨著鐵路線路數(shù)量、運營里程以及行車密度的不斷增加,鐵路信號設(shè)備在保證行車安全和提高行車效率方面發(fā)揮著越來越重要的作用。轉(zhuǎn)轍機作為鐵路信號設(shè)備室外三大件之一是重要的線路轉(zhuǎn)換設(shè)備,它通過缺口檢查、判斷尖軌與基本軌是否密貼以確保列車安全通過道岔。由于轉(zhuǎn)轍機安裝于室外,受雨雪等各種自然條件及震動、沖擊等外界因素的影響較大,其故障率在鐵路信號設(shè)備中居高不下。據(jù)統(tǒng)計發(fā)現(xiàn),道岔轉(zhuǎn)換設(shè)備故障占所有信號設(shè)備故障總數(shù)的40%以上[1]。目前,鐵路現(xiàn)場主要通過設(shè)備周期性巡檢以及電流曲線和功率曲線對道岔狀態(tài)進行人工分析,這些方法都依賴于工作人員的現(xiàn)場經(jīng)驗,易造成道岔設(shè)備維修不足或維修過剩等問題[1]。在理論研究方面,對于轉(zhuǎn)轍機狀態(tài)的研究主要集中于故障狀態(tài)的診斷以提高診斷的速度和準確率,而關(guān)于轉(zhuǎn)轍機在使用壽命內(nèi)由正常到失效整體狀態(tài)的研究還較少。因此,有必要對轉(zhuǎn)轍機的退化狀態(tài)展開研究,為現(xiàn)場設(shè)備的維護與更換提供參考意見,從而降低故障發(fā)生的概率。
國內(nèi)外學者在提高轉(zhuǎn)轍機故障診斷的準確率和效率方面取得了一些研究成果。2015 年,肖蒙等人[2]提出一種基于粗糙集的高效貝葉斯網(wǎng)絡(luò)故障診斷模型,由推理算法求解各類故障發(fā)生的概率。2016 年,Vileiniskis 等人[3]通過單類支持向量機(OCSVM)方法對道岔轉(zhuǎn)換設(shè)備故障進行分類診斷學習,建立完整的故障診斷模型。2018 年,黃世澤等人[4]采用比較待測電流曲線與模板電流曲線弗雷歇距離的方法,根據(jù)相似度函數(shù)進行故障模式診斷。這些學者將轉(zhuǎn)轍設(shè)備故障數(shù)據(jù)與機器學習算法相結(jié)合,能夠?qū)D(zhuǎn)轍機各類故障進行準確識別。但是以上研究只能將轉(zhuǎn)轍機狀態(tài)簡單劃分為正常和故障2 種狀態(tài),無法描述轉(zhuǎn)轍機由正常到故障的整個退化過程,難以實現(xiàn)對故障的超前預(yù)判。
因此,一部分學者開始在轉(zhuǎn)轍機退化狀態(tài)識別與故障預(yù)測領(lǐng)域展開研究。2017 年,伏玉明等人[5]采用模糊綜合評判法對轉(zhuǎn)轍機健康狀況進行綜合評估。2018 年,戴乾軍等人[6]將轉(zhuǎn)轍機的退化過程按照全生命周期進行劃分,利用動態(tài)粒子群算法優(yōu)化隱半馬爾科夫(HSMM)模型,實現(xiàn)對轉(zhuǎn)轍機的故障預(yù)測。2019 年,候大山[7]將道岔設(shè)備故障分為突發(fā)故障和緩變故障,針對緩變故障構(gòu)建性能退化指標并搭建緩變故障預(yù)測模型。2020年,高利民等人[8]利用自組織特征映射神經(jīng)網(wǎng)絡(luò)(SOM-BP)對轉(zhuǎn)轍機功率曲線特征參數(shù)進行多次聚類學習,得到6 種轉(zhuǎn)轍機退化樣本數(shù)據(jù),實現(xiàn)對道岔設(shè)備退化狀態(tài)的識別。以上文獻雖然對轉(zhuǎn)轍機退化狀態(tài)進行了劃分,但仍存在評估過程中參考相關(guān)專家經(jīng)驗,導致評估結(jié)果具有一定的主觀因素,且退化特征之間缺乏相關(guān)性分析,無法表征轉(zhuǎn)轍機壽命退化的整個過程。2022 年,武曉春等人[9]提出一種基于小波包分解與GG 聚類相結(jié)合的退化階段劃分方法,構(gòu)建退化性能指標;魏文軍等人[10]將轉(zhuǎn)轍機運行狀態(tài)分為健康、亞健康、故障、嚴重故障4 種類型,但相關(guān)文獻都沒有明確轉(zhuǎn)轍機退化狀態(tài)識別相對應(yīng)的轉(zhuǎn)轍機故障類型。目前關(guān)于轉(zhuǎn)轍機退化狀態(tài)的相關(guān)研究仍然較少。
本文提出一種自適應(yīng)白噪聲完備經(jīng)驗?zāi)B(tài)分解方法(Complete Ensemble Empirical Mode Decom?position with Adaptive Noise,CEEMDAN)與核模糊C 均值聚類(Kernel-based Fuzzy C-Means clustering,KFCM)相結(jié)合的轉(zhuǎn)轍機退化狀態(tài)識別方法,通過CEEMDAN 算法選取各固有模態(tài)函數(shù)(Intrinsic Mode Functions,IMFs)分量的能量密度作為特征向量集,并通過KFCM 算法進行無監(jiān)督聚類,從而實現(xiàn)對轉(zhuǎn)轍機轉(zhuǎn)換過程中阻力異常退化狀態(tài)階段的準確劃分,對轉(zhuǎn)轍機故障由正常到退化的整個過程進行描述。
信號集中監(jiān)測系統(tǒng)(CSM)是監(jiān)測鐵路信號設(shè)備狀態(tài)的綜合監(jiān)測平臺,可以實時記錄設(shè)備數(shù)據(jù),為鐵路現(xiàn)場維護工作提供參考依據(jù)[11]。CSM通過道岔采集單元對轉(zhuǎn)轍機動作過程中的電流、電壓、功率等數(shù)據(jù)進行實時采集。
交流轉(zhuǎn)轍機數(shù)據(jù)采集主要通過在A,B,C 三相電路中并聯(lián)電壓采集配線、串聯(lián)電流采集互感器得到轉(zhuǎn)轍機動作過程中相應(yīng)的電壓和電流值,并將電壓、電流輸出至功率采集單元經(jīng)過隔離采樣、A/D 轉(zhuǎn)換、編碼傳輸后輸出轉(zhuǎn)轍機動作過程中的功率值[12]。
三相交流轉(zhuǎn)轍機采集系統(tǒng)示意圖如圖1 所示。圖中:1DQJ 和1DQJF 分別為轉(zhuǎn)轍機1 啟動繼電器和1 啟動復示繼電器,采集系統(tǒng)通過斷相保護器(DBQ)前級端子11,31 及51 點的配線采集三相電路電壓;三相電流采集互感器采用互感方式穿芯采集三相電路電流。
圖1 三相交流轉(zhuǎn)轍機采集系統(tǒng)
完成電壓、電流采集后,功率采集單元每40 ms 計算1 次有功功率,將動作過程中的采樣點順次記錄形成電流曲線和功率曲線。由于電流曲線只能反映轉(zhuǎn)轍機動作過程中電流值的變化情況,而功率曲線不僅能反映三相電流電壓值的大小,更能反映轉(zhuǎn)轍機轉(zhuǎn)動過程中的阻力變化,所以選擇轉(zhuǎn)轍機功率曲線數(shù)據(jù)作為數(shù)據(jù)源。
同一個轉(zhuǎn)轍機正常轉(zhuǎn)動過程中4 個不同時刻的功率曲線如圖2 所示。由圖2 可以看出:4 條功率曲線都表示道岔能夠無故障正常轉(zhuǎn)換到位,但不同時刻的4條正常功率曲線并不相同,存在一定的差異;在轉(zhuǎn)轍機正常轉(zhuǎn)動過程中,啟動解鎖階段由于三相電動機轉(zhuǎn)動克服較大阻力,所以功率值急劇上升,阻力大小不同則功率峰值會有所不同;4 條曲線功率峰值依次為2.514,2.230,2.358 及2.488 kW,若在啟動階段道岔尖軌與基本軌之間密貼太緊而解鎖不良,可能會出現(xiàn)啟動功率過高的現(xiàn)象,若道岔密貼不足啟動功率過低,或信號集中監(jiān)測系統(tǒng)40 ms 的采樣周期無法捕捉到轉(zhuǎn)轍機啟動解鎖的峰值,避開了峰值采集點,又可能會造成功率曲線峰值的消失[10]。在轉(zhuǎn)換階段,轉(zhuǎn)轍機動作桿拉動道岔尖軌到達指定位置,正常情況下道岔轉(zhuǎn)換過程平穩(wěn),正常的轉(zhuǎn)轍機功率曲線應(yīng)較平直。但若道岔轉(zhuǎn)換過程中由于滑床板缺油等情況引起轉(zhuǎn)換阻力異常,從而導致道岔轉(zhuǎn)換受阻?;舶迥Σ磷枇Φ拇笮∨c轉(zhuǎn)轍機動作功率曲線的波動程度具有相關(guān)性,功率曲線的波動程度反映了轉(zhuǎn)轍機轉(zhuǎn)換期間所受摩擦阻力的大小變化,具有退化過程[13-14]。若發(fā)現(xiàn)轉(zhuǎn)轍機轉(zhuǎn)換階段功率值發(fā)生偏差而不及時調(diào)整,可能會導致道岔無法正常轉(zhuǎn)換[15]。
圖2 不同時刻正常動作功率曲線
大部分故障發(fā)生前,功率曲線雖會出現(xiàn)異常波動但與正常曲線無明顯差異,監(jiān)測人員可能會忽略這些細微的變化而錯過最佳維修時間。若直至道岔出現(xiàn)故障才進行維修,不但增大維修成本,而且可能會影響行車安全與行車效率。如果對具有退化趨勢的故障進行退化狀態(tài)識別研究,進行針對性維修,可以提高鐵路現(xiàn)場在日常維護中的維修效率。
EMD(經(jīng)驗?zāi)B(tài)分解,Empirical Mode De?composition)將原始信號按照高頻到低頻的順序分解為一系列固有模態(tài)函數(shù),從而反映非平穩(wěn)信號的局部特征。但EMD 在分解過程中會出現(xiàn)模態(tài)混疊的現(xiàn)象,對信號分解產(chǎn)生干擾。為了克服模態(tài)混疊,EEMD(集成經(jīng)驗?zāi)B(tài)分解,Ensemble Em?pirical Mode Decomposition)對原始信號添加高斯白噪音,利用EMD 濾波器的二元濾波器組特性填充整個時頻空間以減少模態(tài)混合,但是EEMD 在對信號加噪的過程中可能會產(chǎn)生一定的虛假分量,影響后續(xù)的信號分析。為此,CEEMDAN在EEMD的基礎(chǔ)上加以改進,在每次分解中加入成對的高斯白噪聲并進行平均運算,解決白噪聲從高頻到低頻的傳遞問題,從而抑制模態(tài)混疊和假分量的產(chǎn)生,更適用于對非線性、非平穩(wěn)信號進行時頻分析,而轉(zhuǎn)轍機功率曲線信號非線性、非平穩(wěn)的特點與CEEMDAN 算法的適用范圍相匹配,因此選擇CEEMDAN提取轉(zhuǎn)轍機功率曲線信號特征。
CEEMDAN算法計算過程如下。
(1)用k表示第k階模態(tài)分量,k=1 時,令轉(zhuǎn)轍機功率曲線信號p(t)=r0(t),r0(t)為待分解信號,向p(t)中添加高斯白噪聲Ni(t),添加i(i=1,2,…,I)次得到疊加信號xi(t)為
(2)對xi(t)進行EMD分解,獲得I個IMF分量c0i(t)。
(3)對c0i(t)集合平均得到第1 階IMF 分量c1(t)為
(4)計算第1階余量r1(t),計算式為
(5)向1 階余量中繼續(xù)添加i次白噪聲E(Ni(t)),得到新的待分解信號Yi(t),計算式為
(6)對Yi(t)進行EMD 分解得到IMF 分量c1i(t),并集合平均得到第2 階IMF 分量c2(t),計算式為
(7)當k=2,3,…,K時,第k階余量rk(t)計算式為
第k+1階IMF分量ck+1(t)計算式為
(8)將k依次遞加,重復步驟(5)—步驟(7),當余量為單調(diào)函數(shù)時停止分解,得到最終分解結(jié)果為
信號在不同頻率下能量幅值會發(fā)生相應(yīng)的變化,為了反映這種變化,可以在CEEMDAN 分解之后計算各IMF分量的能量分布[16]。
通過對非線性信號進行CEEMDAN 分解可以得到T個IMF 分量,通過熵值計算可以得到相應(yīng)的能量E1,E2,…,ET。假設(shè)最后分解余量忽略不計,由CEEMDAN 分解的正交性可知,分解后的IMF 分量能量之和等于原式功率信號的總能量,從而得到功率信號在頻率域上的能量分布。CEEMDAN能量熵HEN定義為
其中,
式中:pi為第i個本征模函數(shù)的能量占總能量E的比重;Ei為第i個本征模函數(shù)的能量。
轉(zhuǎn)轍機結(jié)構(gòu)復雜,其退化過程具有模糊、隨機的特點,且其功率信號非平穩(wěn)非線性。KFCM 算法為無監(jiān)督聚類算法且核函數(shù)的引入更適用于處理非線性數(shù)據(jù),具有在沒有人為干預(yù)條件下通過數(shù)據(jù)特征尋找潛在數(shù)據(jù)結(jié)構(gòu)[17],從而將數(shù)據(jù)劃分為不同退化階段的能力,可以很好地解決轉(zhuǎn)轍機功率數(shù)據(jù)退化階段劃分的問題。
KFCM 算法通過核函數(shù)將數(shù)據(jù)通過非線性映射Φ:X→H:Φ(x)=y,將特征映射至高維特征空間,由高維特征空間的線性函數(shù)對數(shù)據(jù)集進行劃分,相比于FCM 算法能夠更精確地進行樣本聚類。
(1)給定原始特征數(shù)據(jù)集X,聚類個數(shù)c,收斂精度ε,由FCM算法初始化聚類中心v0;
(2)定義vi(i=1,2,…,c)為第i個聚類中心,uij(i=1,2,…,c;j=1,2,…,n)為第j個樣本第i類的隸屬度函數(shù),KFCM目標函數(shù)為
式中:U={uij};v={v1,v2,…,vc};m為加權(quán)指數(shù);為Φ(xj)到Φ(vi)之間距離的平方;K(xj,vi)為高斯核函數(shù);σ為平滑程度參數(shù)。
(3)由拉格朗日乘子法得到U,v的迭代表達式為
為了分析KFCM 算法分類的準確度,采用分類系數(shù)F和平均模糊熵H進行聚類效果評估。
分類系數(shù)為隸屬度的均方值,F(xiàn)越接近1,聚類效果越好。
平均模糊熵反映了隸屬度分布所蘊含的信息熵的大小,H越接近0,聚類效果越好。
以S700K 轉(zhuǎn)轍機退化狀態(tài)為研究核心,以其使用壽命內(nèi)功率曲線數(shù)據(jù)為研究對象,構(gòu)建轉(zhuǎn)轍機退化狀態(tài)識別模型,具體流程示意圖如圖3 所示。首先通過CEEMDAN 算法將功率曲線數(shù)據(jù)展開為多個IMFs,根據(jù)其能量密度獲得特征向量集;其次由KFCM 聚類算法進行轉(zhuǎn)轍機退化狀態(tài)劃分;最后通過分類系數(shù)和平均模糊熵對KFCM 算法聚類效果進行綜合評估,證明所提方法的有效性。
圖3 退化狀態(tài)劃分示意圖
為驗證基于CEEMDAN 算法與KFCM 聚類算法進行轉(zhuǎn)轍機退化狀態(tài)研究方法的可行性,對某鐵路公司1 臺發(fā)生轉(zhuǎn)換阻力異常故障的轉(zhuǎn)轍機進行研究,向前回溯該發(fā)生故障的轉(zhuǎn)轍機3 個月內(nèi)的正常動作功率曲線數(shù)據(jù)共434條進行分析驗證。
由CSM 采集的轉(zhuǎn)轍機動作過程功率曲線作為數(shù)據(jù)源,通過CEEMDAN 算法進行模態(tài)分解并得到能量熵特征。相關(guān)系數(shù)越大,與原始信號的相關(guān)性越高,越能反映原始信號的物理信息,所以通過計算各IMF 分量的相關(guān)系數(shù)大小確定IMF 分量的個數(shù)為8 個。由于每組數(shù)據(jù)前6 個IMF 能量幅值較高,第6 個以后的能量幅值很小,所以選取前6 個IMF 分量的能量熵作為退化狀態(tài)識別數(shù)據(jù)特征集見表1。
表1 特征參數(shù)數(shù)據(jù)集
通過KFCM 聚類算法對轉(zhuǎn)轍機從正常到失效的整個過程進行研究,由退化狀態(tài)研究各類參考文獻[9,18]可知,退化狀態(tài)通常劃分為3~5 個退化階段。本文將CEEMDAN 分解得到的特征向量進行PCA 降維后得到二維特征向量A1,A2,通過KF?CM 聚類算法對于聚類數(shù)目c分別取3,4,5 時進行無監(jiān)督聚類,KFCM 參數(shù)設(shè)定為:m=2,?=0.000 01。KFCM 聚類圖如圖4 所示。圖中:P1和P2分別為聚類中心的橫坐標與縱坐標;紅色圓圈為聚類中心。由圖4可知:當c=4時,聚類簇之間的間隔更大,聚類劃分效果更好。通過分類系數(shù)和平均模糊熵對于c分別取3,4,5 時的聚類效果進行評估,結(jié)果見表2。
圖4 KFCM 聚類等高線圖
表2 聚類效果評估分析
由表2 可知:當c=4 時分類系數(shù)為0.956 2,更接近1,平均模糊熵為0.056 1,更接近0,因此c=4 更能展示不同退化狀態(tài)之間的特征差異,同種特征之間的差異也最小,所以分為4類時的聚類效果最好。
通過現(xiàn)場調(diào)研并與相關(guān)技術(shù)人員交流溝通,將轉(zhuǎn)轍機的4種退化過程劃分為正常、輕微退化、中度退化、嚴重退化4個階段,并通過聚類結(jié)果對該轉(zhuǎn)轍機各個退化階段的功率曲線進行分析以證明該聚類算法的有效性,各個退化階段的功率曲線如圖5所示。
圖5 S700K轉(zhuǎn)轍機各退化狀態(tài)功率曲線
由圖5 可知:正常狀態(tài)轉(zhuǎn)轍機功率曲線較平穩(wěn);輕微退化狀態(tài)功率曲線會產(chǎn)生小幅度波動;中度退化狀態(tài)功率值明顯高于輕微退化狀態(tài);而嚴重退化狀態(tài)轉(zhuǎn)轍機因為受摩擦阻力較大而在轉(zhuǎn)換階段出現(xiàn)了明顯凸起,與聚類結(jié)果一致。
4類狀態(tài)聚類中心坐標見表3。
表3 KFCM聚類中心坐標
為了驗證本文所提方法的有效性,除去訓練聚類模型所用到的434 條轉(zhuǎn)轍機正常轉(zhuǎn)換功率曲線數(shù)據(jù),從故障發(fā)生前3個月的轉(zhuǎn)轍機功率曲線數(shù)據(jù)中繼續(xù)等間隔抽取100 條使用壽命內(nèi)轉(zhuǎn)轍機功率曲線數(shù)據(jù)構(gòu)成測試數(shù)據(jù)集,對聚類模型的聚類準確性進行分析驗證,最終測試樣本的分類準確率達到95.6%。由于測試數(shù)據(jù)集中有小部分樣本數(shù)據(jù)位于2 種退化狀態(tài)的邊界位置,對于2 個聚類簇的隸屬度都不高,難以界定屬于何種退化狀態(tài),對于分類準確度有一定的影響,所以仍有4.4%的數(shù)據(jù)未能準確識別。
不同聚類算法在聚類數(shù)目c=4 時的聚類識別結(jié)果以及相應(yīng)的分類系數(shù)與平均模糊熵見表4。通過選擇在退化狀態(tài)識別領(lǐng)域應(yīng)用較廣泛的FCM 算法[19]和GK 算法[20]進行比較分析。由于FCM 算法對初始聚類中心較敏感,GK 算法對于球類數(shù)據(jù)聚類更加有效。由表4 可知:相較于FCM 算法和GK 算法,KFCM 算法聚類效果更佳,具有一定的優(yōu)越性。
表4 不同聚類方法退化狀態(tài)識別比較
針對S700K 交流轉(zhuǎn)轍機運行狀態(tài)與其動作功率曲線之間的關(guān)系,提出時頻分析與能量熵相結(jié)合的S700K 轉(zhuǎn)轍機退化狀態(tài)核模糊聚類分析方法。該方法以轉(zhuǎn)轍機轉(zhuǎn)換過程中阻力異常故障的退化發(fā)展過程為具體研究對象,根據(jù)轉(zhuǎn)轍機在不同性能退化狀態(tài)下功率信號能量分布的差異,利用CEEM?DAN 將非線性功率曲線數(shù)據(jù)分解成不同的IMF 分量,并根據(jù)IMF 分量的能量密度獲得特征向量集,實現(xiàn)轉(zhuǎn)轍機功率曲線典型特征信息的表征,并在S700K 交流轉(zhuǎn)轍機退化狀態(tài)聚類識別過程中采用KFCM 無監(jiān)督聚類算法進行聚類,降低主觀經(jīng)驗對于聚類結(jié)果的影響,無需對模型進行訓練即可實現(xiàn)退化狀態(tài)識別。
試驗結(jié)果表明該方法能夠較好地劃分轉(zhuǎn)轍機性能退化各個階段的不同狀態(tài),識別準確率達到95.6%,對于鐵路現(xiàn)場轉(zhuǎn)轍設(shè)備的故障預(yù)判以及維修維護具有一定的指導意義。