農漢彪,曾巧妮
(百色學院,廣西 百色 533000)
輪軌相互作用力監(jiān)測是軌道交通車輛運行安全狀態(tài)中非常重要的方法和途徑。通過輪軌力的監(jiān)測可以實時了解車輛運行過程中的減載率,脫軌系數等。在基于地面的輪軌力檢測中,通常通過測量鋼軌的動態(tài)響應來測量車輪通過時的輪軌相互作用力[1]。而在現場實測時,由于鋼軌支撐條件會存在一定的不確定性,比如懸枕,扣件松弛,以及地基彈性突變等情況,使得輪軌力測試信號中會出現基線漂移的干擾[2],基線漂移的出現影響了后續(xù)的輪軌力信號的定量分析以及對列車運行狀態(tài)的安全評估,所以必須予以去除。
去除基線漂移方法在心電圖信號處理[3-4],脈搏信號處理[5],眼電圖處理[6]等生物醫(yī)學領域中廣泛應用,在光學測試[7]和地震監(jiān)測[8]中也有了相關的文獻論述。而針對輪軌力信號降噪和基線漂移的消除,目前國內外較少涉及。
文獻[9]中提出了基于分段數據中值聚類的算法,該算法將信號數據分成很多分段,取分段數據的中值,將中值的時間間距與幅值間距作為距離測度進行最近距離聚類,得到了能代表基線漂移的基點,擬合基點得到基線漂移干擾。算法效果良好,然而算法中需要設置不同測度之間的協調因子,且該因子的設置與數據長度,采樣頻率,數據幅值等因數相關。文獻[10]利用LabVIEW提供的高級信號處理工具包和數字濾波器設計工具包對實測輪軌力應變信號進行處理,內容包括消除基準漂移、去除寬帶噪聲和提取信號特征等。文獻[11]提出一種小波包降噪算法與經驗模態(tài)分解(EMD)相關算法相結合的數據處理方法,有效地消除輪軌力在采集過程中隨機白噪聲的干擾和抑制模態(tài)的混疊。文獻[12]提出了基于集合經驗模態(tài)分解(EEMD)與小波變換相結合的去噪方法。對含有基線漂移的分量通過小波變換進行分解,將代表基線漂移的趨勢項置零達到去除基線漂移的目的。
近年來,基線漂移的去除方法趨向于將原信號通過不同的算法分解成純凈信號部分和干擾成分,主要算法有基EMD及其改進算法,如EEMD[13], CEEMDAN[14]等,有經驗小波分解(EWT)[15],傅里葉分解[16],變分模態(tài)分解(VMD)[17]等,而信號的分解總會存在頻率混疊問題,傳統的方法有FIR或IIR的方法,中值濾波[18],曲線擬合[19]和數學形態(tài)學濾波[20]等。曲線擬合方法是將信號中能代表基線漂移走勢的基點擬合成曲線并從原始信號中除去。該方法高效、準確,計算量小,但是從原始信號中提取和確定基點比較困難。本文根據輪軌力信號短時分段數據的高階統計量分布和基線漂移的關系,提出了基于分段數據高階統計量聚類分析的方法獲取基點所在的數據分段,以數據分段中值作為基點,再擬合即可得到基線漂移。
鋼軌的模型通常采用連續(xù)彈性基礎梁進行表示,鋼軌垂直位移與移動載荷的大小,速度,位置之間關系表示為[21]:
(1)
其中:EI為鋼軌的抗彎剛度,k為地基的彈性系數,m為單位長度鋼軌質量,P為鋼軌上載荷的大小,x為載荷作用點與觀測點之間的距離,v為載荷移動的速度,δ(·)為狄拉克函數。
靜態(tài)或準靜態(tài)時,在多個載荷的同時作用下,鋼軌上某觀測點的剪力為:
(2)
在實測信號中,測試系統采集到信號除了鋼軌載荷引起的響應之外,還包含了基線漂移成分和其他的隨機干擾,即采集到的信號f(t)可以表示為:
f(t)=Q(t)+BW(t)+n(t)
(3)
其中:Q(t)為車輪載荷所引起的剪力測量值;BW(t)為基線漂移信號,n(t)為白噪聲干擾信號,當所有|xi|>3πL/2時,Q(t)降為峰值的1%以內,此時BW(t)+n(t)Q(t),稱無載荷區(qū)間即:
f(t)≈BW(t)+n(t)
(4)
根據隨機噪聲的對稱性和基線漂移信號的緩變性,當所有|xi|>3πL/2時,短時間段內測試信號的中值即可表示為基線漂移成分的幅值,稱為基點。而當存在|xi|<3πL/2時,測量值f(t)包含鋼軌對載荷的響應,其數據段的中值不能表示為基點。擬合所有基點即可達到信號的基線漂移成分。而前提是正確篩選出能被視為基點的數據段中值數據。
對于f(t),由于Q(t),BW(t),n(t)相互獨立,則有f(t)的方差:
D(f(t))=D(Q(t)+BW(t)+n(t))=
D(Q(t))+D(BW(t))+D(n(t))
(5)
BW(t)為緩變信號,在短時間內BW(t)為可視為常數,即D(BW(t))=0,而白噪聲的方差D(n(t))可視為常數C;從而有當所有|xi|>3πL/2時:
D(f(t))=0+0+C=C
(6)
而在|xi|<3πL/2時:
D(f(t))=D(Q(t))+0+C=D(Q(t))+C
(7)
另外,同樣可以看到,在短時間內信號的峭度值:
(8)
其中μ為f(t)的數學期望,σ為f(t)的標準差,由于Q(t),BW(t),n(t)相互獨立,有:
K(f(t))=K(Q(t))+K(BW(t))+K(n(t))
(9)
短時間內BW(t)是均勻分布,即K(BW(t))=0,n(t)為正態(tài)分布,K(n(t))=3;從而有當所有|xi|>3πL/2時:
K(f(t))=0+0+3=3
(10)
而在|xi|<3πL/2時:
K(f(t))=K(Q(t))+0+3=K(Q(t))+3
(11)
聯合方差與峭度,無載荷期間內數據段的D(f(t)),和K(f(t))將主要分布在以方差和峭度為坐標軸的點(0,3)和點(C,3)附近,而承載期間的坐標位置將遠離這兩點坐標。根據以上分析,可以通過對分段數據的方差和峭度進行基于密度的聚類分析來篩選出無載荷期間的數據段。
基于密度的聚類分析可以將具有相同或相近特征的對象樣本之間的分為同一類,即在某類別任意樣本周圍一定空間范圍內一定有同類別的樣本存在,能有效區(qū)分有載荷期間數據段和無載荷期間數據段。基于密度的聚類分析的常用算法有DBSCAN,OPTICS和DENCLUE等。DBSCAN需要設定點數閾值minPts和鄰域半徑,全局密度,DENCLUE需要設定密度閥值和參數,這兩種算法的效果對參數非常敏感,需要確定合適的參數才能得到理想的效果。OPTICS是DBSCAN的一種改進方案,也要設定點數閾值minPts和鄰域半徑,但聚類結果對參數不敏感。
基于以上分析,應用基于密度的聚類分析可以有效找到信號中基點,從而實現基線漂移的消除。該方法的具體過程和步驟如下:
1)對測量數據進行分段。前后數據段之間可以部分重疊,以加大數據段數量和保證數據的連續(xù)性;
2)計算每數據段方差和峭度值,并分別進行歸一化處理;
3)針對歸一化方差和峭度兩個維度進行基于密度的聚類分析;
4)篩選出聚類結果中處于零點附近的一個分類或幾個分類;
5)對選用分類所對應的數據段取中值,即為基點;
6)曲線擬合所有基點得到基線漂移干擾。
分段時,數據段的大小需要根據信號自身的成分來確定。涉及到信號數據的采樣頻率,通過列車的轉向架間距,軸距和運行速度等。分塊大小的最優(yōu)設置是能將信號的負荷狀態(tài)和非負荷狀態(tài)完全分開,這是理想的情況,而實際上由于信號數據初始采集相位未知且列車運行速度并不恒定原因,無法在未識別壓頭時刻的情況下實現理想分段。而總會出現部分分段橫跨負荷狀態(tài)和非負荷狀態(tài)兩種狀態(tài)的情況。根據數據試驗結果一般采用的分大小可為:
(12)
分段數據的方差和峭度都是非負數值,但具有不同的數值范圍,基于密度的聚類需要考慮數據點之間的距離測度或相似度測度,為了均衡方差和峭度在距離測度上的貢獻,需要對方差和峭度進行歸一化處理。歸一化時可以將最大方差和最大峭度置為1,最小值置為零,其他進行線性化處理。
在聚類分析時,選用對參數不敏感的OPTICS算法,OPTICS所需要點數閾值minPts和鄰域半徑ε兩個參數可以通過自適應的方式來確定。鄰域半徑ε可以取所有數據樣點兩兩間距測度密度分布函數的最快下降梯度點所對應的距離測度,minPts可以取使得當前ε下所有分類間距總和最小的閾值。
為了定量分析基線消除方法的效果,預先準備一組零漂移輪軌垂直力信號和一組已知基線漂移信號。假設列車為兩軸轉向架,車輛定距為7.67 m,轉向架軸距為1.75 m,車輛長度為11.986 m,列車低速經過觀測點的車速為4 km/h,信號采樣頻率為1 000 Hz,數據長度為60 000點,各輪軌力信號峰值隨機分布在1.4~1.7之間零漂移輪軌垂直力信號圖1所示,數據本身具有很低的頻率成分,該頻率成分與列車轉向架間距,軸距與列車速度都有關系?;€漂移信號為:
圖1 零漂移鋼軌垂直力信號
BW(t)=0.15*(sin(0.15πt)+sin(0.09πt+0.2π))
(14)
采用與力信號相同的采樣間隔。基線及與力信號疊加后的結果如圖2所示。
圖2 基線及與力信號疊加的結果
常用于定量分析濾波算法性能評估參數主要有均方誤差(MSE)和信噪比(SNR)等[22]。對于性能評價,MSE值越小越好,SNR越大越好。它們的定義分別為:
(15)
(16)
根據分段大小的分析,仿真數據可以采用分段大小為500數據點對含有基線漂移的信號數據進行分段,分段窗口步進長度為250。分段后的數據分段中值如圖3所示,大部分分段數據的中值和已知的基線漂移重合,另一部分偏離較遠。
圖3 含基線信號分段取中值的結果
隨后對所有數據分段統計數據分段的方差和峭度,得到的方差和峭度數據如圖4所示。
方差數值在0~1范圍之內,而峭度數值在0~80范圍之內,分別對方差和峭度進行線性歸一化,然后對歸一化后的數據進行聚類分析得到如圖5的分類結果。
圖5 聚類分析結果
圖5中,數據點被分成了兩個分類和部分未分類樣點。根據輪軌力數據的特點,選用分類1作為無載荷期間的數據段。對分類1所對應的數據分段中值即為信號數據的基點。基點數據與目標基線漂移的位置關系如圖6所示。
圖6 選用基點與原始信號
為了對比分析,利用移動中值濾波,形態(tài)學濾波,(BEADS,baseline estimation and denoising with sparsity)[23],CEEMDAN,EWT,VMD,零相位濾波器以及本文提出的方法分別對圖2中含有基線漂移的力信號進行處理。在這些方法可分為兩類,一類是CEEMDAN,EWT,VMD和零相位濾波器,另一類是移動中值濾波,形態(tài)學濾波,BEADS和本文的方法。第一類主要是信號分解與重構的方法和數字濾波的方法,這些方法會將所有的測量數據值進行計算,這使得在有載荷期間的基線漂移的提取會受到載荷大小的影響。各種方法通過優(yōu)化設置參數得到最優(yōu)的結果如圖7所示。所得結果與目標基線存在較大的誤差,不適合后續(xù)的定量分析。
圖7 第一類方法提取基線漂移結果
第二類方法中,設置移動中值濾波的移動窗口大小為700數據點,移動步進為一個數據點,然后再經過1 Hz低通濾波器得到最優(yōu)的平滑基線;數學形態(tài)學濾波采用長度為350數據點的橫條型結構分別進行開閉運算然后取兩部分和的一半,再經過1 Hz低通濾波器得到最優(yōu)的平滑基線;依據文獻[23]BEADS方法采用截止頻率為0.8 Hz,階數為1,不對稱參數為12,正則化參數為0.01。由于BEADS方法對任何信號提取的基線首尾均為零,需要先對原信號的首尾置零提取趨勢線再進行提取,才能得到最佳的評估效果。不同方法提取的基線漂移與目標基線的誤差如圖8所示
圖8 提取的基線漂移與目標基線的誤差曲線
從基線漂移誤差曲線看到,移動中值濾波和形態(tài)學濾波具有形同的變化規(guī)律,即會在觀測點負載時會有較大誤差而其他時刻的誤差趨于零,BEADS方法在信號的兩頭出現較大的誤差,而中間部分誤差較小。而本文的方法提取基線的誤差相對其他3種方法都要小。原始帶基線漂移的信號在經過不同方法去除基線前后的相似測度參數如表1所示。
表1 不同方法去除基線漂移的效果
從表1的數據結果表明,本文的方法對于仿真數據的消除基線漂移的兩種評價指標均優(yōu)于形態(tài)濾波等其他3種方法。本文方法的均方誤差MSE僅約為次好的BEADS算法的0.47%,而信噪比SNR則高出23 dB。
實測數據中,除了基線漂移的干擾之外還會有其他噪聲的存在,如工頻干擾和隨機干擾等。如圖9所示為一組數據現場實測輪軌力信號。
圖9 實測輪軌力信號
依據算法,首先獲取數據峰值寬度以確定數據分段的大小,接著對實測信號進行數據分段,統計分段數據的方差和峭度,基于方差和峭度統計數據段之間距離,按距離分布函數獲取最優(yōu)聚類領域半徑,然后進行基于OPTICS算法進行聚類分析,得到聚類結果如圖10所示,選用分類1所對應的數據段,以該分類數據段的中值作為基點,擬合所有基點得到基線漂移成分,如圖11所示。
圖10 實測信號分段數據高階統計量聚類結果
圖11 實測輪軌信號基線漂移的基點的選取
實測信號沒有預知的基線漂移或純凈的信號數據,無法進行量化的評估。為了驗證本文方法的效果,采用移動中值濾波,形態(tài)學濾波,BEADS方法分別對實測信號進行處理,對比的方法通過調整相應的參數使得處理結果達到最佳效果。圖12為不同方法消除實測輪軌垂直力信號基線漂移的效果。其中最上方的曲線為實測的原始信號,往下分別為移動中值濾波加低通濾波的方法,形態(tài)學濾波加低通濾波的方法,BEADS方法以及本文方法去除基線漂移后的信號波形圖。
圖12 實測輪軌力信號基線漂移的消除效果比較
從圖上看,本文的方法和BEADS方法于實測數據中的基線漂移的消除效果明顯優(yōu)于前兩種方法。本文的方法和BEADS方法都能有效地去除基線漂移的干擾,僅從視覺上看,兩者無法區(qū)分兩者優(yōu)劣情況。從計算量上,由于本文的方法采用分段的方法,使得整個計算過程的計算量相比與移動中值濾波、形態(tài)學濾波和BEADS方法大大的減小,提高了計算效率。
本文針對輪軌垂向力信號的基線漂移消除問題,提出了基于分段數據高階統計量聚類分析的方法來確定信號基點所在的數據段,統計選用數據段中值作為基點,曲線擬合基點即可得到信號的基線漂移干擾。文中通過仿真數據和現場實測信號從定量和定性兩種方式對所提出的方法進行了驗證,并與現有常用的基線漂移去除方法進行了橫向比較。驗證結果都表明相比于其他方法,本文的方法在定量上具有更高的信噪比和更小的均方誤差,在對實測信號的定性分析上同樣具有很好的效果,而且計算量更小,速度更快。本文方法的參數設置可以根據信號的特性自適應設置,不需要過多的人為參與。該方法同樣適用于其他包含有基線偏移的測試信號的處理,比如心電信號,光譜信號,脈搏信號等。