潘虹,唐魏,鄭源,于洋
(1. 河海大學能源與電氣學院,江蘇 南京 210098; 2. 中國電建集團中南勘測設(shè)計研究院有限公司,湖南 長沙 410014; 3. 中水東北勘測設(shè)計研究有限責任公司,吉林 長春 130062)
局域均值分解(LMD)是SMITH于2005年提出的一種非平穩(wěn)信號處理方法[1],其基本思想是將任何一個復雜的非平穩(wěn)信號分解成多個乘積函數(shù)(production function, PF)分量之和,通過提取各個分量的瞬時幅值和瞬時頻率來得到信號完整的時頻分布.
LMD被廣泛應用到旋轉(zhuǎn)機械、電路故障診斷領(lǐng)域.近年來,與小波、熵、深度學習等信號處理與機器學習方法融合應用取得了較好的信號分析效果[2-5].但LMD方法也存在一系列的問題,如LMD中局域均值和包絡估計函數(shù)是通過平滑相鄰極值點獲得.但是信號的端點可能不是局部極值點,這樣便會造成局域均值和包絡估計函數(shù)在數(shù)據(jù)兩端失真.在分解高頻分量時,由于局部極值點間距較小,端點效應只局限在端點附近,但是低頻分量的局部極值點間距變大,端點效應逐漸向內(nèi)“污染”,嚴重時分解出錯誤的PF分量.目前,針對端點效應問題,已經(jīng)提出許多抑制方法,如鏡像映射、波形匹配等,這些方法對抑制端點效應取得了一定的效果,但是在精度或算法適應性等方面存在一定的局限性[6-10].鏡像映射法沒有考慮信號整體的自然趨勢和相似性;波形匹配法對周期重復性信號具有較好的延拓能力,但當信號中存在低頻疊加波或調(diào)幅信號幅度相差較大的信號時,則誤差較大且學習時間過長.
文中從考慮曲線幅值和幾何形狀相似性出發(fā),提出基于灰色B型關(guān)聯(lián)度和歐氏距離的端點效應抑制方法,通過計算待匹配波形和特征波形的綜合距離參數(shù),選擇參數(shù)最小值對應的匹配波形作為延拓數(shù)據(jù),提高LMD分解過程中重構(gòu)信號精度.
LMD方法的基本原理是將1個復雜的多分量信號分解為若干個瞬時頻率具有物理意義的PF分量和1個殘余分量之和.PF分量的瞬時幅值就是包絡信號,瞬時頻率可由純調(diào)頻信號求導獲得.
LMD方法中的端點效應是在計算局域均值和包絡估計函數(shù)時產(chǎn)生.局域均值和包絡估計函數(shù)是相鄰局部極值點均值和包絡值的擬合函數(shù).在每次滑動平均法擬合過程中,擬合生成的局部極值點也存在一定誤差.由于下一個PF分量是對原信號減去上一個PF分量后進行的又一次篩分,因此擬合誤差隨著迭代過程不斷累積,并從端點附近向數(shù)據(jù)內(nèi)部“污染”,最后導致出現(xiàn)錯誤的分解結(jié)果.
波形匹配法是一種LMD端點效應抑制方法[11].其基本思想是從原信號中找出最符合端點附近變換趨勢的相似波形,實現(xiàn)延拓信號與原信號的光滑過渡.設(shè)原信號x(t),采樣數(shù)為n.以左端延拓為例,具體步驟如下:
1) 計算出信號所有的極大值點M和極小值N點,對應時間為tmi和tni.
2)x(1),M1和N1構(gòu)成特征波形,根據(jù)x(1)與最靠近左端點的極值點的時間相對位置計算平移波形的起點.
3) 計算x(ti),Mi+1,Ni+1這3點構(gòu)成的波形與特征波形的誤差E(i).
4) 找出最小誤差對應的波形,作為匹配波形,將該波形前的數(shù)據(jù)作為左端延拓數(shù)據(jù).若存在多個相等的值,則取與左端距離最遠的波形為匹配波形.
右端延拓與左端思路一致.實際計算過程中,可以設(shè)置一閾值來控制特征波形與匹配波形的最小誤差.
波形匹配法基本思想是從信號內(nèi)部本身找到與端點處的變化波形最相近的數(shù)據(jù)段作為端點延拓的參照.這種方法使得延拓波形更加符合原信號的自然發(fā)展走勢.但是在計算待匹配波形與特征波形的誤差時,只是定量給出了待匹配波形和特征波形3個特征點在幅度上的差異,而對波形幾何形狀的相似性沒有度量.因此,文中引入灰色系統(tǒng)理論,提出了基于灰色B型關(guān)聯(lián)度和歐氏距離的改進方法.
灰色B型關(guān)聯(lián)度通過全面描述曲線間發(fā)展過程的異同性和關(guān)聯(lián)程度,根據(jù)幾何形狀的相似程度來判斷其聯(lián)系是否緊密[12].曲線幾何形狀越接近,灰色B型關(guān)聯(lián)度就越大,反之則越小.其具體計算步驟如下:
設(shè)特征序列為X1(k),待匹配序列為X2(k),其中k=1,2,…,n.則B型關(guān)聯(lián)度r為
(1)
B型關(guān)聯(lián)度利用位移差反映了2個時間序列發(fā)展過程或量級的相近性,利用一階斜率差和二階斜率差反映了兩序列幾何形狀的相似性.由于實際應用中待匹配波形的量綱不一定相同,計算前采取標準化變換對原始數(shù)據(jù)消除量綱.灰色B型關(guān)聯(lián)度對于曲線幾何形狀的反映比較敏感,但是在衡量曲線幅度上的差異方面不夠準確.
歐氏距離是衡量曲線幅值差異的定量標準[13].時間序列x={x1,…,xn},y={y1,…,yn}的歐氏距離定義為
(2)
為同時考慮曲線在幅值和幾何形狀上的差異,文中結(jié)合歐氏距離與B型關(guān)聯(lián)度,定義了特征波形和待匹配波形相似度的綜合距離參數(shù).為便于比較,對歐氏距離進行了歸一化處理.綜合距離參數(shù)η為
(3)
式中:ε為非常小的正數(shù);D′為歸一化后的歐氏距離.綜合衡量參數(shù)η越小時,代表兩段波形相似度越高.
基于B型關(guān)聯(lián)度和歐氏距離的匹配波形法(簡稱綜合距離法)的左端點延拓步驟如下所示,右端延拓與左端延拓思路一致.
1) 計算信號所有的極大值點M和極小值點.
2) 若第1個出現(xiàn)的極值點為局部極大點,令從左端點到第1個極小點位置的信號為特征波形,左端點到第1個極大點的采樣數(shù)L.以局部極大點Mi(不包括最后1個極大點)為基點生成待匹配波形,確保每個待匹配波形的Mi與特征波形的Mi重合.待匹配波形長度為n,起點為局部極大點Mi向左移動L個數(shù)據(jù).
3) 若第1個出現(xiàn)的極值點為局部極小點,令從左端點到第1個極大點位置的信號為特征波形,左端點到第1個極小點N1的采樣數(shù)為L.以局部極小點Ni(不包括最后1個極小點)為基點生成待匹配波形,確保每個待匹配波形的Ni與特征波形的N1重合.待匹配波形長度為n,起點為局部極小點Ni向左移動L個數(shù)據(jù).
4) 計算所有待匹配波形和特征波形的綜合距離參數(shù),找出最小時對應的匹配波形,將該波形前的數(shù)據(jù)作為左邊端點的延拓數(shù)據(jù).若存在多個相等的值,則取與左端點距離最遠的波形為匹配波形.同理找出最匹配右端點的特征波形,將匹配波形后數(shù)據(jù)作為右邊端點的延拓數(shù)據(jù).
5) 應用上述匹配波形選擇的方法延拓數(shù)據(jù),拋棄兩端外延拓數(shù)據(jù)提取PF分量,重復執(zhí)行上述步驟直至提取完成所有PF分量.
針對仿真信號和實例信號,根據(jù)端點效應伴隨的能量泄漏,以分解前后信號的能量變化作為端點效應程度的評價指標,具體方法如下:
1) 計算原信號的均方根有效值
(4)
式中:xi為原信號的第i個組成分量.
2) 計算所有PF分量和殘余分量的均方根有效值.
(5)
式中:PFi為信號分解獲得的第i個PF分量;k為分解PF分量個數(shù).
3) 計算端點效應的評價指標θ
(6)
θ越大,則說明端點效應影響越大.
針對仿真信號,由于已知信號組成,另建立評價指標δ以體現(xiàn)PF分量與原信號組成分量之間的誤差.
(7)
δ越小,端點效應抑制越成功.
為比較綜合距離法與鏡像映射法、波形匹配法對端點效應的抑制性能,下面分別以平穩(wěn)仿真信號和非平穩(wěn)仿真信號為例進行具體分析.仿真信號為
x(t)=cos6πt+0.4cos20πt+0.9sin50πt.
(8)
該信號為正弦疊加信號,主要頻率為3,10,25 Hz.取樣1 024點,采樣時間2 s.圖1為仿真信號1 LMD分解結(jié)果,是3種方法生成的PF分量,即PF1,PF2,PF3,圖中上部紅色實線為包絡線.端點效應評價指標θ和δ見表1.
圖1 仿真信號1 LMD分解結(jié)果
表1 端點處理方法的性能評價
由表1可知,3種方法指標數(shù)值均較小,說明端點效應對分解結(jié)果影響不大.鏡像映射算法的θ最大,說明鏡像映射法端點效應抑制效果最差,圖1a中PF1和PF2分量兩端信號都出現(xiàn)了較大程度的失真,也體現(xiàn)了端點效應的影響.后經(jīng)仿真信號多次驗證,發(fā)現(xiàn)鏡像映射法對規(guī)則信號的端點抑制效果要稍差,波形匹配法和綜合距離法適用于信號內(nèi)部變化具有較強規(guī)律的信號.
非線性仿真信號二為
x(t)=(1+0.5cos0.01πt)cos(0.5πt+
2cos0.02πt)+4sin0.000 4πtsin0.12πt.
(9)
信號采樣頻率為1 Hz,采樣時間600 s.信號由2個調(diào)幅調(diào)頻分量組成,一個分量的載頻為0.06 Hz并伴有幅值調(diào)制,另一個分量的載頻為0.25 Hz附近并帶有頻率為0.01 Hz的頻率調(diào)制.
利用鏡像映射法、波形匹配法及綜合距離法對仿真信號二進行LMD分解,結(jié)果如圖2所示,圖中上部紅色實線為包絡線.波形匹配法包絡線由于幅值過大未繪制.由圖可見,所有方法獲得的PF1分量都對應載頻為0.25 Hz左右的調(diào)幅調(diào)頻信號,且瞬時頻率圖中清楚顯示0.01 Hz的頻率調(diào)制現(xiàn)象.PF2分量對應了載頻為0.06 Hz的調(diào)幅分量.根據(jù)數(shù)學描述,PF1和PF2分量在左端點處的幅值應該分別為1.5和0,而實際分解結(jié)果與瞬時頻率的數(shù)學表達式存在較大差異.
對該非平穩(wěn)信號而言,波形匹配法效果最差.在圖2b中,右邊的端點效應比較嚴重,PF分量幅值數(shù)量級高達106.為了顯示PF分量的波形,調(diào)整PF1和PF2分量的y軸坐標范圍為[-5,5].PF3是由于端點效應產(chǎn)生的虛假模態(tài).此外,波形匹配方法所得的PF1和PF2分量的瞬時頻率在左右端點的波動幅度也遠大于其他方法.鏡像映射法效果僅優(yōu)于波形匹配法,在時間為500 s處信號幅值和瞬時頻率都出現(xiàn)了較大突變.
表2為端點處理方法的性能評價,即列出了3種方法的評價指標θ和δ.由表可知,波形匹配法的性能最差,信號右端點出現(xiàn)了較大誤差,評價指標均遠大于其他方法,取最大值1.鏡像映射法能量指標θ最小,但是其波形誤差指標δ較大,這一點與圖2a中500 s處PF分量的幅值大幅度波動吻合.綜合距離法對仿真信號二端點效應的抑制性能最好,其中綜合距離法的波形誤差僅為0.008,證明分解所得的PF分量與原信號0.25 Hz和0.06 Hz的組成分量基本一致.
圖2 仿真信號2 LMD分解結(jié)果
表2 端點處理方法的性能評價
經(jīng)多次仿真信號試驗,結(jié)果表明:鏡像映射法對平穩(wěn)信號和非平穩(wěn)仿真信號端點效應的抑制效果都較差,但是該方法操作簡單,分解速度上具有明顯的優(yōu)勢;波形匹配法主要適用于信號內(nèi)部變化具有較強規(guī)律的平穩(wěn)信號,對非平穩(wěn)信號會出現(xiàn)較大誤差;綜合距離法由于從幅值和幾何形狀上這2個方面綜合考慮了特征波形的匹配識別,對非平穩(wěn)信號可以取得較好的分解結(jié)果.
以某泵站主軸擺度信號為例,分析綜合距離法對實際信號的適用性.機組葉輪直徑3.19 m,設(shè)計抽水揚程4.2 m,設(shè)計總抽水量66 m3/s,機組額定轉(zhuǎn)速136.4 r/min.擺度信號由IN-085電渦流傳感器采集,經(jīng)CRAS振動信號采集與分析處理系統(tǒng)處理獲得,采樣頻率為512 Hz,采樣時間8 s.圖3為主軸徑向擺度信號時域圖,圖中A為幅值.
圖3 主軸擺度信號時域圖
圖4為水泵主軸擺度信號LMD分解結(jié)果.為提高分類精度和速度,分解前對原信號進行了去除趨勢項和降采樣處理,采樣頻率降為64倍轉(zhuǎn)頻.應用鏡像映射法、波形匹配法和綜合距離法對信號進行分解,結(jié)果如圖4所示.其中PF2根據(jù)相關(guān)分析判斷為虛假分量.
由圖4可知,PF1分量中同時出現(xiàn)了2.273Hz的轉(zhuǎn)頻和轉(zhuǎn)頻倍頻,這是LMD分解常見的模態(tài)混疊現(xiàn)象.此處主要根據(jù)PF1分量時域圖比較各方法對端點效應抑制情況.鏡像映射法在7.5~8.0s的時間段上PF1分量波形失真,波形匹配法在0~1s的時間內(nèi)PF1分量波形明顯失真,綜合距離法的分解結(jié)果沒有出現(xiàn)此類現(xiàn)象,波形基本保持一致.3種方法算法評價指標見表3,由于該主軸擺度信號為實際工程信號,指標無法計算.由表3可知,與鏡像映射法和波形匹配法相比,綜合距離法的評價指標明顯減小.利用文中提出的LMD改進方法對多個水電站振擺信號進行了試驗驗證,結(jié)果與上述水泵主軸擺度信號分析結(jié)果一致.總的來說,PF分量示意圖和評價指標都表明綜合距離的端點抑制方法性能較好,可以有效抑制端點效應對分解結(jié)果產(chǎn)生的波形失真現(xiàn)象.
圖4 水泵主軸擺度信號LMD分解結(jié)果
表3 擺度信號端點處理方法的性能評價
1) 文中針對局域均值分解方法存在的端點效應問題,提出了基于灰色B型關(guān)聯(lián)度和歐式距離的改進抑制方法,克服了傳統(tǒng)鏡像映射法和波形匹配法無法兼顧幅值和幾何形狀差異的不足,適合用于非平穩(wěn)信號時頻分析.
2) 利用基于灰色B型關(guān)聯(lián)度和歐式距離的綜合距離法分析泵站主軸擺度,端點效應評價指標遠低于傳統(tǒng)方法,證明利用該方法分解信號準確率更高.但在分析過程中,也發(fā)現(xiàn)局域均值分解方法存在的模態(tài)混疊問題,在很大程度上影響了信號特征提取的效果,這方面問題有待進一步研究.