范津瑋 劉曉波
(貴州大學(xué)電氣工程學(xué)院,貴州 貴陽 550000)
EMD 方法是由美國的NASA 的Huang 等人所提出, 由于該方法具有良好的時(shí)頻特性和自適應(yīng)性,被許多專家學(xué)者廣泛應(yīng)用于各個(gè)方面。 例如,在結(jié)構(gòu)分析領(lǐng)域應(yīng)用到橋梁監(jiān)測和模態(tài)響應(yīng)分析,在自然科學(xué)領(lǐng)域應(yīng)用于海洋、大氣、天體等的觀測和地球物理分析,在生物學(xué)領(lǐng)域應(yīng)用于心率變換和肺部血壓信號(hào)分析,在故障診斷領(lǐng)域應(yīng)用于旋轉(zhuǎn)機(jī)械信號(hào)分析[1]和電力系統(tǒng)暫態(tài)故障信號(hào)分析[2]。
由于EMD 分解的終止條件、 插值誤差和端點(diǎn)效應(yīng)等影響,常常會(huì)出現(xiàn)分解過度的現(xiàn)象。 這會(huì)導(dǎo)致分解得到的IMF 分量個(gè)數(shù)大于原有信號(hào)的組成個(gè)數(shù),而多余的IMF 分量便是虛假分量。這些分量與原信號(hào)相關(guān)性較小,不能準(zhǔn)確反映原信號(hào)的特征,所以需要準(zhǔn)確識(shí)別出虛假分量。
EMD 分解是一種新的自適應(yīng)處理非平穩(wěn)信號(hào)分析方法,適用于處理非線性、非平穩(wěn)性的時(shí)間序列數(shù)據(jù)。 某信號(hào)使用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)對(duì)其進(jìn)行分解后可以得到不同時(shí)間尺度的IMF 分量。 EMD 的基本公式為:
其中,x(t)為原始數(shù)據(jù)信號(hào),IMFi為第 i 個(gè) IMF 分量,res 為不能再分解的剩余分量。
下面以某一信號(hào)x(t)為例說明EMD 分解過程中產(chǎn)生的虛假分量問題。
其中,采樣頻率 1 000 Hz,采樣點(diǎn)數(shù) 1 000 點(diǎn)。 其波形圖如圖1 所示。對(duì)該信號(hào)進(jìn)行EMD 分解,結(jié)果如圖2 所示。 進(jìn)一步求各階IMF 的傅里葉頻譜圖,結(jié)果如圖3 所示。
圖1 仿真信號(hào)波形圖
圖2 EMD 的分解結(jié)果圖
圖3 各IMF 分量的傅里葉頻譜圖
從圖3 可以看出, 第一個(gè)IMF 與第二個(gè)IMF 的頻率成分與原始信號(hào)的兩個(gè)頻率成分50 Hz 和10 Hz是相符合的。第三個(gè)、第四個(gè)IMF 與剩余分量res 的頻率分量在原信號(hào)中都沒有出現(xiàn), 故由此可推斷出,除前兩個(gè)IMF 外其他均為虛假分量。
目前, 虛假分量的消除方法有相關(guān)系數(shù)法、K-S檢驗(yàn)法。 下面介紹這兩種方法的優(yōu)缺點(diǎn)。
相關(guān)系數(shù)法是通過計(jì)算各IMF 分量與原信號(hào)之間的相關(guān)系數(shù)。 若兩者之間相關(guān)系數(shù)較大則判定為是有效的IMF 分量,若兩者之間相關(guān)系數(shù)較小,則判定為虛假分量。 但文獻(xiàn)[3]通過使用相關(guān)系數(shù)法對(duì)虛假分量的識(shí)別過程中發(fā)現(xiàn)兩個(gè)問題:(1)只有第一個(gè)IMF 分量的相關(guān)系數(shù)很大,其他分量的相關(guān)系數(shù)很?。唬?)通過人為設(shè)定閾值大小來界定IMF 分量是否為虛假分量,存在將真實(shí)分量誤判為虛假分量的可能。
K-S 檢驗(yàn)法的全稱為Kolmogorov-Smirnov 擬合優(yōu)度檢驗(yàn)法。 該方法通過計(jì)算各IMF 分量與原信號(hào)的累積分布函數(shù)之間的差異。若某一IMF 分量與原信號(hào)直接的相似概率接近1,則認(rèn)為該IMF 分量有效,若相似概率接近0,則認(rèn)為該IMF 分量為虛假分量。 但文獻(xiàn)[4]指出該方法所需方差比率較大,因此適用性較低。
本文所提的能量比值法是通過比較某一IMF 分量的能量與所有IMF 的能量之和的比值來對(duì)虛假分量進(jìn)行判別。
由于終止條件和插值誤差等因素的影響,會(huì)造成EMD 在分解過程中,無法完全一模一樣地分解出組成原信號(hào)的各分量,這會(huì)導(dǎo)致在整個(gè)數(shù)據(jù)序列的某些個(gè)點(diǎn)上會(huì)產(chǎn)生一定微小誤差。 從公式(2)可知第一個(gè)IMF 分量應(yīng)始終為幅值1 的正弦函數(shù),但在實(shí)際分解得到的圖2 中第一個(gè)IMF 分量的某些波峰處幅值不為1,由于誤差很小所以肉眼難以從圖中直接看出。
由于端點(diǎn)效應(yīng)問題的存在,故會(huì)采用一些方法去抑制端點(diǎn)效應(yīng),但是再好的方法也不能完全消除端點(diǎn)處因缺少極值點(diǎn)而導(dǎo)致的包絡(luò)線擬合不符合信號(hào)內(nèi)生規(guī)律帶來的影響,這會(huì)使得分解出來的IMF 分量在端點(diǎn)處的數(shù)值產(chǎn)生一定的誤差。 從圖2 中第一和第二個(gè)IMF 分量的左右兩端均可以看出,兩端局部的數(shù)據(jù)點(diǎn)的數(shù)值與公式(2)中幅值為1 和0.5 的正弦函數(shù)數(shù)值有一定誤差。
EMD 分解的終止條件、插值誤差和端點(diǎn)效應(yīng)處理方法等問題共同導(dǎo)致了虛假分量的產(chǎn)生,但這些誤差要么很微小要么也只是在端點(diǎn)處產(chǎn)生。 從圖2 中第三個(gè)IMF 分量可以看出虛假分量在兩端的數(shù)據(jù)點(diǎn)上存在一定的數(shù)值且數(shù)值會(huì)小于有效分量的幅值,中間的數(shù)據(jù)點(diǎn)的數(shù)值均圍繞在0 左右。 所以虛假分量的能量比起有效分量的能量小得多, 數(shù)量級(jí)至少相差二,對(duì)比明顯,不會(huì)造成誤判。
能量是信號(hào)的特征常量,假設(shè)有限長信號(hào)序列x(t),信號(hào)的能量特征可以用能量密度來表示它表示在t 時(shí)刻每單位時(shí)間內(nèi)信號(hào)的能量強(qiáng)度。 信號(hào)總能量定義為:
其中,x(n)為信號(hào)的離散形式,能量定義為各數(shù)值點(diǎn)幅值的平方和。第i 個(gè)IMF 分量的能量與所有IMF 分量能量之和的比值定義為公式(4),n 為IMF 的個(gè)數(shù)。
為了檢驗(yàn)?zāi)芰勘戎捣ǖ目尚行裕孕盘?hào)y(t)為例,采樣頻率10 000 Hz,采樣點(diǎn)數(shù)5 000 個(gè)點(diǎn)。
y(t)=0.6cos(640×π×t)+cos(320×π×t)+0.5sin(80×π×t) (5)
對(duì)公式(5)的信號(hào)進(jìn)行EMD 分解,結(jié)果如圖4所示。
采用能量比值法對(duì)圖4 中的各IMF 分量分別進(jìn)行計(jì)算,結(jié)果列于表1 中。
圖4 信號(hào)的EMD 分解圖
表1 各IMF 分量的能量比值表
從表1 中可以得到,前三個(gè)有效分量的能量比值均較大,其余虛假分量的能量比值較小,他們之間相差兩個(gè)數(shù)量級(jí),有的甚至高達(dá)三個(gè)數(shù)量級(jí),能量對(duì)比明顯,可對(duì)虛假分量進(jìn)行準(zhǔn)確識(shí)別。
首先本文對(duì)EMD 方法及其虛假分量問題進(jìn)行了詳細(xì)的分析,并指出了現(xiàn)有處理方法的優(yōu)缺點(diǎn)。接著由于虛假分量主要是因?yàn)橥V箿?zhǔn)則、 插值誤差和端點(diǎn)效應(yīng)的問題而產(chǎn)生,故虛假分量的幅值和頻率較低,能量較小。 最后根據(jù)分析結(jié)果提出能量比值法,并進(jìn)行數(shù)值仿真驗(yàn)證, 仿真結(jié)果表明該方法具有可行性。