陳強強,戴邵武,呂余海,張 剛
(1.海軍研究院,上海 200436;2. 海軍航空大學岸防兵學院, 煙臺 264000)
光纖陀螺作為重要的慣性傳感器之一,能夠有效進行角速度測量,在導航、制導領域有著廣泛的應用。在光纖陀螺工作過程中,受到工作環(huán)境、溫度變化等影響,導致光纖陀螺輸出信號具有強烈的非線性、非平穩(wěn)性,從而使其時間序列信號具有較強的復雜性。通過對光纖陀螺輸出信號進行復雜性計算,能夠分析其時間序列內(nèi)部作用機制,從而研究信號的系統(tǒng)規(guī)律。文獻[2]通過對光纖陀螺漂移數(shù)據(jù)分量信號進行復雜性分析,得到高頻噪聲項及混合模態(tài)分量,完成對光纖陀螺原始含噪信號的去噪。文獻[3]以排列熵作為衡量信號復雜度的工具,得到信號復雜度與回歸精度之間的關系,實現(xiàn)對光纖陀螺溫度漂移的建模及補償。文獻[4]通過比較分解后數(shù)據(jù)與原始輸出數(shù)據(jù)之間的復雜程度關系,驗證了分解算法能夠有效降低光纖陀螺輸出序列的復雜程度,從而提高光纖陀螺隨機誤差的預測精度。通過對光纖陀螺輸出序列進行復雜度分析,能夠把握數(shù)據(jù)規(guī)律;同時,光纖陀螺輸出序列的復雜度信息也可作為時間序列的特征信息,為后續(xù)進行光纖陀螺輸出信號識別、故障診斷、預測研究等方面奠定基礎。
在對時間序列復雜度進行分析的過程中,由B. Christoph等提出的排列熵算法是一種有效監(jiān)測時間序列隨機性和動力學突變行為的方法,其計算方法簡單、抗噪能力強,適用于非線性、非平穩(wěn)的光纖陀螺輸出序列,在對陀螺儀輸出信號分析、機械系統(tǒng)(滾動軸承、齒輪箱等)振動信號分析及醫(yī)學信號(肌電信號、腦電信號等)復雜度分析中有著廣泛的應用,相比傳統(tǒng)的時頻特征具有明顯的優(yōu)勢。但在排列熵的解算過程中,時間序列的長度對排列熵值影響較為明顯;同時,對長時間序列進行排列熵求解時,運算量較大,計算時間較長,降低了時間序列分析的效率。
光纖陀螺輸出時間序列通常為長時間序列,為了有效度量長時間序列條件下的光纖陀螺輸出序列復雜度,并提高排列熵算法的計算效率。本文通過引入經(jīng)驗模態(tài)分解中的迭代思想及包絡算法,利用三次樣條插值算法求取原始長時間序列的上下包絡曲線,得到上下包絡均值作為慢振蕩分量;在求取上下包絡曲線時,將原始時間序列長度限定為求解排列熵信息的通用長度,既避免了因時間序列長度過長而無法準確度量復雜度,同時優(yōu)化了解算流程,提高了計算效率。
排列熵算法原理為:針對長度為的時間序列{(),=1,2,…,},對()進行相空間重構(gòu)
(1)
式中,為嵌入維數(shù);為延遲時間;=-(-1)為重構(gòu)向量的個數(shù)。
將中的元素按升序排列得
[+(-1)]≤…≤[+(-1)]
(2)
式中,,,…,為各元素在排序之前位于相空間所在列的索引。
若中有兩元素相等,則按原始順序排列。通過對相空間重構(gòu)后的時間序列進行分析,對于任意一個,均能得到相應的符號序列={,,…,},其中,=1,2,…,,且≤!??啥x排列熵為
(3)
(4)
此時,的取值為[0,1],可反映出時間序列的復雜程度,越大,則序列復雜程度越高。
排列熵作為衡量時間序列內(nèi)部復雜度的算法,計算過程簡單方便,能夠有效地分析非線性、非平穩(wěn)信號,適用于光纖陀螺輸出信號。在排列熵的計算過程中主要包括3個參數(shù):時間序列長度、嵌入維數(shù)、延遲時間。排列熵算法的提出者Bandt建議選擇嵌入維數(shù)為3~7,且一般隨著時間序列長度的增加進行相應調(diào)整;延遲時間對時間序列的計算影響較小,一般選擇=1。后續(xù)學者在對時間序列進行排列熵分析時,對參數(shù)的選擇進行了總結(jié)歸納,對于時間序列長度=2048的時間序列,取=6,=1。
在光纖陀螺輸出信號采集過程中,當時間序列長度過長時,使用常規(guī)排列熵算法進行復雜程度衡量需要考慮以下問題:1)如果時間序列長度為2(=2048)時,相應的參數(shù)應該如何選擇?此時嵌入維數(shù)的取值如果過大,則在式(1)中的相空間重構(gòu)過程會均勻化時間序列,從而忽略時間序列中的微弱變化。2)時間序列長度的增加,增加了排列熵解算時長,在對光纖陀螺輸出信號的實時分析、慣導故障實時診斷過程中降低了計算效率。3)在長時間序列條件下,不同長度的時間序列所對應的嵌入維數(shù)選擇也有所不同,此時需要選擇并調(diào)整相應的嵌入維數(shù),以降低排列熵解算過程的自適應性。
在排列熵算法的分析中,針對長時間序列的復雜程度計算過程中存在的問題,提出了一種基于包絡均值思想的均值排列熵算法。用包絡均值信號代替復雜的原始信號,使其適用于非平穩(wěn)信號分析。
包絡均值思想源自經(jīng)典的時頻分析算法—經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)。EMD算法能夠根據(jù)信號特點自適應地將信號分解成一組具有物理意義的固有模態(tài)函數(shù),在非線性、非平穩(wěn)時間序列分析中得到廣泛應用。
EMD方法在分解的過程中,首先找出信號的全部極值點,然后利用三次樣條插值方法求取上下包絡曲線,并定義信號的局部包絡均值為慢振蕩分量。在對上下包絡曲線進行三次樣條插值的過程中,可通過固定端點完成對包絡均值時間序列長度的確定,從而將長時間序列的排列熵求解問題轉(zhuǎn)換為固定時間長度的復雜度求解。
基于此,定義均值排列熵算法如下:
1)針對長度為*(=1,2,…,)的原始信號(),確定()的所有極大值點與極小值點,通過三次樣條插值方法,確定擬合后的時間序列長度,對()的極值點進行擬合,其極大值點的擬合曲線組成上包絡線,其極小值點的擬合曲線組成下包絡線。
2)計算與的均值,記為包絡均值曲線。在EMD的計算過程中,定義為慢振蕩分量。通過不斷減去慢振蕩分量可以完成對快振蕩分量的篩選,因此在均值排列熵的計算過程中,選擇采用慢振蕩分量代替原始時間序列信號。
3)計算包絡均值曲線的排列熵,得到均值排列熵值。
基于包絡均值思想的均值排列熵算法如圖1所示。
圖1 均值排列熵算法流程Fig.1 Flow of mean permutation entropy algorithm
文獻[11,16]對時間序列信號進行排列熵分析,選擇時間序列長度為2048,因此本文在計算過程中,選擇時間序列長度為2048的倍數(shù)進行對比。算法流程圖如圖1所示,采用均值排列熵算法代替常規(guī)排列熵算法,對光纖陀螺原始長時間序列進行復雜度求解時,通過選擇均值包絡曲線代替原始數(shù)據(jù)進行排列熵求解,在對上、下包絡曲線進行三次樣條插值時限定了時間序列長度,避免了因時間序列過長導致排列熵計算過程中嵌入維數(shù)、時間延遲參數(shù)無法準確選擇的問題,同時減少了時間序列長度,提高了解算效率。
為了驗證本文提出的均值排列熵算法對長時間序列的復雜度計算問題,選擇光纖陀螺輸出信號作為原始數(shù)據(jù)進行驗證。在常溫條件下對陀螺組件進行性能測試,采樣頻率4Hz,輸出單位為(°)/h,選取某一溫度下的,長度為4096(=2×2048)的一組光纖陀螺靜態(tài)漂移數(shù)據(jù),如圖2所示。
圖2 光纖陀螺的原始信號(N=2×2048)Fig.2 The original signal of FOG(N=2×2048)
設置三次樣條插值后的時間序列長度為2048,對得到的原始時間序列進行上、下包絡曲線求解,得到均值包絡曲線如圖3所示。
圖3 原始信號的包絡曲線Fig.3 Envelope curve of the original signal
分別對上、下包絡曲線,均值包絡曲線及原始信號數(shù)據(jù)進行排列熵求解,并統(tǒng)計單次計算排列熵的時間,得到結(jié)果如表1所示。
表1 排列熵結(jié)果(N=2×2048)
如表1所示,上、下包絡曲線與均值包絡曲線的排列熵值相近,且計算效率相似。對于長度為=2048的光纖陀螺輸出信號,取=6,=1更能準確表達其排列熵值,避免了參數(shù)選擇過程,提高了計算效率。
為了繼續(xù)驗證均值排列熵算法對長時間序列的復雜度計算問題,選取某一溫度下的,長度為6144(=3×2048)的一組光纖陀螺靜態(tài)漂移數(shù)據(jù),如圖4所示。
圖4 光纖陀螺的原始信號(N=3×2048)Fig.4 The original signal of FOG(N=3×2048)
設置三次樣條插值后的時間序列長度為2048,分別對上、下包絡曲線,均值包絡曲線及原始時間序列進行排列熵求解,并統(tǒng)計單次計算排列熵的時間,得到結(jié)果如表2所示。
表2 排列熵結(jié)果(N=3×2048)
排列熵的取值范圍為[0,1],其取值越大表示時間序列的復雜程度越高,對比表1和表2可知:1)對于長度為4096及6144的光纖陀螺輸出序列而言,采用常規(guī)排列熵算法進行復雜程度分析,其差值僅為0.0054,無法有效區(qū)分不同時間序列之間的復雜程度;2)以均值包絡曲線的排列熵值作為光纖陀螺輸出信號的復雜度衡量,針對長度為6144(=3×2048)的時間序列,能夠準確反映其排列熵值并提高計算效率;長度為6144(=3×2048)的光纖陀螺輸出信號復雜程度大于長度為4096(=2×2048)的光纖陀螺,符合排列熵的客觀規(guī)律,驗證了均值排列熵的可行性。同時,由于均值排列熵算法確定了均值包絡曲線的長度,避免了在排列熵解算過程中的嵌入維數(shù)選擇問題,提高了算法的自適應性。
本文針對長時間序列復雜度計算問題,以光纖陀螺輸出信號為研究背景,以排列熵算法作為研究基礎,引入均值包絡思想,提出了一種可有效應用于長時間序列復雜度計算的排列熵方法。采用均值排列熵算法可以有效概括輸出序列的復雜程度,并以此作為特征信息,為后續(xù)工程實踐提供基礎。算法分析與實驗結(jié)果表明:
1)均值排列熵算法在解算過程中避免了參數(shù)選擇問題對排列熵解算過程的影響,通過將均值包絡曲線限定在特定時間序列長度下,完成排列熵的解算,提高了算法的自適應性。
2)通過確定均值包絡曲線的長度,減少了長時間序列排列熵的求解時間,提高了解算效率。
3)通過對不同時間序列長度下的光纖陀螺輸出信號的復雜度進行求解,所得結(jié)果符合理論依據(jù),驗證了均值排列熵算法在衡量復雜度方面的可行性。