劉 慧, 萬 麗, 曾祥健, 鄧小成
(廣州大學 數(shù)學與信息科學學院, 廣東 廣州 510006)
多重分形是由定義在具有自相似性的形態(tài)結構上的無窮多個標度指數(shù)的測度所組成的度量集合,其譜函數(shù)可以描述分形結構上不同的局域條件或分形結構在演化過程中不同層次所導致的特殊行為與特征[1-2]。常用于計算多重分形譜及相關參數(shù)的方法是配分函數(shù)法,但該方法無法準確反映有趨勢影響的非平穩(wěn)數(shù)據(jù)的多重特征。近年來,新提出了多重分形降趨波動分析法(Multifractal Detrended Fluctuation Analysis, MFDFA)[3]、多重分形降趨移動平均分析法(Multifractal Detrending Moving Average Analysis, MFDMAA)[4]、小波領導分析法(Wavelet Leaders Analysis, WLA)[5]和小波模極大值法(Wavelet Transform Modulus Maxima, WTMM)[6]等,其中,MFDFA方法由于運算簡便且易于實現(xiàn)的優(yōu)點,已證實是描述非線性序列復雜性的有效定量化工具之一,被廣泛應用在化學、生物、醫(yī)學、地質和物理等各個學科領域,但該方法也存在著產(chǎn)生偽波動誤差及多項式擬合階數(shù)的影響較大的缺點[7-10]。Barnsley于1986年首次提出了分形插值技術[11],為擬合分形數(shù)據(jù)提供了新思想,分形插值方法具有擬合精度高的優(yōu)點。
為了找出更合適的去趨勢和去噪聲的方式,本文將分形插值擬合技術引入到MFDFA方法中,給出了基于分形插值的多重分形降趨波動分析法(Fractal Interpolation based Multifractal Detrended Fluctuation Analysis, FI-MFDFA),并驗證其有效性;進一步從算法模型異同、數(shù)據(jù)樣本量的變化和多重參數(shù)計算的統(tǒng)計精度等方面,對比分析FI-MFDFA和MFDFA方法的優(yōu)劣,為應用這2種方法來分析實際序列的多重分形特征和長程相關性提供理論支持。
分形插值方法是建立在迭代函數(shù)系(IFS)理論基礎上,通過給定一組插值點{(xj,yj)∈R2,j=0,1,2,…,N}構造出滿足插值條件f(xj)=yj(j=0,1,2,…,N)的連續(xù)函數(shù)f:[x0,xN]→R,其中,x0 (1)設插值區(qū)間為I=[x0,xN],兩點區(qū)間為Ii=[xi-1,xi],i=1,2,…,N,壓縮變換Li:I→Ii和Fi:K=I×R→R滿足 Li(x0)=xi-1,Li(xN)=xi (1) Fi(x0,y0)=yi-1,F(xiàn)i(xN,yN)=yi (2) (2)定義仿射變換Wi(xj,yj)=(Li(xj),Fi(xj,yj)),i=1,2,…,N;j=0,1,2,…,N,從而構造出迭代函數(shù)系IFS{K;Wi,i=1,2,…,N},當Li(xj,yj)和Fi(xj,yj)是線性函數(shù)時,可得到如下公式: i=1,2,…,N;j=0,1,2,…,N (3) 其中,(x′m,y′m)為進行第一次迭代插值之后得到的數(shù)據(jù)長度為m的序列,在進行第二次迭代時,將(x′m,y′m)作為新的插值點進行插值,以此類推。當?shù)螖?shù)為k時,生成的插值數(shù)據(jù)個數(shù)m和插值點個數(shù)N之間的關系為m=(N-1)2k+1。 (3)將式(1)和式(2)代入式(3)中,解得 (4) (5) (6) (7) 式中,di(i=1,2,…,N)為垂直比例因子,是仿射變換Wi的一個自由變量,滿足|di|<1,代入相應的di,系數(shù)ai,ei,ci,fi(i=1,2,…,N)可由插值點數(shù)據(jù)計算得出,因此,分形插值擬合可以通過改變垂直比例因子di的值,來改變插值函數(shù)方程f(di)的表達式。 研究非平穩(wěn)序列的途徑是先通過降趨勢過程將序列平穩(wěn)化,再對序列的相關性特征進行分析。降非線性趨勢的常用方式是多項式擬合,而在實際應用中,無法準確判斷數(shù)據(jù)具有幾階多項式趨勢,從而在結果分析時容易產(chǎn)生偏差。FI-MFDFA通過分形插值擬合消除序列的分形趨勢,避免多項式階數(shù)選取的主觀性影響。 對給定長度為n的序列{xi}(i=1,2,…,n),F(xiàn)I-MFDFA的計算步驟如下: 步驟1:求序列{xi}的累積離差序列y(i) (8) 步驟3:把序列y(i)從第一個數(shù)據(jù)開始等長度地分割成尺度為s的Ns=int(N/s)個互不相交的數(shù)據(jù)段,由于長度N經(jīng)常不是s的整數(shù)倍,為了不丟棄尾部剩余部分,從序列最后一個數(shù)據(jù)重復這一分割過程,因此,得到2Ns個區(qū)間。 步驟4:用最小二乘擬合法求均方誤差F2(s,v)。設fv(i)為第v個小區(qū)間的分形插值函數(shù)方程,控制每一個小區(qū)間的函數(shù)方程中的垂直比例因子d不變,均等于第二步計算出的d。 當v=1,2,...,Ns時,有 (9) 當v=Ns+1,Ns+2,…,2Ns時,有 (10) 步驟5:求序列的q階波動函數(shù)(q為整數(shù)) (11) 當q=0時, (12) 步驟6:確定波動函數(shù)的標度指數(shù),根據(jù)Fq(s)與s的關系 Fq(s)∝sh(q) (13) 先固定階數(shù)q,作lnFq(s)對lns的函數(shù)關系圖,其擬合直線的斜率即為所得的標度指數(shù)h(q)。這里h(q)稱為廣義赫斯特(Hurst)指數(shù),當序列是平穩(wěn)時間序列時,h(2)稱為Hurst指數(shù)。通常,波動函數(shù)值Fq(s)是s的增函數(shù),廣義Hurst指數(shù)h(q)是隨q變化的單調(diào)減函數(shù)。當序列的小波動和大波動具有不同的標度行為時,h(q)顯著依賴于q,序列表現(xiàn)為多重分形;當h(q)獨立于q為一常數(shù)時,即廣義指數(shù)函數(shù)h(q)不隨q變化,則序列表現(xiàn)為單一分形。 步驟7:q階廣義Hurst指數(shù)h(q)與質量指數(shù)τ(q)的關系為 τ(q)=qh(q)-1 (14) 根據(jù)legendre變換得到多重分形奇異指數(shù)α和奇異譜函數(shù)f(α): α=dτ(q)/dq (15) f(α)=qα(q)-τ(q) (16) 奇異指數(shù)用來描述觀測序列中不同區(qū)間的奇異程度,奇異譜函數(shù)用于描述不同區(qū)間奇異指數(shù)的分形維數(shù)。當f(α)獨立于α為一常數(shù)時,序列表現(xiàn)為單一分形特征;當f(α)的形狀呈單峰凸分布時,序列表現(xiàn)為多重分形特征。 選擇經(jīng)典二項多重分形序列(BMS)模型檢驗FI-MFDFA方法的有效性。該模型構造如下: x(i)=pn(i-1)(1-p)n-n(i-1),i=1,2,…,2n (17) 式中參數(shù)p的取值范圍是0 選取參數(shù)p=0.20、0.25、0.30、0.35和0.40,長度L=1 024的BMS序列作為分析對象,運用FI-MFDFA方法分析序列在不同參數(shù)下的多重分形特征。無標度區(qū)間s的取值范圍從20到L/4,步長為10;階數(shù)q從-3到3,以0.2為步長均勻取31個值。圖1(a)是不同參數(shù)p下的廣義Hurst指數(shù)h(q)隨著q變化的曲線,當q從-3增加到3時,不同參數(shù)p下的h(q)均隨著q的增大而減小,說明FI-MFDFA能識別出BMS序列的多重分形特征,且Δh=h(-3)-h(3)隨著p增大而減小,說明奇異性越大的序列,多重分形特征越明顯;圖1(b)是不同參數(shù)p下的多重分形譜α-f(α)曲線,從圖形可以看出,隨著p的減小,奇異指數(shù)α增大,即分布奇異性越大的序列多重分形強度越大,說明FI-MFDFA能較好地識別序列的多重分形性。 圖1 BMS序列不同參數(shù)p的FI-MFDFA計算結果Fig.1 FI-MFDFA calculation results of different parameters p in the BMS sequence 2.2.1 方法步驟比較 FI-MFDFA與MFDFA主要不同點在第3步。MFDFA方法用多項式擬合法求殘差,當擬合的多項式階數(shù)為m,相應的方法記作MFDFAm,雖然擬合多項式的階數(shù)可以根據(jù)具體情況靈活設置,但階數(shù)的確定具有主觀性,選取的階數(shù)過小會導致不完全去除趨勢,選取的階數(shù)過大會引起過擬合;而FI-MFDFA用分形插值擬合法求殘差,可以解決多項式階數(shù)的選取不恰當對分析結果造成的影響。 2.2.2 參數(shù)的統(tǒng)計精度比較 采用參數(shù)p=0.3,長度L=256的BMS序列對比FI-MFDFA和MFDFA 2種方法的計算統(tǒng)計精度。無標度區(qū)間s取值范圍為20到L/4,步長為10,階數(shù)q從-3到3,間隔為0.2均勻取31個值。圖2(a)和(b)分別是Hurst指數(shù)h(q)和質量指數(shù)τ(q)與階數(shù)q的關系圖;圖2(c)是FI-MFDFA與MFDFA1、MFDFA2及MFDFA3方法分析得到的多重分形譜f(α)和理論值譜線;為了更好地比較4種方法的統(tǒng)計精度,計算理論Hurst指數(shù)H(q)與實際估計的Hurst指數(shù)h(q)的差值: Δh(q)=H(q)-h(q) (18) 圖2(d)是Δh(q)與q的關系圖。圖2(a)和(b)中h(q)隨著q的變化而變化,且τ(q)與q之間不是直線關系,故該序列是多重分形序列;FI-MFDFA的q階Hurst指數(shù)更接近理論值,其次是MFDFA1和MFDFA3、MFDFA2的計算結果離理論值最遠。由圖2(c)可以看出,多重分形譜曲線均往左偏離理論值曲線;相比于q<0部分,F(xiàn)I-MFDFA方法計算出來的分形譜曲線逼近理論值的效果優(yōu)于q>0部分;MFDFA方法隨著多項式擬合階數(shù)的增加,計算出的多重分形譜與理論值的偏差變化較大,當階數(shù)m=1時,效果優(yōu)于m=2和m=3,擬合階數(shù)過大會引起過擬合現(xiàn)象,導致多重分形譜的形狀和寬度偏離理論值。圖2(d)中FI-MFDFA的Δh(q)波動斜率小于MFDFA,隨著q增大,4種方法下的Δh(q)均有所下降,其中,FI-MFDFA的Δh(q)小于MFDFA,更接近0。 表1是在FI-MFDFA和MFDFA方法下計算的Hurst指數(shù)h(q)、質量指數(shù)τ(q)以及多重分形譜參數(shù)α和f(α)對于理論值的均方根誤差。4種方法下的參數(shù)h(q)、τ(q)、α和f(α)均方根誤差的大小關系:FI-MFDFA 表1 多重分形參數(shù)的均方根誤差 2.2.3 樣本量的影響比較 選取p=0.3,樣本量L分別為256、512和1 024的BMS序列,運用FI-MFDFA、MFDFA1、MFDFA2和MFDFA34種方法分析序列的多重分形性,控制方法中的無標度區(qū)間不變,尺度區(qū)間s取值范圍為20到L/4,步長為10,階數(shù)q從-3到3,間隔為0.2均勻取31個值。圖3分別為FI-MFDFA、MFDFA1、MFDFA2和MFDFA34種方法計算出的多重分形譜,并與理論值對比。隨著樣本量的增加,4種方法計算的分形譜右邊部分的波動變化均大于左邊部分,MFDFA2和MFDFA3的波動明顯大于FI-MFDFA。FI-MFDFA對于樣本量的變化不是特別敏感,在樣本量為256時,多重分形譜的形狀在q<0部分略偏離理論值,在樣本量為512和1 024時,多重分形譜的形狀更接近于理論值;MFDFA方法在樣本量L為256時,分形譜曲線偏離理論值最遠,在樣本量為1 024時,分形譜曲線最接近理論值,其中MFDFA2和MFDFA3受小樣本量的影響較大。 圖3 不同樣本量序列的多重分形譜Fig.3 Multifractal spectrum of different sample series 表2是不同樣本量序列在4種方法下的Hurst指數(shù)的均方根誤差。FI-MFDFA方法在計算同一樣本量序列的實際Hurst指數(shù)與理論值的偏差均小于MFDFA。4種方法計算的h(q)均方根誤差均隨著樣本量L的增大而逐漸減小,其中FI-MFDFA方法對于樣本量的增加,Hurst指數(shù)偏離理論值的變化波動最小,當L=512和L=1 024時的h(q)與理論值的均方根誤差值分別為0.074 1和0.066 9,當L=256時,均方根誤差為0.101 5,均屬于可以接受的誤差范圍;MFDFA方法的多項式擬合階數(shù)取1時,計算3個樣本量序列的均方根誤差均小于MFDFA3,而MFDFA2最大,只有MFDFA1在L=1 024時均方根誤差值小于0.1。綜合分析,使用MFDFA方法對序列進行分析最少需要1 024個數(shù)據(jù)點,而FI-MFDFA方法取512個數(shù)據(jù)點就可滿足計算精度,對于小樣本量也可達到滿意的精度。 表2 不同樣本量序列的Hurst指數(shù)均方根誤差 將分形插值技術與降趨勢波動方法相結合給出基于分形插值的降趨勢波多重分形方法(FI-MFDFA),并利用BMS模型對該方法進行了檢驗,從方法的算法步驟、參數(shù)統(tǒng)計精度和樣本容量的敏感性3個方面,對比分析了FI-MFDFA方法與MFDFA方法的優(yōu)劣性。分析結果顯示:FI-MFDFA方法能有效識別多重分形強度,其多重參數(shù)h(q)、τ(q)、α和f(α)計算結果的均方根誤差均小于MFDFA方法的對應值,且受數(shù)據(jù)量大小的影響也較小,表明了FI-MFDFA方法要明顯優(yōu)于MFDFA方法,還能避免多項式擬合階數(shù)的變化對多重參數(shù)計算結果的影響,為進一步應用該方法研究實際數(shù)據(jù)的多重分形特征提供了理論支持。該方法對二維和高維數(shù)據(jù)的應用有待進一步研究。1.2 FI-MFDFA
2 FI-MFDFA方法檢驗
2.1 多重分形特征識別
2.2 與MFDFA的對比分析
3 結 論