趙文芝,任肖霖
(西安工程大學 理學院,陜西 西安 710048)
在對實際的金融數(shù)據(jù)進行分析的過程中,學者們發(fā)現(xiàn)金融市場經(jīng)常會受到一些突發(fā)事件的影響,而使得金融數(shù)據(jù)在某個時刻k后,樣本的分布或分布參數(shù)緩慢地開始變化。在對金融數(shù)據(jù)進行建模時,必須對漸變變點時刻進行檢驗。所以對均值漸變模型的變點檢驗也是統(tǒng)計學的研究熱點。Jaru?kov(1998)[1]對隨機誤差項為獨立同分布序列的均值漸變模型進行了對數(shù)似然比檢驗,得出檢驗統(tǒng)計量的漸近分布為Gumbel分布;Hu?kov(1999)[2]對隨機誤差項為獨立同分布序列的均值漸變模型進行研究,得到變點估計量的收斂速度及其極限分布;Hu?kov與Steinebach (2000)[3]使用CUSUM方法對漸變變點進行檢驗,得到檢驗統(tǒng)計量的極限分布;Alexander和Josef(2002)[4]研究隨機誤差項滿足弱不變原理的漸變隨機過程中變點的估計,并給出變點估計量的收斂速度;Madurkayova(2007)[5]對隨機誤差為獨立同分布序列的均值漸變模型運用RCUSUM函數(shù)的比率構造Ratio統(tǒng)計量,進行單變點檢驗; Steinebach和Timmermann (2011)[6]研究了具有漂移項的隨機過程中漸變變點,并對其進行序貫檢驗;Timmermann (2014)[7]對漸變變點進行在線監(jiān)測,得到零假設和備擇假設下檢驗統(tǒng)計量的極限分布;Vogt和Dette(2015)[8]研究了非參數(shù)模型中漸變變點估計量的漸近分布;Timmermann (2015)[9]研究了隨機誤差項滿足弱不變原理的漸變隨機過程,得到序貫檢驗統(tǒng)計量的極限分布。對于長相依序列,則有Wang Lihong和Wang Jinde[10]研究了帶有長記憶性的移動平均模型(MA)中方差突變點的檢測問題,在均值已知的情況下得到了未知變點的估計量及估計量的收斂速度,在均值未知的情況下得到原假設和備擇假設下檢驗統(tǒng)計量的極限分布;Wang Lihong (2007)[11]給出隨機誤差為長相依序列的均值漸變變點的最小二乘估計量,得到該估計量的收斂速度;Wang Lihong (2008)[12]研究了長記憶MA模型中均值變點問題。
檢驗漸變變點問題最常用的方法是累積和(CUSUM)方法,然而現(xiàn)有的CUSUM檢驗在討論檢驗統(tǒng)計量漸近性質時要求原假設與備擇假設下對模型的尺度參數(shù)的估計應該是一致的。事實上,在觀察值獨立的情況下,對模型的尺度參數(shù)的估計也并不容易,相依序列的情況就更為復雜。本文基于CUSUM函數(shù)的比率構造了Ratio統(tǒng)計量,避免了CUSUM方法中的尺度參數(shù)估計,得到了零假設和備擇假設下檢驗統(tǒng)計量的極限分布。
考慮如下均值漸變模型:
(1)
其中k*為未知變點,a+=max(0,a),μ,δ≠0,γ∈[0,1]均為未知參數(shù)。
假設
(2)
其中,{εj,-∞ 0 (3) 符號‘~’表示左邊與右邊的比率趨近于1。由文獻[11]可知,式(2),(3)定義的{ei}是帶有長記憶性的線性平穩(wěn)過程。 假設檢驗如下: H0:k*=n; H1:k* 考慮Ratio檢驗統(tǒng)計量 (4) 其中[na]表示取整,0 定理1假定Y1,…,Yn滿足模型(1)且原假設H0成立,有 (5) 證明由文獻[13]中式(2),(6)可得,存在一個分數(shù)布朗運動{Bd(y):0≤y<∞},0 (6) 其中κ是一個常數(shù)。 由文獻[14]可知 (7) 其中 因此,有 O((logT)1/2)a.s. (8) (9) 由文獻[3]中式(2.14)類似可得 因此 (10) 其中i,k=1,…,n,i 取k=[nt],i=[ns],0 Bd([nt]-m′+1)-Bd(n(t-y))dy]= (11) (12) 對于一個給定的k=[nt],結合式(10)~(12),有 (13) 類似地,可得 (14) 結合式(13),(14),可得定理結論。 定理2假設Y1,…,Yn滿足模型(1)且k*=[nt],對任意的0 n1/2|δn|→∞, (15) 則在備擇假設H1下,對a (16) 證明取k=k*,i=k*。 上式中方括號內的表達式有非零的正極限。因此由式(15)可知當n→∞時 定理1給出了原假設下檢驗統(tǒng)計量的極限分布,定理2給出了備擇假設下統(tǒng)計量依概率趨于無窮,這說明當檢驗統(tǒng)計量的值大于臨界值時拒絕原假設。 首先采用Monte Carlo方法對檢驗統(tǒng)計量Zn的極限分布進行數(shù)值模擬得到臨界值??紤]到直接分析檢驗統(tǒng)計量Zn的極限分布較難,本文采用檢驗統(tǒng)計量的樣本分位數(shù)來近似檢驗統(tǒng)計量極限分布的分位數(shù)。 考慮如下數(shù)據(jù)生成過程: 其中n為樣本容量,k*為變點位置,ei為FARIMA(0,d,0)過程。 首先驗證d的變化對假設檢驗的影響,取k*=n=1 000,μ=1,δ=2,γ=1,取d=0.1,0.2,0.3,0.4,對每一個d,分別對產生長度為1 000的FARIMA(0,d,0)序列,代入Zn可計算得一個值,重復進行1 000次得到1 000個樣本,用該樣本的分位點來近似統(tǒng)計量的極限分布的分位點,得到檢驗統(tǒng)計量極限分布的α分位數(shù),如表1。 表1 檢驗統(tǒng)計量極限分布的α分位數(shù)Tab.1 α quantile of cimiting distribnt 分別取樣本容量n=500,800,1 000,μ=0,δ=2,γ=1,重復進行1 000次試驗,檢驗水平α=0.05。模擬的經(jīng)驗水平和經(jīng)驗勢函數(shù)值見表2和表3。同時運用文獻[11]中所給的CUSUM檢驗的分位數(shù),模擬所得的經(jīng)驗水平和經(jīng)驗勢函數(shù)值見表2和表3括號中的數(shù)值。 表2 Zn的經(jīng)驗水平Tab.2 The empirical siye of Zn 注:括號中的數(shù)據(jù)為CUSUM檢驗法得到的經(jīng)驗水平值。 由表2可知,當d=0.1時,樣本容量n越大,Ratio檢驗統(tǒng)計量的檢驗水平越接近于0.05,檢測水平失真較小。同時,CUSUM檢驗的檢驗水平失真也較小。 表3 Zn的經(jīng)驗勢函數(shù)值Tab.3 The emipirical power of Zn 注:括號中的數(shù)據(jù)為CUSUM檢驗法得到的經(jīng)驗勢函數(shù)值。 由表3可知,當樣本容量增加時,Ratio檢驗統(tǒng)計量經(jīng)驗勢函數(shù)值也在增加,而且樣本容量越大,經(jīng)驗勢函數(shù)值越接近于1,檢驗的效果越好。同時,與CUSUM檢驗法相比,Ratio檢驗統(tǒng)計量的經(jīng)驗勢函數(shù)值更接近1,檢驗效果更勝一籌。 由表2和表3可知,d越大,假設檢驗統(tǒng)計量的經(jīng)驗水平失真越小,經(jīng)驗勢函數(shù)值越接近于1。 然后,驗證γ的變化對假設檢驗的影響。分別取樣本容量n=500,800,1 000,μ=0,δ=2,d=0.1,γ=0,0.25,0.5,0.75,1,重復進行1 000次試驗,檢驗水平α=0.05。模擬的經(jīng)驗水平和經(jīng)驗勢函數(shù)值見表4和表5。同時運用文獻[11]中所給的CUSUM檢驗的分位數(shù),模擬所得的經(jīng)驗水平和經(jīng)驗勢函數(shù)值見表4和表5括號中的數(shù)值。 表4 Zn的經(jīng)驗水平Tab.4 The empirical siye of Zn 注:括號中的數(shù)據(jù)為CUSUM檢驗法得到的經(jīng)驗水平值。 由表4可知,當γ=1時,樣本容量n越大,Ratio檢驗統(tǒng)計量的檢驗水平越接近于0.05,檢測水平失真較小。同時,CUSUM檢驗的檢驗水平失真也較小。 表5 Zn的經(jīng)驗勢函數(shù)值Tab.5 The empirical power of Zn 注:括號中的數(shù)據(jù)為CUSUM檢驗法得到的經(jīng)驗勢函數(shù)值。 由表5可知,當樣本容量增加時,Ratio檢驗統(tǒng)計量經(jīng)驗勢函數(shù)值也在增加,而且樣本容量越大,經(jīng)驗勢函數(shù)值越接近于1,檢驗的效果越好。同時,與CUSUM檢驗法相比,Ratio檢驗統(tǒng)計量的經(jīng)驗勢函數(shù)值更接近1,檢驗效果更勝一籌。 實例 為驗證Ratio檢驗法的有效性,以全球平均溫度為例,分析從1880年到1980年的101個歷史數(shù)據(jù)(數(shù)據(jù)來自http://www.datatang.com/data/3490),首先得到原始數(shù)據(jù)的時序圖,如圖1所示。 圖1 全球平均溫度時序圖Fig.1 Global average temperature sequence diagram 從圖1觀察發(fā)現(xiàn),所選時間段間的數(shù)據(jù)呈現(xiàn)漸變的趨勢,可能存在變點。用本文的Ratio檢驗法,假設檢驗如下: H0:k*=101; H1:k*<101,δ≠0。 將所選數(shù)據(jù)帶入檢驗統(tǒng)計量Zn中,計算得到在α=0.05檢驗水平下,Ratio檢驗統(tǒng)計量Zn=1.198,大于d=0.1,μ=0,δ=2,γ=1時對應的臨界值0.305 7,因此拒絕原假設,也就是說所選時間段間的數(shù)據(jù)存在變點。 記時間1880年為t=1,1881年為t=2,一直到1980年為t=101,運用最小二乘法估計出變點發(fā)生在t=42,即1922年。從圖1可以看出,1922年后全球平均溫度呈上升趨勢,查閱相關資料,猜測可能是工業(yè)革命以后,人類大量使用化石燃料,制造了大量二氧化碳等溫室氣體所造成的溫室效應引起了全球平均氣溫的波動。 Yi=2 統(tǒng)計量的極限分布
3 數(shù)值模擬及實例分析
3.1 數(shù)值模擬
3.2 實例分析