王建新,王 健(山東理工大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,山東 淄博 255049)
時(shí)間序列的突變檢驗(yàn)在生活中很多領(lǐng)域有著重要的應(yīng)用,例如水文氣象序列的突變時(shí)間研究.隨著全球氣候的變化威脅著人類的生活環(huán)境,關(guān)于水文氣象序列的研究越來(lái)越重要.非參數(shù)統(tǒng)計(jì)方法要求的假定條件較少,運(yùn)算比較簡(jiǎn)單,更容易使研究者理解應(yīng)用推廣.因此,研究非參數(shù)統(tǒng)計(jì)檢驗(yàn)方法有重要的意義.目前關(guān)于突變檢驗(yàn)的非參數(shù)統(tǒng)計(jì)方法有很多,如Mann-Kendall法,pettitt 法,Reverse Spearman’s rho test ,pettitt 法,WMW法等. 眾所周知,非參數(shù)秩檢驗(yàn)受原始數(shù)據(jù)是否存在自相關(guān)的先驗(yàn)假設(shè)條件限制,但高階自相關(guān)遠(yuǎn)遠(yuǎn)小于一階自相關(guān)帶來(lái)的誤差可以忽略.許多學(xué)者也認(rèn)識(shí)到非參數(shù)統(tǒng)計(jì)法方法會(huì)受到一些序列自身性質(zhì)的影響,而傾向研究小波理論等引入的新方法.[1-3]本文將通過(guò)蒙特卡洛模擬的方法驗(yàn)證剖析不同一階自相關(guān)系數(shù)的存在對(duì)Mann-Kendall突變檢驗(yàn)產(chǎn)生的具體差異影響,從而對(duì)其進(jìn)行修正,并探討不同樣本空間所帶來(lái)的的突變次數(shù)的改變.為檢驗(yàn)相關(guān)問(wèn)題提供更加簡(jiǎn)單可行的分析方法及運(yùn)算步驟.
設(shè)時(shí)間序列{Xt},觀察值序列{xt,t=1,2,...,n}.構(gòu)造秩序列
其中
在時(shí)間序列隨機(jī)獨(dú)立的假定下,定義統(tǒng)計(jì)量:
(k=1,2,...,n)
其中UF1=0,當(dāng)x1,x2,...,xn相互獨(dú)立,且連續(xù)同分布,
UFk是按時(shí)間序列x順序x1,x2,...,xn計(jì)算出來(lái)的統(tǒng)計(jì)量序列.按時(shí)間序列x逆序xn,xn-1,...,x1,再重復(fù)上述過(guò)程,然后使計(jì)算值乘上-1,即可得到UBk序列.分別繪制UFk和UBk曲線圖,如果UFk和UBk曲線交點(diǎn)在置信線之間,那么交點(diǎn)對(duì)應(yīng)的時(shí)刻便是突變開(kāi)始的時(shí)間.
為了驗(yàn)證存在一階自相關(guān)對(duì)于Mann-Kendall 突變檢驗(yàn)方法產(chǎn)生的影響,將利用蒙特卡洛模擬實(shí)驗(yàn)對(duì)于不同一階自相關(guān)系數(shù)ρ1的序列進(jìn)行分析[4-5].設(shè)
Xt=μX+ρ1(Xt-1-μX)+εt
(1)
(2)
蒙特卡洛模擬如圖1、圖2所示.
圖1 正相關(guān)AR(1)影響結(jié)果Fig. 1 Effect of positive serial correlation
圖2 負(fù)相關(guān)AR(1)影響結(jié)果Fig. 2 Effect of negative serial correlation
通過(guò)圖1和圖2可以看出,當(dāng)時(shí)間序列存在正相關(guān)AR(1)過(guò)程時(shí),隨著正相關(guān)系數(shù)的不斷增加,檢驗(yàn)出突變次數(shù)呈明顯的逐漸下降趨勢(shì).另外,隨著樣本空間的增大,檢驗(yàn)出突變點(diǎn)的概率均隨著增高,這符合現(xiàn)實(shí)的認(rèn)知.當(dāng)時(shí)間序列存在負(fù)相關(guān)AR(1)過(guò)程時(shí),隨著負(fù)相關(guān)強(qiáng)度的增加,檢驗(yàn)出突變次數(shù)和正相關(guān)情況相反呈逐漸上升的趨勢(shì).通過(guò)對(duì)比不難發(fā)現(xiàn),存在負(fù)相關(guān)AR(1)過(guò)程的樣本要比存在正相關(guān)AR(1)過(guò)程的樣本檢驗(yàn)出突變的次數(shù)的概率均有所增加.因此,通過(guò)模擬實(shí)驗(yàn)不難發(fā)現(xiàn)如果時(shí)間序列存在自相關(guān)性對(duì)Mann-Kendall 突變檢驗(yàn)方法將產(chǎn)生較大的影響,消除時(shí)間序列的自相關(guān)性在進(jìn)行突變檢驗(yàn)可能會(huì)產(chǎn)生更加精確的結(jié)果.
下面利用Pre-whitening法對(duì)蒙特卡洛模擬產(chǎn)生的時(shí)間序列進(jìn)行預(yù)處理,然后再進(jìn)行模擬實(shí)驗(yàn).
Pre-whitening法[6]是von Storch 提出,并被Yue S等人用于減少AR(1)過(guò)程對(duì)于MK檢驗(yàn)趨勢(shì)分析產(chǎn)生的影響中,下面驗(yàn)證其在處理突變檢驗(yàn)中的效果.樣本序列可以通過(guò)公式進(jìn)行Pre-whitening處理:
Yt=Xt-ρ1Xt-1
然后對(duì)新的時(shí)間序列{Yt}進(jìn)行蒙特卡洛模擬.
圖3 Pre-whitening 修正Fig. 3 Modified by Pre-whitening
從圖3可以看出,運(yùn)用Pre-whitening 處理后的時(shí)間序列再進(jìn)行蒙特卡洛模擬的Mann-Kendall突變檢驗(yàn)已經(jīng)去除了不同自相關(guān)系數(shù)對(duì)于突變檢驗(yàn)的影響,各個(gè)樣本空間的模擬實(shí)驗(yàn)結(jié)果均和自相關(guān)系數(shù)等于0時(shí)保持在幾乎同一水平.說(shuō)明Pre-whitening 處理對(duì)于Mann-Kendall突變檢驗(yàn)也是一種有效的方法.
以全國(guó)1949-2008年洪災(zāi)數(shù)據(jù)為例,利用非參數(shù)統(tǒng)計(jì)檢驗(yàn)方法Mann-Kendall突變檢驗(yàn)進(jìn)行修正前后分析結(jié)果的分析對(duì)比.首先,判斷洪災(zāi)數(shù)據(jù)是否存在一階自相關(guān)性.
表1 一階自相關(guān)系數(shù)顯著性檢驗(yàn)
Tab.1 The test of significance of lag-1 serial correlation coefficient
參數(shù)估計(jì)標(biāo)準(zhǔn)誤差t值近似Pr>|t|滯后MU9763.1994.855099.81<.00010AR1,10.401250.120303.340.00151
通過(guò)利用SAS軟件進(jìn)行條件最小二乘估計(jì)(見(jiàn)表1).可以看出一階自相關(guān)系數(shù)0.40125,并且系數(shù)的t檢驗(yàn)p值小于0.01,說(shuō)明該序列具有較強(qiáng)的一階自相關(guān)性,系數(shù)顯著非零,該數(shù)據(jù)具有一定的討論意義.利用Pre-whitening 處理洪災(zāi)數(shù)據(jù),消除一階自相關(guān)對(duì)數(shù)據(jù)檢驗(yàn)的影響.
圖4 全國(guó)1949—2008年洪災(zāi)數(shù)據(jù)Pre-whitening 處理前、后折線對(duì)比圖Fig. 4 Line chart of flood data before and after Pre-whitenhg from 1949 to 2008 in China
利用pre-whitening 處理全國(guó)洪災(zāi)數(shù)據(jù)后,消除了數(shù)據(jù)本身存在的一階自相關(guān)性.通過(guò)圖4的折線圖對(duì)比可以看出,數(shù)據(jù)處理前后波動(dòng)起伏變化非常小,沒(méi)有改變?cè)紨?shù)據(jù)的核心信息.同時(shí)更好的滿足了利用非參數(shù)秩檢驗(yàn)方法所受到原始數(shù)據(jù)是否存在自相關(guān)的先驗(yàn)假設(shè)條件.
圖5 全國(guó)1949-2008洪災(zāi)數(shù)據(jù)Pre-whitening 處理前、后MK突變檢驗(yàn)對(duì)比圖Fig. 5 Line chart of the MK test based on the flood data before and after Pre-whitenhg from 1949 to 2008 in China
Mann-Kendall突變檢驗(yàn),如果UFk和UBk曲線交點(diǎn)在置信線之間,那么交點(diǎn)對(duì)應(yīng)的時(shí)刻便是突變開(kāi)始的時(shí)間.從圖5可以看出全國(guó)1949-2008洪災(zāi)數(shù)據(jù)Pre-whitening 處理前后的Mann-Kendall突變檢驗(yàn)結(jié)果有所差異.因已算出原始數(shù)據(jù)一階自相關(guān)系數(shù)ρ1=0.401 25,觀察第三節(jié)中所做的不同一階自相關(guān)系數(shù)在不同樣本空間下對(duì)Mann-Kendall突變檢驗(yàn)產(chǎn)生影響的分析結(jié)果,可以看出存在ρ1=0.4的不同樣本空間下均會(huì)產(chǎn)生突變次數(shù)少許降低的影響. 對(duì)圖5分析可以看出數(shù)據(jù)處理前Mann-Kendall突變檢驗(yàn)只檢驗(yàn)出1980年左右一次明顯的突變,但數(shù)據(jù)處理后發(fā)現(xiàn)在原有的突變點(diǎn)外還有較小的波動(dòng),這對(duì)分析數(shù)據(jù)即會(huì)產(chǎn)生影響.同時(shí)將隨著一階自相關(guān)系數(shù)的增加以及樣本量的變化產(chǎn)生更大的影響,更對(duì)剖析突變的成因,突變開(kāi)始的時(shí)間點(diǎn)及突變的發(fā)展趨勢(shì)等產(chǎn)生干擾,因而不容忽視. 通過(guò)修正的Mann-Kendall突變檢驗(yàn)可以看出1980年前后發(fā)生了2次突變,其中1980年左右發(fā)生的突變最為顯著,使全國(guó)洪災(zāi)受災(zāi)面積呈上升的趨勢(shì).不難發(fā)現(xiàn)靠前的一次突變可能是1980年突變產(chǎn)生的根源所在,值得引起我們的深入分析. 因此通過(guò)Pre-whitening 處理后的Mann-Kendall突變檢驗(yàn)方法對(duì)進(jìn)一步分析全國(guó)洪水災(zāi)害變化的趨勢(shì)以及產(chǎn)生的原因可以做出更加精確的解釋.
通過(guò)蒙特卡洛模擬實(shí)驗(yàn)可以看出,存在AR(1)過(guò)程的時(shí)間序列,在進(jìn)行Mann-Kendall突變檢驗(yàn)時(shí)會(huì)對(duì)檢驗(yàn)的結(jié)果產(chǎn)生影響.并且不同的自相關(guān)系數(shù)對(duì)分析結(jié)果影響程度不同,可以分別從正負(fù)自相關(guān)系數(shù)來(lái)解釋.因此,在利用Mann-Kendall突變檢驗(yàn)方法檢驗(yàn)時(shí)間序列的實(shí)際應(yīng)用中,應(yīng)先判斷時(shí)間序列是否存在自相關(guān)性.本文利用蒙特卡洛模擬實(shí)驗(yàn)驗(yàn)證了Pre-whitening 處理方法在Mann-Kendall突變檢驗(yàn)時(shí)間序列中修正的可行性.另外,通過(guò)實(shí)驗(yàn)不難看出,當(dāng)一階自相關(guān)系數(shù)ρ1≥0.2時(shí),即將對(duì)Mann-Kendall突變檢驗(yàn)結(jié)果產(chǎn)生不可忽視的誤差.同時(shí),當(dāng)樣本量n≥100,一階自相關(guān)系數(shù)-0.1<ρ1<0.1時(shí),為了計(jì)算簡(jiǎn)便可以忽略其誤差.當(dāng)一階自相關(guān)系數(shù)ρ1≤-0.2時(shí),Mann-Kendall突變檢驗(yàn)結(jié)果也產(chǎn)生不可忽視的誤差. Mann-Kendall突變檢驗(yàn)方法適用于多類時(shí)間序列的突變檢驗(yàn),可以推廣到其他水文氣象領(lǐng)域或金融等領(lǐng)域的應(yīng)用問(wèn)題中,具有重要的研究及應(yīng)用價(jià)值.
[1] 魏鳳英. 現(xiàn)代氣候統(tǒng)計(jì)診斷與預(yù)測(cè)技術(shù)[M]. 北京:氣象出版社, 1999.
[2] 張應(yīng)華, 宋獻(xiàn)方. 水文氣象序列趨勢(shì)分析與變異診斷的方法及其對(duì)比[J]. 干旱區(qū)地理, 2015, 38(4): 652-665.
[3] 王振龍, 陳璽, 郝振純, 等. 淮北平原水文氣象要素長(zhǎng)期變化趨勢(shì)和突變特征分析[J]. 灌溉排水學(xué)報(bào), 2010, 29(5): 52-56.
[4] YUE S, PILON P, PHINNEY B.et al. The influence of autocorrelation on the ability to detect trend in hydrological series[J]. Hydrol Processes, 2002,16:1 807-1 829.
[5] YUE S, WANG C Y. The Mann-Kendall test modified by effective sample size to detect trend in serially Correlated Hydrological Series[J]. Water Resour Manage, 2004,18:201-218.
[6] YUE S, WANG C Y. The applicability of pre-whitening to eliminate the influence of serial correlation on the Mann-Kendall test[J]. Water Res,2002, 38(6), 10.1029/2001WR000861, 4-1-7.
[7] 姚欣明, 陳元芳, 顧圣華, 等. EEMD-NNBR模型在降水預(yù)測(cè)中的應(yīng)用[J]. 水電能源科學(xué), 2014, 32(12): 11-13,16.
山東理工大學(xué)學(xué)報(bào)(自然科學(xué)版)2018年2期