鄧鑫潔
(重慶建筑工程職業(yè)學(xué)院,重慶400039)
斯米爾洛夫檢驗(yàn)法在非正態(tài)分布?xì)鉁財(cái)?shù)據(jù)均一性檢驗(yàn)中的應(yīng)用
鄧鑫潔
(重慶建筑工程職業(yè)學(xué)院,重慶400039)
均一性檢驗(yàn)是數(shù)據(jù)處理工作的重要步驟,研究均一性檢驗(yàn)方法具有非常重要的意義。均一性檢驗(yàn)也是氣候資料訂正的第一步,其正確性會(huì)直接影響到后續(xù)工作的開(kāi)展。經(jīng)典的標(biāo)準(zhǔn)正態(tài)檢驗(yàn)法(SNHT)只適用于正態(tài)分布的氣候序列的均一性檢驗(yàn),而實(shí)際上存在大量非正態(tài)的氣候序列需要考察其均一性。該文所采用的斯米爾洛夫方法,常用于序列的總體分布檢驗(yàn),文中將其運(yùn)用到氣溫序列的均一性檢驗(yàn)中,適用于任何分布的氣溫序列。針對(duì)重慶市年氣溫序列的均一性檢驗(yàn)結(jié)果表明,斯米爾洛夫方法優(yōu)于SNHT方法。
均一性;檢驗(yàn);氣候資料;非正態(tài)分布;斯米爾洛夫法
在大數(shù)據(jù)時(shí)代,可從海量數(shù)據(jù)中提取信息,為了確保信息的準(zhǔn)確,進(jìn)行適當(dāng)?shù)念A(yù)處理是非常有必要的。氣候資料是研究氣象災(zāi)害及其變化規(guī)律的基礎(chǔ),為人類(lèi)趨利避害提供了實(shí)用的信息。由于臺(tái)站遷移、觀測(cè)儀器更換、站址周?chē)h(huán)境變化、自動(dòng)觀測(cè)儀器及傳輸系統(tǒng)的故障等等因素可能引起粗差或資料缺失等,使氣象序列出現(xiàn)跳躍性變化,導(dǎo)致利用這樣的序列得到的研究成果令人質(zhì)疑。李又君等研究表明臺(tái)站遷移后兩地氣溫差異顯著[1];王穎等發(fā)現(xiàn)自動(dòng)觀測(cè)與人工觀測(cè)的各氣象要素均存在一定的差異[2];熊安元研究發(fā)現(xiàn)觀測(cè)儀器的變化對(duì)氣溫測(cè)值有較明顯影響,其中日、月、年平均氣溫相差達(dá)0.2℃[3]。
在統(tǒng)計(jì)學(xué)上,均一性序列指序列樣本取自同一總體,具有相同的概率分布函數(shù),而非均一性序列指不同時(shí)段的序列取自不同的樣本總體,即存在突變點(diǎn)[4]。均一的氣候序列是氣候變化研究的基礎(chǔ),被定義為只包含天氣和氣候變化的序列,Heino將導(dǎo)致長(zhǎng)期氣候變化的原因劃分為兩類(lèi):明顯變化和真實(shí)變化[5],其中的明顯變化就是導(dǎo)致氣候資料非均一的因素,而序列中的非均一性既可能是漸變的趨勢(shì),也可能是突然不連續(xù)的(即斷點(diǎn))[6]。
國(guó)內(nèi)外許多學(xué)者對(duì)氣候序列的非均一性問(wèn)題進(jìn)行了大量研究,也提出了幾種非均一性檢驗(yàn)方法。目前應(yīng)用最為廣泛的是由A lexandersson發(fā)展的SNHT方法[7]。SNHT方法是一種極大似然檢驗(yàn)方法,能檢出多個(gè)斷點(diǎn),也能檢驗(yàn)趨勢(shì)的均一性,還能檢驗(yàn)方差的變化。
但SNHT方法要求樣本服從正態(tài)分布,實(shí)際上有些臺(tái)站資料不能滿(mǎn)足要求。一般對(duì)變量做標(biāo)準(zhǔn)正態(tài)化處理,而處理過(guò)程中偏差大的或無(wú)法正態(tài)化的序列,不宜采用SNHT方法進(jìn)行檢驗(yàn)。針對(duì)上述問(wèn)題,本文引入基于經(jīng)驗(yàn)分布函數(shù)的斯米爾諾夫方法運(yùn)用到氣溫資料的非均一性檢驗(yàn)中。斯米爾洛夫法是經(jīng)典的總體分布函數(shù)的檢驗(yàn)方法,用于兩個(gè)總體分布函數(shù)的比較問(wèn)題,在氣象上也曾用于分析序列的分布情況,例如降水量的統(tǒng)計(jì)特征[8]等。
實(shí)際計(jì)算分析表明,斯米爾洛夫方法可以進(jìn)行均一性檢驗(yàn),比SNHT方法有更廣泛的適用性。
1.1資料來(lái)源
重慶地屬四川盆地邊緣,地形復(fù)雜,氣象觀測(cè)臺(tái)站分布稀疏。建國(guó)以來(lái),重慶市社會(huì)經(jīng)濟(jì)建設(shè)速度很快,部分氣象臺(tái)站曾多次遷址,導(dǎo)致重慶市氣象局提供的氣候資料存在較嚴(yán)重的非均一問(wèn)題。均一性檢驗(yàn)的過(guò)程中,我們發(fā)現(xiàn),很多(約15個(gè))臺(tái)站的氣溫序列與正態(tài)分布有顯著差異,SNHT方法難以發(fā)現(xiàn)斷點(diǎn)。
為了考察斯米爾洛夫方法的實(shí)際效果,選用重慶市城口站、開(kāi)縣站和奉節(jié)站從1960年到2008年的逐日平均氣溫,參考臺(tái)站選自重慶市除巫溪、云陽(yáng)、金佛山外的其他34個(gè)氣象臺(tái)站。其中巫溪、云陽(yáng)兩地涉及到觀測(cè)臺(tái)站變遷問(wèn)題,資料分別從1973、1974年開(kāi)始,而金佛山觀測(cè)資料結(jié)束于1994年。
1.2計(jì)算方法
設(shè)母體X有樣本觀測(cè)值x1,x2,…xn,其順序統(tǒng)計(jì)量為x(1)≤x(2)≤…≤x(n),在區(qū)間(-∞,+∞)上構(gòu)成函數(shù)
則稱(chēng)函數(shù)Fn(x)為經(jīng)驗(yàn)分布函數(shù),或樣本分布函數(shù)。
根據(jù)大數(shù)定律,當(dāng)樣本容量n足夠大時(shí),經(jīng)驗(yàn)分布函數(shù)Fn(x)依概率收斂于母體分布函數(shù)F(x),即有:
斯米爾洛夫檢驗(yàn)借助于經(jīng)驗(yàn)分布函數(shù)用于比較兩個(gè)母體分布,設(shè)兩個(gè)母體分布函數(shù)分別為F1(x)和F2(x),假設(shè)檢驗(yàn)為:
設(shè)定第一個(gè)母體樣本觀測(cè)值為x1,x2,…xn1,第二個(gè)母體的樣本觀測(cè)值為y1,y2,…yn2,并假定兩個(gè)樣本是相互獨(dú)立的,有根據(jù)兩個(gè)樣本觀測(cè)值建立的經(jīng)驗(yàn)分布函數(shù)分別是Fn1(x)和Fn2(x),F(xiàn)n1(x)與Fn2(x)之間的差異反映的是F1(x)和F2(x)之間的差異。斯米爾洛夫提出的統(tǒng)計(jì)量為:
如果H0成立時(shí),則表明兩母體具有相同的分布函數(shù)F(x),即F1(x)=F2(x)=F(x)。從兩個(gè)母體中分別得到的兩個(gè)樣本,可以看成從同一母體中獨(dú)立的分別得到的兩個(gè)樣本,因而可以利用統(tǒng)計(jì)量Dn1n2及其極限分布進(jìn)行檢驗(yàn),其檢驗(yàn)的具體步驟是:(1)從兩個(gè)母體中獨(dú)立抽取容量分別為n1和n2的樣本,分別建立經(jīng)驗(yàn)分布函數(shù)是Fn1(x)和Fn2(x)。(2)計(jì)算統(tǒng)計(jì)量Dn1n2的值,作為H0的檢驗(yàn)統(tǒng)計(jì)量。(3)給定顯著性水平α,用對(duì)應(yīng)的n值查出的臨界值Dn(α)。(4)比較Dn1n2和Dn(α),若Dn1n2>Dn(α),則否定H0,即認(rèn)為兩母體的分布函數(shù)不同[8]。
1.3對(duì)年平均氣溫的均一性檢驗(yàn)
我們需要得到的是去掉明顯變化的氣候真實(shí)情況,故需要查找出由于非氣候變化導(dǎo)致的氣候資料非均一,在檢驗(yàn)中需剔除母體中各元素包含的氣候真實(shí)變化,所以建立一個(gè)相對(duì)均一的參考序列是檢驗(yàn)和訂正待檢序列的關(guān)鍵,參考序列構(gòu)建的是否合理,是否均一直接影響到待檢序列的檢驗(yàn)結(jié)果。
本文中以原始序列為基礎(chǔ),運(yùn)用多元線(xiàn)性回歸原理得出參考序列。設(shè)T0為待檢臺(tái)站溫度序列,T1為參考臺(tái)站溫度序列,利用下公式計(jì)算得參考序列T'0。
將待檢序列與參考序列的差值序列作為檢驗(yàn)序列{Xi}(i= 1,2,…n)。
如果檢驗(yàn)序列{Xi}沒(méi)有不連續(xù)點(diǎn)存在,則對(duì)于任意i(i=1,2,…n-1),以其前后序列為樣本的{x1,…xi}和{xi+1,…xn}都能通過(guò)斯米爾洛夫檢驗(yàn),認(rèn)為其來(lái)自同一母體,反之亦然。
本文所選實(shí)驗(yàn)數(shù)據(jù)長(zhǎng)度短,在以年份為間斷點(diǎn),逐次將檢驗(yàn)序列分為首尾兩段{X1}和{X2},它們的樣本容量分別為n1和n2,利用斯米爾諾夫檢驗(yàn)法對(duì)兩樣本進(jìn)行分布檢驗(yàn)。將y=Dnln2-Dn(α)作為檢驗(yàn)量,y為正時(shí),序列可能存在間斷點(diǎn),其為正且最大處作為斷點(diǎn)。同法查找斷點(diǎn)前的序列和斷點(diǎn)后的序列中隱藏的斷點(diǎn)。
本文選擇距待檢臺(tái)站最近的5個(gè)臺(tái)站為參考臺(tái)站,利用公式(6)計(jì)算出參考序列,城口站和開(kāi)縣站年平均氣溫待檢序列與參考序列分布圖如圖1、圖2所示,
圖1 城口站年平均氣溫待檢序列與參考序列分布圖
圖2 開(kāi)縣站年平均氣溫待檢序列與參考序列分布圖
將待檢序列和參考序列作為兩樣本,選定顯著性水平α= 0.05,分別計(jì)算得:城口站有:Dn1n2=0.1837<Dn(α)=0.2748;開(kāi)縣站有:Dn1n2=0.1837<Dn(α)=0.2748。通過(guò)斯米爾洛夫檢驗(yàn),認(rèn)為兩樣本來(lái)自同一分布總體。如此處檢驗(yàn)不通過(guò),則需重新篩選參考臺(tái)站。利用待檢序列與參考序列作差構(gòu)造檢驗(yàn)序列進(jìn)行檢驗(yàn),其分布如圖3所示。圖中可看出城口站在1978年前后、2002年前后有明顯的變化,開(kāi)縣站在1978年前后也有明顯變化,而奉節(jié)站在2002年存在明顯的非均一。
選擇顯著性水平α=0.05。將未通過(guò)斯米爾諾夫檢驗(yàn)的差異最大處作為斷點(diǎn),在同理分析斷點(diǎn)前后兩序列中是否存在斷點(diǎn)。
在SNHT法中,可將原假設(shè)定為檢驗(yàn)的變量服從正態(tài)分布,此處通過(guò)計(jì)算樣本的偏度系數(shù)和峰度系數(shù)進(jìn)行,在顯著水平性α= 0.05下,若偏度系數(shù)和峰度系數(shù)滿(mǎn)足:
圖3 城口站與開(kāi)縣站檢驗(yàn)序列分布圖
則拒絕假設(shè),認(rèn)為變量不遵從正態(tài)分布,否則可認(rèn)為變量與正態(tài)分布無(wú)明顯差異。其中偏態(tài)系數(shù)和峰態(tài)系數(shù)與樣本中心矩的關(guān)系為:
式中mk分別為樣本的k階中心矩,k階中心矩表示為:(9)
表1 斯米爾洛夫檢驗(yàn)法與SNHT檢驗(yàn)法結(jié)果對(duì)比表
如不滿(mǎn)足正態(tài)分布,采用適當(dāng)?shù)恼龖B(tài)轉(zhuǎn)換方法,若轉(zhuǎn)換后仍無(wú)法滿(mǎn)足,則無(wú)法檢驗(yàn)。
表1中列舉了兩種方法對(duì)重慶市城口、開(kāi)縣、奉節(jié)三臺(tái)站的檢驗(yàn)結(jié)果。
比對(duì)氣象臺(tái)站沿革資料,該次試驗(yàn)中有記載的臺(tái)站遷移有13個(gè),斯米爾洛夫檢驗(yàn)法共測(cè)出斷點(diǎn)15個(gè),其中8個(gè)可得到臺(tái)站遷移驗(yàn)證;SNHT法共檢驗(yàn)出斷點(diǎn)5個(gè),其中3個(gè)得到臺(tái)站遷移驗(yàn)證。
在本文的計(jì)算中僅考慮了臺(tái)站遷移的沿革資料,而統(tǒng)計(jì)方法、儀器變更和儀器高度等均未考慮。城口站歷史沿革資料記載其于1960年到2008年之間站臺(tái)位置有三次調(diào)整,其中在1978年8月31日后和2007年12月31后有兩次遷站,兩次遷站均有經(jīng)緯度偏移,2007年12月31號(hào)的遷站由農(nóng)村遷移到了城鎮(zhèn),這與歷史記錄相符。但沿革資料中還有一處1982年7月底的臺(tái)站高程變化未查找出。根據(jù)氣象臺(tái)站沿革對(duì)氣溫資料序列非均一性影響程度[9]知臺(tái)站遷移與統(tǒng)計(jì)方法對(duì)溫度資料有明顯影響,而儀器高度對(duì)氣溫資料均一性的影響較?。焕肧NHT法對(duì)開(kāi)縣站查找出斷點(diǎn)一個(gè),無(wú)法得到驗(yàn)證。
在對(duì)開(kāi)縣站的非均一性斷點(diǎn)檢測(cè)中,斯米爾洛夫檢驗(yàn)法檢驗(yàn)出7個(gè)斷點(diǎn),驗(yàn)證4個(gè);SNHT法檢驗(yàn)得4個(gè),得驗(yàn)證2個(gè)。其中1972年的斷點(diǎn)與歷史沿革不相符,但兩法均能查出,本文分析與參考臺(tái)站的選擇有關(guān)。
對(duì)于奉節(jié)站,斯米爾洛夫檢驗(yàn)法查出斷點(diǎn)6個(gè),得驗(yàn)證2個(gè),SNHT法查出1個(gè),得驗(yàn)證1個(gè)。
本文引入了斯米爾洛夫方法研究了重慶市氣候資料的均一性問(wèn)題,與經(jīng)典的SNHT方法相比,主要得到以下認(rèn)識(shí)。
(1)當(dāng)待檢序列與正態(tài)分布無(wú)顯著差異時(shí),斯米爾洛夫方法比SNHT方法的均一性檢驗(yàn)敏感,能夠檢出更多的斷點(diǎn)。
(2)當(dāng)待檢序列與正態(tài)分布有顯著差異時(shí),斯米爾洛夫方法能取得良好的均一性檢驗(yàn)效果,此時(shí)SNHT方法不適用。
為了節(jié)約計(jì)算量,本文只給出了斷點(diǎn)的年份,下一步計(jì)劃研究斷點(diǎn)的月份甚至日期;基于斷點(diǎn)的日期,開(kāi)展重慶市氣候資料的均一性訂正工作。
本文以氣象數(shù)據(jù)的均一性檢驗(yàn)為出發(fā)點(diǎn),探討了兩種檢驗(yàn)方法,這些方法同樣適用于在滑坡、變形監(jiān)測(cè)等工程領(lǐng)域。
[1]李又君,梁國(guó)堅(jiān),張宏政,等.氣象站遷站前后氣溫同期觀測(cè)資料對(duì)比[J].氣象科技,2010,38(5):599-604.
[2]王穎,劉小寧,鞠曉慧.自動(dòng)觀測(cè)與人工觀測(cè)差異的初步分析[J].應(yīng)用氣象學(xué)報(bào),2007,18(6):849-855.
[3]熊安元,朱燕君,任芝花,等.觀測(cè)儀器和百葉箱的變化對(duì)地面氣溫觀測(cè)值的影響及其原因分析[J].氣象學(xué)報(bào),2006,63(3):377-384.
[4]溫華洋.T分布參數(shù)變點(diǎn)的非參數(shù)統(tǒng)計(jì)推斷及其在氣候資料均一性檢驗(yàn)上的運(yùn)用[D].合肥:合肥工業(yè)大學(xué),2007.
[5]Raino Heino.Metadata and Their Role inhomogeneity[C].:Proceedings of the First Seminar for Homogenization of Surface Climatologically Data,1996:5-8.
[6]李慶祥,劉小寧,張洪政,等.定點(diǎn)觀測(cè)氣候序列的均一性研究[J].氣象科技,2003,31(1):2-12.
[7]Alexandersson H.A homogeneity test applied to precipitation data[J].International Journal of Climatology,1986,6:661-675.
[8]方媛,李培月.銀川市降水量正態(tài)分布特征[J].水利科技與經(jīng)濟(jì),2010,16(8):873.
[9]佘敦先,夏軍,張永勇,等.近50年來(lái)淮河流域極端降水的時(shí)空變化及統(tǒng)計(jì)特征[J].地理學(xué)報(bào),2011,66(9):1200-1210.
[10]劉大杰,陶本藻.實(shí)用測(cè)量數(shù)據(jù)處理方法[M].北京:測(cè)繪出版社,2000:137-141.
[11]吳增祥.氣象臺(tái)站歷史沿革信息及其對(duì)觀測(cè)資料序列均一性影響的初步分析[J].應(yīng)用氣象學(xué)報(bào),2005,16(4):461-467.
責(zé)任編輯:孫蘇,李紅
施工經(jīng)驗(yàn)
地下室回填土遇水浸泡怎么辦
某在施工程,在地下室回填1.5m厚素土后,由于暴雨導(dǎo)致雨水通過(guò)地下室的窗戶(hù)進(jìn)入地下室,地下室嚴(yán)重進(jìn)水。對(duì)于土層表面的水可通過(guò)泥漿泵抽取,但是回填土內(nèi)的水處理成為一個(gè)難題。項(xiàng)目部經(jīng)過(guò)多方溝通協(xié)調(diào),制訂了如下處理措施。
1.井管降水
首先由工人開(kāi)挖集水坑降低回填土上層水位,由于底層水位較低。開(kāi)挖集水坑較困難,項(xiàng)目部決定在開(kāi)挖集水坑過(guò)程中安裝降水用井管,土層中的水通過(guò)管壁進(jìn)入到井管內(nèi),然后用水泵將井管內(nèi)水及時(shí)抽出。每個(gè)管井的降水影響半徑一般為10m左右,本工程地下室長(zhǎng)度為76m,回填土內(nèi)按10m的間距布置管井,大概需要6個(gè)管井,井管最后埋在回填土內(nèi)。
2.加設(shè)磚柱和混凝土墊層
地下室回填土進(jìn)水后需要較長(zhǎng)時(shí)間的風(fēng)干,但是由于本工程工期較緊,項(xiàng)目部決定在地下室隔墻基礎(chǔ)下的回填土內(nèi)每隔lm加設(shè)磚柱,磚柱上加設(shè)鋼筋混凝土墊層,然后再砌筑地下室隔墻。
3.埋設(shè)塑料管
地下室地面混凝土墊層施工前為保證土體內(nèi)水分的散發(fā),每個(gè)儲(chǔ)藏室留置了一個(gè)直徑5cm的塑料管,待工程竣工前去除,并抹水泥砂漿找平。
本工程經(jīng)過(guò)兩年多的使用,墻體無(wú)裂紋,墻身無(wú)返潮,最終證明本方案合理有效。(摘自:《建筑工人》)
Application of Sm irnov Testin Homogeneity Test for TemperatureData of AbnormalDistribution
Homogeneity test isan importantstep for data processing,and it ismeaningful to study itsmethods.Thehomogeneity testis the firststep to revise the climate records,and itsaccuracyw illdirectly affect the follow-upwork.The classic SNHT(Standard NormalHomogeneity Test)can only beapplied in climate sequencesof normal distribution,but in reality lotsofabnormal climate sequencesneed to be tested.In thispaper,the Sm irnov Test,generally foroverallsequencedistribution test,isintroduced to test thehomogeneity of the temperature series,which can be applied in temperature sequences of any distribution.Thehomogeneity test results from temperature sequencesin Chongqing show that the Smirnov Test isbetter than SNHT.
homogeneity;test;climate sequences;abnormal distribution;Sm irnov Test
P413
A
1671-9107(2016)08-0054-04
10.3969/j.issn.1671-9107.2016.08.054
2016-07-06
鄧鑫潔(1987-),女,湖北荊州人,研究生,講師,工程師,主要研究方向?yàn)?S數(shù)據(jù)采集與處理。