杜良敏 劉綠柳 高雅琦 肖鶯 李楊
(1 武漢區(qū)域氣候中心,武漢 430074;2 國家氣候中心,北京 100081;3 北京師范大學,北京 100875)
長江流域位于24°27’—35°54’N,90°33’—122°19’E,流域面積約180萬 km2[1],地理跨度大,地勢變化幅度大,降水變率明顯,導致了長江流域的降水特征無論是在時間上或是空間上都存在較大差異,給降水特征的研究帶來諸多不便,這對氣候預測中統(tǒng)計方法的使用提出了更高要求。
在氣候統(tǒng)計中,如回歸分析、判別分析等統(tǒng)計方法模型均要求預報對象服從正態(tài)分布[2-3]。對于不符合正態(tài)分布的站點,需要觀察其頻率直方圖,通過函數(shù)擬合來判斷其屬于何種分布類型,以便對數(shù)據(jù)進行正態(tài)化處理[4-7]。通常關注的概率分布函數(shù)有正態(tài)分布和Γ分布。徐爾灝[8]對我國月降水的理論分布進行研究檢驗,發(fā)現(xiàn)我國各地年降水量基本上服從于正態(tài)分布。丁裕國[9]從理論上證明了Γ概率分布模型在降水擬合上具有普適性,對任意時段降水量概率分布的擬合效果都較好。梁莉等[10]利用Γ分布擬合了淮河流域日降水量概率分布,吳子君等[6]的研究顯示Γ分布函數(shù)在月、季降水中有較好的適用性。這些研究表明Γ分布對降水概率分布具有較好的描述能力。
目前針對分析長江流域在月和季節(jié)尺度的上的降水在正態(tài)分布和Γ分布的對比分析較少,本文利用長江流域1951—2015年的月、季降水資料,采用這兩種分布,分析了長江流域降水量分布特征,對通過檢驗的站點開展了空間分析,這一工作對長江流域降雨分布特征分析和氣候預測具有參考意義。
本文使用國家氣象信息中心提供的1951—2015年長江流域內經(jīng)過地理信息篩選的712個氣象站的逐日降水資料。因20世紀50年代前期觀測站點較少,具體計算時以氣象站建站時間為起點,剔除缺測降水數(shù)據(jù),并將月降水數(shù)據(jù)處理成季降水數(shù)據(jù),形成了月、季節(jié)尺度的降水歷史數(shù)據(jù)序列。
1.2.1 偏度系數(shù)、峰度系數(shù)檢驗法
目前常用的正態(tài)分布檢驗方法有χ2擬合優(yōu)度檢驗、偏度系數(shù)峰度系數(shù)檢驗法。χ2檢驗法雖然是檢驗總體分布的較一般的方法,但是用它來檢驗總體的正態(tài)性時,沒有用到正態(tài)的特性,第Ⅱ類錯誤的概率往往較大[11],為此本文采用偏度系數(shù)、峰度系數(shù)檢驗法。
偏度(Skewness)和峰度(Kurtosis)是描述數(shù)據(jù)分布形態(tài)的統(tǒng)計量,偏度描述的是總體取值分布的對稱性,峰度是描述總體取值分布的陡緩程度[12]。
樣本偏度定義為:
樣本峰度定義為:
式中,n為樣本長度,m2是二階中心矩(即樣本方差),m3是三階樣本中心矩,m4是四階樣本中心矩,xi是第i個值,是樣本平均值。
若總體X為正態(tài)變量,則可證得當n充分大時,近似地有
設X1,X2,…,Xn是來自總體X的樣本,檢驗假設
記:
當取顯著性水平為α=0.05時,H0的拒絕域為
1.2.2 Kolmogorov-Smirnov 檢驗法
對于Γ分布通常使用Kolmogorov-Smirnov檢驗法,該方法是一種非參數(shù)統(tǒng)計分析的檢驗方法,簡稱為K-S檢驗法[13-14]。K-S檢驗法既可以做單樣本檢驗也可以做雙樣本檢驗。單樣本檢驗是和特定的連續(xù)概率分布函數(shù)(正態(tài)分布或者其他分布函數(shù))進行比較,而雙樣本K-S檢驗是比較兩個樣本是否來自同一個總體。雙樣本K-S檢驗是比較兩個樣本最有效的而且也是常用的非參數(shù)比較方法,其思想是,確定樣本的相關經(jīng)驗概率分布方程和累積分布方程之間的距離,或者是確定來自兩個樣本的經(jīng)驗概率分布方程之間的距離,如果兩者之間的距離很小,則可推斷樣本的概率分布和經(jīng)驗分布擬合得很好。具體步驟如下,假設H0:總體分布X來自理論分布。
K-S統(tǒng)計方程如下:
其中F1,n和F2,n'分別表示兩個樣本的經(jīng)驗概率分布方程,sup表示極大值函數(shù)(supremum function)。
原假設在顯著性水平α拒絕域為:
式中,n和n'分別代表兩個樣本的長度,當顯著性水平α取值為0.05時,通過查表得c(α)=1.36。當Dn,n'值不在拒絕域時,接受假設H0。
如果總體分布X的形式或者參數(shù)無法定義可以加入蒙特卡羅方法進行K-S檢驗。本文采用的方法是基于K-S檢驗的蒙特卡羅檢驗方法。
Γ函數(shù)為:
Γ概率密度方程如下:
式中,A,C和D分別代表形狀參數(shù)(shape),尺度參數(shù)(scale)和閾值(threshold)三個參數(shù)。將觀測的降水數(shù)據(jù)定義為n,使用最大似然法對n進行Γ參數(shù)擬合,得到三個參數(shù)A,C,D。將得到的3個參數(shù)代入式(13)生成一組大量符合Γ分布的偽隨機數(shù)n',將n,n'代入式(10)和式(11)計算出Dn,n'和拒絕域。
1.3.1 站點正態(tài)分布檢驗后處理
根據(jù)式(1)和式(2)可計算出長江流域712站的偏度和峰度值g1、g2,取信度α=0.05的閾值,再根據(jù)式(8)和式(9)來確定該站點是否通過檢驗,通過檢驗的站點用“1”標示,未通過站點用“0”標示。
1.3.2 站點Γ分布檢驗后處理
根據(jù)生成的隨機數(shù)n'和降水數(shù)據(jù)n做K-S雙樣本檢驗,取信度α=0.05的閾值,根據(jù)蒙特卡羅的思想來確定站點是否通過檢驗,通過檢驗的站點用“1”標示,未通過站點用“0”標示。
1.3.3 空間插值
通過檢驗的站點賦值為“1”,沒有通過檢驗的站點賦值為“0”。通過Kriging空間插值法得到檢驗結果的空間分布圖,圖1~圖4中陰影代表通過統(tǒng)計檢驗的區(qū)域,空白是未通過統(tǒng)計檢驗的區(qū)域。
圖1 正態(tài)分布偏度峰度檢驗空間分布Fig. 1 Map of stations passed the normality test in monthly precipitation
長江流域氣象站月降水量正態(tài)分布、Γ分布站點通過比例見表1,檢驗結果空間分布如圖1和圖2所示,通過檢驗的站點用顏色標注,沒有通過檢驗的站點用白色標注。
由表1可見,長江流域站點的月降水量歷年降水序列正態(tài)分布的假設檢驗通過率在16%~50%,均未過半數(shù),通過率最高的月份是5月,為47.8%;而長江流域通過Γ分布的假設檢驗通過率在50%以上的月份有11個,通過率最高的月份是11月,比率為75.8%;通過率最低的月份是6月,為47.5%,Γ分布的假設檢驗通過率明顯要好于正態(tài)分布的假設檢驗。
月降水通過正態(tài)檢驗的站點時空分布不均(圖1),長江中下干流區(qū)間僅在2、4和5月正態(tài)性表現(xiàn)較好,而金沙江流域在6—9月的正態(tài)性表現(xiàn)較好。同樣,月降水通過Γ檢驗的站點也表現(xiàn)出時空差異(圖2),其中兩湖流域表現(xiàn)尤為突出,兩湖流域在2—6月通過Γ檢驗的站點很少,但是在1和7—12月Γ特性表現(xiàn)較好。長江上游干流區(qū)間Γ特性一直表現(xiàn)較差。
圖3 正態(tài)分布偏度峰度檢驗空間分布Fig. 3 Map of stations passed the normality test for seasonal precipitation
表1 站點月降水量檢驗比例(單位:%)Table 1 The percentage of station number passed the distribution tests for monthly precipitation (unit∶ %)
圖1 、圖2和表1所示,在2、8、10和11月通過正態(tài)檢驗站點與通過Γ分布檢驗站點具有一定的互補特征,但在1、3和6月站點既不符合正態(tài)分布也不符合Γ分布的比例超過30%,這些站點月降水量分布函數(shù)可能更適用于其他特征。同時也有一些站點既屬于正態(tài)分布又屬于Γ分布,這可能是該站點的月降水通過極大似然法估計出的Γ分布的形狀系數(shù)較大,接近正態(tài)分布所致[15]。
取信度α=0.05的閾值,長江流域氣象站季降水量正態(tài)分布、Γ分布站點通過比例見表2,檢驗結果空間分布如圖3和圖4所示。
結合表1和表2,長江流域季降水量正態(tài)性表現(xiàn)要好于月降水的正態(tài)性,季降水量通過檢驗的站點比例平均值在59.8%,其中春季通過正態(tài)性檢驗的比例可以達到74.6%,秋季通過檢驗的比例最少為49.0%。與正態(tài)分布相比,通過Γ分布檢驗的比例略低,通過率最高季節(jié)是春季,春、夏季的表現(xiàn)好于秋、冬季。
對于月降水的分布檢驗來,大多服從Γ分布,但正態(tài)性的表現(xiàn)較差。而季降水的分布檢驗對比分析,正態(tài)表現(xiàn)與Γ特性差異較小,僅在冬季正態(tài)表現(xiàn)明顯好于Γ特性。這可能是由于月降水年代際的變化大,大量級降水和小量級降水均會出現(xiàn),更容易為偏態(tài)分布,季節(jié)降水會平滑掉季節(jié)內的變化,年代際差異會較小,正態(tài)性和偏態(tài)性均有可能。
表2 站點季降水量檢驗比例(單位:%)Table 2 The percentage of station number passed the distribution tests for seasonal precipitation (unit∶ %)
通過各個季節(jié)長江流域降水通過檢驗站點的空間分布圖得出(圖3和圖4),對于正態(tài)分布檢驗,春季長江全流域大部通過檢驗;夏、秋兩季,通過正態(tài)檢驗的站點主要位于長江中上游;而在冬季,通過正態(tài)檢驗的站點位于下游。對于Γ分布檢驗,春季長江流域大部通過檢驗,夏、冬兩季在上游流域通過檢驗比例較高,秋季通過檢驗的站點分布較為分散。
與月降水類似,季節(jié)站點降水也有一些站點既不服從正態(tài)分布也不服從Γ分布,可能更適用于其他的分布函數(shù)。同時也有一些站點既服從正態(tài)分布又服從Γ分布,同時服從兩種分布的比例要高于月降水(表1和表2)。
了解長江流域月、季降水的概率特征,可為建立科學的降水預報模型提供可靠的理論依據(jù)。本文利用長江流域712個氣象站的月、季降水資料,使用偏度、峰度和K-S檢驗法分別對其進行了正態(tài)分布檢驗與Γ分布檢驗,并對長江流域的降水量分布特征進行了空間分析。結果表明:
1)長江流域站點月降水分布大都服從Γ分布,而服從正態(tài)分布站點的比例不超過50%。通過Γ檢驗的站點表現(xiàn)出時空差異,兩湖流域表現(xiàn)尤為突出,1、7—12月Γ特性表現(xiàn)較好,但兩湖流域在2—6月通過Γ檢驗的站點很少。
2)長江流域季降水量分布特征是正態(tài)分布較好于Γ分布。春、冬季的正態(tài)性比夏、秋季表現(xiàn)要好;而對于Γ分布,春、夏季表現(xiàn)好于秋、冬季。
3)從空間分布上分析,存在著同時服從和都不服從兩種分布函數(shù)的情況,同時服從可能是通過降水分布估計出的Γ分布的形狀系數(shù)較大,接近正態(tài)分布所致,同時不服從顯示降水可能更適用于其他的分布函數(shù)。
本文對長江流域月、季降水進行了正態(tài)分布和Γ分布的服從性開展了探討,但對不同區(qū)域內不同分布特征差異的成因分析,以及其他概率分布在長江流域的適用分析等還較為欠缺,這將在今后的工作中繼續(xù)展開。
Advances in Meteorological Science and Technology2018年4期