冉超 翟宇梅 王力維
摘 要:文章利用經(jīng)驗(yàn)正交函數(shù)(EOF)和逐步線性回歸相結(jié)合的統(tǒng)計(jì)降尺度方法建立大尺度信息與長江中下游地區(qū)25個(gè)氣象站1月及7月,月平均氣溫之間的統(tǒng)計(jì)關(guān)系共計(jì)36個(gè)統(tǒng)計(jì)降尺度模型,其中聯(lián)合預(yù)報(bào)因子變量場采用空間聯(lián)合的經(jīng)驗(yàn)正交函數(shù)分解法。結(jié)果表明:(1)長江中下游地區(qū)25個(gè)站點(diǎn)建立的模型通過獨(dú)立檢驗(yàn),均取得了較好的Pc得分。(2)對(duì)于1月的模擬性能都高于7月,這可能與當(dāng)?shù)靥幱趤啛釒Ъ撅L(fēng)區(qū),夏季較冬季多雨氣溫變化較大有關(guān)。(3)分析得分較高方案發(fā)現(xiàn)海拔較高站點(diǎn)模擬效果優(yōu)勢明顯且采用聯(lián)合預(yù)報(bào)因子變量場的效果更好。
關(guān)鍵詞:統(tǒng)計(jì)降尺度;聯(lián)合EOF分解;長江中下游;短期氣溫預(yù)測
引言
雖然隨著數(shù)值預(yù)報(bào)的發(fā)展,天氣預(yù)報(bào)對(duì)氣溫已有很好的預(yù)報(bào),肖明靜等[1]對(duì)2010年6月至2011年5月WRF-RUC和T639模式預(yù)報(bào)的24h2m溫度預(yù)報(bào)產(chǎn)品進(jìn)行分析與訂正, 閾值2度的預(yù)報(bào)準(zhǔn)確率均達(dá)到80%以上,但是短期氣候預(yù)測效果依然不盡如人意。例如08年發(fā)生南方冰凍雨雪災(zāi)害,雖然天氣預(yù)報(bào)當(dāng)時(shí)已經(jīng)可以很好的預(yù)報(bào)出未來幾天的天氣變化,但是卻沒能提供良好的短期氣候預(yù)測,依舊造成非常大的影響和損失。目前,常用的短期氣候預(yù)測方法有天氣氣候?qū)W、統(tǒng)計(jì)氣候?qū)W和動(dòng)力氣候?qū)W方法。天氣氣候?qū)W和統(tǒng)計(jì)氣候?qū)W方法難以從根本上解釋氣候形成的物理機(jī)制,雖歷史擬合率可能較好,但預(yù)報(bào)準(zhǔn)確率有限且不穩(wěn)定,同樣大氣環(huán)流模式(GCMs)是進(jìn)行氣候預(yù)測最行之有效的方法之一[2-4],然而由于它的空間分辨率一般是上百公里,雖然對(duì)大尺度信息的模擬與預(yù)測是不錯(cuò)的,卻不能達(dá)到局地或區(qū)域氣候預(yù)測空間尺度的精度[5]。可以彌補(bǔ)大氣環(huán)流模式的這種不足目前有兩種方法[6],一是發(fā)展更高精度的氣候模式,另外一種即是采用降尺度方法。第一種方法計(jì)算代價(jià)巨大耗時(shí),結(jié)果卻未必理想,“性價(jià)比”不高。相形之下,降尺度可以在已有模式的基礎(chǔ)上通過動(dòng)力或者統(tǒng)計(jì)的方法來提高局地氣候預(yù)測的精度,是更可性的方法。
從90年代初變開始了統(tǒng)計(jì)降尺度的研究,這是一門較新的科學(xué),經(jīng)歷初期集中在歐洲等地的研究和應(yīng)用后,近年來國內(nèi)也開始對(duì)統(tǒng)計(jì)降尺度展開研究。無論是線性方法、非線性方法以及動(dòng)力-統(tǒng)計(jì)降尺度[7-9],很多學(xué)者都將落腳點(diǎn)放在降尺度方法本身,而對(duì)預(yù)報(bào)因子變量、預(yù)報(bào)區(qū)域選取和對(duì)不同區(qū)域的適用性問題關(guān)注較少。本文采用PCA與逐步回歸相結(jié)合的統(tǒng)計(jì)降尺度方法,通過改變初始輸入的預(yù)報(bào)因子變量區(qū)域、預(yù)報(bào)因子變量場和輸入回歸方程中主成分的個(gè)數(shù),建立了不同模型,再通過對(duì)長江中下游各臺(tái)站氣溫多個(gè)統(tǒng)計(jì)降尺度模擬結(jié)果進(jìn)行研究比對(duì),選擇最優(yōu)預(yù)報(bào)方程,從而提高該地區(qū)氣溫預(yù)測精度。值得注意的是由于統(tǒng)計(jì)降尺度多種不確定性,未來方向[10]將是不斷提高氣候模式的預(yù)測能力,將模式良好的輸出信息作為預(yù)報(bào)因子才能提高區(qū)域降尺度的發(fā)展,同時(shí)用不同的氣候模式驅(qū)動(dòng)不同的降尺度模型即超級(jí)集合以期得到更好的關(guān)于未來短期或長期等的氣候預(yù)測,同時(shí)將降尺度的方法應(yīng)用在各種復(fù)雜多樣的區(qū)域氣候下,尤其氣候累計(jì)觀測資料較少的地區(qū),可以用不同統(tǒng)計(jì)降尺度方法進(jìn)行對(duì)比試驗(yàn),來提高資料稀少地區(qū)的區(qū)域氣候預(yù)測能力。
1 資料選取
對(duì)統(tǒng)計(jì)降尺度的研究可知[11-13],在建立統(tǒng)計(jì)降尺度模型時(shí),需要觀測的預(yù)報(bào)因子變量及觀測的預(yù)報(bào)量兩種數(shù)據(jù)進(jìn)行建模,前者代表大尺度信息,后者代表區(qū)域尺度。中國地域遼闊,不同教材對(duì)各區(qū)域有不同的劃分,為了便于統(tǒng)計(jì)降尺度方法的研究與應(yīng)用,Liu Y等[14]對(duì)中國南方地區(qū)進(jìn)行重新劃分,本文在此基礎(chǔ)上,選取了長江中下游地區(qū)共計(jì)25個(gè)站點(diǎn)1961-2010年1月和7月的月平均溫度資料。圖1為長江中下游地區(qū)25個(gè)測站分布圖,圖中長江中下游地區(qū)包括湖南、湖北、江蘇、浙江、安徽五省,由圖1可以看出25個(gè)站點(diǎn)分布較均勻。由表1可知,站點(diǎn)地形海拔較為均勻,除個(gè)別站點(diǎn)外,海拔都低于100m。
預(yù)報(bào)因子來自于同時(shí)期NCEP/NCAR分辨率為2.5°*2.5°的月平均資料,包括17個(gè)等壓面(1000,925,850,700,600,500,400,300,
250,150,200,100,70,50,30,20,10(hPa))上的溫度(t),位勢高度(hPa),全風(fēng)速,u分量風(fēng)速,v分量風(fēng)速,以及垂直風(fēng)速(w)等共計(jì)102個(gè)預(yù)報(bào)因子。首先對(duì)預(yù)報(bào)因子做距平化處理,然后對(duì)預(yù)報(bào)因子進(jìn)行初選,即102個(gè)因子分別與25個(gè)站點(diǎn)做全球相關(guān)場分析,選出溫度場中相關(guān)性最好的850hPa溫度場、高度場中相關(guān)性最好500hPa位勢高度場(1月是1000hPa)和海平面氣壓場,選取了站點(diǎn)與區(qū)域?yàn)椋?10°~125°E;20°~40°N)的T850溫度場平均相關(guān)系數(shù)進(jìn)行說明(圖2)。一些研究中表明[15],在使用統(tǒng)計(jì)降尺度方法對(duì)地面溫度進(jìn)行預(yù)測時(shí),采用大尺度溫度場作為預(yù)報(bào)因子變量比大氣環(huán)流作為預(yù)報(bào)因子變量效果好,同時(shí)研究還認(rèn)為溫度因子和環(huán)流因子的聯(lián)合預(yù)報(bào)因子變量比單個(gè)變量作為預(yù)報(bào)因子變量更能得到真實(shí)的結(jié)果。所以本文采用850 hPa大尺度溫度場、500 hPa位勢高度場、海平面氣壓場與850 hPa大尺度溫度的聯(lián)合場(SLP+T850),以及500hPa高度場和850 hPa溫度的聯(lián)合場(H500+T850)作為預(yù)報(bào)因子變量場,其中1月選取的大尺度位勢高度場為1000hPa。除了預(yù)報(bào)因子變量外,其預(yù)報(bào)因子具體取值區(qū)域和代入統(tǒng)計(jì)模型的主成份(PCs)個(gè)數(shù)對(duì)統(tǒng)計(jì)降尺度的模擬結(jié)果也有很強(qiáng)的敏感性。因此本文在全球相關(guān)場分析的基礎(chǔ)上還選擇了三個(gè)預(yù)報(bào)因子變量的取值區(qū)域和三種PCs輸入個(gè)數(shù),對(duì)25站1月和7月分別建立了共計(jì)36種統(tǒng)計(jì)降尺度模型(詳見表2)。
2 方法介紹
2.1 主成份分析
在建立統(tǒng)計(jì)降尺度模型之前,首先對(duì)資料需要進(jìn)行主成份分析,來減少系統(tǒng)維數(shù),提取主要特征,主成分分析(PCA)在氣象資料分析中有著廣泛使用。
圖2 站點(diǎn)與該區(qū)域T850溫度場的平均相關(guān)系數(shù)
它目的是降低資料的自由度和維數(shù),也就是用少數(shù)幾個(gè)新變量序列反映原多個(gè)變量的變化信息[16]。為了從資料中分離出有用的大尺度信息減少計(jì)算量,需要先對(duì)NCEP再分析資料進(jìn)行主成分分析。
單個(gè)變量場(如T850)作為預(yù)報(bào)因子變量場進(jìn)行分析可以寫成如下形式: 其中其中m為格點(diǎn)數(shù),n為樣本數(shù),
代表主分量的矩陣。其中n=1為第一主分量,n=2為第二主分量,依次類推。主成分具體運(yùn)算過程可以參考文獻(xiàn)[17]。對(duì)于兩個(gè)變量的聯(lián)合場(如T850+H500)與單量場類似,需要把兩個(gè)變量場在空間上聯(lián)合為一個(gè)新變量場,需要注意的是其空間格點(diǎn)數(shù)為兩個(gè)場空間格點(diǎn)數(shù)的總和,然后進(jìn)入EOF分解步驟。因?yàn)門850和H500兩個(gè)變量場取自同區(qū)域的相同格點(diǎn),所以場其特征向量為兩者空間格點(diǎn)數(shù)總和,而繪制EOFs空間模態(tài)時(shí)應(yīng)該把兩個(gè)變量繪于相同網(wǎng)格上,以便考察兩個(gè)變量在空間上的耦合情況,同樣的聯(lián)合EOF分解得到的PCs代表了聯(lián)合場隨時(shí)間變化的共同特征。以1月,預(yù)報(bào)因子變量為T850+SLP和T850+H1000,取值區(qū)域?yàn)椋?10°~125°E;20°~40°N)來對(duì)比說明單變量預(yù)報(bào)因子場和雙預(yù)報(bào)因子聯(lián)合場的EOF分解結(jié)果。如果是單個(gè)溫度場T850分解的第一EOF模態(tài)只能表示溫度場的變化趨勢。圖3a表示了聯(lián)合場T850+SLP的EOF分解結(jié)果,其中包含了兩種等值線,實(shí)線代表SLP的等值線,虛線代表T850的等值線,兩者繪于同區(qū)域,可以看出氣候變量空間模態(tài)的耦合特征,第一EOF反應(yīng)了與單因子T850類似的溫度變化模態(tài),同時(shí)還伴隨海平面氣壓的增加(減少)變化趨勢,所以表征了溫度和海平面氣壓之間的物理聯(lián)系,同理,圖3b也同時(shí)反映了該場溫度變化,及其隨位勢高度的增加(減少),表征了溫度和位勢高度場之間的物理聯(lián)系,使得預(yù)報(bào)因子物理意義更加明顯。
2.2 逐步回歸
在建立多元線性回歸模型時(shí),有時(shí)自變量會(huì)非常多。逐步回歸可以按照一定的顯著性條件選出重要因素達(dá)到既能減少自變量個(gè)數(shù),又能保證回歸效果的目的。其主要的分析思路為:首先對(duì)多元線性回歸進(jìn)行因子篩選;最后給出在一定顯著性水平下,各因子均為顯著回歸方程中的回歸系數(shù)。以公式 說明,其中以
代表1月份,第n站的氣溫序列, 代表k個(gè)主分量組成的矩陣,因?yàn)榇虢y(tǒng)計(jì)模型的主成份(PCs)個(gè)數(shù)對(duì)統(tǒng)計(jì)降尺度的模擬結(jié)果一定影響,所以本文分別選取了k為10、15、20來進(jìn)行建模。 為多元線形回歸模型的系數(shù),?著為殘差部分,是不能被多元回歸方程解釋的部分。對(duì)k個(gè)主分量利用逐步回歸方法,進(jìn)行逐步篩選,得到對(duì)氣溫統(tǒng)計(jì)模式顯著的主分量。篩選得到的通過顯著性檢驗(yàn)(本文取α=0.25)的PC主分量,再建立多元線形模型,估計(jì)出多元線形回歸的系數(shù)。在本文中由于受資料時(shí)間長短的限制,對(duì)長江中下游地區(qū)1月及7月份氣溫使用前40年(1961-2000年)的資料建模,而后10年(2001-2010年)的資料進(jìn)行模型獨(dú)立檢驗(yàn),采用距平符號(hào)一致率Pc來進(jìn)行評(píng)分。
3 統(tǒng)計(jì)降尺度模式的評(píng)估
圖4顯示了1月及7月36個(gè)預(yù)報(bào)因子變量選擇方案的獨(dú)立檢驗(yàn)符號(hào)一致率Pc的平均得分分布圖。分析圖4可以看出,相對(duì)與7月,1月的各方案模擬效果更優(yōu),直觀上說明冬季氣溫可預(yù)報(bào)性更高。同時(shí)可以看出預(yù)報(bào)因子變量及其區(qū)域的選擇,以及輸入的PCs個(gè)數(shù)對(duì)模擬的效果有著明顯影響。輸入的PCs上來說,平均得分較高的是選擇10個(gè)PCs作為輸入,其模擬結(jié)果優(yōu)于較大的輸入個(gè)數(shù)。而從預(yù)報(bào)變量取值區(qū)域上看較小的區(qū)域3結(jié)果優(yōu)于其它區(qū)域,這與預(yù)報(bào)因子初選有著密切關(guān)系,在建立模型前進(jìn)行了大尺度資料102個(gè)因子全球相關(guān)場的對(duì)比,從實(shí)驗(yàn)的結(jié)果證明相關(guān)性越高的區(qū)域最終模型得分也較高,進(jìn)一步說明不同區(qū)域預(yù)報(bào)因子的適用性不同,預(yù)報(bào)因子區(qū)域的確定也為進(jìn)一步研究長江中下游地區(qū)氣候變量打下了基礎(chǔ)。
預(yù)報(bào)因子實(shí)驗(yàn)方案還考慮了預(yù)報(bào)因子的物理意義所以選用了雙因子和單因子進(jìn)行比較,以區(qū)域3和輸入10個(gè)PCs為例,發(fā)現(xiàn)同樣對(duì)于1月或是7月,T850+SLP和T850+H1000優(yōu)于單因子T850、H1000的模擬性能說明聯(lián)合場的預(yù)報(bào)因子考慮了兩個(gè)場的物理意義其適用價(jià)值高于單預(yù)報(bào)因子場??傮w上看36個(gè)預(yù)報(bào)因子變量方案Pc得分都高于0.5,然后從圖4的曲線變化可以明顯看到36個(gè)預(yù)報(bào)因子變量方案平均得分變化較大,存在差異性,進(jìn)一步證明,預(yù)報(bào)因子變量的選擇對(duì)統(tǒng)計(jì)降尺度模型的直接影響及對(duì)結(jié)果的敏感性。
圖5是25個(gè)測站的36個(gè)預(yù)報(bào)因子變量方案符號(hào)一致率得分的箱線圖,x軸是預(yù)報(bào)因子變量方案,y軸是Pc得分,由圖5a,1月的Pc得分可以看出箱體的中位數(shù)位置基本較高,中心趨勢除個(gè)別站點(diǎn)外均高于0.6,而4、12和25號(hào)站點(diǎn)模擬性能較集中且分散程度也較小,其中最高得分0.9也出現(xiàn)在4號(hào)和25號(hào)站,說明這些站點(diǎn)對(duì)統(tǒng)計(jì)降尺度結(jié)果都有較好的模擬性能,這和其海拔較高有一定關(guān)系??傮w上看各站點(diǎn)地理位置基本分布較集中,長江中下游地區(qū)屬于亞熱帶季風(fēng)氣候,干濕兩季較明顯,所以冬季氣溫變化溫和,預(yù)報(bào)因子變量模擬方案較夏季更好,分散程度也較小。由圖5b,7月的箱線圖分布可以看出其中位數(shù)波動(dòng)隨站點(diǎn)變化較大,預(yù)報(bào)因子變量方案Pc得分差異也較大,這和預(yù)報(bào)因子取值區(qū)域和輸入的PC個(gè)數(shù)有關(guān),而站點(diǎn)12和25號(hào)站中位數(shù)依舊較高,模擬性能較集中,進(jìn)一步說明海拔較高的站點(diǎn)對(duì)統(tǒng)計(jì)降尺度結(jié)果模擬性能更好。雖然7月份與1月份模擬結(jié)果相比Pc得分存在一定差異,但總體上看25個(gè)站點(diǎn)幾乎都有得分為0.8左右的預(yù)報(bào)方案并且所有范圍均超過0.5,這對(duì)進(jìn)一步研究長江中下游地區(qū)統(tǒng)計(jì)降尺度方法適用性提供了前提基礎(chǔ)。
圖5 1月(a)和7月(b)36個(gè)預(yù)報(bào)因子變量模擬的25個(gè)
臺(tái)站氣溫的統(tǒng)計(jì)降尺度獨(dú)立檢驗(yàn)Pc得分箱線圖分布
4 結(jié)束語
(1)首次較詳盡的對(duì)長江中下游地區(qū)各站點(diǎn)的氣溫觀測資料和NCEP再分析資料的T850、H1000、T850+H1000和T850+SLP(7月為H500)建立的36種統(tǒng)計(jì)降尺度模型,通過獨(dú)立檢驗(yàn)Pc得分可以看出,1月的模型得分均高于7月,并且無論1月或是7月,都有得分0.8左右的預(yù)報(bào)方案,并且36個(gè)預(yù)報(bào)變量方案模擬結(jié)果Pc得分均超過了0.5,這為進(jìn)一步研究該區(qū)域統(tǒng)計(jì)降尺度方法提供了參考性和前提保障。
(2)對(duì)25個(gè)站點(diǎn)36種預(yù)報(bào)因子變量方案,篩選出Pc得分較高的預(yù)報(bào)方案進(jìn)一步分析發(fā)現(xiàn)對(duì)于EOF與逐步回歸相結(jié)合的統(tǒng)計(jì)降尺度方法,PC輸入個(gè)數(shù)為10,預(yù)報(bào)因子取值區(qū)域較小的區(qū)域3模擬的平均得分最高,而對(duì)于聯(lián)合的預(yù)報(bào)因子變量其模擬性能比單個(gè)預(yù)報(bào)因子變量模擬性能更佳,說明物理意義更明確的預(yù)報(bào)因子選擇價(jià)值更大,同時(shí)無論1月還是7月較高得分方案均集中出現(xiàn)在海拔較高的站點(diǎn),說明海拔較高的站點(diǎn)對(duì)統(tǒng)計(jì)降尺度模擬性能更好。
(3)通過25個(gè)站點(diǎn)多個(gè)統(tǒng)計(jì)降尺度模型的箱線圖分布可以看出,1月中位數(shù)位置較高分散程度也比7月份小,這跟長江中下游地區(qū)的氣候特點(diǎn)可能有關(guān)。同時(shí)分析7月各站點(diǎn)Pc得分分散程度可以看出建模時(shí)輸入PC的個(gè)數(shù)、預(yù)報(bào)因子區(qū)域的選擇對(duì)模擬性能有很大影響,進(jìn)一步說明預(yù)報(bào)因子變量方案的選擇對(duì)統(tǒng)計(jì)降尺度模型建立的重要性,不同區(qū)域要具體分析。
參考文獻(xiàn)
[1]肖明靜,隋明,范蘇丹,等. 三種數(shù)值模式溫度預(yù)報(bào)產(chǎn)品在山東應(yīng)用的誤差分析與訂正[J].干旱氣象,2012,30(3): 472-477.
[2]Schlesinger M E, Mitchell J F B. Climate model simulations of the equilibrium climatic response to increased carbon dioxide[J]. Reviews of Geophysics, 1987,25(4): 760-798.
[3]Stouffer R J,Manabe S, Bryan K. Interhemispheric asymmetry in climate response to a gradual increase of atmospheric CO 2[J]. Nature,1989,342(6250): 660-662.
[4]Mearn L O,Bogardi I, Giorgi F,et.al. Comparison of climate change scenarios generated froom regional climate model experiments and statistical downscaling. JournalGeophysicsResearch1999,104(D6):6603-6621.
[5]Cubasch U, Von Storch H, Waszkewitz J, et al. Estimates of climate change in Southern Europe derived from dynamical climate model output[J]. Climate Research, 1996, 7(2): 129-149.
[6]范麗軍,符淙斌,陳德亮. 統(tǒng)計(jì)降尺度法對(duì)未來區(qū)域氣候變化情景預(yù)估的研究進(jìn)展[J]. 地球科學(xué)進(jìn)展,2005,20(3): 320-329.
[7]柯宗建,張培群,董文杰,等. 最優(yōu)子集回歸方法在季節(jié)氣候預(yù)測中的應(yīng)用[J].大氣科學(xué),2009, 33(5): 994-1002.
[8]何慧,金龍,覃志年. 基于 BP 神經(jīng)網(wǎng)絡(luò)模型的廣西月降水量降尺度預(yù)報(bào)[J].熱帶氣象學(xué)報(bào),2007, 23(1): 72-77.
[9]嚴(yán)小冬, 吳戰(zhàn)平, 馬振鋒, 等. Downscaling 法在貴州冬季氣溫和降水預(yù)測中的應(yīng)用[J]. 高原氣象,2008,27(1): 169-175.
[10]任麗娜,翟宇梅,王力維. 多模式集合在統(tǒng)計(jì)降尺度應(yīng)用上的研究進(jìn)展[J].科學(xué)技術(shù)與工程,2011,11(29): 7185-7194,7201.
[11]趙芳芳,徐宗學(xué). 黃河源區(qū)未來地面氣溫變化的統(tǒng)計(jì)降尺度分析[J].高原氣象,2008,27(1): 153-161.
[12]曾曉青,王式功,劉還珠,等. 統(tǒng)計(jì)降尺度方法在青海省冬季最低溫度預(yù)測中的應(yīng)用[J].高原氣象, 2009,28(6): 1471-1477.
[13]陳麗娟,李維京,張培群,等. 降尺度技術(shù)在月降水預(yù)報(bào)中的應(yīng)用[J]. 應(yīng)用氣象學(xué)報(bào),2003,14(6): 648-655.
[14]Liu Ying, Fan Ke, WANG Hui-Jun. Statistical Downscaling Prediction of Summer Precipitation in Southeastern China[J]. Atmospheric and Oceanic Science Letters, 2011,4(3): 173-180.
[15] Huth R. Statistical downscaling of daily temperature in central Europe[J]. Journal of Climate, 2002, 15(13): 1731-1742.
[16]吳洪寶,吳蕾.氣候變率診斷和預(yù)測方法[M].北京:氣象出版社,2005: 33-34.
[17]施能.氣象統(tǒng)計(jì)預(yù)報(bào)[M].北京:氣象出版社,2009:91-96.
作者簡介:冉超(1989-),男, 四川成都, 研究生在讀, 研究方向:短期氣候預(yù)測。