黎玥君 郭品文
摘要利用NCEP提供的全球空間分辨率為2.5°×2.5°、2007-2012年6-8月日平均500 hPa高度場再分析格點(diǎn)資料和浙北地區(qū)158個(gè)站點(diǎn)觀測資料,研究了不同大氣環(huán)流型下局地降水與大尺度降水場之間的關(guān)系,以4種不同環(huán)流型下的預(yù)報(bào)對象和預(yù)報(bào)因子分別采用BP神經(jīng)網(wǎng)絡(luò)方法對觀測資料進(jìn)行逼近,得到4種空間降尺度的預(yù)報(bào)模型,分析對比4種預(yù)報(bào)模型158站逐日的降水量的預(yù)報(bào)。結(jié)果表明:神經(jīng)網(wǎng)絡(luò)模型的隱層節(jié)點(diǎn)數(shù)為2時(shí),對降水的擬合效果最好;對降水的極值擬合效果中,環(huán)流分型中NW型和c型的效果優(yōu)于SW型和SE型;從4種分型下的誤差空間分布來看,浙北地區(qū)沿海的寧波、舟山一帶的誤差小于浙北其他區(qū)域;把雨量分等級后進(jìn)行預(yù)測,發(fā)現(xiàn)模型對暴雨的預(yù)測能力最好。
關(guān)鍵詞降水預(yù)報(bào);降尺度;BP神經(jīng)網(wǎng)絡(luò);大氣環(huán)流分型
降水預(yù)測一直是天氣預(yù)測的重點(diǎn)和難點(diǎn),也是政府防汛抗旱工作部署的重要參考依據(jù)(黃惠镕和郭品文,2014)。降尺度預(yù)報(bào)即是利用大尺度的數(shù)值預(yù)報(bào)產(chǎn)品生成精細(xì)化高分辨率的要素預(yù)報(bào)場,降尺度方法是精細(xì)化氣象要素預(yù)報(bào)的主要方法,主要有嵌套高分辨率數(shù)值模式的動(dòng)力降尺度技術(shù)和基于現(xiàn)有大尺度數(shù)值產(chǎn)品的統(tǒng)計(jì)降尺度技術(shù)(劉永和等,2011),多年研究表明,統(tǒng)計(jì)降尺度法是一種有效的降尺度方法,其核心就是通過大量的歷史觀測資料建立大尺度氣象要素場與高分辨率氣象要素場之間的關(guān)系(Wilby,1999)。統(tǒng)計(jì)降尺度有以下優(yōu)點(diǎn):能夠以很高的計(jì)算效率由大尺度氣象要素得到區(qū)域尺度的氣象要素,計(jì)算量相當(dāng)小,節(jié)省機(jī)時(shí)(Charles et al.,1999);能輸出較高分辨率或站點(diǎn)尺度的氣象要素;模型參數(shù)可以受區(qū)域下墊面特征的控制(矯梅燕等,2006)。統(tǒng)計(jì)降尺度能夠彌補(bǔ)動(dòng)力降尺度的一些不足,因而近年來許多氣象工作者對統(tǒng)計(jì)降尺度技術(shù)進(jìn)行了研究和探索。統(tǒng)計(jì)降尺度中應(yīng)用最多的是多元線性回歸(智協(xié)飛等,2013)、SVD線性轉(zhuǎn)換法(Oshima et al.,2002;范麗軍等,2007)和人工神經(jīng)網(wǎng)絡(luò)法(Anandhi et al.,2009)。因此本文研究面向鄉(xiāng)鎮(zhèn)級別站點(diǎn)的非線性日降水降尺度方法,實(shí)現(xiàn)具有地方特色的空間降尺度的業(yè)務(wù)需求。
降水的分布以及降水的強(qiáng)度變化受風(fēng)向和天氣系統(tǒng)的影響很大,并且神經(jīng)網(wǎng)絡(luò)方法不具備挑選預(yù)報(bào)因子的功能,因此對初選預(yù)報(bào)因子進(jìn)行分類在降水預(yù)報(bào)研究中顯得尤為重要。實(shí)踐經(jīng)驗(yàn)告訴我們,夏季6-8月副熱帶高壓位置和強(qiáng)度變化對降水的區(qū)域分布和強(qiáng)度都會(huì)影響,其次,西風(fēng)帶環(huán)流型也很重要(朱乾根等,2007)。這些主觀分型都是以天氣學(xué)理論指導(dǎo),隨著科學(xué)技術(shù)現(xiàn)代化,分類越來越客觀化,對于汛期降水的預(yù)測,結(jié)合環(huán)流指數(shù)的統(tǒng)計(jì)和環(huán)流分型的應(yīng)用是客觀分型的基礎(chǔ)和途徑,環(huán)流指數(shù)通過全球環(huán)流的特征指標(biāo)或格點(diǎn)場資料得到(賈麗偉等,2006)。Lamb-Jenkinson大氣環(huán)流分型方法(張炎和朱靜靜,2009)基于所在區(qū)域的格點(diǎn)場資料,它通過定義一些客觀的標(biāo)準(zhǔn)把主觀的分型方法客觀化,可以自動(dòng)地劃分出環(huán)流類型,客服主觀分型的缺點(diǎn)。實(shí)踐表明:分型結(jié)果的天氣意義明確,依據(jù)NCEP提供的全球2.5°×2.5°、2007-2012年6-8月日平均500 hPa高度場再分析格點(diǎn)資料,在客觀分析的基礎(chǔ)上,逐日鑒別定型,做降水天氣預(yù)報(bào)方法是可行的。
1資料和方法
使用2007-2012年浙江省氣象臺整理的19個(gè)縣市站的夏季6-8月的逐日降水資料,以及同期的129個(gè)中尺度氣象站逐日降水資料(站點(diǎn)分布如圖1所示)和NCEP提供的全球2.5°×2.5°的2007-2012年6-8月日平均500 hPa高度場再分析格點(diǎn)資料。
1.1降水分型:Lamb-Jenkinson大氣環(huán)流分型方法
以浙北地區(qū)為例,杭州位于120.10°E、30.14°N,地處中國東部,浙江省的北部,以(120°E,30°N)為中心點(diǎn),在(112.5~127.5°E,25~35°N)的范圍內(nèi),每隔5個(gè)經(jīng)度、2.5個(gè)緯度的網(wǎng)格點(diǎn)上取16個(gè)點(diǎn)(圖2),用該范圍內(nèi)16個(gè)格點(diǎn)資料計(jì)算格點(diǎn)(120°E,30°N)的環(huán)流指數(shù),并利用環(huán)流指數(shù)的計(jì)算結(jié)果進(jìn)行環(huán)流分型。格點(diǎn)(120°E,30°N)的計(jì)算結(jié)果代表了周邊±1.25°經(jīng)緯度范圍的環(huán)流狀況,該區(qū)域涵蓋了浙中北范圍,在下面的降尺度應(yīng)用中以杭州站為例。
環(huán)流分型的方法和計(jì)算公式詳見文獻(xiàn)張炎和朱靜靜(2009)。大氣環(huán)流分型方法劃分出4類主要的環(huán)流類型,分別為平直氣流型、旋轉(zhuǎn)型、混合型和無定義型,4類又可以細(xì)分為27種不同的環(huán)流類型
對2007-2011年6-8月共460 d的逐日環(huán)流指數(shù)進(jìn)行計(jì)算,并按上述方法分型。結(jié)果顯示有5種環(huán)流沒有出現(xiàn),10次環(huán)流出現(xiàn)的頻次在10次以下;其中NW(8.48%)、SE(15.87%)、SW(29.57%)、c(15.43%)4種環(huán)流類型出現(xiàn)的頻率最高,一共占到了69.35%,這4種環(huán)流類型主導(dǎo)了浙北地區(qū)夏季的天氣(圖3)。
1.2 EOF方法
本文用于建立預(yù)報(bào)模型的因子都是通過與預(yù)報(bào)量作相關(guān)分析取得的,而采用EOF展開的主成分不僅包含了原始降水場的大量信息,同時(shí)使降水場隨時(shí)間變化的信息都集中反映在時(shí)間系數(shù)的變化上,而且相互正交,這樣起到了降維的作用,縮小了神經(jīng)網(wǎng)絡(luò)規(guī)模,避免網(wǎng)絡(luò)過度學(xué)習(xí)。EOF的方法詳見文獻(xiàn)何慧等(2007)。
1.3人工神經(jīng)網(wǎng)絡(luò)方法
人工神經(jīng)網(wǎng)絡(luò)以其具有自學(xué)習(xí)、自組織、較好的容錯(cuò)性和優(yōu)良的非線性逼近能力為特點(diǎn)而被廣泛應(yīng)用。在實(shí)際應(yīng)用中,80%~90%的人工神經(jīng)網(wǎng)絡(luò)模型是采用誤差反傳算法(BP神經(jīng)網(wǎng)絡(luò))。它是利用輸出后的誤差來估計(jì)輸出層的直接前導(dǎo)層的誤差,再用這個(gè)誤差估計(jì)更前一層的誤差,如此一層一層的反傳下去,就獲得了所有其他各層的誤差估計(jì)(金龍,2005)。本文使用的是算法較成熟的前饋三層BP網(wǎng)絡(luò)模型。有關(guān)3層前饋網(wǎng)絡(luò)模型的算法詳見金龍等(2003)。
2預(yù)報(bào)量和預(yù)報(bào)因子分析
2.1預(yù)報(bào)量和預(yù)報(bào)因子的分組
以浙江2007-2012年6-8月共552 d小尺度降水場的時(shí)間系數(shù)為預(yù)報(bào)量,其中前5 a的460 d為訓(xùn)練樣本,2012年的92 d為檢驗(yàn)樣本。取與預(yù)報(bào)量通過相關(guān)性檢驗(yàn)的同期大尺度降水場的時(shí)間系數(shù)作為預(yù)報(bào)因子,建立BP神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型。利用大氣環(huán)流分析方法把初選預(yù)報(bào)量和初選預(yù)報(bào)因子分為4組,4組的訓(xùn)練樣本長度分別是SE型共40 d,NW型58 d,C型73 d,SW型193 d。
2.2預(yù)報(bào)因子的選取
由于人工神經(jīng)網(wǎng)絡(luò)不能自動(dòng)地篩選預(yù)報(bào)因子,大量的預(yù)報(bào)因子會(huì)降低模型的預(yù)報(bào)能力,因而在進(jìn)行建模前,先要對每組預(yù)報(bào)因子和預(yù)報(bào)量分別進(jìn)行EOF分解。初選預(yù)報(bào)對象(小尺度降水場)中選取累計(jì)方差貢獻(xiàn)大于90%的時(shí)間函數(shù)作為預(yù)報(bào)對象,SE型預(yù)報(bào)對象有25個(gè),NW型預(yù)報(bào)對象有35個(gè),c型預(yù)報(bào)對象有42個(gè),SW型預(yù)報(bào)對象有48個(gè)。分別選取與各個(gè)預(yù)報(bào)對象相關(guān)度高(通過a=0.10的顯著性檢驗(yàn))且方差貢獻(xiàn)大的所有初選預(yù)報(bào)因子的時(shí)間函數(shù)(預(yù)報(bào)因子)用于預(yù)報(bào)建模(表略)。
3預(yù)報(bào)模型分析
3.1預(yù)報(bào)模型的建立
本文使用的是前饋三層BP網(wǎng)絡(luò)模型,使用newff函數(shù)生成一個(gè)三層的BP網(wǎng)絡(luò)模型時(shí),采用tansing作為前兩層的傳遞函數(shù),輸出層含有1個(gè)神經(jīng)元,采用purelin傳遞函數(shù),并將初始權(quán)值隨機(jī)化;同時(shí),以結(jié)合了動(dòng)量梯度下降算法和自適應(yīng)學(xué)習(xí)速率梯度下降算法的~aingdx函數(shù)作為訓(xùn)練函數(shù),其中學(xué)習(xí)速率為0.9,動(dòng)量常數(shù)m。為0.5。
3.2預(yù)報(bào)模型中隱層節(jié)點(diǎn)數(shù)的確定
合理的網(wǎng)絡(luò)模型是必須在具有合理隱層節(jié)點(diǎn)數(shù)、訓(xùn)練時(shí)沒有發(fā)生“過擬合”現(xiàn)象、求得全局極小點(diǎn)和同時(shí)考慮網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜程度和誤差大小的綜合過程。因此隱層節(jié)點(diǎn)數(shù)的確定對模型的建立具有重要的影響。隱層單元數(shù)的選取見Mirchandani andGao(1989)。
本文a分別取1~6,4組的學(xué)習(xí)矩陣樣本長度為40、58、73、193,對網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練。當(dāng)學(xué)習(xí)矩陣訓(xùn)練次數(shù)達(dá)到一定時(shí),誤差函數(shù)趨于穩(wěn)定,此時(shí)網(wǎng)絡(luò)模型的各個(gè)參數(shù)確定,并且取均方根誤差最小時(shí)對應(yīng)的a的值(表1)。
對4組預(yù)報(bào)量的分析,不同隱節(jié)點(diǎn)數(shù),3種指標(biāo)結(jié)果都不一樣,結(jié)果如下(表2)。
由表2可以看到,SE型和SW型中,當(dāng)a=2時(shí),平均絕對誤差(MAE)和均方根誤差(MSE)最小,而NW型和c型中,當(dāng)a=5時(shí),誤差值最小,擬合效果最好。
3.3預(yù)報(bào)模型的擬合結(jié)果和預(yù)報(bào)模型的檢驗(yàn)
圖4給出了各類型以小尺度累計(jì)方差貢獻(xiàn)大于90%的時(shí)間函數(shù)(預(yù)報(bào)量)和與預(yù)報(bào)量相關(guān)高的大尺度的時(shí)間函數(shù)(預(yù)報(bào)因子)作為輸出量和輸入量的BP神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型的擬合結(jié)果,對浙北地區(qū)2007-2011年夏季各類型小尺度降水量的時(shí)間函數(shù)的擬合效果(預(yù)測值),以及同期的各類型小尺度的時(shí)間函數(shù)(真實(shí)值),由圖4可以看到,BP神經(jīng)網(wǎng)絡(luò)模型對歷史樣本有較高的擬合精度,在NW型和c型中,對極大值的擬合精度較高,而在SE型和SW型中,對極大值的擬合沒有NW型和C型精度高。
評價(jià)一個(gè)預(yù)測模型的優(yōu)劣分析其擬合效果是一個(gè)方面,更重要的是檢驗(yàn)?zāi)P皖A(yù)報(bào)能力。因此利用2012年6-8月的夏季降水作為檢驗(yàn)樣本,在選擇預(yù)測因子時(shí),因?yàn)镾W型的樣本長度和NW型的樣本長度最多,分別為23 d和16 d,其余類型的樣本長度都不超過10 d,所以本文只分析SW型和NW型的模型檢驗(yàn)?zāi)芰?。從圖5中可以看到,SW型和NW型的時(shí)間系數(shù)預(yù)測和實(shí)況都比較接近,總體趨勢較好,其中SW型對極大值的預(yù)測效果比NW型的精度更高。
4預(yù)報(bào)效果評價(jià)
為了進(jìn)行客觀定量分析,采用以下3種統(tǒng)計(jì)評價(jià)指標(biāo)進(jìn)行分析(何慧等,2007):
4.1平均絕對誤差(MAE指數(shù))的分布
不同的a值(不同的隱層節(jié)點(diǎn)數(shù))誤差也會(huì)不一樣,每個(gè)類型分別取使得誤差值最小的a值,構(gòu)建網(wǎng)絡(luò)模型,得到最佳的擬合時(shí)間系數(shù)。把各類型最佳的時(shí)間擬合系數(shù)乘以各自的空間函數(shù),就可以還原得到擬合的降水量。為了評價(jià)擬合效果,用降水量的實(shí)測值和降尺度模型的預(yù)報(bào)值之間的差值(MAE指數(shù))作為評價(jià)標(biāo)準(zhǔn)。分析4種類型下各自的神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型的MAE(絕對誤差)空間分布(圖6),可以看出,降尺度預(yù)報(bào)模型的誤差值均在2-10mm之間,4種類型中,SW型的預(yù)報(bào)效果最好(MAE指數(shù)最?。?。SE型和NW型呈相反的趨勢,SE型中,MAE的極大值去位于浙江與安徽的交界處,極小值位于浙北和浙中的交界處會(huì)稽山附件,NW型中MAE的極大值和極小值分布于SW型恰好相反。說明SW型的邊界預(yù)報(bào)效果差于內(nèi)部預(yù)報(bào)效果,NW型中西南部的預(yù)報(bào)效果差于東北部。由圖6可以看出,在浙北這些區(qū)域中,靠近沿海的東部,即寧波、余姚、紹興這些地方的MAE指數(shù)都是最小的,說明浙北沿海地區(qū)的擬合效果比較好。
4.2相對偏差(MRD指數(shù))的分布
由MAE指數(shù)的空間分布,可以看出有些地區(qū)的MAE指數(shù)很大,甚至?xí)咏麄€(gè)浙北地區(qū)的降水均值,難道是模型預(yù)報(bào)效果差?整個(gè)浙北地區(qū)中,有些臺站,平均降水量就很小,MAE指數(shù)自然不會(huì)大,而有些臺站,受地形或者天氣系統(tǒng)的影響,降水多屬于大到暴雨,MAE指數(shù)都比較大,所以僅僅用MAE指數(shù)可能不是很客觀,于是,定義MRD指數(shù)(即相對偏差),通過相對偏差來看預(yù)報(bào)模型的效果,如果這個(gè)指數(shù)越大,說明絕對誤差(MAE指數(shù))相對降水均值越明顯即預(yù)報(bào)效果越差,反之。
由各個(gè)類型的MRD指數(shù)的空間分布(圖7)可以看出,c型的MRD指數(shù)普遍是最小的,MRD指數(shù)在15%左右的覆蓋面最廣,且最大值都不超過42%,即預(yù)報(bào)效果最好,這與MAE指數(shù)的預(yù)報(bào)效果不相符SW型的預(yù)報(bào)效果最差,MRD指數(shù)普遍都在28%以上,MRD指數(shù)在37.22%以上的覆蓋面也很廣。
4.3雨量分等級的誤差分析
為了進(jìn)一步研究浙北地區(qū)夏季降水預(yù)測方法的能力,將浙北地區(qū)4個(gè)類型的夏季降水分等級進(jìn)行預(yù)測,將雨量分為3個(gè)等級(金龍等,2003):小雨(0.1~10 mm/(24 h))、中雨(10-25mm/(24 h))、大到暴雨(25~100 mm/(24 h))。可以看出,不同的雨量大小,模型的預(yù)測能力也不一樣,依然用相對偏差作為預(yù)測指標(biāo)來評價(jià)模型的預(yù)報(bào)能力。由圖8可以看出,4種類型雨量分等級后,都是暴雨的MRD指數(shù)(相對偏差)最小,小雨的MRD指數(shù)最大,因此可以認(rèn)為,BP神經(jīng)網(wǎng)絡(luò)的降尺度預(yù)報(bào)模型對大暴雨的預(yù)報(bào)效果比較好。
5結(jié)論
在天氣分型的基礎(chǔ)上,利用BP神經(jīng)網(wǎng)絡(luò)的降尺度方法建立了夏季分型降水預(yù)測模型。利用NCEP再分析資料和站點(diǎn)降水資料,通過計(jì)算相關(guān)系數(shù)(小尺度降水場的時(shí)間系數(shù)分別與大尺度降水場的時(shí)間系數(shù)求相關(guān),取通過a=0.10的顯著性檢驗(yàn)的大尺度的時(shí)間系數(shù)作為預(yù)報(bào)因子)的方法,得到了BP網(wǎng)絡(luò)模型的輸入層和輸出層,進(jìn)行訓(xùn)練后,結(jié)果表明:
1)使用Lamb-Jenkinson法對浙北地區(qū)進(jìn)行環(huán)流分型,環(huán)流分型的結(jié)果有明確的物理意義,有利于挑選出相應(yīng)的預(yù)報(bào)因子和預(yù)報(bào)對象,提高降尺度模型預(yù)報(bào)的準(zhǔn)確率。
2)夏季大小尺度降水場分別采用EOF分解,主成分不僅包含原始大、小尺度降水場的大部分信息,同時(shí)各主成分之間相互正交,有效地對初選因子進(jìn)行降維。選取小尺度降水場中方差貢獻(xiàn)超過90%的主成分作為預(yù)報(bào)對象,相關(guān)系數(shù)達(dá)到0.10信度的顯著性水平檢驗(yàn)后的大尺度降水場的主成分作為預(yù)報(bào)因子,這樣挑選的預(yù)報(bào)因子有利于提高預(yù)報(bào)的準(zhǔn)確率。
3)基于BP神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行降尺度預(yù)報(bào),模式中不同的隱層節(jié)點(diǎn)數(shù)影響模式的預(yù)測能力,選取使得預(yù)測效果最佳的隱層節(jié)點(diǎn)數(shù)2,擬合得到浙北地區(qū)的降水值。
4)為了清楚的看到預(yù)測效果,提高夏季降水預(yù)測的技巧,在挑選降水預(yù)測因子時(shí),把雨量分等級劃分,再進(jìn)行降尺度預(yù)報(bào),通過MRD指數(shù)(相對偏差)可以看出,BP神經(jīng)網(wǎng)絡(luò)模型對暴雨的預(yù)報(bào)能力是最高的。