何澤鋒,薛宇峰,張宇,龍景超,張樹欽,鄭福濤,魏曉鈺,鄭美盈,田霖
(廣東海洋大學(xué)海洋與氣象學(xué)院,廣東湛江 524088)
相似集合法(Analogue Ensemble,AnEn)是結(jié)合相似理論、氣象觀測資料與模式資料,對氣象資料或數(shù)值預(yù)報產(chǎn)品進行分析、解釋和誤差修正的一種統(tǒng)計釋用方法[1],應(yīng)用于相同地點、相同起報時刻、相同預(yù)報時效的模式訂正。相似集合法采用了大數(shù)據(jù)的統(tǒng)計分析與預(yù)報集合思路,在模式訂正方面具有較為穩(wěn)定的特點[2-4],也是目前較為新穎的一種訂正釋用技術(shù)[5-6]。在全球氣候變暖的背景下,極端天氣事件頻發(fā)導(dǎo)致的氣象災(zāi)害以及引發(fā)的次生災(zāi)害發(fā)生發(fā)展趨于嚴重[7],更加突顯了模式后處理的可靠、高效和準確在預(yù)報業(yè)務(wù)中絕對的重要性[8-9]?;浳鞯貐^(qū)三面環(huán)海,丘陵區(qū)域地形條件復(fù)雜,又恰好處在南亞季風(fēng)與東亞季風(fēng)交匯之地,風(fēng)速風(fēng)向復(fù)雜多變,預(yù)報難度極大;同時,由于探測、同化等多方面存在的不足,數(shù)值預(yù)報誤差較大[10-11],尤其對沿岸測站的預(yù)報誤差隨風(fēng)力增大趨于顯著[12]。本研究以粵西10 m風(fēng)速作為預(yù)報對象,采用相似集合方法來建立粵西地面風(fēng)場訂正預(yù)報模型,為改進粵西地區(qū)風(fēng)的預(yù)報提供參考。
對于任一個需要訂正的氣象要素,找出與該氣象要素相關(guān)性較大的若干氣象因子,利用這些因子來構(gòu)成相似集合模型。相關(guān)性大小可籍公式(1)計算環(huán)境場的相似程度來判斷:
其中,t為變量訂正的時刻,而t′為某一歷史時刻;Ft是t時刻確定性的模式環(huán)境場;At′為在與Ft相同位置上t′時刻的模式環(huán)境場;p是選取的相似因子個數(shù);σi是第i個因子歷史時間序列的標(biāo)準差;Fi,t+τ和Ai,t′+τ是第i個因子分別在t和t′時刻要素的值;wi是相似因子的權(quán)重。式(1)表示在t時刻某一要素場前后Δt時段內(nèi)與歷史某一t′時刻要素場在前后Δt時段內(nèi)的相似程度(前后Δt時間段長度稱為時間窗長度),采用時間窗長度可以考慮到要素場在這一時間窗內(nèi)持續(xù)變化的相似性,使得式(1)能描述要素場對于一段時間內(nèi)持續(xù)演變過程,而式(1)中根號下Fi,t+τ-Ai,t′+τ的平方和 可視 為兩要 素場之 間 的“距離”?!熬嚯x”越短,表示這兩個時刻的要素場相似程度越高。假設(shè)歷史數(shù)據(jù)樣本集足夠大,那么利用該公式可以找到與Ft相似的若干個歷史t′時刻的要素場At′,若干個相似的歷史要素場則可以利用集合預(yù)報的思想計算得出對應(yīng)要素的確定性要素值,即獲得訂正后的模式數(shù)據(jù)。選取其中n個“距離”最小、相似程度最大的歷史t′時刻的要素場At′,然后利用式(2)與t′時刻對應(yīng)要素的氣象觀測值一并來計算訂正后確定性的模式數(shù)據(jù)FANEN:
其中,n是相似成員數(shù)。
其中,〈Ft-At′,i〉為式(1)中計算出n個需訂正時刻t與t′時刻的歷史要素場“距離”最小的結(jié)果;Oi為對應(yīng)要素場的觀測值。
使用2017年1月1日—2018年12月31日共計730 d逐時ERA5再分析資料,插值到粵西17個地面站點上(圖略),計算得到10 m風(fēng)的逐日平均風(fēng)速與最大風(fēng)速,以此730 d的平均風(fēng)速與最大風(fēng)速作為需要訂正的兩個要素。以2017年1月2日—2018年12月30日逐日風(fēng)速(Δt=1)作為需要訂正t時刻,同時選取2007年1月2日—2016年12月30日逐日ERA5資料作為歷史t′時刻通過式(1)計算相似度,從中得出n(本研究n=20)個相似集合成員,結(jié)合對應(yīng)歷史t′的觀測資料通過式(2)得出訂正后逐日平均風(fēng)速與最大風(fēng)速。
參照王在文等[4]研究成果并考慮天氣學(xué)意義,分別選取與風(fēng)速相關(guān)性較好的3個物理量作為相似度判據(jù)的因子(即式(1)中p取3):海平面氣壓、2 m氣溫、平均風(fēng)速和最大風(fēng)速。
均方根誤差:
訂正偏差:
其中,n為需要訂正的時次;fi為第i個模式的值;Oi為第i個站點的觀測值。均方根誤差的數(shù)值直接反映訂正數(shù)值的精確程度,而訂正偏差反映出訂正的偏差程度。
粵西地區(qū)17個站點2017年1月2日—2018年12月30日平均風(fēng)速的空間檢驗結(jié)果顯示(圖1),ERA5的均方根誤差均大于0.68 m/s,最大為2.30 m/s,在海岸線附近的站點均方根誤差都較內(nèi)陸站點的要大得多,而在平原地區(qū)的均方根誤差相對較小?;菡揪礁`差最大(12.01 m/s),分析發(fā)現(xiàn)化州站在此期間的歷史資料中相似成員數(shù)較少,引入了相似程度不高的要素場,導(dǎo)致訂正誤差顯著偏大。在后續(xù)的數(shù)據(jù)處理以及討論中剔除該站點。除去化州站,經(jīng)過AnEn訂正后的平均風(fēng)速均方根誤差總體不超過0.88 m/s,且在靠近海岸線的幾個站點訂正效果尤為顯著,平均均方根誤差減少率為41.84%,最高達72.25%。而平均風(fēng)速經(jīng)過AnEn訂正后偏差接近0 m/s。
圖1 粵西地區(qū)17個站點2017年1月2日—2018年12月30日平均風(fēng)速的訂正檢驗
ERA5資料計算的最大風(fēng)速(圖略)具有較高的均方根誤差,各站點基本都在1.50 m/s以上,最大值為2.47 m/s。經(jīng)AnEn訂正后,均方根誤差都降到了1.63 m/s以下,最小降為0.96 m/s。吳川站出現(xiàn)了負的均方根誤差減少率,可見AnEn對該站最大風(fēng)速訂正無效。除去吳川站以外,最大風(fēng)速的平均均方根誤差減少率為23.02%,減少率最大達到38.03%。對比可見,AnEn方法對于最大風(fēng)速的訂正效果沒有平均風(fēng)速的好,而對于最大風(fēng)速來說ERA5的值普遍偏小,最大的偏離程度達到了-1.71 m/s,而在最大風(fēng)速經(jīng)過AnEn訂正后偏差程度也接近0 m/s。
通過建立相似集合模型,構(gòu)建起2017年1月2日—2018年12月30日日平均風(fēng)速與日最大風(fēng)速的相似集合訂正成員集。為了判斷該相似集合訂正成員集的訂正效果與穩(wěn)定程度,對訂正后的日平均風(fēng)速與日最大風(fēng)速進行檢驗。
對平均風(fēng)速總樣本全部日數(shù)計算逐日均方根誤差(圖2a),總體上看,經(jīng)過相似集合訂正后的AnEn集合在日平均風(fēng)速的均方根誤差明顯要小于ERA5資料。ERA5的日平均風(fēng)速均方根誤差日變化大,最小0.2 m/s,最大達到了3.9 m/s;AnEn的日平均風(fēng)速均方根誤差幾乎穩(wěn)定在0.5 m/s以下且日變化小。ERA5的日平均風(fēng)速均方根誤差大概在8月中旬—9月上旬出現(xiàn)最大誤差(圖2b),而在6、7月份均方根誤差相對較??;AnEn的日平均風(fēng)速均方根誤差無明顯季節(jié)變化,全年相對穩(wěn)定。
圖2 平均風(fēng)速的均方根誤差檢驗
不管是ERA5資料還是AnEn資料的日最大風(fēng)速的均方根誤差明顯要比日平均風(fēng)速的誤差大(圖略)。ERA5的日最大風(fēng)速均方根誤差都在0.3 m/s以上,最大接近6 m/s,波動非常大;AnEn的日平均風(fēng)速均方根誤差曲線中存在某幾天的誤差極大,這可能是由于在相似集合模型中與該幾天相似形勢場的天數(shù)較少。但AnEn的日平均風(fēng)速均方根誤差除去個別幾天存在極大的誤差之外,總體的AnEn日平均風(fēng)速均方根誤差小于ERA5資料,說明AnEn對日最大風(fēng)速的訂正還是比較好的。ERA5再分析資料日最大風(fēng)速的均方根誤差有較為明顯的季節(jié)變化,11月中下旬到次年4月份均方根誤差比5—10月的均方根誤差要小且相對穩(wěn)定,基于ERA5資料訂正的AnEn數(shù)據(jù),其日最大風(fēng)速的均方根誤差有著和ERA5再分析資料相似的季節(jié)變化,其波動變化也較為相似。在季節(jié)變化總體上看,相似集合的訂正還是比較有效的。
在式(2)各歷史相似成員為加權(quán)平均和,若要分析單個成員與實際風(fēng)速的均方根誤差,必須修改公式形成新的相似集合成員與實際風(fēng)速進行對比。此處公式簡化為
即只考慮訂正時刻的要素場和與之相似的歷史要素場之間的相似程度,忽略其相似程度對訂正結(jié)果加權(quán)平均的影響。在所研究的17個站點中,每個站點均有20個相似成員,即一天共有340個成員。
相似集合的訂正對于日平均風(fēng)速與日最大風(fēng)速來說,日平均風(fēng)速的異常值數(shù)量要遠小于日最大風(fēng)速(圖3),而且其相似集合成員相對日最大風(fēng)速來說也更為集中。以3—5月代表春季、9—11月代表秋季,對比兩個季節(jié)的日平均風(fēng)速,在春季各相似集合成員的均方根誤差要優(yōu)于在秋季。而對比春秋季日最大風(fēng)速,并無明顯的季節(jié)性變化??傮w來看,不管是日平均風(fēng)速還是日最大風(fēng)速,其各相似集合成員的日均方根誤差與相似集合的日均方根誤差(藍色實線)較為接近,各相似集合成員還是比較接近訂正后的結(jié)果。
圖3 相似集合各成員3—5月(a、c)和9—11月(b、d)日平均風(fēng)速(a、b)與日最大風(fēng)速(c、d)的均方根誤差
其中,n為相似集合成員數(shù);fi為相似集合各訂正成員的大?。籪ave為相似集合各訂正成員的平均值。集合離散度(總樣本的離散程度)檢驗的是相似集合成員對訂正要素的穩(wěn)定性和離散的偏差,而集合平均方根誤差檢驗的是相似集合成員的準確度。集合離散度和集合平均誤差越接近,表示集合離散度越能夠代表系統(tǒng)的誤差演變特征,集合系統(tǒng)越可靠[13]。
圖4對比了日平均風(fēng)速與日最大風(fēng)速的集合離散度和集合平均均方根誤差。日平均風(fēng)速和日最大風(fēng)速的集合離散度都較小于集合平均均方根誤差,同時日平均風(fēng)速較日最大風(fēng)速要更為集中,集合平均均方根誤差要更小,說明日平均風(fēng)速更為穩(wěn)定和準確。雖然日最大風(fēng)速的集合平均均方根誤差波動較大,但是總體上來看,不管是日平均風(fēng)速還是日最大風(fēng)速的集合離散度和集合平均均方根誤差還是比較相近的,說明相似集合系統(tǒng)較為可靠。
圖4 總樣本天數(shù)日平均風(fēng)速與日最大風(fēng)速集合離散度與集合成員平均的均方根誤差(a、c)及集合離散度與集合成員平均的均方根誤差之差(b、d)
基于ERA5再分析資料,采用相似集合法對粵西地區(qū)地面日平均風(fēng)速與日最大風(fēng)速進行訂正,研究相似集合法在粵西地區(qū)的適用性,探討其在空間上訂正效果以及集合成員的性能。
1)利用相似集合法對粵西地面風(fēng)場的日平均風(fēng)速與日最大風(fēng)速進行誤差訂正后,空間檢驗效果顯著。日平均風(fēng)速和日最大風(fēng)速在各個站點上誤差都有明顯減小,且在復(fù)雜地形的山區(qū)也有較好的訂正效果,個別站點效果不理想。日平均風(fēng)速的誤差平均減少率為41.84%,而最大風(fēng)速的誤差平均減少率為23.02%,日平均風(fēng)速的訂正效果優(yōu)于日最大風(fēng)速。
2)ERA5與AnEn的逐日均方根誤差曲線顯示,ERA5的日平均風(fēng)速的均方根誤差要小于日最大風(fēng)速,且波動更小更為穩(wěn)定?;贓RA5再分析資料訂正的AnEn,誤差波動較為相似,對于更為穩(wěn)定誤差更小的日平均風(fēng)速做出的訂正,AnEn中日平均風(fēng)速的訂正效果也要優(yōu)于日最大風(fēng)速。AnEn的日平均風(fēng)速全年誤差波動較小,無明顯起伏,也沒有明顯的季節(jié)變化,而日最大風(fēng)速全年誤差波動較為劇烈,在5—10月的誤差比其他月份誤差更大。
3)對于各成員離散度分析中,日平均風(fēng)速的相似集合成員相對日最大風(fēng)速來說更為集中。日平均風(fēng)速的相似集合成員在春季比秋季集中,而日最大風(fēng)速在春秋季沒有明顯差異。兩者的集合離散度和集合平均均方根誤差大部分都比較相近,說明集合系統(tǒng)較為可靠。日平均風(fēng)速的集合離散度和集合平均均方根誤差更為接近,說明日平均風(fēng)速更為穩(wěn)定和準確。
總體而言,相似集合法在粵西地面風(fēng)場的日平均風(fēng)速與日最大風(fēng)速訂正中有較好的釋用效果。但存在個別站點或者個別天數(shù)誤差較大的情況,或許可從調(diào)整相似因子的選取、相似成員數(shù)n和采用更龐大的數(shù)據(jù)集來減少誤差,獲得更為良好的數(shù)據(jù)訂正集合,有待進一步深入探討。