羅月琳 高 麗 陳權(quán)亮 蔡宏珂 任宏利
1.成都信息工程大學(xué),大氣科學(xué)學(xué)院,成都,610225
2.國家氣象中心,中國氣象局?jǐn)?shù)值預(yù)報中心,北京,100081
3.國家氣候中心,氣候研究開放實驗室,北京,100081
4.中國氣象科學(xué)研究院,災(zāi)害天氣國家重點實驗室,北京,100081
集合預(yù)報是為了減少由初值誤差、模式誤差和大氣系統(tǒng)混沌特性引起的數(shù)值預(yù)報的不確定性,根據(jù)某種誤差概率分布生成的數(shù)據(jù)集,制作出與之相對應(yīng)的一組預(yù)報集合,這一方法就是集合預(yù)報方法(麻巨慧等,2011)。與傳統(tǒng)的“單一”確定性數(shù)值預(yù)報不同,集合預(yù)報的初值不是“一個”,而是滿足某一誤差概率分布的初值數(shù)據(jù)集,因此其預(yù)報結(jié)果是“一組”(或“一集”)。這就為解決“單一”數(shù)值預(yù)報存在不確定性的問題提供了一條有效途徑(李澤椿等,2002)。
在Epstein(1969)和Leith(1974)提出集合預(yù)報思想近20 年以后,20 世紀(jì)90 年代初,集合數(shù)值預(yù)報進(jìn)入了實際業(yè)務(wù)應(yīng)用階段。世界上較為先進(jìn)的國家陸續(xù)基于自己的模式發(fā)展了集合預(yù)報系統(tǒng),隨著美國國家環(huán)境預(yù)報中心(NCEP)和歐洲中期天氣預(yù)報中心(ECMWF)于1992 年先后把集合預(yù)報系統(tǒng)投入業(yè)務(wù)運行,隨后幾年,歐美等發(fā)達(dá)國家的氣象部門也相繼建立了各自的業(yè)務(wù)集合預(yù)報系統(tǒng)(杜鈞,2002;麻巨慧等,2011)。相比之下,中國開展集合預(yù)報研究和業(yè)務(wù)應(yīng)用,尤其在產(chǎn)品的解釋應(yīng)用方面,略顯滯后和技術(shù)薄弱(李澤椿等,2002;陳起英等,2004;關(guān)吉平等,2006)。中國學(xué)者陸續(xù)開展了有關(guān)集合預(yù)報擾動方法的研究(張涵斌等,2014a;Zhang,et al,2015;Xia,et al,2020),國家氣象中心于1995 年安裝了從美國進(jìn)口的IBM/SP2 巨型并行計算機(jī),為中國開展集合數(shù)值預(yù)報提供了硬件基礎(chǔ),并進(jìn)一步于1996 年采用時間滯后平均法(LAF)(Hoffman,et al,1983;張?zhí)m等,2019)建立了基于T63L16 模式的第一代中期集合預(yù)報系統(tǒng);在此基礎(chǔ)上于1999 年以奇異向量法(SV)(Buizza,et al,1995;Winkler,et al,2020;葉璐等,2020)取代時間滯后法,建立了第二代中期集合預(yù)報系統(tǒng),使用低分辨率的T21L16 生成奇異向量;1999 年底,基于國產(chǎn)神威巨型計算機(jī)平臺建立了第三代中期集合預(yù)報系統(tǒng),預(yù)報模式T106L19 投入準(zhǔn)業(yè)務(wù)運行。隨后采用增長模繁殖法(BGM)(Toth,et al,1997;閔錦忠等,2017)擾動初值生成技術(shù),形成了中國新一代全球中期數(shù)值預(yù)報業(yè)務(wù)系統(tǒng)(T213L31),于2002 年3 月投入準(zhǔn)業(yè)務(wù)運行,并于2002 年9 月正式業(yè)務(wù)化,成為中國新一代中期數(shù)值預(yù)報業(yè)務(wù)系統(tǒng)。2005 年底在T213L31 模式基礎(chǔ)上建立了全球集合預(yù)報系統(tǒng)— GEPS-T213,并于2006 年12 月實現(xiàn)了準(zhǔn)業(yè)務(wù)化運行。2010 年將GEPS-T213 模式成功升級為T639 全球模式,T639 全球集合預(yù)報系統(tǒng)(制作全球模式1—15 d 集合預(yù)報)于2014 年8 月正式投入業(yè)務(wù)運行(高麗等,2019)。中國氣象局發(fā)展的新一代非靜力數(shù)值預(yù)報模式—GRAPES,是中國面向天氣預(yù)報業(yè)務(wù)應(yīng)用的重要創(chuàng)新研究成果,其研發(fā)成功及業(yè)務(wù)應(yīng)用標(biāo)志著中國建立并形成了比較完善的數(shù)值天氣預(yù)報業(yè)務(wù)體系。GRAPES 包含區(qū)域及全球兩個版本,其中區(qū)域(GRAPES_Meso)版本已于2010 實現(xiàn)業(yè)務(wù)運行。王太微(2008)基于GRAPES 區(qū)域模式,采用集合變換卡爾曼濾波法(ETKF)(莊照榮等,2011;馬旭林等,2015)和BGM 兩種初值擾動方法進(jìn)行集合預(yù)報試驗,結(jié)果表明兩種方案均具有一定的概率預(yù)報技巧,基于BGM 方法的集合預(yù)報離散度及降水預(yù)報效果略好于集合變換卡爾曼濾波法。目前GRAPES 全球集合預(yù)報系統(tǒng)已于2018 年底正式投入業(yè)務(wù)運行,集合成員增至31 個,為進(jìn)一步開展集合預(yù)報應(yīng)用提供了可能(張涵斌等,2014b;霍振華等,2020;高麗等,2020)。
從業(yè)務(wù)預(yù)報的角度出發(fā),要讓預(yù)報員在短時間內(nèi)從大量集合預(yù)報結(jié)果提取所需信息是非常困難的(金榮花等,2007)。集合產(chǎn)品的釋用就需要對預(yù)報結(jié)果進(jìn)行處理、合成、壓縮。目前,集合預(yù)報主要有3 類產(chǎn)品:集合平均預(yù)報、大氣可預(yù)報性的預(yù)報(潘留杰等,2014;孫令東,2018)和概率預(yù)報(Stanski,et al,1989;Ji,et al,2019)。聚類分析法最初是用于集合預(yù)報產(chǎn)品分析的一種方法,把集合預(yù)報中相似的成員合并成一類,同時給出該類出現(xiàn)的相對頻率,較為適合于經(jīng)驗不多的預(yù)報員。在實際預(yù)報中,環(huán)流形勢預(yù)報對于預(yù)報員具有重要價值,而環(huán)流集合預(yù)報分類釋用研究仍相對較少。為此,文中將對GRAPES-GEPS 環(huán)流集合成員開展聚類分析研究。ECMWF 先后采用Ward 聚類法(Ward,1963)和管子法(Atger,1999)對集合預(yù)報產(chǎn)品進(jìn)行聚類;NCEP 采用距平相關(guān)系數(shù)分簇法對500 hPa 高度場進(jìn)行分簇;法國氣象局采用Diday提出的動力模糊法,初始劃分時的重心由天氣類型定義,劃分用到的距離是位移和最大相關(guān)法(楊學(xué)勝等,2001,2002);瑞典氣象局使用神經(jīng)元聚類法,這種方法基于神經(jīng)網(wǎng)絡(luò)原理;日本氣象廳利用中央聚類法進(jìn)行聚類分析(金榮花等,2007)。中國已有學(xué)者利用聚類法對集合預(yù)報進(jìn)行分類研究。楊學(xué)勝(2002)運用位移和最大相關(guān)距離法對ECMWF集合預(yù)報產(chǎn)品進(jìn)行了分類,結(jié)果表明該系統(tǒng)對影響法國的平直型、熱阻塞型、擾動型等500 hPa 天氣形勢預(yù)報效果比較好,而對波動型的天氣形勢預(yù)報效果稍差;金榮花等(2007)研究顯示基于Ward 聚類法的T213 集合預(yù)報系統(tǒng)的分類產(chǎn)品,能夠有效識別出最有可能發(fā)生的環(huán)流形勢演變和調(diào)整,給預(yù)報員提供有價值的預(yù)報信息;王太微等(2015)利用最遠(yuǎn)距離法對ECMWF 集合預(yù)報產(chǎn)品進(jìn)行分類,發(fā)現(xiàn)經(jīng)過聚類分析后的集合預(yù)報較好地改善了降水落區(qū)和強度預(yù)報效果,降水預(yù)報評分均比業(yè)務(wù)預(yù)報的評分高,且集合離散度也較大。王太微等(2016)利用Ward 聚類分析法將50 個ECMWF全球集合預(yù)報成員分成4 組,分析了一次遼寧地區(qū)強降水過程,結(jié)果表明聚類分析在集合預(yù)報中的應(yīng)用是可行的,可以提高預(yù)報員的效率。
目前,對于中國新一代業(yè)務(wù)集合預(yù)報系統(tǒng),尚未開發(fā)和使用集合預(yù)報聚類產(chǎn)品。中國對于業(yè)務(wù)集合預(yù)報的應(yīng)用一般采用集合平均作代表,對于集合聚類的研究工作較少,而后者對于集合產(chǎn)品的使用具有重要意義。通過對比分析,能夠直觀和定量體現(xiàn)出集合聚類結(jié)果相對于集合平均的優(yōu)勢。然而,中國目前的研究都是事先給定聚類數(shù)目,因此就有可能會導(dǎo)致聚類到后期時將兩個不相似的類別合并在一起,并且沒有給出定量化檢驗評分。因此,本研究利用GRAPES-GEPS 業(yè)務(wù)化以來實時輸出集合成員數(shù)據(jù)開展500 hPa 位勢高度場的集合預(yù)報產(chǎn)品的聚類分析,擬解決集合預(yù)報的動態(tài)聚類分析及檢驗評分。進(jìn)一步針對中國新一代業(yè)務(wù)集合預(yù)報系統(tǒng)開展集合分類釋用方法和檢驗評價研究。
所用模式預(yù)報資料來自于中國氣象局?jǐn)?shù)值預(yù)報中心發(fā)展的GRAPES全球集合預(yù)報系統(tǒng)(GRAPESGEPS)。該系統(tǒng)是GRAPES 模式體系的重要組成部分,已于2018 年年底在中國氣象局?jǐn)?shù)值預(yù)報中心實現(xiàn)實時業(yè)務(wù)運行,其格點空間的水平分辨率為1°×1°,包含31 個成員(1 個對照預(yù)報和30 個集合成員),間隔24 h 預(yù)報一次,一共15 d 的預(yù)報。本研究采用GRAPES-GEPS 在2019 年1 月至2020 年6 月全國范圍內(nèi)的500 hPa 高度場資料,預(yù)報時效分別為24、48、72、96、120、144 h,共6 d。
為了保持與模式預(yù)報資料空間和時間分辨率的一致性,500 hPa 高度場的分析場采用的是同一時段由ECMWF 中ERA5 再分析資料給出的500 hPa高度場作為本研究的分析場資料進(jìn)行模式氣候與觀測氣候差異的對比分析。該資料分辨率1°×1°。
Ward 聚類分析法(昌霞等,2019)是利用離差平方和來計算距離的一種聚類分析方法。聚類時首先使k個樣本各自成一類,然后樣本之間離差平方和最小的兩個樣本合并成一類。該方法總是使得聚類導(dǎo)致的類內(nèi)離差平方和增量最小,其思想源于方差分析,如果類分得好,同類樣本的離差平方和應(yīng)當(dāng)小,類與類之間的離差平方和應(yīng)當(dāng)較大。因此,Ward 聚類法強調(diào)找出集合預(yù)報中的相似要素。該方法的主要計算公式如下:
第K個成員和第J個成員的距離(DK,J)為
第L個成員與K、J合并成一組的類之間的距離()為
式中,Xi表示在第i簇類聚類點的數(shù)值,ni為第i簇類的樣本數(shù)。
當(dāng)集合預(yù)報分為n個類時的類間誤差平方和(S)為
式中,Ci是第i個簇,p是Ci中的樣本點,mi是Ci的質(zhì)心(Ci中所有樣本的均值),S是集合樣本的誤差平方和,代表了聚類效果的好壞。ΔS為當(dāng)分為n個類及n?1 個類時的誤差平方和的差值,S總為總的誤差平方和。
Ward 聚類方法步驟:①首先利用式(1)求每個集合成員樣本之間的距離,輸入距離矩陣,將距離最小的兩類歸并為一類。此時,成員樣本數(shù)減少至k?1。②再利用式(2)重新計算集合成員樣本之間的距離,將距離最小的進(jìn)行合并。③重復(fù)步驟②直到聚類數(shù)達(dá)到要求,停止循環(huán)。
現(xiàn)有絕大部分聚類方法通常需要事先給定聚類數(shù)目,在實際工作中需要根據(jù)經(jīng)驗或相關(guān)領(lǐng)域背景知識來設(shè)定。由于聚類過程中,樣本一旦被分配過,就不能再做類間的移動,這可能使初始錯誤的選擇貫穿于整個聚類過程中,從而導(dǎo)致聚類結(jié)果的不可靠。那么,當(dāng)聚類數(shù)目未知時,如何確定數(shù)據(jù)集的聚類數(shù)目是聚類分析研究的一項基礎(chǔ)性難題。
基于現(xiàn)今最佳聚類數(shù)k值的研究(宋媛,2013;王建仁等,2019),利用“手肘法”判斷最佳聚類數(shù)k值,該方法評價k值好壞的標(biāo)準(zhǔn)是誤差平方和,即運用式(3)計算出不同k值對應(yīng)的誤差平方和。因為不同預(yù)報時效對應(yīng)的總誤差平方和取值范圍不同,很難同時進(jìn)行比較,因此引入一個判定系數(shù)R2,取值范圍0—1。手肘法的核心思想是:隨著聚類數(shù)k增大,樣本劃分會更加精細(xì),每個簇的聚合程度會逐漸提高,R2自然會逐漸變小。當(dāng)k處于最佳聚類數(shù)時,由于k的增大會大幅度增加每個簇的聚合程度,故R2下降幅度會很大,而當(dāng)k到達(dá)最佳聚類數(shù)時,再增加k所得到的聚合程度回報會迅速變小,所以R2下降幅度會驟減,然后隨著k值的繼續(xù)增大而趨于平緩,即R2和k的關(guān)系圖是一個手肘的形狀,而這個肘部對應(yīng)的k值就是數(shù)據(jù)的最佳聚類數(shù)。圖1 給出了利用環(huán)流數(shù)據(jù)計算的R2隨著k值變化的實例。
圖1 2019 年5 月20 日00 時(世界時)環(huán)流數(shù)據(jù)計算的R2 隨著不同k 取值的變化(不同顏色線代表各個預(yù)報時效)Fig.1 R2as a function of k using circulation data at 00:00 UTC 20 May 2019(Different color lines represent different forecast times)
為此,在傳統(tǒng)Ward 聚類法中通過引入動態(tài)聚類的“手肘法”方案,發(fā)展了環(huán)流集合預(yù)報分類釋用方法。利用Ward 聚類法對GRAPES-GEPS 業(yè)務(wù)集合預(yù)報產(chǎn)品進(jìn)行分類,并計算出誤差平方和,通過對大量樣本不同個例不同預(yù)報時效的計算,在確定最佳聚類數(shù)時,發(fā)現(xiàn)k的最佳取值多在4—6,并且大多數(shù)情況k=5。然而通過對聚類結(jié)果的觀察,當(dāng)k=5 時,仍有部分類別比較相似,因此需要進(jìn)一步合并。因為Ward 聚類分析法傾向于將一個成員分配到一個樣本數(shù)較少的集群中,所以其結(jié)果是集群內(nèi)部的方差相當(dāng)。出于同樣的原因,當(dāng)聚類到后期的時候,表現(xiàn)出重要差異的成員往往會聚集在一起,即Ward 聚類方法的聚類效果是有限的,當(dāng)聚類到后期,所使用的最小距離原則將不再適用。因此引入距平相關(guān)系數(shù)法進(jìn)行最終判斷k=5 時是否需要繼續(xù)進(jìn)行合并,此方法是5 個類別之間相互計算距平相關(guān)系數(shù),將距平相關(guān)系數(shù)最大(大于0.95)的兩類進(jìn)行合并,然后再次計算類與類之間的距平相關(guān)系數(shù),直到類與類之間的相關(guān)系數(shù)均小于0.95 時停止合并。
目前已經(jīng)發(fā)展了多種針對確定性預(yù)報的檢驗評價方法。一次或少數(shù)幾次的單一確定性預(yù)報可以明確地針對某次天氣過程的預(yù)報進(jìn)行檢驗,但不能反映集合預(yù)報方法的整體預(yù)報效果,因此必須采用統(tǒng)計的方法,要有足夠大的樣本數(shù)才能反映整體的預(yù)報效果。為了全面分析預(yù)報方法的預(yù)報能力,針對500 hPa 位勢高度場集合預(yù)報聚類結(jié)果中集合分類和集合平均的預(yù)報能力,采用常見的確定性預(yù)報檢驗的距平相關(guān)系數(shù)(ACC)和均方根誤差(RMSE)進(jìn)行效果檢驗,距平相關(guān)系數(shù)是用來衡量兩個場的形態(tài)是否一致,其數(shù)值越大兩個場的形態(tài)越相似;均方根誤差是用來衡量兩個變量之間平均差異的一個參數(shù),表示的是兩個變量的平均偏離程度,其值越小兩個變量的偏離程度越小。
這里首先以一次典型過程為例來展示聚類分析結(jié)果。2019 年5 月26—29 日,中國長江以南地區(qū)出現(xiàn)大范圍強降水天氣過程,長江中下游,江南南部、華南和西南東部地區(qū)累計降水量普遍在50 mm 以上,其中湖北南部、安徽南部、浙江北部、廣西西部、廣東大部分地區(qū)為主要降水大值區(qū),累計降水量超過100 mm,局地達(dá)到200 mm。區(qū)域強降水主要影響時段為26—27 日。圖2 給出5 月26 日12 時(世界時,下同)至29 日00 時逐12 h 的500 hPa 分析場,為觀察環(huán)流場形勢配置變化在圖中將5640 dagpm 等值線設(shè)置紅色??梢钥闯?,26 日12 時(圖2a)中高緯度地區(qū)有一短波槽影響江淮東部和西南地區(qū)西部,隨后高空冷渦控制中國東部沿海地區(qū),切變線東移維持,低層水汽持續(xù)供給,繼續(xù)影響整個江南和華南地區(qū),增大累計降水量。從逐12 h 分析場環(huán)流形勢演變來看,此次強降水過程,主要是高空冷渦東移入海造成的。短波槽從西北向逐漸轉(zhuǎn)為南北向,槽后偏北氣流增大,引導(dǎo)高緯度地區(qū)極地冷渦南下,28 日00 時(圖2d)直抵東北地區(qū)形成高空冷渦。高空冷渦東移維持,低層水汽持續(xù)供給,繼續(xù)影響整個江南和華南地區(qū),增大累計降水量,直至29 日降水過程結(jié)束。通過對大量樣本不同個例不同預(yù)報時效進(jìn)行聚類分析發(fā)現(xiàn),集合預(yù)報聚類結(jié)果中預(yù)報時效24 和48 h 的聚類分析結(jié)果大多數(shù)為一類或兩類,分類效果并不明顯,因為對于較短的預(yù)報時效來說,即初始誤差微小增長不大的情況下,可以認(rèn)為預(yù)報具有“確定性”,此時認(rèn)為集合成員的預(yù)報質(zhì)量相對較高,而集合離散度小,聚類效果不明顯;在較長的預(yù)報時效中,預(yù)報軌跡可以發(fā)散到較大的區(qū)域,預(yù)報具有“隨機(jī)性”(李小泉等,1997)。因此,接下來將分別展示預(yù)報時效為72、96 和120 h 的集合預(yù)報聚類結(jié)果。
圖2 2019 年5 月26 日12 時至29 日00 時間隔12 h(a—f)的500 hPa 環(huán)流形勢分析場Fig.2 500 hPa geopotential height analysis with an interval of 12 h from 12:00 UTC 26 May to 00:00 UTC 29 May 2019(a—f)
圖3—5 分別給出的是預(yù)報時刻均為5 月28 日00 時但起報時刻不同的集合預(yù)報聚類結(jié)果的對比:集合預(yù)報起報時刻分別為2019 年5 月25 日00 時的72 h 預(yù)報、24 日00 時的96 h 預(yù)報和23 日00 時的120 h 預(yù)報,選取聚類區(qū)域為(30°—60°N,100°—150°E)。如圖3 所示,72 h 預(yù)報的集合聚類結(jié)果分成兩類,分別代表著不同的大氣環(huán)流形勢配置。與5 月28 日00 時的分析場(圖2d)對比,預(yù)報發(fā)生概率最高的稱為集合大類(圖3a,發(fā)生概率為0.903),其代表的環(huán)流形勢配置和主要系統(tǒng)形態(tài)與分析場可能更為相似,環(huán)流形勢配置短波槽呈南北走向,呈小倒“Ω”形,盤旋在中國東部沿海上空,引導(dǎo)槽后暖濕氣流往南發(fā)展,造成此次強降水天氣過程。發(fā)生概率次之的集合第二類(圖3b,發(fā)生概率為0.097),其代表的短波槽呈偏西南走向,但短波槽的深度和位置遠(yuǎn)不及集合大類與分析場的相似程度。最后,圖3c 所代表的集合平均預(yù)報場,環(huán)流形勢配置與圖3a 的集合大類高度相似,兩者與分析場相比難以分辨哪個預(yù)報效果更好,需要給出定量化檢驗評分。
圖3 2019 年 5 月 25 日 00:00 UTC 起報的 72 h集合預(yù)報的聚類分析(a、b,分別代表聚類分析的第 1、2 類;右上角為每一類的發(fā)生概率)和集合平均(c)結(jié)果Fig.3 Cluster analysis(a,b,1?2 categories of cluster analysis,respectively;the upper right corner is the probability of each category)and ensemble mean(c)results of 72 h ensemble forecast at 00:00 UTC 25 May 2019
圖4 給出96 h 預(yù)報的聚類結(jié)果是最終分成5 類,分別代表不同的環(huán)流形勢配置。對比分析場(圖2d)來看,聚類中預(yù)報發(fā)生概率最高的集合大類(圖4a,發(fā)生概率為0.581)所代表的環(huán)流形勢配置和主要系統(tǒng)的形態(tài)與分析場更相似,高空冷渦配置呈較明顯的倒“Ω”型,位置較分析場略偏北,短波槽呈南北向,深度不及分析場(圖2d)。發(fā)生概率次之的第2 類(圖4b),短波槽呈偏東南走向、且明顯弱于分析場。在第3 類(圖4c)中高空冷渦配置雖呈倒小“Ω”型,但范圍明顯小于分析場、且短波槽呈西南走向。而在圖4d 的第四類中,其短波槽位置偏北、且明顯弱于分析場。發(fā)生概率最小的圖4e高空冷渦配置呈倒“Ω”型,但位置明顯較分析場偏西。所以,整體上,集合大類與分析場的短波槽深度最為接近。集合平均(圖4f)的環(huán)流形勢配置與圖4a 集合大類(圖4a)相比,前者的高空槽強度不及后者。
圖4 2019 年5 月24 日00 時起報的96 h 集合預(yù)報的聚類分析(a—e,分別代表聚類分析的第1—5 類;右上角為每一類的發(fā)生概率)和集合平均(f)結(jié)果Fig.4 Cluster analysis(a—e,1—5 categories of cluster analysis,respectively;the upper right corner is the probability of each category)and ensemble mean(f)results of 96 h ensemble forecast at 00:00 UTC 24 May 2019
圖5 給出的120 h 預(yù)報的集合聚類結(jié)果分成4 類,分別對應(yīng)不同的環(huán)流形勢配置。如圖5a 所示的集合大類發(fā)生概率為0.581,作為集合大類可能具有更高的信度,高空槽強度與分析場(圖2d)較為接近,位置稍偏北,跨越的緯度與分析場一致,但強度不及分析場。相比之下,作為集合第2 類(圖5b),高空槽呈西南走向,強度不及集合大類與分析場相似,第3 類(圖5c)高空槽的位置比分析場更偏西,呈西南走向,主體形狀與分析場表現(xiàn)出明顯差異。發(fā)生概率最小的第4 類(圖5d),無論是高空槽的位置還是主體形狀,均與分析場差別明顯。在集合平均(圖5e)中,環(huán)流形勢配置與第1 類較為相似,但高空槽相對較弱,這顯然與集合平均對振幅的削弱作用有關(guān)。
圖5 2019 年 5 月 23 日 00:00 UTC 起報的 120 h集合預(yù)報的聚類分析(a—d,分別代表聚類分析的第 1—4 類;右上角為每一類的發(fā)生概率)和集合平均(e)結(jié)果Fig.5 Cluster analysis(a?d,1?4 categories of cluster analysis,respectively;the upper right corner is the probability of each category)and ensemble mean(e)results of 120 h ensemble forecast at 00:00 UTC 23 May 2019
總體來看,就這個被選取的典型個例而言,集合預(yù)報聚類結(jié)果在給出比重最大的類別和其他比較小類別的情況下,集合大類的預(yù)報效果比其他類別更好,且集合大類和集合平均預(yù)報效果相當(dāng),但其他聚類次大類在實際預(yù)報中也不可忽視,小概率類別也有可能對應(yīng)極端事件的發(fā)生。由此可見,集合預(yù)報信息中的集合大類相比于其他類與觀測場更為相似,少數(shù)情況下,所占比重更小的類別預(yù)報更準(zhǔn)確,所以在實際應(yīng)用中發(fā)生概率最高的第1 類通常具有高于其他類別的預(yù)報技巧,但相較于集合平均而言仍需給出定量化的檢驗評分。
在個例分析基礎(chǔ)上,為了驗證集合大類相比于集合平均具有更高的預(yù)報技巧,綜合對比不同個例在不同預(yù)報時效的效果,選取該模式系統(tǒng)業(yè)務(wù)化以來2019—2020 年期間10 個個例(具體個例過程的描述參見表1),每個個例選取兩個起報時刻,這兩個預(yù)報時刻高空槽都正好位于中國中東部地區(qū),預(yù)報區(qū)域均為(30°—60°N,100°—150°E),對選取的兩個時刻運用不同集合預(yù)報起始時間做聚類分析,并將集合大類與集合平均預(yù)報分別進(jìn)行確定性評分ACC 和RMSE 檢驗,最后將這10 個個例的各自檢驗結(jié)果取算術(shù)平均得到綜合檢驗分析結(jié)果。
表1 10 次個例的影響時間及過程描述Table 1 Influence time and process description of 10 cases
圖6 給出了不同預(yù)報時效的集合大類和集合平均預(yù)報與分析場的距平相關(guān)系數(shù)。相關(guān)系數(shù)越大,說明預(yù)報和實況的空間型相似度越高,預(yù)報技巧越高。從圖6可以看出,距平相關(guān)系數(shù)隨著預(yù)報時效的延長呈現(xiàn)自然下降趨勢,這反映出集合預(yù)報的確定性預(yù)報效果隨著預(yù)報時效延長而下降。但很明顯,集合大類預(yù)報技巧的下降要比集合平均緩慢得多。在24及48 h 的預(yù)報中,集合預(yù)報成員之間仍然較為聚集、發(fā)散度較小,在預(yù)報時效較短的情況下,預(yù)報具有“確定性”,預(yù)報質(zhì)量相對較高,可能導(dǎo)致聚類后的最終分類數(shù)較少,大多數(shù)情況下集合大類與集合平均非常接近,因此二者預(yù)報的距平相關(guān)系數(shù)差異較小,只是集合大類預(yù)報技巧略高一些。相比之下,當(dāng)預(yù)報時效達(dá)到72—144 h 時,集合預(yù)報成員已經(jīng)充分發(fā)散,此時集合聚類傾向于離散成若干個有差別的類。從圖中可以看到,在72 h 預(yù)報時效以后,集合大類預(yù)報與實況的距平相關(guān)系數(shù)明顯比集合平均預(yù)報的更大,即發(fā)生概率最高的集合大類具有明顯高于集合平均的預(yù)報技巧。
圖6 集合大類(紅線)和集合平均(藍(lán)線)預(yù)報分別與實況場的距平相關(guān)系數(shù)Fig.6 ACC of the analysis and forecasts for the primary cluster(red line)and ensemble mean(blue line)forecast,respectively
圖7 進(jìn)一步給出集合大類和集合平均預(yù)報與實況場的均方根誤差隨預(yù)報時效的變化情況。均方根誤差越大,兩者相似度越低??梢钥吹?,均方根誤差隨著預(yù)報時效延長呈現(xiàn)增大趨勢,這表明集合預(yù)報整體的預(yù)報效果是隨著預(yù)報時間的延長而趨于變差的??傮w來看,在最初的24 及48 h,由于集合成員尚未充分離散開,導(dǎo)致最終分類數(shù)少,集合聚類中的大類預(yù)報與集合平均預(yù)報差別微小;而在72—144 h 的預(yù)報中,集合大類預(yù)報的優(yōu)勢愈發(fā)顯著,其與實況場的均方根誤差增長幅度比集合平均預(yù)報的小很多,即在500 hPa 位勢高度場集合預(yù)報聚類結(jié)果中集合大類的均方根誤差要比集合平均明顯減小,這與距平相關(guān)系數(shù)的檢驗結(jié)論一致,集合大類預(yù)報比集合平均具有更好的預(yù)報效果。
圖7 集合大類(紅線)和集合平均(藍(lán)線)預(yù)報分別與實況場的均方根誤差Fig.7 RMSE of the analysis and forecasts for the primary cluster(red line)and ensemble mean(blue line)forecasts,respectively
綜上,兩種確定性預(yù)報檢驗評分(距平相關(guān)系數(shù)和均方根誤差)所體現(xiàn)的集合聚類預(yù)報效果總體結(jié)論較為一致,即對于中國中東部地區(qū)500 hPa 位勢高度場而言,集合大類預(yù)報綜合檢驗效果優(yōu)于集合平均,且能給出與之相對應(yīng)的發(fā)生概率,這是后者所不具備的。圖8 展示了10 個例在72—144 h時效平均的距平相關(guān)系數(shù)和均方根誤差評分情況,并對集合大類與集合平均進(jìn)行了對比。可以看到,絕大多數(shù)個例的集合聚類大類預(yù)報相比于簡單的集合平均具有更高的距平相關(guān)系數(shù)和更小的均方根誤差,顯示出集合分類釋用方法具有較為穩(wěn)定的預(yù)報性能。當(dāng)然,某些個例仍可能出現(xiàn)集合平均比集合大類預(yù)報技巧更高的情況,例如圖8a 第9 個例及圖8b 第7 和第9 個例。但整體上集合大類預(yù)報與實況場的相似度要比集合平均更高,即在實際中發(fā)生概率最高的第1 類通常具有高于集合平均的預(yù)報技巧。
圖8 10 個例在72—144 h 時效平均的距平相關(guān)系數(shù)和均方根誤差(a.距平相關(guān)系數(shù),b.均方根誤差)Fig.8 Average ACC and RMSE scores of 10 cases at 72—144 h forecast lead time(a.ACC,b.RMSE)
為了驗證文中提出的聚類分析方法是否能在連續(xù)時間的檢驗評估結(jié)果上與個例分析結(jié)果保持一致,圖9 分別給出了2019 年1 月—2020 年6 月連續(xù)時間的平均距平相關(guān)系數(shù)和均方根誤差的檢驗結(jié)果。從圖9 看,距平相關(guān)系數(shù)隨著預(yù)報時效的延長呈現(xiàn)減小趨勢,這反映出集合預(yù)報的確定性預(yù)報效果隨著預(yù)報時效延長而下降,且隨著預(yù)報時效延長集合大類與分析場的距平相關(guān)系數(shù)預(yù)報技巧相對于集合平均預(yù)報更具有優(yōu)勢。均方根誤差所體現(xiàn)的集合聚類預(yù)報效果總體結(jié)論與距平相關(guān)系數(shù)較為一致,即發(fā)生概率最高的集合大類具有高于集合平均的預(yù)報技巧。連續(xù)性時間檢驗相較于典型個例的檢驗結(jié)果改進(jìn)沒有那么顯著,這一方面與參與計算評分的樣本數(shù)大量增加有關(guān),而且也反映出,聚類分析對于有明顯天氣過程發(fā)生時更有顯著優(yōu)勢。
圖9 2019 年1 月至2020 年6 月逐日輸出的集合大類(紅線)和集合平均(藍(lán)線)預(yù)報分別與實況場的距平相關(guān)系數(shù)和均方根誤差Fig.9 ACC and RMSE of the analysis and forecasts for the primary cluster(red line)and ensemble mean(blue line)forecasts based on daily outputs from January 2019 to June 2020
此外,對比分析了聚類效果不理想個例以說明集合預(yù)報聚類應(yīng)用的不足。2019 年4 月24—26 日受高空東移的短波槽影響,中國北方和南方同時發(fā)生較大范圍的強對流天氣過程,主要影響時段在24—25 日。從分析場看,本次過程由一次高空槽配合低層低渦形勢而發(fā)生。自24 日起,短波槽在東移過程中逐漸加強,與南支槽相連。隨著高空槽的東移,至25 日白天,此次過程趨于結(jié)束。選取這次過程集合預(yù)報起始時刻為2019 年4 月21 日12 時,分析72 和96 h 的集合預(yù)報聚類。對比同時次集合預(yù)報的聚類結(jié)果與分析場發(fā)現(xiàn),集合平均預(yù)報能夠較好描述大尺度環(huán)流形勢的演變特征,但對此次過程預(yù)報的強度偏弱,冷空氣移動的路徑偏北、偏東。預(yù)報效果最好的類別并不是聚類分析的第1 類或者第2 類,說明在集合預(yù)報聚類結(jié)果中對于影響時間短、強度較弱的對流性天氣預(yù)報可能仍然具有一定局限性,需要進(jìn)一步針對此類降水開展研究。
系統(tǒng)性介紹了中外集合預(yù)報業(yè)務(wù)系統(tǒng)中所使用的集合預(yù)報聚類分析方法,借鑒中外已有的技術(shù)和經(jīng)驗以及進(jìn)行實際對比試驗,在傳統(tǒng)Ward 聚類分析中引入了動態(tài)聚類判別方案,發(fā)展了適用于中國GRAPES-GEPS 環(huán)流集合預(yù)報的分類釋用方法,進(jìn)一步利用實時業(yè)務(wù)集合預(yù)報數(shù)據(jù)檢驗了集合預(yù)報聚類結(jié)果在2019—2020 年中東部地區(qū)重要天氣過程個例中的預(yù)報效果,目的是通過對集合業(yè)務(wù)預(yù)報進(jìn)行聚類和釋用研究,尋求客觀識別最有可能發(fā)生的環(huán)流形勢方法,提升集合預(yù)報信息利用率和預(yù)報準(zhǔn)確度,為實際預(yù)報提供參考。
基于GRAPES-GEPS 實時集合預(yù)報的檢驗結(jié)果表明,經(jīng)過聚類分析后的集合預(yù)報聚類分型能較好地識別出500 hPa 環(huán)流場最有可能發(fā)生的環(huán)流形勢類型,并提供相對應(yīng)的發(fā)生概率。通過比較集合大類和集合平均與實況場的相似度,以及經(jīng)過定量化的距平相關(guān)系數(shù)和均方根誤差確定性預(yù)報檢驗,結(jié)果表明,對于中國中東部地區(qū),隨著預(yù)報時效延長,經(jīng)過聚類分析后得到的集合大類相比于集合平均的預(yù)報技巧有顯著提高,即實際預(yù)報中集合大類比集合平均具有明顯的優(yōu)勢。當(dāng)然,在實際預(yù)報中次大類等其他類的作用仍不可忽視,例如在某些突發(fā)性的極端天氣過程中可能會出現(xiàn)集合大類失去優(yōu)勢的情況。
目前國際上很多氣象部門已將聚類分析法應(yīng)用到實際業(yè)務(wù)中,隨著中國自主集合預(yù)報系統(tǒng)和產(chǎn)品的業(yè)務(wù)化程度不斷提升,開發(fā)基于集合預(yù)報聚類分析并開展相關(guān)的分類釋用,成為一個很有前景的研究方向。由于聚類分析方法和集合預(yù)報系統(tǒng)本身仍可能存在的不足,使得分類釋用方法在實際應(yīng)用試驗中還存在一些不夠理想的地方,需要通過更多試驗嘗試對方法進(jìn)行發(fā)展完善,并開展更為全面的檢驗評估。此外,由于天氣形勢和區(qū)域選擇的不同,文中所用的Ward 聚類法不一定全部適用,還需要探索利用和改進(jìn)其他類型的聚類分析方法,以滿足中國在集合預(yù)報應(yīng)用產(chǎn)品研究方面的發(fā)展需求,更好服務(wù)防災(zāi)、減災(zāi)工作。