朱曉彤 姚 凱 馮喜媛 任 航
(1.吉林省氣象科學(xué)研究所,吉林長(zhǎng)春 130062;2.長(zhǎng)白山氣象與氣候變化吉林省重點(diǎn)實(shí)驗(yàn)室,吉林長(zhǎng)春 130062;3.中高緯度環(huán)流系統(tǒng)與東亞季風(fēng)研究開(kāi)放實(shí)驗(yàn)室,吉林長(zhǎng)春 130062;4.吉林省氣象臺(tái),吉林長(zhǎng)春 130062)
短時(shí)強(qiáng)降水(flash heavy rain)是指在短時(shí)間內(nèi)出現(xiàn)的很強(qiáng)的降水事件, 是我國(guó)暖季最主要的災(zāi)害性天氣之一, 我國(guó)天氣預(yù)報(bào)業(yè)務(wù)中一般指1 h雨量在20 mm 或3 h 雨量在50 mm 以上的降水事件[1-3], 氣象行業(yè)標(biāo)準(zhǔn)《強(qiáng)對(duì)流天氣等級(jí)》(QX/T416-2018)指出強(qiáng)對(duì)流天氣中短時(shí)強(qiáng)降水的閾值為大于等于20 mm/h。 時(shí)間尺度上,短時(shí)強(qiáng)降水強(qiáng)調(diào)降水強(qiáng)度,即雨強(qiáng);在空間尺度上,短時(shí)強(qiáng)降水一般由對(duì)流降水形成, 且為典型的中小尺度系統(tǒng)驅(qū)動(dòng),其造成的衍生災(zāi)害往往表現(xiàn)為局地而短促,如山體崩塌、滑坡、城市道路積水、暴洪[4-5],而暴洪是所有相關(guān)氣象災(zāi)害中發(fā)生頻次最高且導(dǎo)致傷亡人數(shù)最多的災(zāi)害[6-9]。 前人對(duì)于短時(shí)強(qiáng)降水的個(gè)例分析、 機(jī)理研究以及預(yù)報(bào)預(yù)測(cè)等方面的探討較為豐富[10-12]。
目前短時(shí)強(qiáng)降水閾值的確定國(guó)際上使用較為廣泛的方法包括百分位法和參數(shù)估計(jì)算法, 如廣義帕累托分布法和廣義極值分布法等[13]。 由于中國(guó)天氣氣候狀況復(fù)雜、影響因子眾多,極端降水事件呈現(xiàn)出明顯的地域差異, 降水本身也具有很強(qiáng)的空間不均勻性, 短時(shí)強(qiáng)降水閾值的選取不應(yīng)統(tǒng)一采用固定閾值。雖然吉林省東、西部地形差異明顯,但目前吉林省氣象臺(tái)的監(jiān)測(cè)業(yè)務(wù)中,對(duì)于短時(shí)強(qiáng)降水的監(jiān)測(cè)仍全省使用統(tǒng)一的閾值, 這樣會(huì)抹平地域差異,因而,細(xì)化分區(qū)討論短時(shí)強(qiáng)降水的閾值是十分必要的。
本文使用K 均值聚類(lèi)方法, 根據(jù)歷史短時(shí)強(qiáng)降水事件對(duì)測(cè)站進(jìn)行分類(lèi),討論氣象行業(yè)標(biāo)準(zhǔn)《強(qiáng)對(duì)流天氣等級(jí)》中短時(shí)強(qiáng)降水的定義(雨強(qiáng)大于等于20 mm/h) 在吉林省本地化分區(qū)應(yīng)用中的適用情況, 進(jìn)一步使用百分位方法細(xì)化短時(shí)強(qiáng)降水在不同區(qū)域的閾值, 對(duì)吉林省暖季短時(shí)強(qiáng)降水監(jiān)測(cè)起到更加準(zhǔn)確的指導(dǎo)作用, 在業(yè)務(wù)應(yīng)用中有較大的實(shí)際意義。
與日降水量相比, 小時(shí)尺度降水資料在反映降水強(qiáng)度和描述降水過(guò)程方面都更準(zhǔn)確[14]。 更精細(xì)的降水資料可以有效避免, 因降水時(shí)間長(zhǎng)而強(qiáng)度較小導(dǎo)致的高估, 或因降水時(shí)間短卻強(qiáng)度極大導(dǎo)致的低估情況, 因而更適用于短時(shí)強(qiáng)降水閾值的確定[13]。 本文使用資料為1980—2019 年(近40 a)暖季(5—9 月)吉林省氣象信息中心提供的經(jīng)過(guò)質(zhì)量控制的51 個(gè)國(guó)家級(jí)地面氣象觀測(cè)站(國(guó)家站)的逐小時(shí)觀測(cè)數(shù)據(jù)。 選取1 mm 以上的小時(shí)降水量作為統(tǒng)計(jì)樣本。
本文使用百分位法來(lái)分析和確定短時(shí)強(qiáng)降水閾值, 該方法是通過(guò)把每個(gè)臺(tái)站的小時(shí)降水量按升序排序后, 選取某一固定百分位數(shù)的強(qiáng)度作為閾值,若小時(shí)降水量超過(guò)該值,則記為一次短時(shí)強(qiáng)降水事件。本文對(duì)各臺(tái)站計(jì)算了98%、99%、99.5%和99.9%四種百分位的強(qiáng)度, 對(duì)比討論了不同區(qū)域暖季短時(shí)強(qiáng)降水的閾值。
K 均值聚類(lèi)方法是一種常用的無(wú)監(jiān)督機(jī)器學(xué)習(xí)方法,可以通過(guò)“數(shù)據(jù)挖掘”的方式,將隱藏于數(shù)據(jù)當(dāng)中的規(guī)則提取出來(lái), 可以有效避免以地理區(qū)劃、 行政分區(qū)或者預(yù)設(shè)的代表性區(qū)為研究區(qū)域的主觀局限性。該方法的步驟為,首先隨機(jī)選取K 個(gè)初始聚類(lèi)中心, 而后將剩下的對(duì)象依據(jù)它們與聚類(lèi)中心的相似度(距離) 分配給最接近的那一聚類(lèi), 不斷重復(fù)該過(guò)程, 直到最后聚類(lèi)中心不再變化,誤差平方和最小為止[15-17]。
統(tǒng)計(jì)了近40 a 吉林省暖季短時(shí)強(qiáng)降水個(gè)例共計(jì)2 923 個(gè)。 其中,伊通站(站號(hào)54164)出現(xiàn)短時(shí)強(qiáng)降水最多,為93 次;最大雨強(qiáng)出現(xiàn)在長(zhǎng)白站(站號(hào)54386),雨強(qiáng)達(dá)到93.4 mm/h,出現(xiàn)日期為2004 年7 月23 日15 時(shí)。 全省暖季短時(shí)強(qiáng)降水出現(xiàn)最多的月份為7 月,共1 351 個(gè);最少為5 月,僅出現(xiàn)26 個(gè)短時(shí)強(qiáng)降水個(gè)例。暖季短時(shí)強(qiáng)降水事件在20 世紀(jì)80 年代、90 年代和21 世紀(jì)00 年代、10 年代的分布較為均勻,均為700 個(gè)左右。
由吉林省暖季短時(shí)強(qiáng)降水雨強(qiáng)分布區(qū)間(表1)可見(jiàn), 絕大部分短時(shí)強(qiáng)降水雨強(qiáng)都集中在20—30 mm/h,共2 118 站,占全部事件的72.5%;30—40 mm/h 次之,共553 站,占全部事件的18.9%;40 mm/h 以上的極端短時(shí)強(qiáng)降水共占總數(shù)的不到10%。 該統(tǒng)計(jì)結(jié)果為后續(xù)分區(qū)閾值的確定提供了依據(jù)。
表1 吉林省短時(shí)強(qiáng)降水雨強(qiáng)分布區(qū)間
本文使用K 均值聚類(lèi)方法, 依據(jù)吉林省暖季近40 a 的歷史短時(shí)強(qiáng)降水事件對(duì)測(cè)站進(jìn)行分類(lèi),經(jīng)過(guò)肘部法則[14]和進(jìn)一步合并后,最終將吉林省51 個(gè)國(guó)家站分為3 類(lèi)(圖1),并依此將全省測(cè)站劃分為3 個(gè)區(qū)域。分別是,一區(qū):白城、松原、四平,長(zhǎng)春中部和北部的長(zhǎng)春、農(nóng)安、九臺(tái)、榆樹(shù)、德惠,吉林西北部的舒蘭;二區(qū):遼源、長(zhǎng)春東南部的雙陽(yáng),吉林中部的吉林、永吉、蛟河,延邊北部的敦化、汪清、安圖;三區(qū):通化、白山,吉林南部的磐石、樺甸,延邊南部的和龍、龍井、延吉、圖們、琿春,以及長(zhǎng)白山保護(hù)區(qū)。
圖1 1980—2019 年暖季(5—9 月)吉林省短時(shí)強(qiáng)降水K 均值聚類(lèi)分區(qū)(一區(qū):紅色臺(tái)站;二區(qū):藍(lán)色臺(tái)站;三區(qū):綠色臺(tái)站)
選取1 mm 以上的小時(shí)降水量作為統(tǒng)計(jì)樣本,對(duì)每個(gè)測(cè)站的小時(shí)降水量按遞增順序排序后,分別計(jì)算小時(shí)降水量20 mm(氣象行業(yè)標(biāo)準(zhǔn)《強(qiáng)對(duì)流天氣等級(jí)》中對(duì)短時(shí)強(qiáng)降水的定義)在全省、一區(qū)、二區(qū)、三區(qū)的百分位。 結(jié)果顯示,小時(shí)降水量20 mm 在全省的百分位為98.7%, 在一區(qū)的百分位是98.1%,二區(qū)98.9%,三區(qū)99.8%。吉林省暖季各地的小時(shí)降水量分布是不均勻的, 與全省最為接近的是二區(qū),而一區(qū)強(qiáng)度最大,三區(qū)強(qiáng)度最小,兩者之間有著較大的差異。 全省小時(shí)降水量自西北向東南逐漸減小, 可見(jiàn)分區(qū)研究短時(shí)強(qiáng)降水閾值是很有必要的。
吉林省各地降水強(qiáng)度的分布是不均勻的,因此, 各區(qū)域采用適當(dāng)條件的短時(shí)強(qiáng)降水閾值更為合理。文獻(xiàn)中對(duì)于短時(shí)強(qiáng)降水閾值的確定,百分位數(shù)常取95%、98%、99%、99.5%或99.9%[13]。本文選取并計(jì)算了各臺(tái)站98%、99%、99.5%和99.9%四種百分位的強(qiáng)度,對(duì)比討論不同區(qū)域暖季短時(shí)強(qiáng)降水的閾值。 從全省、一區(qū)、二區(qū)、三區(qū)小時(shí)降水量的第99.5%分位數(shù)分布特征可以看出, 全省、一區(qū)、 二區(qū)、 三區(qū)的小時(shí)降水量中位數(shù)分別為27.3 mm、30.2 mm、26.0 mm 和23.9 mm;最大值分別為35.9 mm、35.9 mm、31.7 mm 和26.6 mm;最小值分別為17.7 mm、28.5 mm、19.8 mm 和17.7 mm。全省和其他3 個(gè)區(qū)的小時(shí)降水量25%—75%分位數(shù)基本集中分布在20—32 mm。 吉林省暖季降水強(qiáng)度99.5%分位數(shù)的分布(圖2) 與臺(tái)站的分區(qū)分類(lèi)結(jié)果(圖1)有著較好的對(duì)應(yīng)關(guān)系,其中一區(qū)的兩個(gè)明顯的小時(shí)雨強(qiáng)大值區(qū)中心分別在吉林中西部的公主嶺站與北部的乾安站, 三區(qū)的兩個(gè)低值中心分別在二道站和長(zhǎng)白站。
圖2 吉林省暖季降水強(qiáng)度第99.5%分位數(shù)分布
圖3 給出了一區(qū)、二區(qū)、三區(qū)以及全省的小時(shí)降水量的第98%、99%、99.9%分位數(shù)的分布情況。 結(jié)果顯示,第98%分位數(shù)的小時(shí)降水量中位數(shù)(圖3a)無(wú)論在全省、一區(qū)、二區(qū)還是三區(qū)均達(dá)不到20 mm,顯然不適合作為短時(shí)強(qiáng)降水的閾值;第99%分位數(shù)的小時(shí)降水量中位數(shù)(圖3b)在第三區(qū)無(wú)法達(dá)到20 mm, 達(dá)不到氣象行業(yè)標(biāo)準(zhǔn)中短時(shí)強(qiáng)降水的標(biāo)準(zhǔn),亦不適用;第99.9%分位數(shù)的小時(shí)降水量中位數(shù)(圖3c)在全省和三種分類(lèi)情況下均大于30 mm,最小值均在25 mm 以上,且30—40 mm/h 的雨強(qiáng)占短時(shí)強(qiáng)降水的18.9%,這樣的選取方式站點(diǎn)過(guò)少,閾值過(guò)大,亦不適用。 可見(jiàn),第98%、99%、99.9%分位數(shù)均不適合作為吉林省暖季短時(shí)強(qiáng)降水的閾值。
圖3 吉林省全省、一區(qū)、二區(qū)、三區(qū)站點(diǎn)最大小時(shí)降水量的98%分位數(shù)(a)、99%分位數(shù)(b)、99.9%分位數(shù)(c)箱線圖
經(jīng)過(guò)上述分析, 將每個(gè)測(cè)站小時(shí)降水量的第99.5%分位數(shù)作為短時(shí)強(qiáng)降水的閾值,更符合吉林省近40 a 暖季出現(xiàn)的短時(shí)強(qiáng)降水個(gè)例情況。
在日常業(yè)務(wù)中, 中位數(shù)通??梢苑从硵?shù)據(jù)的集中趨勢(shì), 故本文得出的各區(qū)域小時(shí)降水量第99.5%分位數(shù)的中位數(shù),作為確定吉林省暖季分區(qū)短時(shí)強(qiáng)降水監(jiān)測(cè)指標(biāo)的基礎(chǔ), 由于二區(qū)和三區(qū)數(shù)值相近(26.0 mm 和23.9 mm),因而合并為一類(lèi)。最終確定一區(qū),即白城、松原、四平、長(zhǎng)春中部和北部、 吉林西北部, 暖季短時(shí)強(qiáng)降水的監(jiān)測(cè)指標(biāo)為30 mm/h;二區(qū)和三區(qū),即遼源、長(zhǎng)春東南部、吉林中部、延邊北部、通化、白山、吉林南部、延邊南部以及長(zhǎng)白山保護(hù)區(qū)暖季短時(shí)強(qiáng)降水的監(jiān)測(cè)指標(biāo)為25 mm/h。
利用1980—2019 年暖季(5—9 月)吉林省國(guó)家級(jí)地面氣象觀測(cè)站的逐小時(shí)觀測(cè)數(shù)據(jù), 對(duì)短時(shí)強(qiáng)降水事件進(jìn)行統(tǒng)計(jì)分析,使用K 均值聚類(lèi)算法,根據(jù)歷史短時(shí)強(qiáng)降水事件對(duì)全省測(cè)站進(jìn)行分類(lèi)分區(qū), 討論氣象行業(yè)標(biāo)準(zhǔn) 《強(qiáng)對(duì)流天氣等級(jí)》(QX/T416-2018) 對(duì)短時(shí)強(qiáng)降水的定義 (大于等于20 mm/h) 在吉林省本地化分區(qū)應(yīng)用中的適用情況, 并進(jìn)一步使用百分位方法細(xì)化短時(shí)強(qiáng)降水在不同區(qū)域的閾值,得出以下結(jié)論:
(1) 吉林省暖季短時(shí)強(qiáng)降水強(qiáng)度絕大部分發(fā)生在20—30 mm/h,占全部事件的72.5%,40 mm/h以上的極端短時(shí)強(qiáng)降水占總數(shù)的比例小于10%。
(2)利用K 均值聚類(lèi)算法,依據(jù)吉林省暖季近40 a 的歷史短時(shí)強(qiáng)降水事件將全省測(cè)站分為三類(lèi)并定義為一區(qū)、 二區(qū)和三區(qū), 小時(shí)降水量20 mm在一區(qū)的百分位是98.1%,二區(qū)為98.9%,三區(qū)為99.8%,各區(qū)短時(shí)強(qiáng)降水強(qiáng)度分布存在差異,全省短時(shí)強(qiáng)降水強(qiáng)度自西北向東南逐漸減小。
(3) 使用百分位法對(duì)比全部測(cè)站小時(shí)降水量的第98%、99%、99.5%和99.9%分位數(shù)后發(fā)現(xiàn),每個(gè)測(cè)站小時(shí)降水量的第99.5%分位數(shù)作為短時(shí)強(qiáng)降水閾值更符合吉林省近40 a 暖季出現(xiàn)的短時(shí)強(qiáng)降水個(gè)例情況。
(4)日常業(yè)務(wù)中可以將30 mm/h 作為白城、松原、四平、長(zhǎng)春中部和北部、吉林西北部的暖季短時(shí)強(qiáng)降水監(jiān)測(cè)指標(biāo);25 mm/h 作為遼源、長(zhǎng)春東南部、吉林中部、延邊北部、通化、白山、吉林南部、延邊南部以及長(zhǎng)白山保護(hù)區(qū)的暖季短時(shí)強(qiáng)降水監(jiān)測(cè)指標(biāo)。
(5) 百分位法是當(dāng)前國(guó)際上使用的比較廣泛的2 類(lèi)方法之一, 由于廣義極值分布法和百分位法是基于完全不同的思路和算法對(duì)極端降水閾值進(jìn)行估計(jì)的, 因此有必要對(duì)百分位數(shù)與重現(xiàn)期之間的關(guān)系進(jìn)行討論, 基于廣義極值分布通過(guò)重現(xiàn)期的選擇了解相應(yīng)閾值發(fā)生的概率, 并討論百分位數(shù)與重現(xiàn)期之間的關(guān)系是我們進(jìn)一步的工作。另外, 目前使用的是國(guó)家氣象觀測(cè)站的逐小時(shí)降水資料,后續(xù)還應(yīng)利用區(qū)域氣象站數(shù)據(jù),結(jié)合實(shí)際業(yè)務(wù)對(duì)閾值進(jìn)行印證和適當(dāng)調(diào)整。