劉姝寧 石霖晟杰 仲夏
摘要 重現(xiàn)期刻畫了災害的極端值,從尾部風險的角度描繪了災害,為各行各業(yè)的發(fā)展及風險防范提供了量化指標。本文對大風災害的重現(xiàn)期計算方法展開了詳細描述,并提供了構建重現(xiàn)期的操作指導。
關鍵詞 重現(xiàn)期;風險普查;大風災害
中圖分類號:P429 文獻標識碼:B 文章編號:2095–3305(2021)08–0060–02
Calculation Method of Recurrence Interval in Gale Hazard Assessment
LIU Shu-ning et al(Baotou Meteorolo-gical Bureau of Inner Mongolia Autonomous Region, Baotou, Inner Mongolia 014000)
Abstract Return period depicting the extreme value of disasters, depicts the disaster, from the perspective of tail risk for the development of all walks of life and provides quantitative indicators to prevent risks, in this paper, the calculation method of the return period of high winds carried out detailed description, provide the reader with a how to build the return period of manuals.
Key words Recurrence interval; Risk survey; Gale hazard
大風災害會導致人員傷亡以及行業(yè)(如農業(yè)、漁業(yè)、城市建設、交通和電力等)經濟受損,因此,我國特成立全國氣象災害綜合風險普查技術組對大風災害進行調查和評估。重現(xiàn)期能夠直觀地刻畫出大風災害對當地造成影響的“最大”程度,計算重現(xiàn)期對災害的跟蹤、防范具有至關重要的作用。
例如,計算重現(xiàn)期為50年的年極大風速最大值(“年極大風速最大值”是指對每日的極大風速進行年統(tǒng)計并取最大值),是指在很長一段時間內,平均每逢50年會出現(xiàn)一次的年極大風速的最大值。每逢出現(xiàn)一次的意思不是說剛好在50年內出現(xiàn)一次,事實上在50年內可能遇到好幾次,也可能一次也遇不到,這是一個期望值的概念。
有不少研究人員都對重現(xiàn)期展開了研究,張伶俐等[1]使用了皮爾遜Ⅲ型、韋布爾、耿貝爾Ⅰ型,并詳細描述了使用分布,但構建分布也只是計算重現(xiàn)期的其中一步,甚至使用分布、挑選分布都可以使用編程語言的工具包自動實現(xiàn),并未描述使用分布的前因后果。例如,重現(xiàn)期是時間概念,為什么能用概率密度分布進行計算?分布往往非單調,也就沒有反函數,那如何直接反算自變量?這就造成了讀者理解到實施的斷層,雖然知道重現(xiàn)期能做什么,卻無法開展工作。林兩位等[2]使用“皮爾遜Ⅲ型”建立分布并展開了詳細描述,但同樣無法提供給其他研究者一份操作指南,其中包括構建重現(xiàn)期的每一步及其理論依據和注意事項。本文詳細討論在大風災害評估過程中計算重現(xiàn)期的方法及疑難點,為相關工作人員提供詳細的操作指南。
1 總體思路
先將多少年一遇的重現(xiàn)期概念轉換為一年一遇的概率,此處用T表示重現(xiàn)期,用P表示概率,即從T到P的過程;再根據歷年極大風速最大值刻畫概率分布,給定P反算出極大風速最大值X,X就是要求的N年重現(xiàn)期的重現(xiàn)值。
2 將重現(xiàn)期的概念轉化為概率問題
此處討論的是從T到P的過程,在討論極大風速的問題中,氣象更關心那些較大的極端值出現(xiàn)的情況,即右尾發(fā)生的情況,這些概率往往<0.5。在實際工作中,使用公式T=1/P進行轉換,在大風災害普查過程中需要計算50年、20年、10年、5年重現(xiàn)期的重現(xiàn)值,對應于概率分別為0.02、0.05、0.1、0.2。
3 通過分布反算極大風速最大值
提供兩種方式計算從概率P到年極大風速最大值X,兩種方式都要通過歷史年極大風速的最大值刻畫出的概率密度函數及其分布。
3.1 基于顯著度的方法
第一種方法是將概率P以某種等價關系對應到分布右尾的面積(即單尾情況下的顯著度α),通過α求解對應的年極大風速的最大值X(即顯著度對應的關鍵值)。例如,假設α=f(P)=P,即重現(xiàn)期T=20對應的右尾顯著度α=0.05,假設擬合的分布是均值為17、方差為1的正態(tài)分布時,關鍵值(即最終要求的20年重現(xiàn)期的年極大風速最大值X)=18.6 m/s,也就意味著平均每過20年就會出現(xiàn)一次18.6 m/s的極大風速。
為簡潔、直觀地表述該方法建立的過程,上述例子使用的是正太分布,但其實經過驗證,正態(tài)分布并不能很好地刻畫出極大風速最大值的分布。同時,該方法需要設定一個函數將P轉化為顯著度α,在上述例子中假設α=P,雖然不能直接判定該函數關系是正確或錯誤的,但可以明確這與所使用的分布有關,需要在實際使用中根據分布和數據不斷回測、調整。此外,在計算關鍵值X的實際操作中可以使用CDF累積概率密度的反函數(PPF)求解,0.05的顯著度對應的是0.95下的PPF值。
基于顯著度的方法有一個明顯的缺點,這也是為什么要挑選出最合適的轉換函數α=f(P),一個統(tǒng)計量P轉化為另外一個統(tǒng)計量α,兩個統(tǒng)計量雖然排序意義相同,但數值意義卻不一定相同。例如,50年和20年重現(xiàn)期,50年算出的年極大風速最大值理應比20年的大,轉化為顯著度(假設α=P),0.02下的關鍵值也比0.05的關鍵值大,這叫排序意義相同。但50年與20年的差值30是否能和顯著度差值0.03劃等號?答案是否定的,這便造成了即使計算出來也無法解釋的窘境。相比于第一種基于顯著度的方法,實際工作中使用的是第二種方法,即簡單法,指直接基于分布,給定頻率P倒算X。
3.2 簡單法
仍采用上述例子,用簡單法計算,20年重現(xiàn)期T對應的是頻率P=0.05,要求擬合分布中頻率為0.05對應的橫坐標X值。該方法更加簡單直接,也更容易被解釋,這也是在實際操作中使用較多的主要原因。
總體上可以分為兩步:構建分布和反算X。(1)通過歷史的年極大風速最大值構建分布,輸入的歷史數據是對一年內每日極大風速統(tǒng)計的最大值。雖然氣象地面觀測站中的國家基準氣象站通常都有20年以上的有效數據,但這些站點數量過少。因此,等引入氣象地面觀測站中的區(qū)域站作為補充,擴充的區(qū)域站數量是國家站的9倍,但有些區(qū)域站只有幾年的歷史數據,如內蒙古赤峰市藏龍谷站的有效數據只有2018年5月至今的數據,這樣的站點占總體樣本的50%以上,這意味著構建分布的第一步是增加數據。此處提出一種通過月度統(tǒng)計數據來增加年度數據的方法,在整個過程中應遵循一個原則,即無論如何增加數據,都不能改變年度數據分布的特點,增加數據的關鍵在于如何篩選月度的極大風速最大值。文章使用所有站點的年度數據均值往左1.2倍標準差(μ-1.2σ)為最小值進行截取,且該值必須>17.2(大風的定義是由非臺風天氣系統(tǒng)導致發(fā)生的日極大風速達17.2 m/s及以上的風),選擇基點的過程是在數據量增加帶來的分布刻畫更有支撐度與上述原則之間做出權衡。
準備好數據集即可刻畫分布,可以使用python的fitter包,嘗試不同的分布,通過BIC判定最優(yōu)模型,隨后使用fitter包輸出的最優(yōu)模型的參數建立最優(yōu)模型,從而求解X。嘗試的分布有廣義Pareto、廣義極值理論、皮爾遜III型、耿貝爾-右偏分布等,選擇的方式除了歷史經驗,還根據數據本身應有的分布特征進行判斷,年極大風速的最大值所刻畫的分布應該是類鐘型極度右偏的分布,甚至是只有右尾單調遞減的分布(圖1)。但類鐘型分布會造成后面二分法近似求解的麻煩,原因就在于非單調且極點不好求,更重要的是非單調的函數是沒有反函數的,這也就導致無法直接使用反函數X=f(P)求重現(xiàn)期的年極大風速最大值,文章提供的一種解決方案是通過二分法近似求解。
由于概率密度函數大多不單調,導致沒有反函數X=f(P),因而只能不斷嘗試計算較為接近的數值。在實踐過程中,二分法可細分為搜尋和排查兩項工作,搜尋是將目標快速鎖定在一個范圍內,為排查提供范圍的上限值和下限值。
在搜尋的過程中要考慮不存在目標點的情況,這也是使用簡單法的一個缺點。經過歷史值擬合出來的分布有一個概率的上限Pmax,對于越小的重現(xiàn)期越容易超出上限,例如5年重現(xiàn)期對應的概率是0.2,在實踐過程中存在部分站點擬合的分布最大概率<0.2,因此提出使用樣本數據的眾數代替該值。
此外,如果近似計算過程中,初始點選擇不當還會出現(xiàn)計算Bug造成的“不存在”情況。最優(yōu)情況下,初始點是分布的眾數,即極點對應的X,由于分析過程只關心右尾(大的那部分),因此直接從眾數往更大的方向搜尋即可,如果搜尋超時則被認為上面描述的那種“不存在”是超出分布的范圍。可能是由于分布的數理特性造成的,并不能得出分布的眾數或極點值,這就需要定義一個起始點。經過實踐,可以使用的只有分布的均值和中位數,對右偏的分布均值和中位數都在右尾上,并且中位數小于均值,因此選用中位數作為起始點(圖2)。由于起始點不是極點,因而目標點也可能小于起始點,在起始點的左側,搜尋的步長一定要盡可能小,因為在分布的“駝峰區(qū)域”出現(xiàn)了單調性的轉換。
排查是二分法的主體部分,算法內容很簡單,原則上要求單調性,對于
右尾單調遞減的特性,搜尋范圍確定
X1~X2,其中X1 4 結束語 從重現(xiàn)期計算到概率,再從概率計算到重現(xiàn)值,提出了簡單法和基于顯著度的方法,并詳細描述了簡單法下的二分法求解近似值。在實踐中仍存在許多不足之處,如“不存在”問題等。此外,計算結果無法得到直接校驗,只能在后續(xù)使用如災情區(qū)劃等工作中做出反饋并不斷調整。但不可否認的是,使用重現(xiàn)期刻畫大風災害,并加深理解災情的面貌提供了重要角度。 參考文獻 [1] 張伶俐,成坤,劉春澤,等.長白山地區(qū)暴雨特征及重現(xiàn)期幾種計算方法對比[J].北華大學學報:自然科學版,2021,22 (1):21-27. [2] 林兩位,王莉萍.用Pearson-Ⅲ概率分布推算重現(xiàn)期年最大日雨量[J].氣象科技,2005(4):314-317. [3] 夏祎萌,何清,李軍,等.新疆大風災害災度和危險度分析[J].中國沙漠, 2012, 32(4):1025-1028. 責任編輯:黃艷飛