• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于改進的三層機器學(xué)習(xí)搜索法極端降雨區(qū)域頻率估計

      2023-02-19 09:03:34左惠強尹建明
      中國防汛抗旱 2023年1期
      關(guān)鍵詞:同質(zhì)置信區(qū)間時間尺度

      楊 哲 楊 昆 呂 娟 左惠強 尹建明

      (1.中國再保險(集團)股份有限公司博士后工作站,北京 100033;2.中國水利水電科學(xué)研究院,北京 100038;3.水利部防洪抗旱減災(zāi)工程技術(shù)研究中心,北京 100038;4.中國財產(chǎn)再保險有限責(zé)任公司,北京 100033;5.中再巨災(zāi)風(fēng)險管理股份有限公司,重慶 400020)

      1 研究背景

      受氣候變化影響,極端降雨事件日漸頻繁,并對現(xiàn)今社會造成嚴重影響[1-2]。Mondal 等[3]將ENSO(El Ni?o-Southern Oscillation)指數(shù)、全球平均地表氣溫和印度平均氣溫作為指標,發(fā)現(xiàn)100年回歸期的極端降雨頻率在局部地區(qū)呈上升趨勢。Simonovic 等[4]分析了加拿大各地的極端降雨事件的頻率和強度,發(fā)現(xiàn)中西部地區(qū)和東海岸地區(qū)存在相反變化趨勢。Fernandes等[5]比較了1979—1999年和2000—2015年兩個時期巴西的極端降雨事件,在年降雨量和極端降雨的形成機制上都發(fā)現(xiàn)顯著的變化。Ma等[6]分析了中國東南部632個觀測站1969—2013年的日降雨量記錄,發(fā)現(xiàn)高強度的降雨事件頻率在有上升趨勢,而中小強度降雨事件頻率呈減少趨勢。

      強度-歷時-頻率(IDF)曲線用于描述某一站點不同重現(xiàn)期、不同歷時的降雨強度量級。站點的頻率分析法通常分為兩大類:單站點序列分析法,僅用目標站點的歷史數(shù)據(jù)進行IDF曲線的擬合;區(qū)域頻率分析法,利用相似因子,收集大量擁有相似降雨特征的站點資料,用這些資料進行IDF 曲線的擬合[7]。相比于單站點的頻率分析,使用大量樣本的區(qū)域頻率分析法能降低降雨強度估計值的不確定性。在區(qū)域頻率分析中,收集的與目標站點擁有相似降雨特征的站點的集合被稱為同質(zhì)群體。

      同質(zhì)群體的組建直接影響降雨強度估計值的不確定性。選取的相似因子作為衡量標準,其中包括站點的地理位置特征,或通過其歷史氣象資料計算得到的年平均降水量、年平均降雨天數(shù)等[7-10]。相比于站點的地理位置特征,氣象特征更易受氣候變化的影響,可以更有效揭示氣候變化下不同時期降雨事件頻率的變化[11-16]。為考慮在氣候變化對不同地點上極端降雨事件頻率的影響,以及極端降雨事件的空間差異性,Yang等[17]提出了一種基于機器學(xué)習(xí)的三層搜索算法,其使用了禁忌搜索法為擁有不同地理和氣象特征的目標站點選擇出不同的相似性因子,通過這些相似因子進行站點的聚類,進而得到最優(yōu)的同質(zhì)群體。為了減少相似因子之間的相關(guān)性對站點聚類過程中的影響,三層搜索算法使用拉格朗日乘數(shù)法進行。

      為進一步降低降雨強度估計值的不確定性,本文從兩個方面對現(xiàn)有的三層搜索法進行改進:①提高算法對非線性相似因子中非冗余信息提取的有效性。本文將用特征提取法取代特征加權(quán)法進行相似因子間有效信息的提取。②減少同質(zhì)群體組建過程中對原始輸入的依賴。本文將在三層搜索法的框架中添加一種監(jiān)督站收集技術(shù)作為組成同質(zhì)群體的另一種方法。

      2 研究區(qū)域和數(shù)據(jù)

      本文選擇加拿大不列顛哥倫比亞省作為研究區(qū)域。由于靠近海洋和山區(qū),其獨特的地理位置使得該地區(qū)主要呈太平洋海洋和科迪勒拉山系氣候類型,層狀降雨將是該地區(qū)主要的降雨類型。本文選取了不列顛哥倫比亞省內(nèi)現(xiàn)有的86 個站點的雨量數(shù)據(jù)進行試驗,其過程所需要的數(shù)據(jù)如下:

      (1)降雨年最大值序列。分別在86個站點上,收集歷時分別為5 min、10 min、15 min、30 min、1 h、2 h、6 h和12 h的降雨年最大值序列。這些數(shù)據(jù)有兩個特點:一是時間跨度不統(tǒng)一,最長可達到40 a;二是時間上重復(fù)度最高的時段是1985—2004年。

      (2)特征因素的提取。從美國國家海洋和大氣管理局(NOAA)測繪產(chǎn)品數(shù)據(jù)庫、全球集合預(yù)報系統(tǒng)再分析數(shù)據(jù)產(chǎn)品(GEFS/R)和歐洲中期天氣預(yù)報中心的全球預(yù)報再分析數(shù)據(jù)產(chǎn)品(ERA-interim)中,在不同的層級高度上提取了1985—2004 年的氣象相似因子年序列,其時間分辨率為6 h。提取的相似因子如表1所示。

      表1 三層結(jié)構(gòu)中可能的相似因子

      3 研究方法

      3.1 基于三層機器學(xué)習(xí)搜索法的極端降雨區(qū)域頻率估計

      3.1.1 區(qū)域頻率分析法

      在區(qū)域頻率估計法中,假設(shè)同質(zhì)群體內(nèi)所有站點的降雨序列具有相同的頻率分布,則不同回歸期的降雨強度估計可用以下指數(shù)方程求得[7]:

      式中:D表示降雨歷時,h;?T,D是重現(xiàn)期為T年降雨歷時為D的降雨強度估計值;是單個站點在降雨歷時為D情況下的歷史年平均強度值,?T,D是無量綱的分布函數(shù)曲線。其具體實施步驟(圖1)如下[7]:

      圖1 區(qū)域頻率估計法框架圖

      (1)站點篩選。通過Pettitt 檢驗或Mann-Kendall 非參數(shù)檢驗,檢查現(xiàn)有站點的降雨年時間序列,選著擁有平穩(wěn)時間序列的雨量站。

      (2)相似因子的選擇。在傳統(tǒng)的區(qū)域頻率分析法中,選擇相似站點與目標站點的地理距離作為相似因子。

      (3)形成同質(zhì)群體。設(shè)定相似因子的上限值,收集范圍內(nèi)特征相似的站點,組成可能的同質(zhì)群體。

      (4)同質(zhì)群體的評估。對上一步得到的同質(zhì)群體組進行異質(zhì)性檢驗,對不符合同質(zhì)性標準的同質(zhì)群體組進行調(diào)整,即減少其群體內(nèi)已有的相似站點,直至滿足同質(zhì)性標準為止。

      (5)不同回歸期的降雨強度估計。根據(jù)步驟(4)得到的同質(zhì)群體中的降雨序列,識別合適的分布函數(shù),進而估計目標站點不同回歸期下的降雨強度。

      (6)量化分位點的置信區(qū)間。利用同質(zhì)群體中的降雨序列中得到的線性矩,進行1 000次的參數(shù)抽樣,模擬對不同降雨強度分位數(shù)的置信區(qū)間進行估計。

      作為整個估計過程中最重要的一步,同質(zhì)群體的組成直接影響降雨強度分位點估計的不確定性。為了形成更優(yōu)的同質(zhì)群體,Yang等提出了一種基于機器學(xué)習(xí)的三層搜索算法[17]。

      3.1.2 基于機器學(xué)習(xí)的三層搜索算法

      三層搜索算法將極端降雨的形成過程分為:行星邊界層以外云的形成,城市混合層中降雨的產(chǎn)生,以及城市表層降雨強度受地面影響而變化[17-19]。

      第一層:為了區(qū)分兩種極端降雨誘導(dǎo)云(積雨云或雨層云),選擇了對流有效勢能指數(shù)以及其他在300 hPa 和700 hPa 氣壓高度之間的氣象相關(guān)特征為可能的相似因子作為搜索的輸入[20-21],以用來確定目標站點上極端降雨誘導(dǎo)云影響的空間范圍作為最初的同質(zhì)群體[17]。此層中最能影響極端降雨云形成的相似因子為對流有效勢能。

      第二層:在第一層輸出的同質(zhì)群體的基礎(chǔ)上,為進一步考慮區(qū)域尺度上的氣象和地理特征,選取了氣壓高度在850 hPa以上的氣象和地理要素為可能的相似因子作為搜索法的輸入,以確定區(qū)域尺度上目標站點的同質(zhì)群體。此層中最能影響區(qū)域極端降雨的相似因子為水汽通量散度的垂直積分[20-21]。

      第三層:在第二層輸出的同質(zhì)群體的基礎(chǔ)上,為考慮城市化效應(yīng)對降雨的影響,選擇能反映城市熱島效應(yīng)、冠層效應(yīng)和氣溶膠效應(yīng)相關(guān)特征要素為可能的相似因子作為搜索法的輸入,進而形成最終的同質(zhì)群體[13,18,22]。

      原始三層搜索法的步驟如圖2所示。

      圖2 原始三層搜索法框架圖

      (1)相似因子的初選。在第一層中,選著合適的相似性指標作為同質(zhì)群體形成的衡量標準。

      (2)非冗余信息的提取。在選取的相似因子上應(yīng)用特征權(quán)重即拉格朗日乘數(shù)法,得到每個相似指標相應(yīng)權(quán)重。

      (3)同質(zhì)群體的形成。采用乘以權(quán)重后的相似因子作為衡量標準,使用模糊C 均值聚類法,形成同質(zhì)群體,并采用區(qū)域頻率法計算不同分位點對應(yīng)的置信區(qū)間寬度。

      (4)得到第一層最優(yōu)的同質(zhì)群體及其對應(yīng)相似因子組合。運用禁忌搜索法,以步驟(3)得出置信區(qū)間的寬度為指引,選擇下一個可能較優(yōu)的相似因子組合。重復(fù)使用步驟(1)~(3)直至達到預(yù)設(shè)的搜索次數(shù)上限,得到最優(yōu)的相似因子組合。

      (5)得到最終的同質(zhì)群體。分別在第二、第三層中,重復(fù)步驟(1)~(4)。在層與層的銜接中,上一層輸出的同質(zhì)群體會被作為輸入的測試區(qū)域進人下一層,直至得到最終的同質(zhì)群體。

      本文將針對上述步驟中(2)和(3)中所用到的非冗余信息的提取和形成同質(zhì)群體所用到的聚類方法進行改進。

      3.2 改進的三層搜索法

      3.2.1 等距特征映射

      作為特征權(quán)重法,拉格朗日乘數(shù)法適用于線性相關(guān)因子之間非冗余信息的提取,但不適用于非線性因子間的信息提取。考慮相似因子之間的非線性相關(guān),為了提高非冗余信息的有效率,本文采用了非線性特征提取方法等距特征映射(ISOMAP)進行因子相關(guān)性的處理。

      歐式空間并不能較好地描述非線性相關(guān)數(shù)據(jù)點之間的相對關(guān)系。在傳統(tǒng)的機器學(xué)習(xí)方法中,數(shù)據(jù)點之間的距離和映射函數(shù)都是定義在歐式空間上的。然而在實際情況中,傳統(tǒng)歐式空間的度量難以用于真實世界的非線性數(shù)據(jù)點,因此需要對數(shù)據(jù)的空間分布引入新的假設(shè)。等距特征映射使用了流形假設(shè),其認為數(shù)據(jù)點分布在嵌入于外維歐式空間的一個潛在的流形上,或者說這些數(shù)據(jù)點可以構(gòu)成這樣一個潛在的流形體。

      等距特征映射是一種圖形演算法,通過使用點之間的最短路徑的距離對加權(quán)圖上的相互關(guān)系進行重新構(gòu)建,在此過程中保留點的原始幾何結(jié)構(gòu)[23],其大致做法可總結(jié)為:

      (1)組建相鄰區(qū)域。根據(jù)目標流形上所有兩點之間的距離,通過選擇與目標點距離低于設(shè)定閾值的數(shù)據(jù)點或收集特定數(shù)目的鄰近點組成相鄰區(qū)域。然后使用加權(quán)圖G來表示相鄰區(qū)域之內(nèi)數(shù)據(jù)點的關(guān)系。

      (2)最短路徑的計算?;诹餍紊闲纬傻募訖?quán)圖,計算每個鄰域中所有兩點之間的最短距離,并將該最短距離用作測地距離形成的距離矩陣

      此處采用了Floyd 算法或Dijkstra 算法進行最短路徑的計算。

      (3)在新維度上構(gòu)建降維數(shù)據(jù)。對從獲得的距離矩陣使用多維尺度變換法。通過將數(shù)據(jù)嵌入d維歐氏空間Y,以保持目標流形上原始的幾何結(jié)構(gòu)[24]。使用以下等式得到數(shù)據(jù)在歐氏空間Y下的新分布:

      從相關(guān)特征中提取的非冗余信息將用作同質(zhì)群體形成的相似因子。

      3.2.2 影響區(qū)域法

      為了進一步降低降雨強度估計值的不確定性,在改進的三層搜索的框架中,加入影響區(qū)域法(ROI)作為另一種形成同質(zhì)群體的方法。作為一種監(jiān)督算法,當(dāng)輸入組中有足夠數(shù)量與目標站點擁有相似降雨特征的站點時,影響區(qū)域法通常優(yōu)于模糊均值聚類法找到最優(yōu)的同質(zhì)群體。通過使用相似因子來計算與目標站點的歐幾里德距離,并采用異質(zhì)性估量指標,去衡量該站點是否屬于目標站點的同質(zhì)群體[25-26]。本文使用的異質(zhì)性度量指標為[27]:

      其中

      式中:μ為提取序列的均值;Vk為選用的計算指標;σ為提取序列的方差;tˉ2、tˉ3、tˉ4為L-均值(L- mean)、L-變差系數(shù)(L-Cv)和L-偏態(tài)系數(shù)的區(qū)域值;t2(i)、t3(i)、t4(i)為單個測站的0 階、一階、二階的線性矩;ni為站點i降雨序列中的樣本數(shù)目;R代表同質(zhì)群體中的站點數(shù)目。當(dāng)異質(zhì)性度量指標Hk小于1 時,此同質(zhì)群體可認為是均勻同質(zhì)的,當(dāng)1<Hk<2 時,此同質(zhì)群體被認為可能是均勻同質(zhì)的[7]。

      3.2.3 改進的流程

      在原始三層搜索法的基礎(chǔ)上,加入上述兩種方法,得到改進版的三層搜索法框架如圖3所示。與原始方法相比,新框架將在以下幾個步驟中進行改進:

      (1)非冗余信息的提取。用等距特征映射替換原始拉格朗日乘數(shù)法,對選擇的相似因子進行非冗余信息的提取。

      (2)同質(zhì)群體的形成。影響區(qū)域法作為輔助法所形成的同質(zhì)群體,會與用模糊C 均值聚類法所得的同質(zhì)群體進行比較,取置信度區(qū)間較窄的同質(zhì)群體為最優(yōu)。

      圖3 改進的三層搜索法框架圖

      4 結(jié)果分析

      4.1 基礎(chǔ)數(shù)據(jù)分析

      根據(jù)三層搜索法的層結(jié)構(gòu)描述,各層的相似因子會受到不同時間尺度的氣象條件影響。為了更好地描述不同層的降雨相關(guān)特征,需要分析各層相似因子不同時間尺度下提取值,以選擇最優(yōu)時間尺度上的特征提取值。

      為了選取每層相似因子提取值的最優(yōu)時間尺度,本文采用每層最能影響降雨過程的相似因子與其他因子的相關(guān)系數(shù)作為時間尺度的衡量標準。每層因子在不同時間尺度上的提取值通過使用離散小波變換而得到。在第一層,所有站點提取值的相關(guān)系數(shù)在128 d的時間尺度上達到最高值。這128 d的長時間尺度可被認為是合理的:①雖然降水過程是一個中尺度大氣過程,但它可能會受到大尺度現(xiàn)象的影響,包括云的形成、冷暖鋒碰撞等。②在三層設(shè)計中,第一層中的因子被用作收集在大尺度上具有相似極端降雨相關(guān)大氣特性的站點。③研究表明,與極端事件相關(guān)的大氣運動、或?qū)α饔行菽芟嚓P(guān)的特征,都與西非和印度季風(fēng)的季節(jié)性遷移具有強烈的季節(jié)性相關(guān)性[28-29]。在第二層,對于大多數(shù)的站點而言,相關(guān)系數(shù)在時間尺度為64 d 達到最大值,則64 d 被用作在第二層的時間尺度。在第三層中,由于同質(zhì)群體的形成主要是依靠24 h的降雨序列作為判斷,第三層的特征提取值采用24 h 作為時間尺度。不同時間尺度上的特征值提取值的相關(guān)分析只在第一層和第二層中進行。

      圖4 和圖5 顯示了各站點相似因子之間的相關(guān)系數(shù)存在空間差異。盡管在每個站點,其在第一層或第二層的相似因子分別在128 d 或64 d 的時間尺度取得與最能影響降雨過程的相似因子最高的相關(guān)系數(shù)值,但這些相關(guān)值在不同站點上仍存在重大差異。這一結(jié)果在另一方面也證明,不同站點上的降雨相似性指標存在空間差異。

      圖4 第一層不同站點上可能相似因子間的相關(guān)系數(shù)

      圖5 第二層不同站點上可能相似因子間的相關(guān)系數(shù)

      4.2 對比分析

      在研究區(qū)域,本文通過趨勢檢驗法,篩選出75個站點具有平穩(wěn)序列特征,提取不同時間尺度上的特征值,用其進行同質(zhì)群體組建,得出以下結(jié)論:

      (1)模糊聚類法和影響區(qū)域法同樣有效的。對兩種方法得到的在不列顛哥倫比亞省中的75 個雨量站里,49 個站點使用模糊聚類法所得到置信區(qū)間會比使用影響區(qū)域法得到的要窄。

      (2)改進三層搜索算法較原始算法產(chǎn)生更優(yōu)的同質(zhì)群體。本文使用區(qū)域分位點估計值與真值的均方根誤差(RMSE)作為同質(zhì)群體的比較。此處的真值指用單站點頻率估計法得到的不同回歸期下的降雨強度分位點。單站點頻率估計法通常適用于擁有長序列資料的站點[30]。分別在2 a、5 a、10 a、25 a、50 a 和100 a 的重現(xiàn)期得到對應(yīng)的區(qū)域估計值和單點估計值,最終取這6個回歸期的均方根誤差的平均值作為判斷標準。較優(yōu)的同質(zhì)群體會具有較低的均方根誤差值。采用同質(zhì)群體間的對比方法進行均方根誤差值的比較,改進算法在研究區(qū)域的75 個站點中的63 個站點能產(chǎn)生更優(yōu)的同質(zhì)群體。

      (3)改進三層搜索算法較傳統(tǒng)區(qū)域頻率分析法產(chǎn)生更優(yōu)的同質(zhì)群體。傳統(tǒng)的區(qū)域頻率分析法通常采用距目標站點的地理距離作為收集同質(zhì)群體的相似指標。此處同樣將區(qū)域分位點估計值與真值的均方根誤差作為同質(zhì)群體的比較。圖6顯示了在6個回歸期上,分別由改進方法和傳統(tǒng)地理方法得出的同質(zhì)群體的均方根誤差值之間的比率。其中由于在改進算法的搜索過程,均方根誤差在6個回歸期的平均值被作為指引,導(dǎo)致圖6中處于低回歸期均方根誤差比值在1以上,但在其他回歸期上改進法所提供的同質(zhì)群體都會產(chǎn)生較低的均方根誤差。

      圖6 傳統(tǒng)區(qū)域頻率分析法和改進三層搜索法在均方根誤差值上的對比(4)改進三層搜索算法較單站點頻率分析法提供的結(jié)果不確定性更低。此處使用分位點的置信區(qū)間寬度作為衡量標準進行比較。對于分位點的置信區(qū)間寬度估計,區(qū)域頻率分析法通過對線性矩的大樣本模擬而進行估計,單站點頻率分析則假設(shè)其置信區(qū)間的寬度服從正態(tài)分布并使用非參數(shù)抽樣法進行估計[7]。圖7表明,在高回歸期,所有臺站的置信區(qū)間的寬度比中值均低于1,因此改進算法產(chǎn)生的大多數(shù)同質(zhì)群體在6個重現(xiàn)期上產(chǎn)生較低的不確定性,即較窄的置信區(qū)間的寬度。

      圖6 傳統(tǒng)區(qū)域頻率分析法和改進三層搜索法在RMSE值上的對比

      圖7 原三層搜索法和改進三層搜索法在置信區(qū)間寬度上的對比

      為了進一步證明改進算法的有效性,本文對75個站點得到的相似因子組合進行了聚類分析,并得到以下結(jié)論:

      (1)對于第一、二層的75個站點的相似因子組合,聚類分析得到的有效群體數(shù)都為2。此結(jié)論與前兩層改進算法的設(shè)計目的一致:在第一層,區(qū)分積雨云或雨云引起的極端降雨事件;在第二層,區(qū)分對流降雨和層狀降雨的目的。

      (2)第一、二層中的聚類分析中,各群體中心的相似因子組合之間存在相同因子,如表2所示。對于第一、二層,從宏觀和區(qū)域尺度上看,相近的地理位置意味著相似的氣候特性,進而導(dǎo)致不同群體中云和雨的形成機制存在一定程度的相似性。

      表2 第一層、第二層群體中心相似因子組合

      5 結(jié) 論

      考慮到氣候變化和城市化的影響,改進的三層搜索算法,能夠進一步考慮極端降雨強度在空間上的差異性,形成最優(yōu)的同質(zhì)群體,降低降雨強度分位點的不確定性。本文提出了兩點改進:①考慮相似因子之間非線性相關(guān)性,等距特征映射取代特征加權(quán)方法,提取相似因子間的非冗余信息,作為目標站點的降雨相似性指標。②影響區(qū)域法作為一種額外的同質(zhì)群體形成方法,提高同質(zhì)群體的形成結(jié)果。

      改進后的版本已經(jīng)在加拿大的不列顛哥倫比亞省中的兩種氣候進行了大量的測試。與傳統(tǒng)的地理方法相比,改進法提高了同質(zhì)群體的組成,降低了區(qū)域頻率估計值的不確定性。但此法的最大弊端在于搜索過程需要大量計算,耗時較長。

      猜你喜歡
      同質(zhì)置信區(qū)間時間尺度
      時間尺度上非完整系統(tǒng)的Noether準對稱性與守恒量
      定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
      時間尺度上Lagrange 系統(tǒng)的Hojman 守恒量1)
      p-范分布中參數(shù)的置信區(qū)間
      交直流混合微電網(wǎng)多時間尺度協(xié)同控制
      能源工程(2021年1期)2021-04-13 02:06:12
      多個偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
      列車定位中置信區(qū)間的確定方法
      “形同質(zhì)異“的函數(shù)問題辨析(上)
      大連市暴雨多時間尺度研究分析
      同質(zhì)異構(gòu)交聯(lián)法對再生聚乙烯的改性研究
      中國塑料(2016年11期)2016-04-16 05:26:02
      上虞市| 东乡族自治县| 栖霞市| 皋兰县| 肥城市| 海阳市| 密山市| 惠来县| 宣化县| 泸水县| 化隆| 云南省| 略阳县| 洪泽县| 江孜县| 益阳市| 信宜市| 太和县| 徐闻县| 建瓯市| 平乐县| 县级市| 二连浩特市| 罗定市| 吉林省| 舞阳县| 吉木萨尔县| 侯马市| 公主岭市| 凌海市| 合作市| 噶尔县| 花莲县| 兰溪市| 神木县| 鹿邑县| 海伦市| 蓝山县| 沙河市| 乐平市| 宁津县|