• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于自組織特征映射網(wǎng)絡-隨機森林模型的滑坡易發(fā)性評價
      ——以江西大余縣為例

      2022-03-10 05:38:30鮮木斯艷阿布迪克依木
      關鍵詞:易發(fā)柵格斜坡

      何 書,鮮木斯艷·阿布迪克依木,胡 萌,陳 康

      (1. 江西理工大學資源與環(huán)境工程學院, 江西 贛州 341000;2. 離子型稀土資源開發(fā)及應用教育部重點實驗室(江西理工大學), 江西 贛州 341000)

      0 引言

      近年來,基于數(shù)據(jù)驅(qū)動的滑坡易發(fā)性評價已成為區(qū)域滑坡評價領域的熱點和重點[1]。各種常規(guī)統(tǒng)計模型和機器學習算法廣泛應用于滑坡易發(fā)性評價,前者基于對數(shù)據(jù)樣本的統(tǒng)計分析,后者則基于某種學習算法對訓練樣本進行建模。

      常規(guī)統(tǒng)計模型對樣本數(shù)量要求更高,而機器學習算法通??筛鶕?jù)相對更少的樣本數(shù)據(jù),利用模型的泛化能力進行區(qū)域預測,因而受到更為廣泛的關注[2]。因此,在針對樣本不足,區(qū)域面積較大的評價中,機器學習算法往往被視為更好的選擇。常見的機器學習算法包括:神經(jīng)網(wǎng)絡[3]、模糊推理[4]、決策樹[5]、支持向量機[6?7]、隨機森林[8]、邏輯回歸[9]等,不同算法有不同的建模過程與預測精度,在實際應用過程中,需要評價者選擇合適的方法。各種算法均有優(yōu)缺點,為彌補單一方法的不足,將多種方法融合用于滑坡易發(fā)性評價,越來越受到歡迎[10?13]。

      機器學習算法在滑坡空間預測建模過程中通常需要非滑坡樣本,在實際應用中,往往基于人為經(jīng)驗或隨機方法進行選取[14],難免造成部分位于高易發(fā)區(qū)的樣本被列為非滑坡樣本。為克服非滑坡樣本選擇的主觀性,部分研究嘗試利用聚類方法事先進行初步的易發(fā)性分區(qū),再進行非滑坡樣本的選取[15?17]。 黃發(fā)明等[18]研究表明,基于聚類方法的非滑坡樣本選取方法對于樣本優(yōu)化具有一定價值,聚類方法本身的預測精度對非滑坡樣本選取具有顯著的控制作用。

      現(xiàn)有研究表明,評價單元選取對滑坡易發(fā)性評價結(jié)果有重要影響[15]。在非滑坡樣本選取過程中,已有研究多采用柵格單元進行前期的易發(fā)性評價。為此,為進一步探討評價單元和非滑坡樣本選取方法對滑坡敏感性評價的影響,以斜坡單元劃分為基礎,將柵格單元和斜坡單元有機融合,基于自組織特征映射網(wǎng)絡(以下簡稱SOM)和隨機森林模型,構(gòu)建滑坡易發(fā)性評價模型,并通過應用實例開展相關對比分析研究,探討評價方法的有效性。

      1 研究方法

      1.1 SOM網(wǎng)絡

      自組織特征映射網(wǎng)絡(SOM網(wǎng)絡)屬于無導師、自組織、自學習網(wǎng)絡,可根據(jù)輸入向量的分組進行學習和分類,降低了人工干預程度,運算過程可以自動調(diào)節(jié)[19]。典型的自組織特征映射網(wǎng)絡結(jié)構(gòu)由輸入層和競爭層組成,輸入層向量和競爭層神經(jīng)元的距離由式(1)計算[20]:

      式中:dj——距離;

      X——輸入向量;

      Wj——第j個神經(jīng)元的權值向量;

      m——輸入向量的個數(shù);

      xi——第i個輸入向量;

      ωij——第i個輸入向量和第j個競爭層之間的權值。

      在學習過程中,通過不斷修正 ωij,最終完成SOM訓練目標。

      1.2 隨機森林模型

      隨機森林模型的實質(zhì)是包含多個決策樹的分類器,利用隨機方法構(gòu)建決策樹,而決策樹之間沒有關聯(lián)。隨機森林通常采用Bootstrap法進行重采樣,形成新的樣本集后,利用樣本集生成對應的決策樹,然后針對測試樣本,利用決策樹得到每個決策樹的分類結(jié)果,最后采用投票的方法進行分類。由于每個樹的訓練樣本及節(jié)點分裂屬性均為隨機選取,在一定程度上避免了模型的過擬合[21]。 近年來,利用隨機森林方法進行滑坡易發(fā)性評價逐漸受到重視[22]。

      1.3 基于斜坡單元的SOM-隨機森林模型

      進行滑坡易發(fā)性評價,制圖單元的選擇至關重要[23],目前應用最為廣泛當屬柵格單元和斜坡單元[24],二者均有各自的優(yōu)缺點。柵格單元對數(shù)據(jù),特別是DEM數(shù)據(jù)的精度要求較高[25],柵格單元數(shù)據(jù)在制圖過程中,數(shù)據(jù)提取方便,評價結(jié)果相對更為精確,但柵格單元并不代表實際地形地貌,且空間分布零碎,存在與評價因子之間相關性較差的問題[26]。與此同時,斜坡單元的評價指標值一般通過計算單元內(nèi)柵格值的平均值求取[27?28]。當評價區(qū)域面積較大,斜坡單元規(guī)模通常遠大于實際滑坡規(guī)模,因此斜坡單元指標值不能很好的反映滑坡影響因子,從而造成較大誤差。為彌補兩種評價單元的不足,文中將柵格單元和斜坡單元進行整合,并以此為基礎構(gòu)建SOM-隨機森林評價模型。

      模型評價步驟(具體流程見圖1):(1)選取滑坡易發(fā)性評價指標,對研究區(qū)進行斜坡單元劃分,提取單元各指標的滑坡頻率;(2)利用SOM神經(jīng)網(wǎng)絡進行滑坡易發(fā)性分區(qū),在易發(fā)性較低地區(qū)選取非滑坡訓練樣本;(3)利用隨機森林分類算法對所有柵格單元進行二值分類(滑坡或非滑坡);(4)統(tǒng)計斜坡單元內(nèi)的滑坡預測比率,進行滑坡易發(fā)性制圖。

      圖1 SOM-隨機森林模型流程Fig.1 Flow chart of SOM-vandom forest model

      2 研究區(qū)概況及評價指標分析

      2.1 研究區(qū)概況

      大余縣位于江西省贛州市西南部,總面積1 367.63 km2,區(qū)內(nèi)以丘陵地貌為主,屬典型的丘陵盆地(圖2)。地勢西高東低,西部和北部中低山海拔在800 m以上,中部丘陵一般在500 m以下,東部盆地地勢平坦,海拔低于200 m。區(qū)內(nèi)年平均氣溫20.54℃,年均降雨量1 454 mm,多雨季節(jié)集中在3?8月。大余盆地地質(zhì)條件復雜,構(gòu)造活動強烈,褶皺及裂隙發(fā)育,巖漿活動頻繁,地層出露以寒武系淺變質(zhì)巖及第四系沖、殘、坡積層為主。區(qū)內(nèi)人類活動頻繁,路塹邊坡開挖成為誘發(fā)滑坡的主要因素之一。綜上,大余縣降雨集中、地形地貌及地質(zhì)條件復雜、人類活動頻繁,為滑坡災害頻發(fā)提供了環(huán)境基礎。因此,文章將該區(qū)域作為驗證評價方法的典型地區(qū)。

      圖2 研究區(qū)地理位置及滑坡空間分布圖Fig.2 Location of the study area and landslide distribution

      2.2 數(shù)據(jù)來源及評價指標體系

      主要數(shù)據(jù)來源包括:(1)GDEMV2 30m分辨率數(shù)字高程數(shù)據(jù),用于提取坡度、坡向、水文等信息,來源于地理空間數(shù)據(jù)云(http://www.gscloud.cn/sources/accessdata);(2)1∶20萬區(qū)域地質(zhì)圖來源于全國地質(zhì)資料館(http://www.ngac.org.cn/Map),用于提取巖土分布類型;(3)Landsat8影像2景來源于地理空間數(shù)據(jù)云(http://www.gscloud.cn/sources/accessdata),用于提取植被指數(shù)、土地利用類型等信息;(4)歷史滑坡數(shù)據(jù),來源于中國地質(zhì)環(huán)境監(jiān)測院編制的中國典型縣(市)地質(zhì)災害易發(fā)程度分區(qū)圖集以及野外滑坡編錄,用于滑坡解譯及滑坡頻率統(tǒng)計;(5)Google衛(wèi)星地圖,用于道路提取及水文校正。結(jié)合大余縣滑坡發(fā)育特征,選擇評價因子,并利用相關因子系數(shù)分析和平均影響值算法(Mean Impact Value,MIV)對SOM神經(jīng)網(wǎng)絡進行變量篩選,剔除部分次要因子,最終選取10個評價因子,分別為高程、植被歸一化指數(shù)(NDVI)、土地利用類型、坡度、總曲率、巖土類型、道路密度、距道路的距離、距水系的距離、距斷層的距離。未納入評價指標體系的指標如坡向,根據(jù)對歷史滑坡點的調(diào)查分析表明,研究區(qū)內(nèi)滑坡以淺層滑坡為主,與坡向的關聯(lián)度較低?;贛IV算法的變量篩選,優(yōu)化了神經(jīng)網(wǎng)絡的網(wǎng)絡結(jié)構(gòu),提高了模型的預測精度,剖面曲率和平面曲率被排除在評價指標體系之外。參與 滑坡預測模型構(gòu)建的評價指標及分類分級結(jié)果見表1。

      表1 評價指標體系Table 1 Evaluation index system

      3 滑坡易發(fā)性評價

      3.1 柵格及斜坡單元的劃分與評價指標制圖

      所有評價指標均基于ArcGIS軟件進行處理及提取,制成專題圖(圖3),柵格單元大小設為30 m×30 m,研究區(qū)共劃分為1 487 829個柵格。對于面積超過900 m2的滑坡,以滑坡周界代替柵格單元,參與指標值提取。斜坡單元采用DEM水文分析模型劃分,流量閾值設為1 000,斜坡單元平均面積約0.59 km2,利用Google衛(wèi)星地圖進行校正,經(jīng)人工反復修編,共劃分為2 312個斜坡單元。

      圖3 各指標特征空間分布Fig.3 Spatial distribution of the factors

      3.2 基于斜坡單元的滑坡易發(fā)性指數(shù)優(yōu)化算法

      現(xiàn)有歷史滑坡數(shù)據(jù)是滑坡易發(fā)性評價最重要的參考信息,通過對該數(shù)據(jù)統(tǒng)計分析,可初步獲得不同評價指標對滑坡發(fā)生的貢獻率,其中相對滑坡頻率被廣泛應用于神經(jīng)網(wǎng)絡預測模型中[29],基于柵格單元賦值,計算公式如下:

      式中:RPij——某因子i在某區(qū)間j中出現(xiàn)的相對頻率;

      Pij——第i個因子在第j區(qū)間中出現(xiàn)的滑坡頻率;

      Pi——第i個因子的滑坡頻率之和。

      一般地,可將RPij作為神經(jīng)網(wǎng)絡模型的輸入向量,同時將斜坡單元各指標的相對滑坡頻率之和(Z)作為輸出向量,進而構(gòu)建神經(jīng)網(wǎng)絡模型。

      由于模型輸出值與各指標相對頻率之和(Z)密切相關,通過神經(jīng)網(wǎng)絡模型,將輸入向量和輸出向量之間的線性關系演變?yōu)榉蔷€性關系,目的在于尋求各指標相對權重大小。然而,因樣本數(shù)量限制,預測模型的泛化能力將受到明顯影響,理論上樣本數(shù)量越多,代表性越強,模型泛化能力越強。若將輸出向量設為0和1,0代表非滑坡,1代表滑坡,則建模過程將得到較大簡化,因模型泛化過程僅為二值分類,對模型精度的要求明顯降低。因此,在樣本數(shù)相同的情況下,基于相同的方法,二值分類的泛化能力將更高。

      相對于單一滑坡而言,本次劃分的斜坡單元面積偏大,以柵格平均值計算斜坡單元值,顯然會造成較大誤差。因此,為保證評價精度,提出以下斜坡單元易發(fā)性指數(shù)計算方法:

      式中:ZX——斜坡單元的滑坡易發(fā)性指數(shù);

      n ——被判為滑坡的柵格單元數(shù);

      N——斜坡單元總的柵格數(shù)。

      最后將所有斜坡單元的ZX映射到[0,1]之間,以制作滑坡易發(fā)性分區(qū)圖。

      3.3 基于SOM的滑坡易發(fā)性分區(qū)與樣本選取

      利用機器學習算法進行滑坡易發(fā)性預測,需要獲取與滑坡樣本數(shù)量相等的非滑坡樣本,非滑坡樣本的選擇要求避開滑坡點,為比較不同非滑坡樣本選取方法對滑坡預測的影響,現(xiàn)分別采用SOM神經(jīng)網(wǎng)絡聚類和較為常見的隨機選取方法獲取非滑坡樣本,其中隨機選取方法不考慮非滑坡點所在區(qū)域的易發(fā)性程度。通過資料收集和野外調(diào)查,共獲取137個滑坡點歷史數(shù)據(jù),因此需獲取相同數(shù)量的非滑坡點數(shù)據(jù)。利用隨機選取方法進行采樣時,盡量保持與滑坡樣本一定緩沖距離,并盡可能均勻布點。

      首先利用SOM模型對研究區(qū)進行滑坡易發(fā)性初步分區(qū),非滑坡點全部選擇在易發(fā)性等級最低的地區(qū)。具體流程為:(1)首先利用SOM對研究區(qū)進行自組織、無導師分類,然后利用式(2)統(tǒng)計各分區(qū)的相對頻率,按照相對頻率高低分別劃分為高易發(fā)區(qū)、較高易發(fā)區(qū)、中等易發(fā)區(qū)、較低易發(fā)區(qū)和低易發(fā)區(qū)5個區(qū);(2)在低易發(fā)區(qū)均勻選取非滑坡樣本。滑坡易發(fā)性分區(qū)及非滑坡點的選取結(jié)果如圖4(a)所示。

      圖4 滑坡易發(fā)性分區(qū)結(jié)果Fig.4 Zoning map of landslide susceptibility

      3.4 滑坡易發(fā)性分區(qū)及結(jié)果分析

      由137個滑坡樣本和以上兩種方法選取的137個非滑坡樣本分別構(gòu)成隨機森林模型和SOM-隨機森林模型的基礎樣本,其中100個作為訓練樣本,37個作為測試樣本,采用TreeBagger隨機森林分類器構(gòu)建滑坡易發(fā)性預測模型。決策樹數(shù)目均設為500,訓練誤差曲線見圖5。測試樣本的預測準確率分別達到94.59%(隨機森林)和95.95%(SOM-隨機森林)。將1 487 829個柵格單元各指標數(shù)據(jù),分別輸入訓練好的隨機森林和SOM-隨機森林模型中,獲取每一個柵格單元的滑坡預測結(jié)果。然后利用式(3)統(tǒng)計各斜坡單元的滑坡易發(fā)性指數(shù),在ArcGIS軟件中利用自然斷點法進行滑坡易發(fā)性分級,得到易發(fā)性評價圖4(b)、圖4(c)。隨機森林模型收斂速度較快,對大樣本的運算也非常迅速,1 487 829個柵格單元的運算總用時僅為4 min左右。對比SOM、隨機森林和SOM-隨機森林3種評價模型的分區(qū)結(jié)果發(fā)現(xiàn)(表2),SOM模型與其余兩種模型的評價結(jié)果相差較大,較高和高易發(fā)區(qū)的滑坡頻率占比僅為68.87%,同時其低易發(fā)區(qū)的分布面積明顯小于隨機森林和SOM-隨機森林模型的分區(qū)結(jié)果,且位于后兩種方法的低易發(fā)區(qū)內(nèi)。因此,單獨SOM神經(jīng)網(wǎng)絡對于易發(fā)性分區(qū)而言,精度略顯不足,但作為非滑坡樣本的選擇依據(jù),完全能夠滿足選擇需要。隨機森林模型和SOM-隨機森林模型分區(qū)結(jié)果中,較高和高易發(fā)區(qū)的滑坡頻率占比分別為91.19% 和94.94%,表明二者均很好的評價了研究區(qū)的滑坡易發(fā)性。從分區(qū)面積及占比看,由圖4統(tǒng)計,隨機森林模型中,較高和高易發(fā)區(qū)的面積分別為152.83 km2和373.34 km2,占比分別為11.41%和27.88%;SOM-隨機森林模型中分別為152.12 km2和380.21 km2,占比為11.36%和28.39%,其余三個等級的滑坡易發(fā)性分區(qū)面積也十分接近。

      表2 不同滑坡易發(fā)性分區(qū)的滑坡頻率Table 2 Landslide frequency in different landslide susceptibility zones

      圖5 模型誤差與決策樹數(shù)量關系Fig.5 Relationship between model error and decision tree quantity

      為檢驗以上評價模型對大余縣滑坡易發(fā)性評價結(jié)果的準確性,選用成功率曲線對結(jié)果進行驗證,線下面積大小反映了模型的預測準確性,越接近1準確性越高[30]。由圖6可知,SOM、隨機森林和SOM-隨機森林三種模型的線下面積(AUC)分別為0.688、0.822和0.849。檢驗結(jié)果表明,單獨的SOM進行滑坡易發(fā)性分區(qū),準確率偏低,單獨隨機森林模型的預測率則低于SOM-隨機森林模型約2.7%,表明基于SOM的非滑坡樣本選擇能夠有效提高隨機森林模型的預測精度。

      圖6 滑坡易發(fā)性預測成功率曲線Fig.6 Success rate curves of landslide susceptibility indexes

      4 結(jié)論

      以大余縣為例,對比分析SOM神經(jīng)網(wǎng)絡和傳統(tǒng)隨機選取非滑坡樣本方法,基于斜坡單元構(gòu)建滑坡易發(fā)性評價模型,并得出以下結(jié)論:

      (1)單獨利用SOM神經(jīng)網(wǎng)絡進行滑坡易發(fā)性預測,預測精度有限,但分區(qū)結(jié)果作為非滑坡樣本選擇依據(jù),能使樣本選擇更加合理。

      (2)將柵格單元滑坡預測結(jié)果與斜坡單元相結(jié)合,提出了一種滑坡易發(fā)性指數(shù)計算方法,該方法簡單易用,運算快速,同時避免了因柵格單元較小而引起評價結(jié)果空間分布零散的缺點,使斜坡單元評價結(jié)果的物理意義更加明確。

      (3)對比分析隨機森林模型和SOM-隨機森林模型的評價結(jié)果,較高易發(fā)區(qū)和高易發(fā)區(qū)的滑坡頻率占比分別為90.19%和94.94%,根據(jù)預測成功率曲線,AUC值分別達到0.822和0.849,表明SOM-隨機森林模型的評價精度比隨機森林模型有一定提高。

      致謝:中國科學院計算機網(wǎng)絡信息中心地理空間數(shù)據(jù)云提供的遙感和DEM數(shù)據(jù)。

      猜你喜歡
      易發(fā)柵格斜坡
      機用鎳鈦銼在乳磨牙根管治療中的應用
      貴州省地質(zhì)災害易發(fā)分區(qū)圖
      大眾科學(2022年5期)2022-05-18 13:24:20
      夏季羊易發(fā)疾病及防治方法
      基于鄰域柵格篩選的點云邊緣點提取方法*
      冬季雞腸炎易發(fā) 科學防治有方法
      信仰的“斜坡”
      當代陜西(2019年6期)2019-04-17 05:03:50
      夢是長長的斜坡(外一首)
      天津詩人(2017年2期)2017-11-29 01:24:12
      不同剖面形狀的柵格壁對柵格翼氣動特性的影響
      基于CVT排布的非周期柵格密度加權陣設計
      雷達學報(2014年4期)2014-04-23 07:43:13
      無軌斜坡道在大紅山鐵礦中的應用
      东安县| 蒲城县| 长寿区| 乳源| 长武县| 肥西县| 眉山市| 沁源县| 屏山县| 贞丰县| 临夏县| 嘉善县| 沅陵县| 西峡县| 武胜县| 云梦县| 林周县| 吐鲁番市| 静安区| 九龙坡区| 瓦房店市| 沙湾县| 景德镇市| 磴口县| 山东省| 临夏市| 蒙自县| 炎陵县| 喀喇沁旗| 柳江县| 泰州市| 南投市| 阳山县| 潜江市| 徐州市| 黄浦区| 罗山县| 建平县| 日喀则市| 商都县| 永昌县|