• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于頻率比-隨機(jī)森林模型的滑坡易發(fā)性評價(jià)

      2021-01-08 07:31:40鄧念東崔陽陽郭有金
      科學(xué)技術(shù)與工程 2020年34期
      關(guān)鍵詞:易發(fā)滑坡災(zāi)害

      鄧念東,崔陽陽,郭有金

      (西安科技大學(xué)地質(zhì)與環(huán)境學(xué)院,西安 710054)

      滑坡是中國山地丘陵地區(qū)一種常見的地質(zhì)災(zāi)害,嚴(yán)重威脅著區(qū)域基礎(chǔ)設(shè)施和人員的安全。根據(jù)中國地質(zhì)環(huán)境監(jiān)測院《2018年全國地質(zhì)災(zāi)害通報(bào)》顯示,2018年全國共發(fā)生滑坡1 631起,造成112人死亡,直接經(jīng)濟(jì)損失達(dá)14.7億元。因此,開展滑坡易發(fā)性研究,預(yù)測區(qū)域滑坡發(fā)生的概率,已成為當(dāng)前地質(zhì)災(zāi)害防治領(lǐng)域內(nèi)的研究熱點(diǎn)??傮w上而言,滑坡易發(fā)性可概括為:在一定的時(shí)空領(lǐng)域內(nèi),在一系列地質(zhì)環(huán)境因素的耦合作用下,發(fā)生滑坡的可能性[1-3]。近年來,中外眾多學(xué)者開始研究滑坡易發(fā)性,從其所采用的研究方法來看,可大致分為三種類型:統(tǒng)計(jì)學(xué)模型、機(jī)器學(xué)習(xí)模型和耦合模型。

      王文俊等[4]基于GIS(geographic information system)平臺,采用模糊綜合評判法開展四川省珙縣崩塌、滑坡易發(fā)性研究,其研究結(jié)果與實(shí)際情況較為吻合。石松菊等基于RS(remote sensing)與GIS平臺,采用空間信息量法,以鄂西清江流域隔河巖水庫庫區(qū)為例開展庫區(qū)滑坡易發(fā)性研究,結(jié)果顯示73.17%的已知滑坡分布于滑坡高易發(fā)區(qū)內(nèi),表明研究結(jié)果的準(zhǔn)確性較高[5]。許沖等[6]基于層次分析法,在汶川震后災(zāi)區(qū)滑坡遙感解譯的基礎(chǔ)上進(jìn)行滑坡易發(fā)性研究,該研究為汶川震后重建、減輕未來可能遭受的滑坡災(zāi)害提供了可靠的依據(jù)。郭靖[7]以黔西玄武巖地區(qū)為例,采用二元邏輯回歸模型進(jìn)行滑坡易發(fā)性研究,結(jié)果表明83.23%的滑坡位于極高(高)易發(fā)區(qū),評價(jià)結(jié)果與滑坡分布基本一致,驗(yàn)證了研究結(jié)果的可靠性。Bi等[8]以三峽庫區(qū)為研究區(qū),在實(shí)地調(diào)查、統(tǒng)計(jì)分析的基礎(chǔ)上采用人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行滑坡易發(fā)性研究。Regmi等[9]采用雙變量模型對尼泊爾震后災(zāi)區(qū)滑坡易發(fā)性展開研究,結(jié)果顯示模型的預(yù)測率為0.87,表明該模型的預(yù)測結(jié)果與滑坡數(shù)據(jù)吻合度較高,研究結(jié)果可為震后災(zāi)區(qū)防災(zāi)減災(zāi)提供參考依據(jù)。郝國棟[10]基于GIS平臺,以商南縣為研究區(qū),采用隨機(jī)森林算法開展滑坡易發(fā)性研究,研究結(jié)果可為滑坡風(fēng)險(xiǎn)管理和城市規(guī)劃提供科學(xué)依據(jù)。

      盡管中外學(xué)者針對滑坡易發(fā)性展開了一系列研究,也取得了諸多成果,如研究的層次逐漸明朗、滑坡影響因子的選取逐漸規(guī)范化等。但在研究方法的選擇上仍存在一定的不足之處,如長期依靠單一模型[11-12]。基于此,以陜西省洋縣為研究區(qū),采用統(tǒng)計(jì)學(xué)模型——頻率比(frequency ratio, FR)、機(jī)器學(xué)習(xí)模型——隨機(jī)森林(random forest, RF)及兩者的耦合模型(FR-RF)進(jìn)行滑坡易發(fā)性研究。進(jìn)而探索不同類型的模型及其耦合模型在滑坡易發(fā)性研究中的表現(xiàn)差異。研究結(jié)果可為研究區(qū)防災(zāi)減災(zāi)提供參考借鑒。

      1 研究區(qū)概況

      洋縣位于陜西省南部,地處秦巴山區(qū),地質(zhì)災(zāi)害頻發(fā)。地理位置為東經(jīng)107°11′~108°33′,北緯33°03′~33°43′。東西長92.8 km,南北寬72.7 km,總面積3 206 km2。全縣地勢呈東北高陡,南部低平,區(qū)內(nèi)最高海拔2 951 m,最低海拔234 m。地貌可分為中山區(qū)、低山區(qū)、丘陵區(qū)和河谷階地區(qū)四類。洋縣屬于北亞熱帶內(nèi)陸性季風(fēng)氣候,多年平均氣溫14.5 ℃。境內(nèi)河流眾多,均為長江水系,其中主要以漢江、湑水河、溢水河及其支流水系為主。區(qū)內(nèi)構(gòu)造活動(dòng)頻繁,構(gòu)造形跡交織復(fù)雜,以復(fù)式背斜、向斜為主,巖層中小褶曲較為發(fā)育,斷裂構(gòu)造多為陡傾斜的走向斷層。據(jù)2018年陜西省地質(zhì)災(zāi)害詳查結(jié)果顯示,研究區(qū)在冊滑坡115處,研究區(qū)地理位置及滑坡分布如圖1所示。

      2 研究模型

      2.1 頻率比模型

      首先引入滑坡易發(fā)性研究中常用的統(tǒng)計(jì)學(xué)模型——頻率比模型來進(jìn)行滑坡易發(fā)性分區(qū)研究。頻率比的概念可簡要概括為:某一因子分類區(qū)間內(nèi)滑坡像素占所有滑坡像素百分比與該區(qū)間像素占研究區(qū)所有像素百分比的比值。簡而言之,頻率比是通過因子分類區(qū)間的滑坡比除以面積比獲得[13-14]。當(dāng)比值大于1時(shí),表明該因子區(qū)間有利于滑坡發(fā)生。當(dāng)比值小于1時(shí),表明該因子區(qū)間不利于滑坡發(fā)生。當(dāng)比值等于1時(shí),表明難以判斷。由于頻率比模型概念簡單;操作方便;計(jì)算結(jié)果通俗易懂,因而被廣泛應(yīng)用于滑坡易發(fā)性研究中。頻率比計(jì)算公式如式(1)所示。

      (1)

      式(1)中:n為因子分類區(qū)間的數(shù)量;NLSpix為因子分類區(qū)間內(nèi)滑坡像素的數(shù)量;NCpix因子分類區(qū)間像素的數(shù)量。

      圖1 研究區(qū)地理位置以及滑坡災(zāi)害點(diǎn)分布Fig.1 Geographical location and landslide points distribution of the study area

      2.2 隨機(jī)森林模型

      隨機(jī)森林模型是當(dāng)前研究中最為常用的一種集成機(jī)器學(xué)習(xí)模型,歸屬于Bagging類型。該模型通過組合多個(gè)弱分類器,進(jìn)而通過投票或取平均值的方法使模型分析結(jié)果具有較高的精確度和泛化性能[15]。隨機(jī)森林采用分類回歸樹作為其弱分類器,該弱分類器的優(yōu)點(diǎn)在于:當(dāng)數(shù)據(jù)集的因變量為連續(xù)型數(shù)值時(shí),該樹算法就是一個(gè)回歸樹,可以用葉節(jié)點(diǎn)觀察的均值作為預(yù)測值;當(dāng)數(shù)據(jù)集的因變量為離散型數(shù)值時(shí),該樹算法就是一個(gè)分類樹,因而可以很好的解決分類問題??傮w上來看,隨機(jī)森林模型具有以下優(yōu)點(diǎn):①訓(xùn)練速度快,可以在大規(guī)模數(shù)據(jù)分析中運(yùn)用;②由于采用了集成算法,其精度比大多數(shù)單一算法高;③由于隨機(jī)性的引入,使得模型不容易陷入過擬合;④能夠處理高維度數(shù)據(jù),并且不用做特征選擇,對數(shù)據(jù)集的適應(yīng)能力強(qiáng):既能處理離散型數(shù)據(jù),也能處理連續(xù)型數(shù)據(jù),數(shù)據(jù)集無需規(guī)范化。

      3 數(shù)據(jù)來源與分析

      3.1 數(shù)據(jù)來源

      用到的數(shù)據(jù)主要有滑坡點(diǎn)數(shù)據(jù)和各滑坡影響因子圖層數(shù)據(jù)。其中滑坡點(diǎn)數(shù)據(jù)從2018年陜西省地質(zhì)災(zāi)害詳查庫內(nèi)獲取。高程、坡度、坡向、地形起伏度和曲率5種滑坡影響因子由分辨率為30 m×30 m分辨率的數(shù)字高程模型(DEM)影像在ArcGIS軟件提取獲得。距水系距離在1∶50 000的水系圖中獲取。距道路距離在91衛(wèi)圖助手中全國矢量路網(wǎng)數(shù)據(jù)庫中獲得。降雨量通過研究區(qū)氣象站獲得原始數(shù)據(jù),并在ArcGIS軟件中插值分析獲取。巖土體類型通過1∶200 000區(qū)域地質(zhì)圖獲得。各滑坡影響因子圖層如圖2所示。

      3.2 滑坡影響因子共線性分析

      在進(jìn)行滑坡易發(fā)性研究前最重要的一步就是分析因子間的相關(guān)性,因子間是否相關(guān)及其相關(guān)性的大小都將直接影響到研究結(jié)果的準(zhǔn)確性。因此,本文采用皮爾森相關(guān)系數(shù)(Pearson correlation coefficient,PCC)來分析因子間的相關(guān)性,PCC絕對值越大,說明因子的相關(guān)性越強(qiáng)。假設(shè)有樣本數(shù)據(jù)集(Xi,Yj)=(x1,y1), (x2,y2),…,(xn,yn),則評價(jià)因子間相關(guān)系數(shù)的計(jì)算公式為

      (2)

      當(dāng)0≤∣PCC∣≤0.3時(shí),表明因子不相關(guān);當(dāng)∣PCC∣>0.3時(shí),表明因子強(qiáng)相關(guān)。因子共線性分析結(jié)果如表1所示。從表1中可以看出,所有因子間相關(guān)系數(shù)的絕對值均小于0.3,即各因子是相互獨(dú)立的。

      4 滑坡易發(fā)性研究

      將研究區(qū)統(tǒng)一劃分為像素尺寸為30 m×30 m的評價(jià)單元,共計(jì)3.56×106個(gè)。在ArcGIS軟件中提取各滑坡災(zāi)害點(diǎn)與研究區(qū)所有評價(jià)單元的滑坡影響因子屬性值,并建立研究區(qū)滑坡影響因子屬性數(shù)據(jù)庫。

      圖2 滑坡影響因子圖層Fig.2 Layers of landslide conditioning factors

      表1 滑坡影響因子間的相關(guān)系數(shù)

      4.1 頻率比模型

      根據(jù)式(1)計(jì)算研究區(qū)所有滑坡影響因子分組的頻率比值,如表2所示。并將其累加得到滑坡易發(fā)性指數(shù)(landslide susceptibility index, LSI),最終通過計(jì)算所得LSI區(qū)間為[2.37, 17.32]。其值越大,表示發(fā)生滑坡的概率越大。相反,其值越小,表明發(fā)生滑坡的概率越小。采用自然間斷點(diǎn)法將其易發(fā)性等級劃分為五類,分別為極低易發(fā)區(qū)[2.37,5.19)、低易發(fā)區(qū)[5.19, 7.24)、中易發(fā)區(qū)[7.24, 9.38)、高易發(fā)區(qū)[9.38, 11.69)、極高易發(fā)區(qū)[11.69, 17.32],生成的滑坡易發(fā)性分區(qū)如圖3所示。其中,極高-高易發(fā)區(qū)占研究區(qū)面積的32.37%,其內(nèi)滑坡數(shù)量占滑坡總數(shù)量的73.91%,研究結(jié)果表明頻率比模型所繪制的滑坡易發(fā)性分區(qū)圖與現(xiàn)有滑坡災(zāi)害點(diǎn)一致性較高,該模型適用性較好。

      表2 滑坡影響因子分組頻率比值

      4.2 隨機(jī)森林模型

      將滑坡災(zāi)害點(diǎn)與隨機(jī)選取且數(shù)量相同的非滑坡災(zāi)害點(diǎn)組成總訓(xùn)練樣本集,從總訓(xùn)練樣本集中隨機(jī)選取70%的滑坡災(zāi)害點(diǎn)與非滑坡災(zāi)害點(diǎn),共計(jì)162組數(shù)據(jù)作為訓(xùn)練樣本集,其余的作為測試樣本集?;赗-studio軟件平臺,利用隨機(jī)森林模型訓(xùn)練樣本集進(jìn)行學(xué)習(xí),再將學(xué)習(xí)得到的模型用于測試樣本集,得到模型的預(yù)測率為86.63%。隨后將研究區(qū)屬性數(shù)據(jù)庫帶入訓(xùn)練好的模型中,得到基于隨機(jī)森林模型的滑坡災(zāi)害易發(fā)性指數(shù)(LSI),其區(qū)間為[0, 0.97]。采用自然間斷點(diǎn)法將其易發(fā)性等級劃分為五類,分別為極低易發(fā)區(qū)[0, 0.12)、低易發(fā)區(qū)[0.12, 0.28)、中易發(fā)區(qū)[0.28, 0.45)、高易發(fā)區(qū)[0.45, 0.63)、極高易發(fā)區(qū)[0.63, 0.97],生成的滑坡易發(fā)性分區(qū),如圖4所示。其中,極高-高易發(fā)區(qū)占研究區(qū)面積的30.69%,其內(nèi)滑坡數(shù)量占滑坡總數(shù)量的76.52%。對照頻率比模型分區(qū)結(jié)果可知,隨機(jī)森林模型所劃分的極高-高易發(fā)區(qū)較頻率比模型劃分的極高-高易發(fā)區(qū)面積小,但其包含了更多的滑坡災(zāi)害點(diǎn)。表明隨機(jī)森林模型較頻率比模型在滑坡易發(fā)性研究領(lǐng)域內(nèi)有更好的適用性。

      圖3 基于頻率比模型的滑坡易發(fā)性分區(qū)圖Fig.3 Landslide susceptibility map based on frequency ratio model

      圖4 基于隨機(jī)森林模型滑坡易發(fā)性分區(qū)圖Fig.4 Landslide susceptibility map based on random forest model

      4.3 頻率比與隨機(jī)森林的耦合模型

      將式(1)求得的FR值作為輸入數(shù)據(jù)代入隨機(jī)森林模型進(jìn)行學(xué)習(xí),最終得到耦合模型的預(yù)測率為90.10%。然后利用該耦合模型對整個(gè)研究區(qū)滑坡災(zāi)害易發(fā)性進(jìn)行預(yù)測,并得到研究區(qū)滑坡易發(fā)性指數(shù)(LSI),其區(qū)間為[0, 0.99]。同樣采用自然間斷點(diǎn)法將其易發(fā)性等級劃分為五類,分別為極低易發(fā)區(qū)[0, 0.14)、低易發(fā)區(qū)[0.14, 0.33)、中易發(fā)區(qū)[0.33, 0.52)、高易發(fā)區(qū)[0.52, 0.68)和極高易發(fā)區(qū)[0.68, 0.99),生成的滑坡易發(fā)性分區(qū)如圖5所示。其中極高-高易發(fā)區(qū)占研究區(qū)面積的30.08%,其內(nèi)滑坡數(shù)量占滑坡總數(shù)量的78.26%。對比上述兩個(gè)模型分析結(jié)果可知,耦合模型所劃分的極高-高易發(fā)區(qū)面積最小,其所包含的滑坡災(zāi)害點(diǎn)最多。表明耦合模型較單個(gè)模型在滑坡易發(fā)性研究領(lǐng)域內(nèi)有更高的準(zhǔn)確性。

      圖5 基于頻率比與隨機(jī)森林耦合模型的滑坡易發(fā)性分區(qū)圖Fig.5 Landslide susceptibility map based on FR-RF model

      5 模型的檢驗(yàn)與對比

      采用ROC(receiver operating characteristic)曲線對三種模型的性能進(jìn)行檢驗(yàn)與比較,用AUC(area under curve)值分別表示各模型的預(yù)測率,得到各模型預(yù)測率曲線如圖6所示。頻率比模型(FR)、隨機(jī)森林模型(RF)和頻率比與隨機(jī)森林的耦合模型(FR-RF)預(yù)測率曲線的AUC值分別為0.833、0.863和0.901。結(jié)果顯示三種模型在本研究中均表現(xiàn)良好,其中FR-RF模型的預(yù)測率最高,其預(yù)測精度高于單一模型,表明耦合模型在滑坡易發(fā)性研究中的優(yōu)異性能。

      圖6 研究模型預(yù)測率曲線Fig.6 The prediction rate curves of evaluation models

      6 結(jié)論

      分別采用FR模型、RF模型及FR-RF模型對陜西省洋縣的滑坡易發(fā)性進(jìn)行研究,得到如下結(jié)論。

      (1)基于研究區(qū)地質(zhì)環(huán)境特征與前人研究經(jīng)驗(yàn),選取了高程、坡度、坡向、地形起伏度、曲率、距水系距離、距道路距離、降雨量和巖土體類型9個(gè)滑坡易發(fā)性影響因子,并繪制圖層,將各影響因子可視化處理。

      (2)采用皮爾森相關(guān)系數(shù)對各滑坡影響因子間的相關(guān)性進(jìn)行分析。結(jié)果顯示,各影響因子間相關(guān)系數(shù)的絕對值均小于0.3,表明各因子是相互獨(dú)立的。

      (3)FR模型、RF模型及FR-RF模型所劃分的在極高-高易發(fā)區(qū)占整個(gè)研究區(qū)的面積百分比依次為32.37%、30.69%和30.08%。各極高-高易發(fā)區(qū)內(nèi)滑坡數(shù)量占滑坡總數(shù)量的百分比依次為73.91%、76.52%和78.26%。表明FR-RF模型所劃分的極高-高易發(fā)區(qū)更為合理,區(qū)內(nèi)滑坡分布更加集中。

      (4)采用ROC曲線對三種模型的性能進(jìn)行檢驗(yàn)與比較,F(xiàn)R模型、RF模型及FR-RF模型預(yù)測率曲線的AUC值分別為0.833、0.863和0.901,表明隨機(jī)森林模型的預(yù)測精度較頻率比模型高,且兩者耦合模型的預(yù)測精度最高。

      猜你喜歡
      易發(fā)滑坡災(zāi)害
      河南鄭州“7·20”特大暴雨災(zāi)害的警示及應(yīng)對
      機(jī)用鎳鈦銼在乳磨牙根管治療中的應(yīng)用
      貴州省地質(zhì)災(zāi)害易發(fā)分區(qū)圖
      夏季羊易發(fā)疾病及防治方法
      我省汛期常見氣象災(zāi)害及防御
      滑坡推力隱式解與顯式解對比分析——以河北某膨脹土滑坡為例
      冬季雞腸炎易發(fā) 科學(xué)防治有方法
      推動(dòng)災(zāi)害防治工作實(shí)現(xiàn)新跨越
      淺談公路滑坡治理
      北方交通(2016年12期)2017-01-15 13:52:59
      基于Fluent的滑坡入水過程數(shù)值模擬
      南川市| 东辽县| 凌海市| 乌苏市| 舟曲县| 夏邑县| 崇州市| 铁力市| 丹江口市| 阿拉善右旗| 习水县| 抚宁县| 明星| 喀什市| 闻喜县| 江阴市| 观塘区| 龙门县| 苏州市| 荆州市| 深州市| 四平市| 义马市| 齐齐哈尔市| 慈利县| 黔西县| 田林县| 个旧市| 天等县| 三门峡市| 博罗县| 巴塘县| 衡山县| 莱芜市| 潢川县| 南召县| 普宁市| 武陟县| 两当县| 海门市| 鄄城县|