• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于Stacking集成學(xué)習(xí)的泥石流易發(fā)性評(píng)價(jià):以四川省雅江縣為例

      2021-04-07 13:12:44蘇剛秦勝伍喬雙雙扈秀宇陳陽(yáng)車(chē)文超
      世界地質(zhì) 2021年1期
      關(guān)鍵詞:雅江縣易發(fā)泥石流

      蘇剛,秦勝伍,喬雙雙,扈秀宇,陳陽(yáng),車(chē)文超

      吉林大學(xué) 建設(shè)工程學(xué)院,長(zhǎng)春 130000

      0 引言

      泥石流是山區(qū)最容易發(fā)生的地質(zhì)災(zāi)害之一,主要由于突然性的暴雨等極端天氣引發(fā)。近年來(lái),泥石流已被公認(rèn)為是全世界最主要的自然風(fēng)險(xiǎn),會(huì)造成許多人員傷亡和經(jīng)濟(jì)損失,例如2008年在四川汶川就曾發(fā)生過(guò)由于地震引發(fā)的嚴(yán)重泥石流災(zāi)害,造成了巨大的損失[1]。雅江縣隸屬于四川省甘孜州,為高山深切峽谷地貌,地形起伏較大,雅礱江將研究區(qū)深切為東西兩半,加上夏季暴雨影響,存在大量泥石流地質(zhì)災(zāi)害。為減少泥石流災(zāi)害帶來(lái)的損失,有必要對(duì)泥石流進(jìn)行易發(fā)性評(píng)價(jià),以達(dá)到預(yù)防目的,為雅江縣泥石流監(jiān)測(cè)預(yù)警和風(fēng)險(xiǎn)管理提供直觀有效參考。

      20世紀(jì)70年代以來(lái),學(xué)者們對(duì)泥石流進(jìn)行了系統(tǒng)的研究。在泥石流易發(fā)性評(píng)價(jià)方面,區(qū)域泥石流易發(fā)性研究通常以經(jīng)驗(yàn)和統(tǒng)計(jì)方法為基礎(chǔ),結(jié)合3S技術(shù)展開(kāi)。其中,啟發(fā)式方法(如層次分析法[2])的精度主要取決于專(zhuān)家對(duì)某個(gè)地區(qū)泥石流發(fā)生真正原因的了解,具有一定的主觀性。而一些統(tǒng)計(jì)學(xué)方法如信息量模型[3]和頻率比[4]則通過(guò)定量分析克服了一定的主觀影響。近年來(lái),隨著人工智能技術(shù)的迅速發(fā)展,機(jī)器學(xué)習(xí)技術(shù)憑借其強(qiáng)大的非線性建模能力廣泛應(yīng)用于泥石流易發(fā)性評(píng)價(jià),如支持向量機(jī)[5]、神經(jīng)網(wǎng)絡(luò)[6]和邏輯回歸[7]等。雖然人工智能及機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,為泥石流易發(fā)性評(píng)價(jià)提供了全新的研究思路。但是,多數(shù)研究?jī)H采用了一種單獨(dú)方式進(jìn)行預(yù)測(cè),由于泥石流易發(fā)性評(píng)價(jià)問(wèn)題的復(fù)雜性,單一機(jī)器學(xué)習(xí)模型可能由于隨機(jī)性而導(dǎo)致泛化能力降低。因此,人們尋求通過(guò)集成模型來(lái)進(jìn)一步提高模型的預(yù)測(cè)精度。目前,基于bagging[8]和boosting算法[9]的滑坡、泥石流易發(fā)性評(píng)價(jià)應(yīng)用較多,也取得了不錯(cuò)的成果,特別是隨機(jī)森林算法[10]。但bagging和boosting集成方式一般考慮同質(zhì)分類(lèi)器,如隨機(jī)森林采用決策樹(shù),很少有研究結(jié)合常用的不同原理的機(jī)器學(xué)習(xí)方法來(lái)構(gòu)建高質(zhì)量模型。

      Stacking(堆疊)是Wolpert于1992年在“Stacked generalization”論文中提出的一種異質(zhì)集成學(xué)習(xí)算法[11],旨在以一種取長(zhǎng)補(bǔ)短的方式結(jié)合不同機(jī)器學(xué)習(xí)方法的優(yōu)勢(shì)來(lái)消除誤差,從而進(jìn)一步提升預(yù)測(cè)精度。Stacking集成方法已在許多領(lǐng)域取得了顯著的成果,如碰撞損傷嚴(yán)重程度分析[12]、電力負(fù)荷預(yù)測(cè)[13]等。

      因此,筆者以泥石流多發(fā)的雅江縣為研究區(qū),以3種機(jī)器學(xué)習(xí)方法為基模型(支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林),通過(guò)Stacking集成學(xué)習(xí)框架建立了一種多模型融合的泥石流易發(fā)性評(píng)價(jià)模型,并同時(shí)采用支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林進(jìn)行對(duì)比驗(yàn)證,以期能夠客觀驗(yàn)證Stacking融合模型的效果,又能對(duì)雅江地區(qū)泥石流災(zāi)害預(yù)警提供直觀有效的參考。

      1 研究區(qū)概況

      研究區(qū)(雅江縣)位于四川省西北部,甘孜州腹地,其面積約為7 681.5 km2,地理坐標(biāo)為100°19′~101°26′E,29°03′~30°30′N(xiāo)。研究區(qū)屬青藏高原亞濕潤(rùn)氣候區(qū),全年冬長(zhǎng)無(wú)夏,春秋相連,無(wú)霜期短,年平均降水量783.2 mm,主要集中在5—10月。研究區(qū)河流呈樹(shù)枝狀分布,其中雅礱江由北向南縱貫全境,將全縣深切為東西兩半,河谷深切呈“V”字型,主要支流有鮮水河、慶大河、曲汝河、密西溝、祝桑河、霍曲河、馬巖河7條。地勢(shì)總體上北高南低,東北和西北部為山原地貌;中部為河谷地貌;西南部是極高山地貌,海拔在5 000 m以上。研究區(qū)地震加速度0.15 g~0.2 g(g=9.8 m/s2),基本烈度為Ⅶ度,地層較為單一,主要出露三疊系和新生界第四系地層[14]。土壤類(lèi)型主要有淋溶土、半淋溶土、高山土及水成土。

      隨著西部大開(kāi)發(fā)戰(zhàn)略的實(shí)施,雅江縣的城市建設(shè)日益發(fā)展。但由于研究區(qū)處于高山深切峽谷地貌,土地資源極其有限,在城鎮(zhèn)化建設(shè)和發(fā)展中,向坡要地、建筑加載和工程切坡等人類(lèi)工程活動(dòng)強(qiáng)烈,再加上山體表層多松散巖石與土壤,在強(qiáng)降雨的誘發(fā)下泥石流等地質(zhì)災(zāi)害極容易發(fā)生,嚴(yán)重威脅著當(dāng)?shù)鼐用竦纳拓?cái)產(chǎn)安全[15],如2011年暴雨誘發(fā)的“7·13四川甘孜泥石流”,造成國(guó)道318線上22處路基被摧毀,2處路基塌方,15條鄉(xiāng)村道路被沖毀180余公里,橋涵沖毀90余座。因而有必要對(duì)研究區(qū)進(jìn)行泥石流易發(fā)性評(píng)價(jià),為雅江縣泥石流預(yù)防提供參考。

      本研究泥石流災(zāi)害數(shù)據(jù)來(lái)源于2010年四川省雅江縣地質(zhì)災(zāi)害調(diào)查數(shù)據(jù)集[15],研究區(qū)共發(fā)育158處泥石流災(zāi)害,主要分布于研究區(qū)沿雅礱江兩岸及其支流的溝谷地區(qū),為典型的高寒高海拔山區(qū)溝谷型泥石流,按照行政區(qū)劃八角樓鄉(xiāng)分布最多,為40條,紅龍鄉(xiāng)和瓦多鄉(xiāng)最少,各1條,其他鄉(xiāng)均在3~17條之間,研究區(qū)泥石流分布見(jiàn)圖1,本文按照70%、30%的比例將災(zāi)害點(diǎn)隨機(jī)分為兩組,訓(xùn)練點(diǎn)110個(gè),驗(yàn)證點(diǎn)48個(gè),用于模型的建立和驗(yàn)證。

      圖1 研究區(qū)泥石流分布

      2 研究方法

      2.1 評(píng)價(jià)因子的選取

      根據(jù)研究區(qū)的實(shí)際狀況和對(duì)以往文獻(xiàn)的查閱,在充分考慮研究區(qū)資料獲取難易程度及研究尺度后本文選取了12個(gè)泥石流評(píng)價(jià)因子,即高程、坡度、坡向、地形起伏度、平面曲率、剖面曲率、年平均降雨、到河流的距離、到道路的距離、地形濕度指數(shù)(Topographic Wetness Index,簡(jiǎn)稱(chēng)TWI)、歸一化差分植被指數(shù)(Normalized Difference Vegetation Index,簡(jiǎn)稱(chēng)NDVI)及土壤類(lèi)型,研究區(qū)因子圖(圖2),各數(shù)據(jù)來(lái)源見(jiàn)表1。

      a.高程; b.坡度;c.坡向; d.地形起伏度; e.平面曲率; f.剖面曲率; g.年平均降雨; h.到河流距離; i.到道路的距離; j.TWI; k.NDVI; l.土壤類(lèi)型。

      表1 數(shù)據(jù)來(lái)源

      高程是易發(fā)性研究中重要的評(píng)價(jià)因子,通過(guò)影響降雨分布、植被覆蓋、土地利用及土壤水分間接影響泥石流的發(fā)生,特別是對(duì)于山高谷深的地方,降雨、植被等隨著高程出現(xiàn)垂直變化的特點(diǎn)[16]。研究區(qū)高程范圍為2 171~5 142 m,根據(jù)等間距將其分為4類(lèi),分別為2 171~3 000 m,3 000~3 600 m,3 600~4 200 m,>4 200 m。

      大多數(shù)泥石流與坡度直接相關(guān),影響泥石流的發(fā)生、發(fā)展及其運(yùn)動(dòng)規(guī)模。在山高溝深、地形較陡的地方,水流比較容易匯流到一起。因此在暴雨條件下,坡度較陡的山地更容易發(fā)生泥石流災(zāi)害。研究區(qū)坡度變化范圍為0°~64°,利用等間距分為5類(lèi),分別為0°~10°,10°~20°,20°~30°,30°~40°,>40°。

      坡向是泥石流的重要評(píng)價(jià)因子,描述邊坡暴露于陽(yáng)光、風(fēng)和降雨的方向,從而影響成坡材料的性能,與陰坡相比,陽(yáng)坡冰雪融化快、巖石風(fēng)化較為強(qiáng)烈,所以陽(yáng)坡泥石流發(fā)生概率大于陰坡。由于研究區(qū)起伏較大,幾乎沒(méi)有平坦區(qū)域,所以將研究區(qū)坡向分為8類(lèi),分別為0°~22.5°和337.5°~360°為正北,22.5°~67.5°為東北,67.5°~112.5°為正東,112.5°~157.5°為東南,157.5°~202.5°為正南,202.5°~247.5°為西南,247.5°~292.5°為西,292.5°~337.5°為西北。

      地形起伏度是指地表某一局部區(qū)域內(nèi)地形高度的差異,直接代表地形的陡峭程度,是地貌的重要判斷指標(biāo)。地形起伏度通過(guò)ArcGIS焦點(diǎn)統(tǒng)計(jì)功能計(jì)算,鄰域設(shè)置為高100 m、寬100 m。研究區(qū)地形起伏度變化范圍為0~170 m,其分為5類(lèi),分別為0~20 m,20~35 m,35~50 m,50~65 m,>65 m。

      曲率是指地表任意一點(diǎn)的變形狀態(tài)。平面曲率為曲率水平分量,負(fù)值表示下凹,正值表示上凸。剖面曲率是地面坡度的導(dǎo)數(shù),描述了地表在垂直方向的彎曲狀態(tài),決定物質(zhì)相對(duì)運(yùn)動(dòng)速度,正值表明加速,負(fù)值表明減速,反映地面土壤侵蝕的程度。平面曲率根據(jù)自然間斷點(diǎn)法分為3類(lèi):-4.19~-0.1,-0.1~0.1,-0.1~0.5;剖面曲率同樣根據(jù)自然間斷點(diǎn)法分為3類(lèi):-7.87~-0.1,-0.1~0.1,0.1~7.46。

      突發(fā)性水源是泥石流的重要誘因,為松散固體源提供了動(dòng)力條件,降雨造成的地表水在沖洗疏松沉積物的過(guò)程中逐漸演變成泥石流。此研究應(yīng)用ArcGIS克里金插值(高斯函數(shù))獲得了年平均降雨量分布圖,并將降雨根據(jù)等間距分為5類(lèi):687~720 mm,720~740 mm,740~760 mm,760~780 mm,780~805 mm,從東南向西北逐漸減小。

      河流為泥石流提供了重要的水文基礎(chǔ)和流通通道。此研究利用歐氏距離建立了河流緩沖區(qū)以分析泥石流和河流之間的關(guān)系,并將到河流距離分為4類(lèi):0~200 m,200~2 000 m,2 000~5 000 m,>5 000 m。

      到道路的距離在一定程度上反映了人類(lèi)活動(dòng)的影響,如建造道路、砍伐樹(shù)木和人工削坡都可能造成坡面巖體裸露、風(fēng)化嚴(yán)重,從而產(chǎn)生泥石流的物源及流通基礎(chǔ)。將到道路距離分為4類(lèi):0~200 m,200~2 000 m,2 000~5 000 m,>5 000 m。

      TWI是對(duì)徑流長(zhǎng)度和徑流面積的定量描述,直接反映土壤含水量隨空間變化的規(guī)律,也間接反映研究區(qū)的水土流失狀況。研究區(qū)地形濕度指數(shù)根據(jù)自然間斷點(diǎn)法分為4類(lèi):-0.62~6.45,6.45~9,9~14,14~35。

      NDVI也是泥石流易發(fā)性評(píng)價(jià)常用的評(píng)價(jià)因子,是反映出植被空間分布密度的最佳因子。植被的根系可以對(duì)土壤進(jìn)行加固,可以預(yù)防土壤的侵蝕,而水土流失正是泥石流的重要誘因之一。NDVI值在-1到1之間,正值表示植被覆蓋,而且隨著NDVI的增加植被覆蓋越密;0表示為巖石或裸土等;負(fù)值表示地面是云、水和雪等。研究區(qū)NDVI根據(jù)自然間斷點(diǎn)法分為4類(lèi):-0.58~0,0~0.2,0.2~0.39,0.39~0.71。

      物源條件是泥石流發(fā)育的必要條件,巖土類(lèi)型決定了泥石流災(zāi)害的規(guī)模和破壞形式,但研究區(qū)地層比較單一,以三疊系及新生界第四系地層為主,故決定用土壤類(lèi)型代表研究區(qū)的物源條件[14]。研究區(qū)土壤類(lèi)型有淋溶土、半淋溶土、水成土和高山土,其中水成土占地面積僅0.43%,且無(wú)泥石流,故建模時(shí)未考慮。

      2.2 信息增益比

      在泥石流易發(fā)性評(píng)價(jià)建模中,并不是所有的評(píng)價(jià)因子都能夠較好地預(yù)測(cè)泥石流分布,甚至一些預(yù)測(cè)能力較差的評(píng)價(jià)因子會(huì)反向影響模型的性能,降低模型的預(yù)測(cè)能力。因此,有必要對(duì)評(píng)價(jià)因子的預(yù)測(cè)能力進(jìn)行定量研究,以消除預(yù)測(cè)能力不強(qiáng)或很弱的評(píng)價(jià)因子。其中,信息增益比在選擇因子中具有廣泛的適用性,有助于評(píng)價(jià)和排序輸入變量的重要性,以信息理論為基礎(chǔ),在信息增益的基礎(chǔ)上增加了一個(gè)懲罰系數(shù),跟蹤信息熵的減少來(lái)量化評(píng)價(jià)因子的重要性,是數(shù)據(jù)挖掘中衡量因子預(yù)測(cè)能力的標(biāo)準(zhǔn)技術(shù)[16]。

      已知數(shù)據(jù)訓(xùn)練樣本T由n個(gè)樣本組成,那么樣本T在自變量F(泥石流評(píng)價(jià)因子)下的信息增益比IGR(T,F)可以通過(guò)以下公式進(jìn)行計(jì)算:

      (1)

      IG(T,F)=Info(T) Info(T,F)

      (2)

      (3)

      (4)

      (5)

      其中,n(Li,T)表示在T訓(xùn)練集中變量第i類(lèi)(如泥石流L1,非泥石流L2)中樣本的數(shù)量。Tj(j=1,2,…,m)是在T訓(xùn)練集下某一自變量F(泥石流影響因子)的第j類(lèi)的數(shù)量。

      Info(T)為各類(lèi)別的總體信息熵,Info(T,F)是樣本T在自變量F下的信息熵。IG(T,F)為各評(píng)價(jià)因子的信息增益,Spli(T,F)表示分裂信息度量,是將訓(xùn)練樣本T劃分為m個(gè)子集所產(chǎn)生的潛在信息值。

      2.3 Stacking集成方法

      Stacking是一種異質(zhì)集成學(xué)習(xí)算法[11],異質(zhì)集成是指通過(guò)組合若干原理不同的分類(lèi)器,來(lái)組建一個(gè)強(qiáng)分類(lèi)器,以增強(qiáng)泛化能力。此研究Stacking算法采用一種兩層結(jié)構(gòu),Stacking學(xué)習(xí)框架如圖3所示,第一層的分類(lèi)器稱(chēng)為基模型,第二層的分類(lèi)器稱(chēng)為元模型,具體訓(xùn)練過(guò)程為:

      (1)將原始數(shù)據(jù)分為訓(xùn)練集和測(cè)試集;

      (2)利用訓(xùn)練集訓(xùn)練第一層的若干基模型,分別得到若干預(yù)測(cè)結(jié)果(使用五折交叉驗(yàn)證);

      (3)將第一層得到的若干預(yù)測(cè)結(jié)果作為第二層模型的輸入特征,而訓(xùn)練集的標(biāo)簽仍然作為新數(shù)據(jù)集的標(biāo)簽;

      (4)使用新數(shù)據(jù)集訓(xùn)練第二層的模型得到最終的預(yù)測(cè)結(jié)果。

      圖3 Stacking學(xué)習(xí)框架

      元模型的訓(xùn)練集由基模型的預(yù)測(cè)值組成,如果直接用基模型的訓(xùn)練集來(lái)生成第二層訓(xùn)練集,就導(dǎo)致數(shù)據(jù)在兩層模型中重復(fù)使用,產(chǎn)生過(guò)擬合。為了避免這種現(xiàn)象,有必要對(duì)數(shù)據(jù)使用進(jìn)行規(guī)劃,對(duì)每個(gè)基模型采用五折交叉驗(yàn)證[13],具體過(guò)程為:

      (1)將原始訓(xùn)練數(shù)據(jù)集隨機(jī)分成數(shù)量相同的五塊子數(shù)據(jù)集,每個(gè)數(shù)據(jù)塊不能重疊;

      (2)對(duì)于單個(gè)基模型,輪流使用4個(gè)數(shù)據(jù)塊作為訓(xùn)練集,剩下一個(gè)作為測(cè)試集,每個(gè)基模型針對(duì)自己的測(cè)試集都可輸出一個(gè)預(yù)測(cè)結(jié)果,并且這5個(gè)結(jié)果可以拼成新的數(shù)據(jù)集,新數(shù)據(jù)集與原始訓(xùn)練集大小相同;

      (3)將生成的新數(shù)據(jù)集作為元模型的輸入特征,從而實(shí)現(xiàn)了所有訓(xùn)練數(shù)據(jù)從原始特征到第二層特征的變換,而且每個(gè)基模型預(yù)測(cè)的數(shù)據(jù)均未參與到該模型的訓(xùn)練。

      這種數(shù)據(jù)使用令所有數(shù)據(jù)在訓(xùn)練中僅使用一次,能有效防止訓(xùn)練數(shù)據(jù)的泄露,避免過(guò)擬合。

      2.4 Stacking采用的機(jī)器學(xué)習(xí)模型

      立足于基模型的預(yù)測(cè)能力及差異性,在Stacking融合模型第一層應(yīng)選擇預(yù)測(cè)能力強(qiáng)且有較大理論差異的模型作為基模型。第二層應(yīng)選擇泛化能力強(qiáng)的模型,將多個(gè)基模型對(duì)于訓(xùn)練集的偏置找出并進(jìn)行糾正。因此,Stacking融合模型第一層基模型分別為支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林,第二層選擇邏輯回歸作為元模型,這幾種算法不僅有充分的理論支持,在泥石流易發(fā)性評(píng)價(jià)中也得到過(guò)廣泛使用。

      支持向量機(jī)是一種監(jiān)督學(xué)習(xí)方法,是由結(jié)構(gòu)風(fēng)險(xiǎn)最小化概念發(fā)展而來(lái)的具有優(yōu)秀泛化能力的機(jī)器學(xué)習(xí)方法,支持向量機(jī)設(shè)計(jì)了一種非線性變換,令訓(xùn)練數(shù)據(jù)通過(guò)核函數(shù)投影到高維特征空間,使得投影后的訓(xùn)練數(shù)據(jù)線性可分[5]。近年來(lái),支持向量機(jī)逐漸在泥石流易發(fā)性評(píng)價(jià)中獲得廣泛使用。參數(shù)設(shè)置為,模式選擇專(zhuān)家模式,使用RBF作為內(nèi)核,停止標(biāo)準(zhǔn)為0.001,規(guī)則化參數(shù)為10,gamma為0.1。

      神經(jīng)網(wǎng)絡(luò)是在模仿人腦神經(jīng)沖動(dòng)傳導(dǎo)原理基礎(chǔ)上建立的一種非線性數(shù)學(xué)模型,輸入層、隱含層和輸出層組成了神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),每層由神經(jīng)元組成,也可稱(chēng)之為節(jié)點(diǎn)[17]。神經(jīng)網(wǎng)絡(luò)應(yīng)用于泥石流易發(fā)性評(píng)價(jià)具有不錯(cuò)的表現(xiàn)。參數(shù)設(shè)置為,結(jié)構(gòu)為1-2-1層,輸入層節(jié)點(diǎn)數(shù)與泥石流條件因子數(shù)相同,輸出層節(jié)點(diǎn)數(shù)為2。隱含層節(jié)點(diǎn)數(shù)取輸入節(jié)點(diǎn)數(shù)(12)和輸出節(jié)點(diǎn)數(shù)(2)之積的平方根,取5。最后一層用S形激活函數(shù)輸出泥石流發(fā)生的概率。

      隨機(jī)森林是集成學(xué)習(xí)中一種袋裝思想的算法策略。bagging方法通??紤]同質(zhì)弱學(xué)習(xí)器,獨(dú)立、并行地學(xué)習(xí)這些弱學(xué)習(xí)器,并按照一定的確定性平均過(guò)程進(jìn)行組合。隨機(jī)森林以決策樹(shù)為基本學(xué)習(xí)器,建立了袋裝集成算法,同時(shí)引入了特征的隨機(jī)抽樣,進(jìn)一步提升了模型的抗噪聲能力,有效地防止了過(guò)擬合的發(fā)生,在處理高維、大數(shù)據(jù)集時(shí),仍然可以高速處理和學(xué)習(xí)[10]。隨機(jī)森林通過(guò)SPSS Modeler 18.0軟件構(gòu)建,參數(shù)設(shè)置為500個(gè)決策樹(shù),最大樹(shù)深度為10,節(jié)點(diǎn)個(gè)數(shù)m為評(píng)價(jià)因子個(gè)數(shù)(12個(gè))的平方根,故將m取值為3。

      邏輯回歸是二分類(lèi)問(wèn)題中應(yīng)用最為廣泛的機(jī)器學(xué)習(xí)模型,具有良好的穩(wěn)定性[7]。原理是將樣本的特征與樣本發(fā)生的概率聯(lián)系起來(lái),計(jì)算結(jié)果是通過(guò)樣本的特征來(lái)擬合計(jì)算出一個(gè)事件發(fā)生的概率。邏輯回歸通過(guò)SPSS Modeler 18.0軟件構(gòu)建,參數(shù)設(shè)置為采用多項(xiàng)式邏輯回歸,方法選擇進(jìn)入法,模型類(lèi)型為主效應(yīng)。

      2.5 受試者工作特征曲線

      受試者工作特征曲線又稱(chēng)ROC曲線(Receiver Operating Characteristic Curve),通過(guò)選擇所有閾值來(lái)繪制整條曲線,該方法曾廣泛用于驗(yàn)證二分類(lèi)模型的性能[8,10],ROC曲線下面積(Area Under Curve,簡(jiǎn)稱(chēng)AUC)代表模型的可預(yù)測(cè)性,其值范圍是0.5~1,1代表是完美模型,0.5則表示是較差的模型[17]。利用訓(xùn)練集數(shù)據(jù)可以得到模型成功率ROC曲線,曲線下面積即模型的成功率;測(cè)試集數(shù)據(jù)得到預(yù)測(cè)率ROC曲線,用于驗(yàn)證模型的預(yù)測(cè)是否準(zhǔn)確,曲線下面積就是預(yù)測(cè)率。

      3 結(jié)果與討論

      3.1 信息增益比

      評(píng)價(jià)因子信息增益比結(jié)果(保留四位小數(shù))如圖4所示。其中有4個(gè)因子有較強(qiáng)的預(yù)測(cè)能力,分別為到河流距離、到道路距離、高程、剖面曲率。這和研究區(qū)的實(shí)際情況是一致的。雅礱江上游水源豐富,而且大多數(shù)河流都位于山谷中,當(dāng)暴雨發(fā)生時(shí)很容易形成泥石流。河流為泥石流提供了重要的水文基礎(chǔ)和水流通道。同樣,到道路的距離很重要。道路在某種程度上反映了人類(lèi)工程活動(dòng)和地貌環(huán)境的影響。高程和剖面曲率則代表了地形因素對(duì)泥石流的影響。而坡向(0.007 3)、平面曲率(0.004 6)這兩個(gè)因子均<0.01,預(yù)測(cè)能力可以忽略,因此決定在之后的建模中去掉這兩個(gè)評(píng)價(jià)因子。

      圖4 評(píng)價(jià)因子信息增益比結(jié)果

      3.2 易發(fā)性分區(qū)結(jié)果

      本研究使用自然間斷點(diǎn)分級(jí)法對(duì)泥石流易發(fā)性圖進(jìn)行分類(lèi),共分為5個(gè)區(qū)域,分別為極低易發(fā)區(qū)、低易發(fā)區(qū)、中易發(fā)區(qū)、高易發(fā)區(qū)和極高易發(fā)區(qū),最后得到泥石流易發(fā)性圖如圖5所示。

      這4個(gè)模型制作的易發(fā)性圖從總體上看趨勢(shì)相同,主要區(qū)別在雅江縣西側(cè)及南側(cè)區(qū)域。西部區(qū)域如德差鄉(xiāng)、柯拉鄉(xiāng)、西俄羅鎮(zhèn)和紅龍鄉(xiāng)等地,在支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)的易發(fā)性圖中,絕大部分是中等以下區(qū)域,而隨機(jī)森林則有局部地區(qū)為高等以上。南部地區(qū)主要是惡古鄉(xiāng)地區(qū),神經(jīng)網(wǎng)絡(luò)的易發(fā)性圖極高等占比較大,而隨機(jī)森林、支持向量機(jī)的易發(fā)性圖顯示出較低的易發(fā)性,而Stacking融合模型則綜合了這3個(gè)基模型的特征,修正了各模型的誤差。

      Stacking融合模型制作的易發(fā)性圖的高易發(fā)和極高易發(fā)區(qū)主要集中在由北向南縱貫全境的雅礱江全線兩岸及其部分支流附近,中部主要是雅礱江沿岸,依次經(jīng)過(guò)普巴絨鄉(xiāng)、呷拉鎮(zhèn)、雅江縣城、米龍鄉(xiāng)、麻郎措鄉(xiāng)、惡古鄉(xiāng)、八衣絨鄉(xiāng)、波斯河鄉(xiāng)、吉居鄉(xiāng)、牙衣河;其中西部包括德差鄉(xiāng)大部分,柯拉鄉(xiāng)的霍曲河附近,西俄羅鎮(zhèn)的吉珠溝附近,紅龍鄉(xiāng)的東北地區(qū);東部包括八角樓鄉(xiāng)的中部地區(qū),祝桑鄉(xiāng)的大部分地區(qū)。

      高易發(fā)區(qū)地表溝谷發(fā)育,泥石流災(zāi)害點(diǎn)距河流距離分布大多<2 000 m,泥石流發(fā)育多沿溝谷流通,致使大型河流對(duì)研究區(qū)的影響較高。特別是雅礱江沿線河流深切,山體高大,谷坡陡峻,河床狹窄,可以為泥石流提供勢(shì)能,同時(shí)提供泥石流運(yùn)移的通道。高程大部分分布在2 171~3 600 m,少部分位于3 600~4 200 m,4 200 m以上幾乎都是極低易發(fā)區(qū)。坡度分布為20°~40°。此段區(qū)域主要為低山至河流過(guò)渡區(qū)域,高差較大,坡度適中,能夠?yàn)槟嗍魈峁﹦?shì)能。土壤類(lèi)型主要為淋溶土和半淋溶土。NDVI分布為0~0.39,地表主要是植被較少、風(fēng)化嚴(yán)重的裸地。

      3.3 泥石流易發(fā)性與實(shí)際對(duì)比分析

      模型分區(qū)面積占比情況見(jiàn)表2,模型分區(qū)泥石流災(zāi)害點(diǎn)分布情況見(jiàn)表3。4個(gè)模型生成的易發(fā)性圖的空間分布模式相似(圖5)。大部分高易發(fā)性的網(wǎng)格單元集中在雅礱江沿線的河谷中。所有模型在極高和高易發(fā)性級(jí)別產(chǎn)生的網(wǎng)格單元都較少,而極低和低的易發(fā)性級(jí)別所占比例最大(表2)。

      a.支持向量機(jī); b.神經(jīng)網(wǎng)絡(luò); c.隨機(jī)森林; d.Stacking融合模型。

      表2 模型分區(qū)面積占比情況

      表3 模型分區(qū)泥石流災(zāi)害點(diǎn)分布情況

      由表2~3可知,Stacking融合模型制作的易發(fā)性圖大約有13.13%區(qū)域?qū)δ嗍饕装l(fā)性極低,其余40.16%,23.49%,18.11%,5.11%的區(qū)域分別表現(xiàn)為低、中、高和極高易發(fā)性。位于極低、低、中、高、極高易發(fā)性區(qū)的泥石流點(diǎn)分別有0,3,5,42個(gè)及108個(gè),位于高易發(fā)性區(qū)以上的泥石流點(diǎn)占94.94%,位于極高易發(fā)性區(qū)以上的泥石流點(diǎn)占68.35%。3個(gè)基模型生成的泥石流易發(fā)性圖位于高易發(fā)性區(qū)以上的泥石流點(diǎn)占比由大到小分別為隨機(jī)森林(93.04%)、支持向量機(jī)(90.51%)和神經(jīng)網(wǎng)絡(luò)(89.87%),位于極高易發(fā)性區(qū)以上的泥石流點(diǎn)占比由大到小分別是神經(jīng)網(wǎng)絡(luò)(64.56%)、隨機(jī)森林(62.66%)和支持向量機(jī)(59.49%)。相比之下,Stacking融合模型生成的泥石流易發(fā)性圖在這兩部分的泥石流點(diǎn)占比均高于3種基模型,有相當(dāng)高的準(zhǔn)確率,這和ROC曲線的預(yù)測(cè)率有較好的一致性。

      3.4 ROC曲線驗(yàn)證結(jié)果

      使用訓(xùn)練集的3種模型的ROC曲線見(jiàn)圖6,使用驗(yàn)證集的3種模型的ROC曲線見(jiàn)圖7,模型成功率及預(yù)測(cè)率見(jiàn)表4。各模型預(yù)測(cè)率分別為支持向量機(jī)(0.897),神經(jīng)網(wǎng)絡(luò)(0.906),隨機(jī)森林(0.916),Stacking融合模型(0.955)。Stacking融合模型通過(guò)集合各個(gè)模型的優(yōu)勢(shì),舍棄基模型的誤差,預(yù)測(cè)率達(dá)到了0.955,相對(duì)3個(gè)基模型分別提升了支持向量機(jī)(0.058),神經(jīng)網(wǎng)絡(luò)(0.049),隨機(jī)森林(0.039)。

      表4 模型成功率及預(yù)測(cè)率表

      成功率和預(yù)測(cè)率之間的差值可以體現(xiàn)模型的穩(wěn)定性,按照由大到小分別為Stacking融合模型(2.6%),隨機(jī)森林(2.9%),支持向量機(jī)(3.7%),神經(jīng)網(wǎng)絡(luò)(5.5%),由此可知Stacking融合模型比較穩(wěn)定可靠,具有良好的泛化能力。

      因此,通過(guò)綜合考慮ROC曲線驗(yàn)證及泥石流實(shí)際易發(fā)性的對(duì)比分析,Stacking融合模型具有最高的精度,最適用于雅江縣泥石流易發(fā)性評(píng)價(jià)。

      圖6 使用訓(xùn)練集的3種模型的ROC曲線

      圖7 使用驗(yàn)證集的3種模型的ROC曲線

      4 結(jié)論

      (1)信息增益比的結(jié)果表明到河流的距離、到道路的距離、剖面曲率及高程是主要的影響因素;而坡向、平面曲率幾乎沒(méi)有預(yù)測(cè)能力。

      (2)易發(fā)性評(píng)價(jià)結(jié)果顯示,Stacking融合模型制作的易發(fā)性圖大約有13.13%泥石流易發(fā)性極低,其余40.16%,23.49%,18.11%,5.11%的區(qū)域分別表現(xiàn)為低、中、高和極高易發(fā)性。高易發(fā)性以上區(qū)域主要集中在由北向南縱貫全境的雅礱江全線兩岸及其部分支流附近,和泥石流點(diǎn)分布較為符合。

      (3)Stacking融合模型制作的易發(fā)性圖位于極低、低、中、高、極高易發(fā)性區(qū)的泥石流點(diǎn)分別有0,3,5,42及108個(gè),位于高易發(fā)性區(qū)以上的泥石流點(diǎn)占94.94%,位于極高易發(fā)性區(qū)以上的泥石流點(diǎn)占68.35%,均高于3種基模型的泥石流點(diǎn)占比,有相當(dāng)高的準(zhǔn)確率。

      (4)通過(guò)驗(yàn)證模型成功率及預(yù)測(cè)率,Stacking融合模型均高于支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林,而且成功率與預(yù)測(cè)率相差較小(2.6%),模型比較穩(wěn)定,泛化能力強(qiáng),表明Stacking集成學(xué)習(xí)方法最適用于雅江縣泥石流易發(fā)性評(píng)價(jià)。

      猜你喜歡
      雅江縣易發(fā)泥石流
      “香根草”在四川省涉藏地區(qū)推廣利用的思考
      機(jī)用鎳鈦銼在乳磨牙根管治療中的應(yīng)用
      貴州省地質(zhì)災(zāi)害易發(fā)分區(qū)圖
      赴湯蹈火竭誠(chéng)為民
      消防界(2021年21期)2021-12-10 15:30:22
      夏季羊易發(fā)疾病及防治方法
      雅江縣
      綠色天府(2021年2期)2021-04-19 14:01:46
      冬季雞腸炎易發(fā) 科學(xué)防治有方法
      “以桑養(yǎng)畜”發(fā)展雅江縣高原特色農(nóng)牧產(chǎn)業(yè)的思考
      泥石流
      雜文月刊(2018年21期)2019-01-05 05:55:28
      “民謠泥石流”花粥:唱出自己
      海峽姐妹(2017年6期)2017-06-24 09:37:36
      新疆| 祥云县| 中卫市| 镇巴县| 淳化县| 台北县| 马山县| 沁水县| 甘孜| 汉川市| 银川市| 新昌县| 惠州市| 大足县| 邢台县| 辰溪县| 平乡县| 绩溪县| 吉首市| 分宜县| 南漳县| 华阴市| 尼玛县| 思茅市| 平凉市| 布拖县| 博白县| 沅陵县| 拜泉县| 博乐市| 县级市| 龙岩市| 梅州市| 元江| 谢通门县| 江陵县| 九台市| 兴和县| 昂仁县| 仙居县| 米易县|