薛永安,王玉潔,朱婧聰,李昊辰,張明媚
(1.太原理工大學礦業(yè)工程學院,山西太原 030024;2.山西能源學院地質(zhì)與測繪工程系,山西晉中 030600;3.中國科學院地理科學與資源研究所中國科學院陸地表層格局與模擬重點實驗室,北京 100101)
斜坡地質(zhì)災害(本文特指:崩塌、滑坡、不穩(wěn)定斜坡)敏感性評價的本質(zhì)是利用數(shù)學語言評估在一定地質(zhì)環(huán)境條件下斜坡地質(zhì)災害空間概率的敏感性[1]。近年來,國內(nèi)外學者使用不同的數(shù)學模型開展區(qū)域地質(zhì)災害敏感性評價取得了一定的成果[2~6],如基于定性評價方法的加權(quán)線性組合法[7],但更多的是基于定量評價方法,采用最鄰近的災害調(diào)查數(shù)據(jù)及該區(qū)域過去已發(fā)生的各類地質(zhì)災害,在連續(xù)的尺度上確定地質(zhì)災害易發(fā)區(qū)。目前常用的定量評價模型包括:層次分析法[2]、邏輯回歸模型[8]、神經(jīng)網(wǎng)絡法[9]、信息量法[10]、確定性系數(shù)法(Certainty Factor,CF)[11]、隨機森林(Random Forest,RF)[12]和支持向量機(Support Vector Machine,SVM)[13]等。然而,采用這些定量評價模型通常要求大量的高質(zhì)量災害數(shù)據(jù),評價結(jié)果易受到已知地質(zhì)災害數(shù)據(jù)不準確、精度較低和數(shù)量較少的影響,導致評價結(jié)果存在較大的不確定性,評價模型適用性因此受限。其中,CF模型[14]和SVM模型[15]模型在地質(zhì)災害敏感性評價中應用較為廣泛,是統(tǒng)計思想模型和機器學習模型的代表性評價模型,而SVM模型與RF模型又是小樣本情況下表現(xiàn)較好的敏感性評價模型。每種評價模型均具有各自的優(yōu)缺點,單一評價模型往往存在諸多問題,難以客觀、定量、準確的進行區(qū)域地質(zhì)災害敏感性評價[16],更多的學者開始在同一地區(qū)采用不同的模型進行對比研究[17],選取最優(yōu)評價模型和評價結(jié)果[18]。但是,這些模型均需要大量的樣本點進行統(tǒng)計與學習,這對樣本數(shù)量較少的縣域國土空間開展斜坡地質(zhì)災害敏感性評價帶來制約,選用哪種模型進行評價更可靠應依據(jù)縣域?qū)嶋H情況結(jié)合定性經(jīng)驗進行比選。同時,組合評價模型逐漸成為研究熱點[18-20],如SVM與Newmark的組合模型[21],CF與AHP、Logistic回歸和神經(jīng)網(wǎng)絡多層感知器方法組合的區(qū)域滑坡敏感性評價[22]、CF與RF模型的組合[23]、CF與Logistic回歸模型組合[24]等,為敏感性評價模型組合研究提供了豐富的方法參考。還有組合與對比同時進行的研究工作[18],為地質(zhì)災害敏感性評價研究提供了堅實的理論與實踐參考。
針對縣域國土空間斜坡地質(zhì)災害敏感性評價,文獻[25]采用遙感解譯的方式增加了樣本數(shù)量,提升了基于統(tǒng)計思想的信息量模型的適用性,為開展小范圍地質(zhì)災害敏感性評價提供了方法參考。但受交通限制,該方法的解譯斜坡地質(zhì)災害點驗證率僅有46.2%,基礎數(shù)據(jù)可靠性不足,評價結(jié)果存在較大不確定性。本文采用組合預測模型思想,選擇CF模型和SVM模型作為單模型,將CF模型與SVM模型進行組合,開展縣域國土空間斜坡地質(zhì)災害敏感性評價單模型(CF模型、SVM模型、RF模型)與組合模型(CF-SVM模型)適用性對比研究,以期為縣域國土空間規(guī)劃、國土綜合整治、地質(zhì)災害防治等小樣本情況下地質(zhì)災害敏感性評價提供更可靠的評價模型與評價結(jié)果。
以山西省忻州市五寨縣為研究區(qū),研究區(qū)位于山西省西北部黃土高原丘陵區(qū),管涔山北麓,地理范圍:111°28'~113°00'E和38°44'~39°17'N,共有9鄉(xiāng)3鎮(zhèn),行政村250個,總面積為1 391 km2。
研究區(qū)地勢東南高,為變質(zhì)巖森林山區(qū);西北低,屬于典型的晉西北黃土高原黃土地貌形態(tài);中部地勢平坦,為黃土盆地平川區(qū)。主要出露地層有:太古界呂梁群地層,上元古界震旦系,古生界寒武系和奧陶系地層。第三系地層和第四系黃土分布于北部和西部丘陵區(qū),在盆地、河谷內(nèi)為全新近統(tǒng)近代沖洪積物。研究區(qū)地質(zhì)構(gòu)造處于呂梁山背斜西北翼,偏關(guān)臺凹南部邊緣,橫山大斷裂中段,區(qū)內(nèi)主要分布有橫山斷裂、安塘-五寨隱伏斷層和青陽嶺及小口村斷層。地表水均屬黃河水系,主要有朱家川河、縣川河、嵐漪河三大水系。
受自然條件影響,研究區(qū)形成了南寒北暖的特殊氣候,可分為南部涼爽濕潤區(qū)、中部溫涼半干燥區(qū)和北部溫和干燥區(qū)3種類型。年平均降水量為478.50 mm,多集中在7、8、9月份。年蒸發(fā)量1 856.90 mm,約為年降水量的4倍。
研究區(qū)內(nèi)地下礦產(chǎn)資源匱乏,而石灰?guī)r、花崗巖、粘土儲量較為豐富,現(xiàn)有各類礦山20余座,主要為建筑石料用灰?guī)r、砂巖、磚瓦用粘土、建筑用輝綠巖和花崗巖礦。
近年來,研究區(qū)經(jīng)濟建設快速發(fā)展,旅游業(yè)開發(fā)、基礎設施建設、山區(qū)修建住房等人類工程活動對地質(zhì)環(huán)境的影響越來越大,地質(zhì)災害頻發(fā)。
(1)基礎數(shù)據(jù)
收集到研究區(qū)2013年、2017年斜坡地質(zhì)災害點93處,基于2017年五寨縣地質(zhì)災害分布及易發(fā)程度分區(qū)圖(1:50 000)矢量化成果分別提取了研究區(qū)地層巖組、地質(zhì)構(gòu)造、基礎地理信息等數(shù)據(jù)。其中,地層巖組依次為:砂卵礫石、粉土、粉質(zhì)粘土多層土體(Q4)、風積粉砂土單層土體(Qeo13)、沖洪積亞粘土、鈣質(zhì)結(jié)合層多層土體(Qp11+2)、晚第三系上新統(tǒng)亞粘土鈣質(zhì)結(jié)合層多層土體(N2)、薄-中厚層稀裂狀較軟變質(zhì)巖風化巖組(A)、厚層塊體狀硬石英砂巖組(Z)、中厚-厚層稀裂狀中等巖溶化硬灰?guī)r組(∈+o)。
(2)DEM數(shù)據(jù)
以ASTER GDEM V2數(shù)據(jù)作為數(shù)字地形因子提取基礎數(shù)據(jù),下載地址為:http://www.gscloud.cn/。
(3)遙感影像數(shù)據(jù)
以2017年8月11日Landsat8數(shù)據(jù)為NDVI提取基礎數(shù)據(jù),下載地址為:http://www.gscloud.cn/。
空間分析、敏感性評價、結(jié)果統(tǒng)計與制圖分別基于ArcGIS、SPSS Modeler等軟件進行。
CF值是體現(xiàn)地質(zhì)災害發(fā)育敏感性的重要因素,1986年,Heckerman[26]對CF模型做出進一步改進,通過將已知的地質(zhì)災害隱患點作為基礎數(shù)據(jù),運用確定性系數(shù)法計算研究區(qū)CF值。CF取值在[-1,1],CF值越大,發(fā)生災害的可能性越大,反之亦然。CF=0時無法判斷災害發(fā)生可能性。
CF值計算公式如下:
式中:PPa為某一特征a的條件概率;PPs為研究區(qū)域的災害點數(shù)量與面積之比;CF為地質(zhì)災害發(fā)生的確定性系數(shù)。
SVM通過引入核函數(shù)有效地解決了非線性分類問題,使得敏感性評價中的非線性分類計算復雜度不再取決于空間維數(shù),而是取決于用于建模的災害點樣本數(shù)量,尤其是其中支持向量的災害點數(shù)量。因此,SVM被認為是目前針對小樣本統(tǒng)計估計和預測學習的最佳理論,在地質(zhì)災害敏感性評價中應用較多[27]。
對一個數(shù)據(jù)點進行分類,當超平面離數(shù)據(jù)點的“間隔”越大,分類的確信度也越大。最大間隔分類器的目標函數(shù)可以定義為根據(jù)間隔的定義,有
式中:s.t.導出的是約束條件。
隨機森林是由決策樹構(gòu)成的集成算法,是利用多棵樹對樣本進行訓練并預測的一種分類器,屬于集成學習中bagging框架的方法,具體步驟為:
(1)地質(zhì)災害數(shù)據(jù)集包括N個樣本,對數(shù)據(jù)集進行有放回的抽取,共抽取N次,每次抽取1個滑坡災害點,共形成N個訓練樣本集。對N個樣本分別建立決策樹;
(2)每個地質(zhì)災害樣本訓練集包含M個特征,當決策樹的每個節(jié)點需要分類時,隨機從這M個特征中選取m個特征,滿足m<<M。然后從這m個特征中采用某種策略來選擇1個特征作為該節(jié)點的分類特征;
(3)決策樹形成過程中每個節(jié)點均按步驟(2)分類,直至不能分類為止;
(4)由步驟(1)~(3)建立大量的決策樹構(gòu)成隨機森林;
(5)由每棵決策樹模型采用投票方式選出最優(yōu)分類結(jié)果。
與SVM模型相比,RF模型引入了樣本的隨機抽樣和特征的隨機抽樣,大大減少了分類過程中對數(shù)據(jù)噪聲和異常值的敏感性,提高了預測準確率[23]。
該模型是對CF模型和SVM模型的組合,利用CF方法計算得到各個影響因子的分級CF值,以CF值替代分級統(tǒng)計結(jié)果作為SVM模型的分類數(shù)據(jù),并將其作為訓練樣本數(shù)據(jù),采用SVM模型進行樣本訓練,進而對整個研究區(qū)柵格數(shù)據(jù)進行預測,繼而得出研究區(qū)斜坡地質(zhì)災害敏感性評價結(jié)果。
如果評價因子之間存在高度相關(guān)性,CF數(shù)模型的精度就會降低甚至失真。本文選用皮爾遜相關(guān)分析方法來分析各評價因子之間的相關(guān)關(guān)系,皮爾遜相關(guān)系數(shù)Rxy計算公式如式(4)[28]:
式中:x與y均為評價因子序列,分別代表2個樣本,為評價因子序列在相應圖層提取值的平均值;Rxy為評價因子兩兩之間的相關(guān)系數(shù),取值范圍為[-1,1],Rxy>0表示2個因子之間存在正相關(guān)性,Rxy<0表示2個因子之間存在負相關(guān)性,|Rxy|越接近于1,表明2個因子之間的相關(guān)性越高,|Rxy|越接近于0,表明2個因子之間的相關(guān)性越低;xi、yi分別為2個評價因子序列中的第i個因子的值;n為評價因子總數(shù)。
斜坡地質(zhì)災害的發(fā)生與孕災環(huán)境及誘發(fā)因素密切相關(guān),合理的選擇評價因子是進行斜坡地質(zhì)災害敏感性評價的關(guān)鍵[10]。地形地貌是斜坡地質(zhì)災害發(fā)育的重要影響因素,其中,高程與人類活動關(guān)系密切,影響區(qū)域植被類型、植被覆蓋度等因素,從而間接性影響斜坡地質(zhì)災害的發(fā)生。坡度則對坡體剪應力強度有直接的影響,決定了斜坡應力及災害分布。坡向不同導致光照、風的干濕、降雨、植被覆蓋和土壤潮濕程度不同,影響土壤強度和邊坡穩(wěn)定性。地勢起伏度表示在特定范圍內(nèi)最高點與最低點之間的高差,與坡體高度密切相關(guān),而坡體高度增大,剪應力也隨之變大,發(fā)生斜坡地質(zhì)災害的概率隨之變大。區(qū)域地質(zhì)環(huán)境是斜坡地質(zhì)災害發(fā)育的控制性因素,強烈的剪力作用,使得斷層附近的巖石體破碎,活動斷層增加了斜坡地質(zhì)災害發(fā)生的可能性。而地層巖組是斜坡體的構(gòu)成物質(zhì)組成,不同的巖性抗風化、水蝕能力不同,導致坡體穩(wěn)定性隨巖性不同而差異較大。人類工程活動眾多,各類工程開挖、削坡卸載等引起斜坡體穩(wěn)定性的減弱,引起崩塌與滑坡災害。其中,道路工程施工建設中一般需對途經(jīng)巖土體進行開挖,而開挖會改變地形地貌,常引起邊坡失穩(wěn),道路工程擾動成為誘發(fā)斜坡地質(zhì)災害的重要人為動力特征因子。河流水系是區(qū)域地表徑流大小的體現(xiàn),在一定程度上反映了該地區(qū)的溝谷密度,河流沖刷會降低斜坡坡腳的穩(wěn)定性,是誘發(fā)斜坡地質(zhì)災害的重要自然因素,而植被覆蓋則具有保持水土的作用,對保障坡體穩(wěn)定性具有積極作用。
影響因子狀態(tài)分級是指數(shù)據(jù)類型為離散型和連續(xù)型的單因子指標遵循一定的劃分標準分為多個不同范圍的二級狀態(tài)[18]。目前,有研究者采用定量計算選取閾值劃分等級[18],也有研究者根據(jù)以往經(jīng)驗與災害點分布規(guī)律進行因子狀態(tài)分級[10-11,25]。
文中在前期研究的基礎[29-31]上結(jié)合現(xiàn)有研究[10-11,25]從地形地貌(高程、坡度、坡向、地勢起伏度)、地質(zhì)因素(地質(zhì)構(gòu)造、地層巖組)、人為動力(道路工程擾動)和自然因素(河流水系、植被覆蓋(NDVI))4個方面選取9個因子作為斜坡地質(zhì)災害敏感性評價因子組合(表1),并依據(jù)研究經(jīng)驗,綜合考慮進行了評價因子狀態(tài)分級。
表1 研究區(qū)斜坡地質(zhì)災害敏感性評價因子分級表Table 1 Classification of assessment factors of slope geological hazard sensitivity in the study area
根據(jù)研究區(qū)93處斜坡地質(zhì)災害點的分布特征(圖1),以公式(1)計算得到各評價因子不同分級的CF值(表2)。
表2 各因子分類等級CF值計算結(jié)果表Table 2 Calculation results table of CF of classification level of each evaluation factor
(1)高程(圖1(a))。災害點主要分布于1 300~1 400 m之間,災害發(fā)育數(shù)量占總災害數(shù)量的百分比達到44.09%。1 300 m以下次之,災害發(fā)育數(shù)量占總災害數(shù)量的百分比為34.41%,但該區(qū)間災害發(fā)育密度為0.26處/km2,為區(qū)內(nèi)發(fā)育密度最高。2 100 m以上區(qū)域無地質(zhì)災害發(fā)育。
(2)坡度(圖1(b))。災害點主要分布于0~10°和10~20°坡度之間,發(fā)育災害數(shù)量分別占總災害數(shù)量的41.94%和38.71%,但0~10°區(qū)間面積占總面積的50.13%,因此發(fā)育密度相對較小,10~20°和20~30°為災害發(fā)育密度最大坡度區(qū)間,均為0.08處/km2。坡度大于40°的區(qū)域無地質(zhì)災害發(fā)育。
(3)坡向(圖1(c))。災害點主要分布于東南向與南向,其次是西南向與西向,發(fā)育災害占總災害數(shù)量的百分比分別為20.43%、20.43%、15.05%、15.05%,東北向相對較少,僅發(fā)育2處災害點。東南向發(fā)育密度最高,為0.14處/km2。平坡向無地質(zhì)災害發(fā)育。
(4)地勢起伏度(圖1(d))。災害點主要分布于100~150 m地勢起伏區(qū)間,發(fā)育災害占總災害數(shù)量的48.39%,且發(fā)育密度最大,為0.13處/km2,而25~50 m區(qū)間發(fā)育地質(zhì)災害較少,僅有1處。0~25 m區(qū)間無地質(zhì)災害發(fā)育。
圖1 影響因子分級統(tǒng)計結(jié)果圖Fig.1 The results of statistical classification of influencing factors
(5)地質(zhì)構(gòu)造(圖1(e))。距離斷裂構(gòu)造3 000 m以內(nèi)時僅發(fā)育4處地質(zhì)災害,95.70%的地質(zhì)災害點發(fā)育在距離斷裂構(gòu)造3 000 m以外,地質(zhì)構(gòu)造不是影響研究區(qū)地質(zhì)災害發(fā)育的主要因素。
(6)地層巖組(圖1(f))。災害點主要分布于Qeo13,占總災害數(shù)量的53.76%,其次是Q4,占總災害數(shù)量的17.20%,而A未發(fā)育地質(zhì)災害。
(7)道路工程擾動(圖1(g))。災害點在距離道路0~200 m時相對分布較多,占災害總數(shù)量的22.58%,發(fā)育密度最大,為0.11處/km2。而距離道路大于1 000 m區(qū)域發(fā)育災害數(shù)量最多,占災害總數(shù)量的46.24%,但發(fā)育密度為0.06處/km2。
(8)河流水系(圖1(h))。災害點在距離河流0~200 m范圍內(nèi)發(fā)育數(shù)量最多,占總災害數(shù)量的67.74%,發(fā)育密度也最大,為0.23處/km2,表明研究區(qū)地質(zhì)災害發(fā)育受河流水系的影響較大。
(9)NDVI(圖1(i))。災害點主要發(fā)育于NDVI值0.3~0.4、0.2~0.3的區(qū)域,分別占總災害數(shù)量的48.39%和30.11%,發(fā)育密度分別為0.18處/km2、1.00處/km2,表明研究區(qū)地質(zhì)災害發(fā)育位置植被覆蓋度較好。
綜合上述分析,研究區(qū)地質(zhì)災害點受地形地貌影響主要發(fā)育于1 400 m高程以下,0°~20°坡度之間,100~150 m地勢起伏區(qū)間,坡向以東南向、南向為主;受地質(zhì)因素影響主要分布于Qeo13地層,但受地質(zhì)構(gòu)造控制較弱;受人為動力因素影響,距離道路1 000 m以外發(fā)育災害點數(shù)量最多,200 m以內(nèi)相對較多,災害發(fā)育與道路關(guān)系密切;受自然因素影響,災害點主要分布于距離河流200 m以內(nèi)的區(qū)域,受水系影響明顯,同時災害點主要分布于植被覆蓋度較高區(qū)域。
文中隨機選取70%的總樣本點和相同數(shù)量的非地質(zhì)災害單元作為訓練樣本,其余30%作為測試數(shù)據(jù)。
本文利用ArcGIS軟件提取研究區(qū)各因子的圖層數(shù)據(jù),通過皮爾遜相關(guān)系數(shù)Rxy來衡量各因子的相關(guān)度。
經(jīng)計算,高程與道路工程擾動因子之間具有較強相關(guān)性(Rxy=0.816),對比圖1,高程因子與道路工程擾動因子相比規(guī)律性較弱,因此剔除高程因子,以剩余8個因子構(gòu)建評價因子集,采用CF模型進行研究區(qū)斜坡地質(zhì)災害敏感性評價。
在SVM樣本訓練中利用多種核函數(shù)訓練,經(jīng)對比后選取RBF核函數(shù)作為預測模型,進而對整個研究區(qū)的斜坡地質(zhì)災害敏感性進行預測。
利用圖1的統(tǒng)計結(jié)果作為RF模型的分類數(shù)據(jù),利用訓練樣本進行模型訓練,調(diào)整最優(yōu)特征數(shù)和決策樹的個數(shù),對比選出最優(yōu)預測模型,從而對整個研究區(qū)進行預測,得到研究區(qū)斜坡地質(zhì)災害敏感性評價結(jié)果。
采用CF模型計算得到的各評價因子分級CF值作為分類數(shù)據(jù)輸入RBF核函數(shù)SVM模型,進行研究區(qū)斜坡地質(zhì)災害敏感性評價。
研究區(qū)斜坡地質(zhì)災害敏感性評價分別采用CF模型、SVM模型、RF模型、CF-SVM模型,將研究區(qū)劃分為4個敏感性等級,分別為:極高敏感區(qū)、高敏感區(qū)、中敏感區(qū)和低敏感區(qū),采用自然間斷點法得到斜坡地質(zhì)災害敏感性分區(qū)圖(圖2)和分區(qū)統(tǒng)計表(表3),4種模型不同敏感性等級的災害點比例與面積比例頻率比值對比結(jié)果見圖3。
圖2 研究區(qū)斜坡地質(zhì)災害敏感性分區(qū)圖Fig.2 Slope geological hazard sensitivity zoning in the study area
表3 研究區(qū)斜坡地質(zhì)災害敏感性分區(qū)統(tǒng)計表Table 3 Statistical table of slope geological hazard sensitivity zoning in the study area
表3與圖3可以看出,4種模型的頻率比值均隨敏感性等級升高而遞增,經(jīng)對比均符合指數(shù)函數(shù),擬合方程分別為:(1)y=0.014 7e1.3848x,R2=0.987 7;(2)y=0.024e1.2894x,R2=0.976 3;(3)y=0.005 8e1.6904x,R2=0.991 7;(4)y=0.029 9e1.2616x,R2=0.997 6。其中,決定系數(shù)R2的值均接近于1,表明4種模型的頻率比值與敏感性等級之間呈良好的正相關(guān),而CF-SVM模型所劃分的敏感性等級與頻率比值相關(guān)性最好(R2=0.997 6)。
圖3 災害點比例與面積比例頻率比值對比圖Fig.3 Comparison of the frequency ratio by the proportion of disaster points and the proportion of area
ROC曲線下面積AUC值可以用來確定預測模型精度等級[27]:(1)極好:0.9~1;(2)非常好:0.8~0.9;(3)好:0.7~0.8;(4)一般:0.6~0.7;(5)差:0~0.6。
本文采用ROC曲線評價精度,利用占總樣本30%的未參與模型訓練的28個樣本點進行檢驗,保證所建模型的客觀與穩(wěn)定。ROC曲線及統(tǒng)計結(jié)果分別見表4和圖4。
圖4 ROC曲線圖Fig.4 ROC curve
表4 ROC曲線統(tǒng)計表Table 4 Statistical table of ROC curve
(1)CF模型首先進行了評價因子相關(guān)性分析,剔除有較強相關(guān)性的高程因子,保留線性無關(guān)的8個因子開展評價。圖1統(tǒng)計結(jié)果顯示,災害點主要分布于1 300~1 400 m高程區(qū)間,占總災害數(shù)量的44.09%。結(jié)合經(jīng)驗分析,高程是斜坡地質(zhì)災害發(fā)育的重要地形影響因子,因相關(guān)性而剔除高程參與計算對評價結(jié)果具有一定的影響。而SVM模型、RF模型和CF-SVM模型均采用全部評價因子開展評價,消除了重要影響因子可能被剔除所引起的評價風險。
(2)表3顯示,CF模型、SVM模型、RF模型和CF-SVM模型的敏感性分區(qū)結(jié)果中極高敏感區(qū)的頻率比值分別為4.36、3.32、5.57和5.01,而低敏感區(qū)的頻率比值分別為0.06、0.08、0.03和0.11,RF模型在極高敏感區(qū)的頻率比表現(xiàn)最佳,其次是CF-SVM模型,均以更小的分區(qū)面積分布了更多的斜坡地質(zhì)災害點。由表4可以看出,CF模型、SVM模型、RF模型和CF-SVM模型的AUC值分別為0.780、0.817、0.823和0.828,漸進顯著性均小于0.05,表明4種模型均較好,其中,CF模型的精度為好,SVM模型、RF模型和CF-SVM模型的精度為非常好,且CF-SVM模型精度高于其他3種模型。
(3)由圖2可以看出,CF模型與RF模型受水系因子影響較大,所劃分極高敏感區(qū)主要沿水系分布,呈明顯的樹杈狀;SVM模型體現(xiàn)出多因子的綜合作用,所劃分極高敏感區(qū)主要分布于西部黃土丘陵區(qū)與東南部土石山區(qū),西部丘陵區(qū)溝谷縱橫、水土流失嚴重,是黃土崩塌、滑坡發(fā)育的潛在隱患區(qū);CF-SVM模型所劃分極高敏感區(qū)保持了CF模型的特點,沿水系走向分布,而低敏感區(qū)則保持了SVM模型的特點,主要分布于中部平原區(qū)。
(4)圖3表明,4種模型的頻率比值趨勢一致,均呈現(xiàn)指數(shù)特征。CF模型所劃分極高、高敏感區(qū)總面積為682.986 km2,占研究區(qū)總面積的49.10%,災害點分布占總災害點的90.33%;SVM模型所劃分極高、高敏感區(qū)總面積為503.678 km2,占研究區(qū)總面積的36.21%,災害點分布占總災害點的89.24%;RF模型所劃分極高、高敏感區(qū)總面積為596.059 km2,占研究區(qū)總面積的42.85%,災害點分布占總災害點的93.55%;CF-SVM模型所劃分極高、高敏感區(qū)總面積為448.721 km2,占研究區(qū)總面積的32.26%,災害點分布占總災害點的84.95%。
(1)CF模型、SVM模型、RF模型和CF-SVM模型精度均較高,AUC值分別為0.780、0.817、0.823和0.828,預測精度由高到低依次為:CF-SVM模型>RF模型>SVM模型>CF模型,CF-SVM模型較CF模型、SVM模型和RF模型預測精度分別提升了6.15%、1.35%和0.61%,是4種模型中更適合縣域國土空間斜坡地質(zhì)災害敏感性評價的模型。
(2)綜合頻率比值、AUC值和敏感性分區(qū)圖,CF-SVM模型融合了CF模型與SVM模型的優(yōu)點,既保證了更多的斜坡地質(zhì)災害點分布于極高、高敏感區(qū),模型精度非常好,又保證了極高、高敏感區(qū)面積相對較小,符合斜坡地質(zhì)災害分布實際情況,是CF模型與SVM模型綜合賦能預測結(jié)果的體現(xiàn),兼顧了評價精度與結(jié)果合理性,模型適用性更好。
(3)CF-SVM模型所劃分地質(zhì)災害低敏感區(qū)、中敏感區(qū)、高敏感區(qū)和極高敏感區(qū)的面積分別為:537.885 km2、404.394 km2、278.671 km2和170.050 km2,分別占研究區(qū)總面積的38.67%、29.07%、20.03%和12.23%,所分布災害點分別占總災害點的4.30%、10.75%、23.66%和61.29%,災害點比例隨敏感性等級升高而遞增,與敏感性等級之間呈現(xiàn)良好的正相關(guān)。
(4)本文系統(tǒng)性開展了縣域國土空間小樣本斜坡地質(zhì)災害確定性系數(shù)模型(CF)、支持向量機模型(SVM)、隨機森林模型(RF)和組合模型(CF-SVM)敏感性評價精度與結(jié)果對比,為類似研究與防災減災工作提供了技術(shù)參考。
本文所選評價因子中未考慮降雨、地震等影響,今后應繼續(xù)完善評價因子集,同時,應進一步考慮更多模型參與評價與組合,對比遴選最優(yōu)評價模型。