吳 明 堂,薛 正 海,崔 振 華,韓 靖 楠,馮 文 凱
(1.浙江華東建設(shè)工程有限公司,浙江 杭州 310014; 2.成都理工大學(xué) 地質(zhì)災(zāi)害防治與地質(zhì)環(huán)境保護(hù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,四川 成都 610059)
滑坡是世界上最具破壞性的地質(zhì)災(zāi)害之一,常常給工農(nóng)業(yè)生產(chǎn)以及人民生命財(cái)產(chǎn)造成巨大損失[1-2]?;碌母甙l(fā)生率和廣泛分布引起了許多科學(xué)家的研究興趣,其中一些科學(xué)家致力于繪制滑坡易發(fā)性圖[3]。通過(guò)分析滑坡易發(fā)性圖,可以評(píng)估和定位極易受這些事件影響的區(qū)域來(lái)降低滑坡災(zāi)害損失,并在世界各地取得了良好的效果[4-5]。
制圖單元的選擇是滑坡易發(fā)性評(píng)價(jià)的關(guān)鍵步驟。雖然柵格單元的劃分非常精細(xì),但它已經(jīng)失去了與地質(zhì)、地貌和其他工程地質(zhì)條件的所有聯(lián)系。然而滑坡多發(fā)生在山區(qū),與山谷線、山脊線的分布有關(guān)。因此,許多學(xué)者開(kāi)始采用斜坡單位作為制圖單位[6],并發(fā)現(xiàn)基于斜坡單元的易發(fā)性制圖結(jié)果要優(yōu)于基于柵格單元的易發(fā)性制圖結(jié)果[7-10]。
評(píng)價(jià)模型是滑坡易發(fā)性評(píng)價(jià)中不可或缺的,它直接決定了評(píng)價(jià)的結(jié)果。早些年多數(shù)滑坡易發(fā)性都采用單一模型進(jìn)行評(píng)價(jià),例如,頻率比模型[11]、證據(jù)權(quán)模型[12-15]、Logistic回歸模型[16-18]和隨機(jī)森林模型[19]。這些模型中,頻率比模型概念簡(jiǎn)單、操作方便,計(jì)算結(jié)果通俗易懂,能夠客觀地處理評(píng)價(jià)因子狀態(tài)分級(jí)。證據(jù)權(quán)模型具有形式直觀、建模簡(jiǎn)單等優(yōu)點(diǎn)[20],能夠較好地消除評(píng)價(jià)因子選取和權(quán)重分配受主觀影響的問(wèn)題,可以用于實(shí)現(xiàn)評(píng)價(jià)因子狀態(tài)分級(jí)處理[21]。Logistic 回歸模型能夠從不同評(píng)價(jià)因子以及滑坡的關(guān)系中獲得不同評(píng)價(jià)因子的權(quán)重,并可以利用簡(jiǎn)單的線性回歸方程來(lái)描述復(fù)雜的非線性關(guān)系[22]。隨機(jī)森林模型可處理高維度、大數(shù)據(jù)量的數(shù)據(jù)集,且對(duì)噪聲及異常值的敏感度較低,能以概率模型直觀地反應(yīng)滑坡易發(fā)程度,且具有較高的預(yù)測(cè)精度和穩(wěn)定性。但是在評(píng)價(jià)過(guò)程中發(fā)現(xiàn)單一模型在分級(jí)與量化的過(guò)程中出現(xiàn)同一評(píng)價(jià)因子易受主觀因素影響的問(wèn)題。為了解決上述問(wèn)題,學(xué)者們選擇采用多種模型耦合進(jìn)行滑坡易發(fā)性評(píng)價(jià)。Yang等使用基于卷積神經(jīng)網(wǎng)絡(luò)的混合模型進(jìn)行滑坡易發(fā)性制圖,發(fā)現(xiàn)混合模型充分利用了神經(jīng)網(wǎng)絡(luò)的特征提取能力,預(yù)測(cè)精度達(dá)89.6%,分別比兩種純卷積神經(jīng)網(wǎng)絡(luò)模型提高了6.2%和3.7%[23]。Peng等采用基于粗糙集-支持向量機(jī)的混合模型進(jìn)行易發(fā)性制圖,并且將其與一般支持向量機(jī)模型進(jìn)行綜合比較,發(fā)現(xiàn)該模型具有較好的預(yù)測(cè)能力和較高的可靠性[24]。多數(shù)研究都發(fā)現(xiàn)耦合模型得到的滑坡易發(fā)性結(jié)果精度明顯優(yōu)于單一模型。因此,采用多種模型耦合進(jìn)行滑坡易發(fā)性評(píng)價(jià)是目前區(qū)域滑坡易發(fā)性研究的熱點(diǎn),但這些耦合模型研究都只基于柵格單元進(jìn)行,較少的采用斜坡單元模型進(jìn)行分析。
因此本文以斜坡單元為制圖單元,采用證據(jù)權(quán)模型、Logistic 回歸模型和證據(jù)權(quán)-Logistic 回歸耦合模型,對(duì)白鶴灘水電站野豬塘至象鼻嶺庫(kù)岸段進(jìn)行滑坡易發(fā)性研究,以分析耦合模型對(duì)基于斜坡單元的滑坡易發(fā)性評(píng)價(jià)結(jié)果的影響。
研究區(qū)位于云南省巧家縣上游50 km象鼻嶺至下游10 km野豬塘,地處東經(jīng)102°53′27.87″~102°59′37.44″、北緯26°29′14.27″~26°58′12.65″之間,距白鶴灘壩址32.4~94.0 km,河谷形態(tài)為寬緩的“U”字形,兩側(cè)岸坡不對(duì)稱(chēng)。研究區(qū)位于青藏高原東南緣,冬半年(11月至次年4月)受青藏高原南支西風(fēng)環(huán)流影響,天氣晴朗干燥,降雨稀少;夏半年(5月~次年10月)受副熱帶西風(fēng)和西南季風(fēng)影響,降水較為頻繁。區(qū)內(nèi)地層發(fā)育較全,主要有元古界前震旦系會(huì)理群安通組,元古界震旦系上統(tǒng)燈影組和下統(tǒng)澄江組,古生界寒武紀(jì)下統(tǒng)、中統(tǒng)西王廟組和上統(tǒng)二道水組,古生界奧陶系中統(tǒng)巧家組和大箐組,古生界志留系中統(tǒng)石門(mén)坎組和志留系上統(tǒng),古生界泥盆系下統(tǒng)、中統(tǒng)幺棚子組,古生界石炭系下統(tǒng),古生界二疊系下統(tǒng)梁山組、下統(tǒng)棲霞-茅口組和上統(tǒng)峨眉山組以及新生界第四系地層區(qū)內(nèi)除了通過(guò)2條大的斷裂帶之外還發(fā)育許多小的斷裂帶(見(jiàn)圖1)。
為了完成此次研究,收集了以下數(shù)據(jù):
(1) 1 m分辨率的DEM。該數(shù)據(jù)通過(guò)無(wú)人機(jī)航攝得到,用于提取坡度、坡向等地形地貌因子。
(2) 1∶25 000的地質(zhì)圖。該數(shù)據(jù)從全國(guó)地質(zhì)資料館(http:∥www.ngac.cn/)獲取,用于提取巖性、斷層等構(gòu)造因子。
(3) 1∶250 000的水系數(shù)據(jù)。該數(shù)據(jù)從國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)中心(http:∥www.geodata.cn/)獲取,用于提取水系評(píng)價(jià)因子。
(4) 110個(gè)滑坡災(zāi)害點(diǎn)數(shù)據(jù)。該數(shù)據(jù)主要來(lái)源于2個(gè)方面:① InSAR技術(shù)解譯并現(xiàn)場(chǎng)復(fù)核識(shí)別的滑坡災(zāi)害點(diǎn);② 無(wú)人機(jī)遙感航攝解譯并通過(guò)復(fù)核確定的滑坡災(zāi)害點(diǎn)。
斜坡單元代表評(píng)估滑坡、崩塌和其他地質(zhì)災(zāi)害的基本單位。在所有的影響因素中,河谷和河流的發(fā)育階段對(duì)滑坡的形成起著重要的作用。通過(guò)勾勒山脊線與山谷線的劃分,斜坡單元可以與地質(zhì)環(huán)境條件密切相關(guān)??紤]到各種因素的影響,斜坡單元能確保評(píng)估結(jié)果更符合事實(shí)[25]。
從地形地貌上看,斜坡單元可以看作是一個(gè)流域的左或右邊部分,流域的邊界線即為山脊線,如果能夠找出山谷線,用山谷線去分割流域,則可以得到兩個(gè)斜坡單元(見(jiàn)圖2)。
ArcGIS的水文分析功能能夠利用數(shù)字高程模型(DEM)提取山脊線和山谷線,進(jìn)而劃分斜坡單元,操作流程見(jiàn)圖3。研究區(qū)按上述步驟共劃分出458個(gè)斜坡單元,如圖4所示。
證據(jù)權(quán)模型是一種基于貝葉斯統(tǒng)計(jì)的定量評(píng)價(jià)方法,它綜合了各種證據(jù)層因素來(lái)預(yù)測(cè)某一時(shí)刻的滑坡發(fā)生概率[26]。該方法的計(jì)算過(guò)程如下:將歷史滑坡災(zāi)害與各證據(jù)層因子進(jìn)行空間相關(guān)分析,得出各滑坡在不同證據(jù)層中的發(fā)育情況,計(jì)算評(píng)價(jià)因子中各狀態(tài)分類(lèi)對(duì)滑坡災(zāi)害發(fā)生的貢獻(xiàn)[22]。公式如下:
(1)
(2)
(3)
Logistic回歸模型是一種多元統(tǒng)計(jì)分析方法,用于研究二項(xiàng)分類(lèi)結(jié)果與多個(gè)不相關(guān)影響因素之間的關(guān)系[22,27]。該模型通過(guò)研究滑坡易發(fā)性與影響因素之間的關(guān)系,以因子指標(biāo)值為自變量,以是否發(fā)生滑坡(“1”和 “0”)為因變量,預(yù)測(cè)滑坡發(fā)生的概率[28]。
該模型的計(jì)算過(guò)程如式(4) 所示,對(duì)P作Logit函數(shù)轉(zhuǎn)換,結(jié)果如式(5) 所示:
(4)
式中:Ij1,Ij2,Ij3,…,Ijn表示各評(píng)價(jià)因子,如坡度、坡向或證據(jù)權(quán)值等;P為滑坡發(fā)生概率;a0為常數(shù),表示在所有評(píng)價(jià)因子影響的前提下滑坡發(fā)生與不發(fā)生概率之比的對(duì)數(shù)值;ai為邏輯回歸系數(shù)即各評(píng)價(jià)因子權(quán)重[5]。
為更好了解耦合模型對(duì)基于斜坡單元滑坡易發(fā)性結(jié)果的影響,本文選用兩種單一模型與其進(jìn)行對(duì)比分析。
在分析各因素對(duì)研究區(qū)滑坡發(fā)生影響的基礎(chǔ)上,選取坡度、坡向、坡型、地形起伏、斷層密度、距河流距離、工程巖組等7個(gè)評(píng)價(jià)因子作為滑坡易發(fā)性評(píng)價(jià)的指標(biāo)體系。每個(gè)因素在ArcGIS中通過(guò)自然間斷法進(jìn)行分級(jí)(見(jiàn)圖5)。
在ArGIS中將不同評(píng)價(jià)因子的證據(jù)權(quán)值進(jìn)行疊加得到易發(fā)性圖層,最后使用自然間斷點(diǎn)分級(jí)工具將易發(fā)性圖層劃分為4個(gè)等級(jí):極高、高、中、低(見(jiàn)圖6)。
提取110個(gè)發(fā)生過(guò)滑坡的斜坡單元,并隨機(jī)選擇相同數(shù)量未發(fā)生滑坡的斜坡單元,共計(jì)220個(gè)具有獨(dú)立屬性的統(tǒng)計(jì)樣本[28-29]。其中,因變量“1”表示發(fā)生過(guò)滑坡的斜坡單元,“0”表示未發(fā)生過(guò)滑坡的斜坡單元。自變量為坡度、坡向、坡型、地形起伏、斷層密度、距河流距離和工程巖組的指標(biāo)值。將提取的樣本值導(dǎo)入SPSS軟件中進(jìn)行Logistic回歸計(jì)算,得到各評(píng)價(jià)因子的權(quán)值(見(jiàn)表2)。
表1 各評(píng)價(jià)因子證據(jù)權(quán)重Tab.1 Evidence weight of each evaluation factor
表2 Logistic回歸結(jié)果Tab.2 Results of logistic regression
基于Logistic回歸結(jié)果中的各因子權(quán)值可得模型的公式如下:
-0.001Ij4-0.268Ij5+1.295Ij6-0.039Ij7
(5)
式中:P為滑坡易發(fā)概率;Ij1~I(xiàn)j7分別為坡度、坡向、斷層密度、河流距離、起伏度、坡型和工程巖組各因子的指標(biāo)值[29]。
在ArGIS中將各評(píng)價(jià)因子的權(quán)值與其指標(biāo)值使用柵格計(jì)算器進(jìn)行計(jì)算得到相應(yīng)的滑坡易發(fā)性圖層,最后使用自然間斷點(diǎn)分級(jí)工具將易發(fā)性圖層劃分為4個(gè)等級(jí):極高、高、中、低(見(jiàn)圖7)。
基于證據(jù)權(quán)評(píng)價(jià)模型和上述Logistic回歸方法,將Logistic回歸中的自變量轉(zhuǎn)化為各因素的證據(jù)權(quán)值,因變量為斜坡單元上是否發(fā)生滑坡。用SPSS軟件計(jì)算得到回歸結(jié)果如表3所列。
表3 基于證據(jù)權(quán)的Logistic回歸分析結(jié)果Tab.3 Logistic regression analysis results based on evidence weight
通過(guò)結(jié)果中的各因子權(quán)重可得回歸模型的公式如下:
+1.846Ij4+2.649Ij5+2.392Ij6+0.854Ij7
(6)
式中:P為滑坡易發(fā)性概率值;Ij1~I(xiàn)j7分別為坡度、坡向、斷層密度、河流距離、起伏度、坡形、工程巖組各因子不同分區(qū)的證據(jù)權(quán)值[29]。
在ArGIS中將各評(píng)價(jià)因子的權(quán)值與其證據(jù)權(quán)值使用柵格計(jì)算器進(jìn)行計(jì)算得到相應(yīng)的滑坡易發(fā)性圖層,最后使用自然間斷點(diǎn)分級(jí)工具將易發(fā)性圖層劃分為4個(gè)等級(jí):極高、高、中、低(見(jiàn)圖8)。
上述3種模型的結(jié)果分析表明:
(1) 極高易發(fā)區(qū)主要集中在陡坡區(qū)和斷層密集區(qū),并且軟弱巖組對(duì)滑坡的易發(fā)結(jié)果也有很大影響。原因在于:隨著坡度的增加,剪應(yīng)力在坡腳匯集也較大,發(fā)生滑坡的概率也越大;斷裂帶附近巖體較為破碎,極易發(fā)生滑坡災(zāi)害;軟弱巖組自身的巖體力學(xué)參數(shù)較差,如其承載力在該研究區(qū)巖組中最低、抗風(fēng)化能力較弱,使其在降雨、地震等外界因素的作用下,極易發(fā)生滑坡災(zāi)害。這說(shuō)明各模型評(píng)價(jià)結(jié)果與基礎(chǔ)地質(zhì)認(rèn)知相符,合理性較強(qiáng)。
(2) 將易發(fā)性區(qū)劃圖與證據(jù)權(quán)值結(jié)合分析表明,極高易發(fā)區(qū)和高易發(fā)區(qū)多位于坡型為凸型坡、坡向朝NW、起伏度為42~61 m的區(qū)域,且距離河流距離較近,與現(xiàn)實(shí)的地質(zhì)事實(shí)相符。
(3) 通過(guò)對(duì)各模型的頻率比(滑坡比例/面積比例)分析發(fā)現(xiàn)耦合模型更為合理。耦合模型中極高易發(fā)區(qū)只占研究區(qū)面積的25.5%,但總共發(fā)育了64%的滑坡災(zāi)害,滑坡災(zāi)害頻率比達(dá)2.51;低易發(fā)區(qū)占研究區(qū)面積的38.8%,只發(fā)育了5%的滑坡災(zāi)害,滑坡災(zāi)害頻率比只有0.13(見(jiàn)表4)。
表4 各模型易發(fā)性分區(qū)結(jié)果及滑坡分布Tab.4 Results of susceptibility of each models and landslide distribution
為分析不同模型對(duì)易發(fā)性評(píng)價(jià)精度的影響,采用ROC曲線法檢驗(yàn)證據(jù)權(quán)重模型、Logistic回歸模型和證據(jù)權(quán)-Logistic回歸耦合模型的準(zhǔn)確性。AUC越大,實(shí)驗(yàn)精度越高,模型預(yù)測(cè)效果越好[28]。3種評(píng)價(jià)模型的ROC曲線如圖9所示,證據(jù)權(quán)模型、Logistic回歸模型和證據(jù)權(quán)-Logistic回歸耦合模型的AUC值分別為0.880,0.891和0.901,其中耦合模型的AUC值分別比證據(jù)權(quán)模型和Logistic回歸模型的AUC值高1.9%和1%。研究結(jié)果表明,在以斜坡單元為評(píng)價(jià)單元的基礎(chǔ)上使用證據(jù)權(quán)-Logistic回歸耦合模型作為評(píng)價(jià)模型相比與單一評(píng)價(jià)模型具有較高的精度,可以更有效地用于區(qū)域滑坡易發(fā)性評(píng)價(jià)。
研究在斜坡單元的基礎(chǔ)上采用證據(jù)權(quán)模型、Logistic和證據(jù)權(quán)-Logistic回歸耦合模型對(duì)研究區(qū)滑坡災(zāi)害進(jìn)行易發(fā)性評(píng)價(jià)。通過(guò)頻率比和ROC曲線等方法對(duì)結(jié)果進(jìn)行分析研究發(fā)現(xiàn):3種模型的易發(fā)性結(jié)果都與現(xiàn)實(shí)事實(shí)認(rèn)知相符,合理性較好且耦合模型具有更好的合理性;ROC曲線結(jié)果顯示耦合模型評(píng)價(jià)結(jié)果精度明顯優(yōu)于單一模型結(jié)果。說(shuō)明在以斜坡單元為制圖單元的基礎(chǔ)上,采用證據(jù)權(quán)-Logistic回歸耦合模型的評(píng)價(jià)結(jié)果精度更高、效果更好。