王文霞
(北京市地質(zhì)工程勘察院,北京 100048)
滑坡是我國地質(zhì)災(zāi)害中數(shù)量最多、發(fā)生頻率最高的地質(zhì)災(zāi)害。對穿越區(qū)域大、暴露度高的線性工程而言,滑坡嚴(yán)重威脅鐵路、公路、輸電線路、管線等“生命線”工程的正常運(yùn)行[1]。因此,諸多學(xué)者對不同類型的線性工程沿線進(jìn)行了地質(zhì)災(zāi)害易發(fā)性評價(jià)。如屈飛行等[1]將InSA形變監(jiān)測與加權(quán)信息量模型進(jìn)行耦合,構(gòu)建了川藏聯(lián)網(wǎng)工程芒康段地質(zhì)災(zāi)害易發(fā)性動態(tài)評價(jià)模型;冼國棟等[2]采用貢獻(xiàn)率模型完成了中國石油西南管道沿線的地質(zhì)災(zāi)害滑坡易發(fā)性評價(jià);李剛等[3]分析了滑坡對關(guān)中環(huán)線道路建設(shè)和維護(hù)的影響。
不同的評價(jià)模型對滑坡易發(fā)性評價(jià)結(jié)果有很大影響。目前,常用的滑坡易發(fā)性評價(jià)模型可分為知識驅(qū)動型、數(shù)據(jù)驅(qū)動型和物理模型驅(qū)動型[1]。知識驅(qū)動型有較強(qiáng)的主觀性,物理模型驅(qū)動型則需要大量精確的滑坡體力學(xué)參數(shù),這在一定程度上限制了這兩種方法的應(yīng)用。實(shí)踐證明,相較其他兩種類型,數(shù)據(jù)驅(qū)動型有著更高的精確性[2]。隨著人工智能的發(fā)展,機(jī)器模型已成為滑坡易發(fā)性定量評價(jià)最為廣泛應(yīng)用的模型,大量應(yīng)用實(shí)踐證明,機(jī)器模型的評價(jià)結(jié)果優(yōu)于傳統(tǒng)數(shù)據(jù)統(tǒng)計(jì)模型[4]。常見的機(jī)器學(xué)習(xí)模型有隨機(jī)森林模型、決策樹模型、支持向量機(jī)、貝葉斯模型和神級網(wǎng)絡(luò)模型等[5-6],各種模型的優(yōu)缺點(diǎn)見表1。
表1 常見機(jī)器學(xué)習(xí)模型在滑坡易發(fā)性評價(jià)中的優(yōu)缺點(diǎn)對比
根據(jù)滑坡評價(jià)的基本理論,未來滑坡通常會發(fā)生在與已發(fā)生過滑坡的相似區(qū)域,這與物種生存環(huán)境適宜性評價(jià)的基本理論相一致。近期,國外科學(xué)家進(jìn)一步將原應(yīng)用于物種生存環(huán)境適宜性評價(jià)的最大熵模型運(yùn)用于滑坡易發(fā)性評價(jià)研究,取得了有效評價(jià)結(jié)果,這在國內(nèi)滑坡易發(fā)性評價(jià)工作中尚不多見[7-8]。因此,將該跨學(xué)科評價(jià)模型應(yīng)用于國內(nèi)滑坡易發(fā)性評價(jià)并驗(yàn)證其適宜性,可豐富評估模型并應(yīng)用于工程施工過程中的滑坡災(zāi)害預(yù)測。
國道109新線高速公路(六環(huán)—市界段)工程總長度為69.2 km,是實(shí)現(xiàn)京津冀一體化發(fā)展的一條重點(diǎn)規(guī)劃線路。因此,本文以該線路為例,采用機(jī)器學(xué)習(xí)模型中的最大熵模型(MaxEnt)對沿線滑坡進(jìn)行易發(fā)性評價(jià),實(shí)現(xiàn)模型驗(yàn)證的同時,可為新高速公路的滑坡災(zāi)害預(yù)警提供參考。
國道109新線高速公路(六環(huán)—市界段) (圖1),總長度為69.2 km,東起北京六環(huán),終點(diǎn)為市界。本文選擇以公路沿線兩側(cè)所在山體的分水嶺作為評估邊界與地質(zhì)災(zāi)害活動環(huán)境更加相符,進(jìn)而有效評估高風(fēng)險(xiǎn)災(zāi)害[9],圈定評估區(qū)域面積共計(jì)628 km2。項(xiàng)目區(qū)域?yàn)榈湫偷纳降氐孛?,地層以砂巖、玄武巖為主,區(qū)域地質(zhì)構(gòu)造復(fù)雜,主要以大型復(fù)式地臺型褶皺為主,主體構(gòu)造呈NE向,斷裂構(gòu)造發(fā)育,該構(gòu)造附近發(fā)育有少量小型的非活動斷裂。根據(jù)遙感解譯和現(xiàn)場調(diào)查,共發(fā)現(xiàn)126處疑似滑坡,對該工程的建設(shè)和后期維護(hù)產(chǎn)生巨大威脅。
圖1 地理位置圖
所有解譯的滑坡主要分布在公路沿線斜坡單元內(nèi),呈零散分布。地形坡度大(45°~70°),坡向在110°~170°之間,坡高較高,坡體上巖體節(jié)理、裂隙較發(fā)育,受人為活動等影響較大。
基于MaxEnt模型的滑坡易發(fā)性評價(jià)主要有以下步驟:
1)構(gòu)建評價(jià)指標(biāo)體系:收集滑坡數(shù)據(jù)庫、地質(zhì)圖、數(shù)字高程影像等資料,確定評價(jià)指標(biāo)體系。
2)數(shù)據(jù)預(yù)處理:在GIS中將所有評價(jià)指標(biāo)統(tǒng)一坐標(biāo)系,確定評價(jià)單元類型和大小,輸出為ASCII格式。
3)導(dǎo)入MaxEnt軟件計(jì)算:將上步獲取的指標(biāo)導(dǎo)入,設(shè)定訓(xùn)練和驗(yàn)證比例、訓(xùn)練次數(shù)等內(nèi)容,進(jìn)行易發(fā)性計(jì)算。
4)滑坡易發(fā)性分級與分析:將計(jì)算結(jié)果導(dǎo)入到GIS平臺中,采用自然斷點(diǎn)法進(jìn)行易發(fā)性分級,實(shí)現(xiàn)研究區(qū)滑坡易發(fā)性評價(jià)。具體流程見圖2。
圖2 滑坡易發(fā)性評價(jià)流程圖
構(gòu)建有效的評估指標(biāo)體系,才能實(shí)現(xiàn)有效的評價(jià)結(jié)果[10],本文以DEM、地質(zhì)圖、光學(xué)遙感影響及公開數(shù)據(jù)等為數(shù)據(jù)源,選取了地形起伏度、高程、坡度、坡向、地形濕度指數(shù)、粗糙度、工程地質(zhì)巖組、距道路距離、植被覆蓋度和土地利用類型等10個評價(jià)指標(biāo),重采樣所有指標(biāo)精度為30 m。具體數(shù)據(jù)來源和精度見表2。評價(jià)數(shù)據(jù)主要來源于公開數(shù)據(jù),且經(jīng)過大量相關(guān)文獻(xiàn)的檢驗(yàn),數(shù)據(jù)可靠,適用于地質(zhì)災(zāi)害易發(fā)性評價(jià)[1-3,10]。
表2 數(shù)據(jù)來源
首先將所有的數(shù)據(jù)在GIS中轉(zhuǎn)換為同一坐標(biāo)系和同一精度,隨后導(dǎo)出為MaxEnt軟件可識別的ASCII格式。其中,地形起伏度、高程、坡度、坡向、地形濕度指數(shù)和粗糙度等6個指標(biāo)來自數(shù)字高程模型,工程地質(zhì)巖組來自地質(zhì)圖的矢量化處理,NDVI和距道路距離分別來自哨兵2號的紅外、近紅外波段影像及光學(xué)影像,土地利用類型圖依據(jù)國家標(biāo)準(zhǔn)將其分為五大類。滑坡災(zāi)害數(shù)據(jù)庫以野外調(diào)查和遙感解譯為數(shù)據(jù)源,共計(jì)126處。
MaxEnt模型是依據(jù)訓(xùn)練滑坡的地質(zhì)環(huán)境指標(biāo)并通過貝葉斯規(guī)則定量計(jì)算評估區(qū)滑坡發(fā)生概率的機(jī)器學(xué)習(xí)模型。具體計(jì)算原理:將研究區(qū)劃分為有限個像元集X,假設(shè)x表示研究區(qū)的每一個計(jì)算單元x∈X,π(x)表示每個計(jì)算單元的發(fā)生滑坡的概率分布值0
(1)
式中:P(y=1|x)表示在特定x點(diǎn)發(fā)生山體滑坡的概率;P(y|x=1)表示滑坡分布條件下特定點(diǎn)x發(fā)生滑坡的可能性,即π(x);P(y=1)表示滑坡總體發(fā)生率;P(x)表示任意點(diǎn)發(fā)生x滑坡的概率。
因P(x)表示研究區(qū)內(nèi)所有計(jì)算單位X的任意點(diǎn)x等于1|x|,則式(1)可轉(zhuǎn)化為
P(y=1|x)=π(x)P(y=1)|x|
(2)
設(shè)滑坡發(fā)生與不發(fā)生的概率相等,即 [P(y=0)=P(y=1)=0.5],可進(jìn)一步簡化方程為
(3)
MaxEnt模型的應(yīng)用直接取決于條件概率P(y=1|x),條件概率值越大,滑坡發(fā)生的可能性越大。事件發(fā)生的數(shù)據(jù)π(x)可用于建模,代替直接估算P(y=1|x)。最大熵原理估計(jì)的π(x)值等于由指數(shù)表示的吉布斯概率分布。如果考慮n個特征(fi,i=1,2,…,n),則吉布斯的概率分布可定義為
(4)
式中:Zλ是一個歸一化常數(shù),可確保qλ(x)之和為1。在qλ(x)的估計(jì)中,模型利用正則化I2找到最接近約束條件下的分布,避免過度擬合。因此,MaxEnt模型是最大限度地處理對數(shù)似然。如果研究區(qū)內(nèi)事件出現(xiàn)m次,則對數(shù)似然與正則化之間的差異應(yīng)為最大化,表示為
(5)
式中:βj是jth特性fj的正則化參數(shù)。
在最大熵模型應(yīng)用中發(fā)現(xiàn),吉布斯概率分布符合賦存數(shù)據(jù),具推廣意義。
依據(jù)Cory Merow,et al[11]設(shè)置好訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)分配比例、訓(xùn)練次數(shù)、輸出類型等內(nèi)容,即可實(shí)現(xiàn)滑坡易發(fā)性定量評價(jià)。需要設(shè)置的主要參數(shù)有數(shù)據(jù)分割比例和訓(xùn)練次數(shù)兩類,其余為是否生產(chǎn)ROC曲線、輸出類型等相關(guān)選項(xiàng)。本文根據(jù)Du Juan,et al[12]選擇設(shè)定解譯的126個滑坡中80%的滑坡數(shù)據(jù)用于訓(xùn)練模型,其余的20%作為驗(yàn)證模型,模型訓(xùn)練次數(shù)為100次,計(jì)算輸出類型為邏輯計(jì)算、輸出格式ASCII型、進(jìn)行Jackknife分析、繪制變形響應(yīng)曲線。
借鑒受試者工作特征曲線ROC-AUC值對模型精度及分區(qū)結(jié)果進(jìn)行檢驗(yàn)。由圖3可知,訓(xùn)練模型精度達(dá)到80.2%,驗(yàn)證精度達(dá)到82.1%。依據(jù)ROC-AUC值的評價(jià)標(biāo)準(zhǔn)[6],當(dāng)AUC-ROC的值為0.8~0.9時,預(yù)測效果較好(good)。因此,本次模型訓(xùn)練和驗(yàn)證均達(dá)到了預(yù)測效果,且精度較高,結(jié)果具一定的可信度。
使用MaxEnt模型中的Jackknife檢驗(yàn)?zāi)P涂烧莆詹煌u價(jià)指標(biāo)對易發(fā)性評價(jià)結(jié)果的影響[6]。由圖4可知,所有評價(jià)指標(biāo)對評價(jià)結(jié)果的貢獻(xiàn)率均大于0,表明所有指標(biāo)均對模型有一定的影響。依據(jù)該指標(biāo)與ROC值的變化可知,坡向、距道路距離、NDVI、高程、地表粗糙度和土地利用類型6個指標(biāo)對滑坡評價(jià)結(jié)果的總影響達(dá)到了90%,其他指標(biāo)對滑坡貢獻(xiàn)率較小。該分析結(jié)果與野外調(diào)查及相關(guān)經(jīng)驗(yàn)較為一致。坡向影響巖土體表層風(fēng)化作用,進(jìn)而影響雨水入滲后的內(nèi)部耗損;距道路遠(yuǎn)近則反映人類活動對當(dāng)?shù)丨h(huán)境的改造作用;NDVI表示滑坡發(fā)生后的生態(tài)恢復(fù),滑坡活動區(qū)的植被通常比穩(wěn)定斜坡區(qū)稀疏,相應(yīng)的NDVI值也較小,從而區(qū)可分滑坡區(qū)與非滑坡區(qū);高程則影響該斜坡的地應(yīng)力分布、風(fēng)化等因素;地表粗糙度則表示滑坡發(fā)生區(qū)與未發(fā)生區(qū)的地表改造和破壞差異性,DEM精度對其有一定關(guān)系;滑坡區(qū)常因土體松散而被作為專用土地來利用,未滑坡區(qū)多保持原狀。
圖4 刀切法檢測主要環(huán)境變量對滑坡分布影響的重要程度
圖5為MaxEnt模型計(jì)算過程中10個評價(jià)指標(biāo)的響應(yīng)曲線。評估曲線可直接反應(yīng)出不同指標(biāo)值對發(fā)生滑坡災(zāi)害的貢獻(xiàn)度,不同指標(biāo)值對應(yīng)的“存在概率”越大,則表明該指標(biāo)值對滑坡發(fā)生的貢獻(xiàn)概率越大。曲線上升則表示隨著該指標(biāo)值的增加,滑坡發(fā)生概率呈遞增趨勢;曲線下降則表示隨著該指標(biāo)值的增加,滑坡發(fā)生概率呈遞減趨勢。
圖5 環(huán)境變量響應(yīng)曲線
由圖5可見:①滑坡易發(fā)性在0~350 m高程區(qū)間呈遞增趨勢,在350 m高程附近達(dá)到峰值,在350~2500 m高程區(qū)間,隨著高程的增加,“存在概率”緩慢遞減。②滑坡易發(fā)性隨著坡度的增加而逐漸遞增。③統(tǒng)計(jì)發(fā)現(xiàn),坡向呈西南和東南時,其對滑坡易發(fā)性的影響更強(qiáng)烈。④植被歸一化指數(shù)NDVI越低則滑坡易發(fā)性越強(qiáng),當(dāng)NDVI值=0.72時,“存在概率”出現(xiàn)最低值。⑤隨著地表粗糙度的增加,滑坡易發(fā)性呈遞增趨勢。⑥地形濕度指數(shù)對滑坡的影響呈“變速”增加現(xiàn)象,當(dāng)指數(shù)值在0~6之間時,滑坡易發(fā)性大幅度增加;當(dāng)指數(shù)值在6~25之間時,滑坡易發(fā)性的增加速度趨緩。⑦離道路越近,受人類活動(如切坡、削坡)影響越大,滑坡易發(fā)性越強(qiáng),隨著距離的增加,“存在概率”達(dá)最大值,又因地處山體頂部,巖石較為破碎,故滑坡易發(fā)性大大增加。⑧滑坡面多發(fā)生于軟巖和較堅(jiān)硬巖體交界處。⑨土地利用類型主要分為林地、草地和建設(shè)用地三類,其中建設(shè)用地影響最大。
MaxEnt模型的計(jì)算值在0~1之間,數(shù)值越大,表示滑坡易發(fā)性越大。采用自然斷點(diǎn)法將滑坡易發(fā)性分為5類,分別為極低易發(fā)區(qū)(0~0.144)、低易發(fā)區(qū)(0.114~0.296)、中易發(fā)區(qū)(0.296~0.436)、高易發(fā)區(qū)(0.436~0.584)和極高易發(fā)區(qū)(0.584~0.993),具體空間分布見圖6。
圖6 滑坡易發(fā)性分區(qū)圖
由圖6可知,地質(zhì)災(zāi)害極高易發(fā)區(qū)主要分布于新建公路中段兩側(cè)以及東西兩側(cè)接近人類活動區(qū)域的端部,低易發(fā)區(qū)主要分布于高程較高、人類活動影響較小區(qū)域,中易發(fā)區(qū)主要分布于兩者之間,整體易發(fā)區(qū)過渡較為自然,符合自然規(guī)律。
借助柵格統(tǒng)計(jì)分析工具(圖7),滑坡極低易發(fā)區(qū)面積占比2%,低易發(fā)區(qū)面積占比10%,中易發(fā)區(qū)面積占比16%,高易發(fā)區(qū)面積占比32%,極高易發(fā)區(qū)面積占比40%。在滑坡易發(fā)性分區(qū)結(jié)果中,126個滑坡中有90個(72%)位于高易發(fā)區(qū)和極高易發(fā)區(qū),利用LR Class指數(shù)對本次滑坡易發(fā)性進(jìn)行評價(jià),LR Class指數(shù)為2.25,評價(jià)結(jié)果優(yōu)秀[13-16]。
圖7 結(jié)果驗(yàn)證
由圖7可知,統(tǒng)計(jì)新建公路的滑坡易發(fā)區(qū)級別分布較均勻。整體而言,高易發(fā)區(qū)離公路距離較遠(yuǎn),新建公路以中低易發(fā)區(qū)為主,對公路安全運(yùn)營影響較為中性。
本文以國道109新線高速公路(六環(huán)—市界段)工程為例,采用非傳統(tǒng)的公路沿線兩側(cè)分水嶺為評估邊界,對126個滑坡構(gòu)建了10個評價(jià)指標(biāo)的滑坡易發(fā)性評價(jià)指標(biāo)體系,采用機(jī)器學(xué)習(xí)模型(MaxEnt)對沿線滑坡地質(zhì)災(zāi)害進(jìn)行易發(fā)性評價(jià),主要結(jié)論如下:
1)基于GIS和MaxEnt模型的滑坡易發(fā)性評價(jià)模型訓(xùn)練和驗(yàn)證,精度分別達(dá)到80.2%和82.1%,利用LR Class指數(shù)對評價(jià)結(jié)果進(jìn)行了驗(yàn)證,同樣證明本次評價(jià)結(jié)果的有效性。這均證明了原用于生態(tài)分析的MaxEnt模型也可跨學(xué)科的適用于滑坡易發(fā)性評價(jià),增加了模型的可選擇性,具有一定參考性。
2)滑坡主要受坡度、坡向、距道路距離、NDVI、高程、地表粗糙度和土地利用類型6個指標(biāo)影響,其累計(jì)貢獻(xiàn)率達(dá)到了90%;同時各環(huán)境變量響應(yīng)曲線能夠直觀地表示各個指標(biāo)不同數(shù)值范圍對滑坡的貢獻(xiàn)率,相較于其他機(jī)器學(xué)習(xí)的“黑箱”而言,具可視性。
3)在完成易發(fā)性評價(jià)分區(qū)后,創(chuàng)新地統(tǒng)計(jì)了新建公路與滑坡易發(fā)性分區(qū)空間分布關(guān)系,擬結(jié)果可知公路處于中低易發(fā)區(qū),后期本文將進(jìn)一步探索該模擬結(jié)果與實(shí)際施工中的差異性對比,以期為類似公路地區(qū)的防災(zāi)減災(zāi)工作提供參考。