趙喻文(中國(guó)石油西南油氣田公司生產(chǎn)運(yùn)行處,四川 成都 610051)
在西南地區(qū),地質(zhì)災(zāi)害一直是影響山區(qū)油氣管道安全運(yùn)營(yíng)的最大問題。截至2017年,中石油西南地區(qū)在役油氣管道里程已長(zhǎng)達(dá)1.33萬千米[1]。山區(qū)長(zhǎng)輸管道通常穿越山地、丘陵、河溝谷等多種復(fù)雜地貌單元,沿線地質(zhì)形貌復(fù)雜,地質(zhì)災(zāi)害難以避免,輕則造成管道埋深不足或局部出露,重則造成管道長(zhǎng)距離懸空、變形、扭曲、斷裂等,經(jīng)濟(jì)損失不可估量[2]。地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)是預(yù)防及緩解各類地質(zhì)災(zāi)害的有效手段之一,更是危險(xiǎn)性評(píng)價(jià)乃至風(fēng)險(xiǎn)評(píng)價(jià)的基礎(chǔ)。因此,開展油氣管道沿線典型地質(zhì)災(zāi)害的易發(fā)性評(píng)價(jià),不僅為風(fēng)險(xiǎn)管理奠定基礎(chǔ),而且為其監(jiān)測(cè)、防治提供理論依據(jù)。
美國(guó)于20世紀(jì)70年代開展長(zhǎng)輸油氣管道的安全評(píng)價(jià)研究工作,并應(yīng)用于工程實(shí)踐。1985 年,美國(guó)Battle Columbus研究院首次引入了專家評(píng)分法,對(duì)油氣管道地質(zhì)災(zāi)害易發(fā)性進(jìn)行了判斷和評(píng)價(jià)。2006年,加拿大BGC 公司開發(fā)了管道地質(zhì)災(zāi)害風(fēng)險(xiǎn)管理系統(tǒng)(GRM),首次采用半定量評(píng)價(jià)方法對(duì)滑坡、崩塌、水毀、地面塌陷等進(jìn)行了風(fēng)險(xiǎn)評(píng)價(jià)與排序[3]。2009年,中國(guó)石油管道科技研究中心研發(fā)的管道地質(zhì)災(zāi)害風(fēng)險(xiǎn)管理系統(tǒng)(PGR MS)采用了指標(biāo)評(píng)分的半定量評(píng)價(jià)方法[4]。近些年,隨著3S技術(shù)的快速發(fā)展,區(qū)域地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)模型的評(píng)價(jià)精度大大提高,從過去直接地貌制圖、基于專家經(jīng)驗(yàn)的定性分析發(fā)展到統(tǒng)計(jì)模型和更高級(jí)的機(jī)器自主學(xué)習(xí)模型的定量分析[5-6]。其中統(tǒng)計(jì)模型在地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)研究中運(yùn)用最廣[7-8],該方法是以地質(zhì)環(huán)境條件為基礎(chǔ),通過對(duì)過去發(fā)生地質(zhì)災(zāi)害的數(shù)據(jù)統(tǒng)計(jì)分析來建立評(píng)價(jià)模型,然后預(yù)測(cè)同類地區(qū)以及周邊地區(qū)以后可能發(fā)生地質(zhì)災(zāi)害的概率,然后得出易發(fā)程度分區(qū)。
本次研究以四川省東南部的20余條管線穿越區(qū)域?yàn)檠芯繉?duì)象,以野外實(shí)際調(diào)查數(shù)據(jù)為基礎(chǔ),基于地質(zhì)災(zāi)害的發(fā)生機(jī)理,收集了9個(gè)地質(zhì)災(zāi)害易發(fā)性條件因子。所有因子相關(guān)性檢驗(yàn)后采用廣泛使用的機(jī)器學(xué)習(xí)方法:邏輯回歸模型對(duì)研究區(qū)地質(zhì)災(zāi)害的易發(fā)性進(jìn)行建模計(jì)算,并評(píng)估了研究區(qū)的地質(zhì)災(zāi)害易發(fā)性,以期為該區(qū)及周邊地區(qū)油氣管道建設(shè)的風(fēng)險(xiǎn)管理提供依據(jù)。
研究區(qū)位于四川盆地東南部,管線穿越處以丘陵、侵蝕構(gòu)造低山地貌為主。區(qū)內(nèi)屬亞熱帶濕潤(rùn)季風(fēng)氣候,具有氣候溫和、降雨量豐富、冬暖夏熱等特點(diǎn),多年平均氣溫16.7~18.1 ℃。區(qū)域年平均降雨量約1 000 mm,降雨量多集中在5月—10月,約占全年雨量的79%。降雨多以暴雨形式發(fā)生,日最大降雨量257.9 mm,小時(shí)最大降雨量122.0 mm。管線經(jīng)過地區(qū)新構(gòu)造運(yùn)動(dòng)較強(qiáng)烈,地震烈度為Ⅵ~Ⅶ度。區(qū)內(nèi)廣泛出露侏羅系的砂巖、泥巖以三疊系的灰?guī)r,第四系以粘土、粉土及砂卵石層為主。巖土體結(jié)構(gòu)較為疏松,主要賦存第四系松散巖類孔隙潛水以及基巖裂隙水。研究區(qū)內(nèi)人類工程經(jīng)濟(jì)活動(dòng)復(fù)雜,主要有公路、房屋、基礎(chǔ)設(shè)施建及礦區(qū)井田建設(shè)等。
2.1.1 數(shù)據(jù)來源
研究區(qū)管線穿越地區(qū)的基礎(chǔ)數(shù)據(jù)來源于近4年的野外調(diào)查結(jié)果。以管線評(píng)估區(qū)段(0.2~2.0 km)的斜坡為評(píng)價(jià)單元,共統(tǒng)計(jì)地質(zhì)災(zāi)害點(diǎn)94處(正樣本數(shù)據(jù)),其中滑坡20處,崩塌13處,水毀61處。考慮到機(jī)器學(xué)習(xí)需要保持正負(fù)樣本的平衡性,我們還選取了94處非地災(zāi)點(diǎn)作為負(fù)樣本數(shù)據(jù)。
2.1.2 評(píng)價(jià)因子的選擇和分級(jí)
根據(jù)文獻(xiàn)查閱及現(xiàn)場(chǎng)調(diào)查數(shù)據(jù)的可用性,本文綜合考慮了影響管線地質(zhì)災(zāi)害形成的地形地貌、地層巖性、氣象水文、人類工程活動(dòng)以及已有災(zāi)害發(fā)育情況等因素,初步選擇了如表1所示的9個(gè)評(píng)價(jià)因子構(gòu)建數(shù)據(jù)庫(kù),并參照現(xiàn)有規(guī)范進(jìn)行了分級(jí)[9]。
表1 管線地質(zhì)災(zāi)害易發(fā)性條件因子選擇及等級(jí)劃分
選擇合適的地災(zāi)易發(fā)性條件因子對(duì)地災(zāi)易發(fā)性建模至關(guān)重要,因?yàn)槿哂嘈畔⒖赡茉诮_^程中產(chǎn)生噪聲并降低模型的預(yù)測(cè)能力。因此,本文采用隨機(jī)森林(RF)以及Pearson相關(guān)系數(shù)(PCC)方法來篩選地災(zāi)易發(fā)性條件因子。
邏輯回歸(LR)模型是一種二項(xiàng)分類變量的回歸分析模型,因?yàn)樗紤]簡(jiǎn)單的線性關(guān)系,計(jì)算速度快,模型具有顯示性等特點(diǎn),使其廣泛應(yīng)用于地質(zhì)災(zāi)害的易發(fā)性評(píng)價(jià)中。該方法在評(píng)價(jià)過程中,選取自變量為條件因子(xi),以某類地質(zhì)災(zāi)害發(fā)生與否為因變量(設(shè)置1為發(fā)生災(zāi)害,0為不發(fā)生災(zāi)害)。設(shè)置地質(zhì)災(zāi)害的發(fā)生概率為P,Y=1-P為地質(zhì)災(zāi)害不發(fā)生的概率。將P/Y取對(duì)數(shù)為ln(P/Y),則以P為因變量、條件因子集[x1,x2,…,xn]為自變量,建立邏輯回歸方程:
式中:P為0到1之間的數(shù)字;β為回歸常數(shù);C1,C2,…,Cn為回歸系數(shù),X1,X2,…,Xn為影響災(zāi)害發(fā)生的自變量,于是可得邏輯回歸方程:
本文基于Python3.9.5環(huán)境中的scikit-learn庫(kù),用于地質(zhì)災(zāi)害易發(fā)性的邏輯回歸建模。首先將研究區(qū)收集的樣本數(shù)據(jù)集劃分為訓(xùn)練和驗(yàn)證數(shù)據(jù)集,二者之比為7∶3。然后通過隨機(jī)訓(xùn)練100次,得到地質(zhì)災(zāi)害發(fā)生概率的最優(yōu)LR預(yù)測(cè)模型。最后利用驗(yàn)證數(shù)據(jù)集和受試者工作特征(ROC)曲線下面積AUC對(duì)LR模型的預(yù)測(cè)性能進(jìn)行評(píng)估。評(píng)價(jià)指標(biāo)AUC通常用來衡量地災(zāi)易發(fā)性預(yù)測(cè)模型的評(píng)估性能,該值越大預(yù)測(cè)能力越好。
結(jié)果表明,9個(gè)地災(zāi)易發(fā)性條件因子的皮爾遜相關(guān)系數(shù)均小于0.5,因此9個(gè)條件因子之間沒有多重共線性關(guān)系。圖1顯示了基于RF方法的各影響因素的相對(duì)權(quán)重,其中已有災(zāi)害發(fā)育(0.216)是影響火后泥石流預(yù)測(cè)的最重要因子,其次是斜坡坡度(0.208 7)、日降雨量(0.184 4)、斜坡高差(0.089 4)、斜坡坡形(0.068 5)、斜坡結(jié)構(gòu)(0.054 5)、地層巖性(0.052 4)、人類工程活動(dòng)(0.049 3)、地下水活動(dòng)(0.038 1)。因此已有災(zāi)害發(fā)育,斜坡坡度,日降雨量,斜坡高差為影響管線地質(zhì)災(zāi)害形成的控制性因子,而人類工程活動(dòng)、地下水活動(dòng)則影響較小。
圖1 基于RF方法的地質(zhì)災(zāi)害易發(fā)性條件因子的相對(duì)權(quán)重大小分析結(jié)果
本文基于Python3.9.5環(huán)境中的scikit-learn庫(kù),用于地質(zhì)災(zāi)害易發(fā)性的邏輯回歸建模。通過隨機(jī)訓(xùn)練100次,得到地質(zhì)災(zāi)害發(fā)生概率的最優(yōu)LR預(yù)測(cè)模型如式(4)所示。根據(jù)預(yù)測(cè)模型計(jì)算所得地質(zhì)災(zāi)害發(fā)生概率值(P),使用自然斷點(diǎn)法將概率P分為4個(gè)區(qū)間:0~0.185、0.185~0.475、0.475~0.825、0.825~1.000,分別對(duì)應(yīng)4個(gè)易發(fā)性等級(jí):極低易發(fā)、低易發(fā)、中等易發(fā)、高易發(fā)。其中極低易發(fā)區(qū)占比為39.39%,低易發(fā)區(qū)為17.42%,中易發(fā)區(qū)為12.12%,高易發(fā)區(qū)31.06%,且高易發(fā)性區(qū)域主要集中在川南地區(qū)的管線穿越區(qū)段。
式中:P為地災(zāi)發(fā)生概率;X1為已有災(zāi)害發(fā)育情況;X2為斜坡坡度;X3為日降雨量;X4為斜坡高差;X5為斜坡坡形;X6為斜坡結(jié)構(gòu);X7為地層巖性;X8為人類工程活動(dòng);X9為地下水活動(dòng)。
式(4)中所有評(píng)價(jià)因子均已量化,量化標(biāo)準(zhǔn)參考表1,其中極低易發(fā)、低易發(fā)、中等易發(fā)、高易發(fā)分別量化為1、2、3、4。
利用驗(yàn)證數(shù)據(jù)集和受試者工作特征(ROC)曲線對(duì)LR模型預(yù)測(cè)性能的驗(yàn)證結(jié)果如圖2所示。結(jié)果表明,LR模型具有良好的預(yù)測(cè)能力,其AUC達(dá)94.9%。
圖2 ROC曲線及LR模型預(yù)測(cè)準(zhǔn)確率
(1)基于RF算法的各條件因子的重要性分析結(jié)果表明,已有災(zāi)害發(fā)育情況、斜坡坡度、日降雨量、斜坡高差為影響管線地質(zhì)災(zāi)害形成的控制性因子,而人類工程活動(dòng)、地下水活動(dòng)則影響較小。
(2)本研究提出的LR模型具有良好的預(yù)測(cè)能力,其AUC達(dá)94.9%。
(3)易發(fā)性評(píng)價(jià)結(jié)果表明,研究區(qū)極低、低、中及高易發(fā)性管線區(qū)段各自所占比例分別為39.39%、17.42%、12.12%和31.06%。其中,中、高易發(fā)區(qū)段主要集中于川南地區(qū)的管線穿越區(qū)段,評(píng)價(jià)結(jié)果與研究區(qū)實(shí)際情況相近,因此采用邏輯回歸模型能夠較為客觀準(zhǔn)確地評(píng)價(jià)四川省東南地區(qū)管線地質(zhì)災(zāi)害易發(fā)性。