趙 玉,陳麗霞*,付 圣
(1.中國地質(zhì)大學地球物理與空間信息學院,湖北 武漢 430074)
高陡斜坡上的巖土體突然脫離母巖并堆積到坡腳的崩塌現(xiàn)象,極易造成人員傷亡與財產(chǎn)損失,尤其是交通沿線的高陡邊坡問題最為突出[1]。在防控崩塌時,對崩塌源區(qū)的提前判識是首要任務,其結果的準確性直接影響落石的運動軌跡預測和風險的量化判定[2]。
識別崩塌源區(qū)的常用方法有野外地質(zhì)判斷、統(tǒng)計分析或智能模型分析等[3-8]。其中,邏輯回歸模型(LRM)是一種廣泛用于斜坡地質(zhì)災害易發(fā)性分析或空間預測的統(tǒng)計分析方法[3-7]。該模型能揭示因變量和多個互不相關的自變量之間的多元回歸關系[5],LRM 的建模過程本身具有挑選變量的優(yōu)點[6]。隨著應用需求的不斷提高,目前LRM 已從二元發(fā)展到多元,再到與其他模型聯(lián)合使用的階段[7]。
在預測模型的使用中,無論何種方式,都面臨輸入變量取值方式的問題。對于崩塌,其分析因素包括地形地貌、地層巖性、地質(zhì)構造、人類工程活動等。這些數(shù)據(jù)以兩類方式存在:連續(xù)型數(shù)據(jù)(如坡度值)和分類型數(shù)據(jù)(如巖性類型)。連續(xù)變量的取值方式有變量的原值、變量的歸一化值和變量的標準化值。其中,變量的歸一化值是連續(xù)變量原值與評價單元內(nèi)的最大和最小值的差值之比獲得[8];變量的標準化值是將變量值標準化到-1 到+1 之間[9]。分類變量的取值類型有屬性,分級值、模型處理分級值、數(shù)學公式處理分級值和權重分級值,包括根據(jù)因子本身屬性的分級或者使用某種模型獲得的因子對災害的權重或貢獻程度分級。因子屬性分級值(如坡度因子),以10°為間隔從小到大分為1 到9 的序號值[10-11],結合模型處理后的分級值,例如分級后的因子經(jīng)過信息量模型處理后獲得的信息量值[11];結合數(shù)學公式處理后的分級值,例如結合加權頻率比模型[12]進行歸一化的分級值;權重分級值,如根據(jù)專家經(jīng)驗或數(shù)學模型對不同因子賦權重,也可以對不同因子的不同級別賦權重,最終獲得分級值[13]。可見,變量的取值方式多樣,但其對災害評價結果是否有影響以及影響程度如何,需要進行對比驗證。
鑒于此,本文以湖北省利川龍駒壩G318 沿線崩塌為例,使用評價因子的3 種取值方式(原始值、信息量值和信息量排序值),采用LRM 評價崩塌源區(qū)識別的差異性,最終選用最優(yōu)取值方案實現(xiàn)崩塌源的識別。
在資料收集、遙感解譯和野外調(diào)查的基礎上,利用統(tǒng)計分析方法從地質(zhì)數(shù)據(jù)中提取崩塌的主要影響因子,深入研究崩塌的發(fā)育規(guī)律。因子包括坡度、坡向、曲率、粗糙度、巖性、斜坡結構、節(jié)理密度、水系線密度、歸一化植被指數(shù)(NDVI)、土地利用類型。通過統(tǒng)計崩塌集中分布的坡度,初步篩選出崩塌源范圍。之后對崩塌形成內(nèi)在條件和外在誘因上進行變量提取,采用3 種變量輸入方式(原始值、信息量值和信息量排序值),在ArcGIS 內(nèi)實施崩塌源區(qū)易發(fā)性評價,用5 類易發(fā)性等級(極高、高、中、低和極低)表征崩塌源區(qū)發(fā)生災害的可能性大小。最后分別從易發(fā)區(qū)分布空間特征、極高和高易發(fā)區(qū)的面積比例和評價精度三方面,判斷3 種結果的崩塌源識別能力,技術路線見圖1。
圖1 技術路線圖
3 種變量取值方案為:
方案(1)通過ArcGIS 提取各個因子的原始值。例如坡度因子以連續(xù)型坡度值賦給研究區(qū)的柵格單元;斜坡結構因子則以分類型數(shù)據(jù)進行賦值。連續(xù)型數(shù)據(jù)和分類型數(shù)據(jù)分別保持原值。
方案(2)通過信息量模型[10]獲取各個因子的信息量值。信息量值為分類型,各因子以離散形式輸入。
方案(3)是在(2)的基礎上,對各因子的各級別的信息量值由大到小進行重要性由高到低的排序后獲取其排序值,排序值為分類型,各因子的各級別以離散的編號值輸入。
信息量模型最早由殷坤龍[10]提出并用于地質(zhì)災害易發(fā)性預測,其計算公式為:
式中,I為單元信息量值;Ii為因素xi對地質(zhì)災害所提供的信息量;Si為因素xi所占單元總面積;Si0為因素xi單元中發(fā)生地質(zhì)災害的面積之和;A0為研究區(qū)地質(zhì)災害的單元面積之和;A為研究區(qū)總單元面積之和。
LRM 是目前廣泛用于地質(zhì)災害易發(fā)性評價的數(shù)學統(tǒng)計模型[3,4,7],LRM 中表示崩塌的因變量Y是一個二分類變量,其取值Y=1 和Y=0,分別代表發(fā)生崩塌和未發(fā)生崩塌。影響Y取值的n個自變量因子分別為X1,X2,…,Xn,在n個自變量作用下崩塌發(fā)生的條件概率為P=P(Y=1|X1,X2,…,Xn),則LRM 可表示為:
式中,zi為中間變量參數(shù),無實際意義;a0為回歸常數(shù);ai為第i個變量的回歸系數(shù)(i=1,2,…,n);Xij為第i號單元中第j個變量的取值,存在崩塌取1,否則取0;Pi為第i號單元內(nèi)崩塌發(fā)生概率回歸值(i=1,2,…,n)。
采用ROC 曲線[14]對3 種方案的LRM 結果進行檢驗。曲線下的面積AUC 用來表示預測準確性,AUC越高,預測精度值越高。
研究區(qū)位處重慶市萬州區(qū)和湖北省利川市,包含磨刀溪中下游及其支流龍駒河(圖2a),坐標范圍為108°30′E~108°45′E,30°30′N~30°40′N。地處四川盆地東緣,以江津至奉節(jié)沿齊岳山一線為界,平行展布北東向窄條狀中低山脈、地勢相對低凹的寬闊臺地狀山地和平緩丘陵(圖2b)。
圖2 研究區(qū)地理位置圖和地質(zhì)構造圖
區(qū)內(nèi)地層除背斜核部出露中生代三疊系外,其余均為侏羅系,主要為侏羅系中統(tǒng)上沙溪廟組(J2s上部以泥巖為主,中部粉砂質(zhì)泥巖,下部厚層長石砂巖)、下沙溪廟組(J2xs泥巖、泥巖夾長石石英砂巖)和新田溝組(J2x頂部砂質(zhì)泥巖,中部夾鈣質(zhì)砂巖),侏羅系下統(tǒng)自流井組(J1~2z頁巖夾石英砂巖)、珍珠沖組(J1z中厚層石英砂巖、頁巖)、以及三疊系上統(tǒng)須家河組(T3xj厚層長石石英砂巖夾頁巖或煤層)和三疊系中統(tǒng)巴東組(T2b中厚~厚層含粉砂質(zhì)灰?guī)r夾鈣質(zhì)頁巖)。
研究區(qū)崩塌共105 處,面積累計39.45×104 m2,體積累計321.89×104 m3。受地形地貌和巖土工程性質(zhì)的影響,崩塌在上沙溪廟組密集發(fā)育,在其他地層相對較弱(圖3a)。這種近水平地層內(nèi)軟硬巖互層的組合極易產(chǎn)生崩塌,嚴重威脅道路G318 和x553 的安全(圖3b,3c)。
圖3 崩塌分布圖及典型崩塌
基礎數(shù)據(jù):①Pleiades 影像數(shù)據(jù)(分辨率為0.5 m,影像時間:2 014.9.22)和高分一號數(shù)據(jù)(分辨率為1 m,影像時間:2015-03-30);②地質(zhì)圖(1∶10 000);③野外踏勘崩塌數(shù)據(jù)。
崩塌特征受高陡地形控制,為了鎖定崩塌源區(qū),利用最小坡度對區(qū)內(nèi)柵格進行初步篩選。采用5°間隔將坡度分成16 類,通過統(tǒng)計各級內(nèi)崩塌的比例,確定出其分布的最小坡度值。崩塌位于10°~70°內(nèi);在坡度達到25°時,崩塌數(shù)量陡增; 在40°時達到峰值(圖4)。因此,選取25°為最小坡度。
圖4 崩塌源區(qū)與坡度范圍對應圖
通過對歷史崩塌的發(fā)育特點與規(guī)律分析,選擇10 個因子進行評價,各因子的取值情況見表1。
表1 崩塌源區(qū)評價變量分級表
1)地形地貌因子。坡度是控制崩塌重要因子,在較陡的斜坡帶,應力集中,結構面發(fā)育時易崩塌,且?guī)r石風化強度大,其屬于連續(xù)型,通過等間距劃分(圖5a)。坡向控制不同坡面所受到的光照強度,其為連續(xù)型,通過等間距劃分(圖5b)。曲率反映斜坡坡面形態(tài),其在空間幾何上是斜坡表面上某個點的切線方向角所對弧長的轉(zhuǎn)動率(圖5c)。坡面形態(tài)反映斜坡的應力狀態(tài)以及對地表水的匯聚能力,粗糙度反映坡體表面的起伏變化與侵蝕程度,定義為曲面面積與投影面積之比[16]。在GIS 中用自然間斷法分級(圖5d)。
圖5 崩塌源區(qū)評價因子圖
2)工程地質(zhì)因子。巖性分為三類:軟硬巖互層(J2s,J2xs)、軟巖夾硬巖(J1~2z,J2x)和硬巖含軟弱夾層(T3xj,T2b,J1z),屬于分類型(圖5e)。斜坡結構反映結構面與臨空面的空間關系,表征危巖體掉落概率大小。根據(jù)斜坡劃分標準[17]分為5 類:順向坡[0°~30°)、斜順坡[30°~60°)、橫向坡[60°~120°)、逆斜坡[120°~150°)及逆向坡[150°~180°],其屬于分類型(圖5f),節(jié)理是崩塌重要控制因素,通過野外結構面測量獲得,其為連續(xù)型,通過自然間斷法分級(圖5g)。
3)其他誘發(fā)因子。沖溝密度體現(xiàn)臨空條件或反映水的侵蝕能力,屬于連續(xù)型(圖5h)。NDVI 反映地表植被的覆蓋狀況,良好的坡體穩(wěn)定性更好。通過近紅外和紅外波段計算得到,屬于連續(xù)型,通過等間距劃分(圖5i)。土地利用類型反映人類活動對斜坡的擾動情況。利用高分一號數(shù)據(jù)并采用波譜角分類(SAM)方法進行地物識別,得到土地利用類型圖,其為分類型(圖5j)。
3 種變量取值方式在識別崩塌源極高易發(fā)區(qū)的能力上有差異。經(jīng)過與信息量模型耦合后(方案2 中信息量值和方案3 中的信息量排序值)的評價,識別極高易發(fā)等級的崩塌源區(qū)的能力較原值的輸入方式強(表2)。在原值方案下,研究區(qū)只有30%面積被判定為極高易發(fā)區(qū);而在信息量值或者排序值的方案下,極高易發(fā)區(qū)的識別比例上升10%。
表2 不同變量取值方式下崩塌源易發(fā)區(qū)面積對比
圖6a、6b、6c 結果表明,變量輸入方式不會影響高易發(fā)區(qū)的分布情況,地質(zhì)條件才是決定崩塌的重要因素。無論是哪一種輸入方式,其崩塌源高易發(fā)區(qū)分布特征相同,即南北高,中部低。實質(zhì)上,受地質(zhì)構造和巖性的控制,主要分布在趕場向斜的北翼和馬頭場向斜的南翼(圖3)的上沙溪廟組地層內(nèi)。
變量的3 種取值方式在崩塌源識別精度上有差異(圖6d)。通過比較ROC 曲線下AUC 值發(fā)現(xiàn),采用信息量排序值作為變量的輸入值得到的評價結果精度最高,達到0.855,其次是信息量值(0.832)和原值(0.821)的輸入方案。進一步表明,在使用信息量模型與LRM 耦合評價崩塌源區(qū)易發(fā)性時,信息量排序值結果最優(yōu)。從輸入變量的特點分析其原因是:信息量值比原值數(shù)據(jù)更多包含了因子變量的權重值,而排序值相當于對信息量值大的因子賦予了二次權重,LRM 回歸系數(shù)相當于三次權重,多權重的計算促使評價精度最優(yōu)。該研究結果與樊芷吟[10]所得結論一致,即將信息量模型與LRM 耦合時,結果最優(yōu)。
圖6 研究區(qū)崩塌源區(qū)預測結果圖和評價精度曲線圖
針對變量存在多種輸入方式從而影響崩塌源區(qū)識別精度的問題,以龍駒壩境內(nèi)崩塌為例,討論了變量的不同輸入方式對崩塌源區(qū)預測的影響,所得結論如下:
1)崩塌源的分布受地形和地質(zhì)條件控制,邏輯回歸模型中變量的取值方式不會改變其總體空間分布特點,說明在評價地質(zhì)災害易發(fā)性工作中,災害發(fā)育的地形、地質(zhì)條件比模型重要。
2)3 種變量取值方式在崩塌源識別精度上有差異,以信息量排序值為取值方式能得到最高評價精度,同時,與信息量模型進行耦合能優(yōu)化邏輯回歸模型的預測結果,這與前人研究結論一致。
3)邏輯回歸模型只是數(shù)學統(tǒng)計模型中的代表模型,變量取值方式對于其他預測模型是否有同樣的精度提升的效果還需進一步研究。
4)案例研究區(qū)崩塌源總體處于坡度高于25°的斜坡帶,各方案結果均表明極高和高易發(fā)區(qū)分布于趕場向斜的北翼和馬頭場向斜的南翼的上沙溪廟組地層內(nèi)。