劉 彬
(廣東省測繪產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)中心,廣東 廣州 510075)
斜坡單元是地震、泥石流等斜坡地質(zhì)災(zāi)害發(fā)育過程中最重要的衡量指標(biāo),因此可以通過探究斜坡單元的類型,衡量一片區(qū)域地質(zhì)災(zāi)害發(fā)生的機(jī)理、規(guī)律,并進(jìn)行預(yù)測分析。在地理信息技術(shù)被廣泛應(yīng)用于地質(zhì)結(jié)構(gòu)、地理觀測等學(xué)科之后,通過GIS進(jìn)行地質(zhì)表面的結(jié)構(gòu)分析已經(jīng)是一種十分普遍的行為。將斜坡單元類型的劃分應(yīng)用在GIS中,是一個十分復(fù)雜的問題,現(xiàn)有的幾種劃分方法都不是很準(zhǔn)確。
文獻(xiàn)[1]通過地理信息系統(tǒng)的應(yīng)用,切割了斜坡單元周邊存在的界限,并基于紋理分水嶺劃分了斜坡單元的分割依據(jù),并經(jīng)過預(yù)處理的DEM圖像,以灰度矩陣的方式,對分水嶺的坡度進(jìn)行了標(biāo)記,使其能夠?qū)⒄?fù)地形中的分水嶺被準(zhǔn)確劃分。這種方法相對于其他方法擁有更好的切割效果,但是在坡度的計(jì)算上準(zhǔn)確度較差。文獻(xiàn)[2]通過敏感性評價獲取了地勢起伏的最佳提取單元,以均點(diǎn)算法計(jì)算了坡度的起伏均值,并獲取了平均峰值的分布關(guān)系。在不同的網(wǎng)格中計(jì)算了坡度提取的最佳面積。這種方法著重分析坡度起伏與峰值的關(guān)系,對溝谷斜坡密度的計(jì)算幫助不大。文獻(xiàn)[3]利用DEM坡度圖像計(jì)算出來同一單元下的數(shù)據(jù)精度,并通過Python ArcPy程序獲取了最佳統(tǒng)計(jì)單元的計(jì)算方法。在此過程中需要通過空間計(jì)算的方式,因此內(nèi)存占用較大,運(yùn)算時間較長,運(yùn)算結(jié)果的準(zhǔn)確度也不理想。綜合以上文獻(xiàn),本文設(shè)計(jì)了一種以隨機(jī)森林算法為核心的GIS斜坡單元類型劃分方法,通過實(shí)時更新斜坡單元傾角度數(shù),通過GIS劃定了斜坡單元分類標(biāo)準(zhǔn),并通過隨機(jī)森林優(yōu)化了斜坡單元劃分算法。
在計(jì)算斜坡的坡向剖面時,可以通過坡體底部水流的方向,獲取該單元內(nèi)斜坡的傾向計(jì)算方法。在最小二乘法下[4]。每一個擬合的數(shù)據(jù)都可以用來計(jì)算斜坡單元,其高程可以簡略地看作一種以內(nèi)部坐標(biāo)為基準(zhǔn)的線性函數(shù),如公式(1)所示:
式(1)中,Td為該DEM圖像中,斜坡單元的內(nèi)部高程數(shù)據(jù);x和y則為斜坡單元擬合數(shù)據(jù)的內(nèi)部坐標(biāo);ηn、λn、δn均為常數(shù)。將以上斜坡單元的線性方程帶入到DEM數(shù)據(jù)中,可以得到一個單元傾向的三維立體角度,(如圖1所示):
圖1 單元傾向角度
圖1中,坡度高程數(shù)據(jù)通過擬合計(jì)算帶入到x軸和y軸中,可以得到一個夾在x軸和y軸之間的角,這個角θ就是坡度單元傾角。通過求導(dǎo)計(jì)算,可以得到該平面的傾向坐標(biāo),如公式(2)所示:
式(2)中,ai和bi分別為坡度平面單元傾角的兩個方向參數(shù);xd和yd則為x軸與y軸平面上的兩個單位向量坐標(biāo)刻度。則結(jié)合ai和bi,該傾角判定計(jì)算如公式(3)所示:
式(3)中,θn為在第n個斜坡單元中傾角角度;ai和bi的意義如上。將高程及其相關(guān)的變量關(guān)系構(gòu)成一個整體性的系統(tǒng),如公式(4)所示:
式(4)中,HN為在GIS中經(jīng)過形態(tài)局部變量可以改變高程的元素集合;z1、z2、…、zn分別為集合中的第1個、第2個、…、第n個元素。通過近似坐標(biāo)估計(jì),可以直接得到斜坡單元傾向的更新坐標(biāo),如公式(5)所示:
式(5)中,ak和bk分別為更新后的斜坡單元傾向坐標(biāo);hk為觀測數(shù)據(jù)的第k個節(jié)點(diǎn);uk為三維估計(jì)的環(huán)境質(zhì)點(diǎn)為坐標(biāo)估計(jì)的近似值。結(jié)合以上公式,帶入到公式(3)中,可以直接求出斜坡單元傾向的實(shí)時角度。
在GIS中生成斜坡坡度矢量圖層時,首先需要計(jì)算平均曲率,此過程不需要通過剖面曲率的計(jì)算,只需要計(jì)算其斜坡分割面積,并通過坡面的侵蝕劃定地表的局部發(fā)育粗糙度[5]。在凸出的地形元素邊界,可以通過劃定極大值或極小值的方式驗(yàn)證分水嶺的地表傾斜角度,然后去除高程中的尺度變化,使其可以適當(dāng)增加均值的濾裝置。通過劃定可行域的方式,建立一個柵格化的目標(biāo)質(zhì)點(diǎn),然后通過多邊形頂點(diǎn)的內(nèi)部結(jié)構(gòu),判定線段方程的角度與連線中心[6]。尤其是在計(jì)算隨機(jī)誤差時,通過最小二乘法獲取最優(yōu)解是最簡單的方式。如果斜坡被外力破壞,則需要通過內(nèi)外力之差計(jì)算不平衡比率的初始應(yīng)力。在計(jì)算中,通過收斂速度的快慢、收斂過程的波動特性以及不平衡力的比率條件,可以直接完成模型中的坍塌或塑形過程,利用GIS的篩選功能,可以直接刪除緩沖區(qū)分析中的疊置影像,并生成一個矢量圖層,作為該類型圖的屬性統(tǒng)計(jì)標(biāo)準(zhǔn)。所有位置坐標(biāo)中斜坡高程的計(jì)算都可以通過DEM模型中坡向和坡度的提取和計(jì)算,在研究區(qū)的原始圖像內(nèi)生成一個具備重分類效果的坡度矢量圖層。
隨機(jī)森林算法,可以通過大量的決策樹構(gòu)建向量模型,并通過這些模型得到隨機(jī)分布的決策向量,是每一棵樹都進(jìn)行斜坡單元分類標(biāo)準(zhǔn)的投票,通過統(tǒng)計(jì)這些投票數(shù)量,獲取不同的類型劃分信息。在隨機(jī)森林算法的回歸模型中,可以通過梳理分析進(jìn)行獨(dú)立變量的條件統(tǒng)計(jì),并利用回歸函數(shù)確定獨(dú)立變量的概率分布空間,使隨機(jī)分布的變量X和獨(dú)立變量Y聯(lián)合在一起,設(shè)定多變的條件概率,從而獲取回歸函數(shù)的預(yù)測數(shù)據(jù)。通過原始標(biāo)記中的樣本,可以將每一個節(jié)點(diǎn)的分類作為葉結(jié)點(diǎn)的存儲信息,這一類數(shù)據(jù)需要擁有兩種必要條件,分別是:可以實(shí)時更新數(shù)據(jù)樣本、可以分裂子節(jié)點(diǎn)中的規(guī)則密度。這樣一來,通過隨機(jī)森林算法就可以得到概率的回歸分析模型,如果調(diào)整了隨機(jī)森林的結(jié)構(gòu),就可以直接優(yōu)化隨機(jī)森林中的斜坡單元劃分算法。在機(jī)器領(lǐng)域,這個預(yù)測數(shù)據(jù)是十分具有代表性的,本文通過這組回歸數(shù)據(jù),假設(shè)了訓(xùn)練集的分布規(guī)律,將其與預(yù)測器聯(lián)合在一起,劃定了分類標(biāo)準(zhǔn),由于預(yù)測之中有很多分類器的平均值,可以通過隨機(jī)誤差變量的邊緣函數(shù)來計(jì)算隨機(jī)樹的總量,如公式(6)所示:
式(6)中,mg(An,Bm)為兩棵隨機(jī)樹An、Bm的均方誤差;UK(An)為隨機(jī)向量An被分到正確票數(shù)的概率;Bm(uij)為在事件中隨機(jī)向量Bm備份到正確票數(shù)的概率;I(uk)為指示函數(shù)的平均值。在求解邊緣函數(shù)的過程中,可以通過構(gòu)建回歸分析的預(yù)測數(shù)據(jù),計(jì)算線性回歸的最小二乘法,將其與預(yù)測數(shù)值匹配,可以得到泛化的誤差分析。在斜坡單元類型劃分標(biāo)準(zhǔn)的構(gòu)建中,通過隨機(jī)森林算法可以直接提取影像的基本特征信息,由于每一個圖像在細(xì)化到柵格中都具備極大地差別,因此其在應(yīng)對光暗對比、影響旋轉(zhuǎn)重疊等方面都具備極大地邏輯性,并具備一定的特征變換規(guī)律??梢酝ㄟ^建立已知信號的方式定義這種函數(shù),如公式(7)所示:
式(7)中,an為斜坡單元類型劃分過程中的第n個變換方向。在計(jì)算梯度值時,可以通過公式(8)設(shè)定圖像的原始文本。
式(8)中,H1(an,bm)、H2(an,bm)、H3(an,bm)分別為在三種類型的像素中,水平梯度的變化規(guī)律;an和bm為x軸與y軸上的兩個坐標(biāo)點(diǎn);Hbm為在垂直方向上像素點(diǎn)的坐標(biāo)梯度;Han為在平行方向上,像素點(diǎn)的坐標(biāo)梯度。結(jié)合以上公式,可以直接得到隨機(jī)森林分類的路徑(如圖2所示):
圖2中,左邊的樹狀圖案是第一棵樹中的節(jié)點(diǎn),右邊的樹狀圖案是第n棵樹中的節(jié)點(diǎn)。在分類的過程中,通過樣本概率分類器計(jì)算第一棵樹中的屬性判定條件,可以通過公式(9)來計(jì)算:
圖2 隨機(jī)森林算法分類路徑
式(9)中,KH為位置類別的樣本在劃分坡度類型時斜坡單元類型劃分的標(biāo)準(zhǔn)路徑長度;ki為在第i個節(jié)點(diǎn)中的第一棵樹的參數(shù)子集;xi為在第i個節(jié)點(diǎn)中的最后一顆樹的參數(shù)子集。通過以上算法可以提高斜坡單元類型劃分算法中斜坡密度的精確度,從而實(shí)現(xiàn)對劃分方法的優(yōu)化。
本文設(shè)計(jì)了一個斜坡單元類型劃分的方法,將其與基于紋理分水嶺的算法、尺度提取算法、利用Python ArcPy的地形最佳算法相對比,分別檢測當(dāng)溝谷斜坡密度的計(jì)算值與實(shí)際測量值相等時集水面積閾值的數(shù)值,將實(shí)驗(yàn)數(shù)據(jù)作為判斷四種斜坡單元類型劃分優(yōu)劣的標(biāo)準(zhǔn)。通過ArcGIS進(jìn)行衛(wèi)星地圖的編輯與分析,選取某市山區(qū)的地形圖(如圖3所示):
圖3 溝谷斜坡勾繪
圖3中,該衛(wèi)星地圖中斜坡資源十分豐富,為了得到更準(zhǔn)確,更具代表性的實(shí)驗(yàn)數(shù)據(jù),在圖3中選擇了四個高度不一的溝谷斜坡。其中,A坡的絕對高度為23.6m,B坡的絕對高度為30.8m,C坡的絕對高度為11.4m,D坡的絕對高度為14.6m。在ArcGIS上通過(如圖4所示)的流程提取坡面單元。
圖4 提取坡面單元流程
在ArcGIS中建立一個坡面單元數(shù)據(jù)集,作為影像處理與記錄的集合,設(shè)定初始坡面DEM的柵格尺寸為300m,通過“功能”模塊提取正向與反向的坡面DEM影像,將提取得到的影像全部保存在數(shù)據(jù)集中。選擇四個不同深度的坡面A、B、C、D,將其通過線條勾繪成單獨(dú)的矢量模型。然后在設(shè)置坡面深度,從而提取無坡面的DEM影像,將無坡面DEM同樣存儲在數(shù)據(jù)集中。通過緩沖區(qū)疊加分析工具,結(jié)合集水面積數(shù)值,計(jì)算山谷線走向,并通過“工具”菜單得到山谷線的線形矢量圖層。在計(jì)算不同集水面積閾值下的斜坡密度時,可以通過最小二乘法的觀測最優(yōu)估計(jì)來進(jìn)行判定,如公式(10)所示:
式(10)中,ax-1為通過最小二乘法獲得的最優(yōu)觀測估計(jì);k1、kx-1分別為集合中第1個和第x-1個觀測對象。通過該最小二乘矩陣方程,可以得到最新的觀測數(shù)據(jù),如公式(11)所示:
式(11)中,hx為環(huán)境感知質(zhì)點(diǎn)中通過三維壓縮得到的單獨(dú)觀測數(shù)據(jù);xi為第i個觀測點(diǎn)的維度特性,也可以標(biāo)示為正地形下的斜坡密度。更新觀測對象,將其置換成負(fù)地形下的斜坡密度,如公式(12)所示:
式(12)中,各項(xiàng)參數(shù)如上。通過公式(11)和公式(12)可以得到不同集水面積閾值下溝谷斜坡的密度變化。
在通過四種方法計(jì)算溝谷斜坡密度前,首先需要通過實(shí)地勘測的方式得到單位面積內(nèi)溝谷的長度,即溝谷密度的實(shí)際測量值。然后使用以上四種方法計(jì)算不同集水面積閾值下的溝谷斜坡密度,當(dāng)集水面積閾值較小時,溝谷斜坡密度的計(jì)算值與實(shí)際測量值通常存在一定的差距,隨著集水面積閾值的增長,二者之間的誤差會逐漸減小。在該實(shí)驗(yàn)中,通過記錄計(jì)算值與實(shí)際測量值重疊時,集水面積閾值的數(shù)值大小,判斷該方法的有效性和優(yōu)越性。集水面積閾值越小,則該方法斜坡類型劃分的準(zhǔn)確性越高。將通過以上實(shí)驗(yàn)得到的數(shù)據(jù)結(jié)果(如圖5所示):
在圖5的四幅圖像中,當(dāng)集水面積閾值小于300時,四種方法計(jì)算得到的溝谷斜坡密度均沒有與實(shí)際測量值相等。在斜坡A中,使用隨機(jī)森林算法得到的溝谷斜坡密度,在集水面積閾值為700時,與實(shí)際測量值相等。使用紋理分水嶺算法則是在集水面積閾值為900時得到與實(shí)際測量值相等的計(jì)算值,尺度提取算法和Python ArcPy的最終結(jié)果也為900。在斜坡B中,文中方法的數(shù)值為500,其他三種算法的數(shù)值分別為700、700、1100。斜坡C坡度較小,導(dǎo)致實(shí)驗(yàn)中的整體數(shù)值較小,在四種方法下的數(shù)值分別為500、700、700、700。斜坡D的四項(xiàng)數(shù)值分別為500、900、700、1100。綜合以上實(shí)驗(yàn)數(shù)據(jù),在四種斜坡單元類型劃分方法的計(jì)算中,使用文中方法可以減小集水面積閾值的設(shè)定值,并提高單元類型劃分的準(zhǔn)確性。
圖5 集水面積閾值測試
通過ArcGIS與隨機(jī)森林算法設(shè)計(jì)了一種斜坡單元類型的劃分方法,然后通過算法的優(yōu)化,提高了溝谷斜坡密度計(jì)算值的準(zhǔn)確度,使其能夠在更小的集水面積閾值中擁有與實(shí)際測量值相吻合的數(shù)據(jù)。又通過實(shí)驗(yàn)與現(xiàn)有的三種算法進(jìn)行對比,驗(yàn)證了該算法的有效性和優(yōu)越性。通過該研究成果,可以提高斜坡地質(zhì)穩(wěn)定預(yù)測的精準(zhǔn)性,具備一定的推廣價值。