周寧,滿秀玲,李超
(1.東北林業(yè)大學(xué),150040,哈爾濱;2.黑龍江省水土保持科學(xué)研究所,150070,哈爾濱;3.北京林業(yè)大學(xué),100083,北京)
我國東北黑土區(qū)[1]是世界上僅有的三大黑土區(qū)之一,面積103.02萬 km2,其中土壤侵蝕面積27.95萬km2,占總面積的27.13%,土壤侵蝕已成為制約東北黑土區(qū)經(jīng)濟和社會發(fā)展的重要因素;因此,對該區(qū)土壤侵蝕強度進行科學(xué)的評價是研究和保護東北黑土區(qū)的重要內(nèi)容之一。目前,土壤侵蝕強度評價方法已有一些,比如:王春梅等[2]對陜西省安塞縣土壤侵蝕強度進行評價研究;余瞰等[3]建立了以面蝕為主地區(qū)土壤侵蝕強度分級的快速評價方法;史彩寧等[4]進行了大區(qū)域土壤侵蝕自動化計算和坡度的衰減等問題的研究。筆者結(jié)合黑龍江省黑土區(qū)拉林河流域土壤侵蝕現(xiàn)狀,通過構(gòu)建坡度、坡向、土壤類型、土地利用狀況和標準化植被指數(shù)(NDVI)等5項評價指標的數(shù)據(jù)庫,采用邏輯回歸模型和廣義回歸神經(jīng)網(wǎng)絡(luò)模型,分別對研究區(qū)土壤侵蝕強度進行預(yù)測,用像斑概率值構(gòu)建柵格數(shù)據(jù)庫,在ArcGIS上形成研究區(qū)土壤侵蝕強度分布預(yù)測圖,并以受試者工作特征曲線(receiver operating characteristic curve,簡稱ROC曲線)對2種模型的預(yù)測結(jié)果進行校驗分析。構(gòu)建合理的評價模型,對探究區(qū)域土壤侵蝕強度評價的科學(xué)方法,進行水土流失分區(qū)防治、合理施以水土保持措施具有積極意義。
拉林河流域位于黑龍江省的南部,位于E125°44′50″~128°23′45″、N44°4′11″~ 45°30′29″,涉及哈爾濱市阿城區(qū)、五常市、雙城市和尚志市,流域面積1萬645.22km2,地貌自東向西由低山丘陵寬谷向洪積臺地過渡。本流域?qū)僦袦貛Т箨懶约撅L(fēng)氣候。年平均氣溫2.4~3.6℃,年均降雨量481~691 mm,無霜期121~140 d。在黑龍江省植被區(qū)劃中,研究區(qū)西部屬松嫩平原羊草草原區(qū),原生植被類型為草原植被,現(xiàn)已高度農(nóng)業(yè)化,植被類型為栽培植被,東部屬張廣才嶺完達山闊葉紅松林亞區(qū),植被類型以針闊葉混交林、灌叢和沼澤為主。研究區(qū)屬東北黑土區(qū),土壤類型主要包括黑土、黑鈣土、暗棕壤、草甸土和白漿土,土壤侵蝕類型以水力侵蝕為主,按全國第2次土壤侵蝕遙感調(diào)查結(jié)果,并采用黑龍江省水土保持科學(xué)研究所提供黑龍江省第2次土壤侵蝕遙感調(diào)查數(shù)據(jù),繪制研究區(qū)土壤侵蝕強度分布圖,見圖1。
在ArcGIS 9.3上,以1:10萬的地形圖為地理數(shù)據(jù)源,經(jīng)處理生成分辨率為100的研究區(qū)DEM,進而提取坡度和坡向;在遙感影像(Land-sat4 TM)上提取 NDVI[5];采用黑龍江省 1995—1996 年土地利用數(shù)據(jù)和同期土壤資料[6],將土壤類型圖和土地利用類型圖處理為圖層數(shù)據(jù)。對坡度、坡向、NDVI、土壤類型和土地利用類型數(shù)據(jù)進行分級處理[7 8],消除量綱影響,生成6萬5 535個像斑,以合并生成的圖形數(shù)據(jù)作為數(shù)學(xué)分析的基礎(chǔ)和數(shù)據(jù)建庫的本底圖形,并分別保留了源數(shù)據(jù)的空間屬性特征。
圖1 研究區(qū)土壤侵蝕強度分布圖Fig.1 Soil erosion intensity map of the study area
以包含坡度、坡向、土壤類型、土地利用狀況和NDVI等5項評價指標空間信息的像斑數(shù)據(jù)為基礎(chǔ),通過構(gòu)建邏輯回歸模型和廣義回歸神經(jīng)網(wǎng)絡(luò)模型,分別對研究區(qū)土壤侵蝕強度進行預(yù)測,將像斑概率值轉(zhuǎn)換為柵格數(shù)據(jù)庫,在ArcGIS上生成研究區(qū)土壤侵蝕強度分布預(yù)測圖,與研究區(qū)土壤侵蝕強度分布圖做直觀的比較。再利用ROC曲線對2個模型的預(yù)測結(jié)果進行校驗分析,判斷預(yù)測準確程度。
邏輯回歸分析在一個因變量和若干個自變量間構(gòu)建多元回歸關(guān)系,對預(yù)測任意或某一事件的發(fā)生概率具有一定優(yōu)勢,自變量可以是連續(xù)型變量或離散型變量,且不要求必須滿足正態(tài)分布。
構(gòu)建邏輯回歸分析模型。因變量Y取值0和1,分別代表發(fā)生土壤侵蝕和未發(fā)生土壤侵蝕;X1,X2,…,Xn為影響因變量Y取值的n個自變量。發(fā)生土壤侵蝕的條件概率為P=P(Y=1∣X1,X2,…,Xn),邏輯回歸分析模型[9]為:
式中:zi為變量參數(shù);a0為回歸系數(shù);ai為第i個變量的回歸系數(shù)(i=1,2,…,n);Xij為第 i個單元中第 j個變量的值,存在土壤侵蝕取0,否則取1;Pi為第i個單元內(nèi)土壤侵蝕發(fā)生概率的預(yù)測值(i=1,2,…,n)。
對坡度、坡向和NDVI等連續(xù)型變量進行區(qū)間劃分,對離散型變量土壤類型和土地利用類型直接以二進制表示,即存在賦值1,否則取0。模型共考慮51個獨立變量,其中連續(xù)型變量22個、離散型變量29個,因素狀態(tài)見表1。
表1 因素狀態(tài)Tab.1 State of the factors
構(gòu)建邏輯回歸方程,在SPSS18.0中計算預(yù)測因素的回歸系數(shù),回歸系數(shù)a0為-119.57,其他變量回歸系數(shù) ai見表2。將邏輯回歸方程代入 Matlab7.0已編制程序中,得到研究區(qū)的土壤侵蝕發(fā)生概率值和每個像斑的概率值。在ArcGIS9.3上,將像斑概率值構(gòu)建柵格數(shù)據(jù)庫,按照全國第2次土壤侵蝕遙感調(diào)查的土壤侵蝕強度分級方法,采取自然斷點法進行初步分級進而劃分土壤侵蝕強度,形成土壤侵蝕強度分布預(yù)測圖(圖2),可見,預(yù)測圖與實際的土壤侵蝕強度分布圖基本一致。
構(gòu)建由徑向基層和特定的線性層組成的廣義回歸神經(jīng)網(wǎng)絡(luò)[10-11],構(gòu)造見圖3。其中:R為變量個數(shù),即51個獨立變量;Q為訓(xùn)練樣本個數(shù),即6萬5 535個像斑數(shù)據(jù);ai指第1層輸出a的第i個元素;b為第1層網(wǎng)絡(luò)閾值;W1,1為第1層權(quán)值矩陣的 Wi,j的第i行第j列元素;D為距離函數(shù);Np為規(guī)范化點積函數(shù);Pu為神經(jīng)元傳遞函數(shù);圖像匹配Np過程利用內(nèi)嵌函數(shù)源自第2層權(quán)值矩陣W2,1和第1層輸出c計算網(wǎng)絡(luò)的輸出向量n。
在MATLAB7.0上創(chuàng)建廣義回歸神經(jīng)網(wǎng)絡(luò),以其為參數(shù)利用函數(shù)sim()仿真運算,運行格式為:
式中:N為網(wǎng)絡(luò)net;G為newgrnn函數(shù);P為資料矩陣,即像斑數(shù)據(jù)矩陣;T為理想目標輸出矩陣,即土壤侵蝕強度數(shù)據(jù)矩陣;S為spread徑向基函數(shù)的分布系數(shù)。
經(jīng)訓(xùn)練,S為0.5時,網(wǎng)絡(luò)仿真的精度最佳,總體相對精度達到93.1%,單個像斑正確預(yù)報率達到72%。在ArcGIS 9.3上,將像斑預(yù)測值構(gòu)建柵格數(shù)據(jù)庫,按照全國第二次土壤侵蝕遙感調(diào)查的土壤侵蝕強度分級方法,采取自然斷點法進行初步分級進而劃分土壤侵蝕強度,形成土壤侵蝕強度分布預(yù)測圖(圖4),可見,預(yù)測圖與實際的土壤侵蝕強度分布圖基本一致。
表2 回歸系數(shù)Tab.2 Regression coefficient
圖2 邏輯回歸分析模型預(yù)測土壤侵蝕強度分布圖Fig.2 Logistic regression analysis model to predict soil erosion intensity map
圖3 廣義回歸神經(jīng)網(wǎng)絡(luò)構(gòu)造Fig.3 Generalized regression neural network structure
圖4 廣義回歸神經(jīng)網(wǎng)絡(luò)模型預(yù)測土壤侵蝕強度分布圖Fig.4 Generalized regression neural network model to predict soil erosion intensity map
ROC曲線是以預(yù)測結(jié)果的每一個值作為可能的判斷閾值,由此計算得到相應(yīng)的靈敏度和特異度[12]。在SPSS18.0上繪制 ROC曲線,以 (1-特異度)為橫坐標,表示未發(fā)生土壤侵蝕的像斑被正確預(yù)測的概率;以靈敏度為縱坐標繪制而成,表示發(fā)生土壤侵蝕的像斑被正確預(yù)測的概率。將曲線下面積(AUC)作為衡量模型預(yù)測準確度的指標,數(shù)值大小與模型判斷力呈正比。將邏輯回歸模型和廣義回歸神經(jīng)網(wǎng)絡(luò)模型的預(yù)測值和診斷值導(dǎo)入SPSS18.0進行ROC曲線圖繪制,結(jié)果如圖5。2個模型的AUC值分別為0.857和0.881,表明預(yù)測結(jié)果具有一定的準確性,廣義回歸神經(jīng)網(wǎng)絡(luò)模型評價結(jié)果的精度較高。
圖5 邏輯回歸模型和廣義回歸神經(jīng)網(wǎng)絡(luò)模型的ROC曲線Fig.5 ROC curve of the logistic regression model and generalized regression neural network model
以黑龍江省黑土區(qū)拉林河流域為研究區(qū),通過在ArcGIS上構(gòu)建坡度、坡向、土壤類型、土地利用狀況和NDVI等5項評價指標的數(shù)據(jù)庫,采用邏輯回歸模型和廣義回歸神經(jīng)網(wǎng)絡(luò)模型,分別對研究區(qū)土壤侵蝕強度進行預(yù)測,將像斑概率值構(gòu)建柵格數(shù)據(jù)庫,在ArcGIS上形成研究區(qū)土壤侵蝕強度分布預(yù)測圖。結(jié)果表明,預(yù)測的土壤侵蝕強度分布圖與實際的土壤侵蝕強度分布圖基本一致。
采用ROC曲線對邏輯回歸模型和廣義回歸神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果進行校驗分析,發(fā)現(xiàn)預(yù)測結(jié)果具有一定的準確性,廣義回歸神經(jīng)網(wǎng)絡(luò)模型評價結(jié)果的精度較高。邏輯回歸模型對自變量類型及其分布類型沒有嚴格要求,但自變量之間可能存在多重共線性干擾,另外,回歸系數(shù)受樣本和模型設(shè)置影響較大。廣義回歸神經(jīng)網(wǎng)絡(luò)模型能夠在忽略自變量間是否存在復(fù)相關(guān)性的前提下,自動篩選變量中的特異信息訓(xùn)練網(wǎng)絡(luò),以降低仿真輸出結(jié)果受到冗雜信息的影響,保證輸出結(jié)果的準確性;但對土壤侵蝕強度評價方法的研究,仍需提高遙感數(shù)據(jù)的精度,嘗試構(gòu)建不同的預(yù)測模型,以達到預(yù)測準確、方法科學(xué)合理。
[1] 水利部,中國科學(xué)院,中國工程院.中國水土流失防治與生態(tài)安全:東北黑土區(qū)卷[M].北京:科學(xué)出版社,2010
[2] 王春梅,楊勤科,王琦,等.區(qū)域土壤侵蝕強度評價方法:以安塞縣為例[J].中國水土保持科學(xué),2010,8(3):1- 6
[3] 余瞰,柯長青.遙感與GIS支持下的土壤侵蝕強度快速評價方法研究[J].國土資源遙感,2010,73(3):82-88
[4] 史彩寧,常慶瑞,王春梅,等.基于GIS的延安市土壤侵蝕強度等級評價[J].水土保持研究,2010,17(3):28- 31
[5] 安培浚,劉樹林,領(lǐng)耀文,等.植被指數(shù)遙感定量研究:以民勤綠洲為例[J].遙感技術(shù)與應(yīng)用,2005,2(6):574- 581
[6] 黑龍江省土地管理局,黑龍江省土壤普查辦公室.黑龍江土壤[M].北京:農(nóng)業(yè)出版社,1992
[7] 龔文峰,蔡體久,范文義,等.松花江流域哈爾濱城區(qū)段土壤侵蝕時空格局及動態(tài)變化研究[J].水土保持通報,2009,29(5):56- 60
[8] 湯國安,楊昕.ArcGIS地理信息系統(tǒng)空間分析實驗教程[M].北京:科學(xué)出版社2006:277- 280
[9] 劉藝梁,殷坤龍,劉斌,等.邏輯回歸和人工神經(jīng)網(wǎng)絡(luò)模型在滑坡災(zāi)害空間預(yù)測中的應(yīng)用[J].水文地質(zhì)工程地質(zhì),2010,37(5):92- 96
[10]蔡體久,琚存勇.毛烏素沙地植被蓋度估測方法研究[J].北京林業(yè)大學(xué)學(xué)報,2008,30(1):292- 295
[11]聞新,周露,李翔,等.MATLAB神經(jīng)網(wǎng)絡(luò)仿真與應(yīng)用[M].北京:科學(xué)出版社,2003:285- 291
[12]王運生,謝丙炎,萬方浩,等.ROC曲線分析在評價入侵物種分布模型中的應(yīng)用[J].生物多樣性,2007,15(4):365- 372