劉治國,王弟,張紅,張霄羽,韓建平,王云霞
(1.山西大學 黃土高原研究所,山西 太原 030006;2.山西省林業(yè)調(diào)查規(guī)劃院,山西 太原 030012;3.山西大學 環(huán)境與資源學院,山西 太原 030006)
基于遙感數(shù)據(jù)的山西東部油松林蓄積量估測方法研究
劉治國1,王弟2*,張紅3,張霄羽3,韓建平2,王云霞2
(1.山西大學 黃土高原研究所,山西 太原 030006;2.山西省林業(yè)調(diào)查規(guī)劃院,山西 太原 030012;3.山西大學 環(huán)境與資源學院,山西 太原 030006)
為了探討油松林遙感估測模型的精度和適用性,以山西省晉東土石山立地亞區(qū)的170個油松樣地作為研究對象,獲取研究區(qū)的SPOT影像和DEM(Digital Elevation Model,數(shù)字高程模型)數(shù)據(jù),提取170個樣地的遙感波段信息和地形信息,結合地面調(diào)查數(shù)據(jù),分別采用多元逐步回歸模型、偏最小二乘回歸模型和神經(jīng)網(wǎng)絡模型,建立油松林蓄積量的遙感估測方法,并進行精度驗證。結果表明:1)基于遙感影像和DEM影像估測油松林蓄積量是可行的,三種方法都取得了滿意的結果;2)三種方法相比,神經(jīng)網(wǎng)絡模型對油松林蓄積量估算的精度為82.13%,多元逐步回歸模型的精度為76.73%,偏最小二乘回歸模型的精度為77.09%,神經(jīng)網(wǎng)絡模型的估測精度更高。
油松林;蓄積量;遙感估測;多元回歸;偏最小二乘回歸;BP神經(jīng)網(wǎng)絡
森林蓄積量作為反映一個國家或地區(qū)森林資源總規(guī)模和總水平的基本指標之一,其消長動態(tài)變化是林業(yè)經(jīng)濟、社會效益的主要表征參數(shù),因此準確估計森林的蓄積量,對衡量森林生態(tài)環(huán)境具有重要意義。傳統(tǒng)的測定森林蓄積量方法包括材積表法、標準木法、干距法等[1],這些方法調(diào)查周期長,人力財力消耗大且不能及時反映森林蓄積量的動態(tài)變化。隨著“3S”(遙感技術、地理信息系統(tǒng)、全球定位系統(tǒng))技術的發(fā)展,很多學者已將3S技術多方面應運于森林蓄積量的研究[2-4]。包盈智等利用TM(Thematic Mapper)數(shù)據(jù)使用多元回歸分析對森林蓄積量進行了估測[5];袁凱先使用了TM資料,運用材積表法與多元回歸法驗證了這種方法的可行性[6];施鵬程則采用PLS(Partial Least Square,偏最小二乘法)對密云縣森林蓄積進行遙感估測所得模型具有較強適應性[7];李崇貴利用“3S”技術與BP(Back Propagation)神經(jīng)網(wǎng)絡結合,同時使用地面數(shù)據(jù)進行蓄積估測,所得結果也滿足調(diào)查精度要求[8]。
關于森林蓄積量的遙感定量估測研究主要集中在如何提高遙感估測蓄積量精確度,同時在具體的森林經(jīng)營單元上選擇與蓄積量相關性較好的自變量因子[9-12]。國內(nèi)外在選擇蓄積量估測因子中,常常將估測因子分為地面實測因子、遙感因子。純粹采用地面實測因子建模精度高,但工作量大、難以推廣到樣地以外區(qū)域,純粹采用遙感因子建模精度較低,不能準確模擬森林蓄積量。而將兩者結合,可以大大減少野外工作量,提高估測精度,如Gemmell等[13]基于 TM數(shù)據(jù),采用KNN方法研究了各波段、郁閉度、林分面積大小以及地形要素對定量估測森林蓄積量的影響度,結果顯示,郁閉度和蓄積量的相關系數(shù)最大,遠遠大于地形要素對蓄積量的影響。本文以山西省東部土石山的優(yōu)勢樹種油松(Pinustabuliformis)作為研究對象,將遙感影像數(shù)據(jù)與地面數(shù)據(jù)相結合,采用多元逐步回歸模型,偏最小二乘回歸模型及神經(jīng)網(wǎng)絡模型,對油松林蓄積量進行估測,并比較三種方法的估測精度。目的是:1)以SPOT多波段影像和DEM為數(shù)據(jù)源,選取合適的影像因子和地形因子,對樣地內(nèi)油松林蓄積量進行相關性分析和共線性分析;2)基于增強型BP神經(jīng)網(wǎng)絡算法、多元逐步回歸與偏最小二乘法建立油松林蓄積量遙感估測模型,通過比對探索更有效的油松林蓄積量估測方法。
1.1 研究區(qū)概況
油松是山西省主要的針葉樹種,分布廣泛,遙感影像數(shù)據(jù)色彩和紋理明顯、樹冠整齊。山西省森林資源一類清查(2010年)中涉及的油松林樣地有381個,其中晉東土石山立地亞區(qū)分布較多,主要涉及安澤、沁源、長子、長治、壺關、平順、潞城、黎城、屯留、襄垣、沁縣、武鄉(xiāng)、陵川、高平、澤州、榆社、左權、和順、昔陽、壽陽、平定、盂縣等22個縣市。該立地亞區(qū)主要氣候特點是冬夏長、春秋短、四季分明;日照比較充足,晝夜溫差較大;春季少雨多風,干旱時有發(fā)生;夏季炎熱且降雨量集中,年降水量400~600 mm,年際變化大;秋天云高氣爽,降溫快;冬季干冷。立地亞區(qū)內(nèi)的土壤類型多以褐土、栗褐土和山地草甸土為主;地帶性植被以常綠針葉林為主,主要優(yōu)勢樹種有華北落葉松(Larixprincipis-rupprechtii)、油松(Pinustabuliformis)、側(cè)柏(Platycladusorientalis)等,闊葉樹種多為遼東櫟(Quercuswntaishanica)、刺槐(Robiniapseudoacacia)、楊樹(Populusspp.)等。
研究區(qū)的遙感影像采用2010年由SPOT衛(wèi)星高分辨率多波段掃描儀(HRV)獲取的遙感影像,包括10 m分辨率的全色波段和20 m分辨率的多波段數(shù)據(jù)。影像成像時間從5月份到11月份不等。 將381個油松林樣方所在經(jīng)緯度樣方與遙感影像對應,獲得每一個樣方所對應的影像,剔除影像中有云或影像不清晰的樣本、剔除影像月份在5月、6月和11月的樣本,剔除掉蓄積量過大和過小的樣本。本研究所采用的油松樣地數(shù)量為170個。通過對不同數(shù)據(jù)來源進行分類、整理,本文選取的170個油松林樣地海拔750 m~1 940 m,地貌類型以中山為主;樣地坡度在25度以下的占53.53%;樣地內(nèi)油松林主要分布在北與東北坡向;以中齡林與近熟林為主,各占總數(shù)的60.00%和32.35%;郁閉度多介于0.4-0.6、0.6-0.8。
1.2 數(shù)據(jù)來源
將影響油松林蓄積量的自變量因子分為遙感因子、地形因子和地面因子。其中油松林蓄積量的數(shù)據(jù)是通過一類清查得到;地形因子是根據(jù)研究區(qū)的170個油松林小班的DEM數(shù)據(jù),得到海拔(Altitude)、坡度(Slope)、坡向(Slope aspect);地面因子包括齡組(Age group)、郁閉度(Crown density),主要是根據(jù)樣地調(diào)查得到的;遙感影像因子包括SPOT影像的4個波段值;植被指數(shù)因子包括根據(jù)遙感影像波段值計算得到的NDVI(歸一化植被指數(shù))、RVI(比值植被指數(shù))。
遙感影像處理過程為:由SPOT衛(wèi)星高分辨率多波段掃描儀(HRV)獲取的遙感影像,包括10 m分辨率的全色波段和20 m分辨率的多波段數(shù)據(jù)。對多波段影像進行了幾何校正、圖像融合、拼接及輻射校正等預處理,使總誤差小于1個像元。根據(jù)一類清查中涉及研究區(qū)內(nèi)的170個油松林樣地的經(jīng)緯度坐標,提取樣地所在的森林小班,將小班邊界與SPOT影像(2010年)疊加,在ENVI中提取每個油松小班所在像素的波段灰度值B1、B2、B3和B4(NIR近紅外光、RED紅光、GREEN綠光和SWIR短波紅外線),根據(jù)遙感影像波段值計算得到每個小班的NDVI、RVI,模型的自變量因子具體總結見表1,且植被指數(shù)的計算方法如下:
NDVI=[p(nir)-p(red)]/[p(nir)+p(red)] ,
(1)
RVI=p(nir)/p(red) ,
(2)
其中,p(nir)、p(red)分別指影像相應波段的灰度值。
表1 數(shù)據(jù)來源
1.3 研究方法
將油松小班的遙感因子、地形因子和地面因子作為自變量,油松林蓄積量作為因變量,分別采用多元逐步回歸、偏最小二乘回歸以及BP神經(jīng)網(wǎng)絡進行蓄積量擬合。建模分別在SPSS13.0、SIMCA-P、MATLAB R2011b中實現(xiàn)。
分別采用三種建模方法進行了油松林蓄積量的估測,為了比較三種方法的優(yōu)劣,選擇MAE(the mean absolute Error),RMSE(the root mean square error)、精度Pc作為衡量算法性能的指標,具體定義如下:
(3)
(4)
(5)
2.1 基于多元逐步回歸分析法的油松林蓄積量估算
對樣地各自變量因子與因變量蓄積量進行相關性和自變量間共線性分析,結果見表2。由表2可知,RED、GREEN、SWIR、海拔、齡組、郁閉度這6個因子與蓄積量的相關性達到了顯著性水平(P<0.05),而NIR、NDVI、RVI、坡度、坡向這5個因子與蓄積量的相關性沒有達到顯著性水平(P>0.05)。從方差膨脹因子來看,NIR、RED、NDVI與RVI的方差膨脹因子均大于10,表明各波段之間與通過波段值計算得到的植被指數(shù)之間存在多重相關性。
表2 因子與樣地蓄積量的相關性分析和共線性分析
由于自變量間存在著顯著的相關性,易使模型估計失真,因此采用逐步回歸法可以找出引起多重共線性的解釋變量,將它排除出去。對170個樣地的油松林蓄積量與自變量進行多元逐步回歸,并對模型精度進行評估,結果見表3。從表3可以看出,郁閉度為最先引入模型的變量,選出的最優(yōu)模型其郁閉度、齡組及RED的偏相關系數(shù)依次為0.733、0.689及-0.212,決定系數(shù)R2為0.632,通過比較使用此模型獲得的表達式為:公頃蓄積量=-57.817+104.888*郁閉度+24.254*齡組-0.214*RED。從表3中的標準化偏回歸系數(shù)可以表示模型中自變量對因變量的貢獻大小,可以看出貢獻度大小依次為:郁閉度>齡組>RED。
表3 油松林蓄積量估測的逐步回歸模型
2.2 基于偏最小二乘法的油松林蓄積量估算
偏最小二乘回歸可以解決自變量之間多重共線性問題。對170個樣地的油松林蓄積量與自變量進行偏最小二乘回歸分析。結果表明:在偏最小二乘回歸計算過程中,共提取了3個主成分F1、F2、F3,這三個主成分一方面盡可能多地代表X中的變異信息,另一方面與Y相關聯(lián)并能解釋Y中的信息。F1、F2、F3對自變量X和因變量Y的解釋能力分別為:38%,22%,3%,總解釋能力為63%。
各自變量與蓄積量相關性結果見圖1。由圖1可知,自變量對蓄積量的解釋度重要性依次為郁閉度>齡組>RED>GREEN>SWIR>NIR>海拔>RVI>NDVI>坡度>坡向,前三個變量的重要性與逐步回歸中構建模型的3個自變量一致,這也說明兩種模型對自變量的提取是一致的,也即郁閉度、齡組和RED對蓄積量估測起主要作用。偏最小二乘回歸系數(shù)見表4,通過表4,構建蓄積量與11個自變量的偏最小二乘回歸模型為:
蓄積量=-66.499-0.007×NIR-0.032×RED-0.165×SWIR+6.619×NDVI-0.079×RVI+0.007×海拔+0.057×坡度+21.463×齡組+104.963×郁閉度+1.333×坡向
Fig.1 Rank of factors圖1 影響蓄積量的各因子重要性排序
2.3 基于BP神經(jīng)網(wǎng)絡模型的油松林蓄積量估算
神經(jīng)網(wǎng)絡模型的實質(zhì)反映了輸入輸出之間的數(shù)學關系,這種數(shù)學關系由特定的網(wǎng)絡結構確定,根據(jù)具體問題進行設計和訓練。在170個樣本中隨機選取80%的樣本(136個)作為訓練數(shù)據(jù),在Matlab中進行網(wǎng)絡訓練,通過不斷調(diào)整訓練參數(shù),使預測誤差達到最小,達到10-3后停止訓練,總計訓練3 000步,擬合完成后,將剩余的20%樣本(34個)作為檢驗數(shù)據(jù),代入訓練好的模型中進行預測,并與實測值進行比較,進行精度檢驗。
表4 油松林蓄積量估測的偏最小二乘模型
構建的BP網(wǎng)絡結構為10-3-1,即輸入層有10個節(jié)點,隱藏層有3個tansig神經(jīng)元,輸出層有1個purelin神經(jīng)元。模型的訓練、驗證和測試的相關分析見圖2,可知模型訓練樣本的相關系數(shù)R為0.87,檢驗樣本的R為0.76,測試樣本的R為0.71,總體訓練R為0.83。模型預測值與真實值以及模型預測誤差見圖3,可知預測值與實測值呈現(xiàn)一致的波動趨勢,差異較小,預測的誤差為-25~20 m3。這說明本文提出的方法在蓄積量估測的精度方面是可行的,并且隨著樣本量的增大,模型的精度會進一步提高[14-19]。
Fig.2 Artificial neural network model of stand volume圖2 油松林蓄積量的神經(jīng)網(wǎng)絡模擬結果
Fig.3 Prediction value and error of artificial neural network model圖3 模型預測值與真實值以及模型預測誤差
2.4 三種方法擬合精度比較
對多元逐步回歸、偏最小二乘回歸以及人工神經(jīng)網(wǎng)絡三種建模方法進行精度比較,結果見圖4和表5。由圖4可以看出,神經(jīng)網(wǎng)絡模型的預測結果比偏最小二乘模型和逐步回歸模型的預測結果更接近實際值。從表5可以看出,三種模型中,神經(jīng)網(wǎng)絡方法的檢驗精度最高、MAE和RMSE值最低。逐步回歸模型和偏最小二乘模型的檢驗精度均低于神經(jīng)網(wǎng)絡模型,通過驗證得到神經(jīng)網(wǎng)絡可以作為更優(yōu)的蓄積量估測方法,同時也體現(xiàn)出這種方法具有更強大的泛化和預測能力。
Fig.4 Comparison of real value and estimation value of three models圖4 實際值與理論值比較
估算方法檢驗精度MAERMSE多元逐步回歸7673%12011456偏最小二乘回歸7709%11951459人工神經(jīng)網(wǎng)絡8213%824977
由于森林蓄積量是受多因子影響的,而傳統(tǒng)的多元線性回歸模型和偏最小二乘回歸模型是建立在線性假設的基礎上的,因此預測的精度較低,在實際應用中受到很大限制。而基于非線性數(shù)量技術的人工神經(jīng)網(wǎng)絡模型,通過對輸入輸出數(shù)據(jù)進行訓練和仿真,實現(xiàn)網(wǎng)絡的自學習能力,能夠較好地擬合預測研究在復雜情況下的非線性預測問題,比傳統(tǒng)的線性回歸模型有了很大的改進[20-21]。此外,本研究也有較高的實際應用價值,當進行其他地區(qū)或其他樹種蓄積量估測建模時,可根據(jù)神經(jīng)網(wǎng)絡原理建立相應的神經(jīng)網(wǎng)絡模型進行估測。
采用多元逐步回歸、偏最小二乘法、神經(jīng)網(wǎng)絡分別建立對油松林蓄積量的估測模型,通過使用檢驗精度、MAE、RMSE對這三種方法的結果進行擬合精度比較。結果表明:1)利用BP神經(jīng)網(wǎng)絡對油松林進行蓄積量估算,最終模型的檢驗精度為82.13%,利用多元逐步回歸和偏最小二乘回歸分別對油松林進行蓄積量估算獲得模型的檢驗精度分別為76.73%與77.09%。2)本研究結果表明利用神經(jīng)網(wǎng)絡模型對油松林蓄積量遙感估測精度更高,所獲得的理論結果與森林清查獲得的地面數(shù)據(jù)的結果相近,表明該方法能夠真實反映一定樹種蓄積量。
本研究中發(fā)現(xiàn):1)影像的選擇、時空分辨率、影像成像時間和質(zhì)量對于森林蓄積量的估算有很大的影響,使得影像的波段灰度值與蓄積量的關系不一致,甚至呈現(xiàn)相反的關系。未來研究應用分辨率更高的遙感圖像,實現(xiàn)精確定位,可以減少估測誤差。2)蓄積量估測因子的選擇對估測準確性和精確性有很大的影響,將地面易測因子與遙感因子結合,可以大大減少野外工作量,提高估測精度。本文選取了遙感因子和地面因子結合進行蓄積量建模,所得模型的精度為82.13%,其中對蓄積量影響較大的3個因子分別是郁閉度、齡組和RED,遙感影像因子的影響較小,這與本文所選擇的影像精度有關。如果在未來能通過更高分辨率的遙感影像,估算出冠幅或株數(shù)因子,則模型的精度會更高。3)未來的研究方向應該是從植被生產(chǎn)力形成的生理過程出發(fā),研究具有生理學、生態(tài)學意義的機理模型,再利用神經(jīng)網(wǎng)絡等機器學習算法進行高精度定量估測。本文的研究結果雖然只適用于山西油松林的蓄積量模擬,但提出的研究方法可以推廣到其他樹種進行森林蓄積量的估測,對于最大限度地減少外業(yè)工作量,將具有重要的理論研究價值和社會、經(jīng)濟效益,為今后的森林固碳估測及森林規(guī)劃管理提供科學依據(jù)。
[1] 程武學,楊存建,周介銘,等.森林蓄積量遙感定量估測研究綜述[J].安徽農(nóng)業(yè)科學,2009,37(16):7746-7750.DOI:10.3969/j.issn.0517-6611.2009.16.171.
[2] Macomber S A,Woodcock C E.Mapping and Monitoring Conifer Mortality using Remote Sensing in the Lake Tahoe Basin[J].RemoteSensingofEnvironment,1994,50(3):255-266.
[3] Tomppo E,Nilsson M,Rosengren M,etal.Simultaneous use of Landsat-TM and IRS-1C WiFS Data in Estimating Large Area Tree Stem Volume and Aboveground Biomass[J].RemoteSensingofEnvironment,2002,82(1):156-171.
[4] 張彥林.基于3S技術的山東省森林蓄積量定量估測研究[D].北京林業(yè)大學,2008.
[5] 包盈智,袁凱先,趙憲文,等.森林二類調(diào)查中蓄積量遙感估測方法應用實例[J].林業(yè)科學研究,1996,9(3):234-238.
[6] 袁凱先,陳玉山,包盈智,等.森林蓄積量的遙感估測[J].林業(yè)資源管理,1996(3):13-17.
[7] 施鵬程,彭道黎.基于偏最小二乘回歸密云森林蓄積量遙感估測[J].江西農(nóng)業(yè)大學學報,2013,35(4):798-801.DOI:10.3969/j.issn.1000-2286.2013.04.023.
[8] 李崇貴.用非線性理論研究以“3S”為基礎的森林蓄積定量估測[D].北京:中國林業(yè)科學研究院資源信息研究所,2001.
[9] 洪偉,吳承禎,何東進.基于人工神經(jīng)網(wǎng)絡的森林資源管理模型研究[J].自然資源學報,1998,13(1):69-72.DOI:10.3321/j.issn:1000-3037.1998.01.012.
[10] 劉志華,常禹,陳宏偉.基于遙感、地理信息系統(tǒng)和人工神經(jīng)網(wǎng)絡的呼中林區(qū)森林蓄積量估測[J].應用生態(tài)學報,2008,19(9):1891-1896.
[11] 王淑君,管東生.神經(jīng)網(wǎng)絡模型森林生物量遙感估測方法的研究[J].生態(tài)環(huán)境,2007,16(1):108-111.DOI:10.3969/j.issn.1674-5906.2007.01.020.
[12] 汪少華,張茂震,趙平安,等.基于TM影像、森林資源清查數(shù)據(jù)和人工神經(jīng)網(wǎng)絡的森林碳空間分布模擬[J].生態(tài)學報,2011,31(4):998-1008.
[13] Gemmell F M.Effects of Forest Cover,Terrain,and Scale on Timber Volume Estimation with Thematic Mapper Data in a Rocky Mountain Site[J].RemoteSensingofEnvironment,1995,51(2):291-305.DOI:10.1016/0034-4257(94)00056-S.
[14] 劉書劍.沽源縣森林碳儲量遙感動態(tài)監(jiān)測[D].北京林業(yè)大學,2011.
[15] 洪奕豐,林輝,嚴恩萍,等.基于偏最小二乘法的平南縣森林蓄積量估測模型研究[J].JournalofCentralSouthUniversityofForestry&Technology,2011,31(7):80-85.DOI:10.3969/j.issn.1673-923X.2011.07.018.
[16] 陳楚,關澤群,張鵬林,等.利用RS和GIS的森林蓄積量偏最小二乘估測研究[J].湖北林業(yè)科技,2004(4):25-28.DOI:10.3969/j.issn.1004-3020.2004.04.007.
[17] 杜曉明,蔡體久,琚存勇.采用偏最小二乘回歸方法估測森林郁閉度[J].應用生態(tài)學報,2008,19(2):273-277.
[18] 羅批,郭繼昌,李鏘,等.基于偏最小二乘回歸建模的探討[J].天津大學學報:自然科學與工程技術版,2002,35(6):783-786.DOI:10.3969/j.issn.0493-2137.2002.06.026.
[19] 李圣嬌,舒清態(tài),徐云棟,等.基于偏最小二乘回歸模型的高山松蓄積量遙感估測[J].江蘇農(nóng)業(yè)科學,2015(8):182-185.DOI:10.15889/j.issn.1002-1302.2015.08.060.
[20] 羅勝琪.BP算法的改進與性能分析[J].中國科技博覽,2011(33):408-409.
[21] 琚存勇,蔡體久.用泛化改進的BP神經(jīng)網(wǎng)絡估測森林蓄積量[J].林業(yè)科學,2006,42(12):59-62.DOI:10.3321/j.issn:1001-7488.2006.12.010.
Estimation for the Forest Volume ofPinustabulaeformisForest Based on Remote Sensing Data in East Shanxi
LIU Zhiguo1,WANG Di2*,ZHANG Hong3,ZHANG Xiaoyu3,HAN Jianping2,WANG Yunxia2
(1.InstituteofLoessPlateau,ShanxiUniversity,Taiyuan030006,China;2.ShanxiInstituteofForestInventoryandPlanning,Taiyuan030012,China;3.CollegeofEnvironmentScienceandResources,ShanxiUniversity,Taiyuan030006,China)
In order to compare the precision and applicability of different estimation models forPinustabuliformisbiomass based on remote sensing data,remote sensing band and terrain information of 170 sample plots ofPinustabulaeformisforest in an earth-rock soil region of eastern Shanxi were extracted from SPOT and DEM images. Associated with the ground survey data, this study employed the BP neural network model, multiple stepwise regression approach and partial least squares method to estimate the biomass volume ofPinustabuliformis. The accuracies of the models obtained from these three methods were verified and compared. The results showed that:1) all three approaches could estimate the biomass volume ofPinustabuliformiswith high accuracies;2) the neural network model had the highest accuracy among three models (82.13%), followed by partial least squares model (77.09%) and the multiple stepwise regression model (76.73%).
Pinustabulaeformisforest;stand volume;remote sensing estimation;multiple stepwise regression;partial least squares regression; BP neural network
10.13451/j.cnki.shanxi.univ(nat.sci.).2017.01.027
2016-08-22;
2016-11-14
國家自然科學基金青年科學基金項目(41401643)
劉治國(1990-),男,山西忻州人,碩士研究生,主要研究方向為森林生態(tài)學。E-mail:272752172@qq.com
*通信作者:王弟(WANG Di),E-mail:Dw1964@126.com
S718.5
A
0253-2395(2017)01-0187-08