• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Landsat5 TM遙感影像估算江山市公益林生物量*

      2016-02-26 01:36:47張偉陳蜀蓉侯平
      西部林業(yè)科學 2016年1期

      張偉,陳蜀蓉,侯平

      (浙江農林大學林業(yè)與生物技術學院,浙江 臨安311300)

      ?

      基于Landsat5 TM遙感影像估算江山市公益林生物量*

      張偉,陳蜀蓉,侯平

      (浙江農林大學林業(yè)與生物技術學院,浙江臨安311300)

      摘要:本研究基于Landsat5 TM遙感影像數(shù)據(jù)和樣地調查數(shù)據(jù),利用多元逐步回歸、偏最小二乘回歸和隨機森林回歸3種方法,建立江山市公益林生物量估算模型,分析和比較3種模型的精度結果,探究隨機森林回歸模型在估算生物量方面的應用,為提高估算森林生物量的精度提供參考。結果表明,多元逐步回歸模型的預測精度為58.31 %、均方根誤差為31.02 t/hm2,偏最小二乘回歸模型分別為60.84 %、30.72 t/hm2,隨機森林回歸模型為70.02 %, 22.18 t/hm2。由此可得,隨機森林回歸模型的預測精度優(yōu)于其他2種模型,隨機森林算法能提高估算森林生物量的精度。

      關鍵詞:生物量估算;隨機森林回歸;多元逐步回歸;偏最小二乘回歸

      全球氣候不斷變暖,森林碳儲量的研究成為社會關注的一個熱點,而森林生物量的估算是森林碳儲量和碳循環(huán)研究的基礎。隨著遙感技術的發(fā)展,學者們逐漸改變了傳統(tǒng)估算森林生物量的方法,轉而利用遙感影像信息和典型樣地調查的數(shù)據(jù)建立某種關系的模型對森林生物量進行估算,這種方法不但減少了對生態(tài)系統(tǒng)的破壞,而且還減少了大量的人力和物力,使大尺度的森林生物量的估算成為可能[1~3]。

      21世紀初,Leo Breiman 和Cutler Adele開發(fā)完成隨機森林(Random Forests)算法[4]。隨機森林是基于分類樹的一種算法,在分類和回歸中都有廣泛的應用[5~6],并取得較好的效果。它運算速度快,能高效的處理大數(shù)據(jù),不需要考慮一般回歸模型存在的自變量間的多重共線性的問題,能有效的提高模型的預測精度[7]。在國外,隨機森林算法最近10多年來得到迅速發(fā)展,已經(jīng)廣泛應用在醫(yī)學、管理學、經(jīng)濟學等眾多領域[8~10]。但在國內,對于隨機森林方面研究較少,而應用在森林生物量估算方面寥寥無幾[11]。

      本項研究基于遙感信息和樣地調查數(shù)據(jù),利用隨機森林算法、多元逐步回歸及偏最小二乘回歸等3種方法建立江山市的森林生物量估算模型,研究和分析隨機森林回歸模型在估算森林生物量的精度,并擇優(yōu)對江山市的公益林生物量進行反演。本項研究方法將為隨機森林算法估算森林生物量提供參考依據(jù),為江山市的公益林生物量估算提供可行性方法。

      1研究區(qū)域概況

      江山市(北緯28°15′~28°53′,東經(jīng)118°22′~118°48′48″)位于浙江省西南部,以山地丘陵為主,屬于中亞熱帶北部濕潤季風氣候區(qū),冬夏季風交替明顯,四季冷暖干濕分明,光照充足,降雨充沛,雨熱同期。平均氣溫為17.0℃。全市土地總面積20.13×104hm2,其中林業(yè)用地面積14.69×104hm2,占土地總面積的73 %,有林地面積12.75×104hm2,森林蓄積量673.3×104m3,森林覆蓋率68.4 %。公益林面積為5.26×104hm2,占全市土地面積的26.13 %。根據(jù)森林類型大致可分為6類,即松〔包括馬尾松(Pinusmassoniana)、濕地松(Pinuselliottii)〕林、毛竹(Phyllostachysheterocycla)林、杉木(Cunninghamialanceolata)林、灌木林、針闊混交林、常綠闊葉林。

      2研究方法

      2.1 樣地數(shù)據(jù)來源與處理

      采用2階抽樣法,在對固定監(jiān)測小班全面普查的基礎上,選取典型地段以設置面積為20 m×20 m的固定樣地,詳細記錄樣地基本信息,包括經(jīng)緯度、海拔、坡度、坡向等環(huán)境因子[12~13];樣地內喬木層(胸徑大于5 cm)采用每木調查(包括測定樹高、胸徑、冠幅和枝下高等),同時在每塊樣地對角線上均勻設置3個2 m×2 m的灌草固定小樣方,詳細記錄灌木種類、株數(shù)、蓋度、高度以及草本種類、株數(shù)、蓋度等指標[14~15]。根據(jù)固定小班監(jiān)測數(shù)據(jù)和浙江省重點公益林生物量模型[16],推算各樣方森林生物量(包括喬木層、灌木層以及草本層)。由于固定樣地與遙感圖像的分辨率大小不一致,本項研究將各研究區(qū)域的樣地生物量按比例換算成與遙感圖像分辨率大小一致的樣地生物量。喬木生物量的單位為kg/400m2,灌木生物量和草本的單位為kg/4m2,為與遙感圖像分辨率大小一致,將喬木生物量、灌木生物量和草本生物量的單位換算成30 m×30 m范圍的面積內的生物量,得到單位為t/900m2的生物量值,最后轉化成單位為t/hm2的生物量值。此次調查共抽取江山市監(jiān)測樣地80個。

      圖1 江山市海拔分布圖

      2.2 遙感數(shù)據(jù)處理

      本項研究以2009年12月6日的Landsat5 TM 影像為數(shù)據(jù)源,從1︰10000地形圖上采集地面控制點,使用ENVI 4.8遙感圖像處理軟件對遙感影像進行幾何精校正和地形校正[17](改進的C校正法)[18],誤差控制在1個像元內,重采樣后像元大小為30 m×30 m。為減少實測樣地與影像的配準誤差,選取樣點坐標附近的9個像元的平均值作為該樣點的變量值。

      本項研究選取66個自變量作為建模的初始自變量,分別是6種原始波段、4種波段組合信息、8種植被指數(shù)信息、48種紋理信息及5種地學信息(包括經(jīng)緯度信息、海拔、坡度和坡向),初始自變量與江山市森林生物量的相關系數(shù)詳見表1。

      表1 自變量因子與樣地生物量相關系數(shù)

      注:(1)TM3123457=TM3/(TM1+TM2+TM3+TM4+TM5+TM7);DVI=TM4-TM3;IIVI=(TM4-TM5)/(TM4+TM5);TM437=TM4×TM3/TM7;TM73=TM7/TM3;SR=TM4/TM3;EVI=5×(TM4-TM3)/(TM4+6×TM3-7.5×TM1+1);TVI=(NDVI+0.5)^0.5;TM452=(TM4+TM5-TM2)/(TM4+TM5+TM2);PVI=0.939×TM4-0.344×TM3+0.09;SAVI=1.5×(TM4-TM3)/(TM4+TM3+0.5)。(2)**在P為0.01水平上極顯著相關;*在P為0.05水平上顯著相關。

      2.3 模型評價指標

      3模型的建立

      3.1 多元逐步回歸模型

      使用SPSS19.0軟件進行多元逐步回歸分析,將超出2倍標準化殘差閾值的數(shù)據(jù)作為異常點剔除后重新建模,重復上述步驟直到?jīng)]有異常值剔除[21],經(jīng)過剔除后余下53個樣地數(shù)據(jù)作為擬合樣本,18個樣地數(shù)據(jù)作為預測樣本。利用擬合樣本建立多元逐步回歸模型,經(jīng)過篩選后最終有4個變量通過檢驗,分別是B5、TM73、CONB2和ENTB5,模型的擬合相關系數(shù)為0.645 4,RMSE是26.46 t/hm2,預測精度為68.12 %。

      多元逐步回歸模型表達式為,BIOMASS=41.050-7.998×CONB2+49.247×ENTB5-877.193×B5+85.516×TM73,式中:B5是第5波段數(shù)值;TM73是第7波段與第3波段的比值;CONB2是第2波段的對比度;ENTB5是第5波段的熵。

      江山市多元逐步回歸模型描述及顯著性檢驗分別如表2~3。

      表2 江山市多元逐步回歸模型描述及參數(shù)表

      表3 江山市多元逐步回歸模型系數(shù)與顯著性

      3.2 偏最小二乘回歸模型

      偏最小二乘回歸(PLS)[22]主要是運用主成分的思想,并結合典型相關分析的多元統(tǒng)計分析方法,它克服了傳統(tǒng)回歸模型中自變量之間多重共逐步的問題,它是由伍德和阿巴諾于1983年首先提出的回歸方法[21,23]。其基本思路:設已知單因變量Y和自變量[x1,x2,…,xn],樣本個數(shù)為n,在X與Y相關矩陣中提取第一主成分t1,Y與X對t1進行回歸,采用交叉有效性原則,確定提取的主成分個數(shù),將這些主成分作為自變量表達為Y對原始變量X的回歸方程[24]。將初始自變量和擬合樣本建立模型,在相關性大小和自變量間多重相關性的基礎上,根據(jù)構建模型的R2不斷選取和調整自變量,最終選取的自變量分別是SECB1、CONB2、CONB3、CORB4和ENTB5,確定的最佳成分個數(shù)為2。將18個檢驗樣本代入模型中進行檢驗。模型的擬合相關系數(shù)為0.691 6,RMSE為27.41 t/hm2,預測精度為69.16 %。

      偏最小二乘回歸的模型表達式為,BIOMASS=12.487+82.923×SECB1-17.653×CONB2+9.066×CONB3+0.234×CORB4+45.586×ENTB5(3-5),式中,SECB1是第1波段的角二階矩;CONB2是第2波段的對比度;CONB3是第3波段的對比度;CORB4是第4波段的相關性;ENTB5是第5波段的熵。

      3.3 隨機森林回歸模型

      隨機森林算法是一種基于分類樹的統(tǒng)計學習方法,它通過匯總大量的分類樹來提高模型預測精度,不用對自變量進行篩選,能較好的容忍噪聲和異常值,在許多領域得到廣泛的應用[8]。其基本思想是通過Bootstrap重抽樣方法從原始樣本中抽取多個樣本,并且對每個Bootstrap樣本都進行決策樹建模,然后組合多棵決策樹的預測,從而形成隨機森林[4]。其算法過程參見李欣海[7]。

      本項研究使用所有自變量及經(jīng)剔除后的53個樣地數(shù)據(jù)進行隨機森林回歸模型的建立,并預測18個檢驗樣本的森林生物量。利用R軟件的randomForest函數(shù)包來建立隨機森林回歸模型,在建立隨機森林回歸模型中,ntree和mtry是重要的參數(shù),因此要擇優(yōu)選擇。ntree是使用bootstrap重抽樣的次數(shù),根據(jù)圖2可知,模型的回歸誤差在回歸樹數(shù)量達到500后趨于穩(wěn)定;mtry是使用到的輸入變量的個數(shù),其大小在回歸分析中通常為輸入變量數(shù)的1/3,當變量數(shù)<3時取1。為確保模型精度,選擇ntree為500,mtry為22。經(jīng)過多次的測試和檢驗,最終選取的自變量分別是1/B3、ASPECT、SR、VARB1、CORB1、VARB4、CORB4、CORB5和CONB7(圖3)。

      圖2 回歸誤差隨回歸樹數(shù)量變化趨勢

      圖3 變量相對重要性

      4結果與分析

      根據(jù)3種模型建立的估算江山市公益林生物量的模型結果如表4。

      表4 江山市各模型結果的比較

      對于決定系數(shù)、精度,隨機森林回歸模型的效果最好,分別是0.609 1、70.02 %,偏最小二乘回歸模型次之,分別為0.441 0、60.84 %,最差為多元逐步回歸模型(分別為0.342 6、58.31 %);對于均方根誤差,最高的是多元逐步回歸模型(34.13 t/hm2),最小為隨機森林回歸模型(22.18 t/hm2)。對于方差比(VR),隨機森林回歸模型、偏最小二乘回歸模型和多元逐步回歸模型分別是0.73、0.54、0.47,隨機森林回歸模型的預測結果偏離程度較小,而多元逐步回歸模型的偏離程度大;對于偏差(BIAS)而言,隨機森林回歸模型偏差最小為-2.91 t/hm2,多元逐步回歸模型和偏最小二乘回歸模型的偏差最大,分別是-13.35 t/hm2和-13.37 t/hm2,由圖4~5可知,3種模型預測的結果與實測值相比偏低,特別是多元逐步回歸和偏最小二乘回歸2種模型與實測值相比相差較大。

      圖4 多元逐步回歸結果

      圖6隨機森林回歸結果

      Fig.6The results of Random Forest model

      綜合上述5個指標,不管是在擬合樣本和預測樣本中,隨機森林回歸模型的預測效果都優(yōu)于其他2種模型,其次為偏最小二乘回歸模型,最差是多元逐步回歸模型。因此,選取精度高的隨機森林回歸模型進行江山市森林生物量的反演。

      5模型的應用

      根據(jù)3種模型的結果分析擇優(yōu)選取隨機森林回歸模型對江山市公益林生物量進行反演,得到整個研究區(qū)公益林生物量(圖7)。統(tǒng)計結果表明,2009年底的江山市公益林總生物量約為556.61×104t,生物量密度為105.82 t/hm2,較多處于60~120 t/hm2之間。根據(jù)圖7可知,江山市生物量的分布為南部高于北部,東部高于西部,主要可能是與江山市的地形及植被分布情況有關(圖中白色為零,因為沒有數(shù)據(jù)無法計算)。

      圖7 江山市公益林生物量反演圖

      6結論與討論

      從模型的結果分析來看,隨機森林回歸模型的預測精度為70.02 %,R2為0.609 1,均方根誤差為22.18 t/hm2,方差比為0.73,偏差為-2.91 t/hm2。以上5個指標的結果都優(yōu)于偏最小二乘回歸和多元逐步回歸模型。而多元逐步回歸模型和偏最小二乘回歸模型都出現(xiàn)了較大的偏差。

      擇優(yōu)選取隨機森林回歸模型對江山市公益林生物量進行反演,獲得公益林總生物量約為556.61×104t,生物量密度為105.82 t/hm2。隨機森林回歸模型學習過程快,處理了大量的自變量數(shù)據(jù),解決了一般回歸模型中出現(xiàn)的自變量間多重共線性,還能評估所有變量的重要性[7]。由于隨機森林算法本身就具有交叉驗證的作用,提高了估算森林生物量的預測精度。因此隨機森林算法能較好的應用于森林生物量的估算。

      根據(jù)模型的預測結果分析,多元逐步回歸和偏最小二乘回歸2種模型估算江山市公益林生物量都出現(xiàn)較明顯的偏差,估算森林生物量的精度較低,這可能與多元逐步回歸和偏最小二乘回歸模型自身的特點有關。而隨機森林算法則利用其自身選擇樣本和自變量的隨機性,注意不同樣本和自變量的關系與因變量與自變量之間的關系,不會過度擬合,使預測值更加接近真實值。隨機森林算法在江山市的公益林生物量估算中取得較好的預測效果,但是利用隨機森林算法估算森林生物量的研究還不夠多,不能確定它在其它地區(qū)能否取得較好的效果。因此,未來可以進一步加強隨機森林算法在不同區(qū)域估算森林生物量方面的驗證研究。

      模型的精度不僅僅是受到模型自身的因素影響,還受到其他多種因素的影響[25]。首先,樣地數(shù)據(jù)并不是實際測量得出的,而是根據(jù)生物量模型計算得出。第二,遙感影像信息在校正過程中產(chǎn)生的誤差和樣地坐標與遙感影像的匹配不準確等因素也會導致的森林生物量的估算精度的降低。在今后的研究中,對于樣地的設置和數(shù)據(jù)的測量中要規(guī)范操作減少誤差;對于遙感影像的處理過程中,要選取高精度的校正方法,并結合高分辨率的影像或雷達影像,提高遙感影像的精度;在模型建立方面,應該更傾向于結合遙感信息進行遙感數(shù)據(jù)結合生物過程的生物量遙感機理或半機理模型。

      參考文獻:

      [1]Main-Knorn M,Sean G G M.Evaluating the Remote Sensing and Inventory-Based Estimation of Biomass in the Western Carpathians [J].Remote Sensing,2011,3(7):1427-1446.

      [2]Hall R J,Skakun R S,Arsenault E J,etal.Modeling forest stand structure attributes using Landsat ETM+ data:Application to mapping of aboveground biomass and stand volume[J].Forest Ecology and Management,2006,225(1):378-390.

      [3]余朝林,杜華強,周國模,等.毛竹林地上部分生物量遙感估算模型的可移植性[J].應用生態(tài)學報,2012,23(9):2422-2428.

      [4]L B.Random Forests[J].Machine Learning,2001,45(1):5-32.

      [5]Peters J,Baets B D,Verhoest N E C,etal.Random forests as a tool for ecohydrological distribution modelling[J].Ecological Modelling,2007,207(2):304-318.

      [6]Pall Oskar Gislason,Jon Atli Benediktsson,Johannes R.Sveinsson.Random Forests for Land Cover Classification[J].Pattern Recognition Letters,2006,27(4):294-300.

      [7]李欣海.隨機森林模型在分類與回歸分析中的應用[J].應用昆蟲學報,2013,50(4):1190-1197.

      [8]方匡南,吳見彬,朱建平,等.隨機森林方法研究綜述[J].統(tǒng)計與信息論壇,2011,26(3):32-38.

      [9]Andrew Mellor,Andrew Haywood,Christine Stone,etal.The performance of random forests in an operational setting for large area sclerophyll forest classification[J].Remote Sensing,2013,5(6):2838-2856.

      [10]Powell S L,Cohen W B,Healey S P,etal.Quantification of live aboveground forest biomass dynamics with Landsat time-series and field inventory data:A comparison of empirical modeling approaches[J].Remote Sensing of Environment,2010,114(5):1053-1068.

      [11]王云飛,龐勇,舒清態(tài).基于隨機森林算法的橡膠林地上生物量遙感反演研究——以景洪市為例[J].西南林業(yè)大學學報,2013,33(6):38-45.

      [12]張華柳,伊力塔,余樹全,等.嵊州市公益林生物量及生態(tài)效益價值評價[J].林業(yè)資源管理,2011(1):78-85.

      [13]錢逸凡,伊力塔,鈄培民,等.浙江縉云公益林生物量及固碳釋氧效益[J].浙江農林大學學報,2012,29(2):257-264.

      [14]伊力塔,嚴曉素,余樹全,等.浙江省不同森林類型林分健康指標體系[J].南京林業(yè)大學學報(自然科學版),2012,36(1):145-148.

      [15]錢逸凡,伊力塔,張超,等.浙江省中部地區(qū)公益林生物量與碳儲量[J].林業(yè)科學,2013,49(5):17-23.

      [16]袁位高,江波,葛永金,等.浙江省重點公益林生物量模型研究[J].浙江林業(yè)科技,2009,29(2):1-5.

      [17]鮑晨光,范文義,李明澤,等.地形校正對森林生物量遙感估測的影響[J].應用生態(tài)學報,2009,20(11):2750-2756.

      [18]黃微,張良培,李平湘.一種改進的衛(wèi)星影像地形校正算法[J].中國圖象圖形學報,2005,10(9):1124-1128.

      [19]范文義,張海玉,于穎,等.三種森林生物量估測模型的比較分析[J].植物生態(tài)學報,2011,35(4):402-410.

      [20]Foody G M,Cutler M E,Mcmorrow J,etal.Mapping the biomass of Bornean tropical rain forest from remotely sensed data[J].Global Ecology and Biogeography,2001,10:379-387.

      [21]徐小軍,周國模,杜華強,等.基于Landsat TM數(shù)據(jù)估算雷竹林地上生物量[J].林業(yè)科學,2011,47(9):1-6.

      [22]Nguyen Hung T L B.Assessment of rice leaf growth and nitrogen status by hyperspectral canopy reflectance and partial least square regression[J].European Journal of Agronomy,2006,24(4):349-356.

      [23]王慧文,吳栽彬,孟潔.偏最小二乘回歸的線性與非線性方法[M].北京:國防工業(yè)出版社,2006:152-153.

      [24]劉瓊閣,彭道黎,涂云燕,等.基于偏最小二乘的森林生物量遙感估測[J].東北林業(yè)大學學報,2014,42(7):44-47.

      [25]Lu D, Chen Q, Wang G,etal.Aboveground forest biomass estimation with landsat and LiDAR Data and uncertainty analysis of the estimates[J].International Journal of Forestry Research,2012(2):1-16.

      Landsat5 TM-based Biomass Estimation of

      Public-welfare Forest of Jiangshan City

      ZHANG Wei,CHEN Shu-rong,HOU Ping

      (School of Forestry and Biotechnology,Zhejiang A & F University,Lin’an Zhejiang 311300,P.R.China)

      Abstract:By using Landsat5 TM data and forest inventory data,multi-stepwise regression model,partial least square regression model and random forest regression model were built to estimate forest biomass in Jiangshan City,and the accuracy of these three models were analyzed and compared to study the application of regression models in forest biomass estimation.The results showed that the precisions and root mean square errors of multi-stepwise,partial least square regression and random forest were 58.31%,and 31.02 t/hm2,60.84 % and 30.72 t/hm2, 70.02 % and 22.18 t/hm2respectively.Therefore random forest regression model is better than the other two models,and it could improve the accuracy of forest biomass estimation.

      Key words:biomass estimation;random forest regression;multi-stepwise regression;partial least square regression

      通訊作者簡介:侯平(1961-),男,教授,博士,博士生導師,主要從事生態(tài)恢復研究。E-mail:houpingg@263.net

      作者簡介:第一張偉(1988-),男,碩士生,主要從事生態(tài)環(huán)境監(jiān)測與區(qū)域碳收支評估研究。E-mail:zjzhangwei321@163.com

      *收稿日期:2015-06-04

      中圖分類號:S 718.55+6

      文獻標識碼:A

      文章編號:1672-8246(2016)01-0105-07

      竹北市| 姜堰市| 红桥区| 平凉市| 和龙市| 绵竹市| 乐山市| 桓仁| 汽车| 宁津县| 于都县| 祁阳县| 深圳市| 开封市| 黄骅市| 收藏| 左权县| 鹤山市| 沾化县| 榆中县| 宁津县| 井冈山市| 隆尧县| 仙居县| 和龙市| 延津县| 巨鹿县| 高淳县| 金湖县| 湖口县| 河津市| 衡阳市| 法库县| 思南县| 绥化市| 聂荣县| 红安县| 长宁区| 晋州市| 永吉县| 威远县|