潘 穎 丁鳴鳴 林 杰 代 僑 郭 賡 崔琳琳
(1.南京林業(yè)大學(xué)南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心 南京 210037; 2.長江航道工程局有限責(zé)任公司華東分公司 南京 210011; 3.南京市水務(wù)局 南京 210036)
森林生態(tài)系統(tǒng)作為陸地生態(tài)系統(tǒng)的最大碳庫,在全球碳循環(huán)中扮演著源、庫、匯的作用,而城市森林作為城市重要的生命支撐系統(tǒng),是城市可持續(xù)發(fā)展的基礎(chǔ)和保障(林文鵬等, 2008)。葉面積指數(shù)(leaf area index, LAI)通常被定義為植被葉、莖、花、果等組分的總面積與土地面積之比(Chenetal., 1996),是生態(tài)系統(tǒng)碳循環(huán)、水文和氣候等模型中不可或缺的重要組成參數(shù),已被廣泛應(yīng)用于森林監(jiān)測、植被評價(jià)和農(nóng)作物產(chǎn)量預(yù)估等(Mynenietal., 2002; Sonnentagetal., 2007)。LAI能夠反映植被水平覆蓋狀況和垂直結(jié)構(gòu)特征,甚至枯枝落葉層厚薄和地下生物量多少,這些也是植被影響土壤侵蝕的主要方面(楊勤科等, 2006; 楊敏等, 2015)。因此,及時(shí)、準(zhǔn)確、有效估算區(qū)域尺度上高質(zhì)量植被LAI,對研究土壤侵蝕與植被的關(guān)系至關(guān)重要(Linetal., 2014)。
遙感具有及時(shí)、高效探測大面積目標(biāo)地物光譜特征的能力,是獲取區(qū)域乃至全球尺度上植被參數(shù)的主要手段,利用遙感影像構(gòu)建植被指數(shù)已被廣泛用于植被LAI反演研究中(Liangetal., 2015; Linetal., 2014; Liuetal., 2012)。林文鵬等(2008)基于SPOT5遙感影像建立實(shí)測LAI與植被指數(shù)之間的線性回歸關(guān)系,結(jié)果發(fā)現(xiàn)修正土壤調(diào)節(jié)植被指數(shù)(modified soil adjusted vegetation index,MSAVI)和優(yōu)化葉綠素吸收率指數(shù)(modified chlorophyll absorption in reflectance index,MCARI)能夠消除土壤背景和葉綠素的影響,適用于城市森林LAI遙感反演,而歸一化植被指數(shù)(normalized difference vegetation index,NDVI)會受背景等因素不同程度的影響。楊敏等(2015)基于Landsat 8 OLI遙感影像構(gòu)建隱含層為2層的反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò),模型不僅具有較高的LAI反演精度,而且具有較高的空間可靠性。姚雄等(2017)結(jié)合法國Pleiades遙感數(shù)據(jù),利用12種遙感植被指數(shù)構(gòu)建隨機(jī)森林(random forest, RF)林地LAI反演模型,結(jié)果發(fā)現(xiàn)RF模型不容易出現(xiàn)過擬合現(xiàn)象,其精度高于支持向量回歸(support vector regression,SVR)模型和BP神經(jīng)網(wǎng)絡(luò)模型。
多角度遙感從不同方向多種角度對同一地物進(jìn)行觀測,可提供豐富的地物信息,具備較強(qiáng)的植被結(jié)構(gòu)參數(shù)反演能力,且能夠減少“異物同譜”和“同物異譜”等現(xiàn)象對反演結(jié)果造成的影響(楊貴軍等, 2011)。相比于單一角度垂直觀測的遙感數(shù)據(jù),多角度遙感數(shù)據(jù)能夠反映植被立體結(jié)構(gòu)信息和地物多維空間結(jié)構(gòu)特征,可以改善傳統(tǒng)的單角度遙感數(shù)據(jù)反演植被LAI精度低等問題,對于有效反演地表植被結(jié)構(gòu)參數(shù)具有重要意義(李新輝等, 2011; Wangetal., 2016)。Fan等(2009)基于多角度PROBA/CHRIS(project for on-board autonomy/compact high resolution imaging spectrometer)數(shù)據(jù)和混合冠層反射率模型提出一種新的高光譜方向二階導(dǎo)數(shù)方法(hyperspectral directional second derivative method,DSD),能夠有效消除背景影響,提高LAI反演精度。趙妍等(2013)指出,多角度遙感數(shù)據(jù)反演的LAI對研究森林植被生物量和森林生態(tài)系統(tǒng)碳水循環(huán)等具有重要意義。
經(jīng)驗(yàn)?zāi)P头ê臀锢砟P头ㄊ悄壳白畛S玫腖AI反演方法。經(jīng)驗(yàn)?zāi)P头ㄖ冈谥脖恢笖?shù)或反射率與LAI之間建立線性或非線性回歸模型,但模型易飽和,且通用性受限(Schlerfetal., 2006)。物理模型法指利用以物理方法為基礎(chǔ)的植被冠層反射率模型進(jìn)行LAI反演,其中植被冠層輻射傳輸模型PROSPECT+SAIL(scattering by arbitrarily inclined leaves)——PROSAIL模型既考慮土壤的光學(xué)特性,又考慮植被的幾何結(jié)構(gòu)特征,具有良好的模擬效果(楊貴軍等, 2011; 余金林, 2014; Jacquemoudetal., 2009)。谷成燕等(2013)、杜育璋等(2016)利用PROSAIL輻射傳輸模型模擬的植被冠層反射率建立查找表反演植被LAI,結(jié)果發(fā)現(xiàn)基于PROSAIL模型的植被LAI遙感反演結(jié)果與LAI實(shí)測值具有較高一致性,反演精度較高。
綜上可知,多角度遙感數(shù)據(jù)可以充分挖掘植被立體結(jié)構(gòu)信息,隨機(jī)森林算法能夠減少反演過程中的過擬合現(xiàn)象,PROSAIL模型具有較好的植被冠層反射率模擬效果。由此可見,利用多角度遙感數(shù)據(jù),結(jié)合PROSAIL輻射傳輸模型和隨機(jī)森林算法能夠提高植被LAI遙感反演精度,對研究森林生態(tài)系統(tǒng)碳循環(huán)具有重要意義。
鑒于此,本研究基于多角度PROBA/CHRIS遙感數(shù)據(jù)和野外實(shí)測數(shù)據(jù),結(jié)合PROSAIL模型和隨機(jī)森林模型反演森林LAI,并對LAI反演結(jié)果進(jìn)行精度驗(yàn)證和評價(jià),以期提高植被LAI遙感反演精度,為區(qū)域土壤侵蝕遙感定量監(jiān)測提供新的方法和模型。
紫金山位于南京城區(qū)東郊,32°01′57″—32°06′15″N、118°48′00″—118°53′04″E,屬低山丘陵,土壤以黃棕壤為主(王春, 2009)。地處北亞熱帶季風(fēng)性氣候區(qū),四季分明,年均氣溫15.7 ℃以上,全年降水分布不均,年降雨量1 021 mm左右。典型地帶性植被類型為常綠-落葉闊葉混交林,主要由針葉林、闊葉林、落葉常綠混交林、針闊混交林和竹林等組成,樹木生長季主要為春夏季。紫金山大部分森林為人工林,森林覆蓋率80%,森林郁閉度0.75~0.8(王春, 2009; 陳添興, 2012)。
幕府山位于南京城區(qū)北面,32°07′47″—32°10′00″N、118°44′58″—118°51′06″E,主要由崗地、低山、河漫灘和少量平地組成(李林, 2004)。土壤主要為石灰?guī)r殘丘和其他基性巖漿上發(fā)育起來的土壤以及少量人工土壤和碳酸土等(李林, 2004; 劉國華, 2004)。地處北亞熱帶濕潤氣候區(qū),四季分明,熱量充沛,年均氣溫15.4 ℃,雨量充足,年降雨量800~1 000 mm,降水主要集中在6月中旬到7月中上旬。典型地帶性植被類型為常綠-落葉闊葉混交林,無明顯優(yōu)勢樹種,樹木生長季主要為春夏季。幕府山森林以人工林為主、天然次生林為輔,群落結(jié)構(gòu)分為喬木層、灌木層和草本層3個(gè)層次(李林, 2004)。
2.1.1 葉面積指數(shù)測定 于2017和2018年7—9月上旬進(jìn)行LAI測定,選擇天空晴朗、無積云、能見度好的天氣,測定時(shí)間為6:30—10:30和14:00—17:30,盡量避免太陽直射。由于地面測定時(shí)間在遙感數(shù)據(jù)成像后2年,因此樣方選擇植被變化少、人為干擾小的區(qū)域(曹建軍等, 2013)。選取不同林分類型(針葉林、闊葉林、針闊混交林),在每種林分類型內(nèi)選擇地勢坡度較緩、植被分布均勻且變化小的地區(qū)進(jìn)行測定,樣方大小為10 m×10 m,采樣間距大于30 m,共114個(gè)樣方。采用LAI-2200C冠層分析儀,在每個(gè)樣方的4個(gè)角和中心點(diǎn)測定5個(gè)LAI,取其平均值作為該樣方的LAI。利用GPS記錄樣方地理位置,坐標(biāo)參考WGS-84,重復(fù)測定2~3次,取其平均值作為結(jié)果。研究區(qū)內(nèi)采樣點(diǎn)分布如圖1所示,不同植被類型的LAI實(shí)測值描述統(tǒng)計(jì)如表1所示。
圖1 采樣點(diǎn)分布Fig. 1 Distribution of sampling points
表1 采樣點(diǎn)不同植被類型的LAI描述統(tǒng)計(jì)Tab.1 Descriptive statistics of LAI values of different vegetation types in sampling points
2.1.2 葉片光譜測定 葉片光譜測定在天氣良好、無風(fēng)或風(fēng)力較小的條件下進(jìn)行,采用美國產(chǎn)ASD FieldSpec Pro2500光譜輻射儀,測定時(shí)間為10:30—14:00。光譜范圍為350~2 500 nm,采樣間隔350~1 000 nm 范圍內(nèi)為1.4 nm,1 000~2 500 nm 范圍內(nèi)為2 nm。探頭視場角為25°。每片葉片取3個(gè)點(diǎn)進(jìn)行測定,每個(gè)測點(diǎn)視場范圍內(nèi)重復(fù)20次,取其平均值。光譜測定前后立即進(jìn)行參考板校正(張海波等, 2014; 邢著榮, 2010; 劉天鳳, 2014)。
2.2.1 葉片面積測定 采用網(wǎng)格法測定葉片面積。首先將采集的新鮮葉片分為3組,每組10片,在方格紙上將每片葉子的輪廓用鉛筆描繪下來,然后利用方格面積與葉片面積呈正比的關(guān)系計(jì)算葉片面積(張清林等, 2011)。
2.2.2 葉片等效水厚度計(jì)算 在PROSAIL模型中,葉片含水量為等效水厚度(equivalent water thickness,Cw),定義為單位葉片面積單位質(zhì)量葉片內(nèi)含有的水分質(zhì)量。計(jì)算公式如下:
Cw=(葉片鮮質(zhì)量-葉片干質(zhì)量)/
(葉片面積·ρ)。
(1)
式中:ρ為水的密度(g·cm-3)。
2.2.3 葉片干物質(zhì)含量計(jì)算 葉片干物質(zhì)含量(leaf dry matter content,Cm)指葉片內(nèi)淀粉、纖維素和蛋白質(zhì)等含量。在PROSAIL模型中,葉片干物質(zhì)含量定義為單位葉片面積內(nèi)的干物質(zhì)質(zhì)量(g·cm-2)。計(jì)算公式如下:
Cm= 葉片干物質(zhì)質(zhì)量/葉片面積。
(2)
2.2.4 葉綠素a、b含量測定 葉綠素a、b含量(chlorophyll a and b content,Cab)測定參考張清林等(2011)。取新鮮葉片3份,每份0.2 g,加入95%乙醇及適量石英砂和碳酸鈣粉,研磨成勻漿至組織發(fā)白,過濾,用UV2450-紫外可見分光光度計(jì)測量波長 665和649 nm處的消光度(D)。計(jì)算公式如下:
Ca=13.95×D665-6.88×D649;
(3)
Cb= 24.96×D649-7.32×D665;
(4)
色素含量(mg·g-1)=C·V/W/1 000。
(5)
式中:Ca和Cb分別為葉綠素a和葉綠素b濃度;D665和D649分別為波長 665和649 nm處的消光度;C為色素濃度(mg·L-1);V為提取液體積(mL);W為葉片樣品鮮質(zhì)量(g)。
2.3.1 遙感影像數(shù)據(jù) 采用多角度PROBA/CHRIS遙感數(shù)據(jù),影像獲取時(shí)間為當(dāng)年7—9月,盡量選取無云影像(表2)。
PROBA衛(wèi)星是歐空局2001年10月22日發(fā)射的新一代微衛(wèi)星,為太陽同步軌道,軌道高度615 km,傾角97.89°。衛(wèi)星上搭載緊湊式高分辨率成像分光計(jì)CHRIS、輻射測量傳感器SREM和碎片測量傳感器DEBIE。CHRIS作為一種成像裝置,成像模式多、光譜范圍寬、分辨率高,能夠獲取目標(biāo)-55°、-36°、0°、36°和55°5種角度的觀測信息(角度為正表示前向觀測,角度為負(fù)表示后向觀測)(楊貴軍等, 2011)。CHRIS L1數(shù)據(jù)共有5種成像模式: 模式1為陸地和水成像; 模式2為水成像; 模式3、4和5主要為陸地成像。本研究選取Mode 3數(shù)據(jù),共18個(gè)光譜波段,天底點(diǎn)地面分辨率為17 m。因多角度PROBA/CHRIS遙感數(shù)據(jù)受傳感器和云層影響較大,故只有2015年9月7日數(shù)據(jù)。研究區(qū)樹木生長季主要為春夏季,野外調(diào)查時(shí)間稍早于影像成像時(shí)間,對反演結(jié)果影響不大。
表2 多角度遙感數(shù)據(jù)源Tab.2 Multi-angle remote sensing data resources
2.3.2 遙感影像數(shù)據(jù)預(yù)處理 多角度PROBA/CHRIS遙感數(shù)據(jù)預(yù)處理主要包括去噪、云掩膜、大氣校正和幾何校正。首先,利用歐空局提供的HDFclean(http:∥www.earth.esa.int/proba/HDFclean v2.htm)軟件對影像進(jìn)行去噪處理和缺失像元填充。由于獲取數(shù)據(jù)時(shí)天氣良好,沒有云層污染,因此未對數(shù)據(jù)進(jìn)行云掩膜處理。然后,利用歐空局提供的BEAM軟件對CHRIS數(shù)據(jù)進(jìn)行大氣校正。最后,使用校正好的南京市2007年TM遙感影像,在研究區(qū)內(nèi)選擇15個(gè)地面控制點(diǎn),采用二次多項(xiàng)式擬合法和雙線性內(nèi)插法進(jìn)行幾何校正,將誤差控制在0.5個(gè)像元內(nèi)。由于多角度PROBA/CHRIS遙感數(shù)據(jù)獲取區(qū)域在研究區(qū)內(nèi),因此未進(jìn)行影像裁切。
2.3.3 最佳波段選取 CHRIS Mode 3數(shù)據(jù)包含18個(gè)光譜波段,波段間具有較強(qiáng)相關(guān)性。為了選取信息量大、冗余性小的波段,利用主成分分析法對高光譜波段間的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行計(jì)算,并通過分析相關(guān)系數(shù)和協(xié)方差矩陣獲取最佳反演波段(Brogeetal., 2001)。首先,計(jì)算CHRIS影像波段間的相關(guān)系數(shù)矩陣,如圖2所示,18個(gè)光譜波段相鄰波段的相關(guān)系數(shù)較高,而間隔較遠(yuǎn)波段間的相關(guān)性較弱,沿對角線明顯分塊,為方便最佳波段選取,將CHRIS影像波段分為波段1-5、6-11和12-18共3部分; 然后,計(jì)算各分段區(qū)的協(xié)方差矩陣和特征值,確定各分段區(qū)的主成分個(gè)數(shù),進(jìn)而計(jì)算每個(gè)主成分對波段的貢獻(xiàn)率,貢獻(xiàn)率越大,波段所含信息量越大; 最后,根據(jù)貢獻(xiàn)率大小選取最佳波段。第n波段第x主成分的貢獻(xiàn)率為:
(6)
式中:Pnx為第n波段第x主成分的特征向量;λx為第x主成分的特征向量; Varn為協(xié)方差矩陣中第n波段的方差。
最終確定CHRIS數(shù)據(jù)的最佳波段組合為第5、8和18波段,中心波長分別為570.9、676.0和1 022.0 nm。
圖2 CHRIS影像波段間的相關(guān)系數(shù)矩陣Fig. 2 Correlation coefficient matrix between CHRIS image bands
2.4.1 PROSAIL模型 PROSAIL模型整合葉片光學(xué)特性模型PROSPECT和冠層反射率模型SAIL,考慮土壤非朗伯特性、葉片鏡面反射、植被冠層熱點(diǎn)效應(yīng)和葉傾角分布情況,使用2層冠層結(jié)構(gòu),同時(shí)考慮植被冠層水平和垂直方向上的異質(zhì)性,能夠很好描述均勻植被冠層的反射特性,具有良好模擬結(jié)果,在LAI反演、生理生化參數(shù)反演以及光譜模擬等方面廣泛應(yīng)用(谷成燕等, 2013; 趙虹等, 2014; 王李娟等, 2014)。PROSPECT模型是Jacquemoud等(1990)提出的基于ALLEN平板模型改進(jìn)的輻射傳輸模型,主要用于計(jì)算 400~2 500 nm間隔5 nm的上行和下行輻射通量,從而得到葉片的反射率和透射率。SAIL模型是Verhoef(1984)基于SUITS模型發(fā)展的用于描述植被冠層二向性反射率的輻射傳輸模型。PROSAIL模型公式如下:
ρc=PROSAIL(LAI,ALA,N,Cab,
Cw,Cm,SL,Diff,θv,θs,φ) 。
(7)
式中:ρc為冠層反射率; LAI為葉面積指數(shù); ALA為平均葉傾角(°);N為描述葉片內(nèi)部細(xì)胞結(jié)構(gòu)的參量,與植物種類和生長狀態(tài)有關(guān),一般情況下單子葉植物N為1~1.5,雙子葉植物N為 1.5~2.5,老化葉N大于2.5(Darvishzadehetal., 2008);Cab為葉片葉綠素a、b含量(μg·cm-2);Cw為葉片等效水厚度(cm);Cm為葉片干物質(zhì)含量(g·cm-2);SL為熱點(diǎn)參數(shù); Diff為漫反射系數(shù);θv和θs分別為觀測天頂角和太陽天頂角;φ為太陽與觀測相對方位角。
2.4.2 PROSAIL模型參數(shù)敏感性分析 為更好利用冠層反射率反演LAI,需了解各生化組分參數(shù)對冠層反射率變化的敏感程度和影響的波段區(qū)間(吳伶等, 2012)。參數(shù)敏感性分析是確定模型關(guān)鍵參數(shù)和控制模型效率非常有效的過濾工具,細(xì)化敏感性大的參數(shù),將敏感性小的參數(shù)設(shè)為定值,既可建立完整的模擬集,又能減少數(shù)據(jù)的冗余性,有助于優(yōu)化模型構(gòu)建和參數(shù)反演(谷成燕等, 2013)。其中,定性分析是通過改變待分析參數(shù)取值,固定其他參數(shù)取值,得到一系列模擬的冠層反射率,基于冠層反射率曲線變化反映該參數(shù)的敏感性強(qiáng)度; 而定量分析則是考察在某個(gè)參考值附近一定范圍內(nèi),模型輸出的冠層模擬反射率變化情況(谷成燕等, 2013)。定性分析過程中模型各參數(shù)變化范圍選取依據(jù)如下: LAI變化范圍根據(jù)野外實(shí)測LAI范圍設(shè)置;N和SL參考石鋒(2012);Cab、Cw和Cm變化范圍根據(jù)實(shí)驗(yàn)室測量數(shù)據(jù)范圍設(shè)置;θs、θv和φ取值根據(jù)觀測角度為0°時(shí)的影像頭文件信息設(shè)置。采用Spherical函數(shù)(蔡博峰等, 2007)模擬葉面積傾角,土壤背景選擇潮濕土壤,具體參數(shù)設(shè)置如表3所示。
2.4.3 PROSAIL模型適用性分析 利用PROSAIL模型模擬冠層反射率過程中,先通過PROSPECT模型模擬林地葉片反射率,再通過SAIL模型模擬林地冠層反射率。PROSPECT模型模擬葉片反射率時(shí),需先與研究區(qū)實(shí)測葉片反射率進(jìn)行匹配,通過不斷調(diào)試找到最適參數(shù),使模型模擬反射率與實(shí)測反射率有較好匹配,匹配情況由誤差函數(shù)驗(yàn)證(谷成燕等, 2013)。計(jì)算公式如下:
(8)
2.4.4 植被指數(shù)選取 LAI變化與葉片光學(xué)性質(zhì)變化有關(guān),與植被光譜紅光和近紅外波段反射率有很強(qiáng)相關(guān)性,基于特征波段構(gòu)建的植被指數(shù)可用于估算LAI(Pearsonetal., 1972)。Broge 等(2001)研究發(fā)現(xiàn),當(dāng)直接使用多波段光譜數(shù)據(jù)反演 LAI 時(shí),反演方法復(fù)雜且容易受影像中水汽吸收等因素干擾,而植被指數(shù)利用波段比值等方式,能夠減小冠層陰影和土壤背景等干擾因子的影響,從而突出植被信息,是估算植被葉面積指數(shù)的重要工具。
本研究借鑒以往經(jīng)驗(yàn)(姚雄等, 2017),選擇RVI(比值植被指數(shù),ratio vegetation index)、NDVI、PVI(垂直植被指數(shù),perpendicular vegetation index)、DVI(差值植被指數(shù),difference vegetation index)、SAVI(土壤調(diào)節(jié)植被指數(shù),soil adjusted vegetation index)、EVI(增強(qiáng)型植被指數(shù),enhanced vegetation index)、MSAVI和SIPI[結(jié)構(gòu)不敏感色素(植被)指數(shù),structure insensitive pigment (vegetation) index]8 種對LAI敏感的植被指數(shù),計(jì)算公式如表4所示。通過分析8種植被指數(shù)與LAI的相關(guān)性,選擇相關(guān)性較高的植被指數(shù)參與LAI建模和反演,相關(guān)性分析采用SPSS 20.0(SPSS Inc,USA)軟件進(jìn)行。
表3 敏感性分析參數(shù)設(shè)置①Tab.3 Parameter settings of sensitivity analysis
表4 植被指數(shù)及其表達(dá)式①Tab.4 Vegetation indices and their expressions
2.4.5 隨機(jī)森林LAI反演 隨機(jī)森林是一種基于分類回歸樹的集成機(jī)器學(xué)習(xí)算法,是Breiman(2001)提出的Bagging算法的變體,其運(yùn)算速度快、計(jì)算高效、預(yù)測準(zhǔn)確性高,對異常值和噪聲有很好的容忍度,且由于樣本內(nèi)部進(jìn)行交叉檢驗(yàn),不會出現(xiàn)過擬合現(xiàn)象(呂杰, 2012; 吳志明等, 2018)。
本研究通過Python自帶的scikit-learn機(jī)器學(xué)習(xí)庫實(shí)現(xiàn)隨機(jī)森林算法的構(gòu)建。將植被指數(shù)作為自變量,LAI作為因變量,選取70%樣本用于參數(shù)優(yōu)化和模型構(gòu)建,30%樣本用于模型檢驗(yàn)。主要步驟如下: 1) 采用bootstrap技術(shù)進(jìn)行重采樣,在原始數(shù)據(jù)集中有放回地隨機(jī)抽取n個(gè)樣本作為訓(xùn)練集,生成對應(yīng)決策樹,未被抽取到的樣本構(gòu)成袋外數(shù)據(jù)集; 2) 假設(shè)有M個(gè)輸入變量,每株樹的節(jié)點(diǎn)從M個(gè)變量中隨機(jī)選擇k個(gè),用于確定該節(jié)點(diǎn)的最佳分裂點(diǎn); 3) 使每株決策樹都最大限度地生長而不剪枝,直至滿足分割終止條件; 4) 對所有決策樹求平均值獲得最終預(yù)測值。
首先將模擬的冠層反射率通過光譜響應(yīng)函數(shù)模擬到多角度PROBA/CHRIS影像的b1(442 nm)~b18(1 019 nm)波段上,以與LAI相關(guān)性較高的植被指數(shù)作為自變量。其次確定回歸過程的關(guān)鍵參數(shù),包括決策樹數(shù)量(n_estimators)、最大特征數(shù)量(max_features)、最大深度(max_depth)和分裂性能函數(shù)(criterion)。對于n_estimators,主要通過設(shè)置不同決策樹數(shù)量得到不同模型誤差,觀察誤差變化趨勢從而確定n_estimators;當(dāng)n_estimators增加時(shí),模型誤差趨于穩(wěn)定,選擇該值為最佳n_estimators,在本研究中當(dāng)決策樹數(shù)量達(dá)到1 000后,模型誤差趨于穩(wěn)定,因此將1 000作為最佳n_estimators。max_ features設(shè)置為自動(dòng),max_depth默認(rèn)為不輸入,criterion設(shè)置為均方誤差。
LAI反演過程的技術(shù)路線如圖3所示。
圖3 LAI反演技術(shù)路線Fig. 3 Pretreatment flow chart of LAI inversion
2.4.6 精度評價(jià) 決定系數(shù)(coefficient of determination,R2)被用于評價(jià)模型模擬值與實(shí)測值之間的擬合效果(Qietal., 2013),其值越接近于1,表明模型擬合精度越高。計(jì)算公式如下:
(9)
均方根誤差(root mean square error,RMSE)和平均絕對百分誤差(mean absolute percentage error,MAPE)被用于評價(jià)模型預(yù)測值與實(shí)測值之間的誤差,其值越小,表明模型精度越高。計(jì)算公式如下:
(10)
(11)
圖4 冠層反射率隨模型參數(shù)變化曲線Fig. 4 Curve of canopy reflectance with different model parameters
PROSAIL模型中各生化組分參數(shù)在不同波長下的冠層反射率如圖4所示。葉面積指數(shù)(LAI)對可見光波段(400~800 nm)范圍內(nèi)的冠層反射率影響較小,對近紅外和短波紅外波段的冠層反射率影響較為顯著,冠層反射率隨LAI增大而增大;但隨著波段增加、LAI增大,冠層反射率變化幅度減小,逐漸趨于飽和。葉片結(jié)構(gòu)參數(shù)(N)影響整個(gè)光譜范圍內(nèi)的冠層反射率,N增大,植被多次散射效應(yīng)增強(qiáng),冠層反射率隨之增大,特別是綠光和整個(gè)紅外波段,冠層反射率逐漸增大。葉綠素a、b含量(Cab)對可見光波段范圍內(nèi)的冠層反射率影響很大,冠層反射率隨Cab增加呈逐漸降低趨勢,綠光波段處較為敏感;800 nm后,Cab對冠層反射率幾乎沒有影響,冠層反射率趨于一致。葉片等效水厚度(Cw)對可見光波段范圍內(nèi)的冠層反射率沒有影響,這是因?yàn)镃w主要通過水分對光譜的吸收作用影響冠層反射率;而水分對960 nm后的波段吸收較為明顯,冠層反射率隨Cw增大逐漸減小,變化較為顯著。葉片干物質(zhì)含量(Cm)對可見光波段范圍內(nèi)的冠層反射率幾乎沒有影響,原因可能是葉綠素吸收掩蓋了干物質(zhì)含量對冠層反射率的影響(余金林, 2014);Cm對近紅外及其以外波段的冠層反射率影響較為明顯,冠層反射率隨Cm增大逐漸減小。熱點(diǎn)參數(shù)(SL)對可見光波段范圍內(nèi)的冠層反射率無明顯影響,但在760~1 300 nm和1 400~1 850 nm波段,冠層反射率隨SL增大而增大,變化相對明顯。
由上述分析可知,LAI和N影響整個(gè)光譜范圍內(nèi)的冠層反射率,尤其在近紅外波段影響最為顯著;Cab對400~800 nm可見光波段范圍內(nèi)的冠層反射率影響較大;Cw主要影響960 nm后的光譜,冠層反射率隨Cw增大逐漸減?。籆m對近紅外及其以外波段的冠層反射率影響較為明顯,冠層反射率隨Cm增大逐漸減??;SL影響760~1 300 nm和1 400~1 850 nm波段的冠層反射率。各輸入?yún)?shù)敏感性大小為LAI>Cab>Cm>SL>N>Cw。
根據(jù)冠層反射率在相應(yīng)波段的變化程度,結(jié)合波段主成分分析,確定多角度PROBA/CHRIS遙感數(shù)據(jù)的b5、b8和b18波段(分別為綠、紅和近紅外波段)參與敏感度計(jì)算,并將取值范圍按照波長劃分為5個(gè)等級。在參數(shù)取值不同的情況下,用各等級的冠層反射率計(jì)算模型中各參數(shù)的敏感度。計(jì)算公式(余金林, 2014)如下:
(12)
式中:Si為敏感度;Ri和Ri+1分別為第i等級和第i+1等級的冠層反射率。
由表5定量分析結(jié)果可知,各參數(shù)敏感性大小為LAI>Cab>Cm>SL>N>Cw,與定性分析結(jié)果一致。
LAI和Cab對冠層反射率影響較大,將其設(shè)為變化輸入?yún)?shù),其余設(shè)為常量輸入?yún)?shù)。LAI取值范圍參照野外實(shí)測LAI及石鋒(2012)和邢著榮(2010);Cab取值范圍參照實(shí)驗(yàn)室測量數(shù)據(jù);Cm和Cw取值源于實(shí)驗(yàn)室測得的大量不同樹種葉片生化組分參數(shù)的加權(quán)平均值;θv、θs和φ由多角度影像頭文件信息獲得;SL、N和ALA取值源于石鋒(2012)、蔡博峰等(2007)。PROSAIL模型的變化和常量輸入?yún)?shù)如表6、7所示。根據(jù)確定的模型輸入?yún)?shù),利用PROSAIL模型模擬5種觀測角度下的冠層反射率,得到多角度冠層反射率模擬數(shù)據(jù)集。
由圖5a(以垂直向下觀測為例,觀測角度0°)可知,PROSPECT模型模擬葉片反射率與實(shí)測葉片反射率的一致性相對較好,模擬值與實(shí)測值之間線性方程的R2為0.992 7,RMSE為0.034 7,說明模型模擬葉片反射率精度較高,可用于進(jìn)一步模擬林地冠層反射率。由圖5b可知,PROSPECT模型模擬葉片反射率與實(shí)測葉片反射率的絕對偏差(丨模擬值-實(shí)測值丨)較低,在紅光波段(550 nm附近)模擬值偏大,在近紅外波段(750 nm后)模擬值偏小,原因可能是模型中一些輸入?yún)?shù)沒有實(shí)測數(shù)據(jù),結(jié)合參考文獻(xiàn)和經(jīng)驗(yàn)值會給模擬結(jié)果帶來一定誤差,另外實(shí)測葉片反射率還受天氣和試驗(yàn)儀器等影響,會有一定偏差(邢著榮, 2010)。
表6 PROSAIL模型變化輸入?yún)?shù)和范圍Tab.6 Variable input parameters and ranges of PROSAIL model
表7 PROSAIL模型常量輸入?yún)?shù)Tab.7 Constant input parameters of PROSAIL model
圖5 PROSPECT模型模擬葉片反射率與實(shí)測葉片反射率Fig. 5 The relationship between the simulated and measured leaf reflectance
通過光譜響應(yīng)函數(shù),將PROSAIL模型模擬的35個(gè)樣方冠層反射率匹配到多角度PROBA/CHRIS遙感數(shù)據(jù)5種觀測角度的18個(gè)波段上,與多角度數(shù)據(jù)大氣校正后提取的樣方地表反射率進(jìn)行精度對比。由表8可知,除了-55°外,其余由PROSAIL模型模擬的冠層反射率精度較高,其中0°的模擬精度最高,RMSE和MAPE 分別為0.047 3和0.376 1; -55°的模擬精度最低,RMSE和MAPE 分別為0.127 2和0.654 7。由此可見,PROSAIL模型模擬的冠層反射率適用于接下來的計(jì)算。不同觀測角度數(shù)據(jù)模擬的冠層反射率精度大小為0°>36°>-36°>55°>-55°。
表8 各角度模擬冠層反射率與影像反射率的精度評價(jià)Tab.8 Accuracies of simulated canopy reflectance and image reflectance at different angles
5種觀測角度下,實(shí)測LAI與模擬冠層反射率計(jì)算得到的植被指數(shù)之間的相關(guān)性分析結(jié)果如表9所示。可以看出,除了-36°和±55°的RVI和NDVI與LAI分別呈顯著相關(guān)(P<0.05)和顯著不相關(guān)外,其余6種植被指數(shù)在5種觀測角度下均與LAI呈極顯著相關(guān)(P<0.01)。除了MSAVI、SAVI和SIPI外,其余3種植被指數(shù)與LAI的相關(guān)系數(shù)均在0.8以上,其中PVI與LAI的相關(guān)系數(shù)最高,除55°外,均達(dá)到0.9以上。
0°和±36°觀測角度下,8種植被指數(shù)與LAI的相關(guān)系數(shù)由大到小依次為PVI、DVI、EVI、MSAVI、SAVI、SIPI、RVI和NDVI?!?5°觀測角度下,8種植被指數(shù)與LAI的相關(guān)系數(shù)由大到小依次為PVI、DVI、EVI、SAVI、MASVI、SIPI、RVI和NDVI。8種植被指數(shù)均在0°觀測角度下與LAI的相關(guān)性最高。
由相關(guān)性分析結(jié)果可知,選取的8種植被指數(shù)均能較好反映林地LAI變化。除了RVI和NDVI外,其余6種植被指數(shù)在5種觀測角度下均與實(shí)測LAI呈極顯著相關(guān),且相關(guān)系數(shù)均在0.5以上,可作為隨機(jī)森林模型的輸入?yún)?shù)。
表9 實(shí)測LAI與不同觀測角度下植被指數(shù)之間的相關(guān)性分析結(jié)果①Tab.9 Correlation analysis results of LAI and vegetation indices at different angles
由于多角度遙感數(shù)據(jù)可以獲取地面目標(biāo)的立體結(jié)構(gòu)信息,植被不同層次對冠層反射率的貢獻(xiàn)比例隨觀測角度改變而變化,因此基于多角度遙感數(shù)據(jù)進(jìn)行參數(shù)反演能夠提高冠層結(jié)構(gòu)參數(shù)的識別能力和反演精度(楊貴軍等, 2011)。為了探究角度變化和不同角度組合對森林LAI反演結(jié)果的影響,本研究利用每種角度模擬的冠層反射率計(jì)算每種角度的植被指數(shù),構(gòu)建單角度和多角度反演數(shù)據(jù)集,建立基于單角度和多角度數(shù)據(jù)的LAI-VI反演模型,角度組合形式如表10所示,共31種組合,其中單角度數(shù)據(jù)集5種、多角度數(shù)據(jù)集26種。
表10 LAI反演模型構(gòu)建的角度組合方式Tab.10 Observation angle combinations of LAI inversion model
基于單角度數(shù)據(jù)的隨機(jī)森林LAI反演模型精度如表11所示。可以看出,在單角度LAI反演模型中,精度最高的為前向觀測角度55°(R2=0.915 7,RMSE=0.235 7,MAPE=0.042 6),該角度與衛(wèi)星過境時(shí)的太陽天頂角(θs=61.88°)最接近,能較好表達(dá)植被的前向反射特點(diǎn)(楊貴軍等, 2011)。相比傳統(tǒng)垂直觀測角度0°,前向觀測角度55°模型的R2提高0.75%,RMSE和MAPE分別降低3.76%和5.12%。單角度LAI反演模型精度由高到低依次為55°、36°、0°、-55°、-36°。
基于多角度數(shù)據(jù)的隨機(jī)森林LAI反演模型精度最高的組合匯總?cè)绫?2所示??梢钥闯?,在多角度LAI反演模型中,精度最高的為0°、36°和55°的3角度組合(R2=0.918 4,RMSE=0.231 9,MAPE=0.041 5),相比單角度55°,R2提高0.29%,RMSE和MAPE分別降低1.61%和2.58%。相比傳統(tǒng)垂直觀測角度0°,3角度組合模型的R2提高1.05%,RMSE和MAPE分別降低5.31%和7.57%。
表11 基于單角度數(shù)據(jù)的隨機(jī)森林LAI反演模型精度Tab.11 Accuracies of random forest LAI inversion model based on single angle data
由表12還可以看出,增加1種觀測角度,模型反演精度有一定提高,特別是從1種角度增加到2種角度時(shí),模型R2相比單角度55°提高0.21%,RMSE和MAPE分別降低1.15%和0.70%;當(dāng)觀測角度從2種增加到3種時(shí),模型反演精度也有所提高,模型R2提高0.09%,RMSE和MAPE分別降低0.47%和1.89%。但隨著角度組合數(shù)進(jìn)一步增加,模型反演精度反而減小,特別是由4種角度增加到5種角度時(shí),分析其原因可能是角度組合數(shù)過多會造成光譜信息冗余,且由于單角度-36°和-55°反演LAI時(shí)精度較低,因此包含這2種角度的模型精度會有所降低。由此可知,一方面,增加觀測角度可提供更多植被冠層結(jié)構(gòu)信息,LAI反演精度隨觀測角度增加而增加,但另一方面,觀測角度過多會使像元空間重采樣、葉片陰影和土壤陰影等問題帶來更多不確定性,LAI反演精度反而下降。
表12 基于多角度數(shù)據(jù)的隨機(jī)森林反演模型精度Tab.12 Accuracies of random forest LAI inversion model based on multi-angle data
5種觀測角度下,PVI與LAI的相關(guān)性均最高。為了進(jìn)一步證明隨機(jī)森林反演模型在區(qū)域尺度上反演森林LAI的優(yōu)越性,本研究利用單角度和多角度數(shù)據(jù)分別構(gòu)建基于像元尺度的LAI-PVI回歸模型,包括指數(shù)、線性、對數(shù)和冪函數(shù)模型,結(jié)果發(fā)現(xiàn),指數(shù)模型的反演精度最高(表13)。相比非線性回歸模型,單角度隨機(jī)森林LAI反演模型的R2提高0.70%,RMSE和MAPE分別降低15.40%和11.98%; 多角度隨機(jī)森林LAI反演模型的R2提高0.79%,RMSE和MAPE分別降低6.72%和9.19%。由此可知,無論是單角度還是多角度數(shù)據(jù),隨機(jī)森林LAI反演模型精度均高于非線性回歸模型,表明相比傳統(tǒng)回歸模型,隨機(jī)森林模型能夠明顯提高LAI反演精度,適用于區(qū)域植被LAI反演。
表13 基于單角度和多角度數(shù)據(jù)的非線性回歸模型反演精度最高的組合匯總Tab.13 Summary with the highest accuracies of non-linear regression models based on single and multi-angle data
綜上分析可知,基于多角度PROBA/CHRIS遙感數(shù)據(jù)的隨機(jī)森林LAI反演模型最佳角度組合為0°、36°和55°的3角度組合。鑒于多角度遙感影像的公共區(qū)域只有紫金山西部,因此本研究只對該區(qū)域進(jìn)行LAI反演,得到紫金山西部區(qū)域LAI介于0.44~6.70之間,林地LAI均值為3.04,紫金山西部林地LAI整體上呈北部和南部高、中間低的空間分布格局(圖6)。
紫金山西部大部分林地的LAI高于3.0,而大部分城區(qū)的LAI低于2.0。林地北部和南部的LAI相對較高,結(jié)合野外調(diào)查數(shù)據(jù)和小班資源圖發(fā)現(xiàn),紫金山林分類型以闊葉林為主,其次為針葉林和針闊混交林,且針葉林的LAI大部分高于3.5,林地垂直結(jié)構(gòu)多為喬灌草; 而中間部分林地的LAI小于3.0,原因可能是該區(qū)域植被較稀疏,林分結(jié)構(gòu)單一,林地垂直結(jié)構(gòu)多為喬草。由于研究區(qū)植被類型復(fù)雜,多角度PROBA/CHRIS遙感數(shù)據(jù)的覆蓋區(qū)域較小,且建模數(shù)據(jù)比影像數(shù)據(jù)延后2年,加上影像范圍內(nèi)缺少充足有效的實(shí)測植被冠層反射率數(shù)據(jù),因此將模型移植到影像上的反演結(jié)果會存在一定偏差。
為進(jìn)一步考察基于PROSAIL模型和多角度遙感數(shù)據(jù)的隨機(jī)森林LAI反演模型在紫金山西部林地的應(yīng)用精度,本研究利用紫金山區(qū)域內(nèi)20個(gè)樣方的實(shí)測LAI進(jìn)行驗(yàn)證。由圖7可知,LAI實(shí)測值與反演值的散點(diǎn)圖較好地分布在1∶1線附近,RMSE和MAPE分別為0.190 3和0.026 0,表明基于多角度遙感數(shù)據(jù)的隨機(jī)森林模型反演紫金山西部森林LAI是可行的,反演精度較高。傳統(tǒng)垂直觀測只考慮了林地水平覆蓋,而傾斜觀測與多種觀測角度組合可以捕捉到森林冠層結(jié)構(gòu)和林地垂直結(jié)構(gòu),能夠顯著改善傳統(tǒng)垂直觀測反演LAI精度較低的問題。
圖6 基于PROBA/CHRIS遙感數(shù)據(jù)的0°、36°和55° 融合反演得到的LAI分布Fig. 6 The LAI distribution obtained by using 0°, 36° and 55° based on the PROBA/CHRIS data
圖7 LAI反演值與實(shí)測值的關(guān)系Fig. 7 The scatter plot between the measured LAI and estimated LAI
LAI可較好反映森林生長狀況,是評價(jià)森林健康的良好指標(biāo)(楊慧喬等, 2014),其不僅影響森林的碳吸收,而且能夠通過改變感熱與潛熱通量比例直接影響區(qū)域乃至全球氣候(柳藝博等, 2012),因此準(zhǔn)確估算森林LAI對研究森林生態(tài)系統(tǒng)及全球碳循環(huán)具有重要意義。研究表明,LAI與冠層反射率具有較強(qiáng)相關(guān)性(李映雪等, 2006)。目前,不少學(xué)者采用波段比值構(gòu)建植被指數(shù)來反演林地LAI,單一植被指數(shù)包含的信息容易出現(xiàn)飽和現(xiàn)象(宋開山等, 2006),而植被指數(shù)過多也可能產(chǎn)生過擬合現(xiàn)象(楊福芹等, 2016)。隨機(jī)森林模型對數(shù)據(jù)集的適應(yīng)力較強(qiáng),具有很好的抗噪性能和擬合能力(姚雄等, 2017),但不少學(xué)者利用隨機(jī)森林進(jìn)行參數(shù)反演時(shí),直接將各種植被指數(shù)作為模型輸入?yún)?shù),沒有對輸入?yún)?shù)進(jìn)行篩選(韓兆迎等, 2016; 李粉玲等, 2015)。由于植被指數(shù)具有抗飽和、消除或降低土壤背景影響等能力,因此分析不同植被指數(shù)與LAI的相關(guān)性,選擇最佳植被指數(shù)作為輸入?yún)?shù)尤為重要。
PROSAIL模型整合葉片光學(xué)特性模型PROSPECT和冠層反射率模型SAIL,考慮土壤非朗伯特性、葉片鏡面反射、植被冠層熱點(diǎn)效應(yīng)和葉傾角分布情況,能夠很好描述均勻植被冠層的反射特性;但PROSAIL模型模擬的光譜反射率只代表無空間尺度大小的“點(diǎn)”,且多角度PROBA/CHRIS遙感數(shù)據(jù)不同觀測角度對應(yīng)的地面視場范圍不一致,從而導(dǎo)致像元分辨率存在一定差異(楊貴軍等, 2011)。本研究中PROSAIL模型的一些輸入?yún)?shù)沒有實(shí)測數(shù)據(jù),結(jié)合參考文獻(xiàn)和經(jīng)驗(yàn)值會給模型模擬結(jié)果帶來一定誤差。此外,PROSAIL模型反演過程中可能受參數(shù)敏感性帶來的誤差影響,本研究只設(shè)置LAI為最敏感參數(shù),其他參數(shù)設(shè)置為定值,也會影響到LAI反演精度。
由于多角度PROBA/CHRIS遙感數(shù)據(jù)容易受傳感器和天氣影響,數(shù)據(jù)獲取困難,且觀測角度重合區(qū)域較小,因此后續(xù)對多角度遙感數(shù)據(jù)反演LAI的研究可以嘗試?yán)闷渌子讷@取且具有多種觀測角度的影像數(shù)據(jù),從而進(jìn)一步擴(kuò)大研究范圍,建立反演精度高、適用于更大尺度的LAI遙感反演模型。
1) PROSAIL模型中各輸入?yún)?shù)敏感性大小為LAI>Cab>Cm>SL>N>Cw,模擬的冠層反射率精度大小為0°>36°>-36°>55°>-55°。
2) 在選取的8種植被指數(shù)中,5種觀測角度下PVI與LAI的相關(guān)性最高,相關(guān)系數(shù)均達(dá)到0.9以上。除了RVI和NDVI外,其余6種植被指數(shù)在5種觀測角度下均與實(shí)測LAI呈極顯著相關(guān),且相關(guān)系數(shù)均在0.5以上,可作為隨機(jī)森林模型的輸入?yún)?shù)。
3) 單角度LAI反演模型中,精度最高的為前向觀測角度55°(R2=0.915 7,RMSE=0.235 7,MAPE=0.042 6),該角度與衛(wèi)星過境時(shí)的太陽天頂角最接近,能較好表達(dá)植被的前向反射特點(diǎn)。相比傳統(tǒng)垂直觀測角度0°,前向觀測角度55°模型的R2提高0.75%,RMSE和MAPE分別降低3.76%和5.12%。
4) 多角度LAI反演模型中,精度最高的為0°、36°和55°的3角度組合(R2=0.918 4,RMSE=0.231 9,MAPE=0.041 5),相比單角度55°,R2提高0.29%,RMSE和MAPE分別降低1.61%和2.58%。然而角度組合數(shù)過多會帶來光譜信息冗余、葉片和土壤陰影等問題。相比傳統(tǒng)垂直觀測角度0°,3角度組合模型的R2提高1.05%,RMSE和MAPE分別降低5.31%和7.57%。
5) 相比非線性回歸模型,單角度隨機(jī)森林LAI反演模型的R2提高0.70%,RMSE和MAPE分別降低15.40%和11.98%; 多角度隨機(jī)森林LAI反演模型的R2提高0.79%,RMSE和MAPE分別降低6.72%和9.19%。
6) 紫金山西部區(qū)域LAI介于0.44~6.70之間,林地LAI均值為3.04,林地LAI整體上呈北部和南部高、中間低的空間分布格局。