落莉莉,常慶瑞,武旭梅,楊 景,李粉玲,王 琦
(西北農(nóng)林科技大學(xué)資源環(huán)境學(xué)院,陜西 楊凌 712100)
高等植物葉片光合色素包括葉綠素(葉綠素a、葉綠素b)和類胡蘿卜素。這些色素不僅可以吸收、傳遞和轉(zhuǎn)換光能,還可以在光能過剩時(shí)保護(hù)光系統(tǒng)[1]。對(duì)植物葉片光合色素含量進(jìn)行遙感估算,有助于合理指導(dǎo)田間施肥和產(chǎn)量預(yù)測(cè)。不同作物類型、不同色素含量的植物葉片對(duì)光的反射和吸收情況不同。高光譜遙感因其波段窄、分辨率高的優(yōu)勢(shì),可以對(duì)植物光譜反射率的微弱差異進(jìn)行定量分析[2]。所以,借助高光譜技術(shù)對(duì)植物光合色素含量進(jìn)行遙感估算具有一定理論價(jià)值[3-4]。
目前,有關(guān)植物葉片光合色素含量高光譜估算的方法主要包括單變量回歸[5-6]、多元逐步回歸[7-8]和基于機(jī)器學(xué)習(xí)算法的回歸分析[9-10]等。其中,隨機(jī)森林方法(Random forest,RF)作為一種新型的機(jī)器學(xué)習(xí)算法,它通過對(duì)原始樣本進(jìn)行有放回抽樣構(gòu)建獨(dú)立決策樹進(jìn)行分類,有效克服了單棵決策樹泛化能力弱的缺點(diǎn),具有良好的抗噪性能[11],在小麥、水稻、蘋果等植物的長(zhǎng)勢(shì)監(jiān)測(cè)研究中得到廣泛應(yīng)用[12-16]。然而,該方法在植物光合色素含量特別是針對(duì)夏玉米葉片光合色素遙感定量估算方面的研究仍較少。因此,本文旨在探究一種夏玉米葉片光合色素含量遙感估算的方法與模型,以實(shí)現(xiàn)夏玉米葉片光合色素含量的快速、無損檢測(cè),為田間施肥指導(dǎo)和產(chǎn)量預(yù)測(cè)提供參考依據(jù)。
試驗(yàn)于2016年7—10月在陜西省楊凌示范區(qū)西北農(nóng)林科技大學(xué)教學(xué)試驗(yàn)農(nóng)場(chǎng)(34.30°N,108.07°E)進(jìn)行。供試玉米品種為大豐26號(hào),分別進(jìn)行氮、磷5個(gè)施肥水平處理:不施肥、50%標(biāo)準(zhǔn)施肥量、標(biāo)準(zhǔn)施肥量、150%標(biāo)準(zhǔn)施肥量、200%標(biāo)準(zhǔn)施肥量。其中,氮肥和磷肥標(biāo)準(zhǔn)施肥量分別為純氮90 kg·hm-2和P2O560 kg·hm-2。每個(gè)施肥水平設(shè)置2個(gè)重復(fù),共20個(gè)試驗(yàn)小區(qū),小區(qū)面積為22 m2(4 m5.5 m)。所有肥料在播種時(shí)一次性施入,其它生產(chǎn)管理過程與當(dāng)?shù)爻R?guī)生產(chǎn)方式相同。選擇玉米關(guān)鍵生育期:拔節(jié)期、抽雄期、灌漿期和乳熟期,分別進(jìn)行田間觀測(cè)和樣品采集。每個(gè)小區(qū)選取樣本玉米2株,摘取其最上層三片成熟葉片裝入塑封袋,帶回實(shí)驗(yàn)室進(jìn)行葉片光譜和光合色素含量同步測(cè)定。
葉片光譜反射率采用美國(guó)SVC HR-1024I型光譜輻射儀測(cè)定。測(cè)定前先進(jìn)行白板校正,再將葉片放入專用的手持光譜探測(cè)器,在葉子中間部位隨機(jī)選取5個(gè)位置,每個(gè)位置測(cè)定2條光譜曲線,剔除異常曲線后取均值作為該樣點(diǎn)玉米葉片的最終反射光譜。4個(gè)生育期共獲得160條光譜曲線,從中隨機(jī)選取107條用于回歸模型構(gòu)建,剩余53條用于模型精度檢驗(yàn)。同時(shí),避開光譜測(cè)定位置和葉脈位置,從葉片中部稱取質(zhì)量約為0.2 g的葉片樣品,用濃度為95%的乙醇完全浸泡后采用分光光度計(jì)法進(jìn)行光合色素含量測(cè)定。
一階微分光譜能夠有效削弱或消除土壤、水等背景因素對(duì)反射光譜的影響,提高有用光譜信息的提取。因此,本文對(duì)原始光譜進(jìn)行一階微分計(jì)算,具體公式如下:
式中,λi為第i波段的波長(zhǎng),R(λi)為波長(zhǎng)λi對(duì)應(yīng)的原始光譜反射率,R′(λi)為波長(zhǎng)λi對(duì)應(yīng)的一階微分光譜。
光譜指數(shù)可以更全面地反映植物的生長(zhǎng)信息[17],紅邊參數(shù)與植物葉綠素含量及其濃度變化密切相關(guān)[18-19]。本文根據(jù)前人研究結(jié)果選取了與葉綠素 a、葉綠素 b、類胡蘿卜素、總色素含量相關(guān)性較強(qiáng)的光譜指數(shù)和紅邊參數(shù)(統(tǒng)稱為光譜參數(shù),見表1)。由表1可知,所選光譜參數(shù)與光合色素具有良好的相關(guān)性,可用于光合色素含量估算。
在SVC HR-1024i軟件中求取樣點(diǎn)光譜曲線反射率均值,并對(duì)反射光譜進(jìn)行重采樣處理(采樣間隔為1.0 nm)。在Matlab2016b軟件中進(jìn)行五點(diǎn)移動(dòng)平均平滑(平滑次數(shù)設(shè)為5),有效去除高頻噪聲影響[26]。用樣本實(shí)測(cè)值和預(yù)測(cè)值線性擬合的決定系數(shù)(R2)、均方根誤差(RMSE)和相對(duì)誤差(RE)進(jìn)行模型精度檢驗(yàn);根據(jù)R2最大、RMSE和RE最小原則確定最佳估算模型。
將樣本玉米葉片按總色素含量等間隔分為3組:<1.45、1.45~ 2.15 mg·g-1和>2.15 mg·g-1。各組葉片的反射光譜曲線見圖1。
由圖1看出,當(dāng)葉片總色素含量不同時(shí),其反射光譜差異主要體現(xiàn)在可見光和近紅外波段。(1)可見光范圍(380~760 nm)內(nèi),在綠波段550 nm附近有一小的反射峰,兩側(cè)的紅、藍(lán)波段均出現(xiàn)吸收谷;隨著總色素含量的增加,綠波段的反射峰愈加明顯。這是因?yàn)樵摬ǘ畏秶鷥?nèi),光譜反射率主要受色素含量的影響,色素含量越高,葉片對(duì)綠光的吸收越弱、反射越強(qiáng)。(2)近紅外范圍(760~1 000 nm)內(nèi),葉片整體反射率較高;光譜反射率隨總色素含量的增加變化不大。這是因?yàn)樵摬ǘ畏秶鷥?nèi),光譜反射率主要受葉片內(nèi)部結(jié)構(gòu)和水分含量的影響,受色素含量的影響相對(duì)較小。
表1 光譜參數(shù)選取及其與葉片光合色素含量的相關(guān)性分析Table 1 Spectral parameters selected and the correlation analysis of photosynthetic pigment
注:R為反射率,其下標(biāo)數(shù)字為該反射率對(duì)應(yīng)的波段(nm);λ為波長(zhǎng);R(λ)為波長(zhǎng)λ對(duì)應(yīng)的反射率;R′(λ)為R(λ)的一階微分;RDr為Dr對(duì)應(yīng)反射率。**和*分別表示在0.01和0.05水平上顯著相關(guān),下同。
Note:Ris the spectral reflectance, and it’s subscript number is the band value(nm) of the reflectivity;λis wavelength;R(λ) is the reflectivity ofλ; andR′(λ) is the first derivative ofR(λ);RDris the reflectivity data ofDr. ** and * indicate the significant correlation at the level of 0.01 and 0.05, respectively,the same below.
圖1 不同光合色素含量水平下的玉米葉片光譜特征Fig.1 The spectral characteristics of maize leaves having different photosynthetic pigments
在680~760 nm波段范圍內(nèi),光譜反射率急劇上升,形成紅邊。對(duì)原始光譜求一階微分得到紅邊特征,見圖2??梢钥闯觯衩椎募t邊特征存在明顯的“多峰”現(xiàn)象,其峰值主要集中在700 nm附近。隨著總色素含量的增加,紅邊位置由701 nm移動(dòng)到704 nm和706 nm,表現(xiàn)出明顯的“紅移”現(xiàn)象,紅邊振幅和紅邊面積均增大。這是因?yàn)榭偵睾吭礁?,光合作用越?qiáng),葉片對(duì)長(zhǎng)波光子的消耗也就越多[27]。
圖2不同光合色素含量水平下的玉米葉片紅邊特征Fig.2 Red side characteristics of maize leaves having different photosynthetic pigments
根據(jù)表1,分別選取與葉綠素a、葉綠素b、類胡蘿卜素和總色素含量相關(guān)性較好的光譜參數(shù)PRVI(r=0.78)、PSSRc(r=-0.36)、PSSRc(r= 0.71)和Rch(r=-0.72),對(duì)相應(yīng)光合色素進(jìn)行單變量回歸分析,結(jié)果如表2。
單變量模型中,模擬效果最好的均為多項(xiàng)式模型,建模R2介于0.29~0.62之間,檢驗(yàn)R2介于0.22~0.66之間。其中,模擬效果最好的為類胡蘿卜素,葉綠素a和總色素含量次之,葉綠素b的模擬效果最差,但各模型的建模和驗(yàn)證R2均較低、RMSE較大,模擬效果較差。
對(duì)表1列出的所有光譜參數(shù)與光合色素含量進(jìn)行多元逐步回歸分析(見表3)。模型的建模和檢驗(yàn)R2介于0.57~ 0.79之間,與傳統(tǒng)回歸方法構(gòu)建的單變量模型相比,各模型的精度均有所提高,提高幅度最大的為葉綠素b,總色素和葉綠素a次之,類胡蘿卜素的精度提高較小。可見,單獨(dú)的光譜參數(shù)并不能完整地反映植物的光譜信息,多元逐步回歸方法通過對(duì)多個(gè)光譜參數(shù)進(jìn)行線性組合,有效提高了模擬精度。
為了進(jìn)一步驗(yàn)證隨機(jī)森林模型的預(yù)測(cè)精度,分別對(duì)葉綠素a、葉綠素b、類胡蘿卜素和總色素含量進(jìn)行隨機(jī)森林回歸分析。決策樹變量確定為1 000,節(jié)點(diǎn)分割變量設(shè)置為3。
從光合色素的RF模型(表4)觀察發(fā)現(xiàn),所有模型的建模R2均超過了0.9,檢驗(yàn)R2介于0.70 ~ 0.75之間,各模型的模擬效果均較好且模擬精度相差不大。與光合色素的單變量和多元逐步回歸模型相比,RF模型精度均有所提高。模擬效果最好的為葉綠素a,類胡蘿卜素和葉綠素b次之,總色素含量的模擬效果稍差。綜合來看,基于隨機(jī)森林建立的光合色素模型建模和檢驗(yàn)R2均較高,且均達(dá)到0.01顯著水平,RMSE和RE較小,模擬效果較好。
表2 基于光譜參數(shù)的葉片光合色素含量單變量回歸模型
表3 基于光譜參數(shù)的葉片光合色素含量多元逐步回歸模型
表4 玉米葉片光合色素RF回歸模型
分別對(duì)各色素的檢驗(yàn)樣本實(shí)測(cè)值與RF模型預(yù)測(cè)值進(jìn)行線性擬合(圖3)??梢钥闯?,當(dāng)色素含量偏低時(shí),隨機(jī)森林模型預(yù)測(cè)值較實(shí)際值偏高;當(dāng)色素含量偏高時(shí),隨機(jī)森林模型預(yù)測(cè)值較實(shí)測(cè)值偏低;只有當(dāng)葉綠素a含量處于1.3 mg·g-1、葉綠素b含量處于0.57 mg·g-1、類胡蘿卜素含量處于0.13 mg·g-1和總色素含量處于1.8 mg·g-1附近時(shí),隨機(jī)森林預(yù)測(cè)值和實(shí)際值相接近,預(yù)測(cè)結(jié)果較準(zhǔn)確。這是由于當(dāng)色素含量過低時(shí),反射光譜對(duì)微小的色素差異不再敏感;色素含量過高時(shí),吸收光譜又容易飽和;只有當(dāng)色素含量處于一定范圍內(nèi),反射光譜才會(huì)對(duì)光合色素含量較敏感,能夠準(zhǔn)確反映光合色素的含量。
圖3 基于RF的光合色素實(shí)測(cè)值與預(yù)測(cè)值比較Fig.3 Measured photosynthetic pigments value versus predicted value based on random forest regression
植物的光合色素是表征其光合作用強(qiáng)度和潛在生產(chǎn)力的重要參數(shù)[28-29]。對(duì)不同色素分開研究有助于了解各色素的實(shí)際含量,更準(zhǔn)確地掌握植物的營(yíng)養(yǎng)狀況[30]。高光譜技術(shù)能夠快速、實(shí)時(shí)、無損地獲取植物的反射光譜信息,為植物光合色素含量定量估算提供有效可行的方法。本研究分別構(gòu)建了基于單變量、多元逐步回歸和隨機(jī)森林方法的遙感模型,得到的模擬效果差異明顯。
(1)在單變量線性和非線性模型中,模擬效果最好的均為多項(xiàng)式模型,反映了光譜反射率和色素含量之間并非呈現(xiàn)簡(jiǎn)單的線性關(guān)系。所有模型的建模決定系數(shù)均達(dá)到0.01顯著水平,檢驗(yàn)決定系數(shù)除葉綠素b以外,也都達(dá)到0.01顯著水平,但各模型的相對(duì)誤差均較大,最大達(dá)到46.4%。
(2)多元逐步回歸模型較單變量模型精度有所提高,提高幅度介于4.2%~40.90%之間。建模精度最高的是葉綠素b(R2=0.79),檢驗(yàn)精度最高的是葉綠素a(R2=0.68)。用敏感波段構(gòu)建的植被指數(shù)進(jìn)行光合色素模擬能夠有效消除環(huán)境噪聲的影響,但仍存在單一指數(shù)包含信息有限且容易出現(xiàn)飽和等缺點(diǎn)[31-33]。
(3)輸入變量相同時(shí),基于隨機(jī)森林方法的估算模型較多元逐步回歸模型精度明顯提高;其中,葉綠素a的擬合效果最好,建模R2為0.93,檢驗(yàn)R2為0.74,RMSE和RE均較小,其他色素的隨機(jī)森林模型擬合效果也較好。這是因?yàn)殡S機(jī)森林算法中,產(chǎn)生決策樹的訓(xùn)練樣本和節(jié)點(diǎn)分裂時(shí)的最優(yōu)屬性都是隨機(jī)的,可以有效提高分類精度[34]。此外,隨機(jī)森林算法參數(shù)單一且不需要反復(fù)調(diào)參,更加增加了模型的穩(wěn)定性和適用性。
本文以西北區(qū)夏玉米為研究對(duì)象,用敏感波段構(gòu)建光譜指數(shù),對(duì)夏玉米葉片光合色素含量進(jìn)行基于單變量、多元逐步回歸和隨機(jī)森林算法的遙感模型構(gòu)建,得到以下結(jié)論:
(1)不同總色素含量的玉米葉片,其反射光譜特征基本一致,隨著總色素含量的增加,可見光范圍內(nèi)的光譜反射率逐漸增大,紅邊位置“紅移”,近紅外范圍的光譜反射率變化不大。
(2)單變量模型中,各色素的多項(xiàng)式模型擬合效果均優(yōu)于線性、指數(shù)、對(duì)數(shù)和冪函數(shù)模型,類胡蘿卜素的多項(xiàng)式模型擬合精度最高。
(3)多元逐步回歸方法盡管克服了變量單一的缺點(diǎn),但由于所構(gòu)建的模型仍然是線性的,在很大程度上限制了模型的精度。
(4)隨機(jī)森林模型較單變量模型和多元逐步回歸模型精度有顯著提高,在夏玉米葉片光合色素含量研究中具有顯著優(yōu)越性,有較強(qiáng)的農(nóng)業(yè)推廣應(yīng)用價(jià)值。