郭 松,常慶瑞,崔小濤,張佑銘,陳 倩,蔣丹垚,落莉莉
(西北農(nóng)林科技大學(xué)資源環(huán)境學(xué)院,陜西 楊凌 712100)
葉綠素含量為植被生長(zhǎng)和營(yíng)養(yǎng)脅迫等研究常用指示量,可反映植被初級(jí)生產(chǎn)力和生長(zhǎng)狀態(tài)[1-2]。分光光度法、熒光分析法等傳統(tǒng)葉綠素含量檢測(cè)方法不僅流程復(fù)雜、誤差大、耗時(shí)長(zhǎng),且對(duì)植被本身?yè)p害較大,不利于大樣本下葉綠素含量監(jiān)測(cè)[3]。近年來(lái),高光譜遙感技術(shù)以其數(shù)據(jù)蘊(yùn)含較高維度信息的特點(diǎn)被應(yīng)用到植被葉綠素含量估測(cè)研究中,為簡(jiǎn)便迅速、大范圍測(cè)量植被葉綠素含量提供技術(shù)支持[4]。
目前,國(guó)內(nèi)外在高光譜估算植被葉綠素方面開(kāi)展大量研究,Bannari等使用Hyperion EO-1傳感器獲取地面和實(shí)驗(yàn)室高光譜數(shù)據(jù),構(gòu)建多個(gè)光譜葉綠素植被指數(shù)反演冠層尺度上小麥葉綠素a含量,模型決定系數(shù)達(dá)0.69[5];Ali等發(fā)現(xiàn)基于高光譜反射率提取的紅邊位置(REP)可準(zhǔn)確估計(jì)植被葉綠素含量,通過(guò)紅邊位置建立的模型決定系數(shù)為0.90~0.93[6];Yamashita等利用機(jī)器學(xué)習(xí)算法和綠茶葉綠素高光譜敏感波段建立可較好的葉綠素反演模型,預(yù)測(cè)偏差1.4~2.0[7];陳瀾等創(chuàng)建多個(gè)關(guān)中地區(qū)獼猴桃PCA-RF模型,決定系數(shù)最高達(dá)0.98[8];袁小康等對(duì)比不同灌溉條件下夏玉米高光譜特征變化,發(fā)現(xiàn)植被指數(shù)與葉綠素含量相關(guān)性較高,相關(guān)系數(shù)最小絕對(duì)值為0.812[9];陳春玲等為準(zhǔn)確檢測(cè)玉米葉片葉綠素含量,采用蟻群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型,結(jié)果表明,優(yōu)化后神經(jīng)網(wǎng)絡(luò)模型建模和驗(yàn)證決定系數(shù)較未優(yōu)化時(shí)分別提高0.073與0.078[10]。綜上,利用高光譜遙感技術(shù)檢測(cè)作物葉綠素含量的研究較成熟,但光譜變換可對(duì)光譜空間坐標(biāo)作數(shù)學(xué)轉(zhuǎn)換,突出原有光譜特點(diǎn),同時(shí)消除光譜噪聲[11],大部分研究依賴于作物原始光譜構(gòu)建模型,較少探索光譜變換后的建模效果;連續(xù)投影算法為一種以矢量空間共線性最小為原則篩選變量的方法[12],目前大多基于主成分分析或偏最小二乘實(shí)現(xiàn)高光譜數(shù)據(jù)降維,而使用連續(xù)投影算法的報(bào)道較少。
本研究以陜西省關(guān)中地區(qū)玉米為研究對(duì)象,通過(guò)玉米原始光譜及其變換光譜,構(gòu)建基于特征波段和植被指數(shù)的一元回歸模型、基于連續(xù)投影算法的多元線性回歸模型和支持向量回歸模型,探究玉米葉綠素含量最優(yōu)估算模型,旨在為實(shí)時(shí)獲取關(guān)中地區(qū)玉米生長(zhǎng)信息提供技術(shù)和理論支持。
研究區(qū)位于陜西省咸陽(yáng)市乾縣齊南村(108°07′04″E,34°38′32″N)(見(jiàn)圖1),地處關(guān)中平原與渭北旱塬過(guò)渡地帶,地貌類型為黃土臺(tái)塬,平均海拔1 000 m;屬暖溫帶半干旱大陸性季風(fēng)氣候,年均氣溫10.8℃,年均降水量560~600 mm,多集中在6~8月;試驗(yàn)區(qū)內(nèi)土壤類型為紅油土,持水保肥,適宜耕作;作物一年一熟,主要為小麥和玉米。試驗(yàn)于2020年6月1日開(kāi)展,供試作物為“陜單2001”玉米,共設(shè)30個(gè)小區(qū)和1個(gè)大田(空白對(duì)照),小區(qū)面積72 m2(9 m×8 m),大田面積286 m2(11 m×26 m),施用氮、磷、鉀3種肥料,每種肥料分5個(gè)施肥水平,共15個(gè)處理,每個(gè)處理重復(fù)兩次,其中氮肥處理純N施用量分別為:0、60、120、180、240 kg·hm-2;磷肥處理P2O5施用量分別為0、40、80、120、150 kg·hm-2;鉀肥處理K2O施用量分別為0、30、60、90、120 kg·hm-2。在播種前一次性施入所有肥料,不追肥,與當(dāng)?shù)靥镩g管理一致。試驗(yàn)樣品采集于玉米抽雄期,每個(gè)小區(qū)與大田設(shè)兩個(gè)采樣點(diǎn),每個(gè)采樣點(diǎn)采集3片生長(zhǎng)狀態(tài)良好的玉米冠層葉片,葉片裝入塑封袋并排盡空氣,迅速保置于冰袋恒溫箱,當(dāng)天在室內(nèi)測(cè)定葉片葉綠素含量與高光譜信息。
圖1 研究區(qū)玉米試驗(yàn)田位置Fig.1 Location of maize test field in the study area
1.2.1 葉片SPAD值測(cè)定
玉米葉片葉綠素含量測(cè)定使用SPAD-502(柯尼卡美可達(dá)公司,日本)手持式葉綠素儀測(cè)定,用SPAD值表示[13]。測(cè)量時(shí)用紙巾輕輕擦凈葉片表面灰塵并按順序放置,在每片葉子尖、中、基3個(gè)部位分別測(cè)定4個(gè)SPAD值,測(cè)量時(shí)避開(kāi)葉脈,每個(gè)樣點(diǎn)3片葉子共獲取36個(gè)SPAD值,取其平均值作為該樣點(diǎn)最終SPAD值。
1.2.2 葉片光譜反射率測(cè)定
采用SVC HR-1024i(Spectrum Vista公司,美國(guó))便攜式地物光譜儀測(cè)定葉片光譜反射率。該儀器使用內(nèi)置鎢燈作為光源,光譜范圍為350~2 500 nm,光譜分辨率在350~1 000、1 000~1 850、1 850~2 500 nm分別為3.5、9.5及6.5 nm。為確保數(shù)據(jù)科學(xué)可靠,自測(cè)量開(kāi)始到結(jié)束,每0.5 h作一次白板校正。每片葉子在葉尖、葉中和葉基3個(gè)部位(與SPAD值測(cè)定位置相對(duì)應(yīng))分別測(cè)定兩條光譜曲線,每個(gè)樣點(diǎn)三3片葉子共獲取18條光譜曲線。
對(duì)抽雄期玉米各樣點(diǎn)SPAD值排序并按照3:1比例分層抽樣,得到建模樣本47個(gè),預(yù)測(cè)樣本15個(gè)。健康植被光譜響應(yīng)波段主要集中在可見(jiàn)光-近紅外[14],因此,將葉片光譜曲線重采樣至400~1 000 nm,光譜間隔1 nm;每個(gè)樣點(diǎn)獲取18條玉米葉片光譜曲線,取平均作為該樣點(diǎn)代表光譜曲線,通過(guò)Savitzky-Golay二階平滑以減小光譜獲取過(guò)程中產(chǎn)生的隨機(jī)噪聲;最后對(duì)代表光譜開(kāi)展4種變換,分別為普通一階導(dǎo)數(shù)變換[15]、間隙一階導(dǎo)數(shù)變換[16]、連續(xù)統(tǒng)去除變換[17]和開(kāi)平方根變換[18]。
選取4種物理意義較為明確的植被指數(shù)(見(jiàn)表1)及各類型光譜特征波段(與SPAD值相關(guān)性最高波段)作為單因素模型建模參數(shù),單因素模型包括指數(shù)、對(duì)數(shù)和冪函數(shù)回歸模型;通過(guò)連續(xù)投影算法(Successive projections algorithm,SPA)獲取各類型光譜多因素模型建模參數(shù),分別建立基于SPA的多元線性回歸(Multiple linear regression,MLR)模型和支持向量回歸(Support vector regression,SVR)模型。比較各模型的反演精度,篩選出最佳反演模型。模型建立在MATLAB 2016a中實(shí)現(xiàn)。
表1 植被指數(shù)計(jì)算方式Table 1 Calculation method of vegetation index
采用決定系數(shù)(R2)、均方根誤差(RMSE)及平均相對(duì)誤差(MRE)3個(gè)指標(biāo)評(píng)價(jià)模型精度,決定系數(shù)越接近1,均方根誤差和相對(duì)誤差越小,評(píng)價(jià)模型質(zhì)量越優(yōu)。RMSE與MRE使用公式如下。
選取樣本中SPAD最小值、最大值及中位數(shù),分析不同SPAD值下玉米光譜變化特征,如圖2所示。
圖2 不同SPAD值玉米高光譜特征Fig.2 Hyperspectrum characteristics of maize with different SPAD values
不同SPAD值含量樣本光譜曲線變化趨勢(shì)一致,玉米葉綠素吸收藍(lán)光與紅光,反射綠光的特性,導(dǎo)致其在可見(jiàn)光波段400~520 nm及600~750 nm處分別形成兩個(gè)吸收谷,其最低反射率分別為0.09和0.07,在520~600 nm形成一個(gè)弱反射峰,最高反射率為0.22;在680~780 nm處由葉綠素紅光吸收過(guò)渡到葉片細(xì)胞結(jié)構(gòu)對(duì)近紅外的強(qiáng)烈散射、反射,產(chǎn)生“紅邊”;進(jìn)而在780~1 000 nm處形成近紅外高反射平臺(tái),該平臺(tái)各波段反射率均在0.45以上。隨葉綠素含量增加,葉片對(duì)光的利用效率增加,在400~680 nm處反射率隨SPAD值上升而下降,“紅邊”向長(zhǎng)波方向移動(dòng);同時(shí)葉綠素增加標(biāo)志葉片成熟度越高、內(nèi)部細(xì)胞結(jié)構(gòu)越穩(wěn)定,因此高反射平臺(tái)會(huì)隨SPAD值增加而上升。
2.2.1 光譜反射率與SPAD值相關(guān)性
各類型光譜反射率與SPAD值相關(guān)性如圖3所示。由此可知,原始光譜與開(kāi)平方根光譜相關(guān)性曲線變化趨勢(shì)一致,二者通過(guò)0.01相關(guān)性檢驗(yàn)的敏感波段數(shù)量分別為298、303個(gè),均集中分布在451~745 nm,相應(yīng)特征波段位于709、708 nm,相關(guān)系數(shù)分別為-0.852和-0.853;普通一階導(dǎo)數(shù)與間隙一階導(dǎo)數(shù)相關(guān)性曲線走勢(shì)也同樣類似,二者敏感波段數(shù)量分別為335和358個(gè),均集中在477~550、552~670、670~713及717~861 nm,特征波段各自位于756和764 nm,二者相關(guān)系數(shù)分別為0.906與0.907;450~758、765~810、842~896 nm為連續(xù)統(tǒng)去除光譜的敏感波段區(qū)域,其敏感波段數(shù)量達(dá)400個(gè),特征波段在746 nm處,相關(guān)系數(shù)為-0.893。在與SPAD值相關(guān)性方面,各變換光譜敏感波段數(shù)量多于原始光譜,且不同變換光譜特征波段相關(guān)系數(shù)絕對(duì)值均大于原始光譜,說(shuō)明光譜變換可有效消除噪聲,提高數(shù)據(jù)反演SPAD值潛力。
圖3 不同類型光譜反射率與SPAD值相關(guān)性Fig.3 Correlation between different types of spectrum reflectance and SPAD values
2.2.2植被指數(shù)與SPAD值相關(guān)性
根據(jù)表1構(gòu)建不同類型光譜植被指數(shù),分別計(jì)算其與SPAD值相關(guān)性(見(jiàn)表2),由此可知,同一植被指數(shù)在不同類型光譜中反演SPAD值潛力不同,其中mNDVI和RVI最穩(wěn)定,相關(guān)系數(shù)變化范圍 分 別為0.777~0.883、0.863~0.874;而NDVI與MCARI在普通一階導(dǎo)數(shù)及間隙一階導(dǎo)數(shù)變化下相關(guān)性較差,相關(guān)系數(shù)絕對(duì)值最低分別為0.440和0.385。根據(jù)相關(guān)性高低確定PS、SRS和CRS 3種光譜類型最佳植被指數(shù)為NDVI,OFDS和GFDS兩種光譜類型最佳植被指數(shù)為mNDVI。
表2 不同類型光譜植被指數(shù)與SPAD值相關(guān)性Table 2 Correlation of vegetation index of different spectrum types
選取不同類型光譜特征波段與最優(yōu)植被指數(shù)分別構(gòu)建單因素模型,建模結(jié)果見(jiàn)表3。
由表3可知,原始光譜與開(kāi)平方根光譜兩種模型建模精度相當(dāng),但為二者基于特征波段的驗(yàn)證精度不佳;連續(xù)統(tǒng)去除光譜、普通一階導(dǎo)數(shù)光譜和間隙一階導(dǎo)數(shù)光譜特征波段模型較相應(yīng)植被指數(shù)模型,建模R2分別提高0.02、0.02、0.04,驗(yàn)證R2則分別提高0.05、0.09與0.06,同時(shí)三者基于特征波段模型在建模精度與驗(yàn)證精度方面,RMSE與MRE均處于較低水平。綜合看,基于一階導(dǎo)數(shù)特征波段模型為所有單因素模型中最優(yōu),其建模R2、RMSE和MRE分別為0.81、2.73和4.78%,驗(yàn)證R2、RMSE和MRE分別為0.83、2.40和4.36%,在應(yīng)用單因素模型反演玉米葉片SPAD值時(shí),應(yīng)優(yōu)先考慮該模型;其次為間隙一階導(dǎo)數(shù)特征波段模型。
表3 不同光譜類型單因素模型Table 3 Single factor models of different spectrum types
2.4.1 基于SPA算法的多元建模參數(shù)提取
通過(guò)相關(guān)性檢驗(yàn)(0.01水平)的各類型光譜敏感波段作為SPA算法輸入量,SPAD值作為響應(yīng)量,通過(guò)不斷調(diào)試,以RMSE最小為原則[23],進(jìn)一步提取不同類型光譜多因素模型建模參數(shù)。結(jié)果見(jiàn)表4,SPA算法可大幅降低光譜維度,篩選出各類型光譜建模參數(shù)5~9個(gè),且降維比均在97%以上;其中間隙一階導(dǎo)數(shù)光譜建模參數(shù)最多(9個(gè)),連續(xù)統(tǒng)去除光譜建模參數(shù)最少(5個(gè))。
2.4.2 基于SPA-MLR的多因素模型建立及精度比較
利用表4中列出各類型光譜建模參數(shù),建立多元線性回歸方程(見(jiàn)表5)。與單因素模型相比,各類型光譜建模R2與驗(yàn)證R2分別提高0.03~0.09、0.01~0.16,同時(shí)具有較低RMSE與MRE,可見(jiàn)多元線性回歸模型精度整體上優(yōu)于單因素模型;同時(shí)普通一階導(dǎo)數(shù)光譜與間隙一階導(dǎo)數(shù)光譜MLR模型建模精度與驗(yàn)證精度均優(yōu)于原始光譜,其中基于一階導(dǎo)數(shù)光譜的MLR模型為最優(yōu)模型。
表4 不同類型光譜多元建模參數(shù)Table 4 Multivariate modeling parameters of different types of spectra
表5 不同光譜類型下多元線性回歸模型Table 5 Multiple linear regression models under different spectrum types
2.4.3 基于SPA-SVR的多因素模型建立及精度比較
支持向量回歸(SVR)為一種使用超平面定義高維空間邊界的非線性回歸方法,該方法僅依靠支持向量來(lái)決定超平面,無(wú)需全部數(shù)據(jù),適宜處理非線性擬合問(wèn)題[24]。因此,本文基于表4中各多元建模參數(shù),利用SVR反演玉米葉片SPAD值,為避免自變量數(shù)值差異過(guò)大影響建模精度,建模前將所有自變量作歸一化處理。支持向量機(jī)類型選擇epsilon-SVR,使用RBF核函數(shù),gamma參數(shù)設(shè)置為特征數(shù)倒數(shù),ε采用默認(rèn)值0.05,通過(guò)網(wǎng)格法確定懲罰系數(shù)C值,由于C值偏大會(huì)造成過(guò)擬合,偏小會(huì)造成欠擬合,故網(wǎng)格法尋優(yōu)區(qū)間為[10-2,102]。
建模結(jié)果如表6所示,除開(kāi)平方根光譜外,其余各模型建模精度均較高,相應(yīng)建模與驗(yàn)證R2在0.85、0.72以上,均方根誤差不超過(guò)2.57、3.25,平均相對(duì)誤差則在4.33%及6.39%以下。綜合建模及驗(yàn)證精度看,基于普通一階導(dǎo)數(shù)光譜SVR模型具有極高決定系數(shù),建模和驗(yàn)證的決定系數(shù)均超過(guò)0.90,同時(shí)誤差RMSE、MRE均處于較低水平,為支持向量回歸模型中最優(yōu)模型。
表6 不同光譜類型下支持向量回歸模型Table 6 Support vector regression models under different spectrum types
比較各類型光譜不同建模方法,多元線性回歸模型在建模效果與驗(yàn)證效果方面均優(yōu)于單因素模型,支持向量回歸模型建模精度優(yōu)于單因素模型。但在連續(xù)統(tǒng)去除光譜、開(kāi)平方根光譜及間隙一階導(dǎo)數(shù)光譜中,SVR模型建模精度較高,驗(yàn)證精度低于單因素模型,說(shuō)明支持向量回歸模型易出現(xiàn)過(guò)擬合現(xiàn)象。
分別選擇3種建模方法中最優(yōu)模型,將相應(yīng)預(yù)測(cè)值與實(shí)測(cè)值線性擬合(見(jiàn)圖4),其中虛線為1:1線,實(shí)線為擬合線,當(dāng)擬合方程斜率越接近1,截距越接近0,說(shuō)明模型質(zhì)量越好。由此可見(jiàn),在所有模型中,普通一階導(dǎo)數(shù)光譜支持向量回歸模型為最優(yōu)模型,其建模R2與驗(yàn)證R2高達(dá)0.92和0.90,相 應(yīng) 建 模RMSE與MRE則 低 至1.85和3.06%,驗(yàn)證RMSE與MRE為1.87和3.61%。
圖4 不同類型光譜最優(yōu)模型實(shí)測(cè)值與預(yù)測(cè)值分布Fig.4 Distribution of measured and predicted values of different types of optimal spectrum models
不同形式光譜變換在降低作物反射光譜背景噪聲同時(shí)可增強(qiáng)其固有波譜特征,提高光譜反演作物生理生化參數(shù)潛力[25]。本文所使用4種光譜變換均可提高SPAD與特征波段相關(guān)性,結(jié)果與林少喆等[26]研究結(jié)果一致。但光譜變換對(duì)選取的傳統(tǒng)植被指數(shù)敏感性兼具增強(qiáng)與減弱,原因在于傳統(tǒng)植被指數(shù)多為基于作物原始光譜構(gòu)建,變換后光譜曲線特征與原始光譜相比已發(fā)生本質(zhì)性變換,故其植被指數(shù)不完全優(yōu)于原始光譜。因此對(duì)光譜變換后傳統(tǒng)植被指數(shù)公式改進(jìn)為下一步研究重點(diǎn)。連續(xù)投影算法篩選出各類型光譜多元建模參數(shù)介于5~9個(gè),與前人篩選波段數(shù)量不一致[11,23],可能是高光譜反演對(duì)象不一樣所致,未來(lái)研究可針對(duì)不同對(duì)象開(kāi)展連續(xù)投影算法降維對(duì)比。
本文使用不同建模方法構(gòu)建玉米SPAD值高光譜估算模型,各方法下最優(yōu)模型建模精度由單因素向多因素、傳統(tǒng)回歸建模向機(jī)器學(xué)習(xí)模型遞增,各類變換光譜中,普通一階導(dǎo)數(shù)光譜建模效果最優(yōu),與Wang等研究結(jié)果一致[27]。單因素一元模型蘊(yùn)含信息少、對(duì)SPAD值響應(yīng)不全面,所以模型精度與多元模型相比較低;一階導(dǎo)數(shù)光譜放大原始光譜的“紅邊”,建模效果最優(yōu)。SVR提供眾多核函數(shù)用以解決各種回歸問(wèn)題,且模型復(fù)雜度僅依賴于支持向量個(gè)數(shù),而非數(shù)據(jù)本身。但該方法對(duì)參數(shù)及核函數(shù)選擇比較敏感,易出現(xiàn)過(guò)擬合、收斂慢問(wèn)題,所以在前人研究基礎(chǔ)上[28],本研究結(jié)合連續(xù)投影算法與網(wǎng)格法尋優(yōu)構(gòu)建的SVR模型為最佳模型。
抽雄期為玉米生長(zhǎng)發(fā)育最快時(shí)期,該時(shí)期玉米長(zhǎng)勢(shì)直接決定后期籽粒是否飽滿。利用本研究建立的模型與田間獲取的實(shí)測(cè)玉米葉片高光譜數(shù)據(jù)可反演玉米SPAD值,SPAD值高樣點(diǎn),說(shuō)明玉米長(zhǎng)勢(shì)較好,無(wú)需追肥;SPAD值低樣點(diǎn),說(shuō)明玉米長(zhǎng)勢(shì)較差,需追肥。但受氣候、玉米品種及儀器等不同條件影響,本研究?jī)H可反映關(guān)中地區(qū)抽雄期玉米情況,其他生育期估算反演模型有待進(jìn)一步研究;同時(shí),未來(lái)玉米SPAD值高光譜估測(cè)研究應(yīng)逐漸向衛(wèi)星遙感方向靠攏,通過(guò)遙感影像數(shù)據(jù)將地面SPAD值由點(diǎn)擴(kuò)展到面,從大區(qū)域尺度上監(jiān)測(cè)玉米長(zhǎng)勢(shì)狀況。
本文以關(guān)中地區(qū)抽雄期玉米為研究對(duì)象,通過(guò)不同類型光譜構(gòu)建基于特征波段與植被指數(shù)的單因素模型、基于連續(xù)投影的多元線性回歸模型和支持向量回歸模型,得出結(jié)論如下:
a.不同SPAD值玉米原始反射光譜曲線特征一致,隨SPAD值增加,可見(jiàn)光波段反射率降低,近紅外反射率上升,同時(shí)“紅邊”向長(zhǎng)波方向偏移。
b.光譜變換不僅可增強(qiáng)特征波段與SPAD值相關(guān)性,還可增加敏感波段數(shù)量,提升建模質(zhì)量;間隙一階導(dǎo)數(shù)光譜特征波段相關(guān)系數(shù)絕對(duì)值最大,連續(xù)統(tǒng)去除光譜敏感波段數(shù)量最多,二者相較原始光譜分別增加0.054和102個(gè);普通一階導(dǎo)數(shù)光譜建模效果最佳,各類型模型建模與驗(yàn)證精度皆優(yōu)于原始光譜。
c.連續(xù)投影算法顯著降低數(shù)據(jù)維度,各類型光譜降維比均在97%以上。所有模型中,普通一階導(dǎo)數(shù)光譜下SPA與SVR結(jié)合的模型決定系數(shù)最高,擬合誤差最小,為最優(yōu)玉米葉片SPAD值估算模型,其建模R2與驗(yàn)證R2分別達(dá)0.92、0.90。