易翔,張立福,3*,呂新,張澤,田敏,印彩霞,馬怡茹,范向龍
(1.石河子大學農學院/新疆生產(chǎn)建設兵團綠洲生態(tài)農業(yè)重點實驗室,新疆 石河子832003;2.石河子大學機械電氣工程學院,新疆 石河子832003;3.中國科學院空天信息創(chuàng)新研究院/遙感科學國家重點實驗室,北京100094)
棉花是我國極為重要的一種大田經(jīng)濟作物,其生產(chǎn)覆蓋全國24個?。ㄖ陛犑?、自治區(qū)),商品率在95%以上,在國民經(jīng)濟中占有十分重要的地位[1]。新疆因得天獨厚的氣候、光照、土地等自然資源條件,成為目前我國最大的商品棉基地[2]。地上部生物量(Above-ground biomass,AGB)作為反映作物生長的重要參數(shù)之一,在棉花長勢監(jiān)測和大田精準管理方面發(fā)揮重要作用[3]。因此,快速、無損、準確地估算棉花AGB對棉花生產(chǎn)管理和決策具有重要意義。然而,傳統(tǒng)的人工測量方法因破壞性強、耗時、費力且適用范圍小[4]等局限性難以滿足大規(guī)模監(jiān)測的需求。
無人機遙感以其高效率、高分辨率、低成本等優(yōu)勢為精準農業(yè)的快速發(fā)展提供了新的技術平臺[5-7]。目前,無人機高光譜遙感技術已實現(xiàn)對棉花株高、氮素營養(yǎng)狀況、蟲害動態(tài)等監(jiān)測[8-10]。其中關于生物量的研究已有很多報道,Tao等[11]利用無人機獲取高光譜數(shù)據(jù)構建植被指數(shù)結合紅邊參數(shù)建立偏最小二乘法回歸 (Partial least square regression,PLSR)模型用于冬小麥AGB估算。Hansen等[12]基于歸一化植被指數(shù)(Normalized differencevegetation index,NDVI)和PLSR構建了小麥AGB估算模型,結果表明在680~750 nm波長內的波長組合下NDVI與生物量具有較高的相關性,基于PLSR建立的生物量估測模型比NDVI線性模型效果更好。鄧江等[13]利用棉花主要生育時期的無人機近紅外影像數(shù)據(jù),提取4種植被指數(shù)通過與棉花AGB的實測值建立擬合關系,分析不同植被指數(shù)在棉花各生育時期的估算效果并對其擬合效果進行了驗證,結果表明基于無人機影像生物量估算方面具有較好的可行性。上述研究主要是利用植被指數(shù)來建立模型,其特點是物理意義明確,形式簡單,計算難度較低;但其適用性有限,效果各異,對特定的目標選用何種光譜指數(shù)需要大量的嘗試和積累[14],且在建立模型時主要基于少數(shù)敏感波段,沒有充分考慮高光譜遙感所包含波段的光譜信息。對此,本研究首先獲取不同施氮量處理下的棉花AGB與棉花冠層高光譜數(shù)據(jù),然后利用不同光譜預處理方法對光譜信息進行不同程度地減弱或消除背景噪聲,為減少信息冗余,再采用連續(xù)投影算法對不同預處理后的波長進行篩選,以期從無人機高光譜數(shù)據(jù)(398~1 000 nm)中篩選出對棉花AGB敏感的特征波長,最后基于篩選出的特征波長使用PLSR和隨機森林回歸(Random forest regression,RFR)方法建模,并進行模型檢驗,選出棉花AGB的最佳估算模型,實現(xiàn)棉花AGB的快速無損監(jiān)測,為新疆棉花生產(chǎn)的科學管理提供參考。
試驗于2019年在新疆石河子大學農學院教學試驗場(44°19′N,85°59′E)開展。該地區(qū)屬溫帶大陸性氣候,年降水量為125~207 mm,是新疆典型的棉花規(guī)模化種植區(qū)域。供試棉花品種選用當?shù)爻R?guī)品種新陸早53號和新陸早45號,依照新疆機采棉“一膜三管六行”的模式進行種植:行距配置(66+10)cm,株距10.5 cm。如圖1所示,試驗設置6個氮素水平處理:0(N0)、120(N1)、240(N2)、360(NC)、480(N3)、600 kg·hm-2(N4),氮肥以尿素(氮質量分數(shù)為46%)的形式隨水滴灌施入,每個處理設置3個重復,共36個小區(qū),化控等田間管理與當?shù)赝竭M行。
圖1 研究區(qū)位置和試驗設計Fig.1 Location and experimentaldesign ofthe study area
1.2.1棉花冠層高光譜數(shù)據(jù)獲取。試驗于2019年4月24日播種,在棉花出苗(4月29日)后57d、66 d、74 d、88 d、112 d利用六旋翼無人機搭載高光譜相機(圖2),在天氣晴朗,無風無云、光照充足的中午12:00-14:00進行無人機高光譜遙感作業(yè),飛行高度為100 m。無人機搭載的傳感器為Nano-Hyperspec(美國)超微型機載推掃式高光譜成像光譜儀(測量過程中保證光譜儀垂直向下),質量0.6 kg,波長范圍是400~1 000 nm;光譜分辨率為6 nm,空間分辨率為6.2 cm;有270個光譜通道;因為成像光譜儀曝光時間取決于太陽光強度,因此需要進行校正。在進行無人機遙感作業(yè)前,在黑暗條件下采集暗電流,地面設置黑白板進行輻射定標,并保持各時期遙感作業(yè)時的飛行航線一致。
獲取的高光譜遙感影像為HDR格式,需要對其進行處理,主要包括影像校正和影像拼接、提取冠層光譜反射率。本研究使用傳感器自帶的Spectral View軟件進行校正處理,并保存為BSQ文件格式。將校正好的影像使用無縫拼接(ENVI)進行影像拼接等處理,并利用標定板將影像的數(shù)字量化值(Digital number,DN值)轉換為地表反射率,然后在ENVI軟件中進行解譯,根據(jù)AGB地面數(shù)據(jù)對應的樣點位置構建感興趣區(qū)(Region of interest,ROI),再以ROI范圍內的地物平均反射率光譜值作為該小區(qū)棉花冠層反射光譜,進而得到各樣點的反射率光譜數(shù)據(jù)。其中,保證2種尺度采樣點相對應的具體方法:以每幅膜為1個小區(qū),在小區(qū)劃分基礎上用布條確定地面采樣區(qū)間,采樣時記錄采樣點的全球定位系統(tǒng)(Global positioning system,GPS)信息,與無人機GPS信息相對應,并特意擴大無人機的ROI,使之絕對包含地面采樣點,從而減小GPS誤差。
圖2 無人機平臺與高光譜相機Fig.2 UAV platform with Nano-hyperspectralcamera
1.2.2生物量數(shù)據(jù)采集。在無人機作業(yè)后,每個小區(qū)選取1個樣點,以每個樣點為中心隨機選取長勢均勻、無病蟲害的3株棉花沿地表剪取地上部作為試驗樣本,分別置于紙袋中在105℃的烘箱中殺青30 m in,然后將溫度設置到75℃烘干至恒重,稱量烘干后樣品的質量,并計算平均值作為該樣點的單株地上部AGB,根據(jù)單位面積株數(shù)與單株AGB得到單位面積AGB(簡稱“AGB值”,單位:kg·m-2),用于后續(xù)研究。不同處理小區(qū)的AGB值統(tǒng)計特征如表1所示。
1.3.1光譜預處理和特征波長篩選。為消除光譜噪聲,降低環(huán)境背景干擾等因素的影響,本研究對原始光譜分別采用一階導數(shù)(First derivative,F(xiàn)DR)、二階導數(shù)(Second derivative,SDR)、Savitzky-Golay(SG)平滑以及多元散射校正(Multiplicative scatter correction,MSC)進行預處理。為了有效提取棉花AGB的光譜特征信息,壓縮數(shù)據(jù)量,降低模型的復雜度,避免全波段高光譜數(shù)據(jù)大量冗余和同質性問題,利用連續(xù)投影算法(Successive projections algorithm,SPA)[15]篩選與AGB變化相關性更強的特征波長。
1.3.2模型建立及驗證。遙感技術應用于作物監(jiān)測和植物性狀估算時,常與機器學習的方法相結合建模,如PLSR[16]、支持向量回歸(Support vector regression,SVR)和RFR[17]等。本研究采用PLSR和RFR算法建立棉花地上部生物量估算模型。PLSR是結合多元線性回歸、典型相關分析和主成分分析的線性回歸方法,能夠有效地克服一般最小二乘回歸分析方法無法解決的難題,對連續(xù)光譜分析具有明顯的優(yōu)勢,通常用于構建預測模型[18-20]。RFR是基于樹的一種集成學習算法,由不同的樹組成,這些樹通過應用裝袋和隨機變量選擇過程進行訓練,對異常值和噪聲有更好的容忍度;因此,不需要降維便能夠獲得精確的結果,在數(shù)據(jù)分析與挖掘方面具有極其重要的應用價值[21-23]。本研究在RFR計算過程中將樹(nTree)的數(shù)量規(guī)定為500,具體操作在Matlab 2014a軟件中采用代碼實現(xiàn)。
本研究將5次采集的180個樣本用于棉花生物量估算模型構建,其中135個作為建模數(shù)據(jù),45個作為模型檢驗數(shù)據(jù)。依據(jù)篩選出的特征波長,分別采用PLSR和RFR方法構建棉花AGB估算模型;使用決定系數(shù)(R2)、均方根誤差(Root mean square error,RMSE)評估AGB估算模型的準確性;較大的R2表示模型擬合效果較好,而較小的RMSE表示模型的精度高。R2和RMSE分別使用公式(1)和(2)計算:
式中,n為樣本數(shù)量,i表示第i個樣本點數(shù)據(jù);xi為第i個樣本點的棉花AGB實測值,yi為根據(jù)模型估算出的第i個樣本點的棉花AGB預測值,xˉ為棉花AGB(干物質)實測值的平均值,yˉ為模型估算出的棉花AGB(干物質)的平均值,單位均為kg·m-2。
由圖3可知,新陸早53號(圖3-a)和新陸早45號(圖3-b)地上部生物量變化趨勢基本一致,隨著生育期的推移,棉花地上干生物量不斷增長,均在出苗后112 d達到峰值,其中N3處理下棉花地上部生物量最大,此時棉花正處于盛鈴期。在各個時期中,施氮處理下干物質質量決大多數(shù)大于N0處理,N3處理下干物質質量大于N4處理,說明缺氮會降低棉花干物質的積累,適當使用氮肥有助于棉花干物質積累,過量施氮會抑制棉花干物質積累。
圖3 不同處理下棉花地上部生物量(AGB)變化Fig.3 Changes of cotton above-ground biomass(AGB)under differenttreatments
圖4為無人機高光譜影像上不同棉花AGB值對應的冠層反射率光譜曲線,可以看出不同棉花AGB值的冠層光譜曲線趨勢基本相同,在可見光范圍(400~700 nm)內反射率較低,在近紅外波段(700~1 000 nm)反射率較高。550 nm處出現(xiàn)1個反射峰,450 nm和670 nm處附近出現(xiàn)2個吸收谷,680~750 nm處反射率急劇上升,并在750~900 nm處的近紅外波段形成1個顯著的高反射平臺。在紅光與近紅外光之間反射率急劇上升,是由于近紅外光可以穿透葉綠素,經(jīng)過葉肉組織反射形成強反射。其中:在波長450~700 nm的可見光波段表現(xiàn)為AGB值越高,冠層反射率越低,但差異幅度不大;在730~900 nm近紅外波段表現(xiàn)為AGB值越高,冠層反射率越高,且差異顯著。
圖4 不同地上部生物量(AGB)的棉花冠層影像反射率曲線Fig.4 Cotton canopy image reflectance curves with differentabove-ground biomass(AGB)values
SPA通過不斷循環(huán)計算一個波長在其余未選波長上的投影,進而找到包含冗余信息量最少的波長,能較好地降低輸入數(shù)據(jù)組的共線性。運用Matlab 2014a軟件對棉花AGB敏感的光譜數(shù)據(jù)進行SPA特征選擇,實現(xiàn)400~1 000 nm全波段的降維,設置特征波長數(shù)n的范圍為5~30。如圖5和表2所示,對于原始光譜、一階導數(shù)光譜、二階導數(shù)光譜、SG平滑光譜和MSC散射校正光譜分別篩選出了10個、9個、24個、25個、26個特征波長。從表2可以看出,棉花AGB的敏感波段集中在可見光和近紅外光區(qū)域,表明棉花AGB與近紅外波段光譜反射率具有更為重要的關系。而近紅外光譜區(qū)主要受組成成分、生物量等影響。因此,可以利用可見光及近紅外波段的數(shù)據(jù)與農學參數(shù)建立定量關系,估測AGB。
圖5 連續(xù)投影算法(SPA)篩選特征波長結果Fig.5 Characteristic wavelength screening results by the successive projections algorithm(SPA)method
表2 對光譜樣本提取的特征波長Table 2 The effective wavelengths selection forhyperspectralsam ples
利用篩選后的特征波長光譜數(shù)據(jù)與棉花AGB分別建立PLSR和RFR估算模型,結果見表3。根據(jù)表3可知,不同預處理、不同建模方法的生物量估算模型精度存在差異。利用PLSR方法構建的估算模型中,基于SG平滑預處理篩選出的特征波長建立的模型R2(0.63)高于其他預處理,RMSE(0.42)要低于其他預處理,模型效果較佳;基于原始光譜篩選出的特征波長的建模效果次之,R2為0.53,RMSE為0.49;基于二階導數(shù)預處理建立的模型精度與原始光譜相差不大;相比于利用原始光譜建立的模型,MSC預處理的建模效果明顯下降。在RFR方法建立的模型中,一階導數(shù)預處理下的建模效果最佳,其R2=0.87,RMSE=0.45;基于原始光譜的建模效果次之,R2為0.84,RMSE為0.47,且與二階導數(shù)預處理下的建模效果相近;MSC預處理下的建模效果精度最低。2種棉花AGB估算方法的建模效果相比,RFR法的R2普遍高于PLSR法。
表3 棉花地上部生物量(AGB)估算模型Table 3 Estimation modelof cotton above-ground biomass(AGB)
從圖6、圖7與表4可知,對于驗證集,以PLSR建立的5種估算模型的穩(wěn)定性和精度良好(R2分 別 為0.63、0.55、0.57、0.67、0.21,RMSE分別為0.38、0.42、0.41、0.36、0.55),其中SG平滑預處理下模型的精度和穩(wěn)定性高于其他預處理。不同預處理下,通過RFR法所建立的棉花AGB估算模型均優(yōu)于PLSR法,R2分別為0.73、0.81、0.75、0.71、0.57,RMSE分 別 為0.45、0.37、0.40、0.62、0.56,其中基于一階導數(shù)預處理篩選的特征波長建立的模型擬合效果最佳。
圖7 棉花地上部生物量(AGB)估算模型精度檢驗Fig.7 Accuracy verification of above-ground biomass(AGB)inversion model
表4 棉花主要生育時期地上部生物量(AGB)估算模型驗證Table 4 Estimation modelof above-ground biomass(AGB)ofcotton during main grow th periods
近年來,新疆棉花種植密度和種植方式也在不斷的變化,為塑造合理的棉花群體,進一步提高棉花產(chǎn)量,棉花地上部生物量成為反映和描述棉花群體大小的重要的農學指標。傳統(tǒng)的獲取作物生物量的方法是實地取樣后再測定,不僅費時、費力、有破壞性,而且實效性差,難以快速反映作物生長動態(tài),在實際應用中不可行;因此,利用新的方法建立作物地上部生物量的估算模型,獲取精度較高的棉花地上部生物量,對于解釋、預測和設計理想棉花群體意義重大。
在利用高光譜數(shù)據(jù)構建生物量估算模型時,模型精度會受到光譜預處理方法的影響[24]。王玉娜等[25]在構建冬小麥生物量估算模型時發(fā)現(xiàn),采用一階導數(shù)光譜、對數(shù)變換光譜和連續(xù)統(tǒng)去除光譜建立的模型精度均高于利用原始光譜以及光譜指數(shù)建立的模型;馬文君等[26]認為一階微分有效地消除了背景、大氣散射的影響,并提高了不同吸收特征的對比度。可見,合適的預處理方法能夠很大程度上提高模型的精度。本研究利用一階導數(shù)預處理有效篩選出敏感波長,提高了棉花AGB估算模型精度,這與上述研究結果相似。應用于其他監(jiān)測、預測時,采用2種或2種方法組合預處理光譜,可以進一步提高模型精度[27-28];而本研究皆以單個方法進行預處理,因此應嘗試不同預處理方法的組合及運算順序對估算模型進行優(yōu)化。
本研究中,基于SPA算法篩選的特征波長光譜,使用RFR方法獲得的AGB估計值比使用PLSR獲得的估計值更準確。此外,其模型驗證效果較好,與模型性能一致。這些RFR建模的優(yōu)越性與前人研究結果一致,比如:Han等[29]通過機器學習算法估算玉米地上部生物量結果表明,RFR構建的模型結果誤差最小;Lu等[30]基于RGB圖像和RFR算法建立的模型最佳。因此,優(yōu)選RFR算法來構建棉花地上部生物量的無人機高光譜遙感估測模型。
本研究中,運用4種不同的光譜預處理方法對獲取的無人機高光譜反射率進行了有效處理,再利用SPA法在原始光譜及預處理后的光譜信息中挑選出了與棉花AGB相關性較好的特征波長,利用所選用的特征波長光譜和2種機器學習算法(PLSR和RFR)建模,對棉花AGB進行估測。結果表明,采用適當?shù)墓庾V變換進行預處理能夠提高模型的估算效果和穩(wěn)定性。其中:在PLSR建模方法下,SG平滑-SPA處理的效果最佳,較原始光譜-SPA有效提高了模型的精度和穩(wěn)定性;在RFR建模方法下,一階導數(shù)-SPA方法的建模效果優(yōu)于原始光譜-SPA。在同種預處理方法下,RFR法構建模型的精度和穩(wěn)定性均優(yōu)于PLSR法。
本研究結果表明,利用無人機高光譜技術精準監(jiān)測棉花生物量有較強的可行性,在區(qū)域農田信息管理、精準農業(yè)實施等方面具有應用前景。本研究為新疆地區(qū)估測棉花AGB提供了參考方法,可為全生育期棉花長勢的高光譜遙感監(jiān)測提供依據(jù),對精準農業(yè)的發(fā)展有重要的現(xiàn)實意義。