茍 靜,劉 剛,2,何 敬
(1. 成都理工大學地球科學學院,四川 成都 610059;2. 成都理工大學地質(zhì)災害防治與地質(zhì)環(huán)境保護國家重點實驗室,四川 成都 610059)
馬鈴薯是世界第四大糧食作物、公認的糧菜食品[1],也是我國重要的經(jīng)濟作物,對保障全球糧食安全有著重要的意義。生產(chǎn)上,及時掌握馬鈴薯的生長情況對促進馬鈴薯高產(chǎn)穩(wěn)產(chǎn)、提質(zhì)增效尤為重要。葉綠素是植物進行光合作用時必需的催化劑,植物葉片中的葉綠素含量會直接影響植物光合作用能力[2]。因此,快速準確測定馬鈴薯葉綠素含量對于監(jiān)測馬鈴薯光合作用能力及生長情況意義重大。
傳統(tǒng)的葉綠素測定方法主要依靠人工實地取樣測定,這種方法不僅取樣工作量大,對馬鈴薯植株有一定損傷,而且實驗室分析復雜,費時費力[3]。研究表明,高光譜成像儀采集的數(shù)據(jù)包含大量光譜信息,而植物光譜特征與葉綠素含量有著密切關(guān)系[4]。因此,高光譜成像儀可以在不損傷作物的情況下獲取作物葉片的各種光譜參數(shù),再通過數(shù)學方法構(gòu)建模型從而很好地監(jiān)測作物的生長情況[5]。由于葉綠素含量與葉綠素相對含量值(SPAD值)之間有較好的相關(guān)性[6-8],通常以SPAD值來表征植物葉片葉綠素含量水平[9]。
近年來,國內(nèi)外很多學者利用高光譜成像技術(shù)對作物進行了大量的研究,并取得了一定的成果。馬文君等[10]利用全生育期的棉花冠層無人機高光譜數(shù)據(jù),以原始光譜反射率和一階導數(shù)光譜參數(shù)通過傳統(tǒng)回歸分析方法、最小二乘回歸(PLSR)方法構(gòu)建了棉花全生育期的SPAD值估算模型,結(jié)果表明PLSR的估算精度更好。蔡慶空等[11]利用高光譜影像,以植被指數(shù)作為輸入?yún)?shù),采用主成分分析法和最小二乘支持向量機(LS-SVM)相結(jié)合的方法構(gòu)建了冬小麥葉面積指數(shù)估算模型,結(jié)果表明相關(guān)系數(shù)R2能夠達到0.71。李媛媛等[12]基于高光譜數(shù)據(jù),以光譜特征參數(shù)構(gòu)建PLSR和BP神經(jīng)網(wǎng)絡(luò)模型來估算玉米葉片的SPAD值,結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)模型結(jié)果更好。王晶晶等[13]基于高光譜數(shù)據(jù),采用逐步回歸(SWR)和PLSR方法來估算小麥的地上生物量(AGB)和葉面積指數(shù)(LAI),結(jié)果表明PLSR方法的估算精度更高。
前人的研究大都是以單一的植被指數(shù)或某一種光譜變換參數(shù)為自變量,利用PLSR等回歸模型來估算作物的LAI、SPAD值、AGB等參數(shù),而基于高光譜圖像,以植被指數(shù)組合、各種光譜變換的特征波段為自變量,利用LS-SVM模型來估算馬鈴薯冠層葉片SPAD值的研究較少。因此,筆者以馬鈴薯為研究對象,選用馬鈴薯冠層一階導數(shù)光譜、二階導數(shù)光譜和連續(xù)統(tǒng)去除光譜、原始光譜這4種光譜變換的特征波段和歸一化植被指數(shù)(NDVI)、差值植被指數(shù)(DVI)、增強型植被指數(shù)(EVI2)、比值植被指數(shù)(RVI)這4種植被指數(shù)的特征波段的波段組合為自變量,利用LSSVM模型來估算馬鈴薯葉片的SPAD值,進而篩選出最優(yōu)估算模型,為實時監(jiān)測馬鈴薯的生長情況提供技術(shù)支持。
于馬鈴薯塊莖形成期(2021年4月21日)野外采集馬鈴薯冠層光譜和相應(yīng)的葉片SPAD值,分別采集60個樣點,采樣的葉片生長狀況均良好,無病蟲害。選取40個樣點作為建模集,20個樣點作為驗證集。
1.1.1 馬鈴薯冠層高光譜數(shù)據(jù)獲取采用SENOPRIKOLA型高光譜成像儀(芬蘭)獲取馬鈴薯冠層高光譜影像數(shù)據(jù)。該高光譜成像儀既可手持測量,也可用無人機搭載測量。無人機搭載測量飛行高度100 m時,其空間分辨率可達6.5 cm,光譜范圍為500~900 nm,最多可達380個波段。試驗設(shè)置48個波段,光譜分辨率為7 nm。冠層光譜影像數(shù)據(jù)采集時間為11:00—13:00,數(shù)據(jù)采集當天天氣晴朗,無風無云。手持模式測量時,探頭垂直向下,置于地面上方1.5 m處,每次采集前均要用標準白板進行校正。采用ENVI5.3軟件得到各個樣點感興趣區(qū)(ROI)內(nèi)的平均馬鈴薯光譜反射率,將其作為該樣點的馬鈴薯冠層光譜反射率,SENOP-RIKOLA獲取的馬鈴薯冠層葉片高光譜影像如圖1所示。
圖1 SENOP-RIKOLA獲取的馬鈴薯冠層葉片高光譜影像
1.1.2 馬鈴薯冠層葉片SPAD值獲取使用SPAD-502 Plus型手持式葉綠素儀器(KONICA MINOLTA 公司)測定馬鈴薯塊莖形成期的葉片SPAD值,每個樣點隨機測定10片馬鈴薯冠層葉片,每個葉片不同部位測量4次,取平均值作為該葉片的SPAD值,最后以10片馬鈴薯的冠層葉片的平均值作為該樣點馬鈴薯冠層葉片的SPAD值。SPAD值測量與冠層高光譜數(shù)據(jù)獲取在同一天進行。
高光譜數(shù)據(jù)處理主要分為暗電流校正、波段配準和輻射校正3個部分。暗電流矯正采用光譜成像儀自帶的Hyperspectral Imager v2.1.4 軟件進行處理,SENOP-RIKOLA型高光譜儀是框幅式高光譜成像儀,圖像是逐波段獲取的,可能由于人為原因不同波段圖像間會存在姿態(tài)位移上的差異[13]。因此,獲取到的數(shù)據(jù)需要進行波段配準校正,先利用RegMosaic軟件進行圖像波段間的配準,再利用ENVI 5.3軟件將獲取到的DN值影像轉(zhuǎn)換為地物光譜反射完成輻射校正。為了減弱地物環(huán)境及高光譜儀自身的干擾,選用Savitzky-Golay方法進行平滑濾波,以此提高高光譜的平滑性,并降低噪音的干擾,即提高光譜的信噪比,SG預處理后的光譜曲線如圖2所示。然后對去噪后的冠層光譜進行一階導數(shù)變換、二階導數(shù)變換、 連續(xù)統(tǒng)去除處理,得到馬鈴薯葉片冠層一階導數(shù)光譜、二階導數(shù)光譜和連續(xù)統(tǒng)去除光譜。
圖2 SG平滑處理后的馬鈴薯冠層葉片光譜反射率
植被指數(shù)是指將一種或多種植被光譜波段值進行組合運算得到的線性或非線性組合,在實現(xiàn)光譜信息歸一化的同時還能突出反映植被的特征,將高維數(shù)的光譜信息降維至易于運算的數(shù)據(jù)。試驗所用的成像高光譜儀器波段范圍主要在可見光波段的綠光波段和近紅外波段之間,因此利用已有波段選取歸一化植被指數(shù)(NDVI)、增強型植被指數(shù)(EVI2)、比值植被指數(shù)(RVI)、差值植被指數(shù)(DVI)這4種植被指數(shù),其具體的計算公式見表1。
表1 植被指數(shù)計算公式
利用最小二乘支持向量機(LS-SVM)估算馬鈴薯的SPAD值,最小二乘是解決多元函數(shù)回歸最經(jīng)典的方法。LS-SVM是SuyKens和Vandewalb于1999年提出的機器學習方法,是SVM的一種延伸,將SVM的二次規(guī)劃問題轉(zhuǎn)化為求線性方程組的問題[14-16],降低了計算難度,也能夠較好地解決小樣本、非線性和高維模式識別等實際問題[16]。與標準支持向量機相比,最小二乘支持向量機回歸算法只需確定核函數(shù)和懲罰因子,而不需要確定不敏感損失函數(shù)值,只需要更少的建模數(shù)據(jù),這不僅簡化計算,也便于實際應(yīng)用[17-18]。
首先,基于一階導數(shù)光譜、二階導數(shù)光譜、連續(xù)統(tǒng)去除光譜和原始光譜與SPAD值的敏感波段建立LSSVM估算模型,評價出4種光譜變換模型的最佳估算模型;然后,基于歸一化植被指數(shù)(NDVI)、比值植被指數(shù)(RVI)、增強型植被指數(shù)(EVI2)、差值植被指數(shù)(DVI)與SPAD值相關(guān)性最好的波段組合建立LSSVM估算模型,評價出基于4種植被指數(shù)最佳的估算模型,技術(shù)路線圖如圖3所示。第三,對模型預測出來的結(jié)果采用相關(guān)系數(shù)(R2)、均方根誤差(RMSE)、平均絕對誤差(MAE)來評價模型精度。R2越接近1,RMSE、MAE越小,其模型的估算精度越高。
圖3 馬鈴薯冠層葉片SPAD值估算技術(shù)路線
為篩選出與馬鈴薯相關(guān)性最好的光譜波長,利用SPSS軟件通過Person相關(guān)性分析得到馬鈴薯冠層一階導數(shù)光譜、二階導數(shù)光譜、連續(xù)統(tǒng)去除光譜、原始光譜與SPAD值的相關(guān)性,結(jié)果如圖4所示。一階導數(shù)光譜與SPAD值相關(guān)性最好的波長為735 nm,其相關(guān)系數(shù)為-0.718;二階導數(shù)光譜與SPAD值相關(guān)性最0好的波長為704 nm,其相關(guān)系數(shù)為-0.625;連續(xù)統(tǒng)去除光譜與SPAD值相關(guān)性最好的波長為720 nm,其相關(guān)系數(shù)為0.329;原始光譜與SPAD值相關(guān)性最好的波長為775 nm,其相關(guān)系數(shù)為-0.234。將相關(guān)性最好的波段作為敏感波段,將敏感波段對應(yīng)的一階導數(shù)光譜、二階導數(shù)光譜、連續(xù)統(tǒng)去除光譜和原始光譜的光譜反射率作為自變量,利用LS-SVM模型進行SPAD值的預測,最后與以光譜指數(shù)最為自變量的預測模型作對比,得到SPAD值的最佳預測模型。
圖4 各光譜與馬鈴薯SPAD值得相關(guān)性分析
NDVI、RVI、DVI、EVI2這4種植被指數(shù)在計算時使用的反射率都是紅光和近紅外范圍內(nèi)波長的反射率,也常常被用于植被葉綠素的反演。將所有處于紅光波長范圍內(nèi)的波段與所有處于近紅外波長范圍內(nèi)的波段兩兩進行NDVI、RVI、DVI、EVI2光譜植被指數(shù)運算,最后再與馬鈴薯SPAD值進行Person相關(guān)性分析,篩選出每種植被指數(shù)與SPAD值相關(guān)性最好的光譜波段組合,如表2所示。其中,NDVI植被指數(shù)的最優(yōu)波段組合為紅光波段720 nm,近紅外波段為783nm,其相系數(shù)為-0.353;RVI植被指數(shù)的最優(yōu)波段組合為紅光波段751 nm,近紅外波段為775 nm,其相關(guān)系數(shù)為-0.342;DVI植被指數(shù)的最優(yōu)波段組合為紅光波段720 nm,近紅外波段760 nm,其相關(guān)系數(shù)為-0.722;EVI2植被指數(shù)的最優(yōu)波段組合為紅光波段696 nm,近紅外波段775 nm,其相關(guān)系數(shù)為-0.576。
表2 植被指數(shù)特征波段
2.3.1 采用光譜敏感波段構(gòu)建SPAD值的LS-SVM模型將一階導數(shù)光譜、二階導數(shù)光譜、連續(xù)統(tǒng)去除光譜、原始光譜中最優(yōu)波長的反射率作為自變量構(gòu)建馬鈴薯SPAD值估算模型,計算出每個自變量所對應(yīng)的模型的精度,如表3所示。隨著相關(guān)系數(shù)的增大,均方根誤差(RMSE)和平均絕對誤差(MAE)呈下降的趨勢。其中,基于一階導數(shù)光譜的估算模型精度最高,相關(guān)系數(shù)(R2)為0.504 3,其RMSE為1.689 7,MAE為1.488 9。
表3 不同變換光譜的馬鈴薯SPAD值估算模型精度統(tǒng)計
2.3.2 采用光譜指數(shù)敏感波段構(gòu)建SPAD值的LSSVM模型基于NDVI、RVI、DVI、EVI2這4種植被指數(shù)的敏感波段構(gòu)建馬鈴署SPAD值的LS-SVM模型,計算每個自變量所對應(yīng)的模型的精度,如表4所示。利用單個植被指數(shù)敏感波段進行建模時,最優(yōu)估算模型為DVI敏感波段的LS-SVM模型,其R2為0.841 0,RMSE為1.299 3,MAE為1.063 9。利用2種植被指數(shù)敏感波段進行建模時,最優(yōu)估算模型是DVI和EVI2敏感波段的LS-SVM模型,其R2為0.852 4,RMSE為1.262 1,MAE為1.025 7,其估算精度比單一波段估算模型高。利用3種植被指數(shù)敏感波段進行建模時,最優(yōu)估算模型是NDVI、DVI和EVI2敏感波段的LS-SVM模型,其R2為0.912 3,RMSE為1.156 5,MAE為0.898 4,其估算精度比前2種估算模型的精度都高,對馬鈴薯SPAD值有較好的預測結(jié)果。基于4種植被指數(shù)敏感波段構(gòu)建的LS-SVM模型R2為0.876 8,RMSE為1.226 3,MAE為1.011 7,相對于單一變量模型和雙變量模型精度要高,但比3變量模型精度要低。
表4 基于光譜指數(shù)敏感波段的馬鈴薯SPAD值估算模型精度統(tǒng)計
綜上所述,采用光譜植被指數(shù)組合估算馬鈴薯SPAD值的效果比單一植被指數(shù)估算的效果好,其中采用NDVI、DVI和EVI2這3種植被指數(shù)敏感波段構(gòu)建的模型精度最好,該研究只選用了4種植被指數(shù)進行試驗,后續(xù)還可以增加更多的植被指數(shù)進行試驗,找到精度更高更有效的組合模型。
以塊莖形成期的馬鈴薯冠層葉片為研究對象,基于光譜變換敏感波段和4種植被指數(shù)敏感波段利用LS-SVM建模方法構(gòu)建馬鈴薯SPAD值估算模型,通過試驗對比發(fā)現(xiàn)在光譜變換敏感波段估算模型中最優(yōu)的是基于一階導數(shù)變換模型,在植被指數(shù)敏感波段估算模型中最優(yōu)的是基于NDVI、DVI、EVI2這3種植被指數(shù)敏感波段組合的模型,但基于植被指數(shù)的LSSVM估算精度基本都比基于光譜變換敏感波段的估算精度高。在植被指數(shù)估算模型中,多種植被指數(shù)組合估算模型相對于單一植被指數(shù)估算模型更穩(wěn)定,估算精度都較好。
由于該研究只采集了馬鈴薯一個生育期的高光譜數(shù)據(jù),缺少對整個生育期的試驗、分析和對比,具有一定的局限性,模型的估算能力還需在馬鈴薯的不同生育期間進行檢驗。在后續(xù)的研究中,可以結(jié)合無人機技術(shù)獲得更大范圍、全生育期的馬鈴薯高光譜數(shù)據(jù),討論模型對不同生育期、不同地區(qū)馬鈴薯的適用性。