張黎黎 呂霞
摘要:葉綠素含量是反映作物生長狀態(tài)及產(chǎn)量的重要指標(biāo)。高光譜技術(shù)是近年來較為常見的檢測作物生物量的方法之一,但高光譜數(shù)據(jù)直接建模分析復(fù)雜度增大。提出一種基于Gram-Schmidt的降維方法,對以PROSPECT模型模擬數(shù)據(jù)作為建模集的光譜進行Gram-Schmidt變換,找到投影空間構(gòu)造主基底,實現(xiàn)高光譜降維,建立光譜與葉綠素含量之間的模型,將實際測量的數(shù)據(jù)作為驗證集?;贕ram-Schmidt的降維方法可降低維度到5維,交叉驗證結(jié)果R2為0.775,MSE為0.062,通過與主成分分析法進行對比證明了該方法的有效性。研究結(jié)果對植物葉片的葉綠素含量估測與高光譜降維具有重要意義。
關(guān)鍵詞:葉綠素;Gram-Schmidt算法;PROSPECT模型;光譜分析
中圖分類號:S127? ? 文獻標(biāo)識碼:A? ? 文章編號:1674-1161(2021)05-0023-03
高光譜技術(shù)通過光學(xué)傳感器采集作物光譜反射率高光譜數(shù)據(jù)進行各參量的反演,能夠?qū)崿F(xiàn)作物快速、高效、經(jīng)濟的長勢監(jiān)測和營養(yǎng)診斷。但高光譜數(shù)據(jù)為高維矢量,直接建模分析會加大復(fù)雜度。Gram-Schmidt正交算法能夠降低高光譜維度,為敏感診斷參數(shù)提供支持。葉綠素是植物進行光合作用時所需的主要色素,利用遙感手段快速及時地監(jiān)測作物的葉綠素含量對于作物的長勢及產(chǎn)量估算起到重要作用。本課題以遼寧地區(qū)粳稻為研究對象,基于正交變換理論探索高光譜數(shù)據(jù)降維方法,構(gòu)建水稻葉片葉綠素含量估測模型,為水稻長勢狀態(tài)監(jiān)測提供依據(jù)。
1 材料與方法
1.1 PROSPECT模擬數(shù)據(jù)設(shè)置
PROSPECT模型是能夠基本模擬植物葉片光譜反射情況的有效模型,在遙感研究中得到廣泛應(yīng)用。將遼寧地區(qū)水稻生化參數(shù)帶入該模型,模擬葉片光譜反射率,作為試驗對象。數(shù)據(jù)集中各參量在取值范圍內(nèi)產(chǎn)生600個服從均勻分布的隨機數(shù),通過PROSPECT模型得到600條400~2 500 nm葉片模擬反射率。根據(jù)遼寧地區(qū)2010—2020年不同品種水稻葉片生化參量含量的統(tǒng)計數(shù)據(jù),設(shè)置PROSPECT模型關(guān)鍵參數(shù)取值范圍為:葉綠素含量33.45~75.61 μg/cm2、類胡蘿卜素含量6.88~17.44 μg/cm2、葉片結(jié)構(gòu)參數(shù)1.5~3.0、等效水厚度0.006 4~0.011 9 cm、干物質(zhì)含量0.003 7~0.072 0 g/cm2、褐色素含量0 μg/cm2。
1.2 水稻葉片光譜測定及葉綠素含量測定
在模擬水稻光譜反射率數(shù)據(jù)的同時,也需要實際采集水稻葉片數(shù)據(jù)。試驗地點位于遼寧盤錦興隆臺地區(qū),水稻品種為龍稻20,樣本數(shù)為240個,采樣時間為2020年8月16日10∶00—14∶00。葉片光譜測定使用ASD FieldSpec Handheld 2便攜式光譜儀,測定時夾取每株樣本2個葉片的葉脈兩側(cè)部分,共測4次,取平均值獲取數(shù)據(jù)。然后立即將測定光譜部分剪下,稱取0.2 g葉肉組織作為樣品進行葉綠素含量測定。樣品中加入95%乙醇及少量石英砂研磨成勻漿,倒入50 mL錐形瓶中滴定,置于避光環(huán)境下靜置沉淀48 h,直至葉片組織發(fā)白,使用UV2450型紫外可見光分光光度計測量665,649和470 nm波長處的消光度D值,代入公式,計算葉綠素a和葉綠素b的含量。
Ca=13.95×D665-6.88×D649? ? ? ? ? ? ? ? (1)
Cb=24.99×D649-6.88×D665? ? ? ? ? ? ? ? (2)
色素含量= ? ? ? ? ? ? ? ? (3)
式中:C為色素濃度,mg/L;V為色素提取液體積,mL;F為葉片樣本鮮質(zhì)量,g。
1.3 Gram-Schimidt正交變換算法原理及改進
Gram-Schmidt正交變換算法能夠?qū)⑷我饩€性無關(guān)向量組變換成為正交向量集合。算法原理步驟如下:
設(shè)自變量X和因變量Y,
1) 自變量X=[x1,x2,…,xn]經(jīng)過Gram-Schmidt正交變換,轉(zhuǎn)換成為正交集合,即
Xp×n=H×C? ? ? ? ? ? ? ? ? ? ? (4)
2) 構(gòu)造H,即
hs=xs-(s=2,…,q,q 選擇h1= xk,使得r2(xk,xj)= r2(xi,xj);為了方便起見,這里設(shè)k=1,即h1= x1;q為降維后的維數(shù);H=[h1,h2,…,hq]。 應(yīng)用正交投影變換后,Schmidt變量h1,h2,…,hq的方差是按照遞減順序排列的,即Var(h1)≥Var(h2)≥…≥Var(hq)>0,當(dāng)出現(xiàn)Var(hq+1)小于某個閾值時,其所提供的降維影響力的凈信息較少,停止計算。此時得到的h1,h2,…,hq均為基向量,其所對應(yīng)的關(guān)聯(lián)變量即為篩選出來的最簡變量集合(即基向量矩陣H)。 3) 求C,即 C= (6) rjk=(j=2,3,…,s;k=1,2,…s-1)? ? ? ?(7) X為可逆矩陣,則可得 C′(n×q)=X′(n×q)×H(p×q)? ? ? ? ? ? ? ? ? (8) 4) 假設(shè)Y與Gram-Schmidt變量C具有線性關(guān)系,則線性回歸方程為 Y′(n×1)=C′(n×q)×β(q×1)? ? ? (9) 式中:β為回歸系數(shù)。 將該方法應(yīng)用于綠色植物光譜數(shù)據(jù)分析并加以改進:1) 為減少綠色植物光譜特殊情況的影響,構(gòu)建基向量時將建模樣本的平均值作為H的h1,相應(yīng)地閾值需要根據(jù)情況進行改變;2) 由于大部分情況下光譜數(shù)據(jù)X中p(光譜波段數(shù))遠大于n(樣本數(shù)),因此需要將X進行分組,將p分為若干部分,這樣不僅可以避免因p值明顯小于n值而無法使用算法,還可以在每個部分選出“最重要變量”(即該范圍內(nèi)最具代表性的綠色植被光譜)作為基向量,而不是直接利用某一樣本的譜線。 2 結(jié)果與分析 2.1 光譜數(shù)據(jù)獲取預(yù)處理 葉片光譜反射率(PROSPECT模擬值和實測值)如圖1所示。 由圖1可以看出:PROSPECT模型模擬得到的曲線和實際測定得到的光譜曲線趨勢變化一致。PROSPECT模型在各參數(shù)范圍內(nèi)隨機模擬600個樣本(建模集),實際測量情況下采集240個樣本(驗證集),剔除傳感器邊界數(shù)據(jù)后均獲取各葉片樣本400~800 nm波段光譜反射率(分辨率為1 nm)及對應(yīng)的葉綠素含量,作為構(gòu)建和驗證基向量矩陣、建立估測葉綠素含量的建模集和驗證集數(shù)據(jù)。觀察反射率情況可知:400~500 nm波段、600~700 nm波段對應(yīng)的強吸收帶和550 nm對應(yīng)的強反射帶,以及700~750 nm波段反射率急劇上升情況表明模擬后的水稻葉片光譜曲線符合典型植被光譜曲線特征。 2.2 Gram-Schmidt算法降低數(shù)據(jù)維度 2.2.1 觀測窗寬度設(shè)置 以光譜波段為分割對象,分割后的每個部分視為“觀測窗”。在“窗”中隨機將一個樣本作為貢獻最大的基向量,然后將所有向量向這個基向量投影,去掉共性構(gòu)成基向量矩陣。利用不同觀測窗長度分割方法處理建模集的400~800 nm葉片光譜反射率數(shù)據(jù)(見表1),與各自葉綠素含量建立線性回歸模型,得到不同基向量長度條件下的建模精度,設(shè)置選擇基向量閾值為0.02。利用決定系數(shù)R2和均方誤差MSE來判定模型精度,并采用五折交叉驗證法(5-Cross-validation)計算驗證集誤差。 2.2.2 影響葉片葉綠素含量的重要波段 p值是判斷假設(shè)檢驗結(jié)果的參數(shù),p<0.05表示提取信息對結(jié)果影響顯著。當(dāng)對建模集數(shù)據(jù)設(shè)置觀測窗長度為320 nm時,共得到6個基向量,其中基向量1,3,5的p值較小,說明這3個基向量對結(jié)果準(zhǔn)確程度的影響占據(jù)較大比例,對應(yīng)的基向量光譜信息如圖2所示,優(yōu)選出4個葉綠素含量敏感波段分別為427,539,721和749 nm。以篩選的4個敏感波段為輸入,構(gòu)建葉綠素線性回歸模型,得到反演精度CV-R2為0.775,CV-MSE為0.062。 3 結(jié)論 利用高光譜數(shù)據(jù)對水稻葉綠素含量進行估測,基于Gram-Schmidt的降維方法有效降低高光譜數(shù)據(jù)維度,且同時保留原始波段的信息,得到敏感波段。該方法改進了傳統(tǒng)降維方法的不足之處,所建立的模型具有較高的預(yù)測精度,為植物葉片的葉綠素含量估測提供了新的路徑。 參考文獻 [1] 黃文江,師越,董瑩瑩,等.作物病蟲害遙感監(jiān)測研究進展與展望[J].智慧農(nóng)業(yè),2019(4):1-11. [2] 馮帥,許童羽,于豐華,等.基于無人機高光譜遙感的東北粳稻冠層葉片氮素含量反演方法研究[J].光譜學(xué)與光譜分析,2019,39(10):3 281-3 287. [3] 王浩云,曹雪蓮,孫云曉,等.基于光學(xué)特性參數(shù)反演的綠蘿葉綠素含量估測研究[J].農(nóng)業(yè)機械學(xué)報,2021,52(3):202-209. [4] 曹英麗,肖文,江凱倫,等.基于分窗Gram-Schmidt高光譜降維的水稻紋枯病檢測[J].沈陽農(nóng)業(yè)大學(xué)學(xué)報,2019,50(6):713-721. Study on the Chlorophyll Content Estimation Method of Rice Leaves based on the PROSPECT Model ZHANG Lili1, L? Xia2 Abstract: Chlorophyll content is an important indicator to reflect the crop growth status and yield. Hyperspectral technology is one of the common methods to detect crop biomass in recent years, but the complexity of direct modeling and analysis of hyperspectral data increases. In this paper, a dimensionality reduction method based on Gram-Schmidt was proposed. The spectrums simulated by PROSPECT model were transformed by Gram-Schmidt, and the main basis was constructed in the projection space to achieve hyperspectral dimensionality reduction. The model between spectrum and chlorophyll content was established, and the measured data were used as the verification set. The dimensionality reduction method based on Gram-Schmidt can reduce the dimensionality to 5 dimensions, and the cross validation result R2 is 0.775 and MSE is 0.062. The effectiveness of this method is verified by comparing with principal component analysis method. The results are of great significance for estimating chlorophyll content and hyperspectral dimension reduction in plant leaves. Key words: chlorophyll; Gram-Schmidt algorithms; PROSPECT model; spectrum analysi