鐘穗希,李子波,唐榮年
(海南大學 機電工程學院,海南 ???570228)
天然橡膠是一種優(yōu)質(zhì)的天然材料,其綜合機械性能在軍事、醫(yī)療等領(lǐng)域起著重要作用[1].由于巨大的經(jīng)濟效益,橡膠樹被廣泛種植在東南亞的熱帶和亞熱帶地區(qū)[2-3].研究表明,氮素作為一種重要的營養(yǎng)元素,它與橡膠樹的健康狀況密切相關(guān)[4-5],缺乏或過量使用氮肥都可能會對橡膠樹造成不利影響[6].此外,有文獻指出,橡膠樹葉片的氮含量與橡膠的產(chǎn)量成正相關(guān).因此,實時評估橡膠樹葉片中的氮含量對指導橡膠樹的精確施肥和估計橡膠產(chǎn)量具有重要意義.盡管經(jīng)驗豐富的工人可以對橡膠樹的營養(yǎng)狀況進行初步分析,但是這種分析方法準確性較低,并且相當依賴于熟練工人的經(jīng)驗.目前,基于近紅外高光譜技術(shù)的研究大多數(shù)集中在一年生的水果和蔬菜作物上.已有研究表明,近紅外光譜技術(shù)可被有效應用于黃瓜葉片的氮含量監(jiān)測[7].此外,高光譜技術(shù)還可用于探究小麥的富氮波段和對其指標的估算[8];基于高光譜數(shù)據(jù)的小麥葉片氮含量監(jiān)測可為小麥氮含量的診斷打下基礎(chǔ)[9].有研究表明,多光譜技術(shù)可有效用于果樹葉片氮素水平的快速檢測[10];也有研究表明,可見-近紅外光譜可有效用于估測西紅柿葉片的氮含量[11].Tian等人將植被信息應用于檢測水稻葉片的氮含量水平[12].有研究表明,水稻冠層光譜可有效檢測水稻的氮含量水平[13].亦有研究表明,近紅外光譜技術(shù)可有效用于評價橘子葉片的氮含量水平[14].此外,高光譜技術(shù)對于預測辣椒葉片氮素的空間分布也有較高的精度[15].由于氮素在橡膠樹葉片上的分布并不均勻[16-18],而在當前的研究中,常選用隨機點光譜選擇方法、感興趣區(qū)域光譜選擇方法、原始平均光譜法來進行高光譜數(shù)據(jù)選點,上述傳統(tǒng)的光譜選取方法均沒有對橡膠樹葉片高光譜數(shù)據(jù)的氮素敏感區(qū)域進行選擇.因此本研究提出一種新的基于空間-光譜信息的光譜聚類方法,并通過聚類手段來研究橡膠樹葉片的氮素敏感區(qū)域,旨在提高光譜診斷模型的預測精度.為達此目的,本研究使用GaiaField光譜儀來采集割膠期橡膠葉片的高光譜數(shù)據(jù),并通過PCA-Kmeans方法和基于空間-光譜信息對高光譜數(shù)據(jù)進行聚類,分別以21組聚類區(qū)域光譜數(shù)據(jù)為基礎(chǔ),結(jié)合偏最小二乘算法(Partial least square,PLS)建立了橡膠樹氮素的光譜檢測模型,同時對比傳統(tǒng)選點方法的建模結(jié)果來探究橡膠樹葉片的氮素敏感區(qū)域,目的是為高光譜數(shù)據(jù)的選點過程提供理論依據(jù).
1.1 試驗材料本研究的樣本均選自2017年5月25日從海南省儋州市采集的橡膠樹葉片,為了確保樣本的隨機性,所有樣本均從實驗地點隨機選取.在該實驗中,在去除不完整和有明顯病蟲害的葉片之后,從所采摘的葉子中共挑選了147片成熟葉子.研究所用儀器設備為:GaiaField-F-N17近紅外高光譜儀和實驗室光譜采集暗箱GaiaSorter.高光譜儀的光譜分辨率為4 nm,在840~1 680 nm波長范圍內(nèi)以3.3 nm的采集間隔均勻地采集光譜數(shù)據(jù).
1.2 數(shù)據(jù)獲取以GaiaField-N-17E高光譜儀測量葉片樣本的光譜反射率.在實驗前,為了避免灰塵等外在因素的影響,葉片表面均用蒸餾水清洗干凈.測量葉片前,需要蓋上設備鏡頭蓋以獲取黑幀圖像,并且拍攝99%反射率的標準白板以獲取白幀圖像.于GaiaSorter暗箱獲取完整葉片樣本的高光譜圖像數(shù)據(jù),隨后,在計算機中進行高光譜數(shù)據(jù)的存儲、黑白校正和分析,并對原始高光譜數(shù)據(jù)的非樣本區(qū)域進行了置0處理.
根據(jù)現(xiàn)有文獻,凱氏定氮法是一種可靠的氮素含量的檢測方法[19-20],因此,在本研究中,以凱氏定氮法所獲得的氮素含量來作為橡膠樹葉片樣本的參考值.詳細流程如下:在摘除葉片的葉柄后,將葉片樣本加熱到105~108 ℃進行殺青,并在60 ℃的環(huán)境下將葉片進行干燥和研磨.稱取0.08~0.10 g樣本和量取3 mL濃H2SO4,混合后于380 ℃恒溫1.5 h.為樣液澄清并表現(xiàn)出褐色時,加入H2O2并持續(xù)加熱5 min后冷卻,之后便可以把溶液加入凱氏氮含量分析儀(FOSS 2300)來檢測樣本的氮素含量.在進行稱重、溶液混合以及把溶液加入凱氏氮含量分析儀等操作時,由于人工操作以及機器誤差等不確定的因素可能會給研究帶來檢驗誤差,因此,為了盡可能地提高所測葉片氮含量的準確性,對上述操作均重復兩次并取其平均值,并以此作為最終氮含量的參考值.
1.3 PCA-Kmeans聚類方法已知氮素在作物葉片上的分布并不均勻,因此本文提出對高光譜數(shù)據(jù)的像素點進行聚類,以探討哪一類區(qū)域的光譜數(shù)據(jù)最適用于橡膠樹葉片氮含量診斷模型的建立.為了進一步探究不同采點區(qū)域?qū)ο鹉z樹高光譜數(shù)據(jù)氮素含量模型的影響,需要對高光譜數(shù)據(jù)的空間信息進行提取.基于顏色識別的機器視覺分割方法已被廣泛用于馬鈴薯、柑橘、蘋果和其他樣品的損傷識別[22-24],然而,沒有研究表明橡膠樹葉片的顏色與氮素的分布有關(guān).
高光譜數(shù)據(jù)由于其數(shù)據(jù)的多波段性,基于顏色識別的計算機視覺方法并不適用于橡膠樹葉片高光譜數(shù)據(jù)的聚類過程,因此,本研究提出了一種新的基于PCA-Kmeans法的高光譜數(shù)據(jù)像素點的聚類方法,這使得具有相似光譜特征的光譜數(shù)據(jù)形成了一個簇,并使簇間的差異盡可能的大,從而實現(xiàn)了基于空間-光譜信息的橡膠樹葉片高光譜數(shù)據(jù)的聚類.
1.3.1 基于PCA特征向量的重加權(quán)PCA是最流行的高光譜數(shù)據(jù)預處理方法之一,是一種降維和特征提取的方法,在統(tǒng)計學中被廣泛使用[25-27]. 基于最大化方差的理論,PCA方法旨在找到一系列線性變換矢量來最大化原始數(shù)據(jù)的方差[28],它可以通過解決以下優(yōu)化問題來獲得線性變換系數(shù)μ:
式中X表示經(jīng)過去均值處理后的高光譜數(shù)據(jù):X=(x1,x2,x3,…,xj,…,xn),其中,xj為經(jīng)過第j波段的二維圖像經(jīng)整形處理后所得到的一維向量數(shù)據(jù).優(yōu)化結(jié)果為:μTXXTμ=μTλμ=λ,特征向量的方向為投影的最大方差的方向.
于是在本實驗的PCA主成分分析中,以最大方差所對應的主成分特征向量作為高光譜數(shù)據(jù)的空間特征.
1.3.2 Kmeans均值聚類為了對PCA提取的高光譜數(shù)據(jù)的空間特征進行聚類,本研究選取了Kmeans聚類算法.K均值聚類算法(Kmeans)是一種迭代求解的算法,具有無監(jiān)督、迭代速度快的特性[29-30],其在數(shù)據(jù)空間的聚類方面具有較好的效果.Kmeans的優(yōu)化目標是使類重心與內(nèi)部成員位置距離的平方和最小,其優(yōu)化目標如下式:
其中x(j)為聚類結(jié)果中每一個簇的樣本坐標,μi為每一個聚類簇的聚類中心的坐標.
在本研究中,Kmeans的具體流程如下:
步驟1:將每個經(jīng)PCA提取的樣本重加權(quán)系數(shù)矩陣整形為1維列向量;
步驟2:以每個樣本的像素權(quán)值為變量,單獨輸入Kmeans函數(shù)中,對權(quán)值進行聚類;
步驟3:對Kmeans聚類結(jié)果進行規(guī)則化,并與高光譜數(shù)據(jù)的索引進行匹配;
步驟4:改變K的取值K=(2,3,4,5,6,7),重復上述操作.
在Kmeans對每個樣本的權(quán)值系數(shù)進行聚類,并匹配到原始高光譜數(shù)據(jù)的索引后,按照索引獲取高光譜數(shù)據(jù)中相應區(qū)域的光譜數(shù)據(jù),進行平均,得到PCA-Kmeans聚類簇區(qū)域的平均光譜.
1.4 平均光譜的獲取辦法對每個聚類類別的所有聚類簇數(shù)據(jù)求平均值,以獲得ASC(Average Spectrum of Cluster).為了驗證基于PCA-Kmeans的ASC光譜數(shù)據(jù)的建模效果,出于比較的目的,本研究還參考了三種常用的高光譜數(shù)據(jù)采集方法,獲得了147個高光譜數(shù)據(jù)樣本的ASRS(Average Spectrum of Random Spectrum)和ASROI(Average Spectrum of ROI)以及ASL(Average Spectrum of Leaf).
ASRS、ASROI采樣的詳細過程如下:在葉片區(qū)域中將每片橡膠葉片的高光譜數(shù)據(jù)從上到下分為六個部分,并從每個部分中隨機選擇三點光譜,對所選光譜數(shù)據(jù)進行平均以獲得ASRS.對于ASROI,通過平均尺寸為40 * 40像素的矩形框內(nèi)的1 600個相鄰光譜數(shù)據(jù),以獲得ASROI.至于ASL則是以完整橡膠樹葉片的所有像素點作為感興趣區(qū)域,并對該感興趣區(qū)域求平均,以獲取ASL光譜數(shù)據(jù).
1.5 模型構(gòu)建本研究中,從樣本中隨機抽取118個樣本用于建模,余下29個樣品用于驗證模型的精度.本文采用偏最小二乘回歸進行模型的建立,偏最小二乘法是通過最小化誤差的平方和來找到數(shù)據(jù)的最佳匹配函數(shù),它兼并多種算法的特點,包括多元線性回歸分析、典型相關(guān)分析以及主成分分析,因此,偏最小二乘法在建立回歸模型上具有表達更全面信息的能力.為此,采用21組聚類簇光譜數(shù)據(jù)、隨機點平均光譜、ROI平均光譜、原始平均光譜數(shù)據(jù)來分別建立回歸模型,并且以均方根誤差(RMSE)、決定系數(shù)(R2)及相關(guān)系數(shù)作為評價模型預測精度的指標.
1.6 統(tǒng)計分析軟件采用Matlab 2017b對試驗數(shù)據(jù)進行統(tǒng)計分析.
2.1 橡膠樹葉片的氮含量本研究中,分別應用凱氏定氮法對所采集的147個橡膠樹葉片進行了葉片氮素含量參考值的測定.本研究根據(jù)所測得的橡膠樹葉片的氮素含量對其進行了劃分,其結(jié)果如下.
表1 本研究所用樣本的氮含量等級劃分
所采集的橡膠樹葉片樣本涵蓋了各個等級,這有利于建立精準模型.
2.2 橡膠樹葉片的光譜數(shù)據(jù)本研究所基于的SpecView高光譜儀采集的近紅外波段高光譜數(shù)據(jù)是一種三維數(shù)據(jù),它不僅具有光譜維信息,而且還具有空間維信息.為了驗證本研究所基于的假設,即不同采點區(qū)域光譜數(shù)據(jù)的特征不同,本研究以第十號葉片樣本的高光譜數(shù)據(jù)為例,采集了橡膠樹葉片高光譜數(shù)據(jù)不同采點區(qū)域的光譜數(shù)據(jù),如圖1所示.
圖1 橡膠樹葉片高光譜數(shù)據(jù)不同像素位置的光譜曲線
圖1是分別從高光譜數(shù)據(jù)的葉邊緣區(qū)域、葉肉區(qū)域、葉片側(cè)脈區(qū)域和主葉脈區(qū)域人為地選擇單一像素點對應的光譜數(shù)據(jù),即1*1*230的光譜數(shù)據(jù),各像素點光譜數(shù)據(jù)均有著相似的趨勢.在926 nm~1 300 nm區(qū)域均有著較高光譜反射率,在1 376 nm~1 526 nm存在明顯的下降趨勢,在1 450 nm區(qū)域有一個較高的吸收峰.
但是不同像素點光譜數(shù)據(jù)在反射率上存在較大的差異,在1 076 nm~1 100 nm區(qū)域和1 226 nm~1 376 nm區(qū)域,光譜反射率的差異尤為明顯.橡膠樹葉片不同選點區(qū)域的高光譜數(shù)據(jù)確實存在較大的光譜差異,這說明不同選點區(qū)域的內(nèi)部化學成分存在差異,這可能是因為不同氮素含量所導致.
2.3 PCA重加權(quán)結(jié)果原始平均光譜的采集過程等效于將高光譜數(shù)據(jù)中每個像素的光譜權(quán)重默認地設置為1,然而,對于高光譜數(shù)據(jù)而言,每個像素的光譜特征是不同的,均勻的權(quán)重不利于研究橡膠樹葉片高光譜數(shù)據(jù)的空間特性.從統(tǒng)計意義上講,方差越大意味著離散數(shù)據(jù)的波動越大,數(shù)據(jù)越分散, 因此,基于放大像素點權(quán)重差異的目的,本研究選擇PCA方法,在最大方差的反向上提取高光譜數(shù)據(jù)的空間特征,這為后續(xù)Kmeans算法提供了聚類依據(jù).
本研究中,采用了PCA重加權(quán)方式來探究橡膠樹葉片的高光譜數(shù)據(jù)的空間信息,所有樣本第一主成分PC1的貢獻率均大于85%,因此本研究中,選用PC1的特征向量作為重加權(quán)系數(shù).在本文中,我們比較了基于PCA重加權(quán)系數(shù)矩陣和原始系數(shù)矩陣(每個元素均為1)之間所有樣本的高光譜數(shù)據(jù)的投影方差,如圖2所示.
Variance6004002000050100150VarianceofPCAVarianceofOriginalSample圖2 原始高光譜數(shù)據(jù)投影方差和基于PCA重加權(quán)系數(shù)的投影方差圖3 PCA獲取的葉片樣本8的重加權(quán)系數(shù)矩陣
為了使得PCA獲取的重加權(quán)系數(shù)矩陣的結(jié)果更為直觀,對重加權(quán)矩陣進行了可視化操作(見圖3).
圖3中,黑色區(qū)域?qū)獧?quán)值最小的區(qū)域,白色區(qū)域?qū)獧?quán)值最大的區(qū)域,如圖所示,重加權(quán)矩陣在葉脈、葉邊緣、葉肉區(qū)域有明顯的區(qū)分.
結(jié)果表明,前者的投影方差明顯大于后者的投影方差.由于方差越大,數(shù)據(jù)的離散度就越大,因此在PCA加權(quán)矩陣方向上的投影確實會擴大樣本像素之間的差異. 圖3顯示了一個樣本的權(quán)重系數(shù)矩陣的可視化結(jié)果,可視化的權(quán)值矩陣可以明顯地區(qū)分出橡膠葉片的各個區(qū)域,即PCA重加權(quán)過程確實可以從高光譜立方體的巨大波段數(shù)據(jù)中找到合適的二維平面.
2.4 高光譜數(shù)據(jù)聚類的結(jié)果對比與分析為使得聚類選點的結(jié)果更加直觀,本論文對聚類的選點區(qū)域進行了可視化操作,其中,8號葉片樣本的PCA-Kmeans聚類可視化結(jié)果如下圖所示:圖4至圖6是類別2、3和6每個聚類簇的可視化圖像,圖中白色區(qū)域是與每個聚類簇數(shù)據(jù)集相對應的像素位置,僅在圖4(a)中展示了非葉片區(qū)域的聚類簇,而在其余圖中均不作展示.
聚類結(jié)果表明,隨著K的增大,葉片區(qū)域的區(qū)分越精細.如圖4所示,當K為3時,可以清楚地區(qū)分葉肉區(qū)和葉脈區(qū);如圖5所示,當K為4時,可進一步地區(qū)分出主葉脈和側(cè)葉脈;當K為7時,如圖6所示,可將葉片的簇數(shù)據(jù)集劃分得更加細膩,包括葉邊緣區(qū)域、葉肉區(qū)域、側(cè)脈區(qū)域和主脈區(qū)域.
abc圖5 類別3的各個聚類簇的可視化圖像
abcdef圖6 類別5的各個聚類簇的可視化圖像
2.5 最佳氮素敏感區(qū)域的選擇在橡膠樹的生長過程中,營養(yǎng)狀況、水分含量以及光照等因素都會影響橡膠樹葉片的尺寸和形狀,其大小具有隨機性,氮素敏感ROI區(qū)域的尺寸難以量化,因此本文提出了一種基于PCA-Kmeans的無監(jiān)督聚類方法,依據(jù)像素點的空間特征進行了ROI的劃分和選擇.
當重加權(quán)矩陣分別以K=2~7聚類時,相應的聚類有6種聚類類別,每個聚類類別中的高光譜數(shù)據(jù)被聚類成相應的K個簇數(shù)據(jù)集.由于橡膠樹葉片的高光譜數(shù)據(jù)具有非葉片區(qū)域和葉片區(qū)域,因此在每個類別的簇數(shù)據(jù)集中均包含了K-1個葉片區(qū)域簇ASC(Average Spectral of Cluster)和1個非葉片區(qū)域簇數(shù)據(jù)集ASC0.應當指出,category1的ASC1,即聚類類別1的第二個聚類簇數(shù)據(jù)集,其對應于高光譜數(shù)據(jù)的整個葉片區(qū)域的平均光譜.
本研究基于PCA-Kmeans法選擇了21組聚類簇平均光譜進行建模,其建模結(jié)果如表2,由表2可知,聚類類別2的ASC1聚類簇平均光譜所建立的模型的建模精度最佳,其R2達到0.957,RMSE為0.139 9.同時,聚類類別3的ASC2;聚類類別4的ASC2和聚類類別5的ASC3的模型精度也較好,其R2分別為0.941、0.934和0.943.
表2中比較了每個類別中所有ASC的建模結(jié)果,從表2可以看出,隨著K值的增加,每個類別的整體建模精度都會下降,因此,本論文僅研究了2≤K≤7時的聚類情況.基于類別2的ASC1數(shù)據(jù)的預測模型,其預測精度最高,R2達到0.957;基于類別6的ASC6的預測模型,其預測精度最差,但其R2也達到了0.863.
表2 基于所有聚類類別全部ASC所建模型的R2和RMSE對比
結(jié)合表2數(shù)據(jù)和圖4~6,始終發(fā)現(xiàn)基于葉肉區(qū)域聚類數(shù)據(jù)的模型,其準確性要優(yōu)于基于其他區(qū)域數(shù)據(jù)模型的準確性,例如,表2類別2的ASC 1的精度明顯優(yōu)于類別2中的ASC 2的精度.聚類ASC 1的光譜數(shù)據(jù)主要分布在葉肉區(qū)域,而ASC 2的光譜數(shù)據(jù)主要分布在葉肉區(qū)域.在類別3的所有建模案例中,最好的模型預測精度出現(xiàn)在ASC 2所建立的模型中,其對應的是葉肉區(qū)域的聚類簇光譜數(shù)據(jù).同樣,在類別4、5、6中,最佳建模精度也出現(xiàn)在基于葉肉聚類簇所建立的模型中.以葉肉簇數(shù)據(jù)建立的模型似乎總是伴隨著最佳的建模精度,而葉邊緣和葉脈簇的氮含量檢測模型的精度則稍差.
且隨著K增大,每個類別中各個簇區(qū)域的選點個數(shù)減小,其整體建模精度也在下降.該現(xiàn)象在葉邊緣區(qū)域和葉脈區(qū)域尤為明顯,其表現(xiàn)為隨著所選取的像素點光譜數(shù)據(jù)越多,其建模精度越高.
2.6 與傳統(tǒng)選點方式所建立的氮素檢測模型的比較表3展示了ASRS,ASL,ASROI和ASC的建模結(jié)果.其中,ASC為基于類別2的ASC 1數(shù)據(jù)的建模結(jié)果.在幾種選點方式的建模結(jié)果對比中,基于ASC數(shù)據(jù)的模型其精度最高,基于ASL的模型其精度略低于基于ASC數(shù)據(jù)的模型精度,但也高于基于其他兩個光譜數(shù)據(jù)的模型的精度.
基于ASRS的建模結(jié)果與其他三種選點方式的建模結(jié)果差異較大,在此對其光譜的譜形作以下分析.圖7和圖8分別顯示了ASRS和類別2的ASC 1的光譜圖像.
reflectance0.700.650.600.550.50107612261376wavelengthbreflectance0.80.60.40.292610761226137615261678wavelengtha圖7 ASRS數(shù)據(jù)的散點圖以及其局部區(qū)域的散點圖
reflectance0.700.650.600.550.50107612261376wavelengthbreflectance0.70.60.50.40.30.292610761226137615261678wavelengtha圖8 ASC數(shù)據(jù)的散點圖以及其局部區(qū)域的散點圖
ASRS和ASC數(shù)據(jù)在926 nm~1 678 nm波長范圍內(nèi)具有相同的趨勢,但是反射率的局部位置有較大差異,ASRS大部分樣本數(shù)據(jù)的反射率高于ASC樣本數(shù)據(jù)的反射率,同時ASRS數(shù)據(jù)的平滑程度較低,局部位置的波動比較明顯,而ASC數(shù)據(jù)的平滑程度相對理想.
ASRS的建模結(jié)果不理想,其決定系數(shù)R2較低,僅為0.638,均方根差為0.407 3. 雖然對于ASRS僅僅采集了18像素點光譜,但其建模結(jié)果遠低于現(xiàn)在所需的建模精度. 與基于ASRS數(shù)據(jù)所建立的模型相比, 基于ASROI數(shù)據(jù)所建立的模型其建模精度比ASRS的建模精度好,但與ASC和ASL的建模結(jié)果相比仍有一定的差距.ASC所需像素點光譜比ASL所需像素點光譜要少,而其基于類別2的ASC 1所建立的模型,其準確性高于基于ASL數(shù)據(jù)所建模型的準確性.由表3可以看出,本研究提出的模型比傳統(tǒng)方法建立的模型其精度更高,可以用于橡膠樹葉片氮素的快速無損檢測,并可為橡膠樹葉片氮素敏感區(qū)域的選取提供參考依據(jù).
表3 基于類別2聚類簇1、ASRS、ASROI和ASL所建模型的R2和RMSE對比
所以在具體檢測中,可以使用基于PCA-Kmeans的無監(jiān)督聚類方法來進行氮素敏感ROI區(qū)域的選擇.如果需要進行人工的ROI選取,可選取復數(shù)個尺寸較小的ROI區(qū)域,使得這些區(qū)域可以在避開主葉脈的同時避開側(cè)葉脈區(qū)域,僅采集并盡可能多地采集葉肉區(qū)域的光譜數(shù)據(jù).
實時監(jiān)測氮素含量,在橡膠樹精確施肥和橡膠產(chǎn)量評估的方面具有重要意義[31].基于氮素在橡膠樹葉片上分布不均勻的假設,本論文認為傳統(tǒng)的隨機選點方法不適用于橡膠樹葉片氮素模型的建立,因此有必要研究橡膠樹葉片的氮素敏感區(qū)域.通過PCA-Kmeans聚類光譜并結(jié)合PLSR建立模型,此法可用于檢測橡膠樹葉片的氮含量,傳統(tǒng)選點方法已應用于多項研究之上:黎小清等[31]在葉片非葉脈區(qū)域進行隨機點光譜選取,并通過基于零階導數(shù)和二次多項式下的SG平滑模式預處理建立了最優(yōu)的橡膠樹氮含量的PLS模型;鄭濤等[32]選用10×10單位像素矩陣來提取每個樣本的ROI平均光譜;劉燕清等[33]把贛南臍橙葉片的全葉片作為ROI區(qū)域,以全葉片平均光譜來研究葉片的氮含量.作為對比,在本次實驗中采用了上述傳統(tǒng)選點方法來建立模型,這些選點方法分別有隨機點平均光譜法、感興趣區(qū)域平均光譜法和原始平均光譜法.建模得到如下結(jié)果:ASRS-PLS:R2=0.638,RMSE=0.403 7;ASROI-PLS:R2=0.907,RMSE=0.205 9;ASL-PLS:R2=0.942,RMSE=0.162 3.本研究中采取了基于PCA-Kmeans的聚類選點方法,獲取了21組聚類簇平均光譜.基于該方法,本研究的建模結(jié)果以聚類類別2的第1組簇數(shù)據(jù)的模型預測精度最佳,其R2=0.957,RMSE=0.139 9,比傳統(tǒng)選點方法的模型精度高.這是由于和之前傳統(tǒng)的選點方法相比,本實驗在最大方差的方向上提取了高光譜數(shù)據(jù)的空間特征,并經(jīng)過Kmeans聚類,把相似權(quán)值的高光數(shù)據(jù)聚成一簇,由此,通過PLSR來探究橡膠樹葉片氮素的敏感區(qū)域,所以選點過程更具有針對性.
在本研究中,對不同聚類簇區(qū)域進行了建模分析,結(jié)果顯示,葉肉區(qū)域簇的建模精度總是比非葉肉區(qū)域簇的建模精度高.該結(jié)論與溫新[34]對于蘋果葉片氮素含量的反演結(jié)果具有相似的趨勢,且本研究的結(jié)果表明,遠葉柄的葉肉區(qū)域的光譜模型精度比近葉柄的葉肉區(qū)域的光譜模型精度高.
本研究基于氮素的不均勻分布特性,提取了橡膠樹葉片高光譜數(shù)據(jù)的空間-光譜信息,探究了橡膠樹葉片的氮素敏感區(qū)域.通過應用PCA-Kmeans聚類光譜并結(jié)合PLSR,可準確地預測橡膠樹葉片的氮含量.本研究提出的PCA-Kmeans聚類方法,進一步提高了基于高光譜數(shù)據(jù)的橡膠樹葉片氮素模型的精度,這為今后橡膠樹氮素含量的預測模型提供了理論依據(jù),同時也為橡膠樹葉片光譜診斷模型的在線選點過程提供了指導意見.本研究僅對橡膠樹葉片樣本的氮素敏感區(qū)域進行了研究,所采用的方法在其他營養(yǎng)元素的研究以及在其他作物葉片的氮素敏感區(qū)域問題上是否具有范化性還有待進一步的研究.
應用空間-光譜信息的聚類方法可探究橡膠樹葉片的氮素敏感區(qū)域,所建立的模型可實現(xiàn)橡膠樹葉片氮素的快速無損檢測.該方法可為橡膠樹氮素檢測模型的采集過程提供參考依據(jù),同時,也可為實現(xiàn)橡膠樹營養(yǎng)元素的快速無損檢測提供技術(shù)支持.