劉 丹,馬璐萍,李建昌,孫 磊,趙建國(guó),郝建軍
(河北農(nóng)業(yè)大學(xué) 機(jī)電工程學(xué)院,河北 保定 071001)
玉米整個(gè)生長(zhǎng)周期中需求量最大的營(yíng)養(yǎng)元素氮元素,主要來(lái)源于肥料的撒施,對(duì)玉米的生長(zhǎng)發(fā)育起到至關(guān)重要的作用,是表征玉米長(zhǎng)勢(shì)和進(jìn)行光合作用的關(guān)鍵[1-2]。因此,無(wú)損、高效、快速地檢測(cè)玉米的氮含量,是對(duì)其進(jìn)行科學(xué)管理的重要條件[3-5]。
傳統(tǒng)氮含量檢測(cè)通常采用凱氏定氮法和葉綠素檢測(cè)儀檢測(cè)法。如季曉菲等[6]利用凱氏定氮法對(duì)虉草的粗蛋白進(jìn)行測(cè)定,該方法對(duì)樣本具有破壞性,需要將待測(cè)物搗碎置入容器,進(jìn)行化學(xué)分析,并且需要專業(yè)人士進(jìn)行操作,步驟繁瑣,成本較高且容易因試劑、操作等問(wèn)題產(chǎn)生較大誤差;潘義宏等[7]使用葉綠素儀SPAD-502 對(duì)不同品種中部煙葉的SPAD值進(jìn)行測(cè)定,該方法是根據(jù)2 種不同波長(zhǎng)光濃度差計(jì)算葉綠素?cái)?shù)據(jù),再根據(jù)葉綠素與氮含量關(guān)系模型計(jì)算,較為粗放,且只能進(jìn)行點(diǎn)測(cè)定,對(duì)較大區(qū)域的葉片的誤差較大,測(cè)試點(diǎn)選取位置等因素都會(huì)對(duì)追氮產(chǎn)生較大影響。光譜檢測(cè)是1 項(xiàng)新興的技術(shù),與其他方法相比具有操作簡(jiǎn)單,分析速度快,準(zhǔn)確度高的優(yōu)勢(shì)[8-10],當(dāng)前多使用該方法檢測(cè)玉米葉片的氮含量,但由于光譜全波段自變量個(gè)數(shù)過(guò)多, 增加了建模的復(fù)雜程度,且由于自變量過(guò)多,易出現(xiàn)嚴(yán)重的多重共線性,會(huì)使回歸系數(shù)方差增大,增加不穩(wěn)定性,降低了建模的準(zhǔn)確率[11]。因此,業(yè)內(nèi)學(xué)者普遍通過(guò)提取特征波長(zhǎng)的方法,提取全波段中能夠表征光譜反射特性的波長(zhǎng)作為自變量進(jìn)行建模,降低維度,增加建模準(zhǔn)確性的同時(shí)減小計(jì)算工作量。王麗鳳等[12]通過(guò)連續(xù)投影算法提取玉米拔節(jié)期葉片的特征波長(zhǎng),在該波長(zhǎng)下,建立玉米葉片的氮含量與光譜反射率數(shù)學(xué)模型,取得了良好的建模預(yù)測(cè)效果。但是,玉米葉片氮含量特征波長(zhǎng)會(huì)隨著生長(zhǎng)時(shí)期的變化而發(fā)生變化,僅提取1 個(gè)時(shí)期的特征波長(zhǎng)建模分析不能代表玉米的整個(gè)生長(zhǎng)過(guò)程。提取各追肥關(guān)鍵期的玉米葉片的特征波長(zhǎng),分別建立預(yù)測(cè)模型,可以提高在各時(shí)期預(yù)測(cè)模型的準(zhǔn)確性,從而提高氮含量檢測(cè)的準(zhǔn)確度[13-15]。
筆者通過(guò)變量施肥進(jìn)行對(duì)照種植實(shí)驗(yàn),利用連續(xù)投影算法(SPA)分別提取玉米葉片在3 個(gè)追肥關(guān)鍵期(拔節(jié)期、大喇叭口期和抽雄期)的特征波長(zhǎng),從而剔除相關(guān)性強(qiáng)的波長(zhǎng)信息,減少自變量,降低建模的復(fù)雜程度,進(jìn)而通過(guò)多元線性回歸建立所提取的幾個(gè)特征波長(zhǎng)下反射率與玉米葉片氮含量的數(shù)學(xué)模型。
最后,再建立全波段下光反射率與玉米葉片氮含量的數(shù)學(xué)模型,分別預(yù)測(cè)玉米葉片的氮含量,通過(guò)比較2 個(gè)模型預(yù)測(cè)的準(zhǔn)確率,驗(yàn)證了本文提取的特征波長(zhǎng)真實(shí)、有效,可為模型的建立提供可靠的依據(jù),按照本文所提出的實(shí)驗(yàn)及分析方法得到的玉米3 個(gè)追肥關(guān)鍵期氮含量特征波長(zhǎng),能夠?yàn)闇?zhǔn)確、高效地建立玉米葉片氮含量預(yù)測(cè)模型提供支撐。
SPA 可以消除光譜之間的共線性,實(shí)現(xiàn)光譜數(shù)據(jù)的降維,常用于特征波長(zhǎng)的篩選,以降低建模復(fù)雜程度。通過(guò)計(jì)算吸光度矩陣中的1 個(gè)波長(zhǎng)對(duì)其他波長(zhǎng)的投影,選擇投影范圍最大的波長(zhǎng)作為該波長(zhǎng)序列的下個(gè)波長(zhǎng),依此進(jìn)行數(shù)據(jù)分析[16-18]。
Step 0:假設(shè)光譜矩陣為Xm×n(樣品數(shù)m,波長(zhǎng)n),從1 個(gè)波長(zhǎng)開(kāi)始,計(jì)算未選入波長(zhǎng)的投影,并將投影向量中最大的波長(zhǎng)引入波長(zhǎng)組合,進(jìn)行y次循環(huán)。
Step 1:初始波長(zhǎng)為k(0),迭代前(y=1),在訓(xùn)練集光譜矩陣Xm×n內(nèi)任意選擇1 個(gè)列向量xn,記為Xk(0),把未選入的波長(zhǎng)變量的集合記為S:
Step 2:計(jì)算xn對(duì)集合S中向量的投影Pxn;
Step 3:將投影Pxn代入,得到投影范圍內(nèi)最大的波長(zhǎng)位置:
Step 4:將最大的投影向量作為下一次運(yùn)算的投影向量:
Step 5:令n=n+1,若n<N,返回重新進(jìn)行波長(zhǎng)的選擇。
筆者選用穩(wěn)定系數(shù)高的10 組‘鄭單958’作為試驗(yàn)品種,并將其種植在種植箱中。其中1 組不施氮肥,作為對(duì)照組,其余9 組施不同量的氮肥。
筆者選用的1100 便攜式地物光譜儀(PSR-1100)波長(zhǎng)范圍為320 ~1 100 nm,分辨率小于等于 3.2 nm,光譜精度5 nm,光譜采樣點(diǎn)間隔為1 nm。
玉米拔節(jié)期,大喇叭口期和抽雄期的長(zhǎng)勢(shì)圖分別如圖1a,1b 和1c 所示。
圖1 玉米葉片3 個(gè)時(shí)期的長(zhǎng)勢(shì)圖Fig.1 Growth pattern of maize leaves in three periods
首先在玉米3 個(gè)關(guān)鍵追肥期截取長(zhǎng)勢(shì)良好的葉片,將置于暗室的光譜儀標(biāo)定后提取原始光譜數(shù)據(jù)。由于原始光譜數(shù)據(jù)存在影響SPA 提取特征波長(zhǎng)準(zhǔn)確性的量級(jí)和噪聲,所以將原始光譜數(shù)據(jù)分別經(jīng)過(guò)標(biāo)準(zhǔn)歸一化[19](SNV)和卷積平滑[20](SG)處理,3 個(gè)時(shí)期分別如圖2a,2b 和2c 所示。
圖2 玉米葉片的原始光譜、標(biāo)準(zhǔn)歸一化、卷積平滑圖像Fig.2 Original spectrum, standard normalization, convolution smooth spectrogram of maize leaves
圖2a,2b 和2c 分別為拔節(jié)期,大喇叭口期和抽雄期3 個(gè)關(guān)鍵追肥期的光譜數(shù)據(jù)圖,在圖中對(duì)比了原始光譜數(shù)據(jù)曲線,標(biāo)準(zhǔn)歸一化數(shù)據(jù)曲線和卷積平滑數(shù)據(jù)曲線。原始光譜數(shù)據(jù)圖中的不同變量會(huì)存在不同的單位和不同程度的變異。不同的單位會(huì)使系數(shù)的時(shí)間解釋發(fā)生困難,需要通過(guò)標(biāo)準(zhǔn)歸一化消除量綱、變量自身大小和數(shù)值大小的影響;光譜數(shù)據(jù)圖中存在隨機(jī)噪聲,通過(guò)卷積平滑去掉光譜圖中“毛刺”,保留分析信號(hào)中有用的信息,使整個(gè)圖譜更加平滑,可以增加提取特征波長(zhǎng)的準(zhǔn)確性[21-22]。
本文在320 ~1 100 nm 的波段下提取玉米3 個(gè)關(guān)鍵追肥期的特征波長(zhǎng)。將經(jīng)過(guò)預(yù)處理后的光譜數(shù)據(jù),使用MATLAB7.0 軟件通過(guò)連續(xù)投影算法提取特征波長(zhǎng)。拔節(jié)期,大喇叭口期和抽雄期的特征波長(zhǎng)提取圖如圖3a,3b 和3c 所示。
圖3 3 個(gè)關(guān)鍵追氮期的特征波長(zhǎng)提取圖Fig.3 Characteristic wavelength extraction diagram of the three key nitrogen topdressing periods
由圖3 可知,拔節(jié)期玉米葉片的特征波長(zhǎng)分別為: 321、349、509、633、690、901 和1 083 nm;大喇叭口期的特征波長(zhǎng)分別為:321、510、603、684、821、894 和1 076 nm;抽雄期的特征波長(zhǎng)分別為:323、344、529、610、690、764 和854 nm。SPA的x軸默認(rèn)設(shè)置從0 開(kāi)始,由于光譜儀的起始波長(zhǎng)為320 nm,將提取的數(shù)值分別加320 nm,得到玉米葉片的特征波長(zhǎng)。由表1 可知通過(guò)SPA 提取的3 個(gè)關(guān)鍵追肥期的各7 個(gè)特征波長(zhǎng),僅占全波段的0.9%,剔除了冗余數(shù)據(jù),提取了特征信息明顯的自變量,從而降低了建模的復(fù)雜程度。均方根誤差均不大于0.1%,SPA 提取的特征波長(zhǎng)準(zhǔn)確度高,可提高玉米葉片氮含量預(yù)測(cè)的準(zhǔn)確性,為后續(xù)減量施肥的宏觀調(diào)控提供依據(jù)。
表1 連續(xù)投影算法提取的特征波長(zhǎng)Table 1 Characteristic wavelengths extracted by successive projection algorithm
本試驗(yàn)采集100 組樣本集作為建模集,使用20組樣本作為預(yù)測(cè)集,基于100 組建模集多元線性回歸建立模型,20 組模型作為模型校驗(yàn),通過(guò)比較在全波段和特征波段下建模并預(yù)測(cè)得到的預(yù)測(cè)值[23-25], 可知特征波段下預(yù)測(cè)的更準(zhǔn)確(圖4)。圖4a 是玉米葉片3 個(gè)關(guān)鍵追肥期在全波段下通過(guò)多元線性回歸建模預(yù)測(cè)玉米葉片氮含量的擬合圖,由于均方誤差MSE的值越小,說(shuō)明預(yù)測(cè)模型描述實(shí)驗(yàn)數(shù)據(jù)越精確;通過(guò)實(shí)驗(yàn)得到拔節(jié)期全波段建模的MSE=4.31;大喇叭口期MSE=17.384;抽雄期MSE=3.34,其擬合效果較差;圖4b 是玉米葉片3 個(gè)關(guān)鍵追氮期玉米葉片的氮含量在特征波長(zhǎng)下通過(guò)多元線性回歸建模進(jìn)行預(yù)測(cè)的擬合圖,通過(guò)實(shí)驗(yàn)得到拔節(jié)期特征波長(zhǎng)下的MSE=0.104;大喇叭口期MSE=0.325,抽雄期MSE=0.135,說(shuō)明本文所得到的3 個(gè)追肥關(guān)鍵期特征波長(zhǎng)較為準(zhǔn)確,據(jù)此所建模型具有較好預(yù)測(cè) 準(zhǔn)確性。
圖4 多元線性回歸實(shí)測(cè)值和預(yù)測(cè)值的擬合檢測(cè)圖Fig.4 Fitting detection diagram of measured and predicted values in multiple linear regression
多元線性回歸建模得到的玉米葉片氮含量預(yù)測(cè)值與實(shí)測(cè)值準(zhǔn)確率如圖5 所示。
圖5 全波段和特征波長(zhǎng)下準(zhǔn)確率圖Fig.5 Accuracy diagram at full wavelength and characteristic wavelength
紅色曲線為在特征波長(zhǎng)下進(jìn)行建模得到的預(yù)測(cè)準(zhǔn)確率,藍(lán)色曲線為全波段建模預(yù)測(cè)準(zhǔn)確率。由圖5 可知,在筆者所提取的特征波長(zhǎng)下建模,3 個(gè)追肥關(guān)鍵期氮含量預(yù)測(cè)準(zhǔn)確率較高,而全波段建模準(zhǔn)確率較低,且波動(dòng)較大。可知在特征波長(zhǎng)下建模得到的預(yù)測(cè)值比在全波段下建模得到的預(yù)測(cè)值準(zhǔn)確。
在進(jìn)行多元線性回歸分析時(shí),由于自變量數(shù)據(jù)量大,較易出現(xiàn)自變量之間彼此相關(guān)的多重共線性問(wèn)題,導(dǎo)致重要的自變量被排除在模型之外,使常數(shù)項(xiàng)失真,造成模型的預(yù)測(cè)不準(zhǔn)確。如圖4 所示,對(duì)比可得全波段下擬合效果較差。如圖5 所示,3個(gè)追肥關(guān)鍵期全波段下建模預(yù)測(cè)值的準(zhǔn)確率在曲線波動(dòng)范圍較大,預(yù)測(cè)準(zhǔn)確率較低。通常需要在自變量過(guò)多導(dǎo)致嚴(yán)重的多重共線性的情況下降維來(lái)減少自變量的數(shù)量,如:逐步回歸法,嶺回歸法等,但是選用這些方法解決多重共線性的問(wèn)題,需要每次預(yù)測(cè)前降維,過(guò)程較為繁瑣。筆者通過(guò)SPA 提取的特征波長(zhǎng)是全波段中相關(guān)性最小的自變量,既達(dá)到了降維的目的,使其可以直接在特征波長(zhǎng)下建模,降低運(yùn)算的復(fù)雜程度,又顯著提高了建模的準(zhǔn)確性,如圖5 所示3 個(gè)關(guān)鍵追氮期特征波長(zhǎng)下建模預(yù)測(cè)值接近實(shí)測(cè)值,準(zhǔn)確率基本在90%以上,曲線波動(dòng)較小,預(yù)測(cè)準(zhǔn)確率高。
綜上所述,在筆者提取的特征波長(zhǎng)下建模預(yù)測(cè)玉米葉片的氮含量比全波段下準(zhǔn)確率高。因此按照本文方法得到的各關(guān)鍵追肥期的特征波長(zhǎng)具有較高的可靠性和有效性,可有效降低運(yùn)算速度和復(fù)雜程度,提高運(yùn)算效率。
高效、快速監(jiān)測(cè)玉米的生長(zhǎng)情況并及時(shí)提供玉米生命周期中所需的營(yíng)養(yǎng)物質(zhì)是玉米高產(chǎn)的重要保障。氮是玉米整個(gè)生長(zhǎng)發(fā)育過(guò)程中最重要的元素之一,可以反映玉米的生長(zhǎng)情況。玉米葉片各關(guān)鍵追肥期的特征波長(zhǎng)分布規(guī)律相似,但具體波長(zhǎng)存在差異,以某一時(shí)期特征波長(zhǎng)作為降維建模依據(jù)會(huì)導(dǎo)致氮含量預(yù)測(cè)值出現(xiàn)偏差。筆者以‘鄭單958’玉米為研究對(duì)象,獲取長(zhǎng)勢(shì)良好的玉米葉片各關(guān)鍵追肥期的特征波長(zhǎng)和氮含量,按照筆者所提取的3 個(gè)追肥關(guān)鍵時(shí)期特征波長(zhǎng)進(jìn)行建模,準(zhǔn)確率均在90%以上,RMSEP均小于0.1%,證明筆者所提特征波長(zhǎng)具有較高準(zhǔn)確性和可靠性,能夠有效地為追氮關(guān)鍵期玉米葉片氮含量預(yù)測(cè)提供重要支撐;同時(shí),筆者采取方法運(yùn)算復(fù)雜度較低,可以用于后續(xù)的實(shí)驗(yàn)和建模。