劉秀英,余俊茹,王世華
(1.河南科技大學(xué)農(nóng)學(xué)院,洛陽 471023;2.洛陽市共微生物與綠色發(fā)展重點(diǎn)實(shí)驗(yàn)室,洛陽 471023;3.洛陽市植物營(yíng)養(yǎng)與環(huán)境生態(tài)重點(diǎn)實(shí)驗(yàn)室,洛陽 471023)
種子水分是評(píng)定種子質(zhì)量的重要指標(biāo)之一,通過種子水分測(cè)定,能夠及時(shí)采取措施,防止種子發(fā)熱、霉變、生蟲,避免造成種子變質(zhì),是保證種子質(zhì)量的重要手段[1]。傳統(tǒng)測(cè)定種子含水率的方法是室內(nèi)烘干稱重法,該方法測(cè)定結(jié)果準(zhǔn)確,但比較繁瑣,測(cè)定時(shí)間較長(zhǎng)。其他的直接或間接含水率測(cè)定方法雖然也較多,但都存在某些方面的缺點(diǎn),具有不同的適用范圍[2-3]。已有研究表明水分速測(cè)儀具有使用簡(jiǎn)單、測(cè)定迅速的特點(diǎn),但其測(cè)試結(jié)果的準(zhǔn)確性與適宜的溫度條件、種子的品種及質(zhì)量范圍有密切的關(guān)系[4]。目前,市場(chǎng)上種子水分快速檢測(cè)設(shè)備較多,但多數(shù)儀器適合測(cè)定特定的品種,需要適宜的工作環(huán)境,測(cè)定水分的范圍因品種而異。且油脂類種子含有不飽和脂肪酸,在研磨、剪切、加熱過程中容易氧化,因而較多方法和儀器并不適合進(jìn)行油脂類種子含水率測(cè)定[2]。
近紅外光譜分析技術(shù)(Near Infrared Reflectance Spectroscopy,NIRS)是20世紀(jì)80年代發(fā)展起來的一項(xiàng)物理檢測(cè)技術(shù)。與傳統(tǒng)分析方法相比,該技術(shù)具有檢測(cè)速度快、非破壞性、無損樣品等優(yōu)點(diǎn),尤其適用于農(nóng)產(chǎn)品品質(zhì)分析[5-7]和食品品質(zhì)檢測(cè)[8-9]領(lǐng)域。由于在近紅外光譜區(qū),水的O-H基團(tuán)泛音和組合帶非常明顯,因此該技術(shù)的發(fā)展為種子含水率的測(cè)定提供了新的方法[10]。國(guó)內(nèi)外學(xué)者采用近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法特別是偏最小二乘方法對(duì)種子含水率的快速檢測(cè)進(jìn)行了研究,其估算精度差異較大[10-15]。
人工神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)性、容錯(cuò)性、實(shí)時(shí)性等優(yōu)點(diǎn),能夠?qū)W習(xí)和模擬任意復(fù)雜的非線性函數(shù),因而被越來越多的應(yīng)用于可見/近紅外光譜分析[13,15-16]。牡丹籽油富含人體需要的氨基酸、維生素、不飽和脂肪酸(含量高達(dá)92%以上)等多種成分,其中“植物腦黃金”α-亞麻酸占42%左右[17],并且油用牡丹種子出油率較高,因此油用牡丹成為了一種新興的高端木本油料作物。含水率是衡量油用牡丹種子質(zhì)量、影響牡丹籽油品質(zhì)的重要指標(biāo),因而在銷售、儲(chǔ)存及加工過程中需要進(jìn)行快速、準(zhǔn)確測(cè)量。然而以油用牡丹種子為研究對(duì)象,使用BP神經(jīng)網(wǎng)絡(luò)模型反演種子含水率的研究目前尚不多見。為此,本研究以油用牡丹種子為研究對(duì)象,通過相關(guān)分析選擇特征變量作為自變量,建立一元線性回歸模型,然后將從中優(yōu)選的參數(shù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入,油用牡丹種子含水率作為輸出,建立含水率BP神經(jīng)網(wǎng)絡(luò)估算模型,并對(duì)比分析一元線性回歸(SLR,Simple Linear Regression)模型、逐步多元線性回歸(SMLR,Stepwise Multiple Linear Regression)模型、偏最小二乘回歸(PLSR,Partial Least-squares Regression)模型和BP神經(jīng)網(wǎng)絡(luò)(BPNN,BP Neural Network)模型的估算精度,旨在探索油用牡丹種子含水率高光譜估算的最優(yōu)模型,提高油用牡丹種子含水率反演精度,為促進(jìn)中國(guó)牡丹產(chǎn)業(yè)發(fā)展及糧油生產(chǎn)、保障國(guó)家糧油安全提供理論依據(jù)和技術(shù)支持。
本研究收集了2個(gè)年份(即:2016年和2017年)、不同產(chǎn)地(即:安徽安慶、毫州、銅陵;河南洛陽;山東曹縣、吏口、平陰;四川德陽、眉山、資陽)、不同品種(“鳳丹”和“紫斑”)的油用牡丹種子 156份。分年份收集種子樣品后,首先進(jìn)行人工目視篩選,選擇顆粒比較飽滿、大小均勻一致的種子充分進(jìn)行自然干燥,盡可能的去除種子中的含水率。然后分裝在密封袋內(nèi),其中,山東曹縣、平陰、吏口的種子根據(jù)年份、品種不同分成6個(gè)平行樣,共獲得72個(gè)樣本,設(shè)置3個(gè)梯度;而其他省份不同地區(qū)的樣本根據(jù)年份、品種不同分成 3個(gè)平行樣,共獲得84個(gè)樣本,同樣設(shè)置3個(gè)梯度,每份種子樣本約30 g,( 135±10)顆,正好裝滿75 mm培養(yǎng)皿(見圖1),并根據(jù)年份、產(chǎn)地、品種不同進(jìn)行編號(hào)。然后將不同梯度樣本放入烘箱干燥,通過調(diào)節(jié)烘干的時(shí)間,形成不同的水分梯度,樣本含水率范圍為 0.22%~5.77%,詳細(xì)參數(shù)見表1。
圖1 單個(gè)油用牡丹種子樣本Fig.1 Single sample of oil tree peony seeds
表1 油用牡丹種子樣本含水率的統(tǒng)計(jì)特征Table 1 Statistical characteristic of moisture content measured oil tree peony seed samples
含水率測(cè)定:種子含水率測(cè)定采用常壓烘箱干燥法,依照GB/T 5009.3—2003進(jìn)行。
光譜數(shù)據(jù)采集:采用美國(guó)Spectra Vista公司的SVC HR-1024i便攜式光譜儀測(cè)定置于黑色背景上裝滿75 mm培養(yǎng)皿的油用牡丹種子光譜,該儀器的光譜范圍 350~2 500 nm。在波長(zhǎng)350~1 000 nm,光譜分辨率≤3.5 nm;1 000~1 850 nm,光譜分辨率≤9.5 nm;1 850~2 500 nm,光譜分辨率≤6.5 nm。光源為功率50 W鹵素?zé)?,光源入射角?45°;探頭視場(chǎng)角為 8°,垂直放置于目標(biāo)物正上方。儀器開機(jī)預(yù)熱30 min,然后將油用牡丹種子樣本裝盤,從4個(gè)方向?qū)悠愤M(jìn)行掃描,每個(gè)方向掃描3次,一個(gè)樣品總共掃描12次,去掉異常線后求平均值作為該樣品的光譜值。
通過對(duì)種子近紅外吸收光譜、一階微分值與含水率的相關(guān)分析,選擇相關(guān)系數(shù)絕對(duì)值大于0.85的波段即特征波長(zhǎng)吸收光譜及其特征波長(zhǎng)一階微分光譜作為自變量構(gòu)建含水率的一元線性回歸估算模型;將水分吸收特征參數(shù)與含水率進(jìn)行相關(guān)分析,選擇相關(guān)系數(shù)絕對(duì)值大于0.85的參數(shù)作為自變量構(gòu)建含水率的一元線性回歸估算模型。為了進(jìn)一步簡(jiǎn)化及優(yōu)化模型,構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型、多元線性回歸模型和偏最小二乘回歸模型時(shí),選用的輸入變量為構(gòu)建一元線性回歸模型時(shí),建模及驗(yàn)?zāi)?shù)R2大于0.8,驗(yàn)?zāi)MSE小于0.5%,而RPD大于2.5的變量。
為了驗(yàn)證模型的預(yù)測(cè)精度,采用獨(dú)立驗(yàn)證樣本將模型預(yù)測(cè)值和實(shí)測(cè)值進(jìn)行回歸擬合,以預(yù)測(cè)決定系數(shù)(R2)、均方根誤差(RMSE)及相對(duì)預(yù)測(cè)偏差(RPD)作為指標(biāo)評(píng)價(jià)模型的學(xué)習(xí)能力和預(yù)測(cè)能力。RPD值可以解釋模型的預(yù)測(cè)能力,其評(píng)價(jià)采用 Chang等[18]提出的閾值劃分標(biāo)準(zhǔn)。R2及RPD值越大,RMSE越小,表明模型的精度越高。綜合建模和驗(yàn)?zāi)>葯z驗(yàn)結(jié)果,選擇出最優(yōu)估算模型。
圖2和圖3為不同含水率油用牡丹種子樣本的近紅外吸收光譜及吸收特征曲線。由圖2可以看出,油用牡丹種子的近紅外吸收光譜隨含水率增加而增大,在整個(gè)波段范圍內(nèi),光譜曲線總體變化比較明顯,具有多個(gè)波峰、波谷;此外,光譜曲線具有相似的變化規(guī)律,在1 200、1 440、1 930、2 140 nm波長(zhǎng)附近有強(qiáng)烈的吸收峰,隨含水率增加吸收峰強(qiáng)度具有增大的趨勢(shì),而吸收峰位置具有朝長(zhǎng)波方向偏移的趨勢(shì)。依據(jù)前人研究可知,1 400、1 900和2 100 nm波長(zhǎng)附近的吸收峰是由于水分的強(qiáng)吸收引起的[10,19-20],因而采用包絡(luò)線法制作了吸收深度曲線圖(圖3)。從圖3中可以看出,吸收深度最大的波長(zhǎng)位于3個(gè)水分吸收帶,具體位置為1 440、1 930、2 140 nm波長(zhǎng)附近。當(dāng)油用牡丹種子含水率發(fā)生變化時(shí),1 930 nm波長(zhǎng)處的波段寬度最窄;2 140 nm波長(zhǎng)處的吸收深度及吸收面積變化最明顯,1 440 nm波長(zhǎng)處的吸收深度參數(shù)變化最小。因而可以提取1 440、1 930、2 140 nm波長(zhǎng)附近的水分吸收特征參數(shù)進(jìn)行油用牡丹種子含水率反演。
圖2 油用牡丹種子的近紅外吸收光譜Fig.2 Near infrared spectrogram of oil tree peony seeds
圖3 油用牡丹種子的光譜吸收深度曲線Fig.3 Spectral absorption depth curves of oil tree peony seeds
對(duì)油用牡丹種子近紅外吸收光譜及一階微分光譜與含水率進(jìn)行相關(guān)分析,其相關(guān)系數(shù)見圖4。依據(jù)相關(guān)系數(shù)較大且位于 3個(gè)水分吸收帶附近的原則,分別選取了 3個(gè)特征波長(zhǎng)光譜及 3個(gè)特征波長(zhǎng)一階微分光譜變量(見圖4)用于后續(xù)分析建模,其相關(guān)系數(shù)大小見表2。分析表2可知,特征波長(zhǎng)光譜及特征波長(zhǎng)一階微分光譜與含水率的相關(guān)性較好,相關(guān)系數(shù)較高,均通過了0.01極顯著性檢驗(yàn)。特征波長(zhǎng)光譜變量與含水率的相關(guān)系數(shù)介于0.83~0.90之間,而特征波長(zhǎng)一階微分光譜變量與含水率的相關(guān)系數(shù)均大于 0.91,介于 0.91~0.96之間,后者的相關(guān)性明顯高于前者。選擇這3個(gè)特征波長(zhǎng)光譜及3個(gè)特征波長(zhǎng)一階微分光譜變量參與一元線性含水率估算模型的構(gòu)建。
對(duì)光譜進(jìn)行包絡(luò)線去除后,提取水分吸收特征波段1 440、1 930、2 140 nm處的水分吸收特征參數(shù),包括:最大吸收深度(D)、吸收總面積(A)、吸收峰右面積(RA)、吸收峰左面積(LA)、面積歸一化最大吸收深度(AD),及吸收波段波長(zhǎng)位置(P)。將提取的吸收特征參數(shù)與含水率進(jìn)行相關(guān)分析,其相關(guān)系數(shù)的大小見表3。從表3可知,除P1930無法計(jì)算,LA1440、D2140、RA2140與含水率的相關(guān)系數(shù)在0.05水平上相關(guān)外,其余各參數(shù)與含水率的相關(guān)性均達(dá)到了 0.01水平極顯著相關(guān)。其中,面積歸一化最大吸收深度(AD)與含水率的相關(guān)性最好,兩者間的相關(guān)系數(shù)均大于0.9。比較3個(gè)波段位置的吸收特征參數(shù)與含水率的相關(guān)系數(shù)可知,2 140 nm波長(zhǎng)處的吸收特征參數(shù)與含水率的相關(guān)性明顯優(yōu)于另外兩個(gè)波長(zhǎng)位置的參數(shù)??傮w來看,吸收特征參數(shù)與含水率的相關(guān)系數(shù)高于0.85的有7個(gè),說明這些吸收特征參數(shù)對(duì)含水率變化更敏感,因而選擇這 7個(gè)吸收特征參數(shù)作為變量參與一元線性含水率估算模型的構(gòu)建。
圖4 近紅外吸收光譜、一階微分光譜與含水率的相關(guān)性Fig.4 Correlation between near infrared absorption spectra and first derivative of spectra and moisture content
表2 油用牡丹種子特征波長(zhǎng)光譜與含水率的相關(guān)系數(shù)Table 2 Correlation coefficients between characteristic wavelength spectrum of oil tree peony seed and moisture content
2.3.1 含水率的一元線性回歸估算模型
建立 13個(gè)光譜特征變量與含水率的一元線性估算模型,然后采用獨(dú)立樣本進(jìn)行驗(yàn)證,其建模及驗(yàn)?zāi)?shù)見表4。分析表4可知,除R1410和S1930這2個(gè)變量建立的線性估算模型的驗(yàn)證RPD值小于2.0外,其余變量建立的一元線性估算模型的驗(yàn)證RPD值均大于2.0,校正及驗(yàn)證R2均大于0.75,說明這些變量建立的模型均能用于油用牡丹種子含水率快速、無損檢測(cè)。3個(gè)特征波長(zhǎng)一階微分光譜建立的估算模型效果均較好,建模及驗(yàn)?zāi)2和RPD值均較大,而RMSE值均較小,尤其以DF1950、DF2080這2個(gè)參數(shù)建立的模型估算效果更佳,其建模及驗(yàn)?zāi)2均高于0.92,RPD值高于4.0,而RMSE值小于0.4%。
表3 油用牡丹種子水分吸收特征參數(shù)與含水率的相關(guān)系數(shù)Table 3 Correlation coefficients between absorptioncharacteristics parameters of oil tree peony seed and moisture content
吸收特征參數(shù)中以面積歸一化吸收深度參數(shù)建立的估算模型效果最好,尤其以AD2140建立的估算模型效果最佳,其建模及驗(yàn)?zāi)2高于0.94,RPD值高于4.0,而RMSE值小于0.4%。綜合分析比較一元線性模型的建模及驗(yàn)?zāi)5母黜?xiàng)參數(shù)值可知,以DF2080和AD2140為自變量建立的模型優(yōu)于其他光譜特征變量建立的模型,都能對(duì)含水率進(jìn)行很好的估算;而且這2個(gè)模型建模及驗(yàn)?zāi)8黜?xiàng)參數(shù)幾乎相同,相比較而言,以DF2080為自變量建立的模型均方根誤差RMSEv較小,而RPDv值較大所以該模型為一元線性模型中的最優(yōu)估算模型。由于一元線性模型只是應(yīng)用了一個(gè)光譜特征變量建模,為了進(jìn)一步提高含水率預(yù)測(cè)精度,依據(jù)建模及驗(yàn)?zāi)?shù)R2大于0.8,RMSEv小于0.5%,而RPDv大于2.5的原則,從13個(gè)光譜特征變量中進(jìn)一步優(yōu)選出 5個(gè)光譜特征變量(即 DF1150、DF1950、DF2080、AD1930、AD2140)用于逐步多元線性回歸、偏最小二乘回歸及人工神經(jīng)網(wǎng)絡(luò)建模。
表4 基于光譜特征變量的油用牡丹種子含水率估算模型參數(shù)Table 4 The model parameters of moisture content in oil peony seed based on spectral characteristic variable
2.3.2 含水率的BP神經(jīng)網(wǎng)絡(luò)模型
以優(yōu)選出來的5個(gè)光譜特征變量(DF1150、DF1950、DF2080、AD1930、AD2140)作為輸入層,油用牡丹種子實(shí)測(cè)含水率作為輸出層,隱含層節(jié)點(diǎn)數(shù)q根據(jù)經(jīng)驗(yàn)公式(1)[21]給定的范圍,通過試錯(cuò)法多次訓(xùn)練后選出最佳節(jié)點(diǎn)數(shù)為5,建立一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)為5-5-1的BP神經(jīng)網(wǎng)絡(luò)模型。
式中k為輸入層單元數(shù);m為輸出層單元數(shù);α為[1,10]之間的常數(shù)。
利用Matlab編程進(jìn)行BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,為了使網(wǎng)絡(luò)在訓(xùn)練階段容易收斂,首先對(duì)輸入輸出變量進(jìn)行歸一化處理[22];網(wǎng)絡(luò)中間層神經(jīng)元傳遞函數(shù)采用 S型正切函數(shù)Tansig,輸出層神經(jīng)元傳遞函數(shù)采用線性函數(shù) Purelin,訓(xùn)練函數(shù)為 trainlm[23]。通過 BP神經(jīng)網(wǎng)絡(luò)分析得到含水率的預(yù)測(cè)值,然后對(duì)獨(dú)立驗(yàn)證樣本的實(shí)測(cè)值與預(yù)測(cè)值進(jìn)行擬合及精度檢驗(yàn),結(jié)果見表5。模型的訓(xùn)練值和目標(biāo)值均方根誤差RMSE為0.220%,相關(guān)系數(shù)為0.989,相對(duì)分析誤差RPD值為6.478,模擬結(jié)果很好。預(yù)測(cè)值和實(shí)測(cè)值的均方根誤差RMSE為0.242%,預(yù)測(cè)值和實(shí)測(cè)值相關(guān)系數(shù)達(dá)到 0.986,相對(duì)分析誤差RPD值為5.889,模型預(yù)測(cè)效果也非常好。綜上所述,BP神經(jīng)網(wǎng)絡(luò)模型的建模及驗(yàn)證精度都非常高,可進(jìn)行油用牡丹種子含水率精確估算,幾乎可以與實(shí)驗(yàn)室測(cè)量結(jié)果相媲美。
2.3.3 BP神經(jīng)網(wǎng)絡(luò)模型與回歸模型的比較
將BP神經(jīng)網(wǎng)絡(luò)模型與一元線性回歸模型、逐步多元線性回歸模型以及目前在含水率預(yù)測(cè)中應(yīng)用非常廣泛的偏最小二乘回歸模型進(jìn)行比較,其結(jié)果見表5。為了保證模型具有可比性,建立SMLR模型和PLSR模型時(shí),選取與構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型相同的自變量(即優(yōu)選的 5個(gè)光譜特征變量 DF1150、DF1950、DF2080、AD1930、AD2140)作為輸入變量,并采用相同的獨(dú)立樣本進(jìn)行驗(yàn)證。表5列出了不同估算模型的建模及驗(yàn)證結(jié)果。結(jié)果表明,BPNN模型的建模效果最好,建模決定系數(shù)R2為0.978,RMSE為0.220%;其次為多元線性模型,建模決定系數(shù)R2為0.961,RMSE為0.289%。就模型檢驗(yàn)效果而言,BP神經(jīng)網(wǎng)絡(luò)模型驗(yàn)證效果仍然最佳,其次為多元線性模型,均優(yōu)于PLSR模型和一元線性模型。PLSR模型驗(yàn)證決定系數(shù)Rv2為0.955,RMSEv和 RPDv分別為 0.242%和 5.889,預(yù)測(cè)精度略低于 BP神經(jīng)網(wǎng)絡(luò)模型和逐步多元線性模型;而一元線性模型無論是建模還是驗(yàn)?zāi)PЧ畈睢5?,一元線性模型僅用了一個(gè)光譜特征變量建模,從建模及驗(yàn)?zāi)8黜?xiàng)參數(shù)來看估算效果也比較好,精度比較高。由于該方法最簡(jiǎn)單且容易操作,在能夠滿足油用牡丹種子含水率估算的精度情況下,不失為優(yōu)先選擇的估算方法。綜合比較4類模型的建模及驗(yàn)?zāi)8黜?xiàng)參數(shù)可知,4類模型的預(yù)測(cè)精度都比較高,而BPNN模型的預(yù)測(cè)效果最好,其次是多元線性估算模型。
表5 不同估算模型的建模及驗(yàn)證結(jié)果Table 5 Modeling and testing results under different estimation
種子的近紅外光譜是其各種組成成分及其內(nèi)、外結(jié)構(gòu)的綜合表現(xiàn),兩者之間存在著密切關(guān)系。油用牡丹種子樣品中含有大量的C-H、O-H、N-H等含氫基團(tuán),因而在近紅外光譜圖中出現(xiàn)很強(qiáng)烈的吸收,形成吸收峰。但是高光譜數(shù)據(jù)具有波段多、數(shù)據(jù)量大、冗余性強(qiáng)等特點(diǎn),若直接用全波段數(shù)據(jù)進(jìn)行數(shù)據(jù)建模就會(huì)導(dǎo)致建模效率低、模型的性能差[24],因此本研究通過相關(guān)分析篩選出了不同油用牡丹種子含水率的敏感波長(zhǎng),有利于構(gòu)建較高精度的、比較簡(jiǎn)單的估測(cè)模型。將近紅外吸收光譜、一階微分光譜與含水率進(jìn)行相關(guān)分析,結(jié)果表明一階微分光譜與含水率的相關(guān)性明顯高于近紅外吸收光譜。通過相關(guān)分析選擇了相關(guān)系數(shù)較大且位于水分吸收波長(zhǎng)附近的3個(gè)特征波長(zhǎng)1 410、1 900、1 990 nm處的吸收光譜,和3個(gè)特征波長(zhǎng)1 150、1 950、2 080 nm處的一階微分光譜作為變量,參與一元線性回歸建模,結(jié)果表明特征波長(zhǎng)一階微分光譜建立的模型預(yù)測(cè)效果更好,究其原因可能是一階微處分光譜可以部分消除線性或接近線性噪聲的影響[23]。已有研究表明,含水率不同時(shí)吸收光譜的吸收峰的位置會(huì)產(chǎn)生偏移,通過微分變換可以進(jìn)一步增強(qiáng)高頻信息,因而微分變換可以調(diào)整波長(zhǎng)光譜,使吸收峰的位置更加明顯[10],同樣,通過相關(guān)分析可以使不同含水率的吸收光譜的吸收峰的位置更加明顯。本研究分析吸收光譜曲線探究水分的吸收峰位置與通過相關(guān)分析和微分變換選擇的特征吸收峰的具體波段位置雖然稍有差異,但大多都位于1 400、1 900、2 100 nm附近,可見不同方法的分析結(jié)果具有一致性。
通過包絡(luò)線消除法可以去除那些不感興趣的吸收特征,孤立單個(gè)感興趣的吸收特征,并將其歸一到一個(gè)一致的光譜背景上,從而具有可以擴(kuò)大弱吸收特征信息的優(yōu)勢(shì)[25]。故本研究采用包絡(luò)線消除法提取了 1 440、1 930和2 140 nm 3個(gè)水分吸收波段附近的18個(gè)吸收特征參數(shù),通過相關(guān)分析選擇了7個(gè)相關(guān)系數(shù)大于0.85的水分吸收特征參數(shù)參與一元線性回歸分析建模。通過比較分析建模及預(yù)測(cè)結(jié)果可知,3個(gè)吸收深度參數(shù)為變量構(gòu)建的模型優(yōu)于其他吸收特征參數(shù)為變量構(gòu)建的模型;并且2 100 nm波長(zhǎng)位置附近的參數(shù)(比如:AD2140)建立的模型優(yōu)于1 400和1 900 nm波長(zhǎng)位置附近參數(shù)建立的模型。分析原因可能是:從吸收深度圖可以發(fā)現(xiàn),不同含水率的種子樣本在 2 100 nm波長(zhǎng)位置附近吸收峰的吸收深度和吸收面積的變化最明顯,說明含水率的變化對(duì)這個(gè)波長(zhǎng)位置的光譜峰值變化影響更大,從而這個(gè)位置的參數(shù)建立的模型效果更優(yōu),這一結(jié)論有待進(jìn)一步研究。
建模方法是影響可見/近紅外光譜分析法預(yù)測(cè)精度的一個(gè)主要因素,因此采用多變量校正算法來構(gòu)建光譜數(shù)據(jù)與分析目標(biāo)之間的關(guān)系并進(jìn)行預(yù)測(cè)精度比較是非常重要的[24]。本研究比較了SLR、SMLR、PLSR和BPNN方法建立的含水率估算模型的預(yù)測(cè)精度,結(jié)果表明 BPNN模型的預(yù)測(cè)精度最高,其次為SMLR模型,這與其他研究者的結(jié)論一致[23,26]。多元回歸模型可以實(shí)現(xiàn)降維和剔除冗余信息[27],顯著提升光譜分析的精度和可靠性[28],因而模型的預(yù)測(cè)精度相對(duì)較高。而BPNN模型預(yù)測(cè)結(jié)果優(yōu)于PLSR模型,原因可能是BPNN模型能夠解釋光譜變量與含水率間存在的非線性關(guān)系,而偏最小二乘回歸模型是一種線性算法,沒有考慮光譜變量中某些潛在的非線性信息。BP神經(jīng)網(wǎng)絡(luò)是一種采用誤差反向傳播算法對(duì)網(wǎng)絡(luò)權(quán)值進(jìn)行訓(xùn)練的多層前向網(wǎng)絡(luò),通過反向傳播途徑能夠不斷的調(diào)整網(wǎng)絡(luò)的閾值與權(quán)值,直至滿足誤差最小精度條件,輸出最優(yōu)結(jié)果[29]。在數(shù)據(jù)分析時(shí),理論上BP神經(jīng)網(wǎng)絡(luò)模型能夠無限逼近任意復(fù)雜的非線性函數(shù),因而對(duì)非線性問題有很好的解釋性。但是,BP神經(jīng)網(wǎng)絡(luò)算法的網(wǎng)絡(luò)權(quán)值初始化是隨機(jī)的,神經(jīng)網(wǎng)絡(luò)程序在每次運(yùn)行后得到的訓(xùn)練結(jié)果是不同的[23,30],因此BP 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程很難取得全局最佳效果。而且BP神經(jīng)網(wǎng)絡(luò)的隱含層的層數(shù)及節(jié)點(diǎn)數(shù)對(duì)網(wǎng)絡(luò)的模擬及預(yù)測(cè)精度影響較大[24],所以與其他回歸模型相比,其在實(shí)用性方面還有待于進(jìn)一步的研究。此外,為了驗(yàn)證所建模型的實(shí)用性,下一步將進(jìn)行另外批次自然含水率的種子驗(yàn)證試驗(yàn);其次,本研究油用牡丹種子含水率比較低,范圍比較窄,為了拓寬模型的適用范圍,進(jìn)一步研究將擴(kuò)大種子含水率的范圍。
本研究針對(duì)油用牡丹種子的含水率,采用包絡(luò)線消除法提取水分吸收特征參數(shù),分析了含水率與近紅外吸收光譜、一階微分光譜及水分吸收特征參數(shù)的相關(guān)關(guān)系,建立了油用牡丹種子含水率估算的一元線性回歸模型、逐步多元線性回歸模型、偏最小二乘回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型,并比較了不同模型的預(yù)測(cè)精度,得出如下結(jié)論:
1)通過相關(guān)分析確定了含水率的吸收光譜特征波長(zhǎng)為 14 10、1 900、1 990 nm,一階微分光譜特征波長(zhǎng)為1 150、1 950、2 080 nm;
2)水分吸收特征參數(shù)與含水率的相關(guān)性較好,相關(guān)系數(shù)大于 0.9的水分吸收特征參數(shù)為吸收深度參數(shù),即AD1930、AD2140、AD1440;
3)以DF2080和AD2140為自變量建立的一元線性回歸模型預(yù)測(cè)效果明顯優(yōu)于其他模型;
4)將構(gòu)建一元線性回歸模型時(shí)篩選出的光譜特征變量作為輸入,實(shí)測(cè)含水率值作為輸出,構(gòu)建含水率估算的逐步多元線性回歸模型、偏最小二乘回歸模型及BP神經(jīng)網(wǎng)絡(luò)模型。其中BP神經(jīng)網(wǎng)絡(luò)模型的建模與驗(yàn)?zāi)2分別為0.978和0.973,RMSE分別為0.220%和0.242%,而RPD值分別為6.478和5.889,與其他回歸模型相比,BP神經(jīng)網(wǎng)絡(luò)模型的建模及驗(yàn)?zāi)>染罡?,且比較穩(wěn)定,是估算油用牡丹種子含水率的最優(yōu)模型,其次為逐步多元線性回歸模型。在能夠滿足油用牡丹種子含水率估算的精度情況下,一元線性回歸模型估算方法可以作為優(yōu)先選擇。