鄭 劍,周 竹,仲山民,曾松偉(1.浙江農(nóng)林大學(xué)農(nóng)業(yè)與食品科學(xué)學(xué)院,浙江臨安311300;2.浙江農(nóng)林大學(xué)浙江省農(nóng)產(chǎn)品品質(zhì)改良技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江臨安311300;3.浙江農(nóng)林大學(xué)信息工程學(xué)院,浙江臨安311300;4.浙江農(nóng)林大學(xué)浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江臨安311300;5.浙江農(nóng)林大學(xué)智慧農(nóng)林業(yè)研究中心,浙江臨安311300)
?
基于近紅外光譜與隨機(jī)青蛙算法的褐變板栗識(shí)別
鄭劍1,2,周竹3,4,5,仲山民1,2,曾松偉3,4,5
(1.浙江農(nóng)林大學(xué)農(nóng)業(yè)與食品科學(xué)學(xué)院,浙江臨安311300;2.浙江農(nóng)林大學(xué)浙江省農(nóng)產(chǎn)品品質(zhì)改良技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江臨安311300;3.浙江農(nóng)林大學(xué)信息工程學(xué)院,浙江臨安311300;4.浙江農(nóng)林大學(xué)浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江臨安311300;5.浙江農(nóng)林大學(xué)智慧農(nóng)林業(yè)研究中心,浙江臨安311300)
摘要:為了實(shí)現(xiàn)板栗Castanea mollissima的快速自動(dòng)分選,研究了基于近紅外光譜技術(shù)的褐變板栗無損檢測方法。首先采用AntarisⅡ傅里葉變換近紅外光譜儀獲取70個(gè)正常板栗和110個(gè)褐變板栗的近紅外光譜(1 000.00~2500.00 nm),比較了不同光譜預(yù)處理方法對褐變板栗識(shí)別的影響,隨后采用一種新的變量選擇方法即隨機(jī)青蛙算法(Random Frog)提取與板栗褐變相關(guān)的特征波長變量,最后基于特征波長建立和比較了褐變板栗識(shí)別的偏最小二乘-線性判別分析模型(PLS-LDA)和最小二乘-支持向量機(jī)(LS-SVM)模型。結(jié)果顯示:經(jīng)標(biāo)準(zhǔn)正態(tài)變量變換(SNV)預(yù)處理和隨機(jī)青蛙算法優(yōu)選的23個(gè)特征波長所建LS-SVM模型的性能最優(yōu),該模型對測試集的敏感性、特異性和識(shí)別正確率分別為0.92,1.00和95.00%。隨機(jī)青蛙算法可以有效篩選重要的特征變量,不僅能簡化模型,而且可以提高識(shí)別準(zhǔn)確率和識(shí)別速度。圖4表3參22
關(guān)鍵詞:經(jīng)濟(jì)林學(xué);近紅外光譜;褐變;隨機(jī)青蛙算法;最小二乘-支持向量機(jī);偏最小二乘-線性判別分析;板栗
板栗Castanea mollissima味道香甜,營養(yǎng)豐富,是良好的營養(yǎng)保健品。然而,板栗在儲(chǔ)藏和加工過程中常常會(huì)發(fā)生果肉褐變,嚴(yán)重影響產(chǎn)品的品質(zhì)、風(fēng)味和營養(yǎng)成分,降低了產(chǎn)品的經(jīng)濟(jì)價(jià)值。因此,快速準(zhǔn)確檢測褐變板栗對于板栗的儲(chǔ)藏與深加工具有重要的意義。近紅外光譜技術(shù)(NIRS)可利用近紅外光譜區(qū)域(780~2 500 nm)的全譜或部分波段光譜對被測物進(jìn)行定量或定性分析。因其快速、無損等優(yōu)點(diǎn),在肉類[1-2]、果蔬[3-6]等農(nóng)產(chǎn)品品質(zhì)檢測中得到了廣泛的研究。在板栗品質(zhì)檢測方面,周竹等[7-9]、Moscetti等[10-11]研究了帶殼霉變、蟲害板栗的近紅外光譜定性檢測方法;劉潔等[12-13]、傅誼等[14]建立了板栗中水分、蛋白質(zhì)等含量的近紅外光譜模型。以上研究為板栗褐變的近紅外光譜檢測奠定了基礎(chǔ)。然而,近紅外光譜通常包含1 000.00~2 000.00 nm多個(gè)波長點(diǎn)的光譜數(shù)據(jù),利用全波段數(shù)據(jù)建模分析時(shí),光譜中的大量冗余信息會(huì)使建模計(jì)算工作量大,時(shí)間花費(fèi)長。此外,由于變量間的強(qiáng)相關(guān)性,并非所有波長都能提供有用信息。周竹等[7-8]前期采用傅里葉變換、主成分分析等方法提取少數(shù)特征量建立了霉變板栗識(shí)別模型,但傅里葉系數(shù)、主成分得分均難以直觀表征正常、褐變板栗光譜。已有的研究表明:對波長變量進(jìn)行優(yōu)選,一方面可以剔除不相關(guān)變量,在簡化模型的同時(shí),還可提高模型的預(yù)測精度以及穩(wěn)健性[15];另一方面可以根據(jù)獲取的特征波長設(shè)計(jì)便攜式在線檢測儀器,從而有效降低成本。本研究提出采用近紅外光譜技術(shù)檢測褐變板栗,擬采用一種最新的變量提取算法——隨機(jī)青蛙算法(Random-Frog,RF)尋找區(qū)分褐變板栗與正常板栗的有效光譜波長,并采用線性建模方法偏最小二乘-線性判別分析(partial least squares-linear discriminant analysis,PLS-LDA)和非線性判別方法最小二乘-支持向量機(jī)(least squares-support vector machine,LS-SVM)建立褐變板栗識(shí)別模型,且與全波段所建模型進(jìn)行比較,以期確定最優(yōu)的板栗褐變檢測方法與模型,為褐變板栗的快速準(zhǔn)確識(shí)別提供方法與技術(shù)支撐。
1.1試驗(yàn)材料
供試板栗品種為浙江省主栽品種毛板紅,產(chǎn)自浙江省麗水市,購于農(nóng)貿(mào)批發(fā)市場。剔除蟲害板栗,選取大小均勻的板栗仁,將其標(biāo)號(hào)放置在4~6℃冷庫中2個(gè)月,隨后取出在室溫下放置10 d,至部分板栗仁內(nèi)部出現(xiàn)不同程度的褐變,選取供實(shí)驗(yàn)板栗仁180個(gè)。
1.2試驗(yàn)儀器
采用AntarisⅡ傅里葉變換近紅外光譜儀(Thermo Scientific Co.,美國)對板栗果仁進(jìn)行光譜采集。該儀器使用InGaAs檢測器,內(nèi)置參比背景,光源為25 W鹵素?zé)簦▋x器標(biāo)配)。通過漫反射式積分球附件進(jìn)行光譜采集。光譜掃描范圍設(shè)置為1 000.00~2 500.00 nm,掃描次數(shù)為32次,分辨率為8.0 cm-1。選擇栗仁平整的面作為光譜采集面[8,11],平面中心以及4個(gè)方位上等距的區(qū)域作為光譜采樣點(diǎn)。采集5個(gè)·樣本-1標(biāo)記部位的光譜,并將其平均光譜作為該樣品的原始光譜。
1.3栗仁褐變評價(jià)
光譜采集完成后,在平行采集面8.0 mm的位置切開板栗,以判斷是否褐變及褐變程度。將板栗剖面置于A4打印紙上,采用Canon 5D3數(shù)碼相機(jī)(分辨率5 184×3 456)對被切剖面拍照,拍照時(shí)使剖面正對鏡頭。圖片通過ENVI 4.7(Research System Inc.,美國)選擇感興趣區(qū)域進(jìn)行處理,計(jì)算褐變面積比(褐變面積占整個(gè)剖面面積的比例)。
1.4特征波段選擇方法
采用隨機(jī)青蛙算法(random-frog)進(jìn)行特征波長選擇。隨機(jī)青蛙算法是一種最新的變量選擇方法,由LI等[16]提出并用于疾病的基因表達(dá)數(shù)據(jù)分析。該方法是一種類似于可逆跳轉(zhuǎn)馬爾科夫鏈蒙特卡洛(reversible jump Markov chain Monte Carlo, RJMCMC)的算法,通過在模型空間中模擬一條服從穩(wěn)態(tài)分布的馬爾科夫鏈,來計(jì)算每個(gè)變量的被選概率,從而用于評價(jià)變量的重要性[16]。本研究中,將隨機(jī)青蛙算法與PLS-LDA算法相結(jié)合,探尋褐變板栗識(shí)別的特征波段,其具體步驟為[17]:1)初始化參數(shù):n為迭代次數(shù),設(shè)為10 000;q為初始變量集v0的變量個(gè)數(shù),為1~1 557任意數(shù),默認(rèn)值為2;θ為正態(tài)分布方差控制因子,默認(rèn)值為0.3;ω為比例因子,用于控制候選變量個(gè)數(shù),默認(rèn)值為3;η是否接受建模結(jié)果差于v0的新變量集V*的概率上界,默認(rèn)值為0.1。2)隨機(jī)選擇包含q個(gè)變量的初始變量集合為v0,并定義包含所有1 557個(gè)變量的集合為v。3)從均值為q,標(biāo)準(zhǔn)偏差為θq的正態(tài)分布中產(chǎn)生隨機(jī)數(shù)并就近圓整為q*,分情況構(gòu)造一個(gè)含有q*個(gè)變量的候選變量子集v*:①若q*=q,則v*= v;②若q*<q,先用變量集v0建立PLS-LDA模型,得到各變量回歸系數(shù),然后將回歸系數(shù)絕對值最小的q-q*個(gè)變量從v0中去掉,則剩余的q*個(gè)變量構(gòu)成v*;③若q*>q,先從v-v0中隨機(jī)選擇ω(q*-q)個(gè)變量,構(gòu)成新變量集t,然后將t與v0組合建立PLS-LDA模型,得到每個(gè)變量的回歸系數(shù),隨后將回歸系數(shù)絕對值最大的q*個(gè)變量挑選出來構(gòu)成v*。4)v*確定后,要決定是否接受v*。分別計(jì)算用v0和v*建立PLS-LDA模型的預(yù)測誤差,記為e0和e*。若e*≤e0,接受v*并令v1=v*;否則,以ηErr0/Err*的概率接受v*且令v1=v*。用v1代替v0,返回2)進(jìn)行下一次迭代,直到完成n次迭代。5)n次迭代后,得到n個(gè)變量子集。變量i的被選頻次記為ni,依公式計(jì)算該變量的選擇概率Pi:
式(1)中:i=1,2,…,1 557。變量對模型越重要,其被選概率越大,因此,可將所有變量的被選概率排序,選出概率較大的一些變量作為特征波長。
1.5建模方法
采用PLS-LDA和LSSVM建立栗仁褐變識(shí)別模型。PLS-LDA是偏最小二乘法與線性判別分析方法的有效結(jié)合,該方法先利用PLS算法對光譜矩陣和類別屬性進(jìn)行分解,得到光譜矩陣的得分向量,然后將得分向量與類別屬性做線性判別分析,建立判別模型[18]。如利用n個(gè)PLS得分向量建立PLS-LDA模型,則其判別方程為:
式(2)中:s=[s1,s2,…,sn]為PLS得分向量,α1,α2,…,αn是判別系數(shù),c為常數(shù)。
在PLS-LDA建模過程中,采用蒙特卡洛交互檢驗(yàn)[19]來確定最優(yōu)主成分?jǐn)?shù)。蒙特卡洛交互檢驗(yàn)的取樣比率為0.75,模擬次數(shù)為2 000。LS-SVM是對經(jīng)典支持向量機(jī)(SVM)的一種改進(jìn),該方法采用最小二乘線性系統(tǒng)作為損失函數(shù),以求解一組線性方程代替經(jīng)典SVM中較為復(fù)雜的2次規(guī)劃問題,從而降低了計(jì)算復(fù)雜性,具有學(xué)習(xí)速度快,泛化性好等特點(diǎn)[20]。該方法用非線性映射將輸入?yún)?shù)映射到高維特征空間,在此空間構(gòu)造最優(yōu)決策函數(shù),并基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則確定決策函數(shù)參數(shù)[21]。該方法中的核函數(shù)是高維特征空間的內(nèi)積,只要滿足Mercer條件的函數(shù)均可作為核函數(shù),其常用的4個(gè)核函數(shù)中,徑向基核函數(shù)(RBF)應(yīng)用最廣泛,故該文采用RBF核函數(shù)作為LS-SVM分類器的核函數(shù),并以留一交叉驗(yàn)證法結(jié)合網(wǎng)格搜索(grid search)策略來確定懲罰因子c以及RBF核函數(shù)參數(shù)g。
1.6模型評價(jià)
模型的評價(jià)指標(biāo)為敏感性、特異性、預(yù)測總正確率。其定義如式(3)~式(5)所示。
式(3)~式(5)中:tP,tN,fP,fN分別表示真陽性、真陰性、假陽性和假陰性。試驗(yàn)中規(guī)定陽性和陰性分別代表褐變板栗和正常板栗。敏感性、特異性以及總正確率越高,說明所建模型性能越好。
所有程序均在Matlab 2010a(The MathWorks Inc.,美國)上運(yùn)行實(shí)現(xiàn)。
2.1栗仁褐變的評價(jià)結(jié)果
試驗(yàn)共使用板栗樣本180個(gè)。表1給出了試樣的形態(tài)學(xué)參數(shù)。從表1中可以看出:試樣的各項(xiàng)形態(tài)學(xué)指標(biāo)均在正常的分布范圍內(nèi),具有一定的代表性。通過切剖觀察,最終確認(rèn)110個(gè)樣本褐變,褐變面積比例范圍為0.16%~49.43%。圖1為典型樣本的剖面圖。圖2為110個(gè)褐變樣本的褐變程度分布。從圖1和圖2中可以看出:試驗(yàn)中包含了不同褐變程度的樣本且褐變程度范圍較廣,因此,試樣的光譜數(shù)據(jù)具有很強(qiáng)的代表性。將所有褐變樣本依據(jù)褐變面積比梯度以2∶1比例進(jìn)行劃分,而正常栗仁樣本則以2∶1比例隨機(jī)劃分,最終組成校正集的正常、褐變樣本數(shù)分別為47個(gè)和73個(gè),組成測試集的正常、褐變樣本數(shù)分別為23個(gè)和37個(gè)。
表1 樣本的形態(tài)學(xué)參數(shù)描述Table 1 Morphological properties of the samples
圖1 板栗樣本Figure 1 Chestnut samples
圖2 栗仁褐變樣本的褐變程度分布圖Figure 2 Histogram of brown chestnut in various degrees
圖3 栗仁原始光譜Figure 3 Spectra of peeled chestnut
2.2栗仁的光譜分析
圖3為正常栗仁和不同程度褐變栗仁的原始光譜。從圖3中可以看出:栗仁光譜在1 200.00,1 450.00和1 940.00 nm處均有明顯的吸收峰,在1 780.00 nm處略有波峰。在栗仁譜圖中,1 200.00 nm左右區(qū)域?yàn)榧谆蛠喖谆蠧—H鍵二級倍頻的特征吸收譜帶,1 450.00 nm附近區(qū)域包含了水分和糖分中O—H基團(tuán)伸縮振動(dòng)的一級倍頻信息,1 940.00 nm為水分中O—H鍵伸縮振動(dòng)和彎曲振動(dòng)的組合頻帶特征譜帶,1 780.00 nm則分別反映了糖分中C—H鍵的一級倍頻和蛋白質(zhì)中N—H鍵的組合頻信息[22]。從圖3中還可以看出:不同褐變程度的板栗的原始光譜圖趨勢基本相似,沒有太大的差別,即隨著褐變程度的增加,吸收峰高沒有呈現(xiàn)出規(guī)律性的變化,難以從圖譜的表面提取褐變果仁的特征指紋。因此,需要進(jìn)一步結(jié)合化學(xué)計(jì)量學(xué)方法對光譜進(jìn)行分析處理,以便建立板栗果仁褐變的鑒別模型。
2.3光譜預(yù)處理方法的確定
受儀器、樣品以及光譜采集環(huán)境等因素的影響,近紅外光譜中常出現(xiàn)噪聲、譜圖基線漂移和平移等現(xiàn)象,為了消除上述因素的影響,應(yīng)對原始光譜(none)進(jìn)行預(yù)處理。采用標(biāo)準(zhǔn)正態(tài)變量變換(SNV),去趨勢變換(detrend),一階導(dǎo)數(shù)(FD),二階導(dǎo)數(shù)(SD),多元散射校正(MSC)等方法對原始光譜進(jìn)行預(yù)處理并采用PLS-LDA建立判別模型,結(jié)果如表2所示。由表2可知:SNV預(yù)處理建立的PLS-LDA模型最優(yōu),該模型對校正集、測試集的敏感性分別為0.90以及0.92,均明顯高于一階導(dǎo)數(shù)、二階導(dǎo)數(shù),多元散射校正等光譜預(yù)處理方法的模型;對校正集的特異性均為1.00,也高于一階導(dǎo)數(shù)、二階導(dǎo)數(shù),多元散射校正等光譜預(yù)處理方法的模型;對校正集、測試集樣本識(shí)別的準(zhǔn)確率分別為94.13%和95.00%,高于其他幾種光譜預(yù)處理方法。這表明SNV預(yù)處理有利于減弱因受儀器、樣品以及光譜采集環(huán)境等因素引起的噪聲干擾,可以增強(qiáng)模型的預(yù)測能力和穩(wěn)健性。因此,在下文均采用SNV處理后的光譜進(jìn)行分析。
表2 不同光譜預(yù)處理下全波段PLS-LDA模型的結(jié)果Table 2 Classification results based on PLS-LDA with different preprocessing methods and full wavelengths
2.4特征波長的選擇
采用隨機(jī)青蛙算法(random-frog)對全波段光譜進(jìn)行特征變量選擇。由于隨機(jī)青蛙算法是基于蒙特卡洛(MC)思想,每次運(yùn)行的結(jié)果略有差異。為了減少隨機(jī)因素的影響,需多次運(yùn)行,并對結(jié)果進(jìn)行統(tǒng)計(jì)。該研究共運(yùn)行隨機(jī)青蛙算法100次,以100次運(yùn)行結(jié)果的平均值作為最終特征波長選擇的依據(jù),其結(jié)果如圖4所示。由圖4可知:大部分變量的被選擇概率都比較小,只有小部分變量的概率比較大。將所有變量的被選概率進(jìn)行排序,以0.1為閾值,選擇出概率最大的前23個(gè)變量作為特征波長,依次為1 078.06,1 028.45,1 029.68,1 081.21,1 077.61,1 183.90,1 029.27,1 020.36,1 080.76,1 145.20,1 183.36,1 124.34,1 119.97,1 032.96,1 121.42,1 032.96,1 098.62,1 028.05,1 162.66,1 120.94,1 145.71和1 182.82 nm,如圖3所示。在1 020.00~1 200.00 nm波段范圍內(nèi),1 020.00 nm附近為蛋白質(zhì)中N—H鍵伸縮振動(dòng)的一級倍頻帶,1 030.00,1 060.00 nm附近為胺類中N—H鍵伸縮振動(dòng)的二級倍頻帶,1 080.00 nm為芳香烴中C—H,C—C鍵伸縮振動(dòng)的一級倍頻帶,1 143.00nm為芳烴中C—H鍵伸縮振動(dòng)的二級倍頻帶,1 152.00,1 195.00 nm為甲基中C—H鍵伸縮振動(dòng)的二級倍頻帶[22]。與板栗果仁褐變直接相關(guān)的物質(zhì)主要是有機(jī)物酚、酸、醌、蛋白質(zhì)、氨基酸等。這些物質(zhì)都與C—H鍵、N—H鍵以及O—H鍵相關(guān)。因此,所選特征波長可以反映板栗栗仁褐變特性。從圖3中還可以看出:所選特征波段避開了水分的強(qiáng)吸收峰,減少了水分因素對栗仁褐變識(shí)別的干擾。
圖4 100次隨機(jī)青蛙算法的平均概率Figure 4 Selection probability of each wavelength averaged over 100 runs of random-frog algorithm
2.5模型的建立與比較
將得到的23個(gè)特征波長(effective wavelengths, EWs)下的光譜數(shù)據(jù)作為輸入,分別采用PLS-LDA以及LS-SVM建立褐變板栗的識(shí)別模型。表3給出了采用23個(gè)特征波長的光譜數(shù)據(jù)所建模型的結(jié)果。為了突出特征波長所建模型的優(yōu)越性,表3還給出了采用全波段(full wavelengths, FWs)光譜所建模型的結(jié)果。從表3中可以看出:23個(gè)特征波長數(shù)據(jù)所建EWs-PLS-LDA模型對校正集的敏感性(0.92)高于FWs -PLS-LDA模型的同類指標(biāo)(0.90),但特異性(0.98)低于FWs-PLS-LDA模型的同類指標(biāo)(1.00),識(shí)別正確率相同,均為94.17%;當(dāng)模型用于測試集數(shù)據(jù)時(shí),EWs-PLS-LDA模型的敏感性(0.89)低于FWs-PLSLDA模型的同類指標(biāo)(0.92),識(shí)別正確率也降低為93.33%。FWs-PLS-LDA模型使用1 557個(gè)變量,模型的主因子數(shù)為16,遠(yuǎn)多于特征波段模型的23個(gè)變量和9個(gè)主因子數(shù),模型較為復(fù)雜。23個(gè)特征波長數(shù)據(jù)所建EWs-LS-SVM模型,無論是校正集還是測試集,其敏感性(0.92/0.92),特異性(1.00/1.00),識(shí)別正確率(95.00%/95.00%)均高于FWs-LS-SVM模型的同類指標(biāo)。該模型與FWs-PLS-LDA模型相比,對校正集的預(yù)測結(jié)果更優(yōu)。相比于EWs-PLS-LDA模型,EWs-LS-SVM模型結(jié)果略優(yōu),原因可能是PLSLDA只能處理栗仁光譜中的線性相關(guān)關(guān)系,而LS-SVM則可以利用低維數(shù)據(jù)中的非線性特性,從而獲得較優(yōu)的預(yù)測結(jié)果。
表3 不同建模方法的結(jié)果Table 3 Results for different methods
表3還給出了不同建模方法建模和預(yù)測所用時(shí)間(模型建立環(huán)境:inter(R)core(TM)i5-3210 CPU@2.5 GHz RAM 4.00 GB Windows 7旗艦版64 Bit)。從表3中可以看出:不管是PLS-LDA方法還是LS-SVM方法,采用23個(gè)特征波長建模時(shí)間以及預(yù)測時(shí)間都要短于全波段模型的相應(yīng)時(shí)間,其中,23個(gè)波段光譜數(shù)據(jù)所建EWs-LS-SVM模型時(shí)間、預(yù)測時(shí)間最短,僅為3.09和9.55 ms。綜上所述,通過隨機(jī)青蛙算法進(jìn)行特征波長選擇,并且采用LS-SVM建立褐變板栗的識(shí)別模型,不僅降低了模型的復(fù)雜度,而且提高了識(shí)別準(zhǔn)確率和識(shí)別速度。
上述結(jié)果表明:應(yīng)用近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法可以快速準(zhǔn)確的對褐變板栗進(jìn)行識(shí)別,為板栗儲(chǔ)藏、深加工等環(huán)節(jié)中板栗品質(zhì)的快速無損檢測提供了重要的參考,可進(jìn)一步研究不同品種,不同產(chǎn)地等條件下的板栗樣本,從而提高模型的穩(wěn)定性和適用性,以便在實(shí)際應(yīng)用中取得滿意的結(jié)果。
采用近紅外光譜技術(shù)對褐變板栗栗仁進(jìn)行快速無損檢測。確定最優(yōu)的光譜預(yù)處理方法為標(biāo)準(zhǔn)正態(tài)變量變換(SNV),運(yùn)用隨機(jī)青蛙算法提取代表光譜有效信息的23個(gè)特征波長,并作為輸入變量建立褐變栗仁識(shí)別PLS-LDA和LS-SVM模型。23個(gè)特征波長所建LS-SVM模型性能最優(yōu),校正集和測試集的敏感性、特異性和識(shí)別正確率相同,分別為0.92,1.00和95.00%。研究結(jié)果表明:采用隨機(jī)青蛙算法提取特征波長并采用非線性的LS-SVM方法建立栗仁褐變檢測模型是可行的,不僅能簡化模型,提高識(shí)別速度,而且能夠提高識(shí)別準(zhǔn)確率。
[1]黃濤,李小昱,彭毅,等.基于近紅外光譜的淡水魚新鮮度在線檢測方法研究[J].光譜學(xué)與光譜分析,2014,34(10):2732 - 2736.HUANG Tao, LI Xiaoyu, PENG Yi, et al.Freshwater fish freshness on-line detection method based on near-infrared spectroscopy[J].Spectrosc Spectral Anal, 2014, 34(10): 2732 - 2736.
[2]湯修映,牛力釗,徐楊,等.基于可見/近紅外光譜技術(shù)的牛肉含水率無損檢測[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29 (11):248 - 254.TANG Xiuying, NIU Lizhao, XU Yang, et al.Nondestructive determination of water content in beef using visible/nearinfrared spectroscopy[J].Trans Chin Soc Agric Eng, 2013, 29(11): 248 - 254.
[3]LI Guanghui, REN Yamei, REN Xiaolin, et al.Non-destructive measurement of fracturability and chewiness of apple by FT-NIRS[J].J Food Sci Tech, 2015, 52(1): 258 - 266.
[4]LIU Cong, YANG S X, DENG Lie.Determination of internal qualities of Newhall navel oranges based on NIR spectroscopy using machine learning[J].J Food Eng, 2015, 161: 16 - 23.
[5]RADY A M, GUYER D E.Evaluation of sugar content in potatoes using NIR reflectance and wavelength selection techniques[J].Postharv Biol Technol, 2015, 103: 17 - 26.
[6]介鄧飛,謝麗娟,饒秀勤,等.近紅外光譜變量篩選提高西瓜糖度預(yù)測模型精度[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29 (12):264 - 270.JIE Dengfei, XIE Lijuan, RAO Xiuqin, et al.Improving accuracy of prediction model for soluble solids content of watermelon by variable selection based on near-infrared spectroscopy[J].Trans Chin Soc Agric Eng, 2013, 29(12): 264 - 270.
[7]周竹,李小昱,李培武,等.基于GA-LSSVM和近紅外傅里葉變換的霉變板栗識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2011,27(3):331 - 335.ZHOU Zhu,LI Xiaoyu, LI Peiwu, et al.Near-infrared spectral detection of moldy chestnut based on GA-LSSVM and FFT[J].Trans Chin Soc Agric Eng, 2009, 25(8): 131 - 135.
[8]周竹,劉潔,李小昱,等.霉變板栗的近紅外光譜和神經(jīng)網(wǎng)絡(luò)方法判別[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,40(增刊1):109 - 112.ZHOU Zhu, LIU Jie, LI Xiaoyu, et al.Discrimination of moldy Chinese chestnut based on artificial neural network and near infrared spectra[J].Trans Chin Soc Agric Mach, 2009, 40(supp 1): 109 - 112.
[9]LIU Jie, LI Xiaoyu, LI Peiwu, et al.Nondestructive detection of moldy chestnut based on near infrared spectroscopy [J].Afr J Agric Res, 2010, 5(23): 3213 - 3218.
[10]MOSCETTI R, HAFF R P, SARANWONG S, et al.Nondestructive detection of insect infested chestnuts based on NIR Spectroscopy[J].Postharvest Biol Technol, 2014, 87: 88 - 94.
[11]MOSCETTI R, MONARCA D, CECCHINI M, et al.Detection of mold-damaged chestnuts by near-infrared spectroscopy[J].Postharvest Biol Technol, 2014, 93: 83 - 90.
[12]劉潔,李小昱,李培武,等.基于近紅外光譜的板栗水分檢測方法[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(2):338 -341.LIU Jie, LI Xiaoyu, LI Peiwu, et al.Determination of moisture in chestnuts using near infrared spectroscopy[J].Trans Chin Soc Agric Eng, 2010, 26(2): 338 - 341.
[13]LIU Jie, LI Xiaoyu, WANG Wei, et al.Measurement of protein content in chestnuts using near infrared spectroscopy [J].J Chem Pharm Res, 2014, 6(6): 938 - 941.
[14]傅誼,張擁軍,陳華才,等.基于偏最小二乘法的板栗近紅外光譜分析模型的建立[J].食品科技,2012,37 (5):42 - 45.FU Yi,ZHANG Yongjun,CHEN Huacai,et al.Establishment of NIR models for components determination in fresh chestnu[J].Food Sci Technol, 2012, 37(5): 42 - 45.
[15]褚小立,袁洪福,陸婉珍.近紅外分析中光譜預(yù)處理及波長選擇方法進(jìn)展與應(yīng)用[J].化學(xué)進(jìn)展,2004,16 (4):528 - 542.CHU Xiaoli, YUAN Hongfu, LU Wanzhen.Progress and application of spectral data pretreatment and wavelength se-lection methods in NIR analytical technique[J].Progr Chem, 2004, 16(4): 528 - 542.
[16]LI Hongdong, XU Qingsong, LIANG Yizeng, et al.Random Frog: An efficient reversible jump Markov Chain Monte Carlo-like approach for variable selection with applications to gene selection and disease classification[J].Anal Chim Acta, 2012, 740: 20 - 26.
[17]李洪東.廣義灰色分析體系建模的基本問題及其模型集群分析研究[D].長沙:中南大學(xué),2012.LI Hongdong.Fundamental Problems of Generalized Grey Analytical Systems and Their Research of Model Population Analysis[D].Changsha: Central South University, 2012.
[18]周竹,李小昱,高海龍,等.漫反射和透射光譜檢測馬鈴薯黑心病的比較[J].農(nóng)業(yè)工程學(xué)報(bào),2012,28 (11):237 - 242.ZHOU Zhu, LI Xiaoyu, GAO Hailong, et al.Comparison of diffuse reflection and transmission mode of visible/near infrared spectroscopy for detecting black heart of potato[J].Trans Chin Soc Agric Eng, 2012, 28(11): 237 - 242.
[19]LI Hongdong, LIANG Yizeng, XU Qingsong, et al.Model population analysis for variable selection[J].J Chemometr, 2010, 24(7/8): 418 - 423.
[20]SUYKENS J A K, de BRABANTER J, LUKAS L, et al.Weighted least squares support vector machines: robustness and sparse approximation[J].Neurocomputing, 2002, 48(1/4): 85 - 105.
[21]顧燕萍,趙文杰,吳占松.最小二乘支持向量機(jī)的算法研究[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2010,50(7):1063 - 1066.GU Yanping, ZHAO Wenjie, WU Zhansong.Least squares support vector machine algorithm[J].J Tsinghua Univ Sci & Tech, 2010, 50(7): 1063 - 1066.
[22]嚴(yán)衍祿.近紅外光譜分析基礎(chǔ)與應(yīng)用[M].北京:中國輕工業(yè)出版社,2005:31 - 39.
Chestnut browning detected with near-infrared spectroscopy and a random-frog algorithm
ZHENG Jian1,2, ZHOU Zhu3,4,5, ZHONG Shanmin1,2, ZENG Songwei3,4,5
(1.School of Agriculture and Food Science, Zhejiang A & F University, Lin’an 311300, Zhejiang, China; 2.The Key Laboratory for Quality Improvement of Agricultural Products of Zhejiang Province, Zhejiang A & F University, Lin’an 311300, Zhejiang, China; 3.School of Information Engineering, Zhejiang A & F University, Lin’an 311300, Zhejiang, China; 4.Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology, Zhejiang A & F University, Lin’an 311300, Zhejiang, China; 5.Research Center for Smart Agriculture and Forestry, Zhejiang A & F University, Lin’an 311300, Zhejiang, China)
Abstract:To develop a calibration model for rapid, accurate and nondestructive detection of chestnut browning with peeled chestnut Castanea mollissima by using near infrared spectroscopy technology.Seventy normal chestnuts and 110 browning chestnuts were prepared, and their diffuse reflectance spectrums were collected in the wavelength range from 1 000.00 to 2 500.00 nm.Spectral pretreatment methods, including standard normal variate(SNV), multiplication scattering correction(MSC), first derivative(FD), second derivative(SD), and detrend, were used and compared first.Then random-frog algorithm was applied to select effective wavelengths (EWs)from the SNV pretreated spectrum.Afterward, a partial least squares-linear discriminant analysis(PLSLDA)and a least squares-support vector machine(LS-SVM)model were established to classify the browningbook=323,ebook=144chestnuts based on EWs, and the results were compared based on sensitivity, specificity and accuracy.For the validation set, the sensitivity, specificity and accuracy obtained by EWs-LS-SVM were 0.92, 1.00 and 95.00%, respectively.The results were better than those of full-PLS-LDA model,full-LS-SVM model and EWs-PLSLDA model.Also, the random-frog algorithm effectively selected important wavelengths and simplified the discrimination model improving precision and recognition speed.The overall results demonstrate that random-frog algorithm is a powerful tool to select the efficient variables, and EWs-LS-SVM is excellent for the spectral calibration.[Ch, 4 fig.3 tab.22 ref.]
Key words:cash forestry; NIR spectroscopy; browning; random-frog algorithm; least squares-support vector machines; partial least squares-linear discriminant analysis; chestnut
作者簡介:鄭劍,講師,博士研究生,從事農(nóng)產(chǎn)品儲(chǔ)藏加工與品質(zhì)檢測研究。E-mail:zhengjian622@126.com。通信作者:周竹,講師,博士,從事智能化檢測與控制技術(shù)研究。E-mail:zhouzhu@zafu.edu.cn
基金項(xiàng)目:浙江省自然科學(xué)基金資助項(xiàng)目(Y3110450,LQ13F050006);浙江農(nóng)林大學(xué)科研發(fā)展基金資助項(xiàng)目(2008FR053,2012FR085);浙江省木本糧油產(chǎn)業(yè)科技創(chuàng)新團(tuán)隊(duì)項(xiàng)目(2011R50030-2)
收稿日期:2015-04-16;修回日期:2015-09-07
doi:10.11833/j.issn.2095-0756.2016.02.019
中圖分類號(hào):S123; S664.2
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):2095-0756(2016)02-0322-08