張 強(qiáng),劉成海,孫井坤,賈富國(guó),鄭先哲
(東北農(nóng)業(yè)大學(xué)工程學(xué)院,哈爾濱 150030)
基于支持向量機(jī)的稻谷黃曲霉毒素B1近紅外無(wú)損檢測(cè)
張 強(qiáng),劉成海,孫井坤,賈富國(guó),鄭先哲*
(東北農(nóng)業(yè)大學(xué)工程學(xué)院,哈爾濱 150030)
為提高近紅外光譜技術(shù)檢測(cè)貯藏稻谷中黃曲霉毒素B1準(zhǔn)確性和精度,文章探討以RBF徑向基函數(shù)為核函數(shù)的支持向量機(jī)參數(shù)對(duì)建模精度影響。收集80個(gè)稻谷樣本,應(yīng)用近紅外光譜采集光譜信息,采用化學(xué)分析方法測(cè)定貯藏稻谷中黃曲霉毒素B1含量,建立稻谷黃曲霉毒素B1支持向量機(jī)回歸模型。確定基于RBF核函數(shù)模型最優(yōu)參數(shù)為c=106,γ=0.0015。該模型校正集決定系數(shù)為0.913,校正標(biāo)準(zhǔn)偏差和預(yù)測(cè)標(biāo)準(zhǔn)偏差分別為1.186和1.267。結(jié)果表明,基于支持向量機(jī)算法建??蓽?zhǔn)確檢測(cè)稻谷中黃曲霉毒素B1。為準(zhǔn)確、實(shí)時(shí)監(jiān)測(cè)貯藏稻谷黃曲霉毒素B1污染提供理論依據(jù)。
稻谷;貯藏;黃曲霉毒素B1;支持向量機(jī);近紅外光譜
網(wǎng)絡(luò)出版時(shí)間2015-4-30 14:29:00 [URL]http://www.cnki.net/kcms/detail/23.1391.S.20150430.1429.003.html
張強(qiáng),劉成海,孫井坤,等.基于支持向量機(jī)的稻谷黃曲霉毒素B1近紅外無(wú)損檢測(cè)[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2015,46(5):84-88.
Zhang Qiang,Liu Chenghai,Sun Jingkun,et al.Near-infrared spectroscopy nondestructive determination of aflatoxin B1in paddy rice based on support vector machine regression[J].Journal of Northeast Agricultural University,2015,46(5):84-88. (in Chinese with English abstract)
由于貯藏條件影響,稻谷會(huì)受黃曲霉毒素侵染[1]。黃曲霉毒素B1是黃曲霉毒素中的代表性類型,污染糧食數(shù)量多、毒性大[2]。許多國(guó)家都對(duì)稻谷中黃曲霉毒素B1含量作出嚴(yán)格限制[3]。余墩年研究表明,糧倉(cāng)內(nèi)稻谷黃曲霉毒素B1含量高于中國(guó)國(guó)家標(biāo)準(zhǔn)規(guī)定含量[4]。因此,研究稻谷黃曲霉毒素B1含量無(wú)損、及時(shí)準(zhǔn)確檢測(cè)方法具有重要理論意義和應(yīng)用價(jià)值。
近紅外光譜技術(shù)具備無(wú)需任何預(yù)處理,分析速度快、無(wú)污染優(yōu)勢(shì),在農(nóng)產(chǎn)品品質(zhì)檢測(cè)領(lǐng)域得到廣泛應(yīng)用[5-9]。由于光譜儀器和分析環(huán)境影響,光譜噪聲和非信息因素常影響近紅外模型預(yù)測(cè)精度,尋找合適建模方法對(duì)提高模型預(yù)測(cè)精度十分重要。
支持向量機(jī)(SVM)是新型機(jī)器學(xué)習(xí)方法,如果數(shù)據(jù)服從某個(gè)未知但分布固定,要使機(jī)器實(shí)際輸出和理想輸出偏差盡可能小,機(jī)器應(yīng)遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,使錯(cuò)誤概率上界最小化。支持向量機(jī)結(jié)構(gòu)簡(jiǎn)單,能較好解決小樣本、非線性、高維數(shù)和局部極小點(diǎn)等實(shí)際問題。SVM逐步在近紅外光譜定量分析中應(yīng)用,其參數(shù)選擇對(duì)SVM方法的預(yù)測(cè)能力有重要影響[10]。周竹等利用最小二乘支持分類器建立霉變板栗識(shí)別模型,結(jié)果表明該方法可顯著提高霉變板栗檢測(cè)精度[11]。陳紅光等應(yīng)用近紅外光譜結(jié)合支持向量機(jī)檢測(cè)大棗內(nèi)部蟲害,結(jié)論是支持向量機(jī)回歸算法可實(shí)現(xiàn)大棗內(nèi)部蟲害無(wú)損、準(zhǔn)確檢測(cè)[12]。國(guó)內(nèi)外關(guān)于將支持向量機(jī)算法用于稻谷黃曲霉毒素B1近紅外建模研究鮮見報(bào)道。
本文以貯藏稻谷為研究對(duì)象,利用支持向量機(jī)算法建立稻谷黃曲霉毒素B1近紅外光譜預(yù)測(cè)模型。以RBF徑向基函數(shù)為核函數(shù),分析其參數(shù)對(duì)建模精度的影響,對(duì)參數(shù)進(jìn)行優(yōu)化,確定基于RBF核函數(shù)模型最優(yōu)參數(shù)。使用外部樣品對(duì)建立校正模型預(yù)測(cè)精度和穩(wěn)定性進(jìn)行驗(yàn)證。
1.1 材料
稻谷樣品取自東北農(nóng)業(yè)大學(xué)稻谷加工實(shí)驗(yàn)室,2013年10月收獲,并在(25±3)℃環(huán)境下貯存約10個(gè)月。其中,60個(gè)樣本為校正集,用于建立近紅外光譜校正模型,20個(gè)樣本為預(yù)測(cè)集,用于檢驗(yàn)校正模型預(yù)測(cè)性能和穩(wěn)定性,校正集和預(yù)測(cè)集比例為3∶1。
1.2 儀器設(shè)備
ANTARISⅡ型傅立葉變換近紅外分析儀(美國(guó)Thermo Nicolet公司);恒溫恒濕箱[CTHI-150(A)B型,上海施都凱儀器設(shè)備有限公司];礱谷機(jī)(日本FC2K型,日本株式會(huì)社佐竹制作所);微型植物試樣粉碎機(jī)(FZ102型,天津泰斯特儀器有限公司);電子分析天平(精度為0.0001 g,梅特勒-托利多公司);離心機(jī)(LDZ5-2型,北京京立離心機(jī)有限公司);黃曲霉毒素B1酶聯(lián)免疫試劑盒(北京安美生醫(yī)藥科技有限公司);微孔酶標(biāo)儀(EL301型,美國(guó)Bio-Tek儀器有限公司)。
1.3 方法
1.3.1 光譜掃描
光譜掃描前將稻谷樣品置于室溫(25±3)℃下使樣品溫度回升且均勻。光譜采集主要參數(shù)設(shè)定為:光譜采集為10 000~4 000 cm-1,掃描次數(shù)64次,分辨率8 cm-1,稻谷光譜數(shù)據(jù)以log(1/R)形式記錄。試驗(yàn)采用美國(guó)Thermo Nicolet公司生產(chǎn)的ANTARISⅡ型傅立葉變換近紅外分析儀進(jìn)行光譜掃描。光譜掃描試驗(yàn)開始前,儀器預(yù)熱60 min,每次掃描時(shí)將45 g稻谷樣品置于旋轉(zhuǎn)樣品臺(tái),開始掃描時(shí)光譜儀自動(dòng)去除背景干擾,樣品每次掃描時(shí)間約90 s,每個(gè)樣品掃描3次,取3次光譜平均值作為原始光譜數(shù)據(jù)。光譜掃描結(jié)束后,對(duì)稻谷樣品化學(xué)值進(jìn)行測(cè)定。
1.3.2 參考值測(cè)定
采用酶聯(lián)免疫法測(cè)定稻谷中黃曲霉毒素B1含量[13-15],每個(gè)樣本取20 g粉末加入100 mL甲醇/水(1∶1,V/V),混合液劇烈震蕩3 min,在5 000 r·min-1條件下離心10 min;取400 μL上清液和600 μL樣品稀釋液充分混勻;使用酶聯(lián)免疫試劑盒進(jìn)行檢測(cè),加標(biāo)準(zhǔn)品/樣本50 μL至對(duì)應(yīng)微孔中,再加入酶標(biāo)物50 μL·孔-1,輕輕振蕩混勻,用蓋板膜蓋板后置室溫避光環(huán)境中反應(yīng)15 min;用洗滌工作液300 μL·孔-1進(jìn)行洗滌,充分洗滌5次后加入顯色液100 μL,在避光環(huán)境下反應(yīng)15 min;加入終止液50 μL·孔-1,應(yīng)用美國(guó)Bio-Tek公司生產(chǎn)的酶標(biāo)儀在450 nm下測(cè)定稻谷黃曲霉毒素B1含量。
1.3.3 試驗(yàn)設(shè)計(jì)
本試驗(yàn)調(diào)用SVM模式識(shí)別與回歸軟件包LIBSVM實(shí)現(xiàn)SVM模型的建立和預(yù)測(cè)過程。選擇試驗(yàn)參數(shù)為:核函數(shù)確定為RBF徑向基函數(shù),SVM類型采用e-SVR,損失函數(shù)ε取默認(rèn)值為0.1。本試驗(yàn)直接將提供的校正集樣品原始光譜數(shù)據(jù)歸一化后作為SVM的輸入,采用網(wǎng)絡(luò)搜索法找出最佳懲罰參數(shù)c和RBF核參數(shù)γ組合。初步設(shè)定搜索參數(shù)如下:c取1、10、102、103、104、105、106、107時(shí),γ取0.01、0.05、0.10、0.15、0.20。通過建立SVM模型比較參數(shù)對(duì)建模精度影響,進(jìn)一步縮小最優(yōu)參數(shù)搜索范圍,以獲得更佳支持向量機(jī)回歸模型。
1.3.4 近紅外光譜校正模型評(píng)價(jià)方法
采用SVM算法建立校正模型,通過校正模型檢驗(yàn)預(yù)測(cè)集稻谷樣品,對(duì)模型預(yù)測(cè)精度和穩(wěn)定性進(jìn)行驗(yàn)證。用校正集決定系數(shù)和預(yù)測(cè)集決定系數(shù)R2、校正標(biāo)準(zhǔn)偏差(SEC)和預(yù)測(cè)標(biāo)準(zhǔn)偏差(SEP)評(píng)價(jià)模型優(yōu)劣[16]。決定系數(shù)R2越大說明光譜信息和參考值含量相關(guān)性越好,校正標(biāo)準(zhǔn)偏差(SEC)和預(yù)測(cè)標(biāo)準(zhǔn)偏差(SEP)越小,說明模型預(yù)測(cè)性能越好。
2.1 黃曲霉毒素B1含量參考值結(jié)果
采用標(biāo)準(zhǔn)方法測(cè)定得到80個(gè)稻谷樣品黃曲霉毒素B1化學(xué)值如表1和圖1所示。由表1和圖1可知,所收集稻谷樣本黃曲霉毒素B1含量范圍覆蓋廣,梯度分布較均勻,表明樣本具有良好代表性,以此為基礎(chǔ)建立的近紅外校正模型將有較好適應(yīng)性。
2.2 稻谷樣本近紅外光譜特征
由圖2可知,在全波長(zhǎng)范圍內(nèi),感染黃曲霉毒素B1稻谷樣品大部分圖譜結(jié)構(gòu)相似,在8 300~4 000 cm-1波數(shù)范圍內(nèi)存在多個(gè)吸收峰,有強(qiáng)烈的光譜吸收,含較豐富光譜信息。8 304 cm-1處為對(duì)應(yīng)CH2和CH3基團(tuán)C-H伸縮振動(dòng)一級(jí)倍頻[17]。6 838 和4 022 cm-1為脂肪酸和糖類C-H伸縮振動(dòng)組合頻。5 665 cm-1為對(duì)應(yīng)CH2基團(tuán)C-H伸縮振動(dòng)二級(jí)倍頻。5 222~5 102 cm-1譜區(qū)為水和葡萄糖O-H伸縮振動(dòng)一級(jí)倍頻[18]。4 747 cm-1處為酯化分子C=O伸縮振動(dòng)二級(jí)倍頻和氨基酸N-H伸縮振動(dòng)組合頻[19]。
表1 稻谷中黃曲霉毒素B1含量Table 1 Aflatoxin B1content in samples of paddy rice
圖1 貯藏稻谷中黃曲霉毒素B1頻率分布和正態(tài)分布Fig.1 Frequency distribution and normal curve of aflatoxin B1content
圖2 感染黃曲霉毒素B1稻谷樣本近紅外光譜Fig.2 NIR raw spectra of samples of paddy rice,based on the aflatoxin B1infection in the sample
2.3 支持向量機(jī)回歸結(jié)果
在搜索范圍內(nèi)得到支持向量機(jī)回歸結(jié)果見表2。
表2 γ=0.01、0.05、0.10、0.15、0.20對(duì)應(yīng)回歸結(jié)果Table 2 Regression results of support vector machine at γ=0.01、0.05、0.10、0.15、0.20
由表2可知,除γ=0.10外,其余γ對(duì)應(yīng)的支持向量機(jī)回歸模型決定系數(shù)均可達(dá)到0.905。隨γ增加,懲罰參數(shù)c在較小值時(shí)可使回歸模型決定系數(shù)達(dá)到最大值。
2.4 lgc、γ和預(yù)測(cè)標(biāo)準(zhǔn)偏差關(guān)系
圖3和圖4給出lgc、γ和校正標(biāo)準(zhǔn)偏差(SEC)、預(yù)測(cè)標(biāo)準(zhǔn)偏差(SEP)間關(guān)系。由圖3可知,除γ= 0.10對(duì)應(yīng)曲線外,其他4條曲線SEC均隨c增大而減小,而圖4中,SEP和c無(wú)必然聯(lián)系。因此,懲罰參數(shù)c主要影響SVM自預(yù)測(cè)能力,在γ為固定值條件下,c越大,SVM模型SEC越小,模型自預(yù)測(cè)能力提高。在圖4中,幾乎所有曲線SEP都隨γ增大而增大,而SEC和γ無(wú)必然聯(lián)系。因此,RBF核參數(shù)主要影響SVM實(shí)際預(yù)測(cè)能力,在固定懲罰參數(shù)c的情況下,γ越大,SVM的SEP越大,模型實(shí)際預(yù)測(cè)能力越差。
圖3 lgc、γ和校正標(biāo)準(zhǔn)偏差(SEC)的關(guān)系Fig. 3 Relationship between SEC and lgc, γ
圖4 lgc、γ和預(yù)測(cè)標(biāo)準(zhǔn)偏差(SEP)的關(guān)系Fig.4 Relationship betweenSEPand lgc,γ
2.5 SVM檢測(cè)模型優(yōu)化
綜合考慮SVM模型校正標(biāo)準(zhǔn)偏差和預(yù)測(cè)標(biāo)準(zhǔn)偏差,可確定在該搜索范圍內(nèi)支持向量機(jī)最優(yōu)參數(shù)為c=105,γ=0.01,此時(shí)校正標(biāo)準(zhǔn)偏差SEC= 1.589,預(yù)測(cè)標(biāo)準(zhǔn)偏差SEP=2.276,決定系數(shù)R2= 0.905。為尋找最優(yōu)SVM模型,進(jìn)一步縮小最優(yōu)參數(shù)搜索范圍,設(shè)定搜索參數(shù)為:c分別取105、106、107,γ分別取0.001、0.0015、0.002、0.005。表3中列出SVM模型評(píng)價(jià)結(jié)果。通過進(jìn)一步小范圍搜索,從表3中可得到更佳支持向量機(jī)模型,校正標(biāo)準(zhǔn)偏差SEC=1.186,預(yù)測(cè)標(biāo)準(zhǔn)偏差SEP=1.267,決定系數(shù)R2=0.913,得到基于RBF核函數(shù)SVM模型最優(yōu)參數(shù)為c=106,γ=0.0015。該SVM模型可取得較好預(yù)測(cè)結(jié)果。
表3 小范圍內(nèi)搜索得到的SVM回歸結(jié)果Table 3 Regression results of SVM at a small range
利用10 000~4 000 cm-1波段范圍內(nèi)80個(gè)稻谷樣本近紅外光譜測(cè)量數(shù)據(jù),通過支持向量機(jī)算法建立稻谷黃曲霉毒素B1近紅外預(yù)測(cè)數(shù)學(xué)模型,確定基于RBF核函數(shù)模型最優(yōu)參數(shù)為c=106,γ= 0.0015,該模型校正集決定系數(shù)為0.913。
本研究結(jié)果表明,基于支持向量機(jī)算法建模可準(zhǔn)確檢測(cè)稻谷中黃曲霉毒素B1含量??蔀閷?shí)時(shí)、準(zhǔn)確監(jiān)控貯藏稻谷黃曲霉毒素B1污染提供理論依據(jù),為今后稻谷毒素快速無(wú)損檢測(cè)提供新方法。
[1]Ni X Z,Wilson J P,Buntin G D,et al.Spatial pattern s of aflatoxin levels in relation to ear-feeding insect damage in pre-harvest corn [J].Toxins,2011(3):920-931.
[2] 莊振宏,鄭傳琦,汪世華.黃曲霉培養(yǎng)條件的優(yōu)化及黃曲霉毒素B1的提取[J].應(yīng)用與環(huán)境生物學(xué)報(bào),2010,16(5):724-729.
[3] 中華人民共和國(guó)衛(wèi)生部.GB 2761-2011,食品安全國(guó)家標(biāo)準(zhǔn)食品中真菌毒素限量[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2011.
[4]余墩年,劉勇,劉堅(jiān),等.糧倉(cāng)內(nèi)稻谷及稻谷籽粒中黃曲霉毒素B1分布情況研究[J].糧食儲(chǔ)藏,2008(6):42-44.
[5] 譚克竹,張長(zhǎng)利,柴玉華.基于遺傳多層前饋神經(jīng)網(wǎng)絡(luò)的大豆脂肪酸含量近紅外光譜檢測(cè)[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2008,39 (7):112-117.
[6]李娟,李忠海,付湘晉.稻谷新陳度近紅外快速無(wú)損檢測(cè)的研究[J].光譜學(xué)與光譜分析,2012,32(8):2126-2130.
[7] Sirisomboon C D,Putthang R,Sirisomboon P.Application of near infrared spectroscopy to detect aflatoxigenic fungal contamination in rice[J].Food Control,2013,33:207-214.
[8]寧井銘,宛曉春,張正竹,等.近紅外光譜技術(shù)結(jié)合人工神經(jīng)網(wǎng)絡(luò)判別普洱茶發(fā)酵程度[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(11):255-260.
[9]徐文杰,劉茹,洪響聲,等.基于近紅外光譜技術(shù)的淡水魚品種快速鑒別[J].農(nóng)業(yè)工程學(xué)報(bào),2014,30(1):253-261.
[10] 張小超,吳靜珠,徐云.近紅外光譜分析技術(shù)及其在現(xiàn)代農(nóng)業(yè)中的應(yīng)用[M].北京:電子工業(yè)出版社,2010.
[11]周竹,李小昱,李培武,等.基于GA-LSSVM和近紅外傅里葉變換的霉變板栗識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2011,27(3):331-335.
[12] 陳紅光,王健,中野和弘,等.基于支持向量機(jī)的大棗內(nèi)部蟲害無(wú)損檢測(cè)[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2014,45(2):94-102.
[13] 中華人民共和國(guó)衛(wèi)生部.GB/T 5009.22-2003,食品中黃曲霉毒素B1的測(cè)定[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2003.
[14] Zheng Z M,Humphrey C W,King R S,et al.Validation of an ELI?SA test kit for the detection of aflatoxin B1in grain and grain prod?ucts by comparison with HPLC[J].Mycopathologia,2005,159: 255-263.
[15] Zhang Q,Jia F G,Liu C H,et al.Rapid detection of aflatoxin B1in paddy rice as analytical quality assessment by near infrared spectroscopy[J].Int J Agric Biol Eng,2014,7(4):127-133.
[16] 陸婉珍,袁洪福,徐廣通,等.現(xiàn)代近紅外光譜分析技術(shù)[M].北京:化學(xué)工業(yè)出版社,2007:170.
[17] Gaspardo B,Zotto S D,Torelli E.A rapid method for detection of fumonisins B1and B2in corn meal using fourier transform near infrared(FT-NIR)spectroscopy implemented with integrating sphere[J].Food Chem,2012,135:1608-1612.
[18] Berardo N,Pisacane V,Battilani P,et al.Rapid detection of ker?nel rots and mycotoxins in maize by near-infrared reflectance spectroscopy[J].J Agr Food Chem,2005,53:8128-8134.
[19] Osboneb G,Fearn T.Near infrared spectroscopy in food analysis [M].London:Longman Scientific and Technical,1986:36-39.
Near-infrared spectroscopy nondestructive determination of aflatoxin B1in paddy rice based on support vector machine regression
ZHANG Qiang,LIU Chenghai,SUN Jingkun,JIA Fuguo,ZHENG Xianzhe(School of Engineering,Northeast Agricultural University,Harbin 150030,China)
In order to improve the accuracy and the precision of the near infrared spectroscopy technical detection for the aflatoxin B1in the paddy rice,this paper discussed the effects of the parameters of support vector machine on the modeling precision.The parameters took the RBF radial basis function as the kernel function.And 80 paddy rice samples were collected.The near infrared spectroscopy was used to collect spectral information.Then chemical analysis method was used to determine the content of aflatoxin B1in the paddy rice.The regression model of support vector machine for aflatoxin B1in the paddy rice was established.The optimal parameters based on the RBF radial basis function model were determined asc= 106andγ=0.0015.The correlation of calibration sets of this model was 0.913.The standard error of calibration sets and standard error of prediction were 1.186 and 1.267,respectively.The results showed that modeling based on the support vector machine algorithm could accurately detect aflatoxin B1in the paddy rice.The research results could provide theoretical basis for accurate and real-time monitoring of aflatoxin B1contamination in the storage paddy rice.
paddy rice;storage;aflatoxin B1;support vector machine regression;near-infrared spectroscopy
TS207.3
A
1005-9369(2015)05-0084-05
2015-01-24
國(guó)家科技支撐計(jì)劃項(xiàng)目(2012BAK08B04-02);公益性行業(yè)(農(nóng)業(yè))科研專項(xiàng)(201403063-4);黑龍江省科技攻關(guān)項(xiàng)目(GC12B404)
張強(qiáng)(1986-),男,博士研究生,研究方向?yàn)檗r(nóng)產(chǎn)品無(wú)損檢測(cè)。E-mail:13945142945@163.com
鄭先哲,教授,博士生導(dǎo)師,研究方向?yàn)檗r(nóng)產(chǎn)品加工技術(shù)。E-mail:zhengxz@neau.edu.cn