陳積山, 朱瑞芬, 張 強(qiáng), 杜優(yōu)穎, 孔曉蕾
(黑龍江省農(nóng)業(yè)科學(xué)院草業(yè)研究所, 黑龍江 哈爾濱, 150086)
近紅外光譜(Near infrared spectroscopy,NIRS)分析,是利用有機(jī)化學(xué)物質(zhì)在其近紅外光譜區(qū)內(nèi)的光學(xué)特性,快速測(cè)定樣品中一種或多種化學(xué)成分含量的新技術(shù)。它具有處理樣品簡(jiǎn)便甚至無需處理、分析速度快、譜圖信息量大、分析效率高、不破壞樣品、便于實(shí)現(xiàn)在線分析、分析成本低、無污染等優(yōu)點(diǎn),現(xiàn)已廣泛應(yīng)用在農(nóng)牧、食品、化工、石化、制藥、煙草、飼料等眾多領(lǐng)域。便攜式微型近紅外光譜儀也在普及和應(yīng)用,為現(xiàn)場(chǎng)檢測(cè)提供了便利。建立這種微型儀的測(cè)定模型,成為當(dāng)前廣泛關(guān)注的研究熱點(diǎn)[1-2]。
隨著偏最小二乘法(Partial Least Square Method,PLS)的深入研究與應(yīng)用,使用特定的方法篩選出具有特征的波長(zhǎng)或波長(zhǎng)區(qū)間,才能建立較好的定量模型。特征波長(zhǎng)優(yōu)選可以簡(jiǎn)化模型,降低模型維數(shù),特別是可以剔除不相關(guān)或非線性變量因素,得到魯棒性好和測(cè)定能力強(qiáng)的測(cè)量模型[3-12]。目前,普遍認(rèn)為偏最小二乘法(PLS)具有較強(qiáng)的全波長(zhǎng)建模能力。但研究表明,近年來通過波長(zhǎng)優(yōu)選可以消除不相關(guān)或非線性變量,簡(jiǎn)化模型并完全獲得魯棒性好和測(cè)定能力強(qiáng)的模型[9,13]。波長(zhǎng)優(yōu)選方法主要有隨機(jī)蛙跳(Random Frog,RF)[14]、移動(dòng)窗(Moving Window,MW)[15]、無信息變量消除法(Uninformative Variable Elimination,UVE)[16]、間隔偏最小二乘法(Interval Partial Least Square Method,Ipls)[17]、自適應(yīng)量加權(quán)采樣(CompetiveAdaptive Reweighted Sampling,CARS)[18]和遺傳算法(GeneticAlgorithms,GA)[19]等。
本文探討UVE和RF分別與PLS組合,并選擇羊草常規(guī)營(yíng)養(yǎng)成分含量的敏感波長(zhǎng)變量,建立測(cè)定羊草常規(guī)營(yíng)養(yǎng)成分的最適模型,首次建立采用近紅外儀快速測(cè)定羊草品質(zhì)穩(wěn)定可靠的測(cè)定模型,為科學(xué)評(píng)價(jià)羊草質(zhì)量、促進(jìn)羊草交易、高質(zhì)量生產(chǎn)利用和安全儲(chǔ)存提供技術(shù)支撐。
試驗(yàn)于2014~2017年6月初在黑龍江及內(nèi)蒙東部草地選擇單一羊草群落,每個(gè)樣地50畝不少于5個(gè)采樣點(diǎn),生物量鮮重不少于500 g,收集地上5 cm以上的羊草為待測(cè)樣品,裝入紗網(wǎng)袋袋中。當(dāng)天在實(shí)驗(yàn)室將其用烘箱干燥(65℃,48 h)。按樣品編號(hào),每隔 3個(gè)樣品隨機(jī)抽取 1個(gè),共計(jì)270個(gè)樣品作為供試樣品。供試樣品分別用刀式磨粗磨,再用Foss公司的Cyclotec TM1093旋風(fēng)磨二次細(xì)磨;過1.0 mm篩;放入搖勻器中搖動(dòng)30 s;按照編號(hào)裝入自封袋;常溫避光保存。
近紅外光譜臺(tái)式分析儀采用瑞典波通(Perten)公司二極管陣列近紅外漫反射光譜儀(DA7200),樣品池的光程為 13 mm,材質(zhì)為石英試樣杯?;瘜W(xué)儀器:烘箱,瑞典福斯·特卡托2300全自動(dòng)凱氏定氮儀(Foss公司),索式粗纖維測(cè)定儀Fibertec1020(Foss公司);IR35全自動(dòng)快速水分測(cè)定儀。
測(cè)定項(xiàng)目為水分(Water,W)、粗蛋白(Crude Protein,CP)、酸性洗滌纖維(Acid Detergent Fiber,ADF)和中性洗滌纖維(Neutral Detergent Fiber,NDF)。3次重復(fù),均以干物質(zhì)為基礎(chǔ)。所有測(cè)試數(shù)據(jù)由農(nóng)業(yè)部谷物及制品質(zhì)量監(jiān)督檢測(cè)測(cè)試中心(哈爾濱)測(cè)定。
圖1 羊草的近紅外光譜Fig.1 Near Infrared Spectrum of the samples ofLeymus chinensis
近紅外測(cè)定。測(cè)得的數(shù)據(jù)為近紅外值。在確定了羊草的近紅外光譜后,在上述波長(zhǎng)內(nèi)測(cè)定羊草品質(zhì)常規(guī)營(yíng)養(yǎng)成分,包括剔除異常樣本后,樣品具有較好的差異性和代表性,符合近紅外光譜PLS定量模型研究。
化學(xué)測(cè)定。測(cè)得的數(shù)據(jù)為化學(xué)值。水分測(cè)定按照GB/T6435-2014標(biāo)準(zhǔn)方法測(cè)定。
粗蛋白測(cè)定按照GB/T6432-1994標(biāo)準(zhǔn)方法測(cè)定。其中,(1)消化:準(zhǔn)確稱取0.2000 g試樣,無損失地轉(zhuǎn)移到消解管的底部,加入1勺催化劑(0.4 g硫酸銅+6 g硫酸鈉或硫酸鉀),再加入 10 ml濃硫酸搖勻。將消解管放在通風(fēng)櫥的消煮爐上用 290℃炭化 15 min,然后將溫度調(diào)至420℃進(jìn)行消解180 min。將消煮完的試驗(yàn)樣品從消煮爐上取下,冷卻至室溫,待測(cè)。(2)蒸煮:把配制好的400g·L-1氫氧化鈉溶液、1%硼酸溶液和蒸餾水,裝在定氮儀上進(jìn)行測(cè)定,直接輸出粗蛋白含量數(shù)據(jù)。注意每次開始試驗(yàn)前要用蒸餾水進(jìn)行空白管校正試驗(yàn)。
中性洗滌纖維和酸性洗滌纖維測(cè)定采用Van Soest方法。中性洗滌纖維的計(jì)算公式如下,其中式中:W1為濾袋質(zhì)量(g),W2為一樣品質(zhì)量(g),W3為提取過程后濾袋和樣品的質(zhì)量(g),C1為空白濾袋校正系數(shù)(提取后烘干的空白袋質(zhì)量/空白袋質(zhì)量)。每個(gè)樣品做三個(gè)重復(fù),用三個(gè)數(shù)的算數(shù)平均數(shù)作為最終結(jié)果。
酸性洗滌纖維的計(jì)算公式如下,其中式中:W1為濾袋質(zhì)量(g),W2為一樣品質(zhì)量(g),W3為提取過程后濾袋和樣品的質(zhì)量(g),C1為空白濾袋校正系數(shù)(提取后烘干的空白袋質(zhì)量/空白袋質(zhì)量)。
計(jì)算每個(gè)樣品測(cè)定項(xiàng)目二個(gè)重復(fù)測(cè)量值的平均數(shù),并折算成絕對(duì)干重,以百分比表示。
本試驗(yàn)采用MATLAB7.0 軟件(美國(guó)MathWorks公司)的自編程序?qū)υ囼?yàn)數(shù)據(jù)進(jìn)行處理。利用matlab工具箱(iToolbox)建立羊草水分、粗蛋白、中性洗滌纖維和酸性洗滌纖維的關(guān)系模型。用決定系數(shù)(R2)和均方根誤差(Root Mean Square Error,RMSE)評(píng)價(jià)新建模型。同時(shí),借助SPSS 17.0進(jìn)行所有數(shù)據(jù)的整理和分析。
無信息變量消除法(unknown variable elimination,UVE)將與自身矩陣相同數(shù)量的變量之隨機(jī)變量矩陣添加到光譜矩陣中。然后通過交叉驗(yàn)證,逐個(gè)消除非信息變量[10,20],建立偏最小二乘法(partial least squares,PLS)多元回歸模型,得到回歸系數(shù)的矩陣。通過分析回歸系數(shù)矩陣中回歸系數(shù)向量的均值和標(biāo)準(zhǔn)偏差的商的穩(wěn)定性,最后根據(jù)商的絕對(duì)值確定是否在最終模型中使用變量。
3)可以通過搜索引擎,在百度、搜狐上搜索一些熟知的英文新聞網(wǎng)站和英文學(xué)習(xí)網(wǎng)站,了解最新國(guó)內(nèi)外大事和與四、六級(jí)考試相關(guān)的資訊。
隨機(jī)蛙法(random frog algorithm,RF)是對(duì)波長(zhǎng)優(yōu)化計(jì)算,用少數(shù)變量對(duì)羊草品質(zhì)進(jìn)行建模[21]。選擇每個(gè)波長(zhǎng)變量輸出的概率,并根據(jù)可能性的大小選擇波長(zhǎng)。
UVE和RF2種方法在Matlab代碼指令下分別與PLS聯(lián)合建模(UVE-PLS和RF-PLS),與偏最小二乘法的全波長(zhǎng)模型進(jìn)行比較分析。
把羊草水分含量的近紅外值和化學(xué)值進(jìn)行比較,對(duì)模型進(jìn)行校正和預(yù)測(cè)。圖2中(A)、(B)和(C)分別為經(jīng)過PLS、UVE-PLS和RF-PLS模型獲得校正集和預(yù)測(cè)集的散點(diǎn)圖。采用UVE優(yōu)選特征波長(zhǎng)結(jié)合PLS測(cè)定模型,即UVE-PLS模型測(cè)定羊草水分含量的數(shù)據(jù)分布,更加明顯集中在擬合線附近。
表1 波長(zhǎng)優(yōu)選模型對(duì)羊草水分的測(cè)定效果Tab.1 Predictive effect of wavelength optimization model on water content of Leymus chinensis
圖2 不同模型分析羊草中水分含量的預(yù)測(cè)值與真實(shí)值Fig.2 Prediction and measurement of water content in Leymus chinensis by different models注:黑色點(diǎn)為真實(shí)值,紅色點(diǎn)為預(yù)測(cè)值,下同Note:The black point is the true value and the red point is the predicted value,the same as below
在羊草粗蛋白含量的測(cè)定模型中,同樣采用1st Derivative、SNV預(yù)處理組合法,分析羊草樣品的近紅外光譜數(shù)據(jù),進(jìn)行UVE、RF和全波長(zhǎng)光譜信息建模預(yù)測(cè),得出三種模型的相關(guān)結(jié)果見表2所示。比較UVE、RF和PLS模型及其組合的結(jié)果,UVE-PLS與全波長(zhǎng)PLS模型相比,顯著
表2 波長(zhǎng)優(yōu)選模型對(duì)羊草粗蛋白的測(cè)定效果Tab.2 Predictive effect of wavelength optimization model on CP of Leymus chinensis
羊草粗蛋白含量近紅外值和化學(xué)值在PLS、UVE-PLS和RF-PLS三種模型的校正集和預(yù)測(cè)集的散點(diǎn)圖分別見圖3中的(A)、(B)和(C)。從圖中可知,采用UVE優(yōu)選特征波長(zhǎng)結(jié)合PLS的模型,即UVE-PLS模型預(yù)測(cè)的羊草粗蛋白含量的數(shù)據(jù)分布,在擬合線附近的集中度更明顯。
圖3 不同模型分析羊草中粗蛋白含量的預(yù)測(cè)值與真實(shí)值Fig.3 Prediction and measurement of CP content in Leymus chinensis by different models
表3 波長(zhǎng)優(yōu)選模型對(duì)羊草酸性洗滌纖維含量的測(cè)定效果Tab.3 Predictive effect of wavelength optimization model on ADF of Leymuschinensis
比較圖4中的羊草酸性洗滌纖維含量近紅外值和化學(xué)值的數(shù)據(jù)分布,(B)圖UVE-PLS測(cè)定模型更明顯地集中在擬合線附近。
圖4 不同模型分析羊草酸性洗滌纖維含量的預(yù)測(cè)值與真實(shí)值Fig.4 Prediction and measurement of ADF content in Leymus chinensis by different models
表4 波長(zhǎng)優(yōu)選模型對(duì)羊草酸性洗滌纖維含量的測(cè)定效果Tab.4 Predictive effect of wavelength optimization model on NDF of Leymuschinensis
變量數(shù)Variable number校正均方根誤差RMSEC校正集決定系數(shù)R2C交叉驗(yàn)證均方根誤差RMSECV交叉驗(yàn)證決定系數(shù)R2CV預(yù)測(cè)均方根誤差RMSEP預(yù)測(cè)集的決定系數(shù)R2PPLS1200.48320.89550.79670.70280.77360.8029UVE-PLS540.26360.97210.40430.93060.69230.9768RF-PLS660.40210.93230.66310.79320.71250.8337
比較圖5羊草中性洗滌纖維含量的近紅外值和化學(xué)值的散點(diǎn)圖,圖(B)采用UVE優(yōu)選特征波長(zhǎng)結(jié)合PLS的模型,測(cè)量效果更接近真實(shí)值。
圖5 不同模型分析羊草中性洗滌纖維含量的預(yù)測(cè)值與真實(shí)值Fig.5 Prediction and measurement of NDF content in Leymus chinensis by different models