趙紫竹,衛(wèi)勇 ,張乃遷,常若葵,吳海云,劉華,單慧勇,楊仁杰,郭小英
(1.天津農(nóng)學(xué)院工程技術(shù)學(xué)院,天津300384;2.Biological and Agricultural Engineering Department,Kansas State University,M anhattan KS 66502,USA)
牛奶中營養(yǎng)元素豐富,被譽(yù)為“白色血液”,其脂肪、蛋白質(zhì)含量是評價(jià)牛奶品質(zhì)的重要指標(biāo)[1-2]。目前,常用牛奶檢測方法分析過程繁瑣,無法提供在線測試[1]。近年來,應(yīng)用近紅外光譜技術(shù)快速在線測量牛奶品質(zhì)是一個(gè)研究熱點(diǎn)[3-6]。據(jù)報(bào)道采用近紅外光譜技術(shù)可檢測牛奶中干物質(zhì)含量及品質(zhì)[7-8]。Fu等(2014)采用高光譜成像技術(shù)有效檢測了摻假牛奶中低含量(≤1.0%)的三聚氰胺。在國內(nèi)應(yīng)用高光譜定量檢測牛奶中成分含量報(bào)道較少。僅有張倩倩等建立模型對牛奶中蛋白質(zhì)成分含量進(jìn)行預(yù)測。本文利用高光譜成像技術(shù),分別采用PLS法、二維相關(guān)技術(shù)結(jié)合N-PLS法,建立了牛奶中的脂肪含量預(yù)測模型,并分析了兩種預(yù)測模型在測量牛奶脂肪含量上的適用性。
實(shí)驗(yàn)中所用牛奶為市面購買Vitamin D Milk(總脂肪質(zhì)量濃度8 g/240 mL),Hiland牌2%R educed Fat M ilk(總脂肪質(zhì)量濃度5 g/240 mL),1%Low Fat Milk(總脂肪質(zhì)量濃度2.5 g/240 mL),Fat Free Skim Milk(總脂肪質(zhì)量濃度0 g/240 mL)。實(shí)驗(yàn)中所用脂肪含量梯度牛奶樣品均為上述牛奶混合配制,配制后每240 mL中總脂肪量分別為0,0.5,1,…,7.5,8 g共17個(gè)梯度。樣品配制后使用攪拌器攪拌20 min使牛奶中脂肪充分均勻,然后取樣,放置于直徑為70 mm的培養(yǎng)皿中,液面高度為8 mm,用于高光譜測試。表1為樣品質(zhì)量濃度。
表1 牛奶脂肪質(zhì)量濃度
實(shí)驗(yàn)室采用美國堪薩斯州立大學(xué)高光譜儀,采集過程如圖1,成像系統(tǒng)的光譜范圍為400~1000 nm,光譜分辨率<4 nm,共有141個(gè)波段,空間分辨率CCD像元為8微米,圖像分辨率為1024像素×400像素。
采集數(shù)據(jù)前首先對高光譜成像系統(tǒng)進(jìn)行黑白校正,為了使實(shí)驗(yàn)結(jié)果更加精確,同一脂肪質(zhì)量濃度測量3次。
圖1 數(shù)據(jù)采集過程
在高光譜圖像數(shù)據(jù)采集過程中,由于光源在不同波段下的光強(qiáng)不同以及相機(jī)中暗電流的作用對圖像帶來較大的噪音干擾,這些噪音信息會影響高光譜圖像數(shù)據(jù)的質(zhì)量,因此在高光譜圖像數(shù)據(jù)采集之前必須要對系統(tǒng)進(jìn)行黑白校正,以消除噪音信息的干擾[11-12]。首先,將相機(jī)鏡頭蓋上,得到全黑參考高光譜圖像,再將白板放置在電移動平臺,采集到全白參考高光譜圖像,根據(jù)公式(1)進(jìn)行黑白校正。
式中,Ic為校正后高光譜圖像;Iraw為原始高光譜圖像;Idark為全黑參考高光譜圖像;Iwhite為全白參考高光譜圖像。
首先根據(jù)高光譜圖像選取感興趣區(qū)域,再提取感興趣區(qū)域的光譜值作為數(shù)據(jù)分析對象。圖2為牛奶樣品的單波長圖像,選取培養(yǎng)皿中心部分為分析區(qū)域,分析區(qū)域大小為60像素×60像素。提取分析區(qū)域內(nèi)所有高光譜反射值,取每一個(gè)波段下3 600個(gè)像素點(diǎn)的平均值作為該波段的光譜值。即
并根據(jù)式(2)對光譜數(shù)據(jù)采用歸一化處理方法[13],
式中:IN為光譜歸一化值;Ii為各個(gè)波長下光譜反射值;m ax(I)為光譜反射最大值;min(I)為光譜反射最小值。
圖2 牛奶樣品高光譜圖像
圖3為牛奶樣品在401.95~965.54 nm內(nèi)的光譜歸一化反射平均值光譜圖。圖3中,橫坐標(biāo)為波長,縱坐標(biāo)為光譜歸一化反射值。由圖3可以看出,牛奶樣品在652 nm、607 nm下產(chǎn)生較大的吸收峰,但不同脂肪含量的牛奶樣品的光譜圖僅有細(xì)微的差別,由于平均光譜圖中包含信息較少,區(qū)別小,樣品數(shù)量多,光譜數(shù)據(jù)量大,為了更好的探索牛奶中脂肪含量對光譜反射值的影響,還需要對光譜數(shù)據(jù)中所包含的有用信息進(jìn)一步的探索。
圖3 牛奶樣品的平均光譜圖
實(shí)驗(yàn)共有51個(gè)樣品,按照60%,40%的比例分為校正集和測試集,既校正集由34個(gè)樣品組成,測試集由17個(gè)樣品組成。將所有牛奶樣品的光譜值的二維矩陣作為輸入變量,建立PLS模型對牛奶中的脂肪質(zhì)量濃度進(jìn)行定量分析。
主成分?jǐn)?shù)量的選擇對建立具有較高精度的模型十分關(guān)鍵,如果選擇主成分?jǐn)?shù)過大,則容易將噪音信號也擬合進(jìn)去,對模型過度擬合,反之,如果主成分?jǐn)?shù)選擇過小,則對模型擬合不夠,主成分?jǐn)?shù)過大或過小都會影響模型的擬合精度,削弱模型預(yù)測能力[14-15]。為了選擇最優(yōu)主成分個(gè)數(shù),首先對校正集采用交叉驗(yàn)證方法,計(jì)算在不同主成分?jǐn)?shù)下的校正均方根誤差REMSEC值(如圖4)。由圖4可知,當(dāng)主成分?jǐn)?shù)為3時(shí)RMSEC趨于平緩,因此選擇3個(gè)主成分建立PLS模型。
圖4 PLS模型中主成分?jǐn)?shù)對RMSECV的影響
利用光譜歸一化反射平均值建立PLS模型,對校正集中的34個(gè)樣品進(jìn)行預(yù)測,并將校正集中牛奶脂肪含量的實(shí)際值與預(yù)測值進(jìn)行一元線性回歸,結(jié)果如圖5,回歸方程為y=0.9879x+0.4242,其相關(guān)系數(shù)R2為0.9851,RMSEC為0.3066。
圖5 PLS模型校正集樣品預(yù)測結(jié)果
為了對所牛奶脂肪含量預(yù)測模型精度進(jìn)行評價(jià),并檢驗(yàn)預(yù)測模型是否具有通用性,將未參與校正集建模的17個(gè)測試集樣品帶入校正模型進(jìn)行驗(yàn)證計(jì)算,預(yù)測結(jié)果見表2,并對預(yù)測集中牛奶脂肪含量的預(yù)測值與實(shí)際值進(jìn)行一元線性回歸,結(jié)果如圖6,回歸方程為y=1.022x-0.08541,相關(guān)系數(shù)R2為0.9913,預(yù)測均方根誤差RMSEP為0.2409。由圖可見,PLS模型建立的預(yù)測模型對牛奶中脂肪含量的預(yù)測具有較高的精度,能夠精確地預(yù)測牛奶中的脂肪含量。
圖6 PLS模型預(yù)測樣品預(yù)測結(jié)果
將牛奶脂肪含量為0的樣品分別與其余脂肪含量的牛奶樣品進(jìn)行二維相關(guān)計(jì)算,將所有牛奶樣品二維相關(guān)計(jì)算后得到的三維矩陣作為輸入變量,建立N-PLS模型對牛奶中的脂肪含量進(jìn)行定量預(yù)測,
經(jīng)二維相關(guān)計(jì)算后共有48個(gè)牛奶樣品參與模型建立及測試,按照60%,40%的比例分為校正集和測試集,既校正集中有32個(gè)牛奶樣品,測試集中有16個(gè)牛奶樣品。N-PLS模型主成分?jǐn)?shù)的選擇也同樣重要,主成分?jǐn)?shù)對模型精度有較大的影響。首先對校正集采用交叉驗(yàn)證法,計(jì)算在不同主成分?jǐn)?shù)下的R EMSEC值(如圖7)。由圖7可以看出,當(dāng)主成分?jǐn)?shù)為8時(shí)RMSEC值趨于平緩,因此選擇8個(gè)主成分建立N-PLS模型。
圖7 PLS模型中主成分?jǐn)?shù)對RMSECV的影響
利用光譜歸一化反射平均值建立N-PLS模型,對校正集的32個(gè)牛奶樣品中脂肪含量進(jìn)行預(yù)測,并將牛奶脂肪含量的實(shí)際值與預(yù)測值進(jìn)行一元線性回歸,結(jié)果如圖8所示,回歸方程為y=1.0031x-0.017,相關(guān)系數(shù)R2為0.9999。RMSEC為0.0255。
圖8 N-PLS模型校正集樣品預(yù)測結(jié)果
對所建立的牛奶脂肪含量預(yù)測模型進(jìn)行評價(jià),檢驗(yàn)?zāi)P褪欠窬哂型ㄓ眯裕瑢]有參與建模的16個(gè)測試集牛奶樣品帶入N-PLS預(yù)測模型進(jìn)行驗(yàn)證計(jì)算,預(yù)測結(jié)果見表2,對牛奶脂肪含量的預(yù)測值與實(shí)際值進(jìn)行一元線性回歸,結(jié)果如圖9,回歸方程為y=1.026x-0.1199,相關(guān)系數(shù) R2為 0.9976,RMSEP為0.1247。
表2為PLS模型與N-PLS模型對預(yù)測集中17個(gè)牛奶樣品中脂肪質(zhì)量濃度的預(yù)測結(jié)果。在PLS模型當(dāng)中,絕對誤差絕對值最大為0.39,絕對誤差最小為0.03。在N-PLS模型當(dāng)中,絕對誤差絕對值最大為0.303,最小為0.01。通過表3-2能直觀的看到,N-PLS模型的預(yù)測能力略高于PLS模型,尤其是在對脂肪低含量值的預(yù)測,N-PLS模型高于PLS模型。
表2 PLS、N-PLS模型預(yù)測結(jié)果
圖9 N-PLS模型對預(yù)測集預(yù)測結(jié)果
本文在高光譜反射成像系統(tǒng)下,采集不同脂肪質(zhì)量濃度牛奶樣品的高光譜圖像數(shù)據(jù),根據(jù)高光譜圖像選取適當(dāng)?shù)姆治鰠^(qū)域,并提取分析區(qū)域內(nèi)所有光譜數(shù)據(jù)取每個(gè)波段下的平均值,將光譜數(shù)據(jù)進(jìn)行歸一化處理,并進(jìn)行二維相關(guān)計(jì)算,建立PLS模型與N-PLS模型進(jìn)行比較,其中PLS模型校正集R2為0.9851,RMSEC為 0.3066,預(yù)測集 R2為 0.9913,RMSEP為0.2409。N-PLS模型校正集R2為0.9999,RMSEC為0.0255,預(yù)測集R2為0.9976,RMSEP為0.1247。結(jié)果表明,高光譜成像技術(shù)可以應(yīng)用于對牛奶中脂肪質(zhì)量濃度的檢測,而且具有很高的預(yù)測精度,并且采用適當(dāng)?shù)哪P涂梢赃M(jìn)一步提高預(yù)測精度。二維相關(guān)計(jì)算與N-PLS方法相結(jié)合的模型預(yù)測精度優(yōu)于傳統(tǒng)的PLS方法建立的模型,尤其是對脂肪質(zhì)量濃度較低的牛奶樣品。
參考文獻(xiàn):
[1]陽麗芝,陳志偉.牛奶中脂肪檢測技術(shù)研究進(jìn)展[J].食品科學(xué),2011(1):270-273.
[2]張華秀.近紅外光譜法快速檢測牛奶中蛋白質(zhì)與脂肪含量[D].中南大學(xué),2010.
[3]趙明富,施玉佳,羅彬彬,王念,曹李華,羅松.基于近紅外透射光譜的牛奶中脂肪和蛋白質(zhì)含量檢測[J].激光雜志,2014(1):44-45,50.
[4]陽麗芝,陳志偉.牛奶中脂肪檢測技術(shù)研究進(jìn)展[J].食品科學(xué),2011,32(1):270-273.
[5]王晶,王加啟,卜登攀,等.近紅外光譜技術(shù)在牛奶及其制品品質(zhì)檢測中的應(yīng)用[J].光譜學(xué)與光譜分析,2009,29(5):1281-1285.
[6]韓東海,魯超,劉毅.純牛奶、還原奶、摻假奶、牛奶新鮮度的近紅外檢測[C]//中國乳制品工業(yè)協(xié)會第十一次年會,2005.
[7]李曉云,王加華,黃亞偉,等.便攜式近紅外儀檢測牛奶中脂肪、蛋白質(zhì)及干物質(zhì)含量.光譜學(xué)與光譜分析,2011,31(3):665-668.
[8]楊仁杰,劉蓉,楊延榮,等.用二維相關(guān)近紅外譜和多維主成分分析判別摻雜牛奶.光學(xué)精密工程,2014,22(9):2352-2358.
[9]FU X,KIM MS,CHAO K,et al.Detection of melamine in m ilk pow ders based on N IR hyperspectral imaging and spectral sim ilarity analyses[J].Journalof Food Engineering,2014,124(1):97-104.
[10]張倩倩,譚琨.2015.基于高光譜的牛奶中真蛋白質(zhì)含量反演.光譜學(xué)與光譜分析,35(12):3436~3439.