苗鈞魁,張雅婷,劉小芳,于源,冷凱良,2*,楊增光,蔣永毅
1(中國水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所 農(nóng)業(yè)部海洋漁業(yè)可持續(xù)發(fā)展重點(diǎn)實(shí)驗(yàn)室 青島市極地漁業(yè)資源開發(fā)工程研究中心, 山東 青島,266071)2(青島海洋科學(xué)與技術(shù)試點(diǎn)國家實(shí)驗(yàn)室,山東 青島,266200)3(青島菲優(yōu)特檢測(cè)有限公司, 山東 青島,266111)
南極磷蝦(Euphausiasuperba)廣泛分布于南極海域,據(jù)研究數(shù)據(jù)統(tǒng)計(jì)估計(jì),南極磷蝦的生物量高達(dá)3.7億t左右[1],如今該資源在《南極海洋生物資源養(yǎng)護(hù)公約》的監(jiān)督下得到可持續(xù)發(fā)展,是世界上最重要的動(dòng)物蛋白及脂質(zhì)的寶庫之一[2]。南極磷蝦約含有77.9%~83.1%的水分,11.9%~15.4%的蛋白質(zhì),0.4%~3.6%的脂肪和約2%的甲殼質(zhì)[3-4]。南極磷蝦粉是南極磷蝦加工的主要產(chǎn)品之一,蛋白質(zhì)含量一般在490~720 g/kg,脂肪含量在50~200 g/kg,其蛋白質(zhì)和脂肪含量均較高[5-10]。由于南極磷蝦粉的生產(chǎn)是在磷蝦捕撈加工船上進(jìn)行,受制于船上條件,加工過程中磷蝦粉的品質(zhì)檢測(cè)工作難以完成,成為影響我國南極磷蝦粉產(chǎn)品品質(zhì)的因素之一,亟待解決。
近紅外光譜(near infrared spectroscopy, NIR)技術(shù)是一種對(duì)有機(jī)物成分快速分析的新型分析技術(shù),其工作原理是根據(jù)被測(cè)物質(zhì)在不同波長下的吸光度差異來進(jìn)行物質(zhì)分析。隨著近紅外分析技術(shù)的不斷進(jìn)步,近紅外光譜分析在石油、化工、農(nóng)林、食品等領(lǐng)域得到了廣泛應(yīng)用[11-12]。與傳統(tǒng)方法相比,該技術(shù)具有以下優(yōu)點(diǎn):待測(cè)樣品無需預(yù)處理、多組分快速同步檢測(cè)、對(duì)待測(cè)樣品不造成傷害、對(duì)環(huán)境和人體健康不構(gòu)成威脅[13]。在水產(chǎn)加工領(lǐng)域,應(yīng)用近紅外光譜法檢測(cè)食品品質(zhì)已有很多應(yīng)用研究:曹小華等[14]以480個(gè)不同類型的魚粉樣品為原料,利用傅里葉近紅外光譜建立了魚粉揮發(fā)性鹽基氮的定量分析模型,模型預(yù)測(cè)值與化學(xué)值之間的決定系數(shù)達(dá)0.94以上;王小燕等[15]采集了不同公司生產(chǎn)的多個(gè)批次的魚糜樣品共196個(gè),建立了魚糜樣品中水分和蛋白質(zhì)含量的近紅外光譜校正模型,并采用獨(dú)立樣品集進(jìn)行了預(yù)測(cè);王衛(wèi)軍等[16]以94份具有代表性的長牡蠣鮮樣組織樣品的近紅外數(shù)據(jù)和其對(duì)應(yīng)的化學(xué)真實(shí)值數(shù)據(jù)為基礎(chǔ),研究了近紅外技術(shù)預(yù)測(cè)長牡蠣鮮樣組織中水分、糖原等成分含量的可行性?,F(xiàn)有的對(duì)于磷蝦粉品質(zhì)的研究均采用傳統(tǒng)的化學(xué)分析方法,從技術(shù)角度來看,實(shí)驗(yàn)室研究和實(shí)際應(yīng)用市場(chǎng)都需要更準(zhǔn)確快捷的分析方法[17-18]。基于近紅外光譜分析技術(shù),利用采集到的磷蝦粉光譜數(shù)據(jù),建立定性分析模型,有望實(shí)現(xiàn)南極磷蝦粉品質(zhì)指標(biāo)的快速檢測(cè)。
由于目前國內(nèi)生產(chǎn)磷蝦粉的企業(yè)少,磷蝦粉樣品收集不易,本研究采集了18個(gè)磷蝦粉樣品,首先利用采集到的樣品進(jìn)行定標(biāo)模型的建立,并對(duì)該模型進(jìn)行了評(píng)價(jià)。為提高預(yù)測(cè)模型的精確度,進(jìn)一步按1∶1的質(zhì)量比對(duì)磷蝦粉樣品進(jìn)行了混合,增加了樣品的數(shù)量,共獲得50個(gè)磷蝦粉混合樣品,以此提升磷蝦粉品質(zhì)近紅外檢測(cè)模型的預(yù)測(cè)精度,為實(shí)現(xiàn)南極磷蝦粉品質(zhì)指標(biāo)的近紅外快速檢測(cè)提供了參考依據(jù)。
傅里葉變換近紅外光譜儀(美國Antaris Ⅱ公司),配備RESULTM樣品光譜采集的集成軟件以及數(shù)據(jù)處理軟件 TQ analyst(美國Thermo Fisher公司)。
本實(shí)驗(yàn)在2018年10月—2019年11月,分別從遼漁集團(tuán)有限公司獲得樣品6個(gè),分別編號(hào)為遼漁1~遼漁6,從中水集團(tuán)遠(yuǎn)洋股份有限公司獲得磷蝦粉樣品12個(gè),分別編號(hào)為中水1~中水12。樣品無異味、霉變、結(jié)塊現(xiàn)象,符合衛(wèi)生標(biāo)準(zhǔn),樣品于-20 ℃冰箱中密封儲(chǔ)存待用。
系統(tǒng)采用漫反射方式采集光譜圖像。儀器工作參數(shù)設(shè)置如下:正式掃描開始前,使光譜儀開機(jī)預(yù)熱30 min;將樣品加入至直徑為5 cm的石英杯中,樣品高度1.5~2 cm,樣品均勻分布在石英杯中。光譜掃描波數(shù)為10 000~4 000 cm-1,掃描次數(shù)為32次,分辨率8 cm-1,掃描溫度為室溫,用吸光度表示吸收光譜。在近紅外光譜掃描過程中,為減少儀器波動(dòng)對(duì)光譜的影響,樣品經(jīng)過3次平行掃描測(cè)量。
樣品光譜采集完成后,根據(jù)GB/T 19164—2003對(duì)18個(gè)初始樣品的水分、蛋白質(zhì)、脂肪含量進(jìn)行了測(cè)定,每個(gè)樣品平行測(cè)試3次,測(cè)量結(jié)果取算數(shù)平均值。
建模前,先采用TQ Analyst軟件對(duì)采集的樣品的原始近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理。分別采用導(dǎo)數(shù)和平滑結(jié)合的6種光譜前處理方法對(duì)采集的光譜進(jìn)行處理,選取最優(yōu)預(yù)處理方法,再用偏最小二乘法對(duì)預(yù)處理后的光譜數(shù)據(jù)進(jìn)行運(yùn)算處理,選擇TQ analyst軟件自動(dòng)推薦的光譜范圍,并對(duì)模型進(jìn)行檢驗(yàn),模型的評(píng)價(jià)參數(shù)包括建模相關(guān)系數(shù)(correlation coefficient in calibration,RC)、交互驗(yàn)證殘差均方根(root mean square error of cross validation,RMSECV)、交互驗(yàn)證相關(guān)系數(shù)(correlation coefficient in cross validation,RCV)、交叉驗(yàn)證用樣品真實(shí)值標(biāo)準(zhǔn)差與RMSECV的比值(the ratio of the RMSECV to standard deviation of reference data in the validation,RPDCV)、外部驗(yàn)證殘差均方根(root mean square error of external prediction,RMSEP)、外部驗(yàn)證相關(guān)系數(shù)(correlation coefficient in external validation,REV)以及外部驗(yàn)證用樣品真實(shí)值的標(biāo)準(zhǔn)差與RMSEP的比值(the ratio of the RMSEP to standard deviation of reference data in the prediction, RPDEV)[16]。
利用交叉驗(yàn)證來完成模型的內(nèi)部驗(yàn)證,校正樣品中的每個(gè)樣品依次作為臨時(shí)驗(yàn)證樣品,除被選中的臨時(shí)驗(yàn)證樣品外的其余樣品作為建模樣品,構(gòu)成模型對(duì)臨時(shí)驗(yàn)證樣品進(jìn)行預(yù)測(cè),依次循環(huán)完所有樣品以得到交叉預(yù)測(cè)值。
本研究進(jìn)行了2種磷蝦粉預(yù)測(cè)模型的構(gòu)建,一種是利用18個(gè)原始樣品直接進(jìn)行建模,隨機(jī)選取15個(gè)作為建模集,3個(gè)樣品作為驗(yàn)證集;因脂肪含量是蝦粉品質(zhì)指標(biāo)的關(guān)鍵因素,因此另一種挑選遼漁和中水樣品組中脂肪含量最高和最低的2組4個(gè)樣品(遼漁1、遼漁5、中水3和中水5),分別與同組的其他樣品按1∶1的質(zhì)量比混合均勻,獲得32個(gè)混合磷蝦粉樣品,加上18個(gè)初始樣品,共獲得50個(gè)磷蝦粉樣品,并以此進(jìn)行第2組近紅外模型的建立,其中隨機(jī)抽取40個(gè)樣品作為建模集,10個(gè)樣品作為驗(yàn)證集。
在異常樣品存在的情況下進(jìn)行建模將會(huì)對(duì)模型的預(yù)測(cè)精度造成影響,為確保磷蝦粉樣品數(shù)據(jù)的精度,需對(duì)光譜數(shù)據(jù)中的異常樣品進(jìn)行剔除。常用的異常值剔除方法有:濃度殘差剔除法、馬氏距離法(mahalanobis distance,MD)、蒙特卡洛采樣算法、杠桿值法等。馬氏距離是指數(shù)據(jù)的協(xié)方差距離,它是一種有效地計(jì)算2個(gè)未知樣品集的相似度的方法。本文利用MD法對(duì)光譜數(shù)據(jù)進(jìn)行異常樣品剔除處理[19]。
在進(jìn)行粉末樣品NIR漫反射光譜采集時(shí),由于樣品顆粒尺寸、均勻性等的影響,光程無法保持恒定,此時(shí)需要使用多元信號(hào)修正或標(biāo)準(zhǔn)正則變換(standard normal variate transform, SNV)來對(duì)光譜進(jìn)行處理,以消除這些因素的干擾。本文采用SNV方式。
近紅外光譜測(cè)量過程中,經(jīng)常出現(xiàn)光譜偏移或飄移。導(dǎo)數(shù)處理是凈化譜圖較常用的預(yù)處理方法,可根據(jù)需要進(jìn)行一階或二階微分處理。導(dǎo)數(shù)處理既可以消除基線偏移,還可以起到一定的放大和分離重疊信息的作用;平滑的作用是提高信噪比,減小隨機(jī)噪音,從而也可以提高模型的穩(wěn)健性[20-21]。有2種平滑方法可供使用,一種是經(jīng)典的 Savitzky-Golay濾波(SG),它是一種多項(xiàng)式濾波方法,另一種是Norris導(dǎo)數(shù)濾波(Norris derivative filter, NDF),它只能用于一階或二階導(dǎo)數(shù)光譜,是紅外光譜分析中一種很好的濾波方法。
圖1 磷蝦粉樣品的NIR漫反射原始光譜Fig.1 Raw NIR diffuse reflectance spectra of krill meal samples
本文分別采用一階微分(first-order difference,F(xiàn)D)、二階微分(second-order difference,SD)及其與SNV方式和2種平滑方式相結(jié)合的6種方式對(duì)磷蝦粉樣品近紅外圖譜進(jìn)行預(yù)處理,近紅外光譜預(yù)處理結(jié)果如表1~表3所示:
表1 磷蝦粉蛋白近紅外光譜預(yù)處理結(jié)果Table 1 Krill meal protein NIR pretreatment results
表2 磷蝦粉水分近紅外光譜預(yù)處理結(jié)果Table 2 Krill meal moisture NIR pretreatment results
表3 磷蝦粉脂肪近紅外光譜預(yù)處理結(jié)果Table 3 Krill meal fat NIR pretreatment results
磷蝦粉原始樣品的原始光譜的蛋白質(zhì)、水分、脂肪所對(duì)應(yīng)的預(yù)處理結(jié)果如表1~表3所示,經(jīng)RC、REV和RCV3個(gè)參數(shù)綜合比較,蛋白、脂肪和水分三者的最佳預(yù)處理方式均為SNV+FD+NDF,經(jīng)預(yù)處理后,蛋白模型主成分?jǐn)?shù)為6,RC為0.989 3,REV為0.917 2,RCV為0.964 8;水分模型主成分?jǐn)?shù)為3,RC為0.983 1,REV為0.997 1,RCV為0.971 0;脂肪模型主成分?jǐn)?shù)為10,RC為1.000 0,REV為0.991 0,RCV為0.944 3。
磷蝦粉光譜數(shù)據(jù)預(yù)處理參數(shù)如表4所示,經(jīng)譜圖預(yù)處理后,模型的相關(guān)系數(shù)較未經(jīng)過預(yù)處理得到明顯提升,說明模型的預(yù)測(cè)精度也得到顯著提升,預(yù)處理后的光譜圖見圖2。
表4 原始磷蝦粉光譜數(shù)據(jù)預(yù)處理參數(shù)Table 4 Pretreatment parameters of NIR spectral data of krill meal samples composition
圖2 磷蝦粉樣品的預(yù)處理后NIR光譜圖Fig.2 NIR spectra of krill meal samples after pretreatment
2.3.1 原始磷蝦粉樣品指標(biāo)表述性統(tǒng)計(jì)
本實(shí)驗(yàn)中18份樣品的建模集和驗(yàn)證集的樣品數(shù)見表5,建模集樣品共15個(gè),其中遼漁磷蝦粉樣品5個(gè),中水樣品10個(gè);驗(yàn)證集樣品共3個(gè),其中遼漁樣品1個(gè),中水樣品2個(gè)。表5數(shù)據(jù)顯示各組分間各個(gè)成分最大值分別為最小值的:水分(7.64倍)、蛋白質(zhì)(1.13倍)、脂肪(1.98倍),各組分含量差異較大,樣品成分含量范圍足夠廣泛,證明此樣品可以進(jìn)行近紅外光譜的建模分析。
表5 原始磷蝦粉樣品建模集和驗(yàn)證集樣品成分含量Table 5 Modeling set and validation set composition content of original krill meal samples
2.3.2 預(yù)測(cè)模型建立與優(yōu)化
原始樣品建模結(jié)果如表6及圖3~圖5所示,不同成分樣品無異常值被剔除。模型建立過程中的各個(gè)相關(guān)系數(shù),即:RC、RCV和REV值越接近100%,模型的擬合程度越好[22];RMSECV、RMSEP也同樣用來評(píng)價(jià)模型的優(yōu)劣,RMSECV和RMSEP越小,證明模型的精確度越高,RMSECV和RMSEP越接近,證明模型的穩(wěn)定性越高;同時(shí)模型的RPD值是模型評(píng)價(jià)的另一個(gè)重要指標(biāo),精準(zhǔn)度高的模型具有高RPD值,當(dāng)RPD值大于2.5時(shí)模型可以進(jìn)行準(zhǔn)確預(yù)測(cè)。
表6 磷蝦粉原始樣品建模過程中的指標(biāo)描述Table 6 Index description in the process of modeling the original krill sample
在原始樣品模型中,各組分的三類相關(guān)系數(shù)都在0.9以上,蛋白、脂肪和水分3個(gè)含量指標(biāo)的建模相關(guān)系數(shù)RC均大于0.98,其RMSEC值均小于0.45,交叉驗(yàn)證相關(guān)系數(shù)RCV均在0.94以上,脂肪RMSECV略高(>1),但RPDCV均大于2.5,說明模型的精確度較好[23]。但在外部驗(yàn)證中,外部驗(yàn)證相關(guān)系數(shù)還比較理想,REV值大于0.91,但蛋白和脂肪的RMSEP值較高,RPDEV僅水分為6.46,蛋白質(zhì)和脂肪均小于2.5,不甚理想,這可能主要由于驗(yàn)證集樣本量較小導(dǎo)致。
圖3 原始樣品模型蛋白含量NIR主要參數(shù)Fig.3 NIR parameters of protein content in the original sample model
圖4 原始樣品模型脂肪含量NIR主要參數(shù)Fig.4 NIR parameters of fat content of the original sample model
圖5 原始樣品模型水分含量NIR主要參數(shù)Fig.5 NIR parameters of moisture content of the original sample model
為提升NIR模型的預(yù)測(cè)精度,檢測(cè)樣品數(shù)量應(yīng)越多越好。但由于有區(qū)分度的磷蝦粉樣品不易獲得,廠家在生產(chǎn)過程中也未對(duì)樣品進(jìn)行分類,很難短時(shí)間內(nèi)獲得足量有區(qū)分度的樣品。由于磷蝦粉本身不是一種單一的分布均勻的原料,理論上通過混合后的樣品依然符合磷蝦粉樣品的特征。如1.5所述,本實(shí)驗(yàn)采用40個(gè)原始樣品加混合樣品進(jìn)行單獨(dú)建模,與原始樣品的NIR模型進(jìn)行比較。光譜預(yù)處理方式采用2.2中最佳預(yù)處理方式:SNV+FD+NDF。
2.4.1 混合磷蝦粉樣品指標(biāo)表述性統(tǒng)計(jì)
表7以及圖6~圖8數(shù)據(jù)表明,經(jīng)SNV+FD+NDF預(yù)處理后,蛋白質(zhì)模型主成分?jǐn)?shù)為6,光譜范圍為5 731.40~5 580.98 cm-1, 7 875.86~7 613.59 cm-1,8 396.54~8 219.13 cm-1;水分模型主成分?jǐn)?shù)為4,光譜范圍為5 164.43~4 971.56 cm-1,6 869.20~6 117.10 cm-1;脂肪模型主成分?jǐn)?shù)為7,光譜范圍為8 307.83~7 926.00 cm-1,8 573.96~8 396.54 cm-1。
表7 混合磷蝦粉光譜數(shù)據(jù)預(yù)處理參數(shù)Table 7 Pretreatment parameters of NIR spectral data of mixed krill meal samples composition
混合樣品的建模集和驗(yàn)證集的樣品數(shù)見表8,建模集樣品共40個(gè),其中遼漁原始磷蝦粉樣品4個(gè),遼漁混合磷蝦粉樣品8個(gè),中水原始磷蝦粉樣品9個(gè),中水混合磷蝦粉樣品19個(gè),驗(yàn)證集樣品共10個(gè),其中遼漁原始磷蝦粉樣品2個(gè),遼漁混合磷蝦粉樣品2個(gè),中水原始磷蝦粉樣品3個(gè),中水混合磷蝦粉樣品3個(gè)。各組分間各個(gè)成分差異情況與原始樣品相同,符合建模要求。
圖6 混合樣品水分、蛋白質(zhì)和脂肪模型主成分因子數(shù)Fig.6 Factors of mixed sample moisture, protein and fat models
圖7 混合樣品模型蛋白質(zhì)含量NIR主要參數(shù)Fig.7 NIR parameters of protein content of the mixed sample model
圖8 混合樣品模型脂肪含量NIR主要參數(shù)Fig.8 NIR parameters of fat content of the mixed sample model
2.4.2 預(yù)測(cè)模型建立與優(yōu)化
在原始樣品模型中,各組分的RC、RCV和REV三類相關(guān)系數(shù)除脂肪的REV為0.905 8,其余均在0.94以上,水分、脂肪和蛋白質(zhì)3個(gè)含量指標(biāo)的建模相關(guān)系數(shù)RC均大于0.97,其RMSEC值均小于0.45,交叉驗(yàn)證相關(guān)系數(shù)RCV均在0.94以上,RMSECV在0.6左右,RPDCV均大于2.5,說明模型的精確度較好。在外部驗(yàn)證中,水分和蛋白質(zhì)的REV分別為0.977 9和0.984 1,而脂肪的REV為0.905 8,較其他2個(gè)成分略差,脂肪的RMSEP也偏高,但RPDEV均大于2.5,說明該模型可以進(jìn)行準(zhǔn)確預(yù)測(cè)。
表8 混合磷蝦粉建模集和驗(yàn)證集樣品成分含量Table 8 Modeling set and validation set composition content of mixed krill meal samples
如圖9、表9所示;磷蝦粉混合樣品構(gòu)建的模型與磷蝦粉原始樣品構(gòu)建的模型相比較,在三類相關(guān)系數(shù)方面并未體現(xiàn)出明顯優(yōu)勢(shì),但在脂肪的RMSECV以及蛋白質(zhì)和脂肪的RMSEP和RPDEV等參數(shù)方面有所提升,說明通過混合樣品數(shù)量的提升可以降低預(yù)測(cè)值的偏離程度,提升預(yù)測(cè)模型的準(zhǔn)確性。
圖9 混合樣品模型水分含量NIR主要參數(shù)Fig.9 NIR parameters of moisture content of the mixed sample model
表9 磷蝦粉混合樣品建模過程中的指標(biāo)描述Table 9 Description of indicators in the modeling process of mixed krill samples
本文采用最小偏二乘法建立并優(yōu)化了磷蝦粉中水分、脂肪和蛋白質(zhì)的近紅外定標(biāo)模型,確定了磷蝦粉近紅外圖譜最佳預(yù)處理方式為SNV+FD+NDF,經(jīng)預(yù)處理后,通過交互驗(yàn)證和外部驗(yàn)證,各組分的RC、RCV和REV三類相關(guān)系數(shù)除脂肪的REV為0.905 8,其余均在0.94以上,RPD均大于2.5,證明磷蝦粉近紅外定標(biāo)模型對(duì)3個(gè)成分均有較好的預(yù)測(cè)準(zhǔn)確性,可以快速準(zhǔn)確的進(jìn)行磷蝦粉中主要成分的定量。比較以原始磷蝦粉樣品構(gòu)建的近紅外定標(biāo)模型和以混合磷蝦粉樣品構(gòu)建的近紅外定標(biāo)模型,在相關(guān)系數(shù)方面并未體現(xiàn)出明顯優(yōu)勢(shì),但在RMSECV、RMSEP和RPDEV等參數(shù)方面有所提升,說明通過混合樣品數(shù)量的增加可以降低預(yù)測(cè)值的偏離程度,提升預(yù)測(cè)模型的準(zhǔn)確性。
本研究為磷蝦粉中水分、脂肪和蛋白質(zhì)含量近紅外模型的構(gòu)建以及快速檢測(cè)提供了理論依據(jù)和數(shù)據(jù)支持。為進(jìn)一步提升磷蝦粉近紅外定標(biāo)模型的預(yù)測(cè)精度,下一步應(yīng)繼續(xù)擴(kuò)大磷蝦粉樣品的采集范圍,增加代表性原始磷蝦粉樣品的數(shù)量,使其能夠滿足不同來源磷蝦粉樣品的成分預(yù)測(cè)。另外,可以通過特征波場(chǎng)選擇算法優(yōu)化定標(biāo)模型,使其預(yù)測(cè)精度進(jìn)一步提升。