李建蕊 李九生
(中國(guó)計(jì)量學(xué)院信息工程學(xué)院,杭州 310018)
利用近紅外光譜和偏最小二乘回歸法預(yù)測(cè)脂肪酸組成
李建蕊 李九生
(中國(guó)計(jì)量學(xué)院信息工程學(xué)院,杭州 310018)
采集了 30種植物油樣品在 10 000~55 00 cm-1范圍內(nèi)的近紅外透射光譜,將所有樣品作為校正集,隨機(jī)抽取 10種樣品作為預(yù)測(cè)集,以氣相色譜方法測(cè)得植物油中主要成分油酸、亞油酸、棕櫚酸、硬脂酸的含量為參考值,應(yīng)用偏最小二乘回歸法建立了基于近紅外光譜的測(cè)定植物油主要成分含量的校正模型。四種成分校正模型的交叉驗(yàn)證誤差均方根為 0.281 1%~1.496 4%,預(yù)測(cè)誤差均方根為 1.080 8%~18.063 0%,校正集的預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)系數(shù)均大于 0.99,預(yù)測(cè)集中除了棕櫚酸的預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)系數(shù)為0.817 9,其余均大于 0.9。
近紅外光譜 偏最小二乘回歸 植物油
近紅外光譜分析技術(shù)是一項(xiàng)高效、快速的分析技術(shù)[1],通過(guò)信息豐富的光譜,借助于化學(xué)計(jì)量學(xué)方法,可以直接分析不經(jīng)過(guò)任何預(yù)處理的樣品,具有儀器簡(jiǎn)單、分析速度快、無(wú)污染的優(yōu)點(diǎn)。近年來(lái)已有相關(guān)應(yīng)用報(bào)道,陸艷婷等[2]用近紅外光譜技術(shù)對(duì)粳稻品種的直鏈淀粉含量進(jìn)行了測(cè)量。魏良明等[3]采用近紅外光譜法測(cè)定了玉米完整籽粒蛋白質(zhì)和淀粉含量。David Pazdernik等[4]用近紅外技術(shù)分析了大豆中的氨基酸和脂肪酸的含量。張萍等[5]利用近紅外光譜技術(shù)對(duì)食品品質(zhì)進(jìn)行鑒別。雖然近紅外光譜分析技術(shù)已被廣泛應(yīng)用于農(nóng)業(yè)、食品、材料、醫(yī)藥等行業(yè)[6-9],但是利用該技術(shù)來(lái)分析植物油的脂肪酸卻鮮有報(bào)道。當(dāng)前市場(chǎng)上銷(xiāo)售的植物油質(zhì)量魚(yú)龍混雜,一些不法商人為了謀取利益,將收集來(lái)的潲水油經(jīng)過(guò)水油分離、過(guò)濾、去味等程序處理,再次拿到市場(chǎng)上銷(xiāo)售,嚴(yán)重的危害人們身體健康。目前植物油中脂肪酸的測(cè)定主要用氣相色譜法、薄層色譜法、高效液相色譜法等檢測(cè)方法[10]。雖然這些檢測(cè)技術(shù)精度較高,但是在樣品提純、萃取等預(yù)處理技術(shù)方面要求十分復(fù)雜,后期檢測(cè)條件要求苛刻,檢測(cè)周期較長(zhǎng)。
通過(guò)檢測(cè) 30種植物油的近紅外光譜,以氣相色譜測(cè)得到植物油的油酸、亞油酸、棕櫚酸、硬脂酸含量作為標(biāo)準(zhǔn)值,結(jié)合偏最小二乘回歸法進(jìn)行分析,旨在尋找一種快速有效無(wú)損鑒別植物油成分的方法。
試驗(yàn)用 30種植物油購(gòu)于超市,沒(méi)有進(jìn)一步提純等處理,將它們逐個(gè)編號(hào)。將所有的測(cè)試樣品作為校正集,隨機(jī)抽取 10個(gè)樣品作為預(yù)測(cè)集。
Nexus870型傅里葉近紅外光譜儀:美國(guó) Ther mo Nicolet公司;6890N型氣相色譜儀:美國(guó)Agilent公司。
圖1 樣品近紅外光譜圖
將植物油樣品分別放到光程為 1 mm的玻璃比色皿中,在溫度恒定無(wú)背景干擾條件下采集近紅外透射光譜,譜區(qū)采集范圍 10 000~5 500 cm-1,光譜分辨率 2 cm-1,每條曲線(xiàn)包括 2 250個(gè)波數(shù)點(diǎn),掃描20次平均。測(cè)得近紅外光譜如圖 1所示。在試驗(yàn)過(guò)程中,嚴(yán)格控制環(huán)境濕度,防止在光譜的采集過(guò)程中水分含量的變化影響測(cè)試結(jié)果。在一種樣品測(cè)試完后,用酒精擦洗干凈比色皿,以免比色皿壁上殘留樣品,影響下一種樣品的測(cè)量精度。通過(guò)近紅外光譜圖發(fā)現(xiàn)樣品的吸收峰很相近,說(shuō)明樣品的成分相近。
30種樣品的棕櫚酸、硬脂酸、油酸和亞油酸含量參考值由 6890N型氣相色譜測(cè)得。校正集中 30種樣品主要成分棕櫚酸、硬脂酸、油酸和亞油酸的最大質(zhì)量分?jǐn)?shù)分別為 15.27%、5.99%、80.78%和63.35%,其中具有最大含量的樣本數(shù)為 1種,占總樣本數(shù)的 3.3%。棕櫚酸、硬脂酸、油酸和亞油酸的最小質(zhì)量分?jǐn)?shù)分別為 2.53%、1.47%、22.32%和4.83%,同樣最小含量的樣本數(shù)也是 1種,占總樣本數(shù)的 3.3%。表 1列出了這四種主要成分實(shí)測(cè)值的變化范圍、平均值、標(biāo)準(zhǔn)偏差。
表1 樣品主要成分氣相色譜實(shí)測(cè)值統(tǒng)計(jì)
偏最小二乘回歸是近年來(lái)生產(chǎn)和發(fā)展的一種具有廣泛適用性的多元統(tǒng)計(jì)分析方法,能利用對(duì)系統(tǒng)中的數(shù)據(jù)信息進(jìn)行分解和篩選,提取對(duì)因變量解釋性最強(qiáng)的綜合變量,辨識(shí)系統(tǒng)中的信息和噪聲,實(shí)現(xiàn)多種數(shù)據(jù)分析方法的綜合應(yīng)用[11]?;驹頌?
式中:n為校正集樣品總數(shù);m為預(yù)測(cè)集樣品總數(shù);dim為實(shí)測(cè)值;dip為預(yù)測(cè)值。
試驗(yàn)測(cè)試的近紅外光譜每條曲線(xiàn)有 2 250個(gè)波數(shù)點(diǎn),各個(gè)波數(shù)點(diǎn)所包含的信息是不同的,為了以較少的波數(shù)點(diǎn)獲得較高的預(yù)測(cè)精度,把校正集光譜區(qū)劃分為5個(gè)等波數(shù)子區(qū)間,分別得到了5個(gè)子區(qū)間的回歸模型。不同分析對(duì)象區(qū)間的選擇應(yīng)該不同,對(duì)植物油的 4種主要成分分別進(jìn)行了校正集預(yù)測(cè),RM2 SECV越小、相關(guān)系數(shù) R越近 1,表明模型的預(yù)測(cè)結(jié)果越準(zhǔn)確,模型的可靠性越高。通過(guò)校正集預(yù)測(cè)分析比較發(fā)現(xiàn) 4種成分均在波段 10 000~9 100 cm-1的預(yù)測(cè)效果最好。表 2是 4種成分在 10 000~9 100 cm-1譜區(qū)的 RMSECV和校正相關(guān)系數(shù)。從表 2中可以看出在譜區(qū) 10 000~9 100 cm-14種成分的相關(guān)系數(shù)都比較大,均在 0.99以上。
表2 四種成分校正集最優(yōu)建模結(jié)果
表 3是植物油主要成分利用偏最小二乘回歸模型對(duì)校正集和預(yù)測(cè)集進(jìn)行預(yù)測(cè)的結(jié)果。
表 3 植物油主要成分校正集和預(yù)測(cè)集的預(yù)測(cè)結(jié)果
從表 3可知,可以看出校正集的相關(guān)系數(shù) R均接近 1,預(yù)測(cè)集除了棕櫚酸的相關(guān)系數(shù) R為 0.817 9外,其余均接近 1。校正集的 RMSECV在 0.281 1%~1.496 4%,校正相對(duì)偏差 RSECV在 0.255 3%~0.425 4%,說(shuō)明模型的精度較高;預(yù)測(cè)集的 RMSEP在 1.080 8%~18.063 0%之間,預(yù)測(cè)相對(duì)偏差 RSEP在 2.411 5%~3.626 8%之間,說(shuō)明模型對(duì)未知樣品的預(yù)測(cè)效果較高。
圖 2是植物油 4種主要成分校正集和預(yù)測(cè)集中預(yù)測(cè)值和氣相色譜實(shí)測(cè)值之間相關(guān)系數(shù)的散點(diǎn)圖。
從圖 2可以看出校正集的預(yù)測(cè)值和實(shí)測(cè)值之間的相關(guān)性顯著;預(yù)測(cè)集中的預(yù)測(cè)值和實(shí)測(cè)值之間的相關(guān)性較好,除個(gè)別點(diǎn)偏離很大外,其余預(yù)測(cè)效果較好,其中棕櫚酸在 15.27%點(diǎn)的誤差最大為1.8%,其他含量點(diǎn)的平均誤差為 0.5%;硬脂酸在 2.0%點(diǎn)的誤差最大為19%,其他含量點(diǎn)的平均誤差為11.2%;油酸在 22.3%點(diǎn)的誤差最大為 14.7%,其他含量點(diǎn)的平均誤差為7.7%;亞油酸在 7.20%點(diǎn)的誤差最大為16.1%,其他含量點(diǎn)的平均誤差為 2.1%。以上說(shuō)明偏最小二乘回歸對(duì)植物油有較好的建模效果,利用近紅外光譜分析植物油成分是可行的。
圖2 實(shí)測(cè)值與預(yù)測(cè)值
利用偏最小二乘回歸法建立了基于近紅外光譜測(cè)定植物油主要成分含量的校正模型,建模過(guò)程中截取了含有信息量大的光譜區(qū),以較少的波數(shù)得到較高的建模精度,對(duì)于原始近紅外光譜沒(méi)有進(jìn)行預(yù)處理,模型的預(yù)測(cè)結(jié)果較好,相關(guān)系數(shù)接近于 1,預(yù)測(cè)誤差均方根在 1.080 8%~18.063 0%之間。研究結(jié)果表明近紅外光譜提供了一種快速、無(wú)損、無(wú)污染、精確定量檢測(cè)植物油成分的方法。
[1]任秀珍,郭宏儒,賈玉山,等.近紅外光譜技術(shù)在飼草分析中的應(yīng)用現(xiàn)狀及展望 [J].光譜學(xué)與光譜分析,2009,29 (3):365-369
[2]陸艷婷,金慶生,葉勝海,等.應(yīng)用近紅外光譜技術(shù)快速測(cè)定粳稻品種的直鏈淀粉含量[J].中國(guó)糧油學(xué)報(bào),2007, 22(3):149-151
[3]魏良明,嚴(yán)衍祿,戴景瑞.近紅外反射光譜測(cè)定玉米完整籽粒蛋白質(zhì)和淀粉含量的研究[J].中國(guó)農(nóng)業(yè)科學(xué),2004, 37(5):630-633
[4]David L P,Arthur SK,JamesH.Analysisof amino and fatty acid composition in Soybean seed using near infrared reflec2 tance spectroscopy[J].Agron,1997,89:679~6851
[5]張萍,閆繼紅,朱志華,等.近紅外光譜技術(shù)在食品品質(zhì)鑒別中的應(yīng)用研究[J].現(xiàn)代科學(xué)儀器,2006,1:60-62
[6]郭旭生,尚占環(huán),方向文,等.近紅外光譜技術(shù)在反芻動(dòng)物營(yíng)養(yǎng)研究中的應(yīng)用現(xiàn)狀[J].光譜學(xué)與光譜分析,2009,29(3):641-645
[7]盧寶華,張俊,張義榮,等.玉米完整籽粒近紅外品質(zhì)分析模型的比較及改進(jìn)[J].中國(guó)糧油學(xué)報(bào),2005,20(4):44-49
[8]王學(xué)順,戚大偉,黃安民.木材近紅外光譜小波閾值去噪方法[J].東北林業(yè)大學(xué)學(xué)報(bào),2009,37(2):32-34
[9]周云,臧恒昌.近紅外分析技術(shù)在中藥鑒定及含量測(cè)定方面的研究進(jìn)展[J].食品與藥品,2009,11(1):72-74
[10]毛江勝,陳子雷,杜紅霞,等.毛細(xì)管氣相色譜法測(cè)定食用油中的酚類(lèi)抗氧化劑BHA、BHT、TBHQ[J].化學(xué)分析計(jì)量,2006,15(6):11-12
[11]王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國(guó)防工業(yè)出版社,1999.
Determination ofVegetable Oil Compositions byNear Infrared Spectroscopy and PartialLeast Squares Regression
Li Jianrui Li Jiusheng
(College of Information Engineering,China JiliangUniversity,Hangzhou 310018)
The near infrared trans mission spectrums of 30 kinds of vegetable oilwere measured in the frequency ranging from 10000cm-1 to 5500cm-1.All sampleswere used as a calibration set,and ten samples randomly se2 lected were as a prediction set.The measured contents of main components(i.e.palmitic acid,stearic acid,oleic acid and linolic acid)of the vegetable oils by gas chromatographic were employed as a reference volume.A calibra2 tion model based on near-infrared spectroscopy deter mination of the main component contentswas set-up by using the partial least-squares regression method.Results:The cross-validation rootmean square error of the four com2 ponents is 0.2811%~1.4964%,and the root-mean-square error is 1.0808%~18.0630%.The correlation co2 efficients of the predicted and measured values of the calibration set are over 0.99.The correlation coefficients of the predicted and measured values of the prediction set are over 0.9,except for pal mitic acid with 0.8179.
near-infrared spectroscopy,partial least squares regression,vegetable oil
TS225.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-0174(2010)06-0107-04
浙江省科技廳資助項(xiàng)目(2008C23018),中國(guó)博士后基金(20070420118)
2009-07-02
李建蕊,女,1984年出生,碩士,太赫茲技術(shù)
李九生,男,1976年出生,副教授,太赫茲技術(shù)