陳美林 杜芬妮 陳 業(yè) 程 超 單長(zhǎng)海 楊 迪 莫開(kāi)菊,3
(湖北民族大學(xué)生物科學(xué)與技術(shù)學(xué)院1,恩施 445000) (恩施土家族苗族自治州食品藥品檢驗(yàn)檢測(cè)中心2,恩施 445000) (生物資源保護(hù)與利用湖北省重點(diǎn)實(shí)驗(yàn)室3,恩施 445000)
1973年,世界衛(wèi)生組織專家委員會(huì)正式宣布,硒是人體生理必需的微量元素,1988年,中國(guó)營(yíng)養(yǎng)學(xué)會(huì)將硒列為15種微量元素之一[1]。硒在增強(qiáng)抗氧化、提高免疫力和預(yù)防癌癥等方面有重要功效[2,3]。全國(guó)有72%的地區(qū)處于缺硒、低硒帶,膳食中硒攝入量不足[4],需要通過(guò)富硒食品補(bǔ)充。土壤中的硒被植物吸收后通過(guò)代謝最終以無(wú)機(jī)硒和有機(jī)硒兩種形式存在,其中有機(jī)硒占總硒含量的80%以上,由大分子硒(硒蛋白、硒核酸和硒多糖等)和以硒代氨基酸及其衍生物形式存在的小分子硒化物(硒甲基硒代半胱氨酸、硒代高胱氨酸、硒代蛋氨酸和硒肽等)組成[5]。GB 5009.93—2017規(guī)定了食品中硒含量測(cè)定的方法[6],但是這些方法需要引入有毒的化學(xué)試劑,前處理繁瑣,分析設(shè)備昂貴,要求專業(yè)的操作人員才能獲得準(zhǔn)確的測(cè)定效果[7]。而紅外光譜技術(shù)能準(zhǔn)確快速靈敏的測(cè)定食品中的化學(xué)成分且無(wú)試劑參與,綠色而環(huán)保。
中紅外光譜是由化學(xué)成分中基團(tuán)的基頻振動(dòng)而產(chǎn)生的,具有高度特征性,可利用其化學(xué)鍵的特征吸收來(lái)鑒別化合物并定量測(cè)定[8]。中紅外光譜比較復(fù)雜,尤其是像食品這樣的多成分的復(fù)雜體系中的微量成分的定量分析,難以以某單一峰的強(qiáng)度作為定量分析的依據(jù)。因此采用衰減全反射中紅外光譜結(jié)合化學(xué)計(jì)量法測(cè)定米粉中極其微量的硒代胱氨酸的硒含量將是一項(xiàng)有益的探索。
東北大米、硒代胱氨酸(98%)、胱氨酸(98%)。
Nicolet iS5傅里葉變換中紅外光譜儀、iD7 Transmission衰減全反射附件。
1.2.1 材料制備
大米在粉碎機(jī)內(nèi)粉碎過(guò)140目篩,45 ℃烘?zhèn)溆谩?/p>
配制1 μg/mL(以硒計(jì))硒代胱氨酸溶液:稱硒代胱氨酸(98%)0.108 g(0.05 g)用去離子水定容至1 000 mL(50 μg/mL),取10mL定容至500 mL(1 μg/mL)備用。
將1 μg/mL的溶液用去離子水分別稀釋成1、0.98、0.96、0.94、0.92、0.90、0.88、0.86、0.84、0.82、0.80、0.78、0.76、0.74、0.72、0.70、0.68、0.66、0.64、0.62、0.60、0.58、0.56、0.54、0.52、0.50、0.48、0.46、0.44、0.42、0.40、0.38、0.36、0.34、0.32、0.30、0.28、0.26、0.24、0.22、0.20、0.18、0.16、0.14、0.12、0.10、0.05和0 μg/mL的溶液,各取10 mL分別與10 g米粉混勻配成硒濃度梯度分別為100、98、96、94、92、90、88、86、84、82、80、78、76、74、72、70、68、66、64、62、60、58、56、54、52、50、48、46、44、42、40、38、36、34、32、30、28、26、24、22、20、18、16、14、12、10、5、0 μg/100 g的樣品,烘箱里45 ℃烘6 h后研缽里研磨均勻。
1.2.2 樣品光譜采集
取適量樣品置于衰減全反射附件的晶體上,壓實(shí);光譜掃描范圍:4 000~400 cm-1;掃描次數(shù):32次;掃描間隔:2 cm-1;每個(gè)樣本分別采集3次。
1.2.3 數(shù)據(jù)分析
應(yīng)用TQ Analyst做數(shù)據(jù)處理、PLS建模和校驗(yàn)。
每種化合物都有特征的紅外光譜,因此可以進(jìn)行物質(zhì)的定性和定量分析。多組分樣品紅外光譜數(shù)據(jù)集相對(duì)較大,難以簡(jiǎn)單辨析物質(zhì)的特征吸收光譜。因此需要合理的選擇光譜區(qū)間進(jìn)行分析。選擇合適波段能減少計(jì)算量、提高精度[9]。
圖1為胱氨酸及硒代胱氨酸標(biāo)準(zhǔn)品的紅外圖譜。由于3 000.00~2 800.00 cm-1受羥基影響大,650 cm-1以后光譜又有較大的噪音,因此取1 600~650 cm-1為特征吸收光譜。由圖2能清楚看出硒代胱氨酸較胱氨酸特征波數(shù)往波數(shù)小的方向移動(dòng),波數(shù)越小波長(zhǎng)越長(zhǎng),即發(fā)生了紅移,分子折合質(zhì)量越小,振動(dòng)頻率(波數(shù))越大;鍵的力常數(shù)越大,振動(dòng)頻率越大[10]。這與硒取代了硫元素導(dǎo)致分子折合質(zhì)量增大、偶極矩減小導(dǎo)致振動(dòng)頻率變小的事實(shí)相符。
定量分析模型建立,打開(kāi)TQ Analyst軟件,建模窗口從左向右設(shè)置參數(shù):
在Description窗口下選擇定量模型的算法Partial least squares(PLS)(偏最小二乘法):在Pathlength窗口下選擇光程類型,Constant(恒定光程);在Components窗口下設(shè)置定量組分的信息如組分名稱、濃度范圍等;在Standards窗口下導(dǎo)入數(shù)據(jù)并選擇作為建模和驗(yàn)證的數(shù)據(jù);在Spectra窗口下設(shè)置數(shù)據(jù)格式,如Spectrum(原始光譜)、First derivative(一階導(dǎo)數(shù)光譜)、second derivative(二階導(dǎo)數(shù)光譜)等;在Regions窗口下選擇波數(shù)160 0~650 cm-1;在Other窗口下設(shè)置因子數(shù),選擇Optimize number of factors each time calibration is changed(每次校準(zhǔn)更改時(shí)優(yōu)化因子數(shù));其他設(shè)置為默認(rèn)。
C語(yǔ)言作為一門多數(shù)工科類學(xué)生必修的計(jì)算機(jī)語(yǔ)言類課程,被多數(shù)高校師生所推崇。通過(guò)學(xué)習(xí)C語(yǔ)言,可以掌握程序設(shè)計(jì)的基本知識(shí),了解一些通用的計(jì)算機(jī)算法,培養(yǎng)學(xué)生對(duì)計(jì)算機(jī)編程的興趣,養(yǎng)成良好的編程習(xí)慣,同時(shí)培養(yǎng)學(xué)生能夠使用計(jì)算機(jī)思維去思考和解決專業(yè)上所遇到的實(shí)際問(wèn)題。
圖1 胱氨酸及硒代胱氨酸標(biāo)準(zhǔn)品中紅外光譜
圖2 標(biāo)準(zhǔn)樣品中紅外光譜特征波數(shù)
建模窗口設(shè)置完后點(diǎn)擊工具欄上的Calibrate按鈕,計(jì)算校正模型,當(dāng)前窗口就會(huì)顯示模型決定系數(shù)、校正均方差、預(yù)測(cè)均方差、因子數(shù)和校正結(jié)果,點(diǎn)擊菜單欄上Diagnostics下的Cross-Validation對(duì)模型作內(nèi)部交叉驗(yàn)證,當(dāng)前窗口就會(huì)顯示決定系數(shù)、交叉驗(yàn)證均方差、因子數(shù)和校正結(jié)果。
2.2.1 留多模型建立
交叉驗(yàn)證(Cross-validation)主要用于PCR、PLS回歸建模中。在給定的建模樣本中,拿出大部分樣本進(jìn)行建模,留小部分樣本用于對(duì)建立的模型進(jìn)行預(yù)測(cè)檢驗(yàn)。留一交叉驗(yàn)證每次只留一個(gè)樣本作為驗(yàn)證數(shù)據(jù),這樣能保證每次計(jì)算有最大的訓(xùn)練集,被認(rèn)為是漸近無(wú)偏的估計(jì),當(dāng)樣本量較少時(shí)采用留一法,當(dāng)樣本量較大時(shí),留一法計(jì)算較繁瑣,耗時(shí),留多交叉驗(yàn)證則改進(jìn)了計(jì)算的復(fù)雜性,但通常會(huì)產(chǎn)生不可忽略的偏差[11];當(dāng)樣本量很大的時(shí)候留多驗(yàn)證可以減輕計(jì)算量,節(jié)約時(shí)間。
留多交叉驗(yàn)證每次從數(shù)據(jù)集中抽出多個(gè)樣本,用剩余的樣本建模并預(yù)測(cè)被抽出的多個(gè)樣本,該過(guò)程重復(fù)多次。若樣本數(shù)為n,抽出的驗(yàn)證數(shù)據(jù)為m,則需要進(jìn)行n/m次交叉驗(yàn)證并獲得n/m個(gè)模型。對(duì)于中度或較小的數(shù)據(jù)集(n<50),m的取值不應(yīng)過(guò)大,最好的留多交叉驗(yàn)證是m=n×30%[12]。
為了保證驗(yàn)證集分布較均勻,將全部樣本分為低中高濃度,分別用隨機(jī)數(shù)生成器產(chǎn)生1/3的樣本作為驗(yàn)證集,剩下2/3作為建模集,模型內(nèi)部采用留一交叉驗(yàn)證。表1是不同預(yù)處理后的PLS模型參數(shù)。
表1 模型參數(shù)
2.2.2 留多模型驗(yàn)證
表2 驗(yàn)證集的預(yù)測(cè)效果
結(jié)果顯示原始數(shù)據(jù)及經(jīng)過(guò)一導(dǎo)、二導(dǎo)處理的驗(yàn)證集決定系數(shù)都達(dá)到0.95以上,RPD都大于3,說(shuō)明模型都具有很好的預(yù)測(cè)性能;除驗(yàn)證集1外經(jīng)過(guò)一導(dǎo)、二導(dǎo)處理后預(yù)測(cè)值與真實(shí)值的決定系數(shù)都達(dá)到0.97以上,較原始數(shù)據(jù)增大,說(shuō)明其經(jīng)過(guò)一導(dǎo)、二導(dǎo)處理后預(yù)測(cè)值與真實(shí)值之間的整體方差較小,相對(duì)原始數(shù)據(jù)準(zhǔn)確性提高了,二導(dǎo)處理后模型的預(yù)測(cè)效果比一導(dǎo)略好二導(dǎo)模型驗(yàn)證數(shù)據(jù)的預(yù)測(cè)值與真實(shí)值的相對(duì)偏差在20%以內(nèi)的占87.50%以上;驗(yàn)證集1經(jīng)過(guò)導(dǎo)數(shù)處理后決定系數(shù)、RPD都不如原始數(shù)據(jù),可能由于模型1只提取出了5個(gè)因子,因此丟失了些信息導(dǎo)致預(yù)測(cè)偏差較大。
為了更清楚看其預(yù)測(cè)效果,驗(yàn)證集用經(jīng)二導(dǎo)處理模型計(jì)算的預(yù)測(cè)值與真值的比較如表3~表5。
由表3~表5可知,相對(duì)偏差大于20%集中分布在含量小于18μg/100 g的樣本中,少數(shù)分布在驗(yàn)證集1稍高濃度樣品中,這可能是因?yàn)槟P?的因子數(shù)較少導(dǎo)致預(yù)測(cè)誤差較大;含量在18μg/100 g以上的123個(gè)樣品中只有4個(gè)樣品相對(duì)偏差在20%以上,最高偏差為35.50%,也即相對(duì)偏差在20%以內(nèi)的占了96.75%,含量在50 μg/100 g(不含)以上的樣品中,有93.33%偏差在10%以內(nèi),只有6.67%偏差在10%以上,沒(méi)有偏差大于20%的樣品。以上數(shù)據(jù)說(shuō)明當(dāng)米粉中硒含量高時(shí),所建模型預(yù)測(cè)較準(zhǔn)確。表5中50 μg/100 g的樣品偏差在14.89%~23.23%之間,數(shù)據(jù)偏大,可能在測(cè)試過(guò)程中環(huán)境條件的偶然變化所致,對(duì)這種低概率的非系統(tǒng)偏差應(yīng)盡量避免,如減少人員進(jìn)出對(duì)環(huán)境的擾動(dòng)。
表3 驗(yàn)證集1
表4 驗(yàn)證集2
表5 驗(yàn)證集3
為了更直觀的比較預(yù)測(cè)效果,將二導(dǎo)預(yù)測(cè)值與其真實(shí)值進(jìn)行擬合作圖(圖3)。虛線是理想擬合線,表明預(yù)測(cè)值與真實(shí)值沒(méi)有偏差;實(shí)線為實(shí)際擬合線。
圖3 預(yù)測(cè)值與真值相關(guān)性比較
由圖3可知驗(yàn)證集1較驗(yàn)證集2和3分布分散,驗(yàn)證集3較驗(yàn)證集2斜率接近1,驗(yàn)證集3整體偏移實(shí)際較小。各模型決定系數(shù)到達(dá)到0.95以上,斜率也較接近1,說(shuō)明其方差較小且沒(méi)有整體偏移,預(yù)測(cè)效果較好。
校正樣本的代表性、數(shù)量和分布都會(huì)影響模型的準(zhǔn)確性[19]?;瘜W(xué)計(jì)量法分析模型是基于統(tǒng)計(jì)學(xué)原理建立,結(jié)果可靠性取決于基礎(chǔ)校正集樣品數(shù)據(jù)的代表性,校正樣品選擇很重要。一般而言樣品越多、分布越廣,分布越均勻,代表性越強(qiáng),模型越好。模型3矯正數(shù)據(jù)范圍大,驗(yàn)證集數(shù)據(jù)都包含在內(nèi),分布均勻,所以預(yù)測(cè)也較準(zhǔn)確,模型1和模型2驗(yàn)證集在低含量分布較多,矯正數(shù)據(jù)分布在相對(duì)高含量區(qū)域,會(huì)導(dǎo)致對(duì)低含量區(qū)域的預(yù)測(cè)偏差較大,驗(yàn)證集1和2的預(yù)測(cè)偏差確實(shí)偏大,特別是低含量的更明顯。
衰減全反射中紅外光譜結(jié)合偏最小二乘法能建立有效的大米硒代胱氨酸硒的定量分析模型。作為一種快速、準(zhǔn)確的定量檢測(cè)方法,選擇1 600~650 cm-1作為特征波段,經(jīng)導(dǎo)數(shù)處理后建模,預(yù)測(cè)值與真實(shí)值的線性擬合決定系數(shù)能達(dá)到0.95以上,預(yù)測(cè)與真實(shí)值的相對(duì)偏差在20%以內(nèi)的高達(dá)87.94%以上,而含量在18 μg/100 g以上的樣品相對(duì)偏差在20%以內(nèi)的高達(dá)96.75%。本文采用的是單點(diǎn)反射附件,經(jīng)過(guò)一次衰減全反射(單點(diǎn)反射),光透入樣品深度有限,樣品對(duì)光吸收也有限,所得光譜吸收帶弱、信噪比差,表現(xiàn)在低含量時(shí)信噪比差,預(yù)測(cè)不穩(wěn)定、偏差較大,而在高含量時(shí)預(yù)測(cè)更穩(wěn)定、準(zhǔn)確。為了進(jìn)一步提高18 μg以下低含量樣品測(cè)定的準(zhǔn)確性,今后將采用多點(diǎn)反射法以增加全反射次數(shù)使吸收譜帶增強(qiáng),提高測(cè)試過(guò)程中的信噪比。