張 毅、陳國慶*、朱 純、朱焯煒、徐瑞煜
1. 江南大學理學院、江蘇 無錫 214122 2. 江蘇省輕工光電工程技術研究中心、江蘇 無錫 214000
熒光光譜結合支持向量機測定食用色素純度
張 毅1,2、陳國慶1,2*、朱 純1,2、朱焯煒1,2、徐瑞煜1,2
1. 江南大學理學院、江蘇 無錫 214122 2. 江蘇省輕工光電工程技術研究中心、江蘇 無錫 214000
采用一種由原點矩法改造所得的特征壓縮算法對熒光光譜數(shù)據(jù)進行預處理、將處理后的數(shù)據(jù)與加權最小二乘支持向量機(WLS-SVM)算法結合、建立魯棒回歸模型、用以預測實際食用色素粉末的純度。以亮藍和胭脂紅這2種色素為例論述該方法對實際食用色素粉末純度的預測效果。首先、利用FLS920熒光光譜儀測量獲得兩種色素的標準樣本和實際樣本在最佳激發(fā)波長下的熒光發(fā)射光譜數(shù)據(jù)、利用由原點矩法改造所得的特征壓縮算法對獲取的熒光光譜數(shù)據(jù)進行壓縮和變換、一方面縮短了算法的運算時間、另一方面也提高了模型的預測精度。將預處理后的熒光光譜數(shù)據(jù)輸入加權最小二乘支持向量機中建立濃度預測模型、該模型對亮藍、胭脂紅實際樣本溶液給出的預測光譜與它們的實測光譜吻合程度好、半高峰寬區(qū)間內的平均決定系數(shù)分別為0.662和0.931。所有亮藍、胭脂紅溶液的預測濃度和標稱濃度之間具有良好的線性關系、相關系數(shù)分別為0.997和0.992。由此通過多項式擬合得到的亮藍、胭脂紅粉末的預測純度分別為61.0%和72.3%。
光譜學; 合成食用色素; 純度軟測量; 加權最小二乘支持向量機
食品安全問題逐漸成為全社會關注的焦點。目前我國食品中添加食用色素的行為非常普遍。食用色素又稱著色劑、是以調節(jié)食品色澤為主要目的的一類食品添加劑、一直被廣泛的應用于食品工業(yè)及醫(yī)藥和化妝品生產(chǎn)。食用色素分合成色素和天然色素兩種、其中、合成食用色素因色澤鮮艷、著色力強、價格低廉等特點而被廣泛使用[1]。但是許多合成食用色素有一定毒性、如胭脂紅、誘惑紅等色素超標攝入、會有致畸、致癌的可能性[2]。我國對合成食用色素使用有嚴格的用量和用法規(guī)定、但仍有不少商家為了贏利、不管消費者的健康、無視有關法規(guī)濫加濫用。即使某一種食品中色素含量是合格的、但若消費者在生活中大量食用多種含有同樣色素的食品、仍然有可能導致攝入的色素總量超標、給健康帶來危害。因此在對合成食用色素使用的監(jiān)管中、其含量的測定就顯得尤為重要。
目前檢測食用色素含量的方法主要有:高效液相色譜法[3-6]、毛細管電泳法[7]、示波極譜法[8]等、這些方法都有各自的優(yōu)勢、但也存在操作繁瑣、檢測耗時、檢測成本高、結果重現(xiàn)性差等缺點。因此、有必要尋找一種可靠、便捷的測定合成色素含量的方法、給食品行業(yè)中合成食用色素的監(jiān)管提供參考。
熒光光譜技術由于檢測成本低、靈敏度高、對樣本無損、得到廣大學者的認可[9-10]。又因為所有合成色素均為熒光物質、它們在短波長光激發(fā)下,均能產(chǎn)生強的或較強的熒光[11]、所以本文利用該技術對合成色素進行定量分析。但光譜儀獲取的熒光光譜數(shù)據(jù)的數(shù)據(jù)量往往較大、這不僅會增加回歸算法的運算時間而且會影響回歸算法的預測精度。因此本文利用由原點矩法改進所得的特征壓縮算法先對原始光譜數(shù)據(jù)進行降維處理。同時考慮到熒光光譜儀激發(fā)光光強存在正常的無序抖動現(xiàn)象、導致被測樣品的熒光強度不夠穩(wěn)定、可能會出現(xiàn)離群點。相關文獻[12-15]的研究結果表明離群點對預測模型的精度有很大影響、特別是小樣本建模問題、這種影響尤為突出。因此本文采用加權最小二乘支持向量機(weighted least squares support vector machine、WLS-SVM)[16]算法對降維后的數(shù)據(jù)進行回歸建模、該算法可以增強預測模型的魯棒性、其在熒光光譜檢測領域的應用鮮見報道。用上述方法對某糖果廠實際生產(chǎn)中使用的2種合成食用色素粉末的純度進行預測、取得了較為滿意的預測效果。
1.1 基于WLS-SVM的回歸算法[16]
WLS-SVM是由LS-SVM發(fā)展而來的。對于一個訓練數(shù)據(jù)集{(x1,y1),(x2,y2),…,(xN,yN)}、其中xi∈Rn,yi∈R、基于LS-SVM的回歸算法[17-19]主要是通過非線性變換將訓練樣本集映射到高維特征空間、然后在高維空間進行線性回歸、最后映射回原空間完成輸入空間的回歸估計、其線性回歸函數(shù)可表示為
g(x)=wTφ(x)+b
(1)
式中φ(x)為核空間映射函數(shù)、w為權向量、b為偏差。
在基于LS-SVM的回歸算法中,將回歸問題轉化為二次優(yōu)化問題
使得
yi=wTφ(xi)+b+ei,i=1,2,…,N
(2)
式中J(w,e)為目標函數(shù)、γ為懲罰系數(shù)、其值的大小決定了對誤差的懲罰力度、ei為松弛變量。應用Lagrange法可以將式(2)的二次優(yōu)化問題化簡為求解線性方程組問題、最終可得基于LS-SVM的回歸函數(shù)為
(3)
其中α=[α1; …;αN]為Lagrange乘子向量、k(·,·)為滿足Mercer條件的核函數(shù)。
但對于樣本中離群點、基于LS-SVM的回歸算法所采用的誤差平方和評價函數(shù)會導致不穩(wěn)健的預測結果。針對此問題、在基于LS-SVM的回歸算法的基礎上、用權值因子vi對每個樣本的松弛變量ei進行加權就能得到穩(wěn)健的預測結果、這就是基于WLS-SVM的回歸算法。加權處理后、優(yōu)化問題變?yōu)?/p>
使得
(4)
(5)
表1 WLS-SVM算法中常用的權值因子函數(shù)
1.2 a/b-熒光期望法
本文對原點矩法(屬于三維熒光光譜特征參量法[21])進行改造得到了一種新的特征壓縮方法、將其命名為:a/b-熒光期望法。該方法對某一樣本數(shù)為N的樣本集的二維熒光光譜數(shù)據(jù)集(本文所用的二維熒光光譜數(shù)據(jù)為最佳激發(fā)波長下的發(fā)射光譜)作如下處理:
(2)挑選出第i個樣本的發(fā)射光譜中熒光強度大于等于a/b峰高(a/b為0~1之間的分數(shù))的所有數(shù)據(jù)點(每個數(shù)據(jù)點都含有發(fā)射波長em和該發(fā)射波長下的熒光強度Intensity(em)這兩個信息)、構成數(shù)集Di,a/b; 將區(qū)間[Di,a/b中最小的em、Di,a/b中最大的em]稱為第i個樣本的a/b-標尺、記作Ri,a/b、i=1,2,…,N。
(2)選取N個樣本的a/b-標尺的交集作為整個樣本集的a/b-標尺、記作Ra/b。
1.3 決定系數(shù)
在回歸分析中、決定系數(shù)是判斷模型擬合效果的重要指標。其計算公式為
(6)
2.1 儀器與試樣
實驗儀器為英國EdinburghFLS920熒光光譜儀、梅特勒AB-135S電子天平、Thermo移液槍。
試樣為符合國家計量標準的亮藍溶液標準物質(GBW(E)100162)、胭脂紅溶液標準物質(GBW(E)100161)(濃度均為1mg·mL-1); 某糖果廠實際生產(chǎn)中使用的合成食用色素粉末:亮藍、胭脂紅。
2.2 方法
以超純水作為溶劑將亮藍標準溶液和胭脂紅標準溶液按表2所示的濃度各配制出31個樣本、分別記作亮藍標準樣本集和胭脂紅標準樣本集。
表2 標準樣本的濃度
假設合成食用色素粉末的純度為100%、用電子天平分別稱取2種色素粉末適量、記錄下數(shù)值。用超純水配制出標稱濃度為100 μg·mL-1的亮藍實際溶液和胭脂紅實際溶液、將它們按表3所示的標稱濃度各配制出10個樣本、分別記作亮藍實際樣本集和胭脂紅實際樣本集。
表3 實際樣本的濃度
從4個樣本集中各取一個樣本、分別測量它們的三維熒光光譜、2種色素標準樣本的熒光光譜特征參數(shù)見表4。為了提高光譜數(shù)據(jù)采集和光譜數(shù)據(jù)分析處理的效率、按照表5所示的熒光光譜儀測量參數(shù)對2種色素標準樣本和實際樣本進行二維熒光光譜的測量、每個樣本測量三次取平均值、4個樣本集的二維熒光光譜如圖1所示。
表4 熒光光譜的特征參數(shù)
表5 熒光光譜儀測量參數(shù)
2.3 基于WLS-SVM算法對合成食用色素純度的預測
2.3.1 訓練樣本集的選取
為了訓練用于預測各實際樣本濃度的回歸模型、將標準樣本集作為訓練樣本集。并構造數(shù)據(jù)集{(x1,y1),(x2,y2),…,(x31,y31)}、其中xi為標準樣本集中第i樣本的二維熒光光譜數(shù)據(jù)、yi為第i標準樣本的濃度。
2.3.2 訓練樣本集數(shù)據(jù)的預處理
圖1 四個樣本集的二維熒光光譜圖
2.3.3 基于WLS-SVM的魯棒回歸模型的建立
文中基于WLS-SVM的回歸模型采用的核函數(shù)是徑向基(RBF)核函數(shù); 權值函數(shù)選用Hampel、該權值函數(shù)的參數(shù)設置如下:c1=2.5和c2=3; 采用k-fold交叉驗證法確定模型系數(shù)、k設為3。同時將訓練數(shù)據(jù)集輸入回歸模型對其進行訓練、多次迭代后得到魯棒回歸模型。
2.3.4 對合成食用色素粉末純度的預測
沿用亮藍(胭脂紅)標準樣本集的3/4-標尺計算出10個亮藍(胭脂紅)實際樣本的3/4-熒光期望、構成預測數(shù)據(jù)集輸入魯棒回歸模型、對10個亮藍(胭脂紅)實際樣本溶液的濃度預測結果如表6所示。
表6 實際樣本的預測濃度
圖2 使用本文方法的預測效果(亮藍實際樣本)
圖3 使用本文方法的預測效果(脂胭紅實際樣本)
將濃度與實際樣本預測濃度相同的標準樣本的二維熒光光譜稱為該實際樣本的預測光譜。由于預測濃度與標準樣本集中31個濃度接近的實際樣本個數(shù)有限、只能從亮藍(胭脂紅)實際樣本集中選擇個別樣本、比較它們的實測光譜和預測光譜、兩種光譜的比較效果如圖2(圖3)所示。
由上述預測效果圖可知、實測譜線和預測譜線吻合程度較好。引入曲線吻合程度的評價參數(shù)對譜線在3/4-標尺和1/2-標尺(即半高峰寬區(qū)間)上的吻合程度進行評價、在3/4-標尺上的評價參數(shù)表征了峰值點附近譜線的吻合程度、可以反映局部細節(jié)的預測效果; 在1/2-標尺上的評價參數(shù)表征了峰腰以上譜線的吻合程度、可以反映宏觀整體的預測效果。必須同時考察這兩個標尺上的評價參數(shù)才能客觀、真實地反映譜線的吻合程度。評價結果見表7。表中亮藍(胭脂紅)實際樣本在3/4-標尺、1/2-標尺上的平均決定系數(shù)分別為:0.530、0.662(0.948、0.931)、而且由表7中的平均相對誤差穩(wěn)定、由此說明由本文的方法給出的預測光譜和實測光譜吻合程度較好、即所建的魯棒回歸模型的預測結果可靠。
表7 實際光譜和預測光譜在3/4-標尺和1/2-標尺上的吻合程度的評價結果
對所有的亮藍(胭脂紅)實際樣本溶液的預測濃度和標稱濃度進行一次多項式擬合。選用的擬合函數(shù)為:F(x)=p1x+p2、由于當假定濃度為0時、真實濃度必為0、所以該真實濃度和標稱濃度之間的函數(shù)關系必經(jīng)過原點、所以在擬合時將p2設為0。擬合結果為亮藍:F(x)=p1x+p2、p1=0.610 1、p2=0、p1的95%置信區(qū)間(0.595 4,0.624 8); 胭脂紅:F(x)=p1x+p2、p1=0.722 5、p2=0、p1的95%置信區(qū)間(0.695 5,0.749 5)。圖4為擬合效果、擬合優(yōu)度見表8。
圖4 擬合結果
由表8可知、亮藍、胭脂紅實際樣本溶液的預測濃度和標稱濃度的相關系數(shù)分別為0.997和0.992、說明兩種色素的預測濃度和標稱濃度之間具有良好的線性關系、由此說明本文的方法可以有效的預測合成食用色素粉末的純度。用該方法對亮藍、胭脂紅合成食用色素粉末的預測純度分別為:61.0%和72.3%。
表8 擬合優(yōu)度
為了減小樣本采集過程中可能引入的離群點對回歸模型預測精度的影響、本文采用了WLS-SVM算法來構建回歸模型。為了進一步的提高回歸模型的預測精度和處理數(shù)據(jù)的效率、本文采用了一種由原點矩法改造所得的特征壓縮方法—a/b-熒光期望法。利用熒光光譜數(shù)據(jù)結合a/b-熒光期望法、WLS-SVM算法所建的魯棒回歸模型對亮藍、胭脂紅實際樣本溶液的濃度預測準確、預測譜線和實測譜線的吻合程度好、半高峰寬區(qū)間內的平均決定系數(shù)分別為0.662和0.931。而且所有的亮藍、胭脂紅實際樣本的預測濃度和標稱濃度之間具有良好的線性擬關系、相關系數(shù)分別為0.997、0.992。由此說明該方法可對某糖果廠實際生產(chǎn)中所使用的亮藍、胭脂紅合成食用色素粉末的純度給出可靠的預測、預測純度分別為61.0%和72.3%。該方法操作簡單、成本低、測量周期短、測量結果可靠。可將該方法應用于對食品中合成食用色素的含量測定、為食品行業(yè)中合成食用色素的監(jiān)管提供參考。
[1] CHEN Guo-qing(陳國慶). Jiangnan University Doctoral Dissertation(江南大學博士論文),2010:23.
[2] LI Run,CHEN Guo-qing,et al(李 潤、陳國慶、等). Spectroscopy and Spectral Analysis(光譜學與光譜分析),2014、34(1):111.
[3] Li W J,Zhou X,Tong S S,et al. Talanta,2013、(105):386.
[4] NING Shang-yong、GAO-Jie,et al(寧尚勇,高 潔、等). Chinese Journal of Analysis Laboratory(分析試驗室),2008、(4):72.
[5] ZHANG Yu-lin,MA Jing-yuan,et al(張予林,馬靜遠、等). Journal of Northwest A & F University·Natural Science Edition(西北農林科技大學學報·自然科學版),2011、(1):186.
[6] ZHANG Wan,WANG Tan,et al(張 婉,王 覃、等). Food Science(食品科學),2011、(4):177.
[7] Del Giovine L,Bocca A P. Food Control,2003、14(3):131.
[8] WANG Yu-tian,XU Jing,et al(王玉田,徐 婧、等). Chinese Journal of Lasers(中國激光),2014、41(12): 1215002.
[9] LIU Jing,LIU Wen-qing,et al(劉 晶,劉文清、等). Acta Optica Sinica(光學學報),2013、33(9): 0930001.
[10] SONG Xin,JI Shuang-li,et al(宋 新,紀雙利,等). Chinese Journal of Food Hygiene(中國食品衛(wèi)生雜志),2009、(5):422.
[11] CHEN Guo-qing(陳國慶). Jiangnan University Doctoral Dissertation(江南大學博士論文),2010: 32.
[12] Pell R J. Chemometrics and Intelligent Laboratory Systems,2000、(52):87.
[13] Daszykowski M,Kaczmarek K,Vander Heyden Y,et al. Chemometrics and Intelligent Laboratory Systems,2007、85(2):203.
[14] Mφller S F,von Frese J,Bro R. Journal of Chemometrics,2005、19(10):549.
[15] Kruger U,Zhou Y,Wang X,et al. Journal of Chemometrics,2008、22(1):1.
[16] Suykens J A K,Van Gestel T,De Brabanter J,et al. Least Squares Support Vector Machines. Singapore:World Scientific,2002. 149.
[17] Suykens J A K,De Brabanter J,Lukas L,et al. Neurocomputing,2002、48(1):85.
[18] Suykens J A K,Vandewalle J. Neural Processing Letters,1999、9(3):293.
[19] Shim J,Hwang C,Nau S. Advances in Natural Computation,2006. 157.
[20] De Brabanter K,Karsmakers P,Ojeda F,et al. LS-SVMlab Toolbox User’s Guide. ESAT-SISTA Technical Report 10-146,2010: 33.
[21] SHANG Li-ping,YANG Ren-jie(尚麗平,楊仁杰). Site Fluorescence Spectrum Technology and Application(現(xiàn)場熒光光譜技術及其應用). Beijing:Science Press(北京:科學出版社),2009、1(5):217.
*Corresponding author
Soft Measurement of the Purity of the Synthetic Edible Pigment Powder Using Fluorescence Spectroscopy Combined with SVM
ZHANG Yi1,2、CHEN Guo-qing1,2*,ZHU Chun1,2、ZHU Zhuo-wei1,2、XU Rui-yu1,2
1. School of Science、Jiangnan University、Wuxi 214122、China 2. Jiangsu Provincial Research Center of Light Industrial Optoelectronic Engineering and Technology、Wuxi 214000、China
The feature compression algorithm which was reformed from the original Moment method was used for the pre-processing of the fluorescence spectral data,then combined the data and the Weighted Least Squares Support Vector Machine(WLS-SVM) algorithm to establish a robust regression model,which is used for forecasting the purity of edible pigment powder. In this paper,brilliant blue and ponceau 4R served as an example to discuss the method of forecasting effect of edible pigment powder purity. The emission fluorescence spectra of two edible pigment at the optimal excitation wavelength were measured by FLS920 fluorescence spectrometer. The compression and transformation of the fluorescence spectral data was acquired by the feature compression algorithm reformed from the Original Moment method. On the one hand the feature compression algorithm shortened the operation time,on the other hand it improved the prediction accuracy of the model. Then,the concentration prediction model was established after inputting the fluorescence spectral data pre-processed into the Weighted Least Squares Support Vector Machine. The model gave anastomotic predicted spectral data with the actual experiments of the brilliant blue and ponceau 4R,and the average coefficient of determination in the half peak width was 0.700 and 0.930 respectively. There was a good linear relationship between the predicted and the nominal concentration of the brilliant blue and ponceau 4R,and the correlation coefficients were 0.997 and 0.992 respectively. It can be concluded that,the predicted concentration of the brilliant blue and ponceau 4R powder were got the results of 61.0% and 72.3% respectively.
Spectroscopy; Synthetic edible pigment; Soft measurement of purity; Weighted least squares support vector machine
Sep. 3,2015; accepted Jan. 25,2016)
2015-09-03、
2016-01-25
國家自然科學基金項目(61178032、61378037)、中央高校基本科研業(yè)務費專項資金項目(JUSRP51517)資助
張 毅、1990年生、江南大學理學院碩士研究生 e-mail:zy137927643@126.com *通訊聯(lián)系人 e-mail:cgq2098@163.com
O436
A
10.3964/j.issn.1000-0593(2016)12-3978-08