周華茂 陳添兵 劉木華 徐將 何秀文 許方豪 姚明印
摘 要 為了對稻殼中重金屬鉻(Cr)含量進(jìn)行快速測定,利用激光誘導(dǎo)擊穿光譜技術(shù)(LIBS)獲取了江西省鄱陽湖周邊24組水田污染區(qū)稻殼中Cr元素的等離子體信號(hào)光譜數(shù)據(jù)。通過在422.04~445.94 nm波段范圍內(nèi)構(gòu)建光譜九點(diǎn)平滑和歸一化數(shù)據(jù)預(yù)處理,選擇18組數(shù)據(jù)作為訓(xùn)練樣本,另外6組作為測試樣本,提出了基于粒子群算法(PSO)的支持向量機(jī)(SVM)參數(shù)調(diào)節(jié)優(yōu)化方法。建立了PSO-SVM智能算法對Cr含量的LIBS定量分析模型,得到測試集均方根誤差(RMSE)為7.83 μg/g,平均絕對誤差百分比(MAPE)為4.10%,預(yù)測值與測定值之間的相關(guān)系數(shù)為0.9948。在同等條件下,采用聯(lián)合區(qū)間偏最小二乘法(siPLS)預(yù)測6組樣本濃度,其RMSE為22.58 μg/g,MAPE為6.17%,相關(guān)系數(shù)為0.9840。結(jié)果表明,PSO-SVM回歸定量方法可用于LIBS農(nóng)產(chǎn)品的成分分析,其分析效果優(yōu)于siPLS。
關(guān)鍵詞 激光誘導(dǎo)擊穿光譜;粒子群算法-支持向量機(jī);鉻;稻殼
1 引 言
稻米在糧食中占有重要地位,但由于環(huán)境污染,稻谷重金屬超標(biāo)問題時(shí)有發(fā)生[1,2],進(jìn)而危害人體健康。稻殼是稻米加工過程中數(shù)量最大的副產(chǎn)品,可作為家禽飼料、化工原料[3]等,用途廣泛。此外,稻殼中含有較多SiO2,且以網(wǎng)絡(luò)狀態(tài)處于纖維素、木質(zhì)素之中,機(jī)械強(qiáng)度較好,通過熱解碳化及化學(xué)改性,使稻殼表面形成多孔狀,具有較好的吸附能力[4]。 有研究表明,稻殼中重金屬含量高于大米[5],因此,對稻殼中金屬元素、農(nóng)藥殘留等污染物進(jìn)行綠色、快速檢測具有重要意義。
激光誘導(dǎo)擊穿光譜(LIBS)是一種快速檢測物質(zhì)成分的技術(shù),通過探測激光誘導(dǎo)等離子體信號(hào)光譜分析線的位置及信號(hào)強(qiáng)度,獲取物質(zhì)成分和濃度信息。由于LIBS具有快速、簡便、多元素同時(shí)分析等優(yōu)點(diǎn),已被廣泛用于食品安全[6,7]、工業(yè)生產(chǎn)[8,9]、生物醫(yī)學(xué)[10,11]等領(lǐng)域,但由于單變量分析方法無法消除樣品的基體效應(yīng)等因素的影響,不利于分析結(jié)果準(zhǔn)確性?;诖耍S多研究者利用偏最小二乘法(PLS)、人工網(wǎng)絡(luò)(ANN)、多元線性回歸(MLR)和支持向量機(jī)回歸(SVM)等多種多變量分析方法,提高LIBS分析的靈敏度和準(zhǔn)確度。
PLS算法主要針對多因變量和多自變量的數(shù)據(jù)關(guān)系進(jìn)行回歸建模,可以解決大量樣本數(shù)據(jù)。同時(shí),PLS還結(jié)合了主成分分析(PCA)優(yōu)點(diǎn),可以剔除變異數(shù)據(jù),盡可能提取最大的有效信息[12,13]。ANN算法也是一種處理非線性數(shù)據(jù)的重要手段,其優(yōu)點(diǎn)在于可以模擬測定數(shù)據(jù)進(jìn)行預(yù)測,尤其是在不能用規(guī)則或公式描述的大量原始數(shù)據(jù)處理過程中,能依據(jù)環(huán)境變化不斷對權(quán)值進(jìn)行調(diào)整而學(xué)習(xí)實(shí)現(xiàn)算法,表現(xiàn)出極大的靈活性和自適應(yīng)性。Li等[14]提出了一種基于ANN的多譜線校正方法,以提高LIBS分析鋼的精度。El Haddad等[15]利用人工神經(jīng)網(wǎng)絡(luò)對土壤樣品現(xiàn)場LIBS分析數(shù)據(jù)進(jìn)行定量分析,其現(xiàn)場預(yù)測分析結(jié)果效果較好。MLR算法可將多個(gè)線性的物質(zhì)之間的變量和自變量之間建立相關(guān)度高的線性回歸方程,對物質(zhì)成分進(jìn)行定量分析時(shí),需要人工參與,手動(dòng)查找譜峰位置等準(zhǔn)備過程,但是,當(dāng)樣品條件和激光能量變化時(shí),與實(shí)際物理含義無關(guān)的MLR方法對目標(biāo)的成分預(yù)測值可能會(huì)與實(shí)際值有較大的誤差。沙文等[16]將LIBS技術(shù)和MLR結(jié)合,用于復(fù)混肥中磷元素濃度測定,發(fā)現(xiàn)四元線性回歸法可提高LIBS測量準(zhǔn)確性。SVM是繼神經(jīng)網(wǎng)絡(luò)之后出現(xiàn)的一種比較高效優(yōu)越的算法,該算法能避免經(jīng)驗(yàn)非線性方式的過擬合、局部最優(yōu)等問題,泛化能力強(qiáng),已被廣泛應(yīng)用于各種預(yù)測領(lǐng)域[17,18]。
以上多變量方法一定程度上解決了LIBS分析中基體效應(yīng)及自吸收效應(yīng)問題,提高了定量分析結(jié)果的準(zhǔn)確度,有力推動(dòng)了LIBS的快速發(fā)展。但是,每種分析方法都有其優(yōu)勢和局限性,如SVM算法參數(shù)的選取會(huì)直接影響模型的預(yù)測準(zhǔn)確度,采取試湊法或遍歷優(yōu)化進(jìn)行參數(shù)選擇比較費(fèi)時(shí),且找到的未必是全局最優(yōu)解。本研究針對SVM參數(shù)的選取具有一定的“盲目性”的問題,以稻殼中的Cr元素為研究對象,提出利用粒子群優(yōu)化(PSO)算法優(yōu)化其模型參數(shù),采用PSO對SVM的懲罰因子c和核函數(shù)g的參數(shù)進(jìn)行優(yōu)化,建立基于粒子群算法的支持向量機(jī)(PSO-SVM)回歸預(yù)測模型,測定稻殼中Cr濃度,并將測定結(jié)果與聯(lián)合區(qū)間偏最小二乘法(siPLS)的測定結(jié)果進(jìn)行比較。
2 定量分析模型與原理
2.1 支持向量機(jī)回歸模型
SVM是一種以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),建立在VC維(Vapnik-Chervonenkis)、結(jié)構(gòu)風(fēng)險(xiǎn)最小和核函數(shù)原理基礎(chǔ)上的新型機(jī)器學(xué)習(xí)方法。SVM算法適用于小樣本,已廣泛用于解決各種分類和回歸預(yù)測問題[19,20]。SVM的算法原理及具體建模過程參見文獻(xiàn)[21],由于建模時(shí)參數(shù)c與g的選擇決定SVM回歸的準(zhǔn)確度與預(yù)測的精度,c是影響回歸模型對回歸誤差大于樣本的重視水平,g的大小關(guān)系著回歸模型的精度。因此,為了提高SVM的學(xué)習(xí)和泛化能力,需要對c和g兩個(gè)參數(shù)進(jìn)行優(yōu)化,可以得到最佳的預(yù)測模型。
2.2 粒子群優(yōu)化算法
PSO是一種基于迭代模式的優(yōu)化算法,源于對鳥群捕食行為的模擬,其基本思想是通過對群體中粒子之間的信息傳遞及共享達(dá)到尋優(yōu)目的。在PSO中,每個(gè)優(yōu)化問題的潛在解稱為“粒子”,每個(gè)粒子都有自己的位置和速度,以及一個(gè)被優(yōu)化的函數(shù)決定的適應(yīng)值。PSO初始化時(shí)為一群隨機(jī)粒子,每個(gè)粒子都需要在歷次迭代過程中基于目標(biāo)函數(shù)決定自適應(yīng)值的取值,根據(jù)自適應(yīng)值確定當(dāng)前粒子的最優(yōu)解pbest(個(gè)體極值)和群體最優(yōu)解gbest(全局極值)[22]。設(shè)在一個(gè)D維搜索空間中,微粒數(shù)M,第i個(gè)粒子的位置為xi=(xi1,xi2,…,xiM),速度為vi=(vi1,vi2,…,viM),
在獲得兩個(gè)極值后,粒子根據(jù)式(1)和式(2)更新自己的位置和速度。
式中,ω為慣性權(quán)重因子;c1和c2為加速因子,通常取值為(0,2)之間;r1和 r2為隨機(jī)參數(shù),取值為(0,1)之間。當(dāng)?shù)螖?shù)達(dá)到設(shè)定值或搜索到的最佳位置,滿足設(shè)定的最小自適應(yīng)值時(shí),尋優(yōu)結(jié)束。采用PSO算法對SVM參數(shù)進(jìn)行優(yōu)化的過程如圖1所示。
3 實(shí)驗(yàn)部分
3.1 實(shí)驗(yàn)裝置
LIBS實(shí)驗(yàn)裝置示意圖如圖2所示,系統(tǒng)采用Nd:YAG激光器作為激光光源(工作波長為1064 nm,單脈沖最大能量為300 mJ,脈沖寬度為8 ns,頻率為2 Hz),激光束經(jīng)反射鏡垂直后穿過穿孔反射鏡經(jīng)焦距為100 mm的聚焦透鏡聚焦在待測樣品表面。樣品表面產(chǎn)生的激光等離子體光譜信號(hào)經(jīng)過穿孔反射鏡(表面鍍紫外加強(qiáng)鋁膜,(LIBS)反射率>80%)反射到焦距為100 mm的石英聚焦透鏡耦合至光纖,并傳輸至八通道光譜儀(探測波長為200~1050 nm,分辨率0. 08~0.13 nm)完成光譜的分光與探測。DG645型數(shù)字式延遲脈沖發(fā)生器為激光器和光譜儀提供精準(zhǔn)外觸發(fā)信號(hào),控制光譜采集的延遲時(shí)間。同時(shí),為了保證測量的均勻性和穩(wěn)定性,將樣品置于二維自動(dòng)旋轉(zhuǎn)工作臺(tái)上,勻速運(yùn)動(dòng)實(shí)現(xiàn)無重復(fù)采樣打點(diǎn)。
3.2 實(shí)驗(yàn)樣品采集和處理
根據(jù)實(shí)地考察及調(diào)研,在江西省鄱陽湖湖邊采集了24個(gè)不同區(qū)域的水田污染區(qū)稻谷測試樣品。稻谷自然風(fēng)干后,將其谷殼分離,并采用粉碎機(jī)對稻殼進(jìn)行粉碎,再用手動(dòng)壓片機(jī)對樣品進(jìn)行壓片制樣(壓力為30 MPa),每個(gè)樣品制成直徑為30 mm,厚度約為3 mm的圓餅塊狀型。待 LIBS光譜采集實(shí)驗(yàn)后,采用原子吸收光譜法(AAS)對每個(gè)樣品進(jìn)行測定濃度的檢測,每個(gè)樣品中Cr元素的含量如表1所示,為考慮訓(xùn)練集與測試集濃度大小分布合理,24個(gè)樣品按濃度大小排列,然后按步長為4抽取數(shù)據(jù),分成4等份,并以其第1、2、4等份數(shù)據(jù)為訓(xùn)練集,第3等份數(shù)據(jù)為測試集。
3.3 LIBS光譜采集
為增強(qiáng)等離子體光譜信號(hào)強(qiáng)度,本研究采用雙脈沖激光器對樣品進(jìn)行LIBS實(shí)驗(yàn),兩路激光能量分別為175和235 mJ,兩路光束之間的延遲時(shí)間為60 ns,光譜最佳采集的延遲時(shí)間為1.58 μs。
每個(gè)樣品進(jìn)行3次重復(fù)實(shí)驗(yàn),每次重復(fù)實(shí)驗(yàn)采集50幅光譜,每幅光譜由2個(gè)脈沖累加組成。圖3 顯示了24個(gè)稻殼樣品在422.04~445.94 nm波段內(nèi)的特征峰光譜,Cr元素的Cr I 425.43 nm、Cr I 427.48 nm、Cr I 428.97 nm三重線譜線清晰。同時(shí),由于儀器自身特點(diǎn)和測量過程中溫濕度等因素引起的干擾,譜線的特征峰會(huì)出現(xiàn)不同程度的變化,因此,為了降低儀器設(shè)備和實(shí)驗(yàn)環(huán)境帶來的干擾,選擇包含Cr元素三重線在內(nèi)的波段422.04~445.94 nm特征峰光譜的積分強(qiáng)度為多元回歸的輸入。
4 結(jié)果與討論
4.1 回歸訓(xùn)練
利用Matlab2018軟件對24個(gè)稻殼樣品在42204~445.94 nm波段內(nèi)的469組光譜數(shù)據(jù)進(jìn)行九點(diǎn)平滑法和歸一化法數(shù)據(jù)預(yù)處理。采用圖1中的PSO算法流程對SVM參數(shù)進(jìn)行優(yōu)化,并利用基于臺(tái)灣大學(xué)林智仁等開發(fā)設(shè)計(jì)的Libsvm 3.22 軟件包對稻殼中的Cr元素進(jìn)行PSO-SVM回歸訓(xùn)練。
先對PSO的參數(shù)進(jìn)行初始化設(shè)置,設(shè)粒子維度為2,每一維粒子群中粒子數(shù)目為20,粒子群最大優(yōu)化代數(shù)為200,加速因子c1=1.5和c2=1.7,慣性權(quán)重因子ω=1,懲罰參數(shù)c的搜索范圍為(0.1,1000),核參數(shù)g的搜索范圍為(0.01,1000)。PSO訓(xùn)練過程的適應(yīng)度變化曲線如圖4所示,輸出的最佳參數(shù)值為Best c=2.4265,Best g=0.0100。將優(yōu)化得到的參數(shù)代入PSO-SVM回歸模型,得到稻殼中Cr元素的訓(xùn)練集和測試集的預(yù)測結(jié)果(圖5),均與測定值基本吻合,相關(guān)系數(shù)分別為0.9999和0.9948。
利用siPLS算法對稻殼中Cr元素的含量進(jìn)行定量分析,同樣選取波段422.04~445.94 nm內(nèi)特征峰光譜的積分強(qiáng)度為模型輸入,Cr元素的濃度作為輸出,得到訓(xùn)練集和測試集的預(yù)測結(jié)果,兩者與測定值擬合度系數(shù)分別為0.9714和0.9840。
4.2 預(yù)測結(jié)果分析
以相關(guān)系數(shù)(R)、平均絕對誤差百分比 (MAPE)、預(yù)測集均方根誤差(RMSE)為指標(biāo),優(yōu)化建模參數(shù),考察所建立稻殼LIBS光譜數(shù)據(jù)與Cr含量之間的PSO-SVM和siPLS 算法定量回歸模型性能。
式中,M為樣品總數(shù)量,yi、L、L分別為樣品濃度實(shí)際值、預(yù)測值和平均值。相關(guān)系數(shù)R表示兩組變量之間的線性關(guān)系,MAPE可反映預(yù)測值誤差的實(shí)際情況,RMSE用于衡量預(yù)測值與實(shí)際值之間的偏差。
PSO-SVM與siPLS算法預(yù)測的結(jié)果分析如表2所示,PSO-SVM算法測定結(jié)果的MAPE為4.10%,RMSE為7.83 μg/g;siPLS算法測定結(jié)果的MAPE為6.17%,RMSE為22.58 μg/g,與siPLS算法的預(yù)測結(jié)果相比,PSO-SVM預(yù)測的平均絕對誤差百分比和均方根誤差均更低,檢測能力更優(yōu)。同時(shí),通過PSO-SVM算法預(yù)測稻殼中Cr元素濃度的預(yù)測值與測定值之間的相關(guān)系數(shù)為0.9948,高于siPLS算法得到的相關(guān)系數(shù)(0.9840),說明PSO-SVM的輸出值更接近測定值,提高了準(zhǔn)確性。
5 結(jié) 論
采集稻殼樣品的LIBS光譜,結(jié)合LIBS技術(shù)與SVM理論,利用PSO算法對SVM 進(jìn)行參數(shù)尋優(yōu),以R、MAPE、RMSE為指標(biāo),對預(yù)測結(jié)果進(jìn)行評估,獲得懲罰系數(shù)c最優(yōu)值為24265,核參數(shù)g 最優(yōu)值為0.0100,建立了稻殼中重金屬Cr含量的PSO-SVM定量分析模型,并與siPLS 建模結(jié)果比較。預(yù)測結(jié)果表明,LIBS與PSO-SVM算法相結(jié)合,能夠有效地檢測出稻殼中Cr元素的濃度,且檢測準(zhǔn)確度優(yōu)于siPLS方法,相關(guān)系數(shù)R由0.9840提升到0.9948,MAPE由6.17%降低為4.10%,RMSE由22.58 μg/g下降為7.83 μg/g。 這說明PSO-SVM模型具有較高的泛化性能,為提高稻谷安全的監(jiān)測和稻殼的開發(fā)與再利用提供了參考。
References
1 WANG Xiao-Bo,LI Jian-Guo,LIU Dong-Ying,QIU Yan-Jun,CHEN Rui-Tao. Chinese Journal of Food Hygiene,2015,27(1): 75-78
王曉波,李建國,劉冬英,邱艷君,陳銳濤. 中國食品衛(wèi)生雜志,2015,27(1): 75-78
2 SHENTU Ping-Ping,LUO Jin-Bin,CHEN Gao-Shang,CAO Li-Jun,CHEN Shuang. Zhejiang Journal of Preventive Medicine,2014,26(2): 128-132
申屠平平,羅進(jìn)斌,陳高尚,曹麗軍,陳 爽. 浙江預(yù)防醫(yī)學(xué),2014,26(2): 128-132
3 LIU Qiang,HOU Ye-Mao,ZHANG Hu,ZHENG Kun,ZHANG Juan,TIAN Yuan,WANG Shao-Wen. Grain Processing,2013,38(3): 39-42
劉 強(qiáng),侯業(yè)茂,張 虎,鄭 坤,張 娟,田 原,王紹文. 糧食加工,2013,38(3): 39-42
4 SUN Nan,TIAN Wei-Wei,ZHANG Ying,TIAN Jia-Li. Transactions of the Chinese Society of Agricultural Engineering,2016,32(13): 197-205
孫 楠,田偉偉,張 穎,田佳麗. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(13): 197-205
5 CHEN Ya-Ya,LIN Qin-Lu,LUO Fei-Jun. Journal of Cereals & Oils,2017,30(4): 1-4
陳婭婭,林親錄,羅非君. 糧食與油脂,2017,30(4): 1-4
6 Peng J Y,He Y,Jiang J D,Zhao Z F,Zhou F,Liu F. Food Chem.,2019,295: 327-333
7 Moncayo S,Manzoor S,Rosales J D,Anzano J,Caceres J O. Food Chem.,2017,232: 322-328
8 Cheng X,Yang X Y,Zhu Z H,Guo L B,Li X Y,Lu Y F,Zeng X Y. Appl. Optics,2017,56(33): 9144-9149
9 Sun L X,Yu H B,Cong Z B,Lu H,Cao B,Zeng P,Dong W,Li Y. Spectrochim. Acta B,2018,142: 29-36
10 Moncayo S,Trichard F,Busser B,Sabatier-Vincent M,Pelascini F,Pinel N,Motto-Ros V. Spectrochim. Acta B,2017,133: 40-44
11 Busser B,Moncayo S,Coll J L,Sancey L,Motto-Ros V. Coordin. Chem. Rev.,2018,358: 70-79
12 Yuan T B,Wang Z,Li Z,Ni W D,Liu J M. Anal. Chim. Acta,2014,807: 29-35
13 CHEN Tian-Bing,LIU Mu-Hua,HUANG Lin,ZHOU Hua-Mao,WANG Cai-Hong,YANG Hui,HU Hui-Qin,YAO Ming-Yin. Chinese J. Anal. Chem.,2016,44(7): 1029-1034
陳添兵,劉木華,黃 林,周華茂,王彩虹,楊 暉,胡慧琴,姚明印. 分析化學(xué),2016,44(7): 1029-1034
14 Li K H,Guo L B,Li C M,Li X Y,Shen M,Zheng Z,Yu Y,Hao R F,Hao Z Q,Zeng Q D. J. Anal. Atom. Spectrom.,2015,30(7): 1623-1628
15 El Haddad J,Bruyère D,Ismal A,Gallou G,Laperche V,Michel K,Bousquet B. Spectrochim. Acta B,2014,97: 57-64
16 SHA Wen,LI Jiang-Tao,LU Cui-Ping,ZHENG Chun-Hou. Spectroscopy and Spectral Analysis,2019,39(6): 1958-1964
沙 文,李江濤,魯翠萍,鄭春厚. 光譜學(xué)與光譜分析,2019,39(6): 1958-1964
17 DONG Mei-Rong,WEI Li-Ping,LU Ji-Dong,LI Wen-Bing,LU Sheng-Zi,HUANG Jian-Wei,LI Shi-Shi,LUO Fa-Sheng,NIE Jia-Lang. Spectroscopy and Spectral Analysis.,2019,39(7): 2202-2209
董美蓉,韋麗萍,陸繼東,黎文兵,陸盛資,黃健偉,李詩詩,駱發(fā)勝,聶嘉朗. 光譜學(xué)與光譜分析,2019,39(7): 2202-2209
18 Lu S Z,Dong M R,Huang J W,Li W B,Lu J D,Li J. Spectrochim. Acta B,2018,140: 35-43
19 ZHU Yi-Ning,YANG Ping,YANG Xin-Yan,LI Jia-Ming,HAO Zhong-Qi,LI Qiu-Shi,GUO Lian-Bo,LI Xiang-You,ZENG Xiao-Yan,LU Yong-Feng. Chinese J. Anal. Chem.,2017,45(3): 336-341
朱毅寧,楊 平,楊新艷,李嘉銘,郝中騏,李秋實(shí),郭連波,李祥友,曾曉雁,陸永楓. 分析化學(xué),2017,45(3): 336-341
20 WANG Chun-Long,LIU Jian-Guo,ZHAO Nan-Jing,MA Ming-Jun,WANG Yin,HU Li,ZHANG Da-Hai,YU Yang,MENG De-Shuo,ZHANG Wei,LIU Jing,ZHANG Yu-Jun,LIU Wen-Qing. Acta Optica Sinica,2013,33(3): 314-319
王春龍,劉建國,趙南京,馬明俊,王 寅,胡 麗,張大海,余 洋,孟德碩,章 煒,劉 晶,張玉鈞,劉文清. 光學(xué)學(xué)報(bào),2013,33(3): 314-319
21 Zhang T L,Wu S,Dong J,Wei J,Wang K,Tang H S,Yang X F,Li H. J. Anal. Atom. Spectrom.,2015,30(2): 368-374
22 JIN Ye,YANG Kai,WU Yong-Jiang,LIU Xue-Song,CHEN Yong. Chinese J. Anal. Chem.,2012,40(6): 925-931
金 葉,楊 凱,吳永江,劉雪松,陳 勇. 分析化學(xué),2012,40(6): 925-931