楊暉 黃林 劉木華 陳添兵 王彩虹 姚明印
摘要利用激光誘導擊穿光譜(LIBS)技術與常規(guī)化學分析方法獲取28個濃度梯度含Cd元素的青菜樣品的LIBS譜線信息以及Cd含量信息。對獲取的光譜信息結合標準歸一化處理(SNV)、一階導數(shù)(FD)、二階導數(shù)(SD)、中心化處理(Center)作為偏最小二乘法(PLS)模型的優(yōu)選方法;再根據(jù)4種預處理方法的預測結果選取最佳方法,同時將該方法作為間隔偏最小二乘法(iPLS)與聯(lián)合區(qū)間間隔偏最小二乘法(SiPLS)優(yōu)選青菜LIBS譜線的最佳波長區(qū)間。結果表明: 通過SiPLS優(yōu)選的特征波長區(qū)間分別為214.72~215.82 nm,215.88~216.97 nm, 225.08~226.35 nm,并且經(jīng)過中心化預處理后建立的驗證模型效果最好,結果顯示交叉驗證均方根誤差(RMSECV)為1.487,驗證均方根誤差(RMSEP)為1.094,相關系數(shù)(R)為0.9942,平均相對誤差(ARE)為11.60%。 研究結果表明,所選優(yōu)化方法適合青菜中重金屬Cd元素的LIBS校正模型的建立,且具有較好的預測效果。
關鍵詞激光誘導擊穿光譜;青菜;鎘;變量篩選
1引 言
蔬菜是人們日常生活不可缺少的食物之一,但由于工業(yè)廢水、廢氣的排放及農藥、化肥的濫用,導致蔬菜重金屬超標現(xiàn)象時有發(fā)生[1~4]。Shaheen等[5]研究發(fā)現(xiàn),重金屬在蔬菜中的殘留具有普遍性; Anwar等[6]對污水灌溉區(qū)葉菜樣品進行了化學檢測,得出重金屬超標的結論;龔夢丹[7]等對杭州某蔬菜重金屬風險進行評價,發(fā)現(xiàn)該地區(qū)以鎘(Cd)污染為主;劉堯蘭等[8]對環(huán)鄱陽湖區(qū)采集的葉類蔬菜樣品重金屬污染情況進行檢測,結果顯示青菜中Cd超標率為33%;Ye等[9]發(fā)現(xiàn)Cd在蔬菜中的積累能力高于其它重金屬。蔬菜富集的重金屬經(jīng)食物鏈被人體吸收,危害健康。因此,需要在蔬菜進入餐桌前,對其安全性進行檢測。檢測蔬菜中重金屬傳統(tǒng)方法主要有原子吸收光譜法(AAS)[10,11]、電感耦合等離子體質譜法(ICPMS)[12]等,雖然這些方法檢測精度高,但需要進行復雜的前處理,對操作人員具有較高的技術要求,且還會帶來次生污染。因此,發(fā)展簡單綠色、無污染的檢測方法具有重要的現(xiàn)實意義。
激光誘導擊穿光譜(LIBS)[13~15]是新型的物質成分分析技術,具有多元素檢測、無需復雜的樣品化學前處理、對環(huán)境友好等諸多優(yōu)點,在材料成分檢測[16,17]、生物醫(yī)學[18,19]、產(chǎn)品分類[20,21]等領域應用廣泛, LIBS在農產(chǎn)品質量安全檢測方面的研究也日益突出,但主要集中在樣品分類或礦物質營養(yǎng)元素的定性/定量分析研究[22],對重金屬污染物的研究較少[23]。為了提高LIBS在農產(chǎn)品重金屬檢測方面的預測精度,國內外研究組在定性/定量分析上采用了多種方法, Sankaran等[24]利用基線校正、小波去噪等預處理方法并結合支持向量機(SVM)算法對異常柑橘葉檢測分類,結果表明,分類準確率為97.5%。陳添兵等[25]比較了5種不同的光譜數(shù)據(jù)預處理方法對PLS建立豬肉中Pb元素預測模型精度的影響,結果表明,多元散射(MSC)預處理效果最好,驗證集預測平均相對誤差為7.8%。
本研究以實驗室Cd元素污染的青菜為例進行LIBS實驗,采用偏最小二乘法(Partial least square, PLS)、間隔偏最小二乘算法(Interval PLS, iPLS)、聯(lián)合區(qū)間偏最小二乘法(Synergy interval PLS, SiPLS)并結合不同的光譜預處理, 建立青菜中Cd元素的定量模型,比較不同變量篩選方法對模型預測能力的影響。
2實驗部分
2.1儀器與試劑
固體Nd:YAG雙光束激光器(中國北京Beamtech公司); 輸出波長1064nm,重復頻率1~15 z,脈寬為8ns;激光能量測量儀(中國計量科學研究院);雙通道光柵光譜儀(荷蘭Avantes公司); 波長范圍206~330 nm,330~483 nm,分辨率分別為0.08和0.16 nm;DG645數(shù)字脈沖延遲發(fā)生器 (美國Stanford 公司); SC300二維旋轉平臺(北京卓立漢光公司);便攜式食品重金屬快速分析儀(江蘇天瑞儀器股份有限公司); CdCl2, NO3, ClO4均為天津市永大化學試劑有限公司提供的純度≥99%的優(yōu)級純試劑;實驗用水均來自SRO10L/超純水系統(tǒng)。
2.2污染樣品制備
實驗所用的青菜(四季小白菜)樣品購自本地農貿市場,初步測定樣品中Cd元素含量為0.22 mg/kg。為了研究LIBS對青菜中Cd元素的預測可行性,需要對樣品進行實驗室污染處理。首先稱取不同質量的CdCl2,配制濃度范圍在0.2~10 mg/L的28個濃度梯度的Cd水溶液。將青菜放入配制好的溶液中浸泡4 h后取出,并用去離子水多次清洗, 消除樣品表面殘留的Cd的影響,自然風干后, 將3片葉片疊加放置于LIBS試驗平臺進行光譜采集。LIBS測試結束后,取LIBS擊打附近0.5 g青菜樣品放入150 mL錐形瓶中,加入25 mL NO3ClO4混合酸(4∶1, V/V),放置約10 h。然后在電熱板上加熱,直至錐形瓶中溶液剩1~2 mL,且為無色透明或略現(xiàn)黃色。完全冷卻,用少量超純水清洗瓶壁,通過中速濾紙過濾到50mL容量瓶中,用超純水定容。再采用石墨爐原子吸收分光光度計校核準確度為95%~105%的便攜式食品檢測儀獲取樣品中Cd元素的濃度,為保證測量的準確性,每個樣品做3次重復,結果如表1所示,可知污染處理后的青菜樣品Cd平均真實濃度在0.7978~28.20 mg/kg之間,均超過食品安全國家標準[26]。同時可知除#8樣品多次測量重復性為5.13%之外,其余樣品測量重復性均在5%以下,整體在0.07%~4.63%范圍內變化,說明此便攜式檢測方法穩(wěn)定性滿足要求。
3結果與討論
3.1LIBS譜線
LIBS試驗裝置工作時,激光器發(fā)射高能脈沖激光經(jīng)反射鏡反射,由焦距為100 mm的聚焦透鏡聚焦于放置在二維旋轉平臺上的樣品表面產(chǎn)生的等離子體,再經(jīng)穿孔反射鏡反射到焦距為100 mm的水平石英聚焦透鏡耦合至光纖,光譜儀對光纖傳輸?shù)男盘栠M行采集,最后利用計算機對光譜信息進行分析處理。為了減少樣品不均勻性帶來的誤差,提高分析靈敏度,第一束激光能量選取160 mJ,第二束激光能量為180 mJ,同時每個樣品采集10幅光譜,每幅光譜均是激光累計擊打15次的平均結果,最終光譜數(shù)據(jù)選擇平均值。
圖1是無污染處理的青菜樣品和#7污染處理樣品在206.28~330.99 nm波長范圍的LIBS譜線,可以看出,LIBS能清晰探測到#7樣品中的Cd 214.43 nm, Cd 226.50 nm, Cd 228.80 nm 3條特征譜線,而在對照組青菜樣品中則未探測到Cd元素的譜線信息。根據(jù)探測的等離子體譜線分布對比查詢NIS標準原子光譜數(shù)據(jù)庫,可知在該波段范圍內含有豐富的Fe, Mg, Na, Al和Ca等礦質元素。
3.2光譜處理
LIBS采集光譜信息時,受儀器本身的穩(wěn)定性、實驗參數(shù)、外部環(huán)境等因素的影響,獲取的光譜數(shù)據(jù)中除含有青菜所需的原始信息外,還包含基線漂移、背景信號、噪聲信號等干擾信息。為了提高后期數(shù)據(jù)分析的準確性、減小誤差,對采集的光譜結合基線校正、小波去噪等前處理方法。圖2為#7青菜樣品光譜前處理結果。可知,樣品在211.10~229.53nm波長范圍內的原始LIBS譜線整體向上漂移,且包含了較多的噪聲信號。通過手動基線校正與小波去噪后,對基線的漂移和噪聲去除有較為明顯的改善,且原本被噪聲信號掩蓋或不易辨析的其它元素信號也得以顯現(xiàn)。
3.3變量篩選
為進一步消除噪聲信號與基線偏移對模型的影響,采用標準歸一化處理(SNV)、一階導數(shù)(FD)、二階導數(shù)(SD)、中心化處理(Center)對前處理后的光譜進一步處理,同時結合偏最小二乘法(PLS)進行建模分析選取最佳處理方法,并在此基礎上將此處理方法作為間隔偏最小二乘法(iPLS)與SiPLS數(shù)據(jù)預處理方法,進行建模分析, 選取最佳變量區(qū)間,以提高青菜中Cd元素的預測模型精度。
3.3.1偏最小二乘法建模分析選取包含目標元素Cd特征譜線Cd 214.43 nm,Cd 226.50 nm,Cd 228.80 nm 在內的211.10~229.53 nm波長范圍所有LIBS強度值作為分析自變量與Cd元素含量相關聯(lián), 進行建模分析。分析結果如表2所示,在中心化預處理下PLS具有良好的預測性能,此時預測集預測濃度與原始濃度相關系數(shù)(R)為0.9976,預測均方根誤差(RMSEP)為0.8996,相對分析誤差(Relative percent deviation,RPD)為1.761,驗證集預測平均相對誤差(ARE)為12.59%,其中相對分析誤差RPD=SEDV/RMSECV(SEDV)為定標集標準偏差,RMSECV為交叉驗證均方根誤差,RPD>2時建立模型可靠; RPD<1.5時,表示模型預測不準確; RPD在1.5~2.0之間, 基本可以滿足預測精度要求[27]。根據(jù)PLS模型的優(yōu)化比較結果將中心化處理作為iPLS與SiPLS的數(shù)據(jù)前處理方法。
3.3.2間隔偏最小二乘法建模iPLS是將選取的LIBS光譜等分為若干子區(qū)間,分別對每個子區(qū)間建立PLS模型,并對主成分(PC)數(shù)進行選取,最終選擇最佳建模子區(qū)間。本工作比較了不同區(qū)間數(shù)對模型預測能力的影響,結果見表3和圖3,可知iPLS模型下將區(qū)間個數(shù)劃分為12時,選擇區(qū)間數(shù)10,波長范圍為225.08~226.63 nm,主成分數(shù)為6模型效果最佳,此時定標集相關系數(shù)(Rt)為0.9849、交叉驗證均方根誤差(RMSECV)為1.553、驗證集相關系數(shù)(Rp)為0.9989、驗證集均方根誤差(RMSEP)為0841、驗證集相對平均誤差(ARE)為16.99%。
3.3.3聯(lián)合區(qū)間間隔偏最小二乘法建模SiPLS是將劃分子區(qū)間中精度較高的幾個局部模型聯(lián)合起來共同預測待測元素成分。不同區(qū)間數(shù)下SiPLS模型預測能力見表4與圖4,可見在SiPLS模型下將區(qū)間數(shù)劃分16,選擇聯(lián)合子區(qū)間[4513],聯(lián)合區(qū)間波長范圍為214.72~215.82 nm,215.88~216.97 nm, 225.08~226.16 nm,主成分數(shù)為9時模型效果最佳,此時Rt、RMSECV、Rp、RMSEP、ARE分別為0.9863, 1.487, 0.9942,1.094, 11.60%。
3.4結果對比分析
綜上所述,采用不同的變量篩選方法對同一樣本進行變量篩選,對LIBS建模分析精度有較大的影響。結合多個指標對模型進行的優(yōu)劣進行評價,綜合對比3種分析模型,可知在SiPLS模型下有較好的分析預測效果,這主要是因為PLS模型選擇整個211.03~229.56 nm波長范圍的LIBS譜線信息,其中包含分析所需的有用信息,同時也融入了大量的冗余信息,對分析準確性造成干擾;iPLS模型將所選的211.03~229.56 nm波長范圍劃分為若干子區(qū)間,分別進行PLS建模分析,并對潛在變量因子數(shù)進行優(yōu)化,選取最佳建模區(qū)間,但可能會遺漏一些有用信息,分析信息不完整影響分析準確度;SiPLS是將同一次區(qū)間劃分中精度較高的幾個局部模型所在的區(qū)間聯(lián)合起來共同預測待測成分,在選取主要信息同時也會在其它區(qū)間進行篩選,將篩選的區(qū)間聯(lián)合起來共同預測成分。與PLS相比減少了分析中融入的無用信息,與iPLS相比補充了分析中可能遺漏的有用信息,提高了分析準確性。
4結 論
本研究以四季小白菜作為葉類蔬菜代表,進行LIBS對蔬菜中重金屬元素Cd的分析可行性研究,在實驗室含Cd溶液污染處理條件下獲取了不同濃度梯度的葉菜樣品,并利用LIBS技術對青菜光譜信息進行檢測,探討了PLS,iPLS, SiPLS 3種變量篩選方法對Cd元素分析精度的影響,建立Cd元素含量的預測模型。將3種模型的預測結果進行綜合對比,比較結果表明,3種模型預測集相關系數(shù)與均方根誤差均相近,在評價預測準確性的相對誤差參數(shù)上,SiPLS模型優(yōu)于其它兩種模型,其平均相對誤差為11.60%。低濃度樣品預測時,較小的絕對誤差會引起較大的相對誤差,將其中一個相對誤差較大的低濃度樣品剔除后,預測樣品平均相對誤差為8.3%。結果表明,LIBS技術結合經(jīng)變量篩選后的SiPLS算法能夠更為準確檢測青菜中的重金屬Cd元素,提高模型預測的精度。
Abstracteavy metal residue in vegetables is a big concern in the whole world. he aim of this work is to explore the effect of multivariable selection on analyzing Cd in Chinese cabbage polluted in lab by collecting the spectra of laser induced breakdown spectroscopy (LIBS) from the samples. At the same time, the actual Cd content in samples was obtained by anodic stripping voltammetry (ASV). he LIBS spectral range in partial least square (PLS) model was screened by standard normal variable transformation (SNV), first derivative (FD), second derivative (SD) and center treatment (C) for preprocessing spectra and the optimized method was used for the analysis of interval partial least square (iPLS) and synergy interval partial least square (SiPLS). he results indicated that the method of C was the best as a comparison with PLS, iPLS and SiPLS. And the intervals of wavelength were 214.72-215.82 nm, 215.88-216.97 nm and 225.08-226.35 nm by utilizing the optimized SiPLS. ere the root mean square error of cross validation (RMSECV) between real content and predicted ones was 1.487, the root mean squared error of prediction (RMSEP) was 1.094, the correlation coefficient (R) was 0.9942, and the average relative error (ARE) was 11.60%. he results displayed that LIBS could predict Cd in vegetables by multivariable selection of SiPLS and the accuracy could meet the requirement of rapid and green analysis of Cd in vegetables.
KeywordsLaser induced breakdown spectroscopy; Chinese cabbage; Cadmiun; Variable screening