蔣 霞, 張 曉, 白鐵成, 陳 杰, 張楠楠
(塔里木大學(xué)信息工程學(xué)院/中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所新疆南疆農(nóng)業(yè)信息化研究中心,新疆阿拉爾 843300)
冬棗是新疆南疆地區(qū)的重要經(jīng)濟作物,它以味道鮮美,糖分含量高,富含19種人體所需氨基酸和維生素、多種微量元素和較多的藥用成分,被公認為品質(zhì)最好的鮮食棗品種之一[1],具有很高的食療和多種保健功效,被譽為“活維生素丸”[2]。由于大面積種植以及氣候等環(huán)境因素的影響,冬棗樹病蟲害越來越嚴重,嚴重影響了果農(nóng)的利益,果農(nóng)不得不使用農(nóng)藥,但不合理的濫用容易造成冬棗表面農(nóng)藥殘留超標。隨著人們生活水平的提高和健康環(huán)保意識的增強,消費者越來越關(guān)注果蔬的質(zhì)量安全問題,其中果蔬表面的農(nóng)藥殘留問題尤其備受關(guān)注[3]。由于冬棗在采摘前最后1次噴灑農(nóng)藥的時間與上市期的間隔時間較短,導(dǎo)致上市鮮冬棗會出現(xiàn)不同量的農(nóng)藥殘留現(xiàn)象,而且很多消費者食用前不清洗,或者即使清洗也清洗不徹底,因此,導(dǎo)致很多人受害于農(nóng)藥殘留而并不自知。及時對市場上銷售的鮮冬棗進行農(nóng)藥殘留限量檢測顯得極為重要。
近年來,國內(nèi)外研究學(xué)者采用液相色譜法[4]、氣相色譜法[5]、氣相色譜-串聯(lián)質(zhì)譜法[6-7]、酶抑制法[8]、超臨界流體萃取法(SFE)[9]、生物傳感器法[10]等技術(shù)對果蔬類農(nóng)藥殘留進行了研究,并取得了相關(guān)進展。然而,這些檢測方法尤其是化學(xué)方法雖然檢測精度高,但普遍存在耗時長、費用昂貴、對樣品損壞嚴重、樣品和試劑浪費嚴重等現(xiàn)象,且對檢測產(chǎn)品均有一定的破壞性,無法實現(xiàn)經(jīng)濟成本低廉的快速無損檢測[11]。因此,迫切需要一種實時、無損、在線農(nóng)藥殘留快速篩查技術(shù),以適應(yīng)特色林果業(yè)的健康快速發(fā)展需求。
近紅外光譜技術(shù)可利用近紅外光譜區(qū)域的全譜或部分波段光譜對被測物進行快速定量或定性分析[12-13]。該技術(shù)已用于農(nóng)產(chǎn)品品質(zhì)檢測、種類鑒別、農(nóng)藥殘留分析等研究[14-17]。但近紅外光譜通常包含數(shù)以千計的波長變量,利用全波段數(shù)據(jù)建模時,并非每個波長都能提供有用信息,大量冗余數(shù)據(jù)會增加建模工作量。開展波長變量優(yōu)選,不僅可以剔除無關(guān)變量,還能提高模型的預(yù)測精度以及穩(wěn)健性。同時,優(yōu)選的特征波長可用于構(gòu)建在線光譜快速測量系統(tǒng),從而降低生產(chǎn)成本[18]。連續(xù)投影算法(SPA)利用向量的投影分析,尋找含有最少冗余信息的變量組合,使變量間的共線性小,該方法在光譜特征波長優(yōu)選中應(yīng)用廣泛[19-20]。偏最小二乘法(PLS)是一種常見的多元統(tǒng)計數(shù)據(jù)分析方法,被廣泛應(yīng)用于近紅外、高光譜、拉曼、核磁和質(zhì)譜等波譜定量模型的建立,幾乎成為光譜分析中建立定量校正模型的通用方法。
基于以上考慮,本研究以南疆鮮冬棗為對象,通過近紅外光譜技術(shù)得到冬棗樣品表面吸光度信息,以毒死蜱農(nóng)藥為例,建立噴灑不同濃度農(nóng)藥的鮮冬棗樣品的全波段偏最小二乘法(PLS)模型,同時應(yīng)用SPA提取特征波長,作為PLS的輸入變量,建立了SPA-PLS模型,比較2種模型的預(yù)測精度,以期為鮮冬棗農(nóng)藥殘留的快速檢測提供一種新的思路和方法,并對其他果蔬類農(nóng)藥殘留光譜檢測提供借鑒意義。
選取新疆南疆某農(nóng)場購買的鮮冬棗為研究對象,隨機選取180個成熟度良好、顏色均勻的冬棗樣本,所用的農(nóng)藥為毒死蜱,購買于國家物質(zhì)中心,劑型為乳油,質(zhì)量百分含量為40%。把農(nóng)藥配置成1 ∶10、1 ∶50、1 ∶100、1 ∶1 000不同濃度梯度的溶液和空白對照溶液(只含蒸餾水)。
首先對180個冬棗樣本進行清洗并自然風(fēng)干,然后立即按照試驗要求,隨機分為5組,每組36個,將配好的4種濃度的農(nóng)藥溶液及空白對照組分別噴灑1組冬棗,其中每種濃度隨機抽取30個冬棗作為建模集,剩余的6個冬棗作為預(yù)測集。利用噴霧器噴灑,保證噴灑均勻。
將噴灑過藥液的冬棗放在通風(fēng)處12 h后,進行近紅外光譜圖像的采集。整個過程均在實驗室進行,實驗室環(huán)境條件為溫度20~25 ℃,相對濕度為30%~40%。
實驗設(shè)備為Antaris II傅立葉變換近紅外(FT-NIR)光譜儀(Thermo Scientific,USA),無需另外提供采樣背景,以儀器內(nèi)部空氣為背景,測量波長范圍4 000~10 000 cm-1,分辨率為4 cm-1,共1 557個采樣點數(shù),每張光譜掃描32次。測樣方式:開機預(yù)熱30 min后,用近紅外光譜儀對紅棗的可區(qū)別3個部位分別掃描32次,求其平均值作為原始光譜。應(yīng)用OMNIC軟件和與之配套的標準白板采集歸一化后的光譜數(shù)據(jù)并轉(zhuǎn)換格式,利用MATLAB2010b(美國Mathworks)軟件進行數(shù)據(jù)分析和處理。本次采用的近紅外光譜采集設(shè)備系統(tǒng)見圖1。
連續(xù)投影算法(successive projections algorithm,SPA)[18]在光譜分析建模中可以提取光譜數(shù)據(jù)的特征波長,減少數(shù)據(jù)維度的同時能夠有效避免信息重疊,最大限度提取解釋信息,從而提高預(yù)測精度和速度,使模型能夠更有效地達到實際利用目的。
設(shè)X(n×p)為鮮冬棗表面不同濃度農(nóng)藥殘留的吸光度矩陣,其中n為樣本容量,p為全譜波的個數(shù)。設(shè)xk為初始迭代量,M為提取波長變量數(shù)的范圍,SPA的具體算法為:
預(yù)測集的光譜矩陣X(n×m)給出需要選擇的波長數(shù)n,SPA算法如下:
(1)在開始迭代前(m=1)把校正集光譜矩陣的任意第k列(k=1…p,p為波長總數(shù))賦值給xk;
(2)把沒有被選中的其他波長點位置集合記為S:
S={k,1≤k≤p,k?{var(0),…,var(m-1)}};
(3)計算xk對剩余列向量Xvar(m-1)的正交投影:
(4)記
var(m)=arg[max(‖Pxj‖],k∈S;
(5)記
xk=Pxk,k∈S;
(6)m=m+1,如果m (7)最后提取波長位置{var(m)=0,…,M-1}; 對應(yīng)于每一對var(m)和M,循環(huán)1次后進行多元線性回歸分析(MLR),得到驗證集的標準偏差(RMSEP),最小RMSEP值對應(yīng)的var(m)和M則為最優(yōu)值。 偏最小二乘法(partial least square regression,PLS)是通過建立光譜數(shù)據(jù)與農(nóng)藥濃度分類值之間的多元統(tǒng)計回歸模型進行分析。除了線性回歸分析,PLS在建模過程中集合了包括主成分分析、典型相關(guān)分析等方法的功能特點,因此在分析結(jié)果中,不僅可以建立更優(yōu)化的回歸模型,而且在光譜分析中得到廣泛應(yīng)用[19]。 將噴灑毒死蜱農(nóng)藥濃度為1 ∶10的樣本賦值為1,噴灑毒死蜱農(nóng)藥濃度為1 ∶50的樣本賦值為2,噴灑毒死蜱農(nóng)藥濃度為1 ∶100的樣本賦值為3,噴灑毒死蜱農(nóng)藥濃度為 1 ∶1 000 的樣本賦值為4,噴灑蒸餾水的樣本賦值為5。PLS數(shù)值間的間距為1。判別依據(jù)是以各數(shù)值為基準,上下0.5個單位之內(nèi)的為該數(shù)值代表的農(nóng)藥濃度,結(jié)果見表1。 表1 PLS模型判別標準 為有效評價模型精度,本研究選取相關(guān)系數(shù)(R)、建模集中交互驗證預(yù)測均方差(SECV)、驗證集中預(yù)測標準差(SEP)、準確率(precision)進行模型分析檢驗,其計算公式見表2。其中,R越接近1,回歸(或預(yù)測)結(jié)果越好;SECV越小,說明該模型的預(yù)測能力越高;SEP值越小,則表示模型對外部樣品的預(yù)測能力越高;同一批次樣本,SECV和SEP值越小,說明模型的精度越高,二者值越接近說明模型穩(wěn)定性越好;Precision用來驗證模型的正確程度,用來反應(yīng)模型的正確性。 為采集噴灑4種不同濃度毒死蜱農(nóng)藥的樣品組與對照組的原始光譜,從圖2可以看出,噴灑不同濃度農(nóng)藥樣本及對照組樣本的近紅外光譜在4 000~10 000 cm-1曲線趨勢基本相似,并沒有太明顯的差異,但6 800、5 200 cm-1附近有明顯的吸收峰存在,噴灑不同濃度農(nóng)藥的樣品在此2波峰處的吸光強度不同。在所測范圍4 000~10 000 cm-1內(nèi),其吸光強度與毒死蜱農(nóng)藥的濃度呈負相關(guān)關(guān)系,毒死蜱濃度越高,在該范圍內(nèi),其峰值越低,本結(jié)果與前人研究結(jié)論一致。 分別采用一階導(dǎo)數(shù)(savitzky golay first derivative,SGFD)、二階導(dǎo)數(shù)(savitzky golay second derivative,SGSD)、多元散射校正(multiplicative scatter correction,MSC)等3種方法對光譜進行預(yù)處理,光譜預(yù)處理結(jié)果見圖3。然后結(jié)合PLS對不同濃度農(nóng)藥進行建模。采用3種光譜預(yù)處理方法和原光譜所建立的PLS模型對冬棗中農(nóng)藥殘留量分類的建模精度和預(yù)測能力見表3。通過比較,采用原始光譜所建立的模型最優(yōu)(圖4),故后面的連續(xù)投影算法以原始光譜為基礎(chǔ)進行。 表2 偏最小二乘法模型的檢驗指標 采用連續(xù)投影算法在全譜范圍內(nèi)對原始光譜使用SPXY(Sample set partitioning based on joint x-y distance)進行校正集樣品劃分處理,最后使用SPA算法進行光譜變量壓縮。指定提取波長變量數(shù)M的范圍為2~20,采用均方根誤差(RMSE)確定選定的最終變量數(shù)目。從圖4可以看出,當(dāng)最小均方根誤差的最小值為0.689 34時,從原始光譜中共選出5個特征波長,分別為3 999.64、4 578.18、5 179.861、5 283.999、7 162.325 cm-1,其重要性依次減弱。從所選變量的波長可以看出,冬棗表面毒死蜱農(nóng)藥在4 000~5 300 cm-1波段存在相關(guān)性較高的光譜特征,可用于冬棗表面毒死蜱農(nóng)藥殘留量的快速檢測,其中5 179.861、5 283.999 cm-1波段貢獻值較大,本結(jié)果與已有研究中5 200 cm-1附近是農(nóng)藥濃度分類敏感波段結(jié)論相吻合。 表3 不同預(yù)處理方法PLS建模結(jié)果 對從原始光譜做SPA后選出的5個特征波長,仍采用相同的3種光譜預(yù)處理方法和原始光譜建立SPA-PLS模型,該模型對冬棗中農(nóng)藥殘留量分類的建模精度和預(yù)測能力見表4。與PLS模型的建模精度和預(yù)測能力比較可知,原始光譜的SEP由0.653 683增加至0.691 782,RMSECV由 0.573 286 增加至0.782 928,R由0.886 780降低至 0.872 192,Precision由0.737 027提高至0.795 669;一階求導(dǎo)的SEP從 0.739 075 提高至0.771 944,RMSECV從 0.005 520 增加至0.365 338,R從0.852 575降低至 0.837 885,Precision從 0.694 676 增加至0.761 169;二階求導(dǎo)的SEP從 1.232 677 降低至0.708 189,RMSECV從 0.689 179 降低至0.033 439,R從0.490 157提高至 0.865 583,Precision從0.478 865提高至0.668 338;MSC的SEP由1.117 406降低至0.916 856,RMSECV由1.609 444降低至1.000 208,R由0.612 946提高至0.761 372,Precision由0.485 502提高至0.558 819。 試驗結(jié)果表明,SPA-PLS只用了5個特征波長來建模,所用變量數(shù)僅占全波段的0.32%,建立的冬棗表面農(nóng)藥殘留模型的準確度和精度優(yōu)于在全譜區(qū)所建立的PLS模型。因為近紅外光譜的譜峰重疊嚴重,冗余信息多,同時在全譜區(qū)還包含大量與毒死蜱成分無關(guān)的信息,將全光譜的所有信息參與建模,在一定程度上降低了模型的性能[20]。而經(jīng)SPA變量從全光譜中優(yōu)選出有效特征變量建立的模型,最大程度地保留了有用光譜信息,剔除了大量無用和冗余信息,提高了模型精度和穩(wěn)定性。 表4 SPA-PLS建模結(jié)果 采用連續(xù)投影算法(SPA)分別對測定的180組光譜數(shù)據(jù)進行變量選擇,從原始光譜中篩選了3 999.64、4 578.18、5 179.861、5 283.999、7 162.325 cm-1共5個波長,降低了PLS模型的計算量,且連續(xù)投影算法高度概括了絕大多數(shù)樣品光譜的信息,避免了信息重疊,同時去除了冗余信息,簡化了模型,提高了模型精度和穩(wěn)定性。同時,將得到的特征波長用于開發(fā)便攜式農(nóng)藥殘留檢測儀,可以大大降低對硬件的要求,為研制水果表面農(nóng)藥殘留便攜式光譜儀提供依據(jù)和理論基礎(chǔ)。 研究結(jié)果表明,可見近紅外光譜技術(shù)聯(lián)合PLS和SPA是一種有效區(qū)分冬棗表面不同濃度農(nóng)藥殘留量的方法。在今后的研究中,將引入多種農(nóng)藥種類,增加農(nóng)藥梯度設(shè)置,進一步驗證該方法的有效性。但所建模型的精度和準確度相對較低,提高模型精度和準確度的方法還需進一步開展研究。 [1]王亞萍,王貴禧,李艷菊. 冬棗貯藏保鮮技術(shù)研究進展[J]. 中國農(nóng)學(xué)通報,2006,22(3):82-87. [2]曲澤洲,王永蕙. 中國果樹志·棗卷[M]. 北京:中國林業(yè)出版社,1993:229-230. [3]薛 龍,黎 靜,劉木華. 基于高光譜圖像技術(shù)的水果表面農(nóng)藥殘留檢測試驗研究[J]. 光學(xué)學(xué)報,2008,28(12):2277-2280. [4]Yu C S,F(xiàn)an S F,Li Y J,et al. Representative commodity for five brassica vegetables based on the determination and dissipation of six pesticide residues[J]. International Journal of Environmental Analytical Chemistry,2015,95(5):419-433. [5]吳海燕,陳建軍. 蔬菜中多種有機磷農(nóng)藥殘留氣相色譜分析法[J]. 食品與機械,2010,26(4):76-77,83. [6]Lozano A,Rajski L,Belmonte-Valles N,et al. Pesticide analysis in teas and chamomile by liquid chromatography and gas chromatography tandem mass spectrometry using a modified QuEChERS method:validation and pilot survey in real samples[J]. Journal of Chromatography A,2012,1268:109-122. [7]蘇建峰,鐘茂生,陳 晶,等. 氣相色譜-質(zhì)譜法與氣相色譜法測定茶葉及茶葉加工品中295種農(nóng)藥多殘留[J]. 分析測試學(xué)報,2015,34(6):625-638. [8]劉永杰,張金振,曹明章,等. 酶抑制法快速檢測農(nóng)產(chǎn)品農(nóng)藥殘留的研究與應(yīng)用[J]. 現(xiàn)代農(nóng)藥,2004,3(2):25-27,42. [9]Rissato S R,Galhiane M S,Knoll F R,et al. Supercritical fluid extraction for pesticide multiresidue analysis in honey:determination by gas chromatography with electron-capture and mass spectrometry detection[J]. Journal of Chromatography A,2004,1048(2):153-159. [10]Cesarino I,Moraes F C,Lanza M R,et al. Electrochemical detection of carbamate pesticides in fruit and vegetables with a biosensor based on acetylcholinesterase immobilised on a composite of polyaniline-carbon nanotubes[J]. Food Chemistry,2012,135(3):873-879. [11]岳賢田,高桂枝. 蔬菜中農(nóng)藥殘留檢測方法研究進展[J]. 現(xiàn)代農(nóng)業(yè)科技,2008(12):111-113,115. [12]Wu X H,Sun J,Wu B,et al. Qualitative nnalysis model of near infrared spectra of pork based on synergy interval partial least squares discriminant analysis[J]. Laser & Optoelectronics Progress,2015,52(4):242-247. [13]Gong Z Y,Li Y F,Liu Y D,et al. Study on influence of irradiation angle on detection of sugar content of apple by near infrared spectroscopy[J]. Laser & Optoelectronics Progress,2016,53(2):235-240. [14]鐘艷萍,鐘振聲,陳蘭珍,等. 近紅外光譜技術(shù)定性鑒別蜂蜜品種及真?zhèn)蔚难芯縖J]. 現(xiàn)代食品科技,2010,26(11):1280-1282,1233. [15]Gao J F,Li X L,Zhu F L,et al. Application of hyperspectral imaging technology to discriminate different geographical origins ofJatrophacurcasL. seeds[J]. Computers and Electronics in Agriculture,2013,99(6):186-193. [16]溫珍才,孫 通,耿 響,等. 可見/近紅外聯(lián)合UVE-PLS-LDA鑒別壓榨和浸出山茶油[J]. 光譜學(xué)與光譜分析,2013,33(9):2354-2358. [17]湯丹明,孫 斌,劉輝軍. 近紅外漫反射光譜鑒別雞蛋種類[J]. 光譜實驗室,2012,29(5):2699-2702. [18]周 竹,尹建新,周素茵,等. 基于近紅外光譜與連續(xù)投影算法的針葉材表面節(jié)子缺陷識別[J]. 激光與光電子學(xué)進展,2017,54(2):305-313. [19]劉 飛,馮 雷,柴榮耀,等. 基于直接正交信號校正的水稻冠層葉瘟光譜診斷[J]. 光學(xué)學(xué)報,2010,30(2):585-589. [20]羅 霞,洪添勝,羅 闊,等. 高光譜技術(shù)在無損檢測火龍果可溶性固形物中的應(yīng)用[J]. 激光與光電子學(xué)進展,2015,52(8):309-317.1.4 建模方法和模型驗證指標
2 結(jié)果與分析
2.1 原始光譜曲線與特征分析
2.2 預(yù)處理結(jié)果
2.3 SPA選擇特定波長
2.4 基于SPA特征波長的PLS模型
3 結(jié)論