夏金梅, 孫威江, 林 濤, 游 泳, 曾兆華, 王冰玉
(1.福建省農業(yè)科學院植物保護研究所農藥環(huán)境安全評價中心, 福建 福州 350002;2.福建農林大學園藝學院, 福建 福州 350002)
?
基于近紅外光譜技術結合遺傳算法的安溪鐵觀音品質評價
夏金梅1,2, 孫威江2, 林 濤1, 游 泳1, 曾兆華1, 王冰玉2
(1.福建省農業(yè)科學院植物保護研究所農藥環(huán)境安全評價中心, 福建 福州 350002;2.福建農林大學園藝學院, 福建 福州 350002)
以清香型鐵觀音茶葉為試驗原料,基于近紅外光譜技術結合遺傳算法,建立相關的數(shù)學分析模型,用于安溪鐵觀音綜合品質得分的測定,完善茶葉檢測體系,進一步推動我國茶產業(yè)的標準化進程。實驗結果表明,經二階導數(shù)+平滑+歸一化方法對光譜進行預處理后,得到綜合品質得分PLS測定模型最優(yōu),驗證集相關系數(shù)為0.913,均方根偏差為0.665。選用近紅外光譜6 670-4 000 cm-1譜區(qū),經遺傳算法篩選特征波長后,建立茶樣綜合品質得分GA-PLS測定模型,校正集相關系數(shù)為0.959,均方根偏差為0.413;驗證集相關系數(shù)為0.940,均方根偏差為0.587,GA-PLS模型的預測能力和精度更高。
近紅外光譜技術; 遺傳算法; 偏最小二乘法; 安溪鐵觀音; 品質評價
安溪鐵觀音作為我國的十大名茶之一,以其獨特的“觀音韻”聞名,隨著鐵觀音消費量的提高,人們對茶葉品質的要求也隨之提高。當前市場上的安溪鐵觀音外觀多為顆粒狀,消費者很難直接從外觀上辨別其品質優(yōu)劣。感官審評和理化分析是目前茶葉品質檢測最主要的兩種方法,但二者在判別安溪鐵觀音品質方面都具有不同程度的局限性。傳統(tǒng)的感官審評方法主要依靠專業(yè)審評人員的感覺器官對茶葉的外形(權重20%)、湯色(權重5%)、香氣(權重30%)、滋味(權重35%)和葉底(權重10%)5項單因子進行審評得出分數(shù),計算5項因子的加權總分,以分數(shù)的高低來判斷其品質優(yōu)劣,雖然簡便、快捷,但其易受到主觀因素和生理因素的影響,評審缺乏說服力。理化分析是利用化學分析方法檢測茶葉中咖啡堿、茶多酚等理化指標來評判茶葉品質的一種方法,得到的結果雖然較為準確,但因其操作步驟繁瑣、費時、成本高等缺點,難以推廣與運用(傅志明,2005)因此,快捷、準確新型的檢測方法的開發(fā)研究受到普遍關注。
20世紀70年代日本最早運用近紅外光譜技術快速檢測茶葉組分。中國在20世紀90年代才開始就近紅外光譜技術開展相關研究(許瓊等,2007)。王勝鵬等(2011)驗證偏最小二乘法,建立了茶葉在近紅外波段光譜與含水量、全氮量的相關模型,這為茶葉的品質研究提供了一個新的突破。李艷肖等(2015)利用蟻群算法和遺傳算法進行優(yōu)化譜區(qū),建立花茶花青素近紅外光譜預測模型,具有較高精度,可有效選擇特征光譜信息。近紅外光譜技術作為一種具有綠色、無損、快速等優(yōu)勢的新興技術,被認為是有望替代傳統(tǒng)的化學分析的無損檢測方法(劉發(fā)龍等,2008)。
因此,本文以安溪鐵觀音為試驗原料,嘗試利用遺傳算法選取波段,結合偏最小二乘法,最后建立綜合品質得分模型,并對其進行評價與優(yōu)化。研究結果有助于更好地規(guī)范烏龍茶銷售市場,防止出現(xiàn)外觀相似的假冒偽劣產品,并探索出一種能夠快速、準確地評判安溪鐵觀音品質優(yōu)劣的方法。
1.1 材料
1.1.1 試驗材料 選取安溪各地茶農或者茶葉生產廠家未包裝的清香型安溪鐵觀音毛茶,根據收購價格的高低,將茶樣初步劃分為高中低3個檔次,共130個茶樣。其中95個茶樣作為校正集;35個茶樣作為驗證集。
1.1.2 儀器和軟件 采用Antaris II傅立葉近紅外光譜儀,基于Workflow光譜采集工作流獲取茶樣近紅外光譜信息;使用紅外處理軟件OPUS進行數(shù)據格式轉換和近紅外光譜預處理;利用Matlab R2010a軟件進行數(shù)據分析和數(shù)學建模(段焰青等,2011)。
1.2 試驗方法
1.2.1 感官審評 根據《茶葉感官審評方法》(馮花等,2010),由3位專業(yè)審評人員在福建省茶葉質量監(jiān)督檢驗站對茶葉進行了感官審評,得出茶樣品質得分,以此作為建模依據。
1.2.2 樣品前處理 將茶樣放入中藥粉碎機研磨,粉碎1 min呈粉末狀,過80目篩,取篩下茶粉,稱取10-15 g茶粉進行編號、封裝,作為近紅外光譜采集的樣品。
1.2.3 近紅外光譜數(shù)據的采集 利用Antaris II傅立葉近紅外光譜儀采集,基于Workflow設置茶粉光譜采集工作流,設置參數(shù)為:光譜掃描次數(shù)64 次,分辨率8 cm-1,光譜范圍10 000-4 000 cm-1,光譜數(shù)據點為1 557個(鄒小波等,2007),保持室內溫濕度穩(wěn)定。
1.2.4 近紅外光譜預處理 近紅外光譜圖除了攜帶茶樣的自身信息外,還包含了一系列無關信息和噪聲。因此,在結合化學計量學方法建立模型時,利用譜圖預處理方式消除光譜數(shù)據中無關信息與噪聲,提取與化學組成相關的信息對提高模型的準確率十分關鍵。
本試驗采用6種光譜預處理方式:平滑;平滑+歸一化;一階導數(shù)+平滑;一階導數(shù)+平滑+歸一化;二階導數(shù)+平滑;二階導數(shù)+平滑+歸一(“+”表示光譜預處理方式結合),分別形成6組數(shù)據矩陣,再代入試驗模型中進行調試和篩選。
1.2.5 利用遺傳算法進行建模波段的篩選 遺傳算法(GeneticAlgorithm,簡稱GA)是一種自適應的全局的概率搜索算法,通過選擇、交換和突變等遺傳操作,模擬生物界的遺傳機制和自然選擇,使目標函數(shù)值中較好的變量被保留下來,從而使結果達到最優(yōu)。在近紅外光譜技術分析領域,遺傳算法常作用于分析對象特征波長的優(yōu)選和組合(劉輝軍等,2008)。
本試驗在光譜預處理后進行遺傳算法篩選特征波長。將光譜總區(qū)間平均分為30個子區(qū)間進行二進制隨機編碼,每個子區(qū)間包含24個數(shù)據點,設置參數(shù):種群大小為50,基因數(shù)為30,變異概率為0.01,交叉概率為0.6,迭代次數(shù)為15代。以預測值與真實值的相關系數(shù)(Correlation Coefficient,簡稱R)、預測均方根偏差(Root Mean Squared Errorof Prediction,簡稱RMSEP)作為模型結果的評價指標。以F=R/RMSEP最大作為優(yōu)化指標,重復遺傳操作至最大繁殖代數(shù)時停止,F(xiàn)越大代表模型的預測能力越強,以F最大時的基因編碼解碼后得到的譜線組合作為最優(yōu)譜線組合(任廣鑫,2012;周明等,1999)。
1.2.6 引入偏最小二乘法建立模型 偏最小二乘法是一種多因變量對多自變量的回歸建模方法,有機結合了模式型和認識型的方法,使以往用普通多元回歸無法解決的問題得到有效的解決。
本試驗使用Matlab數(shù)學軟件,以茶樣的感官審評得分作為建模依據,引入偏最小二乘法,將其與遺傳算法優(yōu)選后的光譜波段信息進行關聯(lián)性分析,建立近紅外光譜信息與茶樣感官審評得分之間的GA-PLS數(shù)學模型(PLS,Partial Least Squares)。
1.2.7 模型的驗證與優(yōu)化 采集驗證集樣品的近紅外光譜數(shù)據作為模型驗證的輸入量,通過模型預測茶樣的品質加權總分,將預測值與感官審評的結果值進行比較分析,來確定茶葉品質的優(yōu)劣。如果PMSEP值越小,R值越大,說明校正模型的預測準確度越高(任廣鑫,2012)。
2.1 近紅外光譜預處理方法的確定與分析
經平滑、平滑+歸一化、一階導數(shù)+平滑、一階導數(shù)+平滑+歸一化、二階導數(shù)+平滑、二階導數(shù)+平滑+歸一化6種預處理后的譜圖見圖1、PLS模型數(shù)據結果見表1。結果表明,在二階導數(shù)+平滑+歸一化條件下,茶樣綜合品質的校正集的相關系數(shù)RC為0.921,預測均方根偏差RMSEC為0.543;驗證集的相關系數(shù)RP為0.913,驗證均方根偏差RMSEP為0.665,其效果優(yōu)于其它預處理方法。因此本試驗采用二階導數(shù)法+平滑+歸一化的光譜預處理方式。
2.2 近紅外光譜波段的選擇
為避免搜索空間過大而影響尋優(yōu)效果,本試驗擬選取部分光譜區(qū)間進行波長篩選。圖1表明,在6 670-4 000 cm-1光譜區(qū)域吸收峰與光譜特征信息較明顯。因此,本試驗選用近紅外光譜數(shù)據6 670-4 000 cm-1作為特征篩選范圍。
表1 不同光譜預處理條件下的安溪鐵觀音茶樣綜合品質得分PLS模型
Table 1 The PLS model of AXTGY tea based on different kinds of spectral pretreatment
光譜預處理校正集RCRMSEC驗證集RPRMSEP平滑0.1851.4350.3881.505平滑+歸一化0.3411.3730.5121.402一階導數(shù)+平滑0.6141.2230.8660.818二階導數(shù)+平滑0.8120.8530.9070.688一階導數(shù)+平滑+歸一化0.9040.6260.9220.636二階導數(shù)+平滑+歸一化0.9210.5430.9130.665
(a)平滑 (b)平滑+歸一化 (c)一階導數(shù)+平滑
(d)一階導數(shù)+平滑+歸一化 (e)二階導數(shù)+平滑 (f)二階導數(shù)+平滑+歸一化
圖1 不同光譜預處理方式處理后的安溪鐵觀音茶樣光譜圖
Figure 1 The spectra of AXTGY tea sample after different spectral pretreatment process
2.3 PLS模型和GA-PLS模型對比分析
試驗中GA-PLS模型將全部譜區(qū)平均分為30個子區(qū)間進行隨機編碼,試驗結果表明(表2),經過遺傳算法優(yōu)選出最佳的譜區(qū)編碼為:101010110111011101010110010010,其中編碼為“1”的基因個數(shù)為17個,表示平均分割的30個子區(qū)間中有17段譜區(qū)被選擇參與GA-PLS模型的建立,每個子區(qū)間包含24個數(shù)據點,即建模點數(shù)為24×17=408(表2)。
經二階導數(shù)+平滑+歸一化處理后,得到茶葉綜合品質得分的PLS模型與GA-PLS模型(表2),PLS模型和GA-PLS模型的RC和RP均在0.9以上,預測均方根偏差RMSEC均小于0.6,模型預測效果好,可用于預測茶葉綜合品質得分。其中PLS模型的校正集的相關系數(shù)RC為0.959、預測均方根偏差RMSEC為0.413、驗證集的相關系數(shù)RP為0.940、驗證均方根偏差RMSEP為0.587。GA-PLS模型的校正集的相關系數(shù)RC為0.959、預測均方根偏差RMSEC為0.413、驗證集的相關系數(shù)RP為0.940、驗證均方根偏差RMSEP為0.587,對比可知GA-PLS模型結果較優(yōu)。其中PLS模型建模波段為1 557,經遺傳算法波段優(yōu)化后的模型GA-PLS建模波段僅為408,建模波段減少,縮小建模運行時間,GA-PLS模型驗證集的相關系數(shù)RP達到0.940,RMSEP為0.587(表2),優(yōu)于PLS模型,精度更高預測效果更佳。
表2 安溪鐵觀音茶樣綜合品質得分PLS和GA-PLS模型
Table 2 The comprehensive quality score PLS and GA-PLS model of AXTGY tea sample
建模方法建模波段最佳染色體校正集RCRMSECF驗證集RPRMSEPFPLS1557全譜段0.9210.5431.6970.9130.6651.375GA-PLS4081010101101110111010101100100100.9590.4132.3220.9400.5871.601
(a) 偏最小二乘模型 (b) 遺傳算法-偏最小二乘模型
圖2 安溪鐵觀音茶樣綜合品質得分PLS和GA-PLS模型的線性回歸散點圖
Figure 2 The linear regression scatterplot of comprehensive quality score PLS and GA-PLS model of AXTGY tea sample
近紅外光譜會受到其他外界因素的影響。在具體運用中,應根據不同目的和樣品體系選擇不同的預處理方式,由于所測得的光譜曲線圖往往伴隨一定的噪聲,本試驗通過平滑預處理改善光譜形狀,提高信噪比(尼珍等,2008)。導數(shù)法能夠有效的消除其他背景的干擾,但是會引入噪音,所以將平滑法與導數(shù)法結合使用,同時運用歸一化法,進一步校正樣品因顆粒散射和樣品稀疏而引起的光譜信息誤差。將平滑法、導數(shù)法和歸一化法結合使用,能夠有效的對近紅外光譜進行預處理,滿足其適用性。
在建立近紅外光譜校正模型時,對于樣品的選擇應具有一定的代表性和廣泛性。為了提高模型的校正效果和應用范圍,應充分考慮茶樣的產地范圍、品質等級等因素。本試驗將茶樣根據品質高中低進行排序,選取茶樣數(shù)量,以含量梯度法劃分訓練集和預測集。但是茶樣收集存在一定難度,無法收集全部樣品,使得所建模型存在局限性。
本試驗結果表明,綜合品質得分GA-PLS模型相關系數(shù)R達到0.959,預測均方根偏差RMSEP為0.413,能夠較準確評判安溪鐵觀音品質。但該方法仍存在樣品收集復雜、參數(shù)設定憑經驗等問題。因此,在今后的科研工作中,需要我們進一步研究和優(yōu)化近紅外光譜模型,完善茶葉快速無損檢測體系,促進我國茶產業(yè)的標準化進程。
段焰青,陶鷹,者為,等,2011.近紅外光譜分析技術在煙葉產地鑒別中的應用[J].云南大學學報(自然科學版),33(1):77-82.
馮花,郭雅玲,2010.茶葉感官審評方法及其新發(fā)展[J].福建茶葉,32(7):28-31.
傅志民,2005.茶葉感官審評存在的不足和改進建議[J].中國茶葉加工,1:16-17.
劉發(fā)龍,馬新剛,程福銀,等,2008.近紅外光譜分析技術在快速分析上的應用[J].分析測試技術與儀器,,14(4):241-247.
劉輝軍,林敏,施秧,等,2008.遺傳算法在綠茶葉近紅外光譜分析中波長選擇的應用[J].理化檢驗(化學分冊),44(3):249-251.
李艷肖,黃曉瑋,鄒小波,等,2015.蟻群和遺傳算法優(yōu)化花茶花青素近紅外光譜預測模型的比較[J].食品與生物技術學報,34(6):575-583.
尼珍,胡昌勤,馮芳,2008.近紅外光譜分析中光譜預處理方法的作用及其發(fā)展[J].藥物分析雜志,05:824-829.
任廣鑫,2012.基于近紅外分析技術的紅茶成分分析與產地識別的研究[D].安徽:安徽農業(yè)大學.
王勝鵬,宛曉春,林茂先,等,2011.基于水分、全氮量和粗纖維含量的茶鮮葉原料質量近紅外評價方法[J].茶葉科學,31(1):66-71.
許瓊,馬國欣,2007.近紅外光譜技術在化學分析方面的應用進展[J].中國高新技術企業(yè),3:123-124.
周明,孫樹棟,1999.,遺傳算法原理及應用[M].北京:國防工業(yè)出版社,1-202.
鄒小波,趙杰文,2007.用遺傳算法快速提取近紅外光譜特征區(qū)域和特征波長[J].光學學報,27(7):1 316-1 321.
(責任編輯:陳曉雯)
The quality evaluation of Anxi Tieguanyin tea based on near-infrared spectroscopy combined with genetic algorithm
XIA Jin-Mei1,2, SUN Wei-Jiang2, LIN Tao1, YOU Yong1, ZENG Zhao-Hua1, WANG Bing-Yu2
(1.PesticideEnvironmentalSafetyAssessmentCenter,InstituteofPlantProtection,F(xiàn)ujianAcademyofAgriculturalSciences,F(xiàn)uzhou,Fujian350002,China;2.CollegeofHorticulture,F(xiàn)ujianAgricultureandForestryUniversity,F(xiàn)uzhou,F(xiàn)ujian350002,China)
To evaluate the quality of Anxi Tieguanyin (AXTGY) tea by unified standards, the present experiment studied the characterization of AXTGY tea using near-infrared spectroscopy and genetic algorithm. AXTGY tea was collected as the research materials, and genetic algorithm (GA) combined with partial least squares (PLS) was used for building the mathematical analysis model to analyse the quality of AXTGY tea. The results of comprehensive quality score determination model showed that the PLS model displayed the highest prediction performance after spectrum being processed by smoothing, the second derivative and normalized methods. Statistic results of PLS model:Rp=0.913, RMSEP=0.665.NIR spectra ranged from 6 670 to 4 000 cm-1were selected, using GA to select characteristic wavelength and then to construct GA-PLS calibration model which has higher predictive power and precision. Statistic results of GA-PLS model wereRC=0.959, RMSEC=0.413,RP=0.940, RMSEP=0.587.
near-infrared spectroscopy; genetic algorithm; partial least squares method; Anxi Tieguanyin tea; quality score
2016-07-19; 發(fā)表日期: 2016-10-31
福建省自然科學基金(2016J01139); 福建省省屬公益類科研院所專項(2014R1024-6,2016R1023-9)。
夏金梅(1993-),女,本科,研究實習員。研究方向:農藥環(huán)境毒理。Email:1083647947@qq.com。
O657.33; S132
A
1001-4276-(2016)01-0132-06
夏金梅,孫威江,林濤,等,2016.基于近紅外光譜技術結合遺傳算法的安溪鐵觀音品質評價[J].武夷科學,32:132-137.