王化
摘 要:為了彌補傳統(tǒng)茶葉審評方法的不足,該文提出了一種基于高光譜技術的方法來識別茶葉品種。該方法能充分利用茶葉的內(nèi)部成分和外觀特征來綜合識別茶葉品種。采集茶葉的高光譜數(shù)據(jù),提取其顏色特征、紋理特征、光譜特征,結合支持向量機方法建立識別模型。結果表明,品種識別準確率最高可達100%,驗證了高光譜技術的優(yōu)越性。
關鍵詞:高光譜 特征提取 茶葉 品種識別
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1674-098X(2017)03(c)-0101-02
目前茶葉的假冒現(xiàn)象時常發(fā)生,茶葉市場混亂,對茶葉貿(mào)易造成了不良影響,嚴重損害了消費者利益。如何快速、準確地辨別茶葉真假已經(jīng)成為消費者和生產(chǎn)者的迫切需要。
傳統(tǒng)的茶葉檢測方法主要是人為的感官審評和理化檢測,這些方法主觀性強、影響因素多,缺點較多。對此,電子鼻、電子舌、機器視覺技術、光譜技術等無損檢測技術被應用,人們根據(jù)茶葉內(nèi)部成分或者外部品質(zhì)來識別茶葉。但是以上方法不能對茶葉內(nèi)外品質(zhì)綜合判斷,容易失去部分信息,影響識別結果。近年來,高光譜成像技術研究成為熱點。它把二維成像技術和光譜技術結合,同時獲取待測物質(zhì)的內(nèi)外信息,客觀快速地分析待測物質(zhì)。該文以龍井茶葉為研究對象,利用高光譜數(shù)據(jù)提取其顏色、紋理、光譜特征,結合支持向量機方法(SVM),建立基于光譜特征、圖像特征和二者融合的龍井茶葉品種識別模型,分析對比模型效果,確立基于高光譜技術的龍井茶葉品種識別的最優(yōu)模型[1]。
1 材料與方法
1.1 實驗數(shù)據(jù)采集
材料選用浙江省杭州市汾口鎮(zhèn)的中茶108、龍井43號以及鳩坑群體種3種龍井鮮葉,采集后于當天送往實驗室。實驗的高光譜數(shù)據(jù)采集系統(tǒng)主要包含SOC710VP高光譜成像光譜儀、2個250 W的Pro-light室內(nèi)高光譜照明、計算機等。其中SOC710VP高光譜成像光譜儀內(nèi)置掃描裝置、CCD和光譜儀,波長范圍400~1 000 nm、光譜分辨率4.68 nm。
實驗在暗室中進行,稱取20 g茶葉作為一個樣本,均勻地平鋪在黑色培養(yǎng)皿中。為保證高光譜圖像清晰,采樣前反復調(diào)節(jié),每種茶葉樣本采集200組,共得到600組大小為520×696×128的高光譜數(shù)據(jù)。
1.2 特征提取與建模
高光譜數(shù)據(jù)是一個三維數(shù)據(jù)塊,同時包含了樣本的圖像信息和光譜信息,涵蓋茶葉樣本的內(nèi)外信息。但是,高光譜數(shù)據(jù)量過大以及波段之間相關性強,三維數(shù)據(jù)塊之間存在大量的冗余信息,因此,高光譜數(shù)據(jù)的降維對于提高識別模型的識別速率和準確率是非常有效的。主成分分析(PCA)是目前應用最廣泛的降維方法之一。經(jīng)過PCA變換的高光譜數(shù)據(jù)只需少量的主成分就可以盡可能多地表征原始信息[2]。
在數(shù)字圖像處理中,物體的顏色、形狀和紋理是最常用的3種自然屬性,可以用來描述茶葉的外觀品質(zhì),不同品種茶葉甚至同一品種的不同等級茶葉的這些屬性都有差別。單片茶葉的形狀隨機性太大,因此,該文選擇顏色特征和紋理特征作為識別特征。顏色特征是茶葉品種識別的重要影響因子。為了定量描述并全面評價茶葉顏色,結合最常用的RGB模型和HSI模型提取紅色R、綠色G、藍色B、色調(diào)H、飽和度S、亮度I作為顏色特征。茶葉的紋理屬于自然紋理,一般采用統(tǒng)計分析方法。該文通過灰度共生矩陣(GLCM)方法提取對比度、相關性、能量、同質(zhì)性、熵共5個紋理特征[3]。
植被的內(nèi)部結構特征和化學特性對不同波長的光譜有不同的光譜響應。植被光譜具有一些反射特性明顯的獨特譜帶,這些特征譜帶包含的信息量較大、代表性強、能反映不同物種之間的差異。該文應用特征光譜位置參數(shù)(“三邊”位置)結合植被指數(shù)(比值植被指數(shù)、差值植被指數(shù)和歸一化差值植被指數(shù))作為光譜特征來識別龍井茶葉品種[4]。
2 結果分析
截取高光譜數(shù)據(jù)100×100×128大小的感興趣區(qū)域(ROI)作為PCA,3種茶葉的前兩幅主成分圖像的累計貢獻率均有90%以上,代表每個樣本圖像的大多數(shù)高光譜信息。因此,將PC1和PC2作為特征圖像,設定像元距離為1,在0°、45°、90°、135°4個方向上構造GLCM,提取40個紋理特征。利用高光譜成像儀配套的SRAnal710軟件提取茶葉的RGB圖像,再提取ROI的6個顏色特征。中茶108的主成分圖像和RGB圖如圖1所示。
高光譜圖像每一個像素點都包含所有波長下的光譜信息,為了使光譜信息更具有代表性,提取指定ROI的100×100個像素點的平均光譜信息作為該茶葉樣本的反射光譜,如圖2所示。基于反射光譜提取“紅邊”“黃邊”“藍邊”、RVI、DVI、NDVI共6個光譜特征。
將以上52個特征作為輸入向量,利用SVM建立識別模型。SVM的識別模型受核函數(shù)影響較大,選取常用的線性核函數(shù)、RBF核函數(shù)和sigmoid核函數(shù),對比識別結果。此外,用交叉驗證法確定懲罰系數(shù)C、gamma參數(shù)等多個影響因子的最佳參數(shù)。模型的評價標準由識別準確率(正確識別的種類數(shù)量/所有樣本數(shù)量)給定。結果如圖3所示。
該文充分利用高光譜數(shù)據(jù),提取圖像和光譜特征作為龍井茶葉的品種識別特征。模型的平均準確率在99%左右,最高甚至達到100%,因此,利用高光譜技術識別龍井茶葉的品種是可行的,為今后茶葉市場的正規(guī)交易提供了技術支持。
參考文獻
[1] 吳瑞梅.名優(yōu)綠茶品質(zhì)感官評價的儀器化表征研究[D].江蘇大學,2012.
[2] 湯守鵬,姚鑫鋒,姚霞,等.基于主成分分析和小波神經(jīng)網(wǎng)絡的近紅外多組分建模研究[J].分析化學,2009,37(10):1445-1450.
[3] 吳瑞梅,吳彥紅,艾施榮,等.茶葉外形品質(zhì)的高光譜圖像量化分析[J].江西農(nóng)業(yè)大學學報,2013,35(2):413-418.
[4] 蔣帆,喬欣,鄭華軍,等.基于高光譜分析技術的機炒龍井茶等級識別方法[J].農(nóng)業(yè)工程學報,2011(7):343-348.