童陽 艾施榮 吳瑞梅 何國泉 虞文俊 劉鵬 胡瀟 裴剛
摘要:為摒棄茶葉品質(zhì)感官評審方法存在的主觀性和經(jīng)驗性等缺陷,研究采用計算機視覺技術(shù)快速評價茶葉感官品質(zhì)。依據(jù)碧螺春茶行業(yè)標準及茶葉評審師的評審結(jié)果,將20個不同品質(zhì)碧螺春綠茶樣本分成4個等級。采用小波變換和灰度共生矩陣提取茶葉圖像的紋理特征,采用RGB[R表示紅色(red),G表示綠色(green),B表示藍色(blue)]和HIS[H表示色調(diào)(hue),I表示亮度(intensity),S表示色飽和度(saturation)]顏色模型提取圖像的顏色特征,利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù),建立茶葉感官品質(zhì)的BP(back propagation,逆向傳播)神經(jīng)網(wǎng)絡(luò)分級模型,并與其他模型結(jié)果進行比較。結(jié)果表明,當選用前5個主成分時,所建立的模型識別精度最高,該模型總體識別率為938%,Kappa系數(shù)為0.933,較PCA-BP、GA-BP、BP識別精度分別提高10.0、6.3、18.8百分點,Kappa系數(shù)分別提高0.133、0.066、0.233,模型穩(wěn)定性得到提高。
關(guān)鍵詞:計算機視覺;茶葉感官品質(zhì);小波變換;神經(jīng)網(wǎng)絡(luò);遺傳算法
中圖分類號: TS207.3;S126? 文獻標志碼: A? 文章編號:1002-1302(2019)05-0170-04
收稿日期:2018-03-21
基金項目:國家自然科學(xué)基金(編號:31460315);江西省重點研發(fā)計劃(編號:20171ACF60004)。
作者簡介:童 陽(1993—),男,江西高安人,碩士研究生,主要從事計算機視覺研究。E-mail:tongyang_1@sina.com。
通信作者:艾施榮,碩士,副教授,碩士生導(dǎo)師,主要從事計算機視覺研究。E-mail:aisrong@163.com。
茶葉是一種深受消費者喜愛的保健飲料,但一直以來茶葉品質(zhì)仍由品茶師評價,帶有一定的主觀性,易受品茶師經(jīng)驗、生理狀況、外界環(huán)境等因素影響,難以監(jiān)控茶葉市場,導(dǎo)致茶葉市場售價混亂、假冒偽劣等現(xiàn)象出現(xiàn)。
計算機視覺技術(shù)已被廣泛運用于茶葉品質(zhì)快速檢測。Laddi等建立了茶葉品質(zhì)的計算機視覺感官品質(zhì)評價模型[1];Dong等采用基于與專家感官評分極顯著相關(guān)的特征變量,建立了茶葉外觀品質(zhì)的計算機視覺評估模型[2];余洪等根據(jù)專家評審得分值,將72個茶葉樣本分成4個分級,通過提取干茶葉的紋理和顏色特征,建立了茶葉品質(zhì)的計算機視覺分級評價模型[3];常春等運用計算機視覺技術(shù)提取茶樣圖像的紋理及幾何特征,建立了不同種類茶葉的人工神經(jīng)網(wǎng)絡(luò)識別模型[4]。而目前的研究主要提取茶葉圖像的時域特征或區(qū)域特征,當分辨率較低時,圖像的紋理特征區(qū)別不明顯,且少量特征無法較完整地刻畫圖像特征,識別率較低,如要追求高識別率,須增大特征維度,這樣會增加模型的復(fù)雜度[5]。小波變換可實現(xiàn)多分辨率,在降低分辨率的情況下不丟失圖像的原始信息,已被成功應(yīng)用于醫(yī)學(xué)影像診斷[6]、農(nóng)作物病蟲害檢測[7]等來提高識別率,也有報道將其用于提取茶葉圖像紋理特征。Wang等利用小波變換提取干茶葉的紋理特征,結(jié)合顏色特征參數(shù),建立了茶葉種類識別模型[8]。Borah等利用小波變換提取茶葉的紋理特征圖像,建立茶葉種類識別模型,其識別準確率高于使用基于統(tǒng)計矩的紋理特征的結(jié)果[9]。目前已有的研究的主要方法是基于提取的茶葉紋理統(tǒng)計矩特征建立茶葉品質(zhì)評價模型。而小波分析較統(tǒng)計矩具有多分辨率分析以及在時域和頻域同時表征原始圖像局部特征信息的優(yōu)點,被廣泛用于農(nóng)業(yè)科技、生物信息等領(lǐng)域的模型建立。
本研究根據(jù)茶葉評審師對茶樣的評分結(jié)果,將茶樣分為4個等級。利用小波分析和灰度共生矩陣方法提取茶葉圖像的紋理特征,應(yīng)用遺傳算法(genetic algorithm,簡稱GA)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)參數(shù),建立茶葉外形感官品質(zhì)的計算機視覺分級模型,為茶葉品質(zhì)的儀器化快速評價奠定基礎(chǔ)。
1 材料與方法
1.1 茶葉樣本及感官品質(zhì)評價
試驗選用20個不同品質(zhì)的蘇州洞庭山碧螺春茶葉樣本,每個樣本250 g。茶葉感官評價由安徽農(nóng)業(yè)大學(xué)茶學(xué)系4位評茶師完成,根據(jù)碧螺春茶農(nóng)業(yè)行業(yè)標準(NY/T 863—2004《碧螺春茶》)和茶葉感官審評標準(GB/T 23776—2009《茶葉感官評審方法》)進行評定,位于90~99分的為一級,位于 80~89分的為二級,位于70~79分的為三級,位于60~69分的為四級。
1.2 茶葉圖像采集
茶葉可見光圖像采集系統(tǒng)如圖1所示,該裝置由圖像采集卡、CCD(電荷耦合器件)攝像頭、采集暗箱、光源和計算機等組成。采集暗箱內(nèi)部用黑色幕布密閉,采用飛利浦白熾燈為暗箱內(nèi)部光源,其色溫為2 800 K左右,光源安裝在暗箱上部左右兩側(cè),形成一個漫反射光照系統(tǒng)。分別從每個茶樣中稱取(10±0.5) g茶葉,將其均勻平鋪在自制茶樣盒中,茶樣盒規(guī)格為60 mm×60 mm×10 mm,內(nèi)部為黑色,以消除光線反射對圖像采集的影響。從原始圖像中心位置截取200×200像素感興趣的區(qū)域為特征提取的目標圖像。以上圖像采集過程于2017年7月在筆者所在實驗室完成。
1.3 圖像特征提取
1.3.1 基于小波分析的圖像特征提取 小波分析是一種空間(時間)和頻率上的局部變換,具有多分辨率分析以及在時域和頻域同時表征原始圖像局部特征信息等優(yōu)點,原始圖像經(jīng)小波變換后,把低頻信息保存在圖像中,將原始圖像的高頻信息分水平、垂直和對角方向保存到另外3個獨立的圖像中,同時表征出圖像的時域和頻域特征信號。小波函數(shù)由1個小波基函數(shù)經(jīng)過平移與尺寸伸縮得到,小波分析就是把信號分解成一系列小波函數(shù)的疊加。利用小波分析提取茶葉圖像特征的具體步驟如下:首先將茶葉原始圖像進行小波分解,得到原始圖像的子圖像,對子圖像用小波繼續(xù)分解成不同尺度的低頻和高頻子圖像,然后分別求出各分解高頻子圖像的平均灰度、標準方差和三階矩陣作為茶葉圖像的紋理特征信息。其中,紋理特征提取效果主要取決于小波基和分解層數(shù)選擇[10],參照文獻[7],本研究經(jīng)多次分析,使用sym4和db4為小波基函數(shù),兩者結(jié)合能較全面地提取茶葉的紋理特征。小波分解層數(shù)并不是越多越好,經(jīng)多次反復(fù)試驗,第3層各分量能反映茶葉圖像紋理的整體概貌,但不能表達圖像的紋理特征。所以對原圖像進行2層小波分解。圖2是經(jīng)過sym4和db4小波分解后的低頻和高頻分量,高頻分量分別表現(xiàn)了水平(HL)、垂直(LH)、對角(HH)3個方向的紋理細節(jié)信息,低頻分量表現(xiàn)圖像的主要信息,提取了48個小波紋理特征。
1.3.2 灰度共生矩陣紋理特征提取 灰度共生矩陣能很好地反映茶葉圖像的紋理特性[11]。參照文獻[3],采用灰度共生矩陣提取茶葉圖像的16個紋理特征值:0°慣性矩、45°慣性矩、90°慣性矩、135°慣性矩、0°相關(guān)性、45°相關(guān)性、90°相關(guān)性、135°相關(guān)性、0°能量、45°能量、90°能量、135°能量、0°同質(zhì)性、45°同質(zhì)性、90°同質(zhì)性、135°同質(zhì)性。
1.3.3 顏色特征提取 本研究選用RGB[R表示紅色(red),G表示綠色(green),B表示藍色(blue)]和HIS[H表示色調(diào)(hue),I表示亮度(intensity),S表示色飽和度(saturation)]這2種顏色模型表征茶葉的色澤特征[12],提取的顏色特征如下:基于RGB模型的紅體標準差、紅體均值、綠體標準差、綠體均值、藍體標準差、藍體均值以及基于HIS模型的色調(diào)標準差、色調(diào)均值、亮度標準差、亮度均值、飽和度標準差以及飽和度均值,共12個顏色特征。
1.4 算法原理
BP(back propagation,逆向傳播)神經(jīng)網(wǎng)絡(luò)具有自我學(xué)習(xí)能力、自適應(yīng)和并行處理等優(yōu)點,能很好地處理從輸入到輸出的非線性復(fù)雜問題。但該算法的初始化權(quán)值是隨機的,容易陷入局部極小化[13],當網(wǎng)絡(luò)規(guī)模不斷增加時,學(xué)習(xí)時間顯著增加,且學(xué)習(xí)過程中隱藏層的節(jié)點數(shù)及其他參數(shù)憑經(jīng)驗或通過大量計算得出,收斂時間長,魯棒性差。所以,模型建立前,對BP神經(jīng)網(wǎng)絡(luò)參數(shù)進行必要的優(yōu)化。
遺傳算法是一種模仿自然進化算法,在進化過程中,其后生代種群更能適應(yīng)環(huán)境,且末代種群中的最優(yōu)個體通過解碼后,可作為所求解問題的近似最優(yōu)解。
本研究使用GA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)參數(shù)值(初始權(quán)值和閾值),使優(yōu)化結(jié)果不僅朝著全局最優(yōu)方向進行迭代,還能在接近權(quán)值時,得到最優(yōu)的網(wǎng)絡(luò)拓撲結(jié)構(gòu),如此往復(fù),可跳出極值,加快收斂,達到最優(yōu)解。
茶葉圖像特征共提取了76個特征,包括12個顏色特征和64個紋理特征(小波48個,灰度共生矩陣16個),這些特征相互之間存在冗余信息,在優(yōu)化前,應(yīng)用主成分分析法(PCA)對原始數(shù)據(jù)進行降維。用主成分分析法結(jié)合遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法,具體優(yōu)化步驟如圖3所示。
2 結(jié)果與分析
2.1 茶葉感官評價結(jié)果分析
運用Pearson相關(guān)分析法對所有茶葉評審師的評審結(jié)果進行一致性分析。由表1可知,4位專業(yè)茶葉評審師的評審得分結(jié)果具有極顯著的線性相關(guān)性(P<0.01),表明4位茶葉評審師對茶葉品質(zhì)的評價結(jié)果具有顯著的一致性。
參照碧螺春茶農(nóng)業(yè)行業(yè)標準(NY/T 863—2004《碧螺春茶》),依據(jù)評審師的評分結(jié)果,將20個茶葉樣本分為4個等級,如表2所示,其中1,2,……,20分別表示每個茶樣的編號。將每個等級的茶樣隨機均分為6等份,其中4等份作為訓(xùn)練集,剩余2等份作為預(yù)測集,即訓(xùn)練集樣本數(shù)為80,預(yù)測集樣本數(shù)為40。
2.2 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)參數(shù)
本研究采用輸入層、隱含層和輸出層3層BP網(wǎng)絡(luò)結(jié)構(gòu),將主成分因子數(shù)作為網(wǎng)絡(luò)的輸入,而主成分數(shù)的多少對模型結(jié)果影響很大。
研究采用不同主成分數(shù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入,比較不同主成分數(shù)所建模型的識別結(jié)果,模型識別精度高的為最優(yōu)模型。選用雙極S型函數(shù)tansig()為網(wǎng)絡(luò)傳遞函數(shù);雙極S型函數(shù)logsig()為輸出層函數(shù);訓(xùn)練函數(shù)選用trainlm();訓(xùn)練最大迭代數(shù)為2 000次;學(xué)習(xí)率為0.1,訓(xùn)練誤差為0.001,遺傳算法初始種群數(shù)為50個,最大遺傳代數(shù)為80,變異概率設(shè)為0.05,交叉概率設(shè)為0.85。
從圖4可以看出,當主成分數(shù)為5個時,網(wǎng)絡(luò)模型總體識別率最高。由圖5可知,當遺傳代數(shù)達到67代時,其權(quán)值和閾值不變,為最優(yōu)值。
2.3 模型識別結(jié)果
利用優(yōu)化結(jié)果建立茶葉等級的BP神經(jīng)網(wǎng)絡(luò)分級模型,
模型對訓(xùn)練集樣本和預(yù)測集樣本的識別結(jié)果分別見表3和表4。由表3、表4可知,模型對訓(xùn)練集的總體識別率為95%,對測試集的總體識別率為92.5%,在訓(xùn)練集中,1個一級茶樣被誤判為二級,2個二級茶樣被誤判為一級,1個二級茶樣被誤判為三級;測試集中1個一級茶樣被誤判為二級,1個二級茶樣被誤判為一級,1個二級被誤判為三級。根據(jù)碧螺春茶感官評語,一級是纖細卷曲成螺、白毫披覆、勻整、銀綠隱翠、勻凈;二級是緊細卷曲成螺、白毫披露、勻整、銀綠顯翠、勻凈;三級是緊細卷曲成螺、白毫顯露、勻尚整、綠翠、勻尚凈;四級是緊結(jié)卷曲成螺、白毫尚顯、尚勻整、綠潤、尚勻凈??梢钥闯?,一級與二級、二級與三級的評判術(shù)語相差甚微,且評茶師對茶樣品質(zhì)的評判結(jié)果帶有一定主觀性,導(dǎo)致不同級別之間相互誤判。
2.4 模型性能比較
識別率和Kappa系數(shù)常用于衡量模型的性能,Kappa系數(shù)用于一致性檢驗,是衡量模型分類器穩(wěn)定性的重要指標,Kappa系數(shù)越大,分類精度越高,表示分類器越穩(wěn)定[14]。表5是建立的不同模型識別結(jié)果,可以看出,PCA-GA-BP模型的識別率和Kappa系數(shù)最高,未經(jīng)任何優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)的識別率和Kappa系數(shù)最低,效果最差。經(jīng)主成分分析和遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)總體識別率達到93.8%,較其他3個模型分別高出10.0、6.3、18.8百分點。Kappa系數(shù)也位于0.81~1.00之間,分別高出其他3個模型0.133、0.066、0.233。由此可見,本研究所建立的PCA-GA-BP神經(jīng)網(wǎng)絡(luò)模型具備較高的識別精度和穩(wěn)定性。
3 結(jié)論
本研究運用小波變換和灰度共生矩陣提取茶葉圖像紋理特征,建立茶葉感官品質(zhì)的計算機視覺分級模型。在模型建立過程中,使用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的參數(shù)。采用前5個主成分建立的BP神經(jīng)網(wǎng)絡(luò)模型識別率和Kappa系數(shù)最佳,高于PCA-BP、GA-BP和BP神經(jīng)網(wǎng)絡(luò)模型的,表明該方法具有較高的穩(wěn)定性。研究結(jié)果可為茶葉品質(zhì)的快速檢測儀器化研制提供參考。
參考文獻:
[1]Laddi A,Sharma S,Kumar A,et al. Classification of tea grains based upon image texture feature analysis under different illumination conditions[J]. Journal of Food Engineering,2013,115(2):226-231.
[2]Dong C W,Zhu H K,Zhao J W,et al.Sensory quality evaluation for appearance of needle-shaped green tea based on computer vision and nonlinear tools[J]. Journal of Zhejiang University-Science B:Biomedicine & Biotechnology,2017,18(6):544-548.
[3]余 洪,吳瑞梅,艾施榮,等. 基于PCA-PSO-LSSVM的茶葉品質(zhì)計算機視覺分級研究[J]. 激光雜志,2017,38(1):51-54.
[4]常 春,陳怡群,肖宏儒,等. 基于神經(jīng)網(wǎng)絡(luò)圖像分析的智能鮮茶葉分選機[J]. 中國農(nóng)機化學(xué)報,2013,34(1):137-141.
[5]肖志云,劉 洪. 小波域馬鈴薯典型蟲害圖像特征選擇與識別[J]. 農(nóng)業(yè)機械學(xué)報,2017,48(9):24-31.
[6]彭慶濤,吳水才,高宏建,等. 基于小波分析和灰度紋理特征的乳腺X線圖像微鈣化點區(qū)域的提取[J]. 北京生物醫(yī)學(xué)工程,2015,34(5):462-467,488.
[7]孔喜梅,木拉提·哈米提,嚴傳波,等. 基于小波變換的新疆地方性肝包蟲CT圖像分類研究[J]. 生物醫(yī)學(xué)工程研究,2016,35(3):162-167,174.
[8]Wang S H,Phillips P,Liu A J,et al. Tea category identification using computer vision and generalized eigenvalue proximal SVM[J]. Fundamenta Informaticae,2017,151(1/2/3/4):325-339.
[9]Borah S,Hines E L,Bhuyan M. Wavelet transform based image texture analysis for size estimation applied to the sorting of tea granules[J]. Journal of Food Engineering,2007,79(2):629-639.
[10]Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision,2004,60(2):91-110.
[11]Tang Z,Su Y C,Er M J,et al. A local binary pattern based texture descriptors for classification of tea leaves[J]. Neurocomputing,2015,168:1011-1023.
[12]吳瑞梅,吳彥紅,艾施榮,等. 茶葉外形品質(zhì)的高光譜圖像量化分析[J]. 江西農(nóng)業(yè)大學(xué)學(xué)報,2013,35(2):413-418.
[13]孫 麗. 基于遺傳算法BP神經(jīng)網(wǎng)絡(luò)的多目標優(yōu)化方法[J]. 激光雜志,2016,37(8):123-128.
[14]徐樹良,王俊紅. 基于Kappa系數(shù)的數(shù)據(jù)流分類算法[J]. 計算機科學(xué),2016,43(12):173-178.陳玉梅,申允德,張成浩. 黃瓜自動化栽培系統(tǒng)研究進展[J]. 江蘇農(nóng)業(yè)科學(xué),2019,47(5):174-180.