馮麗娟,李秀娟,文成林
(河南工業(yè)大學電氣工程學院,河南鄭州 450001)
基于稀疏表示的小麥品種識別
馮麗娟,李秀娟*,文成林
(河南工業(yè)大學電氣工程學院,河南鄭州 450001)
利用機器視覺判別農(nóng)作物品種的應用日趨增多,為了提高糧食品種的識別率,提出利用稀疏表示的方法識別小麥品種。首先選擇內(nèi)鄉(xiāng)188、鄭麥9023、優(yōu)展1號、豫麥47這4種不同類型的小麥品種,每種小麥隨機選取200粒,選擇其中40粒作為訓練樣本,提取可以區(qū)別不同類型小麥的顏色、形態(tài)和紋理特征參數(shù)作為小麥籽粒的典型特征,用來組建稀疏表示方法的所需字典;然后選擇其中一種小麥品種作為測試樣本,通過Matlab仿真計算每一個測試樣本在字典上的投影,將投影誤差最小的類作為測試樣本的所屬類別;最后對比和分析稀疏表示方法與BP神經(jīng)網(wǎng)絡方法對小麥品種的識別結果。仿真表明,稀疏表示方法對于4種小麥品種識別準確率達到96.7%,獲得了很好的分類效果,是一種可以準確識別小麥品種的有效方法。
小麥分類;圖像處理;稀疏表示
小麥作為主要糧食作物,在滿足人們的膳食要求和保證糧食安全方面具有舉足輕重的地位。河南是小麥主產(chǎn)區(qū),小麥的品種識別及分類直接影響加工品質(zhì)。目前主要采用人的感官從外形、色澤等方面進行綜合評價,存在方法繁瑣、主觀性強、效率低等缺點,增加了小麥品種分類的不確定性。當前,隨著計算機技術的迅速發(fā)展,機器視覺得以廣泛應用于農(nóng)產(chǎn)品品質(zhì)檢測和分類中,為農(nóng)業(yè)實行高效生產(chǎn)提供保障。陳建等[1]利用近紅外光譜技術和人工神經(jīng)網(wǎng)絡對4種玉米品種進行識別。周子立等[2]利用小波變換提取紅外光譜特征,輸入人工神經(jīng)網(wǎng)絡,對3種大米進行識別。LIU Changchun[3]等提取60種顏色和形態(tài)特征識別5種大米,結果表明大米識別率平均在91%以上。王志軍[4]等利用分水嶺算法和人工神經(jīng)網(wǎng)絡建立小麥粒徑外觀品質(zhì)評價模型,識別率達到93%。YUN Hongsun[5]等提出能夠準確分級谷粒的算法,對不同種類谷物制粉率檢測的準確度在95%左右,2 min就可一次性完成200顆谷粒的分級。何勝美[6]等利用小麥形態(tài)和顏色特征對來自4個地區(qū)的7種春小麥進行品種和來源地的識別,品種識別率平均95%,來源地識別率87.5%。與人類的視覺相比,機器視覺代替人工進行品種鑒別具有以下優(yōu)點:(1)多參數(shù)測量,綜合評判分類;(2)降低人的主觀因素影響,實現(xiàn)自動化; (3)降低檢驗誤差,提高準確度和精度。
近年來,稀疏表示[7]是模式識別領域一個非常重要的研究成果,它是一種基于最小化范數(shù)的優(yōu)化方法,成功地應用在機器視覺中并取得了許多研究成果。
文中選取4種小麥籽粒(內(nèi)鄉(xiāng)188、鄭麥9023、優(yōu)展1號、豫麥47號)的圖像作為研究對象,提取顏色、形態(tài)和紋理特征參數(shù),利用稀疏表示方法進行4類小麥品種的識別,采用Matlab進行仿真并與BP神經(jīng)網(wǎng)絡方法對比,證明了文中結論的有效性。
試驗樣本選用內(nèi)鄉(xiāng)188、鄭麥9023、優(yōu)展1號和豫麥47這4種小麥籽粒圖像作為研究對象。每種小麥取200粒樣本,隨機選取其中40粒作為訓練樣本,剩余160粒作為測試樣本。
圖1是所選的4類小麥品種籽粒的圖像。從圖中可以看出,4種小麥品種籽粒分別具有不同的顏色、形態(tài)以及紋理特征;而對于同一品種的小麥籽粒,這3種特征也會出現(xiàn)差異。例如,鄭麥9023小麥品種籽粒總體呈現(xiàn)細長型,但是也有不少小麥籽粒形態(tài)特征會接近于豫麥47或者優(yōu)展1號,這樣就使得人為區(qū)分小麥品種的難度進一步增大,導致識別率降低。
圖1 4類小麥品種籽粒Fig.1 Four types of wheat grains
2.1 小麥特征參數(shù)提取與計算
2.1.1 小麥籽粒顏色特征計算國內(nèi)外利用顏色特征在谷物檢測和識別方面展開了廣泛研究[8-9]?!癛GB和HIS顏色模型”是數(shù)字圖像處理中常用的顏色模型。本試驗把RGB模型和HIS模型聯(lián)合起來共同提取小麥籽粒的顏色特征。用籽粒顏色的紅色分量、綠色分量、藍色分量、色度分量、飽和度分量和亮度分量的平均值來表示其顏色特征,滿足了小麥品種識別對籽粒顏色特征的多參數(shù)測量要求,公式如下:
小麥籽粒顏色特征在一定程度上可以反映小麥質(zhì)量的好壞,因此顏色信息可以作為小麥識別的一個重要特征參數(shù)。從表1可以看出,內(nèi)鄉(xiāng)188、優(yōu)展1號和豫麥47的紅色分量值明顯大于鄭麥9023的紅色分量值;內(nèi)鄉(xiāng)188和鄭麥9023之間的綠色分量差別最大;鄭麥9023的色調(diào)值最大。綜上可知,各小麥品種對應的小麥顏色特征存在差異,所以把小麥的顏色參數(shù)用于小麥品種分類是可行的。
表1 4種小麥品種顏色特征參數(shù)Tab.1 Color feature parameters of four kinds of wheat
2.1.2 小麥籽粒形態(tài)特征計算不同品種的小麥,外形差異是它們之間區(qū)別的重要特征之一。形態(tài)特征參數(shù)的選取沒有統(tǒng)一規(guī)定,只要能夠有效區(qū)分物體的形態(tài)差異,并且能方便快速獲取的參數(shù)可作為形態(tài)特征參數(shù)。參照以往研究,選取周長、面積、矩形度、圓形度、伸長度5個參數(shù)。小麥籽粒的形態(tài)特征表示如下:
式中:A為小麥籽粒的面積;L為小麥籽粒的周長;a為長軸;b為短軸。
從表2中可以看出,不同品種的小麥籽粒在外形上存在一定的差異性,鄭麥9023的周長和面積明顯大于其他3種小麥,其他3種小麥的特征值也明顯不一樣,而且由小麥籽粒提取出來的另外幾個特征參數(shù)如圓形度、矩形度和伸長度等這些特征值不同,可見形態(tài)特征參數(shù)大小與小麥品種籽粒間存在明顯相關性,所以可以用形態(tài)特征參數(shù)進行小麥品種分類。
表2 4種小麥品種形態(tài)特征參數(shù)Tab.2 Shape characteristic parameters of four k inds of w heat
2.1.3 小麥籽粒紋理特征計算紋理廣泛存在于自然界中,是物體表面共有的內(nèi)在特性。紋理特征在人們的感官視覺中占很大比例,是一種視覺現(xiàn)象。Haralick等人提出用于描述紋理的14個特征參數(shù),但通常選取能量、熵、對比度、相關性這些特征作為關鍵特征。
從表3中可知,不同的小麥品種所提取的紋理特征值明顯存在差異。因此,把小麥的紋理特征參數(shù)用于小麥品種的分類識別是可行的。表3中,CON代表對比度,COR代表相關性,ASM代表能量,ENT代表熵。
表3 4種小麥品種紋理特征參數(shù)Tab.3 Textu re feature parameters of four k inds of w heat
2.2 稀疏表示方法
2.2.1 小麥籽粒訓練樣本組成設樣本有n類,每類有m個訓練樣本,用
表示所有屬于第i類的訓練樣本數(shù)據(jù)。它的m個列向量構成一個空間,反應第i類小麥品種,則n類訓練樣本組成的字典矩陣為
A的行數(shù)為訓練樣本的特征參數(shù)個數(shù),列數(shù)為訓練樣本總數(shù)。
文中每種小麥選取40粒作為訓練樣本,將這些小麥籽粒的特征向量排列起來,組成如下訓練樣本矩陣:
矩陣A表示4類小麥品種特征組成的字典,其大小為15×160,行數(shù)代表提取小麥籽粒的特征個數(shù),列數(shù)代表訓練樣本總數(shù)。
2.2.2 稀疏表達對于來自第k個測試樣本的向量y,可由訓練樣本矩陣A線性表示y=A x。因為y
來自第k個樣本,所以x在其所屬類別上的投影系數(shù)不為0,即y的解是稀疏的。由稀疏表示和壓縮感知的研究理論表明[10-11],在x足夠稀疏的條件下,可以通過l1最小化范數(shù)來近似求解x:
2.2.3 數(shù)據(jù)歸一化由于小麥的特征參數(shù)具有不同的量綱,所以需要將數(shù)據(jù)進行歸一化處理。首先計算出訓練樣本中每個特征的最大值
式中,A(i,:)表示A的第i行,ri,max表示第i行(即第i個特征)的最大值。用ri,max對A的每一行進行歸一化處理:
在A的歸一化矩陣A*中,訓練樣本每一個特征值的取值均在[0,1]之間,從而處于同一個量綱級。
同理,對測試樣本Y進行歸一化:
式中,y*是y的歸一化向量。
式中,di(y)表示用第i類訓練樣本重建y的殘差。
2.3 基于稀疏表示的小麥品種識別
文中提出利用稀疏表示對小麥品種進行識別的方法如下:
1)輸入由小麥籽粒構成的規(guī)范化訓練樣本矩陣A和來自某一個品種的測試樣本y,誤差閾值ε= 0.001,迭代次數(shù)為500次。
2)對矩陣A進行歸一化處理,得到A*。
3)對樣本y進行歸一化處理,得到y(tǒng)*。
4)用l1最小化范數(shù)求解。
6)將具有最小殘差的類作為y的所屬類別。
本試驗中,訓練樣本為內(nèi)鄉(xiāng)188、鄭麥9023、優(yōu)展1號、豫麥47這4類小麥品種,樣本編號分別為1~40,41~80,81~120,121~160,測試樣本為內(nèi)鄉(xiāng)188,編號1~160。由于測試樣本數(shù)據(jù)較大,所以截取第1~40個測試樣本的實驗結果如圖2所示。從圖中可知,殘差最小的類是內(nèi)鄉(xiāng)188,根據(jù)上述稀疏表示方法識別小麥品種理論,可判定識別類別為內(nèi)鄉(xiāng)188小麥品種,從而驗證了稀疏表示方法的有效性。同理,選取另外3種小麥品種各160粒作為測試樣本進行品種識別,最終將識別結果進行統(tǒng)計整理,可得到稀疏表示方法對4類小麥識別的結果,如圖3所示。該方法對內(nèi)鄉(xiāng)188、鄭麥9023、優(yōu)展1號、豫麥47這4種品種小麥的正確識別數(shù)目分別為156,153,153,157粒,正確識別率最高可達98.1%,達到了預期的識別目的。然而,從圖2,3中也可以看出,有個別小麥個體被誤識別為其他品種(如圖2中有1粒小麥被誤認為是優(yōu)展1號),究其原因,是由于該品種小麥某些籽粒與內(nèi)鄉(xiāng)188品種小麥在某些特征上非常類似造成的。
圖2 基于稀疏表示方法識別小麥品種舉例Fig.2 Exam ple based on the sparse representation approach to identify wheat varieties
圖3 稀疏表示方法對4類小麥品種的識別結果Fig.3 Sparse rep resentation m ethod for the iden tification results of four k inds of w heat varieties
人工神經(jīng)網(wǎng)絡被廣泛應用于模式識別分類的各個領域,文中選用BP網(wǎng)絡作為分類器與稀疏表示分類方法進行對比,在Matlab 2010環(huán)境下,編程實現(xiàn)BP神經(jīng)網(wǎng)絡方法和稀疏表示方法。其中BP神經(jīng)網(wǎng)絡方法采用Matlab神經(jīng)網(wǎng)絡工具箱提供的函數(shù)進行仿真,l1最小化范數(shù)的求解[12]使用開發(fā)的Matlab軟件包。
如表4所示,4類小麥籽粒的測試樣本共640粒,稀疏表示方法可以正確識別619粒,而廣泛使用的人工神經(jīng)網(wǎng)絡正確識別606粒,稀疏表示方法的識別效果比BP網(wǎng)路好。
表4 BP網(wǎng)絡和稀疏表示方法對4種小麥品種識別結果Tab.4 Identification results of the BP network and the sparse representation method of four kinds of w heat
除此之外,BP網(wǎng)絡中的多個參數(shù)需要經(jīng)過多次優(yōu)化才能提高小麥品種的識別率。而稀疏表示方法在參數(shù)選擇上比較簡單,只用考慮最小誤差和迭代次數(shù),較小的誤差和較大的迭代次數(shù)可獲得較高的識別準確率。這就驗證了稀疏表示方法在小麥品種識別領域,甚至在整個機器視覺領域中的極大優(yōu)勢。
1)對內(nèi)鄉(xiāng)188、鄭麥9023、豫麥47和優(yōu)展1號這4類小麥,通過提取小麥籽粒的顏色、形態(tài)和紋理特征,利用稀疏表示方法進行識別,判別測試樣本的所屬類別。識別結果顯示,識別準確率可達96.7%,為機器視覺實現(xiàn)小麥品種分類提供了一種新的有效方法,對其他農(nóng)作物的品種識別及鑒定也具有一定的參考價值。
2)與人工神經(jīng)網(wǎng)絡方法相比,稀疏表示只需要少量的訓練樣本,大大簡化了BP網(wǎng)絡建立訓練樣本需要大量數(shù)據(jù)進行訓練學習的復雜操作,并獲得了比人工神經(jīng)網(wǎng)絡方法更好的分類性能。
[1]陳建,陳曉,李偉,等.基于近紅外光譜技術和人工神經(jīng)網(wǎng)絡的玉米品種鑒別方法研究[J].光譜學與光譜分析,2008,28 (8):1806-1809.
CHEN Jian,CHEN Xiao,LIWei,et al.Corn variety discrimination based on near-infrared spectroscopy and artificial neural networks[J].Spectroscopy and Spectral Analysis,2008,28(8):1806-1809.(in Chinese)
[2]周子立,張瑜,何勇,等.基于近紅外光譜技術的大米品種快速鑒別方法[J].農(nóng)業(yè)工程學報,2009,25(8):131-135.
ZHOU Zili,ZHANG Yu,HE Yong,et al.Rice varieties based on near-infrared spectroscopy rapid identification methods[J].Agricultural Engineering,2009,25(8):131-135.(in Chinese)
[3]LIU Changchun,Jai-Tsung Shaw,Keen-Yik Poong.Classifying paddy rice by morphological and color features using machine vision[J].Cereal Chemistry,2005,82(6):649-653.
[4]王志軍,叢培盛,周佳璐,等.基于圖像處理與人工神經(jīng)網(wǎng)絡的小麥顆粒外觀品質(zhì)評價方法[J].農(nóng)業(yè)工程學報,2007,23 (1):158-161.
WANG Zhijun,CONG Peisheng,ZHOU Jialu,et al.Wheat Grain appearance of image processing and artificial neural network based on quality evaluationmethods[J].Agricultural Engineering,2007,23(1):158-161.(in Chinese)
[5]YUN Hongsun,LEEWonok,CHUNG Hoon.A computer vision system for rice kernel quality evaluation[R].No:023130 An ASAEMeeting Presentation.http://www.freepatentsonline.com/article/Annals-DAAAM-Proceedings/176688415.htm l
[6]何勝美,李仲來,何中虎.基于圖像識別的小麥品種分類研究[J].中國農(nóng)業(yè)科學,2005,38(9):1869-1875.
HE Shengmei,LI Zhonglai,HE Zhonghu.Classification of wheat cultivar by digital image analysis[J].Scientia Agricultura Sinica,2005,38(9):1869-1875.(in Chinese)
[7]Bruckstein A,Donoho D,Elad M.From sparse solutions of systems of equations to sparsemodeling of signals and images[J].SIAM Review,2009,51(1):34-81.
[8]Majumdar S,Javas D S.Classification of cereal grains usingmachine vision:II.colormodels[J].Transaction of the SALE,2000,43(1):677-680.
[9]Majumdar S,Javas D S.Classification of cereal grains usingmachine vision:IV.combined morphology,color,and texturemodels[J].Transaction of the SALE,2000,43(1)689-694.
[10]Donoho D.Formost large underdetermined systems of linear equations theminimal11-norm solution is also the sparsest solution[J].Communications on Pure and Applied Mathematics,2006,59(6):797-829.
[11]Candes E,Romberg J,Tao T.Stable signal recovery from incomplete and inaccurate measurements[J].Communications on Pure and Applied Mathematics,2006,59(8):1207-1223.
[12]Koh K,Stephen Boyd K S J.Simplematlab solver for l1-regularized least squares problems[EB/OL].(2008-05-15)(2015-03-10).http://www.stanford.edu/~boyd/l1_ls/
(責任編輯:楊勇)
W heat Varieties Identification Research Based on Sparse Representation
FENG Lijuan,LIXiujuan*,WEN Chenglin
(College of Electrical Engineering,Henan University of Technology,Zhengzhou 450001,China)
The applications of using the machine vision to distinguish crop varieties grow increasingly,in order to improve the recognition rate of grain varieties,this paper proposes the method of using the sparse representation to identify the wheat varieties.First,for four different types of wheat varieties:Neixiang 188,Zhengmai9023,Youzhan 1,Yumai47,each of them random ly selected 200 wheat kernels,40 wheat kernels as the training sample,extracting the color,the shape and the texture feature parameters:which can distinguish different types of wheat varieties as the typical characteristics ofwheat kernels,are used to form the dictionary of the sparse representation method.Then take one of the wheat varieties as test samp les,calculate the projection of each test sample in the dictionary through Matlab simulation,and consider theminimum projection error as the class of the test sample.Finally,contrast and analyze the sparse representationmethod and the BP neural network method for the identification results of wheat varieties.The simulation shows that the identification accuracy of the sparse representationmethod for four wheat varieties can reach 96.7%,obtaining a very good classification effect,so the sparse representationmethod is effective which can accurately identify wheat varieties.
classification ofwheat,image processing,sparse representation
S 512.1;TS 211.2
A
1671-7147(2015)06-0730-06
2015-07-02;
2015-09-09。
國家自然科學基金項目(61304258,61273075,61172133);河南省自然科學基金項目(152300410200)。作者簡介:馮麗娟(1989—),女,河南鄭州人,控制科學與工程專業(yè)碩士研究生。
*通信作者:李秀娟(1961—),女,吉林乾安人,教授,碩士生導師。主要從事智能信息處理技術、計算機應用等研究。Email:Lee_xiujuan@163.com