王履程,譚筠梅,王小鵬,雷濤
蘭州交通大學(xué)電子與信息工程學(xué)院,蘭州 730070
基于機(jī)器視覺的枸杞分級方法
王履程,譚筠梅,王小鵬,雷濤
蘭州交通大學(xué)電子與信息工程學(xué)院,蘭州 730070
WANG Lvcheng,TAN Junmei,WANG Xiaopeng,et al.Wolfberry classification method based on machine vision.Computer Engineering and Applications,2013,49(24):16-18.
枸杞自古以來就是深受歡迎的中藥材,主要產(chǎn)地在我國的西北地區(qū)。由于枸杞的采摘時(shí)間跨度大,在晾曬過程中易受環(huán)境的影響和限制,并且由于枸杞內(nèi)部條件不同,導(dǎo)致枸杞成品色澤混雜,嚴(yán)重影響了枸杞的品質(zhì)等級。在加工過程中依據(jù)枸杞的色澤和大小進(jìn)行有效的自動(dòng)分級可以極大地提高枸杞生產(chǎn)企業(yè)的經(jīng)濟(jì)效益。傳統(tǒng)的枸杞分級主要采用人工分揀的方法,既花費(fèi)大量人力,同時(shí)分選質(zhì)量和效率也不能適應(yīng)日益發(fā)展的工廠化加工要求和商品市場需求[1-2]。目前,已開始研制枸杞色選機(jī)來代替?zhèn)鹘y(tǒng)的人工分揀方法[3],其研發(fā)的關(guān)鍵是機(jī)器視覺部分[4],利用機(jī)器視覺技術(shù)實(shí)現(xiàn)對枸杞準(zhǔn)確、快速的自動(dòng)分類。
基于機(jī)器視覺的枸杞分級算法主要包括圖像預(yù)處理、圖像分割、色彩分量提取、特征提取與分類標(biāo)識等步驟[5-6]。圖像分割精確度會(huì)直接影響特征提取的可靠性和分類的準(zhǔn)確度。目前常用的圖像分割方法有基于閾值的分割方法、基于區(qū)域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等,其中閾值分割方法對于背景單一,直方圖呈雙峰的圖像能進(jìn)行快速有效的分割。最小距離分類器是一種簡單而有效的分類方法,在分類前需要各類的中心向量,本文采用聚類分析獲取枸杞各類別的聚類中心作為最小距離分類器的中心向量,從而實(shí)現(xiàn)機(jī)器視覺部分的高度智能化。圖1為基于機(jī)器視覺的枸杞分級方法流程。
圖1 基于機(jī)器視覺的枸杞分級流程圖
由于光照、灰塵等因素的影響,在枸杞圖像的采集和傳輸過程中會(huì)產(chǎn)生噪聲,因此先要對采集的枸杞圖像進(jìn)行噪聲移除等預(yù)處理[6-7];其后進(jìn)行圖像分割。
1.1 圖像預(yù)處理
為了加快分級的速度,同時(shí)便于去除噪聲和分割,對CCD采集的枸杞圖像進(jìn)行灰度化處理。
其中IR,IG和IB分別為枸杞彩色圖像的RGB分量,Igray為灰度化之后的圖像。
中值濾波方法是一種經(jīng)典的非線性平滑噪聲的方法,可以有效去除數(shù)字圖像中常見的隨機(jī)噪聲,并且可以較好地保護(hù)圖像的邊緣信息。本文采用3×3窗口的中值濾波法[8]對枸杞圖像進(jìn)行平滑處理。枸杞圖像、灰度化和中值濾波的結(jié)果如圖2(a)~(c)所示。
圖2 枸杞圖像及預(yù)處理結(jié)果
1.2 圖像分割
枸杞圖像的分割對后續(xù)處理至關(guān)重要。閾值分割是一種簡單實(shí)用的圖像分割方法,它以圖像直方圖信息為主導(dǎo),具備原理清晰、表述簡單、運(yùn)算快捷、效果良好等優(yōu)點(diǎn)[7]。枸杞圖像采集中成像背景穩(wěn)定,而且圖像具有背景像素灰度級和枸杞像素灰度級對比度大且其直方圖呈雙峰等特點(diǎn)。枸杞灰度圖像的直方圖如圖3所示。因此采用閾值分割方法可以快速有效地分割枸杞灰度圖像。
本文使用分割閾值自動(dòng)選取的最優(yōu)方法Otsu閾值法[9]來分割枸杞圖像,通過對圖像的一維直方圖進(jìn)行統(tǒng)計(jì),把圖像分為背景與目標(biāo)兩個(gè)部分,分別計(jì)算兩個(gè)類別的方差值,當(dāng)兩個(gè)類別之間的方差最大時(shí),就可以動(dòng)態(tài)確定出背景與目標(biāo)分割的最優(yōu)閾值。
假設(shè)灰度圖像的像素總數(shù)為N,灰度級為L,灰度為i像素個(gè)數(shù)為ni,則其出現(xiàn)的概率為pi=ni/N(i=0,1,…,L-1)。假定圖像背景與目標(biāo)的分割閾值是T,此時(shí)圖像像素按照灰度可以分為兩類,分別表示背景和目標(biāo)。L1=[0,1,…,T-1],L2=[T,T+1,…,L-1]分別為背景和目標(biāo)的灰度級,則背景和目標(biāo)的類間方差為:
圖3 枸杞灰度圖像的歸一化直方圖
枸杞圖像分割的結(jié)果如圖2(d)所示。
1.3 枸杞圖像的特征選擇與提取
色澤、大小和形狀是枸杞品質(zhì)分級的主要依據(jù)[10]。由于枸杞本身的顏色特點(diǎn),實(shí)驗(yàn)測試表明,使用RGB彩色空間中的紅色分量來進(jìn)行特征提取效果就非常理想。對于分割后的枸杞圖像,采用分割區(qū)域紅色分量的均值和標(biāo)準(zhǔn)差作為枸杞色澤的特征參數(shù)??紤]到枸杞本身形狀特點(diǎn),通過實(shí)驗(yàn)分析和枸杞樣本形狀的計(jì)算與描述,將分割區(qū)域的面積和偏心率分別作為枸杞的大小和形狀特征參數(shù)。
枸杞紅色分量的均值、方差按如下方法計(jì)算:
2.1 最小距離分類器
最小距離分類器[7,11]是一種簡單而有效的分類方法,其基本思想是根據(jù)訓(xùn)練集按照算術(shù)平均生成一個(gè)代表該類的中心向量m1,m2,…,mK,K為類別的數(shù)目。對于每一個(gè)待分類樣本x,計(jì)算其與類中心向量之間的距離,最后判定x屬于與之距離最近的類。距離計(jì)算采用歐式距離:
其中x為樣本的特征向量,mi為第i類的中心向量。
表1 部分枸杞樣本特征數(shù)據(jù)
2.2 K-Means算法
K-Means算法是一種動(dòng)態(tài)聚類的方法,即在歐幾里德空間將N個(gè)樣本數(shù)據(jù)對象劃分為K個(gè)聚類,使得每個(gè)聚類內(nèi)的數(shù)據(jù)相似度高,而不同聚類的數(shù)據(jù)相似度低。其核心思想是找出K個(gè)聚類中心m1,m2,…,mk,使得每一個(gè)數(shù)據(jù)點(diǎn)x和與其最近的聚類中心的平方距離和最小化(該平方距離和被稱為偏差Je)。該算法的基礎(chǔ)是誤差平方和準(zhǔn)則[12-13]。
若Ni是第i個(gè)聚類ci中的樣本數(shù)目,mi是這些樣本的均值向量,即
把ci中的各樣本x與均值向量mi的誤差平方和對所有類相加后為:
Je是誤差準(zhǔn)則和聚類準(zhǔn)則,Je度量了用K個(gè)聚類中心m1,m2,…,mk代表K個(gè)樣本子集c1,c2,…,ck時(shí)所產(chǎn)生的總的誤差平方。對于不同的聚類結(jié)果,Je的值是不同的,使Je極小的聚類是誤差平方和準(zhǔn)則下的最優(yōu)結(jié)果。
K-Means聚類算法的步驟可描述如下[6]:
(1)初始分類:依據(jù)一定規(guī)則指定K個(gè)初始聚類中心m1,m2,…,mk。
(2)指派樣本:對每一個(gè)樣本x,找到離它最近的聚類中心mi,并將其分配到mi所對應(yīng)的聚類ci中。
(3)更新mi:重新計(jì)算加入新樣本后的聚類的中心。
(4)計(jì)算偏差:重新計(jì)算Je。
(5)連續(xù)迭代計(jì)算Je,如果Je值收斂則算法結(jié)束,否則轉(zhuǎn)(2)。
2.3 枸杞分類
枸杞分類通常采用多級分類方式,一般采用兩級分類。本文第一級根據(jù)色澤分為2類;第二級根據(jù)大小分為3類。第一級采用2維特征向量,分別是枸杞紅色分量的均值和方差,第二級采用一維特征即枸杞分割的面積。兩級分類均采用無監(jiān)督的K-Means算法訓(xùn)練得到枸杞分級的基準(zhǔn),在分類階段采用最小距離分類器分類。
本文采用MATLAB 7.0仿真基于聚類分析的枸杞分級方法,部分枸杞樣本的色澤特征向量和大小特征數(shù)據(jù)見表1。針對170個(gè)枸杞樣本進(jìn)行訓(xùn)練得到的分級基準(zhǔn)見表2。針對680個(gè)枸杞樣本進(jìn)行分類測試,色澤分類準(zhǔn)確性達(dá)到99.76%,大小分類準(zhǔn)確性達(dá)到100%。目前色選機(jī)處理要求為每天處理2.16噸,每秒處理25 g枸杞(約100粒)。針對170個(gè)枸杞樣本進(jìn)行訓(xùn)練的耗時(shí)為2.923 s,針對680個(gè)枸杞樣本進(jìn)行分類的耗時(shí)為0.001 4 s。實(shí)驗(yàn)表明該方法能快速準(zhǔn)確地對枸杞進(jìn)行分級。
表2 170個(gè)樣本訓(xùn)練得到的分級基準(zhǔn)
本文研究了采用機(jī)器視覺技術(shù)對枸杞進(jìn)行自動(dòng)分級的方法,根據(jù)目前枸杞加工行業(yè)的實(shí)際情況,采用了色澤和大小兩級分類??紤]到實(shí)時(shí)性和準(zhǔn)確性的要求,在根據(jù)色澤分類時(shí)選取了枸杞圖像紅色分量的均值和方差作為特征向量,在根據(jù)大小分類時(shí)使用分割面積作為特征向量。分類方法采用了最小距離分類器,使用K-Means聚類分析獲取聚類中心替換了最小距離分類器中的算術(shù)平均中心作為分類的基準(zhǔn),實(shí)現(xiàn)了分類的完全自動(dòng)化。實(shí)驗(yàn)表明該方法能快速準(zhǔn)確對枸杞進(jìn)行自動(dòng)分級,對其他類似農(nóng)產(chǎn)品的快速分級提供了理論框架。
[1]崔萍,汪澤鵬.寧夏枸杞產(chǎn)業(yè)發(fā)展現(xiàn)狀及對策[J].北方果樹,2008(5):36-37.
[2]丁潤鎖,尚立新,寧書臣,等.農(nóng)產(chǎn)品色選技術(shù)的發(fā)展分析[J].農(nóng)業(yè)工程,2012(S1):54-56.
[3]王建宏.寧夏枸杞干果告別人工揀選[N].寧夏日報(bào),2006-10-04(001).
[4]張誠彬,陸錫華.色選機(jī)及其在糧食工業(yè)中的應(yīng)用[J].糧食與飼料工業(yè),1995(1):1-4.
[5]高瑞,王安福,朱榮.基于機(jī)器視覺的光電色選機(jī)控制系統(tǒng)的研究[J].鄖陽師范高等??茖W(xué)校學(xué)報(bào),2010,30(6):30-32.
[6]邊肇祺,張學(xué)工.模式識別[M].2版.北京:清華大學(xué)出版社,2001.
[7]Jain A K,Duin R P W,Jianchang M.Statistical pattern recognition:areview[J].IEEETransactionsonPatternAnalysis and Machine Intelligence,2000,22(1):4-37.
[8]岡薩雷斯,伍茲.數(shù)字圖像處理[M].阮秋琦,譯.3版.北京:電子工業(yè)出版社,2011.
[9]Otsu N.A threshold selection method from gray-level histograms[J].IEEE Transactions on Systems,Man,and Cybernetics,1979,SMC-9(1):62-66.
[10]張曉煜,劉靜,王連喜.枸杞品質(zhì)綜合評價(jià)體系構(gòu)建[J].中國農(nóng)業(yè)科學(xué),2004,37(3):416-421.
[11]任靖,李春平.最小距離分類器的改進(jìn)算法——加權(quán)最小距離分類器[J].計(jì)算機(jī)應(yīng)用,2005(5):992-994.
[12]Mohd Rijal O,Noor N M.Some remarks on selected image analysis problems using multivariate statistical methods[C]// 2011 IEEE International Conference on Computer Applications and Industrial Electronics(ICCAIE),2011.
[13]Kanungo T.An efficient k-means clustering algorithm:analysisandimplementation[J].IEEETransactionsonPattern Analysis and Machine Intelligence,2002,24(7):881-892.
WANG Lvcheng,TAN Junmei,WANG Xiaopeng,LEI Tao
Traditional wolfberry sorting primarily uses artificial method.It has time-consuming and inefficient shortcomings.An automatic wolfberry classification method based on machine vision is proposed.This paper uses digital image processing technology for wolfberry image pre-processing,segmentation and extraction of characteristic parameters of color,size and shape;it uses theK-means clustering feature to get the baseline of wolfberry appropriate level;it grades wolfberry by minimum distance classifier based on the trained benchmark.The experimental results show that this method can classify different colors and sizes of wolfberry more accurately and quickly.
wolfberry classification;image segmentation;feature extraction;cluster analysis;minimum distance classifier
針對目前傳統(tǒng)的枸杞分級主要采用人工方法,費(fèi)時(shí)費(fèi)力且效率不高的缺點(diǎn),提出了一種基于機(jī)器視覺技術(shù)對枸杞進(jìn)行自動(dòng)分類的方法。采用數(shù)字圖像處理技術(shù)對枸杞圖像進(jìn)行了預(yù)處理、分割,從而提取枸杞的色澤、大小及形狀等特征參數(shù);用K-means算法對特征進(jìn)行聚類,得到枸杞相應(yīng)等級的基準(zhǔn);根據(jù)聚類分析得到的基準(zhǔn)采用最小距離分類器對枸杞進(jìn)行分級。實(shí)驗(yàn)結(jié)果表明,該方法能夠準(zhǔn)確快速地對不同色澤和大小的枸杞進(jìn)行分類。
枸杞分級;圖像分割;特征提??;聚類分析;最小距離分類器
A
TP391.4
10.3778/j.issn.1002-8331.1305-0379
School of Electronic&Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China
國家自然科學(xué)基金(No.61261029,No.61202314);蘭州交通大學(xué)青年科學(xué)基金項(xiàng)目(No.2011003)。
王履程(1978—),男,博士研究生,講師,研究領(lǐng)域?yàn)槟J阶R別,圖像分析;譚筠梅(1977—),女,博士研究生,講師,研究領(lǐng)域?yàn)橐曨l分析,模式識別;王小鵬(1969—),男,博士,教授,研究領(lǐng)域?yàn)閿?shù)字圖像分析;雷濤(1981—),男,博士,副教授,研究領(lǐng)域?yàn)閿?shù)學(xué)形態(tài)學(xué),圖像處理。E-mail:wanglc@mail.lzjtu.cn
2013-05-28
2013-07-26
1002-8331(2013)24-0016-03
CNKI出版日期:2013-09-26http://www.cnki.net/kcms/detail/11.2127.TP.20130926.1644.009.html