楊露露,秦華偉
(杭州電子科技大學(xué)機(jī)械工程學(xué)院,杭州 310018)
花生是中國重要的經(jīng)濟(jì)作物,在生活和工業(yè)上都有著廣泛的應(yīng)用[1]。花生仁在收獲、儲(chǔ)存中極易發(fā)生破損和霉變,影響其品質(zhì)和價(jià)值[2]。早期花生仁分選大多依靠人工,但是耗時(shí)耗力效率低下。因計(jì)算機(jī)視覺技術(shù)具有高效、實(shí)時(shí)、準(zhǔn)確和無損等優(yōu)點(diǎn),被越來越廣泛地應(yīng)用于農(nóng)產(chǎn)品品種檢測(cè)和質(zhì)量評(píng)判中[3-6]。MARTINEZ等[7]選取橄欖果實(shí)提取46個(gè)形狀尺寸特征,使用偏最小二乘判別分析(PLSDA)進(jìn)行分類,準(zhǔn)確率可達(dá)89%。WAN等[8]在番茄成熟度的鑒別實(shí)驗(yàn)中分別提取RGB和HSI色彩空間中各分量的均值作為顏色特征,通過BP神經(jīng)網(wǎng)絡(luò)對(duì)番茄成熟度進(jìn)行檢測(cè),識(shí)別率為99.31%。BLASCO等[9]利用區(qū)域生長(zhǎng)算法分割柑橘類水果表面缺損特征。潘磊慶等[10]通過提取稻谷的灰度、顏色、紋理等68個(gè)圖像特征,采用SVM模型對(duì)稻谷霉變程度進(jìn)行識(shí)別。張凱等[11]利用顏色和紋理特征實(shí)現(xiàn)了對(duì)花生進(jìn)行分級(jí)檢測(cè)。趙志衡等[12]利用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了對(duì)花生籽完整性的檢測(cè)。
本研究利用計(jì)算機(jī)視覺技術(shù)對(duì)花生仁的外觀品質(zhì)進(jìn)行檢測(cè)分類研究,對(duì)采集到的完好、破損以及霉變3種花生仁的圖像,經(jīng)預(yù)處理后提取顏色和紋理共10個(gè)特征,利用BP神經(jīng)網(wǎng)絡(luò)和SVM分類器分別進(jìn)行分類試驗(yàn),比較兩個(gè)分類器的識(shí)別效果,以實(shí)現(xiàn)花生仁外觀品質(zhì)的高效實(shí)時(shí)檢測(cè)。
選取江西上饒農(nóng)家自產(chǎn)的粉皮花生仁作為試驗(yàn)研究對(duì)象,經(jīng)過人工處理分別篩選出完好花生仁、破損花生仁以及霉變花生仁各200粒,3類花生總共600粒用于試驗(yàn)樣本。3種花生仁如圖1所示。
圖1 3種花生仁
花生仁圖像采集裝置如圖2所示,主要包括支架,LED光源,CCD工業(yè)相機(jī),計(jì)算機(jī)。整體支架尺寸為:45 cm×20 cm×40 cm;底部背景板尺寸為:45 cm×45 cm;頂部環(huán)形LED光源的半徑為12 cm,色溫為正白色;CCD相機(jī)置于環(huán)形光源中間圓心處,距背景板高度為35 cm,相機(jī)的最大分辨率為4608×3288。圖像采集時(shí),將花生仁平鋪在背景板中間,打開光源,將相機(jī)通過數(shù)據(jù)線與計(jì)算機(jī)連接,對(duì)一批試驗(yàn)樣品采集3張圖像,經(jīng)對(duì)比挑選最好的一張用于后續(xù)圖像處理?;ㄉ蕡D像采集實(shí)物圖如圖3所示。
圖2 花生仁采集裝置示意圖
圖3 花生仁采集裝置實(shí)物圖
圖像采集時(shí)易受到外界環(huán)境干擾產(chǎn)生噪音和其他無用信息,圖像預(yù)處理[13]可以有效的去除無用信息,改善視覺效果,提高相關(guān)信息的可檢測(cè)性,本研究采用的預(yù)處理方法如下。
對(duì)采集的原始花生仁RGB圖像(圖4(a))通過均值位移法(Mean shift)[14]進(jìn)行平滑降噪處理(圖4(b));經(jīng)分量法[15]提取RGB各分量灰度直方圖,其中,如圖4(c)、4(d)所示,藍(lán)色(B)通道灰度直方圖具有明顯的雙峰結(jié)構(gòu),且B通道灰度圖的背景與目標(biāo)有明顯的灰度等級(jí)差,可將B通道圖作為灰度處理圖;由圖4(c)所示,背景灰度值均小于100,花生仁灰度值均大于150,通過設(shè)置閾值為135(100~150均可),利用全局閾值分割取反處理,實(shí)現(xiàn)圖像背景與目標(biāo)分離(圖(e));將二值圖與原花生仁RGB圖像進(jìn)行與運(yùn)算處理,實(shí)現(xiàn)背景去除及花生仁目標(biāo)圖像提?。▓D(f));最后通過外接矩形法[16]提取分割除去背景后的單個(gè)完好、破損、霉變的花生仁圖像(圖(g))。
圖4 花生仁圖像預(yù)處理
花生仁的表皮與內(nèi)仁具有一定的顏色差異,可以通過顏色特征有效區(qū)分完好花生仁和破損花生仁,而通過實(shí)驗(yàn)發(fā)現(xiàn)霉變的花生仁在部分顏色特征中與完好的花生仁存在交集,僅通過顏色特征易出現(xiàn)錯(cuò)分,考慮到完好花生仁的表皮較為光滑,霉變花生仁表皮因發(fā)霉褶皺,可以通過紋理特征有效的區(qū)分,因此本研究采用將顏色和紋理特征相結(jié)合的方法進(jìn)行異?;ㄉ实淖R(shí)別。
2.2.1 顏色特征提取 相較于RGB顏色空間而言,HSV顏色空間能夠直觀的表達(dá)出色彩的明暗,色調(diào)以及新鮮程度等物體具體的顏色信息,可以很好的進(jìn)行顏色之間的對(duì)比。針對(duì)花生仁的顏色特征,分別提取H,S,V的3個(gè)分量的均值和方差共6個(gè)特征作為輸入的顏色特征向量。
為保證花生仁輪廓之外的背景不影響顏色特征的提取,在特征提取之前需對(duì)每個(gè)花生仁二值圖像進(jìn)行腐蝕處理,縮小目標(biāo)區(qū)域,防止背景顏色干擾,最后提取縮小后的目標(biāo)區(qū)域A內(nèi)所映射花生仁圖像H,S,V的均值(μ)和方差(δ),計(jì)算公式如(1)和(2)所示。均值(μ)反映了花生仁HSV各通道顏色特征,定義如公式(1)所示。方差(δ)反映了花生仁HSV各通道像素值的波動(dòng)和離散情況,定義如公式(2)所示。其中M和N分別表示圖像像素的長(zhǎng)和寬,n表示目標(biāo)區(qū)域A內(nèi)的像素個(gè)數(shù),P(x,y)表示各通道圖像上坐標(biāo)為(x,y)的像素值大小。表1是所提取3種花生仁各20粒H,S,V的均值和方差的平均值。
表1 花生仁顏色特征參數(shù)
2.2.2 紋理特征提取 紋理特征是一種反映圖像同質(zhì)現(xiàn)象和像素空間分布的特征,包含了物體表面組織結(jié)構(gòu)排列的重要信息[17]。統(tǒng)計(jì)方法中的灰度共生矩陣(GLCM)[18-20]是一種具有較強(qiáng)魯棒性和適應(yīng)性的理論,是研究像素空間分布關(guān)系的重要方法。基于此,本研究采用灰度共生矩陣方法來提取花生仁表面的紋理特征。
灰度共生矩陣生成原理:從灰度值為i的像素點(diǎn)出發(fā),與距離(dx,dy)的另一個(gè)像素點(diǎn)灰度值j的形成的灰度對(duì)出現(xiàn)頻率P(x,y|d,θ),則方陣P(x,y|d,θ)G×G稱為灰度共生矩陣,其中G表示圖像的灰度級(jí)數(shù),dx與dy由2個(gè)像素點(diǎn)之間距離d和角度θ所決定,如圖5所示。
圖5 灰度共生矩陣生成示意圖
灰度共生矩陣的定義如表達(dá)式(3)所示。
對(duì)提取到的GLCM需要進(jìn)行統(tǒng)計(jì)處理,將二次統(tǒng)計(jì)量作為圖像的特征參數(shù)來描述圖像的紋理特征。HARALICK[21]定義了14個(gè)特征參數(shù)用于紋理分析。本研究提取最具代表性的4個(gè)特征參數(shù)輸入作為紋理特征向量,包括能量、熵、對(duì)比度和逆差分矩。
能量(ASM):對(duì)圖像紋理的灰度變化程度的度量,反映灰度分布的均勻性和紋理粗細(xì)程度。見式(4)。熵(ENT):圖像中包含信息量的隨機(jī)性度量,反映灰度分布的復(fù)雜程度。見式(5)。對(duì)比度(CON):描述圖像中的局部變化,反映了圖像的清晰度和紋路深淺。見式(6)。逆差分矩(IDM):反映圖像紋理的規(guī)則度和平滑度。見式(7)。
本研究提取灰度共生矩陣的參數(shù)偏移角度θ和像素對(duì)距離d分別為:θ=0°,d=1,通過花生仁紋理特征計(jì)算公式(4)、(5)、(6)、(7)計(jì)算出3類花生仁各20粒的4個(gè)紋理特征參數(shù)的平均值,如表2所示。由表1和表2可知,完好花生仁和破損花生仁在顏色特征方面有較大的差異,而霉變花生仁較其他兩種花生仁在紋理特征方面有著較大差異,表明花生仁圖像處理效果較好,滿足后續(xù)研究要求。
3.1.1 BP神經(jīng)網(wǎng)絡(luò)概述 BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),其基本思想是利用梯度搜索技術(shù),在給定的輸入下使網(wǎng)絡(luò)的實(shí)際輸出值和期望輸出值的誤差最小,實(shí)現(xiàn)輸入到輸出的非線性映射[22]。BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、輸出層三大層組成,其中隱含層可以為一層或多層,圖6為BP網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。
圖6 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
3.1.2 花生仁BP神經(jīng)網(wǎng)絡(luò)識(shí)別模型建立 將實(shí)驗(yàn)提取的花生仁10個(gè)特征作為神經(jīng)網(wǎng)絡(luò)的輸入,3個(gè)類別分別為“100”(完好)、“010”(破損)、“001”(霉變)作為期望輸出。根據(jù)經(jīng)驗(yàn)公式(8)計(jì)算設(shè)置神經(jīng)網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)數(shù)為10。
式中p為隱含層節(jié)點(diǎn)數(shù),n為輸入層節(jié)點(diǎn)數(shù),q為輸出層節(jié)點(diǎn)數(shù),α∈(0,10)為常數(shù)。
本研究以輸入層-隱含層-輸出層節(jié)點(diǎn)數(shù)分別為10-10-3構(gòu)建花生仁BP神經(jīng)網(wǎng)絡(luò)分類識(shí)別模型。其中70%的數(shù)據(jù)集作為訓(xùn)練集,30%的數(shù)據(jù)集作為測(cè)試集,測(cè)試集分類識(shí)別結(jié)果如圖7所示。
由圖7可知,測(cè)試集中完好花生仁有2個(gè)識(shí)別為霉變的,1個(gè)識(shí)別為破損的;破損花生仁有1個(gè)識(shí)別為完好的,有1個(gè)識(shí)別為霉變的;霉變花生仁中有1個(gè)識(shí)別為破損的,整體花生仁識(shí)別錯(cuò)誤個(gè)數(shù)為6個(gè)。
圖7 測(cè)試集BP神經(jīng)網(wǎng)絡(luò)分類結(jié)果
3.2.1 支持向量機(jī)概述 支持向量機(jī)(SVM)是常見的二分類器,可以將低維空間中無法有效區(qū)分的特征向量,通過核函數(shù)映射到高維的特征空間,再求取最優(yōu)分割超平面對(duì)特征進(jìn)行分類[23]。應(yīng)用二次規(guī)劃法求得判別式[24]如式(9)所示。
其中αi為拉格朗日乘子,yi為類別標(biāo)簽,k(xi,x)為核函數(shù),b為閾值。
3.2.2 花生仁SVM分類模型建立 將花生仁的6個(gè)顏色特征向量和4個(gè)紋理特征向量作為向量機(jī)的輸入,考慮到RBF核函數(shù)具有映射維度廣、需確定參數(shù)少、運(yùn)算相對(duì)簡(jiǎn)單等優(yōu)點(diǎn)[23],選取RBF作為本研究向量機(jī)的核函數(shù),其中設(shè)置懲罰參數(shù)C=100,核函數(shù)參數(shù)g=0.3。將70%的數(shù)據(jù)集作為訓(xùn)練集,30%的數(shù)據(jù)集作為測(cè)試集,測(cè)試集分類識(shí)別結(jié)果如圖8所示。
由圖8可知,測(cè)試集中完好花生仁有2個(gè)識(shí)別為霉變的,1個(gè)識(shí)別為破損的;破損花生仁有2個(gè)識(shí)別為完好的;霉變花生仁全部識(shí)別正確,整體花生仁識(shí)別錯(cuò)誤個(gè)數(shù)為5個(gè)。
圖8 測(cè)試集SVM分類結(jié)果
不同的分類器對(duì)花生仁分類識(shí)別結(jié)果有一定影響,由表3對(duì)比識(shí)別結(jié)果可知,對(duì)于完好花生仁和破損花生仁,二者識(shí)別率一致,而SVM分類器對(duì)霉變花生仁的識(shí)別正確率達(dá)到了100%,明顯好于BP神經(jīng)網(wǎng)絡(luò)。在整體花生仁的識(shí)別率上,BP神經(jīng)網(wǎng)絡(luò)為96.67%,SVM分類器為97.22%,后者也好于前者。在識(shí)別時(shí)間上BP和SVM分別為2.5 s和1.1 s,即tBP>tSVM,識(shí)別效率上也是SVM更好,綜合識(shí)別準(zhǔn)確率和效率兩方面考慮,優(yōu)先選擇SVM分類器模型來對(duì)完好、破損以及霉變的花生仁進(jìn)行區(qū)分識(shí)別。
表3 兩種分類器模型識(shí)別結(jié)果
(1)對(duì)采集到的花生仁圖像經(jīng)預(yù)處理操作,研究提取花生仁圖像HSV空間下的6個(gè)顏色特征,基于灰度共生矩陣法提取花生仁4個(gè)紋理特征,構(gòu)建顏色和紋理共10個(gè)特征的特征模型。
(2)針對(duì)不同的分類器對(duì)花生仁分類識(shí)別的影響,構(gòu)建了BP神經(jīng)網(wǎng)絡(luò)和SVM分類器的分類識(shí)別模型。通過對(duì)比發(fā)現(xiàn),SVM分類器識(shí)別正確率高達(dá)97.22%,耗時(shí)僅為1.1 s,均優(yōu)于BP神經(jīng)網(wǎng)絡(luò),表明SVM的識(shí)別模型更適用于花生仁品質(zhì)的分類識(shí)別。
(3)本研究?jī)H對(duì)了比2種常規(guī)的分類算法模型,后續(xù)可以通過添加優(yōu)化算法對(duì)相應(yīng)的算法模型進(jìn)行優(yōu)化處理,進(jìn)一步提高模型的分類識(shí)別準(zhǔn)確率和效率。