王建璽等
摘 要: 為快速有效地診斷識(shí)別煙葉病害,提高煙草病害診斷水平,首先采用自適應(yīng)中值濾波技術(shù)對(duì)采集的角斑病和野火病圖像進(jìn)行去噪處理,然后采用快速模糊C?均值聚類(lèi)算法對(duì)病斑進(jìn)行分割,最后提取煙葉病斑顏色、形狀和紋理方面的特征,采用模糊識(shí)別技術(shù)對(duì)病害進(jìn)行自動(dòng)識(shí)別。實(shí)驗(yàn)測(cè)試表明,該模型對(duì)病害樣本進(jìn)行處理識(shí)別的正確率較高,能夠滿足生產(chǎn)的實(shí)際需求。
關(guān)鍵詞: 煙葉病害; 自適應(yīng)中值濾波; 快速模糊C?均值聚類(lèi); 模糊識(shí)別
中圖分類(lèi)號(hào): TN964?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2015)08?0004?04
Research on tobacco disease auto?recognition based on image processing and
fuzzy recognition technology
WANG Jian?xi, XU Xiang?yi
(Pingdingshan University, Pingdingshan 467000, China)
Abstract:To diagnose and identify tobacco diseases quickly and effectively, and improve the diagnostic level of tobacco diseases, the adaptive median filtering technology is used to perform the noise removal of the collected images of tobacco angular leaf spot and wildfire, the fast fuzzy C?means clustering algorithm is adopted to segment the lesion, and then the fuzzy recognition technology is used for the Auto?Recognition of the disease according to the characteristics of color, shape and texture of tobacco spot disease. Test results show the model has high recognition rate for the disease samples, and can meet the actual production requirements.
Keywords: tobacco disease; adaptive mean filtering; fast fuzzy C?means clustering; fuzzy recognition
煙葉病害對(duì)煙葉質(zhì)量影響很大,而煙葉質(zhì)量直接影響到煙制品質(zhì)量和煙民的健康,及時(shí)準(zhǔn)確地發(fā)現(xiàn)煙葉病害,快速識(shí)別煙葉病害的種類(lèi)是煙葉病害防治的基礎(chǔ)和前提。農(nóng)作物病害識(shí)別診斷技術(shù)在玉米、小麥、大豆、黃瓜等作物方面研究較多,對(duì)于煙葉病害的研究較少[1?5]。中國(guó)是世界第一煙葉生產(chǎn)大國(guó),2012年,全國(guó)種植烤煙2 118萬(wàn)畝,收購(gòu)烤煙273.7萬(wàn)噸。因此,研究煙葉病害識(shí)別診斷方法具有重要的意義。本文利用圖像處理和模式識(shí)別技術(shù),針對(duì)煙葉種植中常見(jiàn)的角斑病和野火病,提出了一種新的煙葉病害自動(dòng)識(shí)別診斷方法。
1 病斑圖像預(yù)處理
1.1 圖像采集
為提高病斑圖像采集的準(zhǔn)確性,本文采集的煙葉病斑圖像是在植??萍既藛T的指導(dǎo)下,用數(shù)碼相機(jī)在大田自然光照環(huán)境下拍攝獲取的,以RGB格式導(dǎo)入計(jì)算機(jī)系統(tǒng)中,使用常用的圖像處理軟件去除圖像中無(wú)關(guān)的背景,統(tǒng)一圖像尺寸大小,供后續(xù)圖像處理使用。
1.2 圖像去噪處理
在圖像采集時(shí),使用數(shù)碼相機(jī)采集的病斑圖像常有脈沖噪聲[6],需去除噪聲,在進(jìn)行去噪處理時(shí),由于數(shù)碼相機(jī)采集的真彩色圖像占用存儲(chǔ)空間大,處理所用時(shí)間較長(zhǎng),為了提高處理速度,需先把彩色圖像轉(zhuǎn)換為灰度圖像。常用的中值濾波技術(shù)對(duì)煙葉病害圖像進(jìn)行過(guò)濾,能很好地過(guò)濾噪聲,但存在一定的細(xì)節(jié)損失,從而導(dǎo)致在去除噪聲干擾的同時(shí)使圖像變得模糊[7]。
本文采用自適應(yīng)中值濾波算法過(guò)濾圖像中的噪聲,該算法不像中值濾波利用排序結(jié)果的中值直接代替原中心像素灰度值,而是采用自適應(yīng)中值比較算法判定該點(diǎn)是否是噪聲[8],如果是噪聲則替換,否則噪聲保留該點(diǎn)原始像素灰度值,這樣既可以過(guò)濾掉脈沖噪聲,同時(shí)也保存了非噪聲的原始圖像,優(yōu)化了單純中值濾波的效果。簡(jiǎn)單的中值濾波是采用[3×3]的窗口濾波器,而自適應(yīng)中值濾波增加了[5×5]窗口濾波器。該算法思想可描述為:首先在[3×3]采樣窗口模式下,計(jì)算采樣窗口像素的中值Xmed是否在采樣窗口像素最大值Xmax和最小值Xmin之間,如果在兩者之間,說(shuō)明中值Xmed不是極值。接著判斷采樣窗口中心像素值Xxy是否在最大值Xmax和最小值Xmin之間,假如在二者之間,說(shuō)明中心像素值Xxy不是極值,這樣就不需用中值替換中心像素值,直接輸出中心像素值即可;否則中心像素值是極值,需要用中值Xmed替換中心像素值。
假如上述步驟中中值Xmed并沒(méi)有處于像素最大值Xmax和最小值Xmin之間,表示中值Xmed是極值,這時(shí)需要將采樣窗口增大到[5×5],重復(fù)執(zhí)行以上步驟,假如還是找不到一個(gè)合適的中值Xmed,則輸出[3×3]窗口模式下求出的中值結(jié)果,否則輸出[5×5]窗口模式中求出的結(jié)果。該算法步驟如下:
(1) 如果Xmax-Xmed>0且Xmed?Xmin>0,則轉(zhuǎn)步驟(2);
否則增加窗口模式;
如果采樣窗口大小≤Smax,則重復(fù)轉(zhuǎn)到步驟(1);
否則輸出Xmed;
(2) 如果Xmax-Xxy>0且Xxy-Xmin>0,則輸出Xxy;
否則輸出Xmed;
Smax取5×5窗口模式。
該算法能有效平滑噪聲,較好地保留了圖像原來(lái)的像素值、細(xì)節(jié)和邊緣信息,并能根據(jù)情況自動(dòng)擴(kuò)展采樣窗口,提高了圖像的濾波效果,為后續(xù)的病斑特征提取和圖像識(shí)別提供了很好的圖像素材。本文對(duì)采集到的野火病病斑圖像采用自適應(yīng)中值濾波進(jìn)行平滑處理,處理前后的圖像如圖1和圖2所示。
1.3 圖像分割
在對(duì)病斑圖像進(jìn)行識(shí)別和判斷前,需要把病斑從圖像中分割出來(lái),圖像分割的好壞對(duì)以后的圖像識(shí)別至關(guān)重要。本文采用快速模糊C?均值聚類(lèi)算法對(duì)病斑圖像進(jìn)行分割,為提高該算法的處理速度,用灰度級(jí)替換數(shù)字圖像的病斑樣本[9]。算法步驟如下:
(1) 計(jì)算圖像中的灰度級(jí)k=0,1,2,…,L-1,其中L-1表示圖像中的最大灰度級(jí),設(shè)定好閾值ε,類(lèi)別數(shù)c和權(quán)重系數(shù)m,初始化迭代次數(shù)和隸屬矩陣U{0};
(2) 計(jì)算c個(gè)聚類(lèi)的中心{Vi{r}},聚類(lèi)中心計(jì)算公式為:
[vi=K=0L-1μijmh(k)kK=0L-1μijmh(k),i=1,2,…,c] (1)
式中:[μij] 表示隸屬度;m為加權(quán)參數(shù),在[1,∞]取值,用來(lái)控制模糊度;[h(k)] 表示數(shù)據(jù)點(diǎn)k的灰度值。
(3) 計(jì)算新的模糊分類(lèi)矩陣U(r?1),根據(jù)距離式(2),用U(r)替代V(r)即可得到:
[(dik)2=k-vi2, k=0,1,2,…,L-1] (2)
式中:[dik]表示第k個(gè)數(shù)據(jù)集與第i類(lèi)中心的歐氏距離。
步驟4:滿足[U(r-1)-U(r)<ε]時(shí)停止計(jì)算。否則r++,轉(zhuǎn)到步驟(1),重新計(jì)算;
當(dāng)該算法收斂時(shí),根據(jù)最大隸屬度原則,把各灰度級(jí)k劃歸到最大隸屬度的類(lèi)別中,并把各個(gè)類(lèi)別的標(biāo)號(hào)分配給相應(yīng)的像素。
在實(shí)現(xiàn)快速模糊C?均值聚類(lèi)圖像分割算法時(shí),該算法中的參數(shù)如類(lèi)別數(shù)c,指數(shù)m的選擇直接影響著實(shí)驗(yàn)結(jié)果[10?11]。m在實(shí)際中的最優(yōu)取值范圍為1.5~2.5之間。在對(duì)所處理的煙葉病斑有一定了解的基礎(chǔ)上,根據(jù)實(shí)際情況取得c的值。在聚類(lèi)中心相對(duì)分散的情況下,需要采用迭代法確定c的值。本文取c的值為2,m的值為2,[ε]的值為0.05,對(duì)煙葉病斑圖像進(jìn)行分割,并對(duì)分割后的圖像進(jìn)行數(shù)學(xué)形態(tài)處理,處理后的病斑圖像見(jiàn)圖3。
圖3 野火病分割后圖像
2 病斑圖像特征提取和模式識(shí)別
2.1 圖像特征提取
對(duì)分離出來(lái)的病斑進(jìn)行識(shí)別,需確定病斑的相關(guān)特征,然而傳統(tǒng)的分析方法如借鑒經(jīng)驗(yàn)法和病理學(xué)分析法都會(huì)出現(xiàn)較大偏差[12]。本文根據(jù)煙葉角斑病和野火病分割出來(lái)的病斑,從形狀、紋理及顏色三方面特征出發(fā),根據(jù)易區(qū)分、可靠、不相關(guān)性及復(fù)雜度適度的原則,提取了5個(gè)特征參數(shù):形狀特征病斑圓形度C和復(fù)雜度S,紋理特征的熵WE和對(duì)比度WC,顏色特征中的H均值,它們計(jì)算方法如下:
(1)形狀特征病斑圓形度C:圓形度是描述病斑接近圓形的程度,計(jì)算公式為:
[C=4πx=1Nfx,yL2] (3)
式中f(x,y)為圖形的像素點(diǎn);L為病斑區(qū)域周長(zhǎng);C的取值范圍為[0,l],C越大,則區(qū)域越接近圓形。
(2) 形狀特征病斑復(fù)雜性S:復(fù)雜性計(jì)算公式為:
[S=L2x=1Nfx,y] (4)
復(fù)雜性表示單位面積上病斑周長(zhǎng)長(zhǎng)度,值越小表示圖形越簡(jiǎn)單;反之表示圖形越復(fù)雜。
(3) 紋理特征熵WE:紋理特征熵WE和對(duì)比度WC可以從共生矩陣p中計(jì)算出來(lái),根據(jù)角斑病和野火病病斑像素灰度變化構(gòu)造[d=1,θ=0°]的灰度共生矩陣。當(dāng)病斑圖像中無(wú)紋理時(shí),其灰度共生矩陣p(i,j|d,θ)中元素全是零,這時(shí)熵值WE就接近于0;如果圖像中細(xì)紋理很多,那么灰度共生矩陣p(i,j|d,θ)中的元素值接近相等,則這時(shí)熵值WE就很大。熵WE的計(jì)算公式為:
[WE=-i=0L-1j=0L-1pi,j|d=1,θ=0°log2pi,j|d=1,θ=0°] (5)
(4) 紋理特征對(duì)比度WC:對(duì)比度反映了圖像的清晰程度,表示了兩像素點(diǎn)間灰度差情況,當(dāng)對(duì)比度WC值越小時(shí),表示灰度差越小,圖像紋理和視覺(jué)效果越模糊,計(jì)算公式如下:
[WC=n=0L-1n2i=0L-1j=0L-1pi,j|d=1,θ=0°] (6)
式中n=[i-j]。
(5) 顏色特征H均值:[H=Sum Hx=1Nfx,y],Sum H指的是病斑圖像部位像素點(diǎn)H分量的灰度總和。
2.2 模糊模式識(shí)別分類(lèi)器設(shè)計(jì)
模糊識(shí)別技術(shù)是圖像識(shí)別中常用的識(shí)別技術(shù)[13],它根據(jù)待識(shí)別模式和標(biāo)準(zhǔn)模式之間的隸屬度或貼近度對(duì)待識(shí)別元素進(jìn)行分類(lèi)。本文通過(guò)計(jì)算待識(shí)別病害模糊集與已知病害模糊集的貼近度來(lái)對(duì)待識(shí)別病害進(jìn)行識(shí)別。根據(jù)實(shí)際需要建立一個(gè)模糊模式識(shí)別分類(lèi)器。首先建立煙葉角斑病和野火病的標(biāo)準(zhǔn)模式庫(kù),根據(jù)實(shí)際情況建立合適的隸屬度函數(shù),接著計(jì)算待測(cè)病害樣本與標(biāo)準(zhǔn)樣本的隸屬度,依據(jù)隸屬度最大原則將待識(shí)別病害劃分到相近的一個(gè)類(lèi)別中,實(shí)現(xiàn)對(duì)病害的自動(dòng)識(shí)別。
本實(shí)驗(yàn)采用正態(tài)分布型函數(shù)定義待識(shí)別的第k個(gè)病害樣本xk的隸屬度函數(shù):
[μAi(xk)=e-xk-vidmax2] (7)
式中,dmax表示xk與各特征模式中聚類(lèi)中心的最大距離。
本文主要研究角斑病和野火病這兩種病害,在植保技術(shù)人員的指導(dǎo)下,選取病害特征較明顯的煙葉樣本圖像經(jīng)預(yù)處理后,進(jìn)行有監(jiān)督的學(xué)習(xí)。采集角斑病和野火病這兩種病害各100個(gè)建立兩種類(lèi)別的標(biāo)準(zhǔn)特征庫(kù),故c=2,把選擇100個(gè)樣本的5個(gè)特征參數(shù)矩陣提取出來(lái)輸入計(jì)算機(jī),根據(jù)提取的特征參數(shù)計(jì)算出兩類(lèi)病害組成的聚類(lèi)中心集v={v1,v2},根據(jù)公式(8)計(jì)算出用5個(gè)特征參數(shù)表示的角斑病和野火病的聚類(lèi)中心vi(i=1,2)。
[vi=1nix∈Aix] (8)
通過(guò)對(duì)采集的100個(gè)病害樣本進(jìn)行訓(xùn)練,建立了兩種病害的標(biāo)準(zhǔn)模式庫(kù),把計(jì)算出的聚類(lèi)中心vi={m1,m2,…,m5}(i=1,2)保存到特征庫(kù)中,作為以后進(jìn)行分類(lèi)識(shí)別的依據(jù)。
3 病害識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
采用Visual C++ 2012作為煙葉病害識(shí)別系統(tǒng)的開(kāi)發(fā)平臺(tái)。按照本文模式識(shí)別實(shí)際情況,設(shè)計(jì)出兩種病斑自動(dòng)識(shí)別系統(tǒng)的流程如圖4所示。
圖4 煙葉病斑自動(dòng)識(shí)別系統(tǒng)流程圖
通過(guò)自適應(yīng)中值濾波技術(shù)和快速模糊C?均值聚類(lèi)算法對(duì)采集到的圖像進(jìn)行處理后,提取出選擇的5個(gè)特征參數(shù),然后將特征值存入數(shù)據(jù)庫(kù);用獲得的特征值訓(xùn)練這兩個(gè)病害的數(shù)值特征,建立兩種病害模型庫(kù),并輸出獲得的模式文件。進(jìn)行樣本病害識(shí)別時(shí),首先將待識(shí)別煙葉病斑的特征提取出來(lái),計(jì)算出待識(shí)別煙葉病斑特征的隸屬度,依據(jù)隸屬度最大原則得到分類(lèi)結(jié)果。圖4中虛線箭頭表示訓(xùn)練樣本的流程,實(shí)線表示識(shí)別的流程。本實(shí)驗(yàn)采集100張包含角斑病、野火病、赤星病和蛙眼病待識(shí)別病害圖像,把待識(shí)別的病害圖像進(jìn)行去噪、分割和特征提取,計(jì)算待識(shí)別的100個(gè)樣本與聚類(lèi)中心v1,v2的距離,根據(jù)隸屬度函數(shù)計(jì)算最大隸屬度,識(shí)別該病斑的類(lèi)別。識(shí)別結(jié)果見(jiàn)表1。
表1 煙葉病害識(shí)別結(jié)果
從實(shí)驗(yàn)的結(jié)果可見(jiàn),在植保專(zhuān)家的指導(dǎo)下選取的樣本得到了很好的訓(xùn)練結(jié)果,所以兩種病害的識(shí)別率很高,達(dá)到了實(shí)驗(yàn)的要求,驗(yàn)證了本文技術(shù)手段的可行性。在對(duì)100個(gè)驗(yàn)證樣本集進(jìn)行識(shí)別時(shí),角斑病和野火病的識(shí)別率是很高的,存在很少的誤識(shí)情況,實(shí)現(xiàn)了煙葉病害的自動(dòng)識(shí)別。因?yàn)楸疚臎](méi)有建立赤星病和蛙眼病的標(biāo)準(zhǔn)模式特征庫(kù),所以二者的拒識(shí)率非常高,這需要采集更多種類(lèi)的煙葉病害圖像,建立相關(guān)的特征庫(kù)。
4 結(jié) 語(yǔ)
本文研究了基于圖像處理和模糊模式識(shí)別的煙葉病害識(shí)別方法,描述圖像去噪、分割和病害特征提取及模糊模式識(shí)別的過(guò)程,采用模糊識(shí)別中的最大隸屬度原則實(shí)現(xiàn)了病害的自動(dòng)識(shí)別,設(shè)計(jì)的自動(dòng)病害識(shí)別系統(tǒng)對(duì)煙葉發(fā)生率較高的角斑病和野火病的識(shí)別率較高,這充分證明本研究選取的特征參數(shù)和采用的模糊模式識(shí)別的方法是可行的。實(shí)際生產(chǎn)中煙葉的病害種類(lèi)較多,病害的復(fù)雜度也較高,故本研究應(yīng)在健全模式特征庫(kù),增強(qiáng)病害的識(shí)別精度和煙葉受害程度等方面做進(jìn)一步深入研究。
參考文獻(xiàn)
[1] 王靜,張?jiān)苽?一種煙葉病害的圖像增強(qiáng)處理方法[J].中國(guó)農(nóng)學(xué)通報(bào),2011,27(6):469?472.
[2] SASAKI Yutaka, SUZUKI Masato. Construction of the automatic diagnosis system of plant disease using genetic programming which paid its attention to variety [C]// ASAE Meeting Presentation. [S.l.]: ASAE, 2003: 111?120.
[3] 馬德貴,邵陸壽,葛婧,等.水稻稻瘟病及水稻紋枯病病害程度圖像檢測(cè)[J].中國(guó)農(nóng)學(xué)通報(bào),2008,24(9):485?489.
[4] 田有文,李天來(lái),李成華,等.基于支持向量機(jī)的葡萄病害圖像識(shí)別方法[J].農(nóng)業(yè)工程學(xué)報(bào),2007,23(6):175?180.
[5] 譚峰,馬曉丹.基于葉片的植物病蟲(chóng)害識(shí)別方法[J].農(nóng)機(jī)化研究,2009,31(6):41?43.
[6] 王曉峰.植物葉片圖像自動(dòng)識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D].合肥:中科院合肥智能機(jī)械研究所,2005.
[7] SONKA Milan, HLAVAC Vaclav, BOYLE Roger.圖像處理、分析與機(jī)器視覺(jué)[M].艾海舟,蘇延超,譯.北京:清華大學(xué)出版社,2011.
[8] 鄭群輝,唐延?xùn)|.基于圖像統(tǒng)計(jì)信息的去椒鹽噪聲算法[J].計(jì)算機(jī)應(yīng)用,2009,29(7):1943?1946.
[9] 徐月芳.基于遺傳模糊C?均值聚類(lèi)算法的圖像分割[J].西北工業(yè)大學(xué)學(xué)報(bào),2002,20(4):549?553.
[10] HUMPHRIES S, SIMONTON W. Identification of plant parts using color and geometric image data [J]. Transactions of the ASAE, 1993, 36(5): 1493?1500.
[11] 任燕.基于模糊C?均值聚類(lèi)圖像分割技術(shù)研究[J].科技通報(bào),2012,28(4):206?208.
[12] 宋凱.基于計(jì)算機(jī)視覺(jué)的農(nóng)作物病害識(shí)別方法的研究[D].沈陽(yáng):沈陽(yáng)農(nóng)業(yè)大學(xué),2008.
[13] MURAKAMI S, HOMMA K, KOIKE T. Detection of small pests on vegetable leaves using GLCM [J]. American Society of Agricultural Engineers Paper Number, 2012, 9(5): 56?76.
[14] TAKUJI kaburagi, TAKEUCHI Hiroya, FUJII Hirofumi, et al. Initial experience of individualized chemoradiotherapy for superficial esophageal cancers based on the sentinel lymph node concept [J]. Esophagus, 2012, 9(3): 147?152.