劉哲,黃文準(zhǔn),王利平
基于引力核密度聚類算法的作物病害葉片區(qū)域的快速檢測(cè)
劉哲,黃文準(zhǔn),王利平
(西京學(xué)院信息工程學(xué)院,陜西 西安 710123)
針對(duì)作物病害葉片圖像的復(fù)雜性和模糊性,提出一種基于引力核密度聚類算法的作物葉片病害區(qū)域快速檢測(cè)方法:首先,在RGB顏色空間提取病害葉片圖像的R通道值,根據(jù)R值的特征直方圖特性,運(yùn)用多項(xiàng)式擬合特征直方圖曲線,根據(jù)導(dǎo)數(shù)性質(zhì)確定擬合特征直方圖曲線的峰值點(diǎn)和峰值區(qū)域,確定病害葉片圖像聚類數(shù)和初始聚類中心;根據(jù)初步確定的病變?nèi)~片圖像的聚類中心,運(yùn)用引力核密度聚類算法快速完成對(duì)病害葉片病斑的分割。試驗(yàn)結(jié)果表明,基于引力核密度聚類算法的平均分割精度達(dá)80%以上,平均檢測(cè)時(shí)間為4.912 s,優(yōu)于已有病害區(qū)域分割算法K–means和Meanshift的性能。
引力核密度聚類算法;作物病害葉片;圖像分割;顏色空間
在運(yùn)用機(jī)器視覺(jué)技術(shù)對(duì)作物葉片病害癥狀進(jìn)行自動(dòng)檢測(cè)過(guò)程中,對(duì)病害葉片圖像的分割直接影響特征提取的可靠性和病害識(shí)別的準(zhǔn)確性。近年來(lái),基于統(tǒng)計(jì)模式識(shí)別、K均值聚類、模糊C均值聚類、Otsu、EM等算法,提出了許多作物病害葉片圖像分割方法[1-4]。ZHANG等[5]提出一種基于混合聚類的植物病害葉片圖像分割方法:首先通過(guò)超像素聚類將整個(gè)彩色葉片圖像分成若干個(gè)緊湊和近似均勻的超像素,提供有用的聚類線索來(lái)指導(dǎo)圖像分割,從而加快期望最大化(EM)算法的收斂速度,從每個(gè)超像素中快速準(zhǔn)確地分割出病變像素點(diǎn)。YUAN等[6]提出了一種復(fù)雜背景的作物病害葉片分割方法,利用加權(quán)帕爾遜窗口可以得到最佳的分割閾值。ARIVAZHAGAN等[7]提出了一種植物葉片病害自動(dòng)檢測(cè)與分類的軟件解決方案,該方案使用特定的閾值對(duì)綠色像素進(jìn)行掩蔽和去除,在此基礎(chǔ)上計(jì)算出紋理統(tǒng)計(jì)信息,對(duì)圖像進(jìn)行有效的分割。GUI等[8]提出了一種基于復(fù)雜背景的彩色大豆葉片圖像的病害檢測(cè)系統(tǒng),該系統(tǒng)根據(jù)K 均值算法,結(jié)合經(jīng)驗(yàn)閾值,利用凸點(diǎn)映射從大豆葉片病害圖像中分割出顯著區(qū)域。TAJANE等[9]提出了利用canny邊緣檢測(cè)算子和直方圖分析來(lái)識(shí)別藥用植物葉片病害的內(nèi)容圖像庫(kù)檢索方法。該方法首先平滑圖像,以消除噪聲并找到圖像梯度以突出具有高空間導(dǎo)數(shù)的區(qū)域,隨后根據(jù)藥用植物葉片的邊緣特征進(jìn)行病害檢測(cè)。TUCKER等[10]重點(diǎn)研究了燕麥和向日葵葉中的病害分類和檢測(cè)方法,首先用不同的閾值分割被測(cè)病害(枯萎病或銹病)的圖像,然后使用聚類方法將隨后的像素劃分到聚類中,以表示病變區(qū)域,根據(jù)病害的特點(diǎn)將其分為適當(dāng)?shù)念悇e。HARSHADKUMAR等[11]通過(guò)收集水稻的葉片,制作了一組白色背景的水稻植株葉片圖像,首先利用grabcut分割方法從圖像中去除背景,然后使用K均值聚類法提取葉片圖像中的病害部分。在應(yīng)用K均值聚類后,利用閾值技術(shù)從病斑部分去除一些不必要的綠色區(qū)域,最后在病害部位提取88個(gè)特征,建立支持向量機(jī)(SVM)模型對(duì)病變進(jìn)行分類。HIARY等[12]提出了一種葉病害圖像分割算法,該算法首先識(shí)別大多數(shù)綠色像素,然后根據(jù)Otsu分割方法計(jì)算的特定閾值來(lái)掩蔽這些像素,最后使用紅色、綠色和藍(lán)色的零值以及邊界上的像素來(lái)掩蔽這些像素,以完全刪除受感染的群集。KAUR等[13]提出了一種基于彩色圖像K–means聚類算法的葡萄病害葉片圖像分割方法。YU等[14]提出了一種用于作物病害葉片分割的分水嶺算法。CHAUDHARY等[15]提出了一種利用最大期望(EM)處理技術(shù)進(jìn)行病害斑點(diǎn)分割的算法,并比較了CIELAB、HSI和YCbCr顏色空間在病害斑點(diǎn)檢測(cè)過(guò)程中的效果。MOHAN等[16]、QIN等[17]、HERNADES等[18]、ASRAF等[19]在研究病害葉片分割時(shí),進(jìn)一步運(yùn)用支持向量機(jī)、鄰域嵌入等方法研究病害的識(shí)別,準(zhǔn)確率都達(dá)到80%以上。
上述研究運(yùn)用于作物葉片病害區(qū)域圖像的檢測(cè)算法,主要是圖像閾值分割算法和圖像聚類算法。由于作物病害的致病病原種類不同,會(huì)產(chǎn)生形狀、顏色、紋理等差異較大的病斑、孔洞等特異性癥狀,這時(shí)用全局閾值分割算法很難將病斑從葉片中分割出來(lái),需要運(yùn)用多閾值分割算法才能完成,但多閾值的確定往往需要輔以人工參與,這樣就使得算法喪失了普適性和智能化。在用圖像聚類算法進(jìn)行葉片病斑分割時(shí),事先需要人工確定類族的個(gè)數(shù),這使得算法的適應(yīng)性比較差,也容易導(dǎo)致分割錯(cuò)誤。為了解決上述問(wèn)題,筆者提出一種基于引力核密度聚類算法的作物葉片病害區(qū)域快速檢測(cè)方法:首先,在RGB顏色空間提取作物病害葉片圖像的R通道值,根據(jù)R值的特征直方圖特性,運(yùn)用多項(xiàng)式擬合特征直方圖曲線,根據(jù)導(dǎo)數(shù)性質(zhì)確定擬合特征直方圖曲線的峰值點(diǎn)和峰值區(qū)域;接著,根據(jù)峰值區(qū)域和峰值點(diǎn)確定病變?nèi)~片圖像聚類數(shù)和初始聚類中心;根據(jù)初步確定的病害葉片圖像的聚類中心,運(yùn)用引力核密度聚類算法完成對(duì)病害葉片病斑的快速分割。仿真試驗(yàn)驗(yàn)證結(jié)果表明,分割精度平均達(dá)80%以上,平均檢測(cè)時(shí)間為4.912 s,從而實(shí)現(xiàn)快速精確地對(duì)病害葉片區(qū)域進(jìn)行分割。
a 小麥病害葉片;b 黃瓜病害葉片;c 玉米病害葉片;d 番茄病害葉片。
圖1–a,病害區(qū)域呈現(xiàn)白色;圖1–b,病害區(qū)域呈現(xiàn)黃色;圖1–c,病害區(qū)域呈現(xiàn)紅色;圖1–d,病害區(qū)域呈現(xiàn)紫褐色。
對(duì)病害葉片圖像病斑進(jìn)行分割,在RGB空間,通過(guò)對(duì)病害葉片的R、G、B 3種顏色分量進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)從正常葉片區(qū)域過(guò)渡到病害區(qū)域,紅色分量的變化幅度最大。圖2中,a1、b1、c1、d1的R、G、B顏色變化曲線分別對(duì)應(yīng)a、b、c、d中所標(biāo)記行的像素的R、G、B值,標(biāo)記部分如圖2中a、b、c、d所示的白線。由圖2知,所標(biāo)記的行中既包括正常葉片的像素,也包括病害葉片的像素。由三顏色變化曲線可以看出,紅色R在正常葉片區(qū)域的值較小,而在病害葉片區(qū)域的值突然變大,甚至在三顏色中達(dá)到最大,所以從正常葉片區(qū)域過(guò)渡到病害區(qū)域,紅色變化幅度最大,而綠色和藍(lán)色的變化比較平緩,這說(shuō)明正常葉片區(qū)域像素的紅色與病害葉片區(qū)域紅色的差異性最大,可以作為病害圖像分割的依據(jù)。
a 標(biāo)記的小麥病害圖像;b 標(biāo)記的黃瓜病害圖像;c 標(biāo)記的玉米病害圖像;d 標(biāo)記的番茄病害圖像;a1 小麥標(biāo)記區(qū)域三顏色變化曲線;b1 黃瓜標(biāo)記區(qū)域三顏色變化曲線;c1 玉米標(biāo)記區(qū)域三顏色變化曲線;d1 番茄標(biāo)記區(qū)域三顏色變化曲線。
在Lab顏色空間中,L代表亮度,a、b代表色度。圖3中a、b、c、d分別是圖1中所對(duì)應(yīng)原圖的Lab顏色空間的病害葉片圖,圖像中的白線是經(jīng)過(guò)標(biāo)記的行;a1、b1、c1、d1是對(duì)應(yīng)原圖所標(biāo)記行像素的L、a、b分量變化曲線。由圖3知,所標(biāo)記的行中既包括正常葉片的像素,也包括病害葉片的像素。從a1、b1、c1、d1所顯示的L、a、b三分量變化曲線可以看出,亮度L在正常葉片區(qū)域的值較小,而在病害葉片區(qū)域的值突然變大,甚至在3個(gè)分量中達(dá)到最大,所以從正常葉片區(qū)域過(guò)渡到病害區(qū)域,亮度L變化幅度最大,而色度a和色度b變化比較平緩,這說(shuō)明正常葉片區(qū)域像素的亮度L與病害葉片區(qū)域亮度L的差異最大,可作為病害葉片圖像分割的依據(jù)。
a 標(biāo)記的小麥病害圖像;b 標(biāo)記的黃瓜病害圖像;c 標(biāo)記的玉米病害圖像;d 標(biāo)記的番茄病害圖像;a1 小麥標(biāo)記區(qū)域三顏色變化曲線;b1 黃瓜標(biāo)記區(qū)域三顏色變化曲線;c1 玉米標(biāo)記區(qū)域三顏色變化曲線;d1番茄標(biāo)記區(qū)域三顏色變化曲線。
分析作物病害葉片圖像特征,發(fā)現(xiàn)病害葉片圖像的組成有2種模式:第1種,病害葉片圖像由病斑和葉片2個(gè)區(qū)域構(gòu)成;第2種,病害葉片圖像由病斑、葉片和背景3個(gè)區(qū)域構(gòu)成。絕大多數(shù)病害葉片在直方圖上呈現(xiàn)出雙峰或三峰的特征,如圖4中a1、b1、c1、d1所示的病害葉片紅色通道的直方圖,其所對(duì)應(yīng)的病害葉片圖如圖1中的a、b、c、d所示。紅色R直方圖的不同峰值區(qū)域代表病害葉片圖像不同區(qū)域,峰值區(qū)域的峰值點(diǎn)代表在該區(qū)域內(nèi)出現(xiàn)次數(shù)最多的像素點(diǎn)。
圖4 病害葉片的特征直方圖
在式(3)的基礎(chǔ)上,分別對(duì){0,1,2,…, a}求偏導(dǎo)數(shù),并等于0,得到:
將式(4)寫成矩陣的形式,得到式(5)。
峰值點(diǎn)的尋找通過(guò)對(duì)多項(xiàng)式(1)求導(dǎo),令導(dǎo)數(shù)等于0,求導(dǎo)結(jié)果如式(6)。
在找到特征直方圖擬合曲線的所有峰值點(diǎn)后,通過(guò)峰值點(diǎn)對(duì)應(yīng)的顏色值,即找到了病害葉片直方圖的所有峰值區(qū)域,也就大致找到了病害葉片的不同區(qū)域。以該區(qū)域的峰值點(diǎn)作為初始的聚類中心,對(duì)病害葉片進(jìn)行聚類分割。至此,根據(jù)特征直方圖的峰值區(qū)域和峰值點(diǎn),可以初步確定病害葉片的聚類數(shù)和聚類中心。
1.5.1像素間的引力計(jì)算
式中:為萬(wàn)有引力;和為2個(gè)物體的質(zhì)量;為萬(wàn)有引力常數(shù);為物體間的距離。根據(jù)萬(wàn)有引力公式,如果一個(gè)物體的質(zhì)量越大,它對(duì)別的物體吸引力越大;彼此間的距離越近,吸引力也越大。宇宙中,如果一個(gè)星體的質(zhì)量很大,許多小行星就會(huì)以這個(gè)星體為中心,圍繞它旋轉(zhuǎn),形成一個(gè)星系。基于此,提出引力核密度聚類算法:聚類中心類似于大星體,按照聚類中心對(duì)其他像素引力的大小來(lái)判斷像素的歸類。
對(duì)于R取值為(=0,1,…,255)的像素,其個(gè)數(shù)為n,則該像素點(diǎn)的質(zhì)量為m,m=nρ,=0,1,…,255。
為了計(jì)算方便,取=1。
1.5.2引力核密度聚類算法
2) 計(jì)算每個(gè)像素點(diǎn)s到不同I(=1,2,…,)的引力sp;
3) 按照引力sp的大小將像素點(diǎn)s劃分到相應(yīng)的聚類,即選取對(duì)像素點(diǎn)引力最大的聚類中心,將像素點(diǎn)劃分到該類;
4) 對(duì)劃分后的聚類,用該類的質(zhì)心作為新的聚類中心,更新原來(lái)的聚類中心;
5) 轉(zhuǎn)到2)反復(fù)迭代,直到聚類中心不再發(fā)生變化;
6) 算法停止。
與傳統(tǒng)的K–means聚類算法和Meanshift聚類算法相比,引力核密度聚類算法具有一定的自適應(yīng)性,能夠自動(dòng)選取聚類數(shù)目和初始聚類中心,這樣就大大加快了算法的收斂速度。
將引力核密度聚類算法、K–means聚類算法和Meanshift聚類算法對(duì)病害葉片的病斑分割效果進(jìn)行對(duì)比,結(jié)果如圖5所示。由圖5可以看出,由于引力核密度聚類算法不僅考慮了像素間的顏色信息、空間信息,而且還考慮了像素的數(shù)量信息(密度),所以抗噪聲性能較好,區(qū)域定位效果較好,分割精度較高,能較好地將病斑區(qū)域完整分割出來(lái),錯(cuò)分和漏分的情況較少。K–means算法只是單純考慮像素間顏色的相似性,其顏色相似性通過(guò)歐氏距離來(lái)計(jì)算,而沒(méi)有考慮像素間的空間關(guān)系,所以抗噪性能弱,分割精度較差,容易出現(xiàn)錯(cuò)分的現(xiàn)象,尤其是在聚類數(shù)和聚類中心選擇不當(dāng)時(shí),會(huì)導(dǎo)致分類錯(cuò)誤。K–means算法在分類中容易將非病區(qū)域錯(cuò)分成病害區(qū)域,分割精度高,但分割區(qū)域的邊緣會(huì)存在很多“毛刺”。Meanshift算法的分類效果完全取決于帶寬的選擇,如果帶寬選擇過(guò)大,容易出現(xiàn)過(guò)分割,帶寬選擇過(guò)小,則容易出現(xiàn)欠分割。
a1、a2、a3分別是引力核密度聚類算法、K–means算法、Meanshift算法的分割結(jié)果;b1、b2、b3分別引力核密度聚類算法、K–means算法、Meanshift算法的分割結(jié)果;c1、c2、c3分別引力核密度聚類算法、K–means算法、Meanshift算法的分割結(jié)果;d1、d2、d3分別引力核密度聚類算法、K–means算法、Meanshift算法的分割結(jié)果。
為了對(duì)引力核密度聚類算法進(jìn)行定量分析,選取200張作物病害葉片圖像進(jìn)行綜合分析比較。仿真平臺(tái)為Window 8.1 操作系統(tǒng), CPU 為2.8 GHZ, 內(nèi)存16 G, 編程環(huán)境MATLABR2017a。從執(zhí)行時(shí)間、迭代次數(shù)、分割精度3個(gè)性能,對(duì)引力核密度聚類、K–means算法和Mean shift算法進(jìn)行綜合定量分析,其比較結(jié)果如表1所示。其中,分割精度是指算法分割的病斑區(qū)域面積與人工標(biāo)記病斑區(qū)域面積的比值。
表1 算法性能對(duì)比
為了快速精確地提取出作物病害葉片的病斑圖像,提出了一種基于引力核密度聚類算法的作物葉片病害區(qū)域快速檢測(cè)方法??朔藗鹘y(tǒng)K–means聚類算法和Meanshift聚類算法的缺點(diǎn),能夠自動(dòng)確定聚類中心、聚類數(shù),綜合考慮了像素間的顏色信息、空間信息、密度信息,能夠自動(dòng)、快速、準(zhǔn)確地完成病害葉片的分割,而且能夠得到較高的分割精度。今后將重點(diǎn)研究通過(guò)不同顏色空間的信息融合,提出更加有效的病害葉片圖像分割算法,為作物病害圖像識(shí)別提供良好的技術(shù)支撐。
[1] REVATHY R,CHENNAKESAVAN S A.Threshold based approach for disease spot detection on plant leaf[J].Trans Eng Sci,2015,3(5):72–75.
[2] LI G L,ZHANG H C.Segmentation of color images of grape disease using K_means clustering algorithm[J].Trans CSAE,2012,26(2):32–37.
[3] BANDI S R,AVAR D,CHINNASAMY A.Performance evaluation of various statistical classifiers in detecting the diseased citrus leaf[J].Int J Eng Sci Technol,2013,5(2):298–307.
[4] Al-TARAWNEH M S.An empirical investigation of olive leaf spot disease using auto-cropping segmentation and fuzzy c-means classification[J].World Appl Sci J,2013,23(9):1207–1211.
[5] ZHANG S W,YOU Z H,WU X W.Plant disease leaf image segmentation based on superpixel clustering and EM algorithm[J].Neural Comput & Applic,2019,31:1225–1232.
[6] YUAN Y,LI M,LIANG Q,et al.Segmentation method for crop disease leaf images with complex background[J]. Trans CSAE,2011,27(2):208–212.
[7] ARIVA,ZHAGAN S,NEWLINn SHEBIAH R,et al. Detection of unhealthy region of plant leaves and classification of plant leaf diseases using texture features[J].Agric Eng Int,2013,15(1):211–217.
[8] GUI J S,HAO L,ZHANG Q,et al.A new method for soybean leaf disease detection based on modified salient regions[J].Int J Multimed Ubiquitous Eng,2015,10(6):45–52.
[9] TAJANE V,JANWE N J.Medicinal plants disease identification using canny edge detection algorithm histogram analysis and CBIR[J].Int J Adv Res Comput Sci Soft Eng,2014,4(6):530–536.
[10] TUCKER C C,CHAKRAK RABORY S.Quantitative assessment of lesion characteristics and disease severity using digital image processing[J].J Phytopathol,2015,145(7):273–278.
[11] HARSHAD KUMAR B.PRAJAPATI.Detection and classification of rice plant diseases[J]. Intelligent Decision Technologies,2017,11(4):357–373.
[12] AL-HIARY H,BANI-AHMAD S,REYALAT M,et al. Fast and accurate detection and classification of plant diseases[J].Int J Comput Appl,2011,17(1):31–38.
[13] KAUR R,KANG S S.An enhancement in classifier support vector machine to improve plant disease detection[C]//IEEE 3rd International Conference on Innovation and Technology in Education (MITE),2015:135–140.
[14] YUGANG R,JIAN Z,MIAO L,et al.Segmentation method for crop disease leaf images based on watershed algorithm[J].J Comput Appl,2012,32(3):752–755.
[15] CHAUDHARY P,CHAUDHARY A K,CHEERAN A N,et al.Color transform based approach for disease spot detection on plant leaf[J].Int J Comput Sci Telecommun,2012,3(6):65–70.
[16] MOHAN K J,BALASUBRAMANIANM,PALANIVEL S. Detection and recognition of diseases from Paddy Plant leaf images[J].Int J Comput Appl,2016,141(12):34–41.
[17] QIN F,LIU D,SUN B,et al.Identification of alfalfa leaf diseases using image recognition technology[J].PLoS ONE,2016,11:e0168274.
[18] HERNANDES D L, RAMOS QUINTANA F, GUERRERO JUK J.Integrating soms and a bayesian classifier for segmenting diseased plants in uncontrolled environments[J].Sci World J,2017,214–219.
[19] ASRAF H M,NOORITAWATI M T,RIZAM M S.A comparative study in kernel-based support vector machine of oil palm leafs nutrient disease[J].Procedia Engineering,2012,41(2):1353–1359.
Rapid detection of diseased leaf area based on gravity kernel density clustering algorithm
LIU Zhe, HUANG Wenzhun, WANG Liping
(Department of Electronic and Information Engineering, Xijing University, Xi’an, Shaanxi 710123, China)
In view of the complexity and fuzziness of the diseased leaf image, a fast detection method of diseased area of plant leaf based on gravitational kernel density clustering algorithm is proposed. Firstly, the R-channel value of the diseased leaf image is extracted in RGB color space. According to the characteristic histogram characteristics of the diseased leaf R value, the characteristic histogram curve is fitted by polynomial. The peak point and the peak area of the fitting characteristic histogram curve are determined according to the derivative property. Then, the clustering number and the initial clustering center of diseased leaf images are determined according to the peak area and the peak point. Secondly, according to the preliminarily determined clustering center of the diseased leaves’ image, the gravitational kernel density clustering algorithm proposed in this paper is used to quickly segment diseased leaves. The experimental results show that the average segmentation precision based on gravity kernel density clustering algorithm is more than 80%, and the average detection time is 4.912 s, which is better than the performance of existing disease region segmentation algorithm K-means and Meanshift.
gravitational kernel density clustering algorithms; crop leaf; image segmentation; color space
TN911.73
A
1007-1032(2020)04-0488-07
10.13331/j.cnki.jhau.2020.04.017
劉哲,黃文準(zhǔn),王利平.基于引力核密度聚類算法的作物病害葉片區(qū)域的快速檢測(cè)[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,46(4):488–494.
LIU Z, HUANG W Z, WANG L P. Rapid detection of diseased leaf area based on gravity kernel density clustering algorithm[J]. Journal of Hunan Agricultural University(Natural Sciences), 2020, 46(4): 488–494.
http://xb.hunau.edu.cn
2019–11–12
2020–05–15
國(guó)家自然科學(xué)基金項(xiàng)目(61473237);陜西省科學(xué)技術(shù)廳重點(diǎn)研發(fā)項(xiàng)目(2017ZDXM–NY–088)
劉哲(1972—),男,陜西西安人,博士,教授,主要從事人工智能和智慧農(nóng)業(yè)研究,75741733@qq.com
責(zé)任編輯:羅慧敏
英文編輯:吳志立