夏永泉,王 兵,支 俊,黃海鵬,孫靜茹
(鄭州輕工業(yè)學(xué)院 計(jì)算機(jī)與通信工程學(xué)院,河南 鄭州 450001)
基于EM和K-means混合聚類(lèi)方法的植物葉片病害區(qū)域自動(dòng)提取
夏永泉,王 兵*,支 俊,黃海鵬,孫靜茹
(鄭州輕工業(yè)學(xué)院 計(jì)算機(jī)與通信工程學(xué)院,河南 鄭州 450001)
針對(duì)植物病害區(qū)域如何準(zhǔn)確提取的問(wèn)題,文中提出了一種基于EM和K-means混合聚類(lèi)的方法。該方法在目標(biāo)與背景具有較明顯差異的情況下,可以有效地將葉片目標(biāo)提取出來(lái),并對(duì)較復(fù)雜背景也具有一定的甄別效果,優(yōu)于其他經(jīng)典方法。利用植物病害區(qū)域的褪綠特點(diǎn),用K-means方法結(jié)合Lab顏色空間,利用Lab顏色空間顏色分布的均勻性,提取A分量作為參考分量,將病害區(qū)域從葉片目標(biāo)中提取出來(lái)。通過(guò)Matlab仿真實(shí)驗(yàn),結(jié)果表明,基于EM和K-means混合聚類(lèi)方法的植物病害區(qū)域提取是可行的。
植物病害區(qū)域;EM算法;Lab顏色空間;K-means算法;混合聚類(lèi)
中國(guó)作為農(nóng)業(yè)大國(guó),其植物病害的暴發(fā),可以直接造成經(jīng)濟(jì)損失甚至導(dǎo)致人類(lèi)饑荒,所以對(duì)這方面應(yīng)充分給予重視。隨著計(jì)算機(jī)技術(shù)的發(fā)展,將數(shù)字圖像處理和圖像分析技術(shù)應(yīng)用到植物病害檢測(cè)識(shí)別已成為主流,既可以節(jié)省人工成本也可以提高識(shí)別的準(zhǔn)確度。圖像分割是視覺(jué)識(shí)別的前提和關(guān)鍵,分割結(jié)果的優(yōu)劣直接影響著后續(xù)處理過(guò)程。對(duì)于植物病害區(qū)域的分離,胡維煒等[1]通過(guò)HSV、Lab特征空間聚類(lèi)算法逐步分離目標(biāo)葉片和病斑區(qū)域,并采用區(qū)域填充法減少葉面水珠,可以準(zhǔn)確定量化評(píng)估大豆作物的病害程度。李冠林等[2]利用Lab顏色模式下ab二維數(shù)據(jù)空間的顏色差異,以平方歐式距離作為像素間的像素距離和均方差作為聚類(lèi)準(zhǔn)則函數(shù)對(duì)顏色進(jìn)行二分類(lèi)聚類(lèi),實(shí)現(xiàn)了葡萄病害彩色圖像的分割處理。張武等[3]將K-means聚類(lèi)、otsu閾值法等多種方法結(jié)合,多次進(jìn)行分割,最終分割出帶有病斑的小麥病斑圖像。圍繞目標(biāo)的提取問(wèn)題,鄒秋霞等[4]在Lab顏色空間對(duì)a分量進(jìn)行閾值分割,并對(duì)比了ab分量 的K-means聚類(lèi)算法的分割效果,去除了葉片的陰影部分,方便了葉片的精準(zhǔn)提取。謝從華等[5]提出了一種新的基于高斯混合模型特征函數(shù)的圖像特征序列描述方法,用自適應(yīng)的方法解決了葉片圖像的植物數(shù)據(jù)庫(kù)的歸類(lèi)問(wèn)題。郭晶晶等[6]針對(duì)傳統(tǒng)高斯混合模型分割算法在分割上存在的不足,結(jié)合Lab色彩模型的顏色和空間的相關(guān)性,對(duì)于果樹(shù)區(qū)域分割的準(zhǔn)確性有了很大的提升。
傳統(tǒng)高斯混合模型在RGB圖像基礎(chǔ)上,對(duì)植物病害區(qū)域直接聚類(lèi)分割效果并不理想。上述這些病害區(qū)域分割和葉片提取多利用了LAB顏色空間顏色均勻的特點(diǎn),聚類(lèi)效果理想,但背景對(duì)于目標(biāo)區(qū)域的影響又會(huì)降低目標(biāo)提取的準(zhǔn)確性。將二者進(jìn)行結(jié)合,可以有效地克服這個(gè)缺點(diǎn)。大多數(shù)的算法是對(duì)剪裁后的圖像進(jìn)行目標(biāo)提取和后續(xù)處理,需要進(jìn)行人工干預(yù)來(lái)獲得較好的子圖像,本文在對(duì)目標(biāo)葉片進(jìn)行自動(dòng)提取的基礎(chǔ)上,提出了一種植物病害區(qū)域分割的方法,可以有效地將植物病害區(qū)域提取出來(lái),降低背景對(duì)于目標(biāo)區(qū)域的影響,使得植物病害區(qū)域的分割更加準(zhǔn)確。
對(duì)于植物葉片目標(biāo)的提取目前沒(méi)有很好的通用算法,在無(wú)監(jiān)督的情況下,圖像分割大致分為了兩類(lèi):基于邊緣檢測(cè)和像素篩選。對(duì)于邊緣檢測(cè),一些未閉合的非聯(lián)通區(qū)域可能會(huì)出現(xiàn)在分割圖像中,而像素篩選可能會(huì)產(chǎn)生多余的分類(lèi)。獨(dú)立的像素可以通過(guò)一些濾波器輕易濾除,而未封閉的區(qū)域通常給物體檢測(cè)帶來(lái)很大的負(fù)面影響。此外,對(duì)于復(fù)雜背景而言,可能會(huì)分割出來(lái)一些不想要的目標(biāo)。本文的像素篩選是像素的無(wú)監(jiān)督聚類(lèi),采用了基于高斯混合模型和EM算法結(jié)合對(duì)植物葉片進(jìn)行了提取。此方法的目的是對(duì)植物葉片進(jìn)行提取,而不是對(duì)葉片病害區(qū)域進(jìn)行分割。雖然K-means效果不錯(cuò),但由于K的初始值的確定具有隨機(jī)性,在對(duì)大圖像進(jìn)行目標(biāo)提取時(shí),每次的結(jié)果可能會(huì)出現(xiàn)細(xì)微的偏差。
在植物葉片目標(biāo)提取的基礎(chǔ)上,將顏色空間從RGB轉(zhuǎn)換為L(zhǎng)ab顏色空間,提取A分量作為參考分量,這時(shí)已經(jīng)去除了背景對(duì)于葉片目標(biāo)和病害區(qū)域的影響,結(jié)合K-means算法對(duì)葉片和病害區(qū)域進(jìn)行聚類(lèi),便可以實(shí)現(xiàn)對(duì)病害區(qū)域較為準(zhǔn)確的提取。
算法優(yōu)勢(shì)是針對(duì)戶(hù)外目標(biāo)或者簡(jiǎn)單背景下的植物病害葉片目標(biāo),可以進(jìn)行連續(xù)有效的分割,不需要人工干預(yù)或者圖像裁剪來(lái)獲得較優(yōu)的子圖像,方便分割處理,為之后的研究工作奠定基礎(chǔ)。
2.1 算法像素篩選提取葉片目標(biāo)
本文采用無(wú)監(jiān)督像素聚類(lèi),對(duì)植物葉片目標(biāo)提取,即利用有限混合模型進(jìn)行聚類(lèi)[7],而不完全數(shù)據(jù)的樣本,其參數(shù)的似然函數(shù)優(yōu)化困難,故采用EM(expectation maximization)算法來(lái)求解最大似然值。這部分聚類(lèi)的作用是去除圖像中無(wú)用的目標(biāo),為下一步植物病害區(qū)域的提取做準(zhǔn)備。這樣提取的目標(biāo)葉片圖像沒(méi)有了背景成分的干擾,在做植物病害區(qū)域提取時(shí),分割效果會(huì)有顯著的提升。
2.1.1 高斯混合模型的基本形式
(1)
(2)
其中μ1……μc和∑1……∑c分別表示各成分的均值和協(xié)方差。
設(shè)Z1,Z2,……,Zn分別為樣本x1,x2,……,xn所屬成分的概率向量,zij=Zj(i)的取值為0或1。取0時(shí)表示樣本xj不屬于樣本第i個(gè)成分,取1時(shí)代表屬于。則最大似然法求解參數(shù)的log似然函數(shù)如公式(3)所示:
L(ω,μ,∑;x1,x2,……,xn)
(3)
原始RGB圖像高斯混合模型輸出如圖1所示。
2.1.2EM算法估計(jì)未知參數(shù)
由于對(duì)數(shù)內(nèi)求和部分計(jì)算十分復(fù)雜,這使得方程整體求解變的十分困難。這時(shí)就需要引入潛變量[8]W來(lái)對(duì)點(diǎn)進(jìn)行標(biāo)記,而不是對(duì)方程直接求解。通過(guò)潛變量W=zki對(duì)像素點(diǎn)來(lái)進(jìn)行標(biāo)記,這樣就可以通過(guò)概率分布來(lái)確定像素點(diǎn)的歸類(lèi)。而潛變量W是未知的,需要EM算法[1]來(lái)進(jìn)行迭代求解。EM算法主要分為2步:
M-Step:對(duì)公式(3)中的μk、 ∑k和ωk求最大值,可得:
圖1 RGB圖像三類(lèi)像素高斯混合模型Fig.1 Three-pixel Gaussian mixture model of RGB image
(4)
基于用于像素聚類(lèi)的最大似然估計(jì)(ML)的顏色分割方法來(lái)對(duì)植物葉片進(jìn)行提取。根據(jù)EM算法原理,使用這種算法來(lái)估計(jì)給定的一組像素?cái)?shù)據(jù)的高斯混合模型的先驗(yàn)概率,然后通過(guò)概率比較來(lái)將每個(gè)像素進(jìn)行分類(lèi),最終實(shí)現(xiàn)像素的篩選,達(dá)到將目標(biāo)葉片提取出來(lái)的目的。隨著EM迭代次數(shù)的增加,分類(lèi)結(jié)果越來(lái)準(zhǔn)確。但為了節(jié)省分割時(shí)間,如果誤差率小于0.1,停止迭代。較為簡(jiǎn)單背景下植物葉片提取結(jié)果如圖2所示。
在較為復(fù)雜的背景下,EM算法結(jié)合高斯混合模型也有一定的甄別作用。由于復(fù)雜背景下,目標(biāo)和背景的相似性很強(qiáng),很難將目標(biāo)從背景下精確地提取出來(lái),提取的葉片目標(biāo)并不準(zhǔn)確。在像素篩選的過(guò)程中,雖然已經(jīng)采用了顏色閾值的方法來(lái)進(jìn)行了一定程度上的彌補(bǔ),但是復(fù)雜背景下的葉片目標(biāo)提取結(jié)果并不盡如人意。對(duì)于陰影區(qū)域和邊緣區(qū)域的判斷不準(zhǔn)確,使得像素篩選的精度不足,總會(huì)出現(xiàn)錯(cuò)誤分割,從而不能將目標(biāo)和背景較為準(zhǔn)確地分割出來(lái)。這將會(huì)在進(jìn)一步的研究中繼續(xù)改進(jìn)。復(fù)雜背景下葉片目標(biāo)的提取結(jié)果與otsu分割方法對(duì)比如圖3所示。
2.2K-means病害區(qū)域提取
這部分聚類(lèi)的作用是利用Lab顏色空間下顏色分布的均勻性,針對(duì)植物褪綠的顏色特點(diǎn),將植物葉片病害區(qū)域提取出來(lái),對(duì)比RGB圖像下的聚類(lèi)更加準(zhǔn)確。
圖2 較為簡(jiǎn)單背景下植物葉片提取結(jié)果Fig.2 The results of plant leaf extraction in the simple context
圖3 復(fù)雜背景下植物葉片目標(biāo)的提取結(jié)果與otsu方法提取結(jié)果對(duì)比Fig.3 Comparison of extraction results of plant leaf target in complex background and otsu method
2.2.1Lab顏色空間轉(zhuǎn)換
絕大部分的彩色圖像是基于RGB顏色三基色模型,但RGB空間中三個(gè)分量之間存在很強(qiáng)的相關(guān)性[9],因此不適于直接用于基于三個(gè)分量獨(dú)立運(yùn)算的圖像分割。但利用各種變換,可以由RGB空間推廣到其他顏色空間[10],其中HSI[11]空間是從色調(diào)、亮度和飽和度三方面描述圖像,比較直觀(guān)且符合人的視覺(jué)特性。但Lab色彩空間是目前最均勻的顏色空間,它與設(shè)備無(wú)關(guān),適用于接近自然光照的場(chǎng)合。
Lab中L表示明度,a、b均表示顏色,這就表明在Lab中明度和顏色是分開(kāi)的,L通道沒(méi)有顏色,a和b通道只有顏色。L、a、b分別取值為0-100(純黑-純白)、-127-128(洋紅-綠)、-127-128(黃-藍(lán))。正、負(fù)分別為暖色、冷色。紅綠分量a可以作為評(píng)價(jià)顏色最重要的指標(biāo)之一[12],它能很好地反映植物病害葉片褪綠的顏色狀態(tài)。
2.2.2K-means算法提取植物病斑區(qū)域
經(jīng)過(guò)上一步對(duì)植物葉片目標(biāo)提取獲得原始圖像。將提取出來(lái)的葉片目標(biāo)圖像從RGB空間轉(zhuǎn)換到Lab空間,之后運(yùn)用5·5的矩陣窗口對(duì)目標(biāo)進(jìn)行中值濾波去噪,消除噪聲或減弱對(duì)葉片病斑提取的影響。然后運(yùn)用K均值算法對(duì)圖像進(jìn)行分割,僅僅根據(jù)圖像的顏色信息,將顏色相近的像素點(diǎn)劃分到同一簇去,就可以有比較好的分割效果。
K均值(K-means)聚類(lèi)算法[13-14]是目前應(yīng)用較為廣泛的聚類(lèi)分析方法之一。該算法具有快速、直觀(guān)、易于實(shí)現(xiàn)的優(yōu)點(diǎn)。K均值(K-means)聚類(lèi)算法的具體步驟如下:
(1)將數(shù)據(jù)劃分為預(yù)先設(shè)定好的K個(gè)簇,為每個(gè)簇定義一個(gè)質(zhì)心;
(2)將數(shù)據(jù)中的每個(gè)點(diǎn)與距它最近的質(zhì)心聯(lián)系起來(lái)直至再無(wú)數(shù)據(jù)點(diǎn)與相關(guān)質(zhì)心相連,這標(biāo)志早期聚合已完成;
(3)根據(jù)結(jié)果重新計(jì)算K個(gè)質(zhì)心作為每個(gè)簇的質(zhì)心;
(4)當(dāng)獲得K個(gè)新的質(zhì)心時(shí),需要重新將數(shù)據(jù)集中的點(diǎn)與距它最近的新質(zhì)心相綁定并進(jìn)行循環(huán)迭代,直至準(zhǔn)則函數(shù)收斂使平方誤差函數(shù)值最小如式(5)。
(5)
這部分聚類(lèi)的基本思路是從m×n像素大小的圖像數(shù)據(jù)對(duì)象選擇2個(gè)對(duì)象作為代表病斑區(qū)域和正常區(qū)域的初始聚類(lèi)中心,對(duì)于剩下的其他對(duì)象,則根據(jù)他們與聚類(lèi)中心的相速度將其分配給與其最為相似的聚類(lèi)并進(jìn)行標(biāo)記,從而產(chǎn)生兩種新聚類(lèi)標(biāo)記區(qū)域;然后再計(jì)算兩個(gè)新聚類(lèi)的聚類(lèi)中心,繼續(xù)進(jìn)行聚類(lèi);不斷重復(fù)這個(gè)過(guò)程直到聚類(lèi)準(zhǔn)則函數(shù)收斂為止,最終產(chǎn)生的兩種不變的聚類(lèi)標(biāo)記區(qū)域即為分割結(jié)果。
在Lab顏色空間中,所有顏色信息都包含在ab二維空間中,圖像分割可以根據(jù)不同顏色塊差異進(jìn)行聚類(lèi)[15]。圖4為小麥白粉病圖像a和b分量以及對(duì)應(yīng)的直方圖,可以看出病害圖像a和b分量顏色存在明顯差異,直方圖呈現(xiàn)互補(bǔ)的趨勢(shì),表明可以利用a和b分量對(duì)顏色進(jìn)行分類(lèi)。
在Matlab2016仿真軟件下,分別用基于HSI顏色空間最優(yōu)閾值算法[16]、直接進(jìn)行K-means聚類(lèi)和本研究算法對(duì)植物葉片病害區(qū)域進(jìn)行分割,分割結(jié)果如圖5所示:其中A、B、C、D依次為原始圖像、HSI最優(yōu)閾值算法、K-means直接聚類(lèi)和本文研究算法,前兩幅圖片為簡(jiǎn)單背景下植物病斑分割結(jié)果,后兩幅圖片為較復(fù)雜背景下植物病斑分割結(jié)果。
圖4 小麥白粉病a、b分量圖像及直方圖Fig.4 Wheat powdery mildew a, b component image and corresponding histogram
圖5 植物葉片病斑分割結(jié)果Fig.5 Plant leaf sport division results
對(duì)于簡(jiǎn)單背景下的植物病斑分割,由于病斑區(qū)域紋理復(fù)雜、顏色多樣,在采用基于HSI顏色空間的最優(yōu)閾值圖像分割算法不能有效地將病害區(qū)域提取出來(lái),在光照不均勻情況下,陰影部分和光線(xiàn)較暗部分錯(cuò)分為病害區(qū)域,如圖5-a所示。K-means算法結(jié)合Lab顏色空間下的聚類(lèi)算法,雖然對(duì)于復(fù)雜紋理不敏感,但對(duì)于光照不均勻的植物葉片,會(huì)將葉片陰暗區(qū)域誤分割為病斑區(qū)域,對(duì)分割結(jié)果的正確性產(chǎn)生嚴(yán)重影響,如圖5-b所示。在圖像像素?cái)?shù)目比較大的情況下,K初始值的確定具有隨機(jī)性,從而每次的聚類(lèi)結(jié)果會(huì)產(chǎn)生些許的差距,也會(huì)影響分割結(jié)果的準(zhǔn)確性。本研究算法首先對(duì)像素進(jìn)行篩選,較為準(zhǔn)確地提取出植物葉片,盡量避免了背景對(duì)葉片分割的影響,對(duì)于光照不均勻的植物葉片圖像,在進(jìn)行像素篩選時(shí)可以將陰影區(qū)域劃分為背景部分,也減少了因?yàn)楣庹斩l(fā)生顏色改變對(duì)葉片分割的影響。再針對(duì)葉片和病害區(qū)域顏色塊進(jìn)行聚類(lèi),對(duì)復(fù)雜紋理等不利影響不敏感,可以得到較好的分割效果,如圖5-a、b所示。
對(duì)于復(fù)雜背景下的植物病斑分割,由于背景和目標(biāo)的相似性,導(dǎo)致EM算法結(jié)合高斯混合模型提取的植物葉片目標(biāo)并不準(zhǔn)確,這樣后續(xù)的植物病斑區(qū)域分割結(jié)果并不理想,所以本研究算法針對(duì)復(fù)雜背景并不完善,尤其是植物葉片和背景的交界區(qū)域,以及陰影區(qū)域。這樣在后續(xù)的植物病斑分割過(guò)程中,產(chǎn)生的結(jié)果不準(zhǔn)確,如將背景區(qū)域誤分割為病斑區(qū)域。而對(duì)比HSI顏色空間下的最優(yōu)閾值法和直接在Lab顏色空間下采用A分量進(jìn)行K-means算法直接聚類(lèi)的結(jié)果發(fā)現(xiàn),本研究算法盡管存在了不足,但對(duì)比這些算法仍然在一定程度上減少了復(fù)雜背景對(duì)于植物病斑區(qū)域的影響,使得準(zhǔn)確性對(duì)比前兩者有了較大的提升,如圖5-c、d。所以本研究算法對(duì)于復(fù)雜背景下植物葉片病害區(qū)域的提取具有一定的參考價(jià)值。如何在復(fù)雜背景下準(zhǔn)確地提取植物葉片目標(biāo),保證后續(xù)植物葉片病斑區(qū)域分割的準(zhǔn)確度,將在進(jìn)一步的研究中加以改進(jìn)。
為了驗(yàn)證算法的魯棒性和有效性,特地選取具有復(fù)雜紋理、光照不均勻、病害區(qū)域不連續(xù)等特點(diǎn),背景較為簡(jiǎn)單的病害葉片10幅。由于病害區(qū)域較小,很難特別準(zhǔn)確地確定原圖像的像素?cái)?shù)目,因此采用主觀(guān)判定的方法來(lái)確定分割的病變區(qū)域數(shù)目,來(lái)比較分割病害區(qū)域的準(zhǔn)確率。由于分割病害區(qū)域不能保證百分百正確,分割出像素過(guò)小的區(qū)域也不計(jì)入統(tǒng)計(jì)范圍,所以先統(tǒng)計(jì)分割出的區(qū)域數(shù)目,然后再統(tǒng)計(jì)分割正確的區(qū)域數(shù)目(以括號(hào)內(nèi)數(shù)目進(jìn)行表示),結(jié)果如表1所示。
由于HSI最優(yōu)閾值法在圖片分割中存在較嚴(yán)重的誤分割問(wèn)題,故不計(jì)其分割準(zhǔn)確率。通過(guò)實(shí)驗(yàn)驗(yàn)證可以發(fā)現(xiàn),在具有復(fù)雜紋理、光照不均情況下,HSI顏色空間下的最優(yōu)閾值算法總是會(huì)出現(xiàn)過(guò)分割現(xiàn)象,將紋理和葉片陰暗部分誤分割為病害區(qū)域,這樣的情況下,主觀(guān)判斷分割結(jié)果的參考性大大降低,從而影響分割的準(zhǔn)確度。直接進(jìn)行Lab顏色空間下的K-means聚類(lèi)分割結(jié)果雖然也比較不錯(cuò),但是在光照不均等情況下,會(huì)對(duì)病害區(qū)域分割產(chǎn)生誤差,錯(cuò)將陰影部分分割為病害區(qū)域,從而再主觀(guān)對(duì)分割結(jié)果進(jìn)行判斷時(shí),會(huì)錯(cuò)誤識(shí)別分割區(qū)域。圖片1、2、3光照并不均勻,存在陰影部分,在只計(jì)算正確分割區(qū)域的情況下,由于背景較為簡(jiǎn)單,病害區(qū)域明顯且數(shù)目較少,故分割準(zhǔn)確率能夠達(dá)到100%,但最優(yōu)閾值法和K-means在Lab顏色空間下的直接聚類(lèi)會(huì)將光照不均勻的陰影區(qū)域分割出來(lái)。圖片5、6、7光照均勻,背景簡(jiǎn)單,紋理復(fù)雜,所以改進(jìn)算法和K-means算法的比較效果并不明顯,分割效果十分接近,在只計(jì)算正確分割區(qū)域的情況下,準(zhǔn)確率也能達(dá)到100%,但HSI最優(yōu)閾值法很難把復(fù)雜紋理和病害區(qū)域分割出來(lái)。其他圖片有些背景會(huì)對(duì)分割結(jié)果產(chǎn)生影響,導(dǎo)致分割出來(lái)的區(qū)域比病害區(qū)域多,這也使得分割結(jié)果并不如改進(jìn)算法。綜合比較來(lái)看,采用混合聚類(lèi)的改進(jìn)算法對(duì)比K-means算法在Lab顏色空間下的直接聚類(lèi)和HSI最優(yōu)閾值法,具有對(duì)光照和復(fù)雜紋理不敏感的優(yōu)勢(shì),能夠較為正確地將植物葉片病害區(qū)域提取出來(lái),具有更加準(zhǔn)確地分割區(qū)域特性,但混合聚類(lèi)喪失了時(shí)間和計(jì)算簡(jiǎn)單的優(yōu)勢(shì)。在植物葉片自動(dòng)提取的前提下,減少背景對(duì)病害區(qū)域分割的影響,并最終結(jié)合Lab顏色空間中的a分量,運(yùn)用K-means聚類(lèi)算法進(jìn)行病害區(qū)域提取的方法切實(shí)可行并具有較高的魯棒性和有效性。根據(jù)主觀(guān)觀(guān)測(cè)的判斷條件下其分割結(jié)果準(zhǔn)確率達(dá)到94.70%。
表1 分割實(shí)驗(yàn)結(jié)果
Table 1 Segmentation experiment results
圖片序號(hào)SerialNo.原始圖像病變區(qū)域個(gè)數(shù)Numberoforiginalimagelesions改進(jìn)算法Improvealgorithm最優(yōu)閾值算法OptimalthresholdalgorithmK均值直接聚類(lèi)K-meansdirectclustering改進(jìn)算法準(zhǔn)確率Improvealgorithmaccuracy/%K均值直接聚類(lèi)準(zhǔn)確率K-meansdirectclusteringaccuracy/%11313(13)22(11)17(12)100.0092.312721(7)4(1)12(6)100.0085.71355(5)8(5)7(5)100.00100.0042422(19)33(22)26(17)79.1779.17578(7)11(7)8(7)100.00100.0061011(10)3(0)12(10)100.00100.0072130(21)20(1)30(21)100.00100.008912(8)14(7)12(8)88.8988.899812(7)22(5)24(7)87.5087.50103636(29)33(18)40(28)80.5677.78平均值13.317(12.6)17(7.7)18.8(12.1))94.7090.97
本研究提出了一種自動(dòng)葉片目標(biāo)提取方法,將葉片從背景中提取出來(lái),減少背景對(duì)葉片最終病害區(qū)域的分割結(jié)果的影響。并在此基礎(chǔ)上,將提取的葉片轉(zhuǎn)換到Lab顏色空間中,利用了ab分量包含全部顏色信息,并主要用a分量(即病變區(qū)域褪綠現(xiàn)象),再結(jié)合K-means聚類(lèi)方法,將健康區(qū)域和病害區(qū)域聚類(lèi)為2類(lèi),實(shí)現(xiàn)了較為精準(zhǔn)的圖像分割。在與其他經(jīng)典的分割算法來(lái)進(jìn)行比較,發(fā)現(xiàn)研究算法不僅精度較高,對(duì)復(fù)雜紋理、光照不均、顏色信息復(fù)雜等特征的病斑圖像也能提供較好的分割結(jié)果。在復(fù)雜背景下,也具有一定的葉片目標(biāo)提取能力,降低了復(fù)雜背景對(duì)植物葉片病害區(qū)域的影響。為實(shí)現(xiàn)植物病害區(qū)域自動(dòng)分割提供了一種有效途徑,具有較高的現(xiàn)實(shí)意義。
[1] 胡維煒,張武,劉連忠,等. 利用圖像處理技術(shù)計(jì)算大豆葉片相對(duì)病斑面積[J]. 江蘇農(nóng)業(yè)學(xué)報(bào),2016,32(4):774-779. HU W W,ZHANG W,LIU L Z,et al. Measurement of relative lesion area on soybean leaf using image processing technology [J].JiangsuJournalofAgriculturalSciences, 2016, 32(4):774-779. (in Chinese with English abstract)
[2] 李冠林,馬占鴻,黃沖,等. 基于K-means硬聚類(lèi)算法的葡萄病害彩色圖像分割方法[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2010, 26(增刊2):32-37. LI G L, MA Z H, HUANG C, et al. Segmentation of color images of grape diseases using K-means clustering algorithm[J].TransactionsoftheCSAE, 2010, 26(S2): 32-37. (in Chinese with English abstract)
[3] 張武,黃帥,汪京京,等. 復(fù)雜背景下小麥葉部病害圖像分割方法研究[J]. 計(jì)算機(jī)工程與科學(xué),2015,37(7) : 1349-1354. ZHANG W, HUANG S, WANG J J, et al. A segmentation method for wheat leaf images with disease in complex background[J].ComputerEngineering&Science, 2015,37(7): 1349-1354. (in Chinese with English abstract)
[4] 鄒秋霞,楊林楠,彭琳,等. 基于Lab空間和K-means聚類(lèi)的葉片分割算法研究[J]. 農(nóng)機(jī)化研究,2015(9):222-226. ZOU Q X, YANG L N, PENG L, et al. Research on blade segmentation algorithm based on Lad space and K-means clustering[J].JournalofAgriculturalMechanizationResearch, 2015(9): 222-226. (in Chinese)
[5] 謝從華, 王立軍,常晉義. 面向葉子圖像的植物歸類(lèi)的特征序列描述方法[J]. 計(jì)算機(jī)應(yīng)用研究,2012,29(12): 4740-4746. XIE C H, WANG L J, CHANG J Y. Method of signatures description of leaves images for plant categorization[J].ApplicationResearchofComputers, 2012, 29(12): 4740-4746. (in Chinese with English abstract)
[6] 郭晶晶,李慶武,程海粟,等. 基于Lab顏色距離和GMM的樹(shù)木圖像分割算法[J]. 信息技術(shù), 2016(2): 1-9. GUO J J, LI Q W, CHENG H L, et al. Segmentation algorithm of tree image based on lab color-distance and GMM[J].InformationTechnology, 2016(2): 1-9. (in Chinese with English abstract)
[7] 胡慶輝,丁立新,陸玉靖,等. 一種快速、魯棒的有限高斯混合模型聚類(lèi)算法[J]. 計(jì)算機(jī)科學(xué),2013,40(8):191-195. HU Q X, DING L X, LU Y J, et al. Rapid robust clustering algorithm for Gaussian finite mixture model[J].ComputerScience, 2013, 40(8): 191-195. (in Chinese with English abstract)
[8] BILIMES J A. A gentle tutorial of the EM algorithm and its application to parameter cstimation for Gaussian mixture and hidden Markov models[EB/OL]. (1998-03-25). http://ssli.cc.washington.edu/ people/bilmes/mypapers/cm.ps.gz.
[9] 龐曉敏,閔子建,闞江明. 基于HSI和LAB顏色空間的彩色圖像分割[J]. 廣西大學(xué)學(xué)報(bào)(自然科學(xué)版),2011, 36(6): 976-980. PANG X M, MIN Z J, KAN J M. Color image segmentation based on HSI and LAB color space[J].JournalofGuangxiUniversity(NaturalScienceEdition), 2011, 36(6): 976-980. (in Chinese with English abstract)
[10] 李麗君. 結(jié)合空間信息的模糊C均值聚類(lèi)的圖像分割算法[J]. 遼寧石油化工大學(xué)學(xué)報(bào),2010,30(4): 51-53. LI L J. Fuzzy C-Means clustering algorithm with spatial information for image segmentation[J].JournalofLiaoningShihuaUniversity, 2010, 30(4): 51-53. (in Chinese with English abstract)
[11] 閆春來(lái). 彩色圖像分割算法的研究[D]. 成都:電子科技大學(xué),2008: 10-11.
YAN C L. Research on color image segmentation algorithm[D]. Chengdu: University of Electronic Science and Technology, 2008: 10-11. (in Chinese with English abstract)
[12] 楊新. 圖像偏微分方程的原理與應(yīng)用[M]. 上海:上海交通大學(xué)出版社,2003.
[13] 劉晉浩,朱於軍,闞江明. 圖像分割在廢棄木質(zhì)材料連接件檢測(cè)中的應(yīng)用[J]. 廣西大學(xué)學(xué)報(bào)(自然科學(xué)版), 2010, 35(6): 962-966. LIU J H, ZHU Y J, KAN J M. The application of image processing for the segmentation of measured image of waste wood-based materials connector[J].JournalofGuangxiUniversity(NaturalScienceEdition), 2010, 35(6): 962-966. (in Chinese with English abstract)
[14] CHEN T W, CHEN Y L, CHEN S Y. Fast image segmentation based on K-means clustering with histograms in HSI color space[C] // IEEE 10th Workshop on Mutimedia Signal Processing(MMSP08). Queensland, Australia: Carins, 2008: 322-325.
[15] 張強(qiáng),王正林. 精通MATLAB圖像處理[M]. 北京:電子工業(yè)出版社, 2008: 272-279.
[16] 李中健,杜娟,郭璐. 將Otsu用于多閾值彩色圖像分割的方法及優(yōu)化[J]. 計(jì)算機(jī)工程與應(yīng)用,2010, 46(11): 176-178. LI Z J, DU J, GUO L. Multi-threshold segmentation and optimization based on Otsu in color image[J].ComputerEngineeringandApplication, 2010, 46(11): 172-178. (in Chinese with English abstract)
(責(zé)任編輯 張 韻)
Automatic extraction of plant diseases based on EM and K-means hybrid clustering
XIA Yongquan, WANG Bing*, ZHI Jun, HUANG Haipeng, SUN Jingru
(CollegeofComputerandCommunicationEngineering,ZhengzhouUniversityofLightIndustry,Zhengzhou450001,China)
Aiming at the problem of how to extract the plant disease area accurately, a method based on EM and K-means hybrid clustering is proposed. The method can effectively extract the leaf target and have some screening effect on the more complicated background, which is superior to other classical methods in the case of obvious difference between the target and the background. Based on the chlorotic characteristics of the plant disease area, the K-means method was used to combine the Lab color space. Using the uniformity of the color distribution of the Lab color space, the A component was extracted as the reference component, and the disease area was extracted from the leaf target. The experimental results showed that the extraction of plant diseases based on EM and K-means hybrid clustering method is feasible.
plant disease area; EM algorithm; Lab color space; K-means algorithm; hybrid clustering
10.3969/j.issn.1004-1524.2017.08.21
2017-02-28
國(guó)家自然科學(xué)基金(61302118,81501547)
夏永泉(1972—),男,遼寧綏中人,博士,副教授,主要從事圖像處理、計(jì)算機(jī)視覺(jué)、模式識(shí)別與人工智能研究。E-mail: 563241627@qq.com
*通信作者,王兵,E-mail: 417726753@qq.com
TP391.41
A
1004-1524(2017)08-1384-08
夏永泉,王兵,支俊,等. 基于EM和K-means混合聚類(lèi)方法的植物葉片病害區(qū)域自動(dòng)提取[J]. 浙江農(nóng)業(yè)學(xué)報(bào),2017,29(8): 1384-1391.
浙江農(nóng)業(yè)學(xué)報(bào)2017年8期