摘? 要: 針對(duì)棉花識(shí)別中由于光照不均、背景復(fù)雜等不利影響降低識(shí)別率的問題,提出了一種基于K均值聚類的棉花HSV圖像分割算法?;贖SV顏色空間下棉花目標(biāo)在顏色上與背景存在著明顯差異的特點(diǎn),在分割中使用K均值聚類算法將復(fù)雜背景下的棉花分成棉葉、棉花、土壤和棉枝四類。首先對(duì)樣本采取預(yù)處理操作,然后使用空間轉(zhuǎn)換算法和K均值聚類算法進(jìn)行圖像處理,進(jìn)一步在HSV顏色空間下依據(jù)色彩信息確定聚類的數(shù)目,利用二維Otsu算法對(duì)圖像進(jìn)行分割操作。通過實(shí)驗(yàn)驗(yàn)證,基于K均值聚類和二維Otsu的棉花HSV圖像分割算法可以使分割結(jié)果更加準(zhǔn)確且邊緣更加整潔,分割正確率達(dá)到80%,同時(shí)該方法對(duì)具有同類特征的花卉采摘視覺系統(tǒng)的設(shè)計(jì)具有參考價(jià)值。
關(guān)鍵詞: 棉花;K均值聚類;HSV顏色空間;二維Otsu
中圖分類號(hào): TP391.4;S562;TP391.9 ???文獻(xiàn)標(biāo)識(shí)碼: A??? DOI:10.3969/j.issn.1003-6970.2020.07.034
本文著錄格式:夏亞飛. 基于K均值聚類和二維Otsu的棉花HSV圖像分割[J]. 軟件,2020,41(07):170-173
Cotton HSV Image Segmentation Based on K-means Clustering and Two-dimensional Otsu
XIA Ya-fei
(Zhengzhou Baoye Steel Structure Co., Ltd., Zhengzhou, Henan 450000, China)
【Abstract】: A cotton image segmentation algorithm based on K-means clustering and two-dimensional Otsu is proposed to solve the problem of cotton recognition which is affected by uneven illumination and complex background. Based on the color difference between the cotton target and the background in HSV color space, K-means clustering algorithm is used to divide the cotton image in complex background into four categories: cotton leaf, cotton, soil and cotton branch. Firstly, the sample is preprocessed, then the image is processed by spatial conversion algorithm and K-means clustering algorithm, and then the number of clusters is determined according to the color information in HSV color space. Finally, the image is segmented by two-dimensional Otsu algorithm. Through the experimental verification, the cotton HSV image segmentation algorithm based on K-means clustering and two-dimensional Otsu can make the segmentation result more accurate and the edge more neat, and the segmentation accuracy reaches 80%. At the same time, this method has reference value for the design of flower picking vision system with similar characteristics.
【Key words】: Cotton; K-means clustering; HSV color space; Two-dimensional Otsu
0? 引言
隨著計(jì)算機(jī)、電氣技術(shù)和人工智能的突飛猛進(jìn),智能設(shè)施開始出現(xiàn)在現(xiàn)代的生產(chǎn)和生活里。一些專家和科研組織提出了利用農(nóng)業(yè)機(jī)器人摘取棉花的設(shè)想[1]。在采棉機(jī)的研發(fā)中首先要解決的問題是將棉花圖像從復(fù)雜的背景中分離提取出來。
目前關(guān)于棉花目標(biāo)的分割方法還處于研究探索階段,國內(nèi)外學(xué)者們已取得一定的探索性研究成果。Rao U[2]對(duì)棉花圖像的R-B、R-G、G-B三個(gè)通道進(jìn)行分析,提出通過設(shè)定顏色差值的閾值來判斷棉花圖像,該方法算法簡單且成本低;劉坤等[3]提出采用色差模型和隨機(jī)Hough變換對(duì)棉花圖像進(jìn)行識(shí)別操作,該方法算法快捷、可行,對(duì)因遮擋造成形狀殘缺的圖像也能取得比其他算法更好的效果;王玲等[4]分別對(duì)HIS、L*a*b*展開研究,在HIS和Lab下結(jié)合閾值和預(yù)處理算法完成了棉花分割,該算法復(fù)雜度低,但是易受光照等環(huán)境因素的影響。
本課題研究的棉花圖像分割技術(shù)在農(nóng)業(yè)采棉機(jī)的研發(fā)里占據(jù)重要的科研地位,也是棉花識(shí)別、空間定位的前提。針對(duì)棉花識(shí)別中由于光照不均、背景復(fù)雜等不利影響降低識(shí)別率的問題,提出了一種基于K均值聚類[5-9]和二維Otsu的棉花HSV[10-11]圖像分割算法。首先利用空間轉(zhuǎn)換算法對(duì)經(jīng)過預(yù)處理的棉花圖像進(jìn)行轉(zhuǎn)換得到棉花HSV圖像,進(jìn)一步基于HSV顏色空間下棉花目標(biāo)與背景在顏色上存在明顯差異的特點(diǎn),確定棉花圖像的聚類數(shù)目為4,最后在V通道[12]下利用二維Otsu[13-15]算法對(duì)圖像進(jìn)行分割操作。通過實(shí)驗(yàn)驗(yàn)證,基于K均值聚類的棉花HSV圖像分割算法可以使分割結(jié)果更加準(zhǔn)確且邊緣更加整潔,顯著提高了識(shí)別率,同時(shí)該方法對(duì)具有同類特征的花卉采摘視覺系統(tǒng)的設(shè)計(jì)具有參考價(jià)值。
1 ?棉花K均值聚類算法
利用棉花目標(biāo)在顏色上與背景存在明顯差異的特點(diǎn),首先在HSV顏色空間下對(duì)經(jīng)過預(yù)處理的棉花圖像依據(jù)顏色信息確定聚類的數(shù)目并進(jìn)行聚類操作,然后在棉花和背景存在顯著不同的V通道下使用二維Otsu算法進(jìn)行分割。
1.1 ?棉花圖像預(yù)處理
由于光照不均、復(fù)雜背景的干擾會(huì)影響棉花圖像分割效果的原因,需要尋找能夠有效提取完整棉花目標(biāo)的顏色空間。經(jīng)研究發(fā)現(xiàn),棉花圖像在HSV顏色空間中有明顯的顏色差異,且在V通道下棉花目標(biāo)和背景在亮度方面存在顯著差異,因此預(yù)處理中利用空間轉(zhuǎn)換算法得到棉花HSV圖像,并根據(jù)顏色信息確定聚類數(shù)目。
1.2 ?K均值聚類算法
在原彩色棉花圖像中存在著豐富的顏色信息,且在HSV顏色空間下棉花目標(biāo)與背景在顏色上存在著明顯的差異,因此使用聚類算法具有合理性和高效性。
K均值聚類算法的研究關(guān)鍵和熱點(diǎn)是聚類數(shù)目和中心的選擇,其選擇的結(jié)果直接影響到所得聚類的效果。該算法的聚類準(zhǔn)則函數(shù)通常選擇誤差平方和函數(shù)[16],公式如(1)、(2)所示:
其中S代表給定的數(shù)據(jù)集,ci代表聚類中心。
1.3? 棉花圖像聚類數(shù)目和聚類中心的選擇
通過K均值聚類算法,依據(jù)顏色信息對(duì)棉花圖像進(jìn)行聚類處理,整幅棉花圖像分為四類:棉花、棉枝、棉葉和土壤,在去噪的同時(shí)減小了后續(xù)分割操作的難度。研究表明棉花圖像聚類個(gè)數(shù)的設(shè)定會(huì)直接影響K均值聚類的效果。不同聚類個(gè)數(shù)的效果如下圖1所示。
由于聚類的對(duì)象是棉花圖像的顏色信息,因此在確定聚類數(shù)目時(shí)可以參考棉花圖像在HSV顏色空間中的主要顏色區(qū)域個(gè)數(shù),即H分量直方圖的峰值個(gè)數(shù)。實(shí)驗(yàn)中經(jīng)反復(fù)實(shí)驗(yàn)選取具有普適性和效果最佳的聚類數(shù)目4。
進(jìn)一步在HSV顏色空間下,將100幅棉花聚類后的圖像做直方圖分析, 發(fā)現(xiàn)棉絮與棉葉等背景在V分量上明顯不同,經(jīng)過研究觀察到棉絮在直方圖里突出為尖峰形狀, 在棉絮和背景相交邊緣的兩側(cè)亮度值差距懸殊[17-19],因此選用棉花HSV圖像的V通道展開目標(biāo)的分割研究。
2 ?棉花同態(tài)濾波與二維Otsu算法
2.1 ?同態(tài)濾波
同態(tài)濾波[20]可以減少棉花圖像的低頻成分并增加高頻成分,在不損失亮區(qū)圖像細(xì)節(jié)的同時(shí)增強(qiáng)暗區(qū)圖像細(xì)節(jié),從而減少光照影響和銳化圖像邊緣。
一張棉花樣本可以看作為由光源的入射部分i(x,y)和反射部分r(x,y)組成,可以表示為:
其中i(x,y)表示低頻成分,代表光照條件;r(x,y)表示高頻成分,代表了棉花圖像的細(xì)節(jié)等。通過消減i(x,y)與放大r(x,y)能夠?qū)崿F(xiàn)對(duì)光照不足或者不均圖像的補(bǔ)償目的。
基于DCT的同態(tài)變換流程如下圖2所示。
2.2 ?二維Otsu算法概述
二維Otsu算法在分割中綜合考慮與研究了本身灰度和鄰域灰度均值的具體情況,首先計(jì)算出圖像的二維直方圖,然后利用閾值選擇出包含有棉花目標(biāo)和背景的兩類,之后采用最大類間方差法進(jìn)行圖像的分割。
把棉花圖像用閾值(s,t)劃分成棉絮目標(biāo)與背景區(qū)域,其中s代表了f(x,y)進(jìn)行圖像分割時(shí)的閾值,t表示了g(x,y)進(jìn)行圖像分割時(shí)的閾值,其中s、t∈[0,L-1],L表示此圖像的灰度級(jí)。設(shè)C1、C2分別代表了目標(biāo)與背景,則有下面的概率公式:
其中P1(C1)、P2(C2)分別表示像素被分到C1、C2中的概率,即像素屬于目標(biāo)或背景的概率,pij表示圖像的二維聯(lián)合概率密度。由此可以推出C1、C2類中像素的平均灰度值依次是:
則所有像素的平均灰度為:
在二維Otsu里,忽略了棉絮和背景以外的信息,有以下公式:
類間方差可以表示為:
由此可以推出最佳閾值,其公式表達(dá)式為:
2.3 ?邊緣檢測
圖像的邊緣是指一幅棉花圖像中灰度值發(fā)生劇烈變化的區(qū)域,主要存在于棉花目標(biāo)之間、棉花目標(biāo)與背景之間、區(qū)域與區(qū)域之間,是圖像中最基本的特征。Canny算子可以抑制噪聲的干擾,解決了其他傳統(tǒng)檢測算法里效果不理想的問題。Canny算子的處理過程如圖3。
2.4? 棉花分割的實(shí)驗(yàn)結(jié)果與分析
綜合考慮了各分割方法的優(yōu)缺點(diǎn),實(shí)驗(yàn)中研究了基于K均值聚類和二維Otsu的棉花HSV圖像分割,算法過程如圖4。
為了檢驗(yàn)該算法的分割效果,在100個(gè)樣本中能夠有效分割出80幅圖像,分割正確率達(dá)到80%。以下是其中兩組的分割效果。實(shí)驗(yàn)過程如圖5所示。
其中圖a是初始棉花樣本,圖b是棉花HSV圖像,圖c是進(jìn)行聚類得到的結(jié)果,圖d是V通道,圖e是進(jìn)行濾波的結(jié)果,圖f是分割結(jié)果,圖g是為了獲得理想的分割效果進(jìn)行的形態(tài)學(xué)處理,圖h是Canny邊緣檢測結(jié)果,圖i是棉花圖像的識(shí)別顯示結(jié)果。
為了驗(yàn)證K均值聚類在棉花分割中的影響,進(jìn)行了不使用聚類操作的比較實(shí)驗(yàn),結(jié)果如圖6所示,發(fā)現(xiàn)未使用K均值聚類算法的分割結(jié)果不理想,含有更多的干擾區(qū)域。
為了驗(yàn)證本章算法的優(yōu)越性,利用文獻(xiàn)[21]中的算法進(jìn)行了對(duì)比實(shí)驗(yàn),在100個(gè)樣本中能夠有效分割出50幅圖像,分割正確率達(dá)到50%。其效果如圖7所示,與本文所提算法進(jìn)行實(shí)驗(yàn)對(duì)比,結(jié)果如表1所示,可以看出由于該算法沒有在V通道下進(jìn)行處理的原因,使計(jì)算得到的分割閾值不夠理想,導(dǎo)致分割結(jié)果中含有干擾區(qū)域,效果不如本章算法。
3? 結(jié)束語
針對(duì)棉花識(shí)別中光照不均、背景復(fù)雜等不利影響降低識(shí)別率的問題,提出了一種基于K均值聚類和二維Otsu的棉花HSV圖像分割算法。使用空間轉(zhuǎn)換算法得到棉花HSV圖像,基于棉花目標(biāo)的顏色與背景存在的明顯差異,確定棉花圖像的聚類數(shù)目,最后在V通道下對(duì)圖像分割。通過實(shí)驗(yàn)驗(yàn)證,分割算法可以使分割結(jié)果更加準(zhǔn)確且邊緣更加整潔,分割正確率達(dá)到80%,同時(shí)該方法對(duì)具有同類特征的花卉采摘視覺系統(tǒng)的設(shè)計(jì)具有參考價(jià)值。考慮到該算法僅利用了色彩和灰度信息,分割方法單一,后期還會(huì)結(jié)合分水嶺算法進(jìn)行研究,以獲得更高的分割率。
參考文獻(xiàn)
樊建榮, 采棉機(jī)的現(xiàn)狀研究和發(fā)展趨勢[J]. 機(jī)械研究與應(yīng)用, 2011, 24(01): 1-4.
Rao U. Design of automatic cotton picking robot with Machine vision using Image Processing algorithms[C]// International Conference on Control. IEEE, 2014.
劉坤, 費(fèi)樹岷, 汪木蘭, 等. 基于改進(jìn)隨機(jī)Hough變換的棉桃識(shí)別技術(shù)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2010, 41(8): 160-165.
王玲, 王萍, 陳兵林, 等. 基于顏色閾值的田間籽棉圖像分割技術(shù)[J]. 作物學(xué)報(bào), 2010, 36(3): 502-507.
任磊, 賴惠成, 陳欽政, 等. 基于改進(jìn)K均值聚類與HSV模型的棉花分割算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2013, 34(5): 1772-1776.
安計(jì)勇, 高貴閣, 史志強(qiáng), 等. 一種改進(jìn)的K均值文本聚類算法[J]. 傳感器與微系統(tǒng), 2015, 34(5): 130-133.
翟東海, 魚江, 高飛, 等. 最大距離法選取初始簇中心的K-means文本聚類算法的研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2014, 31(03): 713-715+719.
張雪鳳, 張桂珍, 劉鵬. 基于聚類準(zhǔn)則函數(shù)的改進(jìn)K-means算法[J]. 計(jì)算機(jī)工程與應(yīng)用, 2011, 47(11): 123-127.
Amir Ahmad, Lipika Dey. A k -mean clustering algorithm for mixed numeric and categorical data[J]. Data & Knowledge Engineering, 2007, 63(2).
孫琦龍, 張明亮. 一種HSV顏色空間量化的藏毯圖像檢索方法[J]. 軟件, 2016, 37(03): 36-39.
孫琦龍, 張明亮. 基于顏色特征的藏毯圖像檢索研究與實(shí)現(xiàn)[J]. 軟件, 2015, 36(08): 25-29.
任磊. 棉花圖像分割算法研究[D]. 新疆大學(xué), 2013.
王寧, 姜全春, 蔣林華. 高噪聲環(huán)境下的快遞包裹條形碼的快速定位分割識(shí)別[J]. 軟件, 2019, 40(07): 80-83.
王浩, 孫福明, 賈旭. 基于圖像分割的葵花籽脫殼率在線估計(jì)技術(shù)[J]. 江蘇農(nóng)業(yè)科學(xué), 2018, 46(18): 229-234.
李仁忠, 楊曼, 俱寒,等. 基于二維Otsu算法的織物疵點(diǎn)檢測[J]. 毛紡科技, 2017, 45(10): 75-80.
毛嘉莉. 基于K-means的文本聚類算法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2009, 18(10): 85-87.
任磊, 賴惠成, 陳欽政, 王星. 基于改進(jìn)K均值聚類與HSV模型的棉花分割算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2013, 34(5): 1772-1776.
戴天虹. 基于計(jì)算機(jī)視覺的木質(zhì)板材顏色分類方法的研究[D]. 東北林業(yè)大學(xué), 2008.
陶霖密, 徐光祐. 機(jī)器視覺中的顏色問題及應(yīng)用[J]. 科學(xué)通報(bào), 2001(03): 178-190.
曲蘊(yùn)慧, 湯偉, 文豪, 雷濤. 基于DCT同態(tài)濾波的紙病圖像去噪算法研究[J]. 中國造紙, 2018, 37(05): 45-49.
張豪. 基于機(jī)器視覺棉花圖像的分割和棉田視覺導(dǎo)航研究[D]. 新疆農(nóng)業(yè)大學(xué), 2015.