鄭志超
(深圳市鼎為科技有限公司,深圳 518000)
圖像分割是一個經典的機器視覺處理問題,其目的是將圖像分割為若干個相關的區(qū)域,從而提取出感興趣的區(qū)域或者輪廓特征。圖像分割的準確性直接作用于目標物測量的準確性,其效率直接影響生產的效率,因而,一個快速準確圖像分割算法是目標識別,分級分類任務面臨的首要問題。
在農業(yè)產品分級分類任務中,圖像分割的目的是將工業(yè)相機采集到的圖片中的農產品準確的提取出來,為進一步的尺寸測量,分類任務做好準備。對于農產品圖像分割算法來說,由于受到生產設備成像質量,灰塵污漬,光照條件,陰影等外部因素影響,造成分割的不準確。本文通過對比不同圖像分割算法,闡述各類算法的優(yōu)缺點,以及各自合適的應用場景。
闕值提取法是圖像分割中使用較為廣泛的方法,通過闕值的設置,將處于闕值區(qū)間內的像素區(qū)域歸納為同一區(qū)域,從而分割圖像。此類算法的缺陷在于只考慮了目標的灰度信息,從而缺少魯棒性。在這類算法中,如何獲取一個合理的闕值是算法成功的關鍵,手動選取闕值無法具備通用性,易受環(huán)境變化的影響,主流的選取闕值的方法有最大類間方差法和最大熵闕值分割法。
最大類間方差法根據圖像的灰度特性尋找闕值,使分割出的圖像區(qū)域之間的差別最大,用于判斷分割圖像區(qū)域之間的差別是其各區(qū)域間的內部方差。最大類間方差法極易受到噪音的影響,如陰影,但在單純背景條件下,適用于初步的獲取目標物的位置。
最大熵闕值法與最大類間方差原理類似,將圖像通過信息熵分為不同區(qū)域。信息熵在混亂無序的系統(tǒng)中較大,在確定有序的系統(tǒng)中較小,根據信息熵的特性,可將圖像分割為不同的區(qū)域。徐海,秦立峰等人在黃瓜葉部角斑病提取任務中,使用最大類間方差法初分割,繼而使用最大熵發(fā)二次分割提取病蟲害區(qū)域。
另外,彩色圖片中,使用色彩信息分割圖像也是常用的手段,常見的色彩信息表示方式有BGR 和HSV,通過設置色值區(qū)間可提取農作物病變區(qū)域。其中,HSV(或者HSI)更為可靠,其更精確的表示同一視覺感受顏色在不同光照條件下的區(qū)間。但對于有些農產品,如紅蘋果,紅棗等缺陷識別時,病變區(qū)域R 色值區(qū)間會明顯異于正常區(qū)域,此時采用BGR 中的R 值作為闕值區(qū)別缺陷區(qū)域就是合適的。
邊緣檢測算法是一種經典圖像分割算法,主要是利用連通區(qū)域邊緣對比度的階躍變化,通過其梯度變化找出邊緣,從而達到分割圖像的目的,相較于闕值法對環(huán)境光變化的容忍性更好。對于以矩陣形式存儲的圖像來說,采用模板矩陣(算子)對源圖像進行卷積運算是其提取梯度特征的通用方法。
Sobel 算子計算量較少,抗噪性較好且能保留邊緣的強弱,由一個用于提取水平方向特征和一個用于提取垂直方向的特征的算子組成。Sobel 算子十分適合用于提取農產品方向性的特征,例如檳榔的紋路就能很好的被垂直方向的Sobel 算子提取出來,通過紋路分布密度,進行檳榔的分級任務。
Canny 算子相較于Sobel 算子更加復雜,能獲取更加精準的邊緣且獲取到的邊緣不會虛化,抗噪性更好,但無法體現(xiàn)邊緣的強弱。Canny 算法適用于描述農產品的褶皺程度,如紅棗中皮皮棗的篩選。文獻[4]采用了一種改進的Canny 算子用于蘋果輪廓的提取。
綜上所述,相較于闕值法,邊緣檢測方法不僅限于提取粗略的輪廓信息,還可以用來提取更加細致的特征,常用于二次分割或配合闕值法使用。
基于深度學習的圖像分割方法,主要研究領域在于語義分割,即根據圖片內容,將圖像分為多個有含義的部分,對于農產品分類而言有著革命性的意義。
全卷積網絡FCN 是深度學習用于進行圖像分割的先驅,以分類模型AlexNet 為基礎,將其最后3層全連接層轉化為反卷積層進行上采樣,從而將輸出有特征分類轉化為區(qū)域特征熱力圖。
基于編碼解碼器結構的圖像分割網絡雖然能在復雜背景及環(huán)境中基于特征分割出圖像區(qū)域,不過其提取的輪廓特征依然較為粗糙,不足為真實尺寸測量提供依據,直到Mask RCNN 才做到了像素級圖像分割,為尺寸測量提供了依據。除此之外,Mask RCNN 將目標檢測和語義分割結合,對農產品尺寸測量及分類提供了指導性算法,也是目前研究優(yōu)化的主要方向。
綜上所述,圖像分割算法是用于農產品光電檢測分級分類的基礎任務,傳統(tǒng)算法的優(yōu)勢在于結構簡單,效率高,但對復雜環(huán)境的適應性較弱。深度學習方法受到環(huán)境影響較少,但需大量樣本支持,如何正確的獲取樣本,以及提高算法的整體效率是當前需要解決的主要問題。在實際使用中,深度學習由于性能問題尚無法完全取代傳統(tǒng)算法,使用者可以根據具體的需求選擇合適的算法。