楊漫
(河海大學(xué) 商學(xué)院,江蘇 南京211100)
基于頂帽-底帽變換和二次圖像分割的目標(biāo)提取
楊漫
(河海大學(xué) 商學(xué)院,江蘇 南京211100)
文中分別采用最大內(nèi)間方差法、迭代法、二維最大熵法、KFCM單次閾值分割法和灰度均值區(qū)域生長(zhǎng)法對(duì)坦克和卡車從背景中進(jìn)行提取。針對(duì)單次閾值分割法和灰度均值區(qū)域生長(zhǎng)法在提取目標(biāo)時(shí)出現(xiàn)不能分割出車身投影或者大量丟失車體等問題,本文結(jié)合單次閾值分割法和區(qū)域生長(zhǎng)法的優(yōu)勢(shì),提出了基于頂帽-底帽變換和二次圖像分割的目標(biāo)提取算法。對(duì)比試驗(yàn)表明,該算法在較完整保留車體部分同時(shí)能去除車體的投影,很大程度上抑制了目標(biāo)的形心漂移。
閾值分割法;區(qū)域生長(zhǎng)法;頂帽-底帽變換;二次分割
圖像分割技術(shù)研究,指依據(jù)圖像的一些特性(如灰度強(qiáng)度、顏色、紋理等)將圖像中的各個(gè)像素歸類成互相都不相交的、具有某種相似性的均勻子區(qū)域的過程,是圖像處理領(lǐng)域中的一項(xiàng)重要內(nèi)容。本文根據(jù)分割方法的不同特點(diǎn)將其分為:基于邊緣的圖像分割、基于閾值的圖像分割、基于區(qū)域的圖像分割和結(jié)合特定理論的圖像分割。近年來,在圖像分割中隨著人工神經(jīng)網(wǎng)絡(luò)、模糊集理論和圖論等的廣泛使用,產(chǎn)生了很多與特定理論結(jié)合的分割算法。
在圖像分割的實(shí)際應(yīng)用中有時(shí)還需要根據(jù)實(shí)際問題解決一些特定的分割問題。例如在本文所要提取的坦克和卡車目標(biāo)中,如何在提取坦克和卡車目標(biāo)的同時(shí)去掉投影分割也是需要研究的問題。針對(duì)此類投影分割問題,研究通過對(duì)投影建模等方法一定程度上有效的解決了分割投影的問題。然而如何尋找一種魯棒性強(qiáng),實(shí)時(shí)性好的投影分割方法也是現(xiàn)在一直在研究的問題之一。
首先采用最大內(nèi)間方差法計(jì)算出最佳閾值t1,用閾值t1將輸入測(cè)試圖片閾值化處理。閾值化測(cè)試圖片如圖1所示。由圖1可知,坦克圖片背景較為簡(jiǎn)單,只有少量雜草,說明采用最大內(nèi)間方差法效果較好;而卡車背景較為復(fù)雜,有大量雜草,說明采用最大內(nèi)間方差法的效果較差,閾值化后的圖像中有大面積干擾區(qū)域,不利于后續(xù)目標(biāo)提取。
圖1 Ostu法閾值化結(jié)果:左為坦克圖片,右為卡車圖片F(xiàn)ig.1 Threshold value results of Ostu method:left for tank picture,right for truck picture
然后對(duì)閾值化后的圖像進(jìn)行形態(tài)學(xué)處理。測(cè)試圖片面積最大連通域如圖2所示,由圖可知卡車圖像中卡車并不是最大連通域。
圖2 面積最大連通域:左為坦克圖片,右為卡車圖片F(xiàn)ig.2 Largest connected domain:left for tank picture,right for truck picture
針對(duì)卡車圖像干擾區(qū)域較為分散,而且干擾區(qū)域的許多連接處很細(xì)窄的情況,首先對(duì)閾值化后的圖像的連通域進(jìn)行標(biāo)記,并對(duì)其作開運(yùn)算,破壞干擾區(qū)域的大連通性;然后只保留開運(yùn)算后二值圖像面積最大的連通域?yàn)槟繕?biāo)區(qū)域位置,如圖3(a)所示。由于開運(yùn)算在截?cái)喔蓴_區(qū)域細(xì)窄連接帶的同時(shí),也截取了卡車后輪底部的細(xì)窄處,為了提取完整的卡車圖像,根據(jù)開運(yùn)算前連通域的標(biāo)記,取最大連通域開算運(yùn)算前的區(qū)域?yàn)槟繕?biāo)區(qū)域,如圖3(b)所示。
由圖3可知保留的連通域中都含有孔洞,用形態(tài)學(xué)的閉操作也很難填充完整。為此將圖片取反,取反后面積最大的連通域?yàn)槿》辞暗暮谏尘皡^(qū)域,取反前的目標(biāo)區(qū)域變成了取反后的背景區(qū)域,而取反前的孔洞則變成取反后的小目標(biāo)區(qū)域,保留面積最大的連通域(目標(biāo)區(qū)域)即可去除孔洞。去除孔洞后的圖像如圖4(a)所示。去除孔洞后的圖像與原輸入圖像進(jìn)行異或運(yùn)算則得到最終目標(biāo)物的提取。目標(biāo)提取結(jié)果如圖4(b)所示。
圖3 二值圖像最大連通域:左圖為坦克圖片,右圖為小車圖片F(xiàn)ig.3 Binary image maximum connected domain:left for tank picture,right for the car picture
圖4 目標(biāo)提取結(jié)果Fig.4 Target extraction results
采用灰度均值區(qū)域增長(zhǎng)法的首要目的是確定種子生長(zhǎng)點(diǎn)。本文采用卷積法粗略定位坦克和卡車區(qū)域。首先將測(cè)試圖像歸一化到128×128像素,然后利用坦克和卡車的灰度級(jí)較背景低的特點(diǎn)分別對(duì)坦克和卡車采用60×30和50×30的全1模板與坦克和卡車做卷積,將卷積值最小處的模板中心定位初始生長(zhǎng)點(diǎn)。為避免少量灰度級(jí)過高的地方引入的干擾(如坦克的五角星),卷積前將圖像中像素值大于200的點(diǎn)的像素值設(shè)置為圖像的平均像素值。
為加快卷積的計(jì)算速度,將卷積轉(zhuǎn)換到頻域中進(jìn)行,也即計(jì)算Cf1f2=F-1(F·F2)。F為模板的傅里葉變換的共軛;F2為測(cè)試圖像的傅里葉變換;F-1為傅里葉逆變換。定位種子生長(zhǎng)點(diǎn)后對(duì)坦克圖像和卡車圖像的K=28,增長(zhǎng)結(jié)果如圖5(a)所示。然后對(duì)圖5(a)用形態(tài)學(xué)閉操作增強(qiáng)細(xì)窄處連接;再取反后進(jìn)行孔洞填充得到圖5(b);最后提取區(qū)域如圖5(c)。
針對(duì)單純的閾值分割算法在分割背景復(fù)雜、灰度變化不明顯的圖像時(shí)不能取得較好效果的情況,本文提出了基于頂帽-底帽變換和二次圖像分割的目標(biāo)提取算法。鑒于第一次閾值分割通常都會(huì)保留坦克和卡車的投影,所以第一次分割為“過分割”?!斑^分割”能將目標(biāo)物、投影和自影一起分割出來。由于自影和投影像素很相近,直接采用一般的分割算法很難將其分開。為此在進(jìn)行第二次分割前先將對(duì)其進(jìn)行頂帽-底帽變換以增強(qiáng)對(duì)比度,然后再采用自動(dòng)種子定位的區(qū)域生長(zhǎng)法進(jìn)行第二次分割。為簡(jiǎn)化計(jì)算,在第一次分割結(jié)果的基礎(chǔ)上以最上、最下、最左和最右非255像素值點(diǎn)為界限提取感興趣區(qū)域(ROI)作為子圖用作后續(xù)分割。
然后對(duì)坦克和卡車圖片的ROI區(qū)域進(jìn)行頂帽-底帽變換以增強(qiáng)其對(duì)比度。本文采用半徑為15的圓盤作為結(jié)構(gòu)元素。對(duì)圖4的坦克和卡車進(jìn)行頂帽-底帽變換的結(jié)果如圖6所示。
圖5 灰度均值區(qū)域增長(zhǎng)法Fig.5 Grayscale average regional growth method
圖6 頂帽-底帽變換結(jié)果:左2為變換前圖像,右2為變換后圖像Fig.6 Hat-bottom cap transformation results:left 2 for images before transform,right 2 for images after transform
進(jìn)一步分析坦克和卡車ROI的直方圖(圖7)可知,最低灰度級(jí)段都會(huì)出現(xiàn)第一個(gè)高峰,由于投影區(qū)域的灰度級(jí)較低,所以第一個(gè)高峰代表投影區(qū)域,而灰度級(jí)最高段的高峰則主要是白色背景導(dǎo)致的。同時(shí)由于直方圖均呈現(xiàn)多峰分布,很難采用閾值分割法將投影去除的同時(shí)又盡可能少的去除車身部分。
圖7 ROI區(qū)域直方圖:左圖為坦克,右圖為卡車Fig.7 ROI area histogram:left for tank,right for truck
針對(duì)這一問題,本文對(duì)提高對(duì)比度后的圖片采用自動(dòng)種子定位的區(qū)域生長(zhǎng)法去除投影。為使去除投影的同時(shí)盡可能少去除車身部分,本文把種子生長(zhǎng)點(diǎn)放在投影區(qū)域。即先把投影當(dāng)做目標(biāo),把坦克和卡車當(dāng)做背景將投影提取出來,然后在ROI區(qū)域上去除提取出的投影區(qū)域即可把投影去除。自動(dòng)定位種子點(diǎn)后采用灰度均值區(qū)域生長(zhǎng)法來提取投影區(qū)域,而均勻測(cè)度K取為K=t2(ROI區(qū)域的直方圖上找到第一個(gè)峰谷點(diǎn)的灰度級(jí)),提取結(jié)果如圖8(a)所示;然后根據(jù)連通域的面積將8(a)中的小孔洞填滿后進(jìn)行形態(tài)學(xué)開運(yùn)算斷開細(xì)窄的連接帶,再根據(jù)連通域面積去除小的孤立的連通域后得到8(b);其次從單次閾值分割中提取的目標(biāo)去除提取的投影部分得到圖8(c);再次根據(jù)連通域的面積去除小的孤立的連通域得到圖8(d);最后將圖8 d)與圖4進(jìn)行與運(yùn)算即可得到最終的提取目標(biāo)。
4.1閾值分割算法分析
本文測(cè)試了Ostu法、迭代法、二維最大熵法和KFCM閾值分割的效果,4種方法計(jì)算出的閾值如表1所示。3種閾值分割算法對(duì)坦克的分割效果都較好,而對(duì)卡車的分割都引入了大量背景,尤其是采用二維最大熵法分割卡車時(shí)將卡車的車身都當(dāng)做了背景。這是因?yàn)?,坦克的直方圖具有一個(gè)明顯的主峰和一個(gè)小的單峰,對(duì)于圖像直方圖為這種簡(jiǎn)單的雙峰結(jié)構(gòu)的圖像,采用單閾值分割方法就能有比較滿意的分割效果。而卡車圖像的直方圖為典型的多峰結(jié)構(gòu),多峰結(jié)構(gòu)的直方圖采用單閾值分割很難將目標(biāo)與背景很好的分離。
圖8 二次分割提取目標(biāo)Fig.8 Re-segmentation image segmentation
4.2目標(biāo)提取算法比較與分析
本文對(duì)提出的Ostu單次閾值分割法、迭代法單次分割法、二維最大熵單次分割法、KFCM、灰度均值區(qū)域生長(zhǎng)法和基于頂帽-底帽變換的二次分割法均在測(cè)試圖片上進(jìn)行了測(cè)試,測(cè)試結(jié)果如圖9所示。
表1 閾值計(jì)算結(jié)果Tab.1 Threshold calculation results
圖9 6種算法目標(biāo)提取結(jié)果Fig.9 Target extraction results of 6 kinds of algorithm
針對(duì)邊緣檢測(cè)算法的不足,本文首先采用單次閾值分割方法提取出了帶有車身投影的目標(biāo),然后采用灰度均值的區(qū)域生長(zhǎng)法提取出了去掉車身投影的目標(biāo)。最后利用閾值分割和區(qū)域增長(zhǎng)的優(yōu)勢(shì)并結(jié)合頂帽-底帽變換,提出了基于頂帽-底帽變換和二次圖像分割的目標(biāo)提取算法。實(shí)驗(yàn)表明,該算法僅去掉了少量車體部分,但去除了大面積投影。本文提出的算法具有以下特點(diǎn):1)實(shí)時(shí)性較好,在去除少量車體部分的同時(shí)能去除車身的投影,大大減少了目標(biāo)物的形心漂移現(xiàn)象;2)自適應(yīng)性較強(qiáng),能利用陰影的特點(diǎn)快速自動(dòng)定位種子生長(zhǎng)點(diǎn)和閾值K;3)簡(jiǎn)單且易于實(shí)現(xiàn),不需要構(gòu)建復(fù)雜投影模型來去除投影。
然而,本次對(duì)圖像分割的研究也有很多今后需要深入研究的地方:1)對(duì)提取的陰影沒有進(jìn)一步處理。如圖9(b)所示。怎么確定一種魯棒性好的方法去除圖9(b)中長(zhǎng)條狀的自影部分;2)沒能去除車身附近少量的雜草。對(duì)于此問題,考慮利用坦克和卡車外形的先驗(yàn)知識(shí),如何利用幾何條件(如Hough變換直線檢測(cè))去除雜草也是今后需要繼續(xù)研究的問題。
[1]J Bernsen.Dynamic thresholding of Grey-level lmages[C]//in:Proceeding of the Eighth International Conference on Pattern Recognition.Paris,F(xiàn)rance,1986:1251-1255.
[2]W Niblaek.An Introduction to Digital Image Processing[M]. Prentice Hall.Englewood CliffS.NJ,1986.
[3]J Sauvola and M Pietikainen.Adaptive document image binarization[J].Pattern Recognition,2000,33(2):225-236.
[4]B Gatos.I Pratikakis,S J Perantonis.Adaptive degraded document image binarization[J].Pattern Recognition,2006,39 (3):317-327.
[5]Kuo-LiangChung,Chia-LunTsai.Fast incremental algorithm for speeding up the computation of binarization[J].Applied Mathematics and Computation,2009,212(2):396-408.
[6]HUANG Deng-yuan,WANG Chia-hung.Optimal multi-level thresholding using a two-stage otsu optimization approach[J]. Pattern Recognition Letters,2009,30(3):275-284.
[7]Vincent L,Soille P.Watersheds in digital spaces:an efficient algorithm based on immersion simulations[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1991,13 (6):583-598.
[8]ZHAO Qin-pei,YAO Li-xiu,CHENG Jian,et al.A novel color image segmentation based on color information and region growing[J].Journal of Shanghai Jiao Tong University,2007,41(5):802-812.
Target extraction based on the hat-bottom cap transformation and second image segmentation
YANG Man
(The Business School of Hohai University,Nanjing 211100,China)
This paper use the method of maximum amount of variance,iterative,two-dimensional maximum entropy,KFCM single threshold segmentation and grayscale average region to put the tanks and trucks segmented from the background growing respectively.To solve the problem of single threshold segmentation method and the grayscale average region growing method being not able to segment the car or lost some part in extracting target projection,this paper has combined the advantage of single threshold segmentation method and the region growing method,and has put forward a target extraction method based on the hat-bottom cap transformation and the second image segmentation.Comparison test shows that the algorithm can remove the bodywork projection while remaining the intact body,which can inhibit the target centroid drift to a large extent.
optimal thresholding;region growing method;hat-bottom cap transformation;re-segmentation
TN99
A
1674-6236(2016)03-0171-05
2015-03-28稿件編號(hào):201503410
楊 漫(1988—),女,安徽寧國(guó)人,碩士,助理工程師。研究方向:人力資源管理。