張虎龍
(中國(guó)飛行試驗(yàn)研究院,西安 710089)
基于二維直方圖和模糊熵準(zhǔn)則的閾值化方法
張虎龍
(中國(guó)飛行試驗(yàn)研究院,西安 710089)
圖像分割是圖像分析、識(shí)別和理解的基礎(chǔ)。圖像分割主要是指將圖像分成各具特性的區(qū)域并提取出感興趣目標(biāo)的技術(shù),其研究多年來(lái)一直受到人們的高度重視;閾值化法是圖像分割的一種重要方法,在圖像處理與識(shí)別中廣為應(yīng)用;針對(duì)圖像分割中細(xì)節(jié)往往被忽略導(dǎo)致后續(xù)處理困難的問(wèn)題,基于模糊關(guān)系和最大模糊熵原理提出了一種閾值化方法,對(duì)二維直方圖進(jìn)行模糊分割;為了獲得圖像分割中的細(xì)節(jié),提出的方法根據(jù)最大熵原則自動(dòng)確定模糊區(qū)域和門限,進(jìn)而獲得二維模糊熵和遺傳算法最優(yōu)解,最后獲得圖像細(xì)節(jié);通過(guò)對(duì)不同灰度水平和顏色類型圖像進(jìn)行實(shí)驗(yàn)比較,實(shí)驗(yàn)結(jié)果表明提出的方法優(yōu)于二維非模糊方法和一維模糊熵分割法,得到該方法在圖像分割中獲得細(xì)節(jié)的結(jié)論。
模糊區(qū)域;模糊關(guān)系;最大模糊熵原則;門限;二維直方圖
圖像分割是圖像分析、識(shí)別和理解的基礎(chǔ)。圖像分割主要是指將圖像分成各具特性的區(qū)域并提取出感興趣目標(biāo)的技術(shù),其研究多年來(lái)一直受到人們的高度重視。閾值化法是圖像分割的一種重要方法,在圖像處理與識(shí)別中廣為應(yīng)用。圖像分割中細(xì)節(jié)往往被忽略導(dǎo)致后續(xù)處理困難的問(wèn)題,本文基于最大熵原則自動(dòng)確定模糊區(qū)域和門限、二維模糊熵和遺傳算法最優(yōu)解,獲得圖像分割中的細(xì)節(jié)。
提出方法的主要思路是對(duì)圖像進(jìn)行灰度變換,然后對(duì)圖像進(jìn)行區(qū)域劃分求解模糊熵,然后根據(jù)隸屬函數(shù)確定最優(yōu)值,最終獲得最佳分割區(qū)域。為了獲得二維直方圖,定義像素f(x,y)周圍4個(gè)相鄰的平均值g(x,y)。
(1)
二維直方圖是一個(gè)用f(x,y),g(x,y)函數(shù)對(duì)發(fā)生次數(shù)統(tǒng)計(jì)的陣列。二維直方圖被看做兩個(gè)解析量X和Y,X表示灰度級(jí),Y表示平均灰度級(jí):X=Y={0,1,2...L-1}。映像點(diǎn)有同樣的強(qiáng)度但不同的空間特征點(diǎn)可能被區(qū)別在第二個(gè)維度(當(dāng)?shù)仄骄叶人?的二維直方圖。
塊B和塊W各自由公式(1)來(lái)定義,4個(gè)模糊量BrightX,DarkX,BrightY,和DarkY是由S函數(shù)和對(duì)應(yīng)的Z函數(shù)來(lái)定義的。
上式為明暗不同區(qū)域?qū)?yīng)的模糊集。
這里Z()=1-S(),上式為明暗不同區(qū)域?qū)?yīng)的模糊集。
這模糊關(guān)系Bright是全解析空間X×Y等的子集,Bright=BrightX×BrightY?X×Y
μBright(x,y)=μBrightX×BrightY(x,y)=
min(μBrightX(x),μBrightY(y))
(2)
上式為模糊集求解方法。
相似的,Dark=DarkX×DarkY?X×Y
μDark(x,y)=μDarkX×DarkY(x,y)=
min(μDarkX(x),μDarkY(y))
(3)
上式為模糊集求解方法。
用μA(xi)函數(shù)定義A成為一個(gè)模糊集合的元素,xi,i=1,...N,P(xi)是A的出現(xiàn)概率。A元素的最大熵用(4)來(lái)定義。
(4)
圖像的全局熵定義為
(5)
如圖1所示的暗塊B能被分成不模糊區(qū)域RB和模糊區(qū)域R1。
BlockB=RB∪R1
上式為亮塊區(qū)域RB和定義。
圖1 塊B被分割成RB和R1
相似的,亮塊
Block
w
是由一個(gè)不模糊區(qū)域
R
W
和一個(gè)模糊區(qū)域
R
2
組成的,如圖2所示。
BlockW=RW∪R1
圖2 塊W被分成RW和R2
以下四熵能計(jì)算如下:
(6)
(7)
(8)
(9)
以上4式為模糊熵和非模糊熵的定義。
求解最優(yōu)的a,b,c是最優(yōu)化問(wèn)題,可以由以下方法解決:?jiǎn)l(fā)式搜索,遺傳算法,燜火仿真等。在這篇論文里,用遺傳算法來(lái)找到最優(yōu)解。
步驟1只執(zhí)行一次,步驟2和3對(duì)每一個(gè)a、b、c重復(fù)計(jì)算。熵的選擇以隸屬度函數(shù)0.5時(shí)為最大模糊熵點(diǎn)。一旦閾值的傳遞媒介(s,t)獲得,它把二維直方圖分成四塊,一個(gè)暗塊Block0一個(gè)亮塊Block1,兩個(gè)噪聲塊Block2和Block3如圖3所示。亮塊的提取方法由(6)來(lái)表示:
(10)
相反的黑暗部分的提取是:
(11)
圖3 二維直方圖被分成四部分
提出的算法包含的主要步驟如圖4所示。
圖4 本文計(jì)算過(guò)程
灰度水平圖像閾值化技術(shù)可以被擴(kuò)大到彩色圖像,直接處理彩色空間的各個(gè)部分, 然后結(jié)合結(jié)果在某個(gè)方面獲得最后的圖像。對(duì)彩色圖像分別對(duì)RGB各個(gè)色彩空間進(jìn)行各自的運(yùn)算,然后合并3個(gè)結(jié)果到一個(gè)新的RGB彩色圖像。
在很多彩色圖像和黑白照片上使用本文提出的方法。在這里僅使用3張圖片。黑白圖像和彩色圖像RGB灰度值范圍從0 到255 。對(duì)單色圖像對(duì)應(yīng)的二值圖像閾值門限是在0到255的兩個(gè)強(qiáng)度間表示。對(duì)彩色圖像,二值閾值圖像的每一個(gè)RGB成分是兩個(gè)被表示成比最大閾值要大的最大像素出現(xiàn)次數(shù)的灰度級(jí)組成。然后二值圖像被組合合成一個(gè)彩色圖像。在門限選擇上為了顯示空間信息的重要性。用提出的方法和一維最大熵法模糊C均值和最大模糊熵來(lái)選擇閾值。提出方法的結(jié)果和非模糊二維方法比較來(lái)顯示模糊集合論的優(yōu)勢(shì)。二維非模糊法用最大熵法選擇門限。
對(duì)于圖5~8用二維非模糊方法和二維模糊方法各自獲得的熵向量是(119,159)和(112,112)。用一維最大模糊熵法得到的閾值是127。圖8在細(xì)節(jié)上比圖6~7要清楚很多。天空和塔細(xì)節(jié)更好在圖8在圖10,對(duì)于RGB3個(gè)量閾值是102,113和112。對(duì)于圖片11閾值向量是RGB分量閾值是(82,82),(81,75)和(66,69)。
圖5 原始圖像
圖7 二維非模糊熵法
圖8 二維模糊熵法
圖9 原始圖像
圖10 一維模糊熵結(jié)果
圖11 二維非模糊熵法
圖12 二維模糊熵法
對(duì)于圖像12RGB閾值向量是(81,81),(100,100)和(154,154)。圖像12是唯一個(gè)從天地里區(qū)分出藍(lán)天和拖拉機(jī)細(xì)節(jié)的,所以其提取效果要比圖10~11要好。圖12 的上部的角落被錯(cuò)誤分類了,這是因?yàn)槎祷撝翟斐傻?。這也在圖像11中出現(xiàn)了??傊?,圖像4給出了最好的結(jié)果。對(duì)于圖像14RGB圖像個(gè)分量閾值是252,211,164。對(duì)于圖像15閾值向量是(138,128),(164,196)和(180,182)。
圖13 原始圖像
圖14 一維模糊熵結(jié)果
圖15 二維非模糊熵法
圖16 二維模糊熵法
對(duì)于圖像16閾值向量是(215,215),(196,196),(171,171)。在圖像16眼睛鼻子和嘴都提取的很好,衣服和頭發(fā)的顏色也不同。在圖像14衣服的顏色頭發(fā)和臉的細(xì)節(jié)都一樣。在圖像15衣服被錯(cuò)誤的分類到背景里。
基于VC++6.0,在聯(lián)想G450進(jìn)行實(shí)驗(yàn),計(jì)算時(shí)間在表1。
表1 運(yùn)算時(shí)間
提出了一種基于模糊關(guān)系和最大模糊熵原理閾值化方法,對(duì)二維直方圖進(jìn)行模糊分割。提出的方法根據(jù)最大熵原則自動(dòng)確定模糊區(qū)域和門限,進(jìn)而獲得二維模糊熵和遺傳算法最優(yōu)解,最后獲得圖像細(xì)節(jié)。通過(guò)對(duì)不同灰度水平和顏色類型圖像進(jìn)行實(shí)驗(yàn)比較,實(shí)驗(yàn)結(jié)果表明提出的方法優(yōu)于二維非模糊方法和一維模糊熵分割法,該方法在圖像分割方面具有較大的應(yīng)用前景[1-5]。
[1]HuWM,TanTN,WangW,SteveMaybank,ASurveyonVisualSurveillanceofObjectMotionandBehaviors[J].IEEETransactionsonsystems,man,andcybernetics, 2004,34(3) :344-352.
[2]HeL,WangH,ZhangH,Objectdetectionbypartsusingappearance,structuralandshapefeatures.MechatronicsandAutomation(ICMA)[A]. 2011InternationalConferenceon[C] .2011, 489-494
[3]Anvaripour,M.Ebrahimnezhad,H.,Objectdetectionwithnovelshaperepresentationusingboundingedgefragments[A].Telecommunications(IST), 2010 5thInternationalSymposiumon[C]. 2010,(s): 846-851
[4]HungCC,KulkarniS,KuoBC(2010).ANewWeightedFuzzyC-MeansClusteringAlgorithmforRemotelySensedImageClassification[J].IEEEJournalofSelectedTopicsinSignalProcessing,2010.
[5] 楊廷梧,張正中.航空飛行試驗(yàn)光電測(cè)量理論與方法[M].北京:國(guó)防工業(yè)出版社,2014.
Thresholding Using Two-Dimensional Histogram and Fuzzy Entropy Principle
Zhang Hulong
(Chinese Flight Test Establishment, Xi’an 710089,China)
Image segmentation is the basis of image analysis, recognition and understanding. Image segmentation, partitioning an image into different regions with some specific properties, has always been an important and challenging problem for many years. Thresholding is an important form of image segmentation and is used in the processing of image for many applications.This paper presents a thresholding approach by performing fuzzy partition on a two-dimensional (2-D) histogram based on fuzzy relation and maximum fuzzy entropy principle. The experiments with various gray level and color images have demonstrated that the proposed approach outperforms the 2-D nonfuzzy approach and the one-dimensional(1-D) fuzzy partition approach.
uzzy region;fuzzy relations;maximum fuzzy entropy principle;threshold;2-D histogram.
2017-02-08;
2017-03-07。
航空科學(xué)基金項(xiàng)目(2010ZD30004);航空科學(xué)基金項(xiàng)目(2015ZD30002);航空科學(xué)基金項(xiàng)目(2008ZD30008);國(guó)家863計(jì)劃重點(diǎn)資助項(xiàng)目(2008AA121600)。
張虎龍,男,漢族,湖南平江人,主要從事圖像處理方向的研究。
1671-4598(2017)05-0236-04
10.16526/j.cnki.11-4762/tp.2017.05.065
TP391
A