郭 紅
(重慶郵電大學(xué)信號(hào)與信息處理重慶市重點(diǎn)實(shí)驗(yàn)室,重慶 400065)
基于混合高斯模型和相似度的閾值分割
郭 紅
(重慶郵電大學(xué)信號(hào)與信息處理重慶市重點(diǎn)實(shí)驗(yàn)室,重慶 400065)
閾值分割法在圖像分割中是一種最為簡單和有效的方法,然而如何選取合適的閾值實(shí)現(xiàn)有效分割,目前還沒有統(tǒng)一的方法。結(jié)合信息論與圖像的空間信息,提出一種新的閾值優(yōu)化算法。首先建立圖像的混合高斯分布(GMM),然后利用強(qiáng)度的類不確定性和相似度函數(shù)特性定制出目標(biāo)函數(shù),優(yōu)化出局部閾值,從而獲得高效的分割效果。實(shí)驗(yàn)結(jié)果表明,與大津法(OSTU)相比,該算法能夠成功分割出模糊的邊界,并且能夠?qū)D像中的各個(gè)組織有效的分割出來。
閾值;混合高斯分布;類不確定性;相似度函數(shù);目標(biāo)函數(shù)
圖像的邊緣含有非常豐富的圖像信息。在圖像信號(hào)的采集、傳輸和處理過程中將不可避免地引入各種類型的噪聲,導(dǎo)致圖像的邊界模糊,因此如何有效地從模糊、噪聲干擾的圖像中檢測出邊緣是一個(gè)有意義的課題。傳統(tǒng)的邊緣提取方法較多,但仍存在許多問題。閾值分割是進(jìn)行圖像邊緣分割的一種最常用,同時(shí)也是最簡單的圖像分割方法。它通過設(shè)定不同的特征閾值,把圖像分成若干類。許多閾值分割方法根據(jù)一維灰度直方圖或二維灰度直方圖從背景中提取感興趣的目標(biāo)[1-3];最大類間方差法[4]通過最大化類間方差選取一個(gè)全局最優(yōu)閾值;Kittler和Illingworth等人提出的最小誤差法[5]將圖像像素分類后誤差率最小的值確定為圖像閾值;信息論中熵指信息的不確定性,作為最佳準(zhǔn)則引入閾值分割算法[6-7]中,并得到了很好的閾值分割效果,但是它沒考慮圖像的空間相關(guān)性,所以若不同圖像直方圖相同,那么得到的閾值也相同;基于模糊連接度的圖像分割算法也已經(jīng)廣泛地運(yùn)用到醫(yī)學(xué)圖像的分割中[8-9],能夠很好地處理醫(yī)學(xué)圖像的模糊性和圖像噪聲。
圖像的數(shù)據(jù)量比較大,其密度函數(shù)會(huì)有單峰或多峰,并呈現(xiàn)不規(guī)則狀;對(duì)于復(fù)雜的圖像,尤其是醫(yī)學(xué)圖像,一般來說圖像的密度函數(shù)都是多峰的,比較復(fù)雜。所以用高斯混合模型(GMM)估計(jì)出來的結(jié)果更接近圖像的真實(shí)分布,能夠很好地刻畫圖像分布的細(xì)節(jié)。因此,本文通過建立高斯混合模型對(duì)圖像進(jìn)行建模,結(jié)合類不確定性和相似度函數(shù)特性選取最佳閾值進(jìn)行分割,以獲取高效的分割效果。
本文提出的改進(jìn)閾值分割法主要是能量函數(shù)的定制,能量函數(shù)有兩部分組成:1)基于信息論的相關(guān)特性,本文通過建立混合高斯模型,求物體的類不確定;2)基于圖形學(xué)的相似度,用于區(qū)域的計(jì)算,該方法依據(jù)高的類不確定性估計(jì)出物體的邊界,分割出不同組織區(qū)域。在任何圖像位置中,高的能量在類不確定性和相似度同時(shí)高或低的地方。最后,該方法的基本原理源于假設(shè)模糊圖像邊界,在最優(yōu)分割下,高的類不確定性的像素出現(xiàn)在物體邊界上。
GMM混合分布模型的建立如圖1所示。
圖1 混合高斯模型的概率分布(截圖)
在高斯混合分布中,閾值將其分為前景區(qū)域和背景區(qū)域,本文中選取K=7個(gè)高斯模型。
數(shù)字圖像可以被表示成一個(gè)有序?qū)崝?shù)對(duì)ζ=C,()f,在這里C表示圖像域,f表示一個(gè)強(qiáng)度函數(shù),即f|C→[IMIN,IMAX],這里的[IMIN,IMAX]表示像素強(qiáng)度最小和最大值。通常,在二維圖像的像素域C中,像素點(diǎn)一般用矢量p,q,r表示C的元素,在三維或高維中,則另有表示。根據(jù)閾值和各混合高斯模型中的均值,將高斯模型分為前景區(qū)Fo,t和背景區(qū)Fb,t。
對(duì)前景區(qū)域中的高斯分布,根據(jù)公式(3)求出該像素點(diǎn)離各個(gè)高斯分布的distance,distance最小,那么該像素點(diǎn)就屬于那個(gè)高斯分布
那么該像素點(diǎn)強(qiáng)度值為g,在前景區(qū)域的概率為
式中:p代表高斯概率密度函數(shù);表示像素p的混合高斯模型中第i個(gè)高斯分量的權(quán)重,滿足;這里分別表示第i個(gè)高斯分布的均值及協(xié)方差,協(xié)方差定義為其中σ表示標(biāo)準(zhǔn)差,I表示單位矩陣,那么該像素點(diǎn)落在背景區(qū)域中的概率,可以用同樣的方法求出,所以,強(qiáng)度值為g的像素點(diǎn)落在背景區(qū)域中的概率為
定義θ不依賴于像素的強(qiáng)度,表示屬于Fo,t的像素的概率,(1-θ)表示Fb,t的像素概率。通常情況下,θ被稱為密度函數(shù)
因此,任何像素點(diǎn)強(qiáng)度值為g的概率,表示為p(g),計(jì)算如下
用貝葉斯準(zhǔn)則定義前景和背景類的像素點(diǎn),強(qiáng)度值為g的后驗(yàn)概率,分別為
根據(jù)分類的不確定性,隨著強(qiáng)度值g的像素值落入前景或背景類的圖像域C中,根據(jù)后驗(yàn)概率熵公式,稱為類不確定性,它的估計(jì)根據(jù)香農(nóng)和韋弗的熵方程
根據(jù)以上的描述,任何給定的強(qiáng)度閾值t,計(jì)算像素點(diǎn)的強(qiáng)度密度概率f(g)
1979年將模糊連接度概念引入圖像處理中,并提出了它的框架和對(duì)象表示,模糊空間的概念如下:設(shè)n維歐式空間Rn被n組相互垂直的超平面分割成一些超立方體,這些超立方體稱為空間元素,當(dāng)n=2時(shí),這些空間元素稱為像素。模糊空間的概念是設(shè)這些超立方體的中心坐標(biāo)為n元的整數(shù),則它對(duì)應(yīng)于Zn中的一個(gè)點(diǎn)Zn上的模糊關(guān)系α是自反的、對(duì)稱的,(Zn,α)被稱為模糊數(shù)字空間[10],一般 α 的隸屬函數(shù) μα(c,d)(c,d∈Zn)是c,d距離‖c-d‖的遞減函數(shù)。ζ=(c,f)被稱為模糊數(shù)字空間(Zn,α)上的場。
考慮到每對(duì)相鄰點(diǎn)的整體信息,相似度函數(shù)用如下公式計(jì)算
為了求取閾值,定制出目標(biāo)函數(shù)Q為
通過公式可以看出:1)不確定性高,且模糊相似度大時(shí),目標(biāo)函數(shù)值大,式中第一部分起主要作用;2)當(dāng)不確定性值和模糊相似度低時(shí),目標(biāo)函數(shù)值大,式中第二部分起主要作用,只有一個(gè)大一個(gè)小,目標(biāo)函數(shù)才能達(dá)到最小。目的是優(yōu)化目標(biāo)函數(shù)使其值最小,從而找到閾值t。
ITK(Insight Segmentation and Registration Toolkit)是一個(gè)開源,跨平臺(tái)的圖像分割框架,里面有大量的前沿算法,廣泛用于圖像配準(zhǔn)和分割。在描述閾值t優(yōu)化方法時(shí),利用ITK中的vnlpowell這個(gè)類來實(shí)現(xiàn)。
本文后面的搜索空間僅僅是二維的,powell算法不需要計(jì)算導(dǎo)數(shù),在每一維中使用brent算法迭代搜索,搜索速度比較快,局部尋優(yōu)能力極強(qiáng),在局部搜索中精度要高于其他的優(yōu)化算法[11-12],所以采用powell法來優(yōu)化閾值與梯度參數(shù)。
為了驗(yàn)證本算法的性能,本文利用合成圖像與實(shí)際圖像進(jìn)行了測試,并與ostu算法結(jié)果進(jìn)行了比較(見圖2~圖5)。圖2為2D腦區(qū)域圖像,加入了混合高斯噪聲并且對(duì)圖像進(jìn)行了模糊和噪聲處理。從圖中可以看出不確定性值與像素的亮度成正比,在邊界上不確定性高,能夠更清晰地分割出不同組接口。
從圖6~圖9中可以清楚看出,通過這種方法,可以把灰度圖不同的組織,根據(jù)優(yōu)化出來的局部最優(yōu)閾值,清楚地分割出來,達(dá)到應(yīng)用到醫(yī)學(xué)圖像的目的,從而提高了臨床醫(yī)生對(duì)人體內(nèi)部病變部位的觀察,提高了確診率。
圖9 不同組織分割效果
近年來,自動(dòng)選取閾值的圖像分割算法在圖像分割中應(yīng)用效果很好,而基于信息論熵理論的閾值自動(dòng)選取算法,對(duì)圖像分割的效果也得到了很好的驗(yàn)證。本文自動(dòng)選取閾值的算法,給出了算法的數(shù)學(xué)推導(dǎo)過程及優(yōu)化策略,從形式上看直觀、簡潔,并且在醫(yī)學(xué)圖像的應(yīng)用中,也取得令人滿意的結(jié)果,它能將醫(yī)學(xué)圖像中的不同組織分割開來。本文應(yīng)用到的類的不確定性,將信息論的特征應(yīng)用到圖像中,將圖像中的有用信息最大限度地保留下來,而且類不確定性這一特征也可以應(yīng)用到其他的一些算法中,下一步將對(duì)此進(jìn)行研究。
:
[1]張新明,鄭延冰.二維直方圖準(zhǔn)分的Tsallis熵閾值分割及其快速實(shí)現(xiàn)[J].儀器儀表學(xué)報(bào),2011,32(8):1797-1802.
[2]LU Rong,SHENG Yi.Image threshold segmentation method based on an improved 2-D histogram[J].Systems Engineering and Electronics,2004,26(10):1487-1490.
[3]ORLANDO J T,RUI S.Image segmentation by histogram thresholding using fuzzy sets[J].IEEE Trans.Image Processing,2002,11(12):1457-1465.
[4]OTSU N.A threshold selection method from grey-level histograms[J].IEEE Trans.Systems,1979,9(1):62-66.
[5]KITTLER J,ILLINGWORTH J.Minimum error thresholding[J].Pattern Recognition,1986,1(19):41-47.
[6]PUN T.A new method for gray-level picture thresholding using the entropy of the histogram[J].Signal Processing,1980,2(2):223-237.
[7]PRASANNA K,SAHOO G A.A thrsholding method based on two-dimensional Renyi's entropy[J].Pattern Recognition,2004,6(36):1149-1161.
[8]劉耀輝,陳官發(fā)生,黃展鵬.基于MITK的CT序列圖像模糊連接度分割算法研究[J].湘南學(xué)院學(xué)報(bào),2011,32(2):38-41.
[9]SAHA P K,UDUPA J K.Relative fuzzy connectedness among multiple objects:theory,algorithms and applications in image segmentation[J].Computer Vision and Image Understanding,2001,82(1):42-56.
[10]楊安榮,林財(cái)興,李紅強(qiáng).一種基于模糊連接度和維諾圖的混合分割方法[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(1):105-108.
[11]MAES F,VANDERMEULEN D,SUETENS P.Comparative evaluation of multiresolution optimization strategies for multimodality image registration by maximization of mutual information[J].Medical Image Analysis,1999,3(4):373-386.
[12]PLUIM J,MAINTZ J,VIERGEVER M.Mutual information based registration of medical images:a survey[J].IEEE Trans.on Medical Imaging,2003,22(8):986-1004.
Threshold Segmentation Based on GMM Model and Similarity
GUO Hong
(Chongqing Key Laboratory of Signal And Information Processing,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)
Threshold segmentation method in image segmentation is one of the most simple and effective methods,but how to select appropriate threshold to achieve effective segmentation is still not unified method at present.Based on information theory and image space information,a new threshold optimization algorithm is put forward.Firstly,image mixed Gaussian distribution(GMM)is established,and by using the intensity of the class uncertainty and similarity function characteristic custom out the target function,the local threshold value is optimized,so as to achieve efficient segmentation effect.The experimental results show that compared with the OSTU,the proposed algorithm can successfully segment fuzzy boundary and image of each effective organization segmentation out.
threshold;GMM;class uncertainty;similarly function;target function
TN911.73;TP391.41
A
【本文獻(xiàn)信息】郭紅.基于混合高斯模型和相似度的閾值分割[J].電視技術(shù),2013,37(3).
國家自然科學(xué)基金項(xiàng)目(61071196);教育部新世紀(jì)優(yōu)秀人才支持計(jì)劃項(xiàng)目(NCET-10-0927);信號(hào)與信息處理重慶市市級(jí)重點(diǎn)實(shí)驗(yàn)室建設(shè)項(xiàng)目(CSTC,2009CA2003);重慶市自然科學(xué)基金項(xiàng)目(CSTC,2009BB2287;CSTC,2010BB2398;CSTC,2010BB2411)
郭 紅(1984— ),女,碩士生,主研圖像處理。
責(zé)任編輯:時(shí) 雯
2012-09-11