李昌興,王佳燁,吳成茂,喬彩彩,郝思佳
(1.西安郵電大學(xué) 理學(xué)院,陜西 西安 710121;2.西安郵電大學(xué) 通信與信息工程學(xué)院,陜西 西安 710121;3.西安郵電大學(xué) 電子工程學(xué)院,陜西 西安 710121;4.河南工學(xué)院 經(jīng)濟(jì)學(xué)院,河南 新鄉(xiāng) 453003)
圖像分割是根據(jù)像素的特征將圖像分成不重疊的子區(qū)域,提取特定的特征區(qū)域,以備圖像理解與圖像識(shí)別[1]。目前,圖像分割已廣泛應(yīng)用于生物醫(yī)學(xué)工程[2]、智能交通[3]、軍事安防[4-5]、智慧農(nóng)業(yè)工程[6]等諸多領(lǐng)域。圖像的特征提取和相關(guān)聚類算法的選擇是圖像分割的關(guān)鍵[7]。
模糊C-均值聚類算法[8](Fuzzy C-means Clustering Algorithm,F(xiàn)CM)因其簡(jiǎn)單易實(shí)現(xiàn)被廣泛應(yīng)用,但FCM算法對(duì)噪聲極敏感。結(jié)合空間約束的模糊C-均值聚類[9](Fuzzy C-means Dlustering with Spatial Information Constraints,FCM_S)算法在FCM算法的基礎(chǔ)上引入鄰域信息,提高了算法抗噪性,然而,F(xiàn)CM_S算法在每次迭代過程中都需要計(jì)算像素點(diǎn)的鄰域信息。為此,提出了FCM_S1與FCM_S2算法[10],分別利用均值濾波和中值濾波在迭代前計(jì)算像素的鄰域信息,算法的運(yùn)行效率和抗噪性均有提升,但丟失了部分圖像細(xì)節(jié)信息。廣義模糊C-均值聚類算法[11](Generalized Fuzzy C-Means Clustering Algorithm,GFCM)在FCM算法的基礎(chǔ)上引入了一個(gè)新的模糊參數(shù),多數(shù)情況下GFCM算法性能優(yōu)于FCM算法,但抗噪性依然較差。在此基礎(chǔ)上,有學(xué)者提出了含有空間約束的廣義模糊C-均值聚類[12](Generalized Fuzzy C-Means Clustering with Spatial Information Constraints,GFCMS)算法,通過中值濾波提升了算法魯棒性。然而,上述算法中都需要人為控制的正則化參數(shù)。為此,后續(xù)的研究提出了模糊局部信息C-均值聚類算法[13](Fuzzy Local Information C-Means Clustering Algorithm,F(xiàn)LICM),該算法無(wú)需人為設(shè)置正則化參數(shù),自適應(yīng)能力有所提升,但當(dāng)噪聲強(qiáng)度較大時(shí),算法的抗噪性依然不理想。后來有學(xué)者在FLICM的基礎(chǔ)上用鄰域點(diǎn)的像素信息修正模糊加權(quán)因子,提出了局部空間信息的模糊C-均值算法[14](Weighted Fuzzy Local Information C-Means Clustering Algorithm,WFLICM),以及在WFLICM算法中融合了核函數(shù)的核加權(quán)模糊局部信息C-均值聚類算法[15](Kernel Weighted Fuzzy Local Information C-Means Clustering Algorithm,KWFLICM),進(jìn)一步提高了算法對(duì)噪聲的抑制能力,但也導(dǎo)致圖像細(xì)節(jié)信息丟失,分割精度下降,且加權(quán)因子與核函數(shù)的引入使得算法的復(fù)雜度增加。
針對(duì)上述模糊聚類算法對(duì)圖像紋理細(xì)節(jié)信息保留不佳、抗噪性能較差的問題,在FCM_S算法中融入了紋理信息,提出了一種基于小波變換的含有局部信息約束的魯棒模糊聚類彩色圖像分割算法。利用小波變換提取圖像紋理特征,對(duì)所得小波系數(shù)建立廣義高斯分布(Generalized Gaussian Density,GGD)模型[16],并以Kullback-Leibler(KL)散度作為兩個(gè)GGD模型之間的差異度量。同時(shí),在Lab顏色空間[17-18]計(jì)算樣本與聚類中心之間的歐式平方距離。分別在Lab顏色空間與小波域引入鄰域信息。利用拉格朗日乘子法構(gòu)建優(yōu)化模型,得到迭代的魯棒模糊聚類算法,以期算法能達(dá)到滿意的分割精度與抗噪魯棒性。
FCM算法[8]通過隸屬度強(qiáng)度將像素劃分成不同類別,以實(shí)現(xiàn)圖像分割。FCM算法的目標(biāo)函數(shù)定義為
(1)
相關(guān)約束條件為
1)0≤uki≤1,i=1,2,…,n,k=1,2,…,c
其中:m為模糊因子;uki表示第i(i=1,2,…,n)個(gè)像素xi相對(duì)于第k(k=1,2,…,c)個(gè)聚類中心vk的隸屬度;‖xi-vk‖2表示第i個(gè)像素xi到第k個(gè)聚類中心vk的歐式平方距離。
依據(jù)拉格朗日乘子法得到隸屬度uki與聚類中心vk的迭代表達(dá)式為
(2)
(3)
FCM算法采用如下步驟。
步驟1設(shè)置聚類數(shù)c、模糊因子m、迭代終止條件ε以及最大迭代次數(shù)tmax,并令初始迭代次數(shù)t=0。
步驟6根據(jù)隸屬度最大原則對(duì)像素分類。
FCM_S算法[9]將空間鄰域信息約束作為懲罰項(xiàng)加入FCM算法的目標(biāo)函數(shù),其目標(biāo)函數(shù)可以表示為
(4)
相關(guān)約束條件為
1)0≤uki≤1,i=1,2,…,n,k=1,2,…,c
其中:參數(shù)ξ控制鄰域像素對(duì)聚類結(jié)果的貢獻(xiàn);NR表示以xi為中心的鄰域窗口內(nèi)含有的像素?cái)?shù);Ni為鄰域窗口內(nèi)像素的集合。
依據(jù)拉格朗日乘子法得到隸屬度uki與聚類中心vk的迭代表達(dá)式為
(5)
(6)
FCM_S算法雖考慮了鄰域信息,使得算法抗噪性能有所提升。但其分割精度較低,且當(dāng)圖像受噪聲污染嚴(yán)重時(shí),算法的分割效果仍不理想[19-20]。為了進(jìn)一步提升FCM_S算法的抗噪魯棒性,在其目標(biāo)函數(shù)中引入紋理信息,并提出一種小波域局部信息約束的模糊聚類算法。改進(jìn)算法的原理示意圖如圖1所示。
圖1 改進(jìn)算法的原理示意圖
Lab顏色空間包含3個(gè)通道,即一個(gè)亮度通道l,以及兩個(gè)顏色通道a和b[17]。l分量取值范圍為[0,100],其值越大亮度越高。a分量取值范圍為[-128,127],其值由負(fù)數(shù)到正數(shù),對(duì)應(yīng)顏色從綠色到紅色;b分量取值范圍為[-128,127],其值從負(fù)數(shù)到正數(shù),對(duì)應(yīng)顏色從藍(lán)色到黃色。Lab顏色空間具有感知均勻性,其色域?qū)掗?,更符合人類視覺感知[18]。
令xi=(li,ai,bi)與xj=(lj,aj,bj)分別表示像素i處與像素j處的顏色信息,則像素i與像素j的平方歐氏距離[19]可以表示為
‖xi-xj‖2=(li-lj)2+(ai-aj)2+(bi-bj)2
(7)
設(shè)Ii表示以第i個(gè)像素為中心的21×21的圖像窗口,并對(duì)圖像在窗口上進(jìn)行N級(jí)小波變換,分解得到N個(gè)低頻子帶和3N個(gè)高頻子帶,建立廣義高斯分布模型來表征圖像紋理特征變化的分布[20],圖像紋理特征變化的分布為
(8)
其中:Γ(z)為伽馬函數(shù);w為n個(gè)一系列獨(dú)立的小波系數(shù);α為廣義高斯分布的尺度參數(shù),與標(biāo)準(zhǔn)差有關(guān);β為形狀參數(shù),描述分布的衰減速度。當(dāng)β=1和β=2時(shí),廣義高斯分布進(jìn)化為拉普拉斯分布和高斯分布[19-20]。
為了快速準(zhǔn)確地估計(jì)形狀參數(shù),利用凸變換[21]求解參數(shù)α與β。求解形狀參數(shù)β的表達(dá)式為[19,21]
(9)
利用牛頓-拉夫森迭代法[22]求解形狀參數(shù)
(10)
以初始值βint=1.0可從半開區(qū)間中的任意起點(diǎn)收斂到唯一的全局最優(yōu)解,獲得精確的形狀估計(jì)值[19-21],再由式(8)計(jì)算尺度參數(shù)
(11)
KL散度是衡量?jī)蓚€(gè)概率分布差異的非對(duì)稱性的度量[23],其計(jì)算式可表示為
(12)
將式(8)代入式(12)可得
(13)
則像素i與像素j處的局部窗口上小波分解所得高頻子帶GGD模型的KL散度之和[24]可表示為
(14)
其中,αir與βir分別表示在以像素i為中心的窗口上小波變換所得第r(r=1,2,3,…,3N)個(gè)高頻子帶GGD模型的尺度參數(shù)與形狀參數(shù)。
為了提高圖像的分割性能,在提取顏色信息的基礎(chǔ)上,增加圖像的紋理信息,并引入小波域局部鄰域信息。改進(jìn)算法的目標(biāo)函數(shù)可表示為
(15)
需要滿足約束條件為
1)0≤uki≤1,i=1,2,…,n,k=1,2,…,c
其中:λ和τ為正則化參數(shù);Dki表示以像素i為中心的局部窗口和以聚類中心像素k為中心的局部窗口上小波變換所得高頻子帶所對(duì)應(yīng)的GGD模型KL散度之和;uki表示像素i對(duì)聚類中心像素k的隸屬度;vk表示包含所有顏色特征的聚類中心。
為使目標(biāo)函數(shù)服從于隸屬度和唯一性,利用拉格朗日乘子將其轉(zhuǎn)化為無(wú)約束極值問題,即
(16)
其中,μ=(μi)是一系列拉格朗日乘子。
首先對(duì)式(16)關(guān)于隸屬度uki求偏導(dǎo)
(17)
(18)
將式(17)帶入式(18)可得
(19)
則隸屬度uki的迭代更新表達(dá)式為
(20)
對(duì)式(16)關(guān)于vk求偏導(dǎo),可得
(21)
求解式(21)可得顏色聚類中心vk的迭代表達(dá)式
(22)
求解GGD模型參數(shù),對(duì)式(16)關(guān)于αkr求偏導(dǎo)可得
(23)
求解式(23),并令
Hkir=Ψ((βkr+1)/βir)/βir+lgαir
其中,Ψ(z)為雙伽馬函數(shù)。則尺度參數(shù)αkr的迭代式和形狀參數(shù)βkr的超越方程可以分別表示為
(24)
(25)
考慮到超越方程的求解較為復(fù)雜,將求解方程f(βkr)=0時(shí)βkr的取值問題,轉(zhuǎn)化為求解f(βkr)2=0的極小值問題。利用二分法[24]對(duì)非線性方程進(jìn)行一維搜索,根據(jù)使用牛頓-拉弗森迭代法求解結(jié)果,β的取值絕大多數(shù)在[0.5,3]區(qū)間內(nèi),為了快速更新形狀參數(shù)聚類中心βkr,設(shè)置二分法的搜索區(qū)間為[0.5,3]。
各聚類中心的更新與鄰域信息密切相關(guān),且聚類中心在各空間獨(dú)立更新。隸屬度的更新與像素顏色信息、GGD模型參數(shù)以及鄰域信息都相關(guān)。改進(jìn)算法具體的實(shí)現(xiàn)步驟如下。
步驟1設(shè)置聚類數(shù)c,正則化參數(shù)λ和τ,閾值ε,最大迭代次數(shù)tmax以及Ni與Nr,令初始迭代次數(shù)t=0。
步驟2對(duì)局部窗口Ii進(jìn)行級(jí)小波分解,建立GGD模型,并根據(jù)式(10)與式(11)求解GGD模型參數(shù)αir和βir。
步驟3隨機(jī)初始化隸屬度U0。
步驟5根據(jù)式(20)計(jì)算Ut+1,若滿足|Jt+1-Jt|<ε或t=tmax,則輸出(Ut,Vt,At,Bt)并執(zhí)行步驟6;否則,返回執(zhí)行步驟4,并令t=t+1。
使用數(shù)據(jù)集BSD500,紋理圖像集Describable Textures Dataset和遙感圖像集NWPU-RESISC45中的圖像進(jìn)行實(shí)驗(yàn)。將FCM、FCM_S、FCM_S1、FCM_S2、GFCM、GFCMS、FLICM、WFLICM以及KWFLICM算法等9種算法作為對(duì)比算法。實(shí)驗(yàn)測(cè)試環(huán)境為Matlab R2018a。
設(shè)置參數(shù)λ=0.5,τ=0.01,ε=10-1,F(xiàn)CM_S的ξ1=3.8,F(xiàn)CM_S1的ξ2=3.8,F(xiàn)CM_S2的ξ3=3.8,GFCM的ξ4=0.9,GFCMS的ξ5=0.9、ξ5=6,鄰域窗口為5×5,則鄰域內(nèi)除中心像素外像素?cái)?shù)Nr=24。
采用劃分系數(shù)Vpc、劃分熵Vpe、F值、誤分率以及峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)作為圖像分割效果的衡量指標(biāo)[26]。其中:劃分系數(shù)Vpc與劃分熵Vpe都反映分割矩陣的模糊性,Vpc值越接近1,Vpe越接近0,聚類越明確,算法性能越好[27];F值為精確率與召回率的調(diào)和平均值,綜合分割算法的查準(zhǔn)率與查全率指標(biāo),當(dāng)F值較高時(shí)則能說明分割方法具有較高的有效性[21];誤分率描述錯(cuò)誤分類的像素占比,該值越小,分割效果越好[28];PSNR值越大,算法抑制噪聲的能力越強(qiáng),圖像分割的效果越好[28]。
為了驗(yàn)證改進(jìn)的算法對(duì)圖像紋理的分割精度,對(duì)自然圖像“海星”“鱗片”以及遙感圖像“立交”進(jìn)行實(shí)驗(yàn)。3種原始圖像如圖2所示。
圖2 原始圖像
其中,自然圖像“海星”與“鱗片”包含大量紋理細(xì)節(jié)信息,遙感圖像“立交”目標(biāo)類別與細(xì)節(jié)繁多,并且顏色相近,能夠進(jìn)一步地測(cè)試算法的分割精度。10種算法對(duì)不同圖像分割的具體結(jié)果分別如圖3至圖8所示,分割性能指標(biāo)具體數(shù)據(jù)如表1所示。
圖3 10種算法對(duì)圖像海星的分割結(jié)果
表1 10種算法對(duì)圖2(a)-圖(c)的分割性能指標(biāo)
從視覺效果來看,圖3和圖5顯示,F(xiàn)CM、FCM_S以及GFCM算法與改進(jìn)算法在一定程度上均保留了圖像輪廓與細(xì)節(jié)部分,但通過布局放大圖像圖4與圖6來看,改進(jìn)算法保留的細(xì)節(jié)信息更加清晰完整,并且去除了部分雜點(diǎn)。其余算法均丟失了圖像的細(xì)節(jié)信息,大多區(qū)域邊緣光滑呈塊狀分布。這是因?yàn)?,中值濾波、均值濾波或者權(quán)重因子的引入使得算法在聚類過程中考慮了鄰域像素信息,這雖有利于對(duì)去除雜點(diǎn)和噪聲點(diǎn),但對(duì)圖像的細(xì)節(jié)信息處理效果不理想。
圖4 圖3分割結(jié)果的局部放大
圖5 10種算法對(duì)圖像鱗片的分割結(jié)果
圖6 圖5中分割結(jié)果的局部放大
另外,由圖7與圖8可見,改進(jìn)算法的分割結(jié)果中,公路邊界完整清晰,且有效地分割出了公路上目標(biāo)較小的汽車。相對(duì)于其余算法,改進(jìn)算法能較好地去除圖像中的雜點(diǎn),并保留了部分細(xì)節(jié)信息。由表1可以看出,改進(jìn)算法的誤分率相對(duì)于其余算法均明顯減小,F(xiàn)值明顯提升。結(jié)合圖3至圖8與表1可以發(fā)現(xiàn),改進(jìn)算法對(duì)于圖像細(xì)節(jié)信息保留較完整,分割結(jié)果較為理想。
圖7 10種算法對(duì)圖像立交的分割結(jié)果
為了進(jìn)一步驗(yàn)證改進(jìn)算法的抗噪魯棒性,選取“蝴蝶”“建筑”和“機(jī)場(chǎng)”等3幅圖像進(jìn)行測(cè)試。用于測(cè)試的原始圖像與加噪圖像分別如圖9所示。其中:對(duì)圖像蝴蝶添加強(qiáng)度為10%的椒鹽噪聲;對(duì)圖像建筑添加均值為0,歸一化方差為0.1的高斯噪聲;由于遙感圖像所含噪聲水平大小未知,對(duì)圖像機(jī)場(chǎng)添加歸一化方差為0.05的斑點(diǎn)噪聲。各算法分割結(jié)果分別如圖10至圖13所示,分割性能各指標(biāo)具體數(shù)據(jù)如表2所示。
圖8 圖7中分割結(jié)果的局部放大
圖9 原始圖像與加噪圖像
圖10 10種算法對(duì)圖9(d)的分割結(jié)果
由圖10可知,在椒鹽噪聲干擾下,F(xiàn)CM_S2、GFCMS、KWFLICM以及改進(jìn)算法均能獲得較理想的分割結(jié)果。由圖11中對(duì)圖10分割結(jié)果的局部放大可見,F(xiàn)CM_S2算法與GFCMS算法仍有部分噪聲點(diǎn),KWFLICM算法雖有效地抑制了椒鹽噪聲的影響,但丟失了“蝴蝶”翅膀上花紋等細(xì)節(jié)信息。相較于其他算法,改進(jìn)算法殘留的噪聲點(diǎn)較少,具有出明顯的抗噪性能優(yōu)勢(shì),且所得分割目標(biāo)細(xì)節(jié)信息較清晰完整。其他算法的分割結(jié)果中仍存在大量噪聲點(diǎn),且出現(xiàn)了錯(cuò)分現(xiàn)象。分割無(wú)噪紋理圖像非常有效的FCM和GFCM算法嚴(yán)重失真。這是因?yàn)?,這些算法沒有利用局部約束信息,導(dǎo)致其在沒有雜聲干擾情況下,對(duì)圖像的細(xì)節(jié)信息保留較好,但不具有抗噪魯棒性。由圖12與圖13可見,在高斯噪聲與斑點(diǎn)噪聲的干擾下,對(duì)比算法的分割結(jié)果都存在大量噪聲點(diǎn),改進(jìn)算法對(duì)噪聲的抑制能力較好,獲得的同質(zhì)區(qū)域合理清晰。從表2中可以看出,相對(duì)于其他算法,改進(jìn)算法能獲得較大的峰值信噪比與較小的誤分率,進(jìn)一步表明改進(jìn)算法分割精度更高,對(duì)噪聲的抑制能力更強(qiáng)。
圖11 圖10中分割結(jié)果的局部放大
圖12 10種算法對(duì)圖9(e)的分割結(jié)果
圖13 10種算法對(duì)圖9(f)的分割結(jié)果
表2 10種算法對(duì)圖9(d)-圖9(f)的分割性能指標(biāo)
在實(shí)驗(yàn)中,對(duì)圖像在窗口Ii上進(jìn)行小波變換,為了研究窗口的尺寸大小對(duì)于改進(jìn)算法分割性能的影響,將Ii的大小分別設(shè)置為13×13、15×15、17×17、19×19、21×21、23×23、25×25、27×27和29×29,對(duì)圖2(a)-圖2(c)進(jìn)行實(shí)驗(yàn),所得的誤分率如表3所示。
表3 改進(jìn)算法在不同尺寸小波變換窗口時(shí)的誤分率
若窗口Ii過小,則窗口內(nèi)圖像信息過少,也可能導(dǎo)致窗口內(nèi)幾乎全部為低頻信息,不利于牛頓-拉夫森算法快速求解GGD模型的參數(shù);若窗口過大,則窗口有可能跨越多個(gè)特征區(qū)域,使得GGD模型參數(shù)不能合理表征該像素點(diǎn)周圍的像素紋理特征,導(dǎo)致分割性能下降和運(yùn)行時(shí)間的增加。由表8可知,選取窗口Ii的大小為21×21有利于獲得最佳分割結(jié)果。
為了比較上述對(duì)比算法與改進(jìn)算法的執(zhí)行效率,進(jìn)行計(jì)算復(fù)雜度分析。對(duì)于一幅像素為n且可分為c類的圖像,各算法計(jì)算復(fù)雜度如表4所示。其中:l表示迭代次數(shù);q表示當(dāng)前像素所在鄰域窗口大小。從表4可以看出,F(xiàn)CM算法和GFCM算法的計(jì)算復(fù)雜度最低,因?yàn)檫@兩種算法僅包含最簡(jiǎn)單的迭代。FCM_S算法和FLICM算法需要計(jì)算每次迭代中鄰域信息,F(xiàn)CM_S1、GFCMS與FCM_S2算法需要計(jì)算每個(gè)像素均值或中值信息,計(jì)算復(fù)雜度較高。WFLICM和KWFLICM算法的計(jì)算復(fù)雜度包含相似性度量因子的計(jì)算和算法的迭代,這兩種算法的計(jì)算復(fù)雜度最高。改進(jìn)算法的復(fù)雜度為算法迭代復(fù)雜度,技術(shù)復(fù)雜度居中。
表4 各算法計(jì)算復(fù)雜度分析
為了直觀地展現(xiàn)各算法的時(shí)間開銷,將測(cè)得各算法對(duì)不同圖像的運(yùn)行時(shí)間繪制成柱狀圖,不同算法對(duì)各測(cè)試圖像的運(yùn)行時(shí)間對(duì)比如圖14所示。從圖14中可以看出,WFLICM算法與KWFLICM算法較為耗時(shí),這是由于加權(quán)因子的引入和鄰域信息的多次計(jì)算。改進(jìn)算法的運(yùn)行時(shí)間較長(zhǎng),僅小于FLICM、WFLICM和KWFLICM算法,這是因?yàn)?,改進(jìn)算法的計(jì)算復(fù)雜度雖然不高,但其特征提取過程較復(fù)雜,尤其是小波變換、建立GGD模型以及求解模型參數(shù)的過程耗時(shí)較長(zhǎng)。圖14中改進(jìn)算法的時(shí)間開銷不包括特征提取過程,僅為聚類算法時(shí)間開銷。改進(jìn)算法對(duì)不同大小的圖像特征提取的時(shí)間開銷如表5所示??梢钥闯觯倪M(jìn)算法對(duì)圖像特征提取過程的時(shí)間消耗與圖像大小有關(guān)。
圖14 10種算法對(duì)各測(cè)試圖像的運(yùn)行時(shí)間對(duì)比
表5 改進(jìn)算法處理不同圖像時(shí)特征提取的時(shí)間消耗
改進(jìn)算法在圖像特征提取過程中耗時(shí)較長(zhǎng),但其聚類過程可在較短時(shí)間內(nèi)收斂,且能達(dá)到更理想的分割效果。
提出了一種基于小波變換的局部信息約束的魯棒模糊聚類算法。將紋理信息嵌入目標(biāo)函數(shù),并在Lab顏色空間與小波域分別引入了鄰域信息。實(shí)驗(yàn)結(jié)果表明,相較于其他對(duì)比算法,對(duì)于紋理圖像與噪聲圖像,改進(jìn)算法能夠獲得滿意的分割結(jié)果,具有更高的分割精度與更強(qiáng)的抗噪魯棒性。特別是針對(duì)受不同強(qiáng)度及類型的噪聲污染的圖像,改進(jìn)算法能獲得更合理的同質(zhì)區(qū)域,有效地抑制噪聲,又一定程度地保留了圖像的細(xì)節(jié)信息。另外,改進(jìn)算法能獲得更低的誤分率與更高的峰值信噪比。但是,仍存在一些待優(yōu)化的問題,例如,改進(jìn)算法中的特征提取與參數(shù)求解過程導(dǎo)致算法時(shí)間開銷上升,若能以一個(gè)高效的模型來表征圖像紋理特征,則算法的效率將大大提升。另外,若能使算法自適應(yīng)地確定聚類數(shù)目,則將能夠有效地提升算法的實(shí)用性。