吳倩,王民慧
(貴州大學(xué)電氣工程學(xué)院,貴州 貴陽(yáng),550025)
白癜風(fēng)是一種常見(jiàn)的后天性限局性或泛發(fā)性皮膚色素脫失病[1],該病的主要特征是在體表形成大小無(wú)規(guī)則的白斑皮損,是一種嚴(yán)重影響外貌美觀的疾病[2]。參照中國(guó)中西醫(yī)結(jié)合皮膚性病學(xué)會(huì)色素病學(xué)組有關(guān)白癜風(fēng)的臨床分型及療效標(biāo)準(zhǔn)[3],白斑面積是臨床治療效果的重要評(píng)價(jià)指標(biāo),所以白斑面積的測(cè)量是將白癜風(fēng)療效評(píng)價(jià)客觀量化的關(guān)鍵。
傳統(tǒng)白斑面積測(cè)量方法有目測(cè)估算法、點(diǎn)估算法[4]、宮格法[5]等,這類方法主觀性強(qiáng),缺乏統(tǒng)一標(biāo)準(zhǔn)。隨著圖像處理技術(shù)的發(fā)展,出現(xiàn)了許多基于圖像分析的測(cè)量方法,這類方法是非侵入式,客觀性較好,如張?chǎng)蔚萚6]利用PS和ΙmageJ軟件通過(guò)魔棒等工具手動(dòng)分割目標(biāo)區(qū)域并計(jì)算出白斑面積,但此法操作繁瑣。羅衛(wèi)等[7]利用北京航空航天大學(xué)設(shè)計(jì)的計(jì)算機(jī)圖像分析系統(tǒng)在紅綠藍(lán)幀體的基礎(chǔ)上測(cè)量了白斑光密度及平均面積,該法準(zhǔn)確性較好,但在實(shí)際應(yīng)用中實(shí)時(shí)性不強(qiáng)。朱衛(wèi)江等[8]通過(guò)圖像中白斑區(qū)域邊緣根據(jù)微積分原理計(jì)算曲線下白斑面積,魯功榮[9]利用皮膚鏡測(cè)量了白癜風(fēng)的色度及邊緣形態(tài)但卻無(wú)法測(cè)量大面積白斑面積。所以設(shè)計(jì)一種簡(jiǎn)單準(zhǔn)確、快速的白斑面積測(cè)量方法是目前白癜風(fēng)療效評(píng)價(jià)體系中亟待解決的關(guān)鍵問(wèn)題之一。因此本文提出了基于混合顏色空間Κ均值聚類的方法來(lái)快速測(cè)量白斑面積。
本文提出的基于混合顏色空間Κ均值聚類方法的關(guān)鍵是將白斑皮損從圖像中完整的提取出來(lái),尤其是在大面積白斑的測(cè)量中。白斑無(wú)特定形態(tài),有的面積大而分散,因此在拍攝時(shí)難免會(huì)將背景或光照等干擾帶入圖像,使得提取的難度進(jìn)一步加大,所以處理此類圖像的關(guān)鍵在于圖像分割。經(jīng)典的圖像分割大致分為:基于閾值、邊緣和區(qū)域的方法,本文研究的是彩色圖像,包含著豐富的顏色、亮度等信息,僅用這些方法難以達(dá)到理想的分割效果。所以采用了基于數(shù)據(jù)挖掘思想的Κ-means聚類來(lái)分割圖像,得到目標(biāo)區(qū)域后,應(yīng)用一系列數(shù)學(xué)形態(tài)學(xué)方法來(lái)處理,得到更為完整的白斑區(qū)域,并通過(guò)提取像素點(diǎn)來(lái)計(jì)算白斑實(shí)際面積[10]。
由于本文研究的白斑主要是依據(jù)其與圖像的背景及前景中正常皮膚顏色的差異來(lái)進(jìn)行提取的,所以選擇合適的顏色空間在圖像分割中非常重要。經(jīng)過(guò)對(duì)圖像進(jìn)行相關(guān)分析和實(shí)驗(yàn),本文選擇在Lab、HSV、YCbCr混合顏色空間模型下來(lái)做Κ均值聚類分割圖像。由于Lab空間是均勻的顏色空間,相比RGB,在衡量不同膚色與白斑的較小色差方面比較有優(yōu)勢(shì),但它會(huì)受到亮度影響,所以本文引入了HSV和YCbCr兩種可將亮度與顏色分離的模型來(lái)減弱光照對(duì)圖像分割的影響。Lab模型中L是亮度,a 、b是顏色通道。L表示從黑到白,a是綠色到紅色;b是藍(lán)色到黃色[11]。HSV模型中H是色調(diào),S是飽和度,V是明度。H表示顏色,S表示顏色的純度,V表示色彩的明亮程度。YCbCr中Y為顏色的亮度,Cb和Cr分別為藍(lán)色和紅色的濃度偏移量。將采集到的RGB圖像轉(zhuǎn)換至這三種顏色模型的公式如下:
(1)RGB轉(zhuǎn)Lab
不能直接轉(zhuǎn)換,需要由標(biāo)準(zhǔn)XYZ顏色模型過(guò)渡,記X、Y、Z代表XYZ顏色空間中3分量,R、G、B代表RGB顏色空間3分量,其轉(zhuǎn)換公式如下[12]:
其中Xn、Yn、Zn表示XYZ空間中的對(duì)應(yīng)參考白點(diǎn)的三色值。
(2)RGB轉(zhuǎn)HSV
Κ-means算法屬于聚類算法中的劃分法,是一種無(wú)監(jiān)督自適應(yīng)的搜索算法。Κ均值聚類的實(shí)質(zhì)是將具有某種相似性質(zhì)的數(shù)據(jù)樣本進(jìn)行分類組織的過(guò)程,其原理是先隨機(jī)選取Κ個(gè)樣本作為初始聚類中心,然后計(jì)算每個(gè)樣本與每個(gè)種子聚類中心之間的距離,把每個(gè)樣本分配給距離它最近的聚類中心,聚類中心以及分配給它們的樣本就代表一個(gè)聚類。一旦樣本集中的所有樣本都被分配了,每個(gè)聚類的聚類中心會(huì)根據(jù)聚類中現(xiàn)有的對(duì)象被重新計(jì)算。這個(gè)過(guò)程將不斷重復(fù)直到滿足全部樣本到其所屬類別的聚類中心的距離之和已經(jīng)達(dá)到局部最小狀態(tài)[13-15]。Κ均值聚類的算法可以看成如下幾步:
(1)設(shè)n個(gè)數(shù)據(jù)組成樣本集為:
其中Xi為d維向量,每個(gè)樣本由原始數(shù)據(jù)的d個(gè)特征組成,Κ均值聚類就是要將這n個(gè)數(shù)據(jù)樣本在一定的準(zhǔn)則下劃分為K類,構(gòu)成數(shù)據(jù)集:
隨機(jī)選取K個(gè)樣本,作為S中各類的聚類中心,記為初始聚類中心集:
(2)定義Sk中任一樣本到聚類中心的歐式距離為:
根據(jù)公式(4)可知,集合S中任一個(gè)子類Sk中的所有樣本到其所屬聚類中心的距離之和可表述為:
則X中全部樣本到各自所屬類的聚類中心之和為:
其中ωi為權(quán)值,只有當(dāng)樣本Xi屬于相應(yīng)Sk類中時(shí)才有意義。
(3)根據(jù)聚類準(zhǔn)則,要使距離總和最小,依據(jù)公式分析,需要取子集Sk中所有樣本的平均值作為類中心才能滿足,由此獲得新的聚類中心。
(4)根據(jù)新的質(zhì)心,再次迭代計(jì)算 E( Xi),直至函數(shù)收斂,此時(shí)算法終止,獲得最佳Κ均值聚類圖像。
本文實(shí)驗(yàn)所研究的是大面積白斑皮損圖像,但前景部分既包括我們所要提取的白斑皮損,也包括正常的皮膚,本文實(shí)驗(yàn)采用Κ均值聚類來(lái)做圖像分割,所以這里設(shè)定的初始聚類中心為3個(gè),圖像分割后通過(guò)數(shù)學(xué)形態(tài)學(xué)相關(guān)算法進(jìn)行修正,更為精確的提取出目標(biāo)區(qū)域像素點(diǎn),整體算法流程圖如圖1所示。
在圖像采集的過(guò)程中,往往因?yàn)榄h(huán)境、光線等原因會(huì)產(chǎn)生一定的噪聲,為便于處理,先對(duì)圖像做增強(qiáng)處理??紤]到后續(xù)研究的需要,采用對(duì)邊緣信息保護(hù)效果較好的中值濾波來(lái)增強(qiáng)圖像,對(duì)原始圖像內(nèi)每一像素點(diǎn)的灰度值取其鄰域內(nèi)所有像素點(diǎn)灰度的中值,既降低了噪聲,又提升了圖像的整體亮度,同時(shí)相對(duì)擴(kuò)大了白斑與背景的差異度,有利于圖像分割。
圖1 圖像處理算法流程圖Fig.1 Flow chart of image processing algorithm
將增強(qiáng)后的圖像從RGB顏色空間分別轉(zhuǎn)到Lab、HSV、YCbCr顏色空間,原始圖像中皮膚顏色包含白、紅、黃三色,而背景近灰色,所以將Lab中a、b顏色分量,HSV中的H、S分量,YCbCr中Cb、Cr分量分別取出來(lái)聚類。因歐氏距離能較精確地測(cè)量顏色之間微小的差距,因此采用歐式距離來(lái)做衡量標(biāo)準(zhǔn),更有利于皮損與正常皮膚顏色差異較小的區(qū)域的分割。分別對(duì)圖像在三種顏色空間做Κ均值聚類,在此分割的基礎(chǔ)上將三種分割結(jié)果相與,得到基于混合顏色空間的聚類結(jié)果,如圖2所示。
由此可知,對(duì)于復(fù)雜的大塊白斑,在Lab空間,分割結(jié)果中噪聲較多,邊緣毛刺現(xiàn)象嚴(yán)重;在HSV空間,分割邊緣較為平滑,但漏分的區(qū)域相對(duì)較大;在YCbCr空間,分割噪聲較多,但分割區(qū)域較準(zhǔn)確。因此,在此基礎(chǔ)上將三者混合,得到的分割結(jié)果視覺(jué)效果更好,噪聲較少,分割區(qū)域更完整,且三者取相同的部分使分割可靠性更高。
圖2 分割結(jié)果Fig.2 Segmentation results
因?yàn)槊娣e測(cè)量需要提取目標(biāo)區(qū)域的像素點(diǎn),所以這里將該圖像轉(zhuǎn)換成二值圖像,如圖3(a)所示,轉(zhuǎn)換成二值圖后只需要提取出圖像中白色部分即像素值為1的像素點(diǎn)即可知道白斑皮損的面積。
由圖3(a)所示目標(biāo)區(qū)域二值化圖像可知,皮損區(qū)域中有一部分紅血絲較多的地方被誤分割為正常皮膚,形成孔洞,圖像邊緣受光干擾影響產(chǎn)生較多噪點(diǎn),為減少像素點(diǎn)提取的誤差,本文應(yīng)用了數(shù)學(xué)形態(tài)學(xué)的相關(guān)算法對(duì)二值圖去噪。由二值化圖像分析可知,要去掉邊緣部分的細(xì)小而不連續(xù)的點(diǎn),同時(shí)要求不能改變目標(biāo)區(qū)域面積,根據(jù)文獻(xiàn)[16]可知,可以采用開(kāi)運(yùn)算或?qū)ο笠瞥齺?lái)達(dá)到類似的目的。
開(kāi)運(yùn)算是利用結(jié)構(gòu)元素對(duì)圖像進(jìn)行先腐蝕后膨脹的過(guò)程,這里結(jié)構(gòu)元素是具有特定形狀的矩陣,通過(guò)與圖像的相互作用提取圖像的形態(tài)結(jié)構(gòu)。腐蝕是用結(jié)構(gòu)元素掃描圖像中每一個(gè)像素并與其覆蓋的二值圖像部分的像素做“與”操作,如果都為1,則該像素為1,否則為0;而膨脹恰好與其相反,全部為0時(shí),則圖像素中的該像素為0,反之為1,相當(dāng)于濾波窗口的作用。由于白斑形狀無(wú)規(guī)則,邊緣呈曲線狀,在去除噪聲的同時(shí)又要盡可能保留邊緣信息[17]供后續(xù)分析,所以在實(shí)驗(yàn)中創(chuàng)建了平面圓盤作為結(jié)構(gòu)元素去探測(cè)圖像,根據(jù)文獻(xiàn)[18]可知,結(jié)構(gòu)元素尺寸越大,圖像邊緣損失越嚴(yán)重,通過(guò)實(shí)驗(yàn)也發(fā)現(xiàn),半盤半徑選的越大,邊緣形狀變化越大,為盡可能保留白斑形態(tài),選取半徑為1的圓盤對(duì)二值圖做開(kāi)運(yùn)算后結(jié)果如圖3(b)所示。
圖3 形態(tài)學(xué)處理1Fig.3 Morphological processing 1
圖4 形態(tài)學(xué)處理2Fig.4 Morphological processing 2
圖3 (a)和(b)中測(cè)得的相應(yīng)二值圖中像素值為1的像素點(diǎn)數(shù)目分別為42601、42405,可以看到經(jīng)開(kāi)運(yùn)算后,圖像邊緣一些不連續(xù)的細(xì)小噪點(diǎn)基本上已經(jīng)被消除了,且完整的保留了白斑的形態(tài)及邊緣信息,但在小面積白斑分散聚集的地方仍有些許噪聲,所以這里對(duì)圖像再進(jìn)行一次處理。采用形態(tài)學(xué)中的“對(duì)象移除”算法來(lái)處理,因圖像大小為386×271,根據(jù)估算,移除像素小于50的的連通對(duì)象,結(jié)果如圖4(a)所示,發(fā)現(xiàn)邊緣噪聲已基本上被濾掉了,白斑邊緣清晰,細(xì)節(jié)信息保留完整。
經(jīng)過(guò)開(kāi)運(yùn)算和對(duì)象移除的形態(tài)學(xué)處理后的圖像,中間還有孔洞,所以要對(duì)其進(jìn)行填充,結(jié)果如圖4(b)所示,白斑區(qū)域中間的孔洞均被填充,內(nèi)部均勻,視覺(jué)效果更好,其中白色像素點(diǎn)的數(shù)目為42701,而要測(cè)得白斑皮損的實(shí)際面積只需提前將相機(jī)定標(biāo)或者將某一已知實(shí)際面積的標(biāo)準(zhǔn)物件,如1元硬幣等一同拍攝到圖像中,通過(guò)計(jì)算出該物件區(qū)域的像素點(diǎn)數(shù)目,即可得到單個(gè)像素點(diǎn)所代表的實(shí)際面積:?jiǎn)蝹€(gè)像素點(diǎn)實(shí)際面積 =標(biāo)準(zhǔn)件實(shí)際面積 / 標(biāo)準(zhǔn)件像素個(gè)數(shù)。這樣:白斑的實(shí)際面積=單個(gè)像素點(diǎn)實(shí)際面積×提取像素點(diǎn)個(gè)數(shù),就實(shí)現(xiàn)了白斑面積的快速測(cè)量。
通過(guò)本文實(shí)驗(yàn)可知,包含大面積白癜風(fēng)白斑的圖像,在經(jīng)中值濾波后,圖像整體亮度得到改善,對(duì)比度增強(qiáng)。將增強(qiáng)后的圖像在混合顏色空間下進(jìn)行Κ均值聚類,圖像分割效果明顯。將分割后的圖像轉(zhuǎn)換成二值圖,并進(jìn)行形態(tài)學(xué)處理,能最大程度保留白斑原始形態(tài)和細(xì)節(jié)信息,同時(shí)消除了處理過(guò)程中產(chǎn)生的噪聲。最后進(jìn)行區(qū)域填充,提取出的白斑變得更均勻平滑,獲得了更好的視覺(jué)效果,更有利于白斑區(qū)域的像素提取。從實(shí)驗(yàn)過(guò)程中,還可以看到在做不同處理時(shí),白斑像素點(diǎn)的變化,使得通過(guò)提取白斑區(qū)域像素點(diǎn)來(lái)計(jì)算實(shí)際白斑面積更可靠。且整個(gè)算法約1s完成,實(shí)時(shí)性好。
本文提出的算法有效的實(shí)現(xiàn)了對(duì)大面積白斑的無(wú)損快速檢測(cè),在保證準(zhǔn)確性的前提下,相比于前人的方法,不僅有效提高了效率還降低了成本,在臨床上發(fā)展前景廣闊。而且對(duì)于白癜風(fēng)病患的跟蹤測(cè)量,只需按周期提取白斑圖像的像素點(diǎn),根據(jù)像素點(diǎn)測(cè)出相對(duì)面積變化,就可以了解病情的發(fā)展和判斷治療是否有效,指導(dǎo)意義重大。在此基礎(chǔ)上,后續(xù)將研究改進(jìn)算法,使得對(duì)于被毛發(fā)覆蓋的白斑也能有效提取。