史水娥, 李 鑫, 胥帥帥, 伍 博
(1.河南師范大學(xué) 電子與電氣工程學(xué)院,河南 新鄉(xiāng) 453007;2.河南省電磁波工程院士工作站,河南 新鄉(xiāng) 453007)
白細(xì)胞通常被稱為免疫細(xì)胞,在人體免疫系統(tǒng)中起著重要作用,許多研究人員在血細(xì)胞檢測領(lǐng)域進(jìn)行了大量的工作。文獻(xiàn)[1]結(jié)合距離變換和邊緣梯度的信息,靈活提取代表目標(biāo)的前景標(biāo)記和代表背景及干擾的背景標(biāo)記,通過分水嶺變換實現(xiàn)細(xì)胞分割。文獻(xiàn)[2]針對顯微圖像中細(xì)胞的形狀特征,提出基于支持向量機(jī)和橢圓擬合的細(xì)胞圖像自動分割。文獻(xiàn)[3]通過改進(jìn)的分?jǐn)?shù)階微分對細(xì)胞圖像進(jìn)行預(yù)處理,用分水嶺算法初分割,通過改進(jìn)的圖論對圖像再分割。文獻(xiàn)[4]采用多特征均值聚類算法和粘連分離模型分割圖像。盡管以上方法對紅細(xì)胞、淋巴細(xì)胞和單核細(xì)胞的分割效果較好,但當(dāng)細(xì)胞核不規(guī)則時,效果并不理想。
為了有效檢測出不同形態(tài)白細(xì)胞的外輪廓信息,先使用K-means++聚類分割彩色血細(xì)胞圖像,可以有效去除背景中的血小板和紅細(xì)胞,得到的白細(xì)胞輪廓可以近似為橢圓,因此可以應(yīng)用橢圓檢測技術(shù)來識別這樣的元素。文獻(xiàn)[5]利用邊緣曲率和凸度來確定邊緣輪廓是否可以組合在一起,并進(jìn)行二維Hough變換來獲得橢圓參數(shù)。文獻(xiàn)[6]根據(jù)橢圓弦與其中心的關(guān)系選擇候選圓弧,并通過分解后的參數(shù)空間進(jìn)行參數(shù)估計。文獻(xiàn)[7]對Fornaciari方法進(jìn)行了改進(jìn),利用一個射影不變量來剪除不需要的候選對象。以上方法對規(guī)則的橢圓輪廓檢測效果較好,而對于近似橢圓的白細(xì)胞輪廓常有誤檢。
本文提出基于邊緣分類的橢圓檢測用于處理K-means++預(yù)處理過的血細(xì)胞圖像,以獲得不同形態(tài)的白細(xì)胞外輪廓信息。
K-means[8]聚類原理:以空間中k個點為中心聚類,對最靠近它們的對象歸類,類別數(shù)為k。不斷迭代,逐次更新各聚類中心值,直至得到最好的聚類結(jié)果。最終的k個聚類本身盡可能緊湊,各個聚類之間盡可能分開。該算法基于歐氏距離劃分,優(yōu)化目標(biāo)函數(shù)誤差平方和(sum of squares for error,SSE)為樣本點到所屬聚類中心的距離平方和,優(yōu)化目標(biāo)函數(shù)表達(dá)式為
(1)
式中xij為第i類第j個樣本點;Ni為第i類的樣本個數(shù);ci為第i類的聚類中心;k為聚類數(shù)目。當(dāng)SSE最小時,迭代結(jié)束。
K-means算法簡潔快速,但隨機(jī)選取的初始聚類中心點位置距離越近,效果越差。K-means++[9]針對這一問題做出改進(jìn),可以直觀地將這一改進(jìn)理解成K個初始聚類中心相互之間應(yīng)該分得越開越好。
白細(xì)胞圖片中每個像素點對應(yīng)的坐標(biāo)為(x,y,r,g,b),其中,(x,y)為位置信息,(r,g,b)為色彩信息。K-means++算法通過對每個像素點色彩信息RGB三個維度聚類,以實現(xiàn)相同顏色的像素在一簇,就可以將圖像分割,進(jìn)一步進(jìn)行橢圓檢測。
針對不規(guī)則的細(xì)胞邊緣的邊緣分類的橢圓檢測主要由4步組成:圓弧提取、弧線分組、橢圓聚類、參數(shù)估計。
首先,使用具有自動閾值的Canny邊緣檢測器[10]檢測邊緣,根據(jù)梯度將邊緣分為四類。然后,利用尺寸約束去除無效邊緣。
1)邊緣分類:給定Canny邊緣檢測器獲得的邊緣點ei=(xi,yi,dxi,dyi),其中(xi,yi)是位置坐標(biāo),(dxi,dyi)分別是X和Y方向上的Sobel微分,該點的斜率tanφi由下式獲得
(2)
式中φi為該點的切線與水平軸正方向之間的角度。如果tanφi恰好等于零,則丟棄像素。將W+定義為具有正邊緣點的集合,將W-定義為其余邊緣點的集合。通過將每個邊緣點與同一集合中8個鄰域中的其他點鏈接在一起,形成一個弧。
根據(jù)弧中點M斜率tanφM的正負(fù)以及左端斜率值tanφl和右端斜率值tanφr的大小關(guān)系將圓弧α分為4個類別,如表1所示。
表1 圓弧分類
2)大小限制:分類后,用αc表示需要去除的僅有少量像素的弧與具有大量共線點的弧,因為它們會導(dǎo)致錯誤的檢測。圓弧中像素點數(shù)小于定義的閾值(Nk 在邊緣分類和無效邊緣刪除之后,將屬于同一個橢圓的弧進(jìn)行分組,為弧分組定義位置約束和切線約束。對每個弧組,使用最小二乘擬合用于估計橢圓參數(shù)。 1)位置約束:相對位置關(guān)系確?;〗M里形成橢圓的4個弧分別來自4個不同的類別(αⅠ,αⅡ,αⅢ,αⅣ)。定義有效標(biāo)記η,當(dāng)η=1時,表明位置有效;當(dāng)η=0時,表明位置無效,見表2。 表2 位置有效性分類 其中,LⅠ·x表示αⅠ的最左端像素的x坐標(biāo),RⅠ·y表示αⅠ的最右端像素的y坐標(biāo)。其余弧的標(biāo)記類似。根據(jù)實驗,Thp的值設(shè)置為2。 2)切線約束:在橢圓的外切四邊形中,兩條對角線和對邊的兩條切線弦相交一個點。本文將這一幾何關(guān)系稱為切線約束。如圖1(a)所示,理想情況4條虛線應(yīng)在同一點相交。然而圖像總有噪聲,所以,4條虛線不會正好相交于一點,如圖1(b)所示。將C1表示為P1P3和P2P4的交點,將C2表示為MiMk和MjMm的交點。由C1和C2的坐標(biāo)計算出C1和C2間的歐氏距離d(C1,C2)<閾值Thd時,認(rèn)為4個圓弧滿足切線約束。 圖1 切線約束示意 滿足上述條件的圓弧,仍然可能存在錯誤擬合的橢圓。由于外部特征影響,一個橢圓可能被分成兩個弧,導(dǎo)致提取出兩個橢圓。因此,需要對同一橢圓的多個檢測進(jìn)行聚類。 橢圓聚類:給定兩個橢圓,定義(Δdx,Δdy),Δda,Δdb和Δdθ分別為兩個橢圓中心、長半軸、短半軸和旋轉(zhuǎn)角對應(yīng)的距離。然后,相似度指數(shù)D如下 D={(Δdx<0.1)&(Δdy<0.1)&(Δda<0.1)& (Δdb<0.1)&(Δdθ<0.1)} (3) 其中,D=1意味著有相似的橢圓需要聚類。得分最高的橢圓被認(rèn)為是給定聚類的中心。 對于滿足聚類后的圓弧組,使用改進(jìn)的最小二乘法擬合方法[11]估計橢圓參數(shù)。該方法能充分利用邊緣點對橢圓進(jìn)行擬合,與實際目標(biāo)吻合更優(yōu)。估計橢圓參數(shù)包括中心點C的坐標(biāo)(x,y),長半軸a,短半軸b,旋轉(zhuǎn)角度θ和橢圓面積s。 進(jìn)行多個實驗驗證本文檢測算法的合理性,所有實驗都是在具有Intel?CoreTMi5—8250U CPU @ 1.8 GHz,4 GB RAM的64位計算機(jī)上進(jìn)行的,操作系統(tǒng)Windows 10,編譯軟件為MATLAB 2018a。 實驗使用經(jīng)典的BCCD數(shù)據(jù)集,其包括364張分辨率為640像素×480像素的8類不同形態(tài)的白細(xì)胞圖像。這里將K-means++算法與先進(jìn)的FRFCM(significantly fast and robust fuzzy C-means clustering)[12]和SFFCM(superpixel-based fast fuzzy C-means clustering)[13]進(jìn)行分割對比。 圖2(a)~(d)分別為淋巴細(xì)胞、單核細(xì)胞、中性桿狀核粒細(xì)胞和嗜堿性粒細(xì)胞。由于嗜酸性粒細(xì)胞與嗜堿性粒細(xì)胞分割效果相似,故不再列舉。與SFFCM和K-means++算法類似的是,F(xiàn)RFCM分割出了淋巴細(xì)胞與單核細(xì)胞的外輪廓,而對中性桿狀核粒細(xì)胞僅僅分割出了桿狀細(xì)胞核,對嗜堿性粒細(xì)胞外輪廓的分割效果也遠(yuǎn)不如SFFCM和K-means++算法,最重要的是,背景中大量的紅細(xì)胞與血小板分割了出來,這些輪廓不利于下一步的橢圓檢測。SFFCM雖然對中性桿狀核粒細(xì)胞和嗜堿性粒細(xì)胞的外輪廓分割效果優(yōu)于FRFCM,但是背景中紅細(xì)胞與血小板的分割效果與FRFCM相似,同樣不利于橢圓檢測。K-means++方法對4種白細(xì)胞的胞外輪廓的分割效果明顯優(yōu)于FRFCM和SFFCM,使其最接近橢圓狀。另外,抹除了背景中大量的紅細(xì)胞與血小板,去除了其對橢圓檢測的干擾。 圖2 4種白細(xì)胞分割結(jié)果 圖3表示的是不同分葉數(shù)的中性分葉核粒細(xì)胞,其中,n=2,3,4,5表示分葉的數(shù)目,由于分葉的不規(guī)則,使其分割難度大大增加??梢钥闯龅氖牵c圖2情況類似,F(xiàn)RFCM和SFFCM并不能有效去除背景中的紅細(xì)胞與血小板,對檢測目標(biāo)只分割出了顏色深的不規(guī)則的分葉細(xì)胞核部分,不利于下一步的橢圓檢測。K-means++方法不僅可以抹除背景,而且可以提取出橢圓狀的整體細(xì)胞,為橢圓檢測創(chuàng)造了條件。 圖3 中性分葉核粒細(xì)胞分割 為了評價基于邊緣分類的橢圓檢測方法的性能,實驗中采用了經(jīng)典的評估指標(biāo),分別是準(zhǔn)確率P、召回率R和F值,其定義如下 (4) (5) (6) 式中Ψ為檢測出來正確的橢圓的個數(shù),Ω為檢測出來的橢圓的個數(shù),Γ為圖像中真實存在的橢圓的個數(shù)。 將邊緣分類橢圓檢測算法與Fornaciari的方法和Jia的方法進(jìn)行參數(shù)比較, 采用的是經(jīng)典的Prasad數(shù)據(jù)集,包含198張低分辨率的具有多個小橢圓的圖像,每幅圖像平均有5.91個橢圓,約52.02 %的圖像尺寸小于300×300。如圖4(a)所示,對于任意的檢測橢圓數(shù)目N本方法都有最高的F值。由圖4(a),(b)可知在檢測橢圓數(shù)目N=3時其綜合性能指標(biāo)F值與準(zhǔn)確率P均高達(dá)0.85。在圖4(c)中顯示召回率R基本上介于另外兩種方法之間,它們都隨著橢圓數(shù)目N的增加而緩慢降低。 圖4 3種方法的參數(shù)比較 接著展示了對上述8類不同形態(tài)白細(xì)胞分割圖片的檢測效果。圖5中為3種橢圓檢測算法的效果對比。第3行Fornaciari的方法僅檢測出了單核細(xì)胞,中性桿狀核粒細(xì)胞和嗜堿性粒細(xì)胞3種白細(xì)胞圖片,而對淋巴細(xì)胞和4種中性分葉核粒細(xì)胞都出現(xiàn)了錯誤檢測或者重復(fù)檢測。第4行Jia的方法僅對分葉數(shù)n=2和n=5的中性分葉核粒細(xì)胞有效,而對于其他6種白細(xì)胞圖片同樣出現(xiàn)了不同程度的錯誤檢測或者重復(fù)檢測。相較而言,本方法不僅成功檢測出8類血細(xì)胞圖片中的白細(xì)胞的輪廓信息,而且檢測效果也是最優(yōu)的,沒有誤檢或者復(fù)檢。得到的8類白細(xì)胞的參數(shù)信息如表3所示。 圖5 3種方法的檢測效果 表3 8種不同形態(tài)白細(xì)胞的參數(shù)信息 針對不同形態(tài)的白細(xì)胞大小和位置信息難以確定的問題,本文使用K-means++算法分割預(yù)處理白細(xì)胞圖像,進(jìn)一步使用邊緣分類的橢圓檢測方法去獲得白細(xì)胞近似外輪廓信息。通過不同實驗的分割效果對比,可以看出:K-means++有效地消除了背景中紅細(xì)胞與血小板的干擾,為橢圓檢測創(chuàng)造了先決條件。在檢測方面,邊緣分類的橢圓檢測算法的F值最優(yōu),在檢測橢圓數(shù)目N=3時其F值與準(zhǔn)確率P均高達(dá)0.85。在效果上成功檢測到準(zhǔn)確的全部8類不同形態(tài)的白細(xì)胞的大小和位置信息。目前該方法還沒有在醫(yī)學(xué)圖像處理中得到應(yīng)用,有一定的研究價值。2.2 弧線分組
2.3 橢圓聚類
2.4 參數(shù)估計
3 實驗與結(jié)果
3.1 K-means++分割結(jié)果
3.2 橢圓檢測結(jié)果
4 結(jié) 論