基于多曲率輪廓信息的病理圖像細胞核自動檢測*
張翼1,龐寶川2
(1.華中科技大學(xué)文華學(xué)院電子與信息工程系,湖北 武漢 430074;
2.華中科技大學(xué)電子與信息工程系,湖北 武漢 430074)
摘要:細胞核自動檢測既是病理圖像分析技術(shù)的重要步驟,也是提高病理圖像自動化分析準確性的主要瓶頸之一,原因在于病理切片制作存在染色分層不均、細胞核粘連或重疊等問題。為了提高細胞核檢測的準確度,定義了一種基于多曲率輪廓的細胞核自動檢測模型,通過多曲率方向能量濾波器提取細胞核輪廓信息。特征檢測器基于boosting算法,利用不同曲率和方向輪廓特征的完備集合產(chǎn)生像素軟分類器,獲得像素的前景背景置信度和概率。最后利用均值漂移算法得到細胞核中心位置及其置信度。實驗結(jié)果表明,該算法與其他細胞核檢測算法相比,在生物組織結(jié)構(gòu)變異、不均勻光照或染色條件下,以及細胞核粘連或部分重疊等情況下,有著較強的魯棒性。
關(guān)鍵詞:細胞核檢測;多曲率;模式識別;機器學(xué)習(xí)
中圖分類號:TP181 文獻標志碼:A
doi:10.3969/j.issn.1007-130X.2015.06.018
收稿日期:*2014-05-19;修回日期:2014-08-11
基金項目:湖北省高等學(xué)校優(yōu)秀中青年科技團隊計劃資助(T201431)
作者簡介:
通信地址:430074 湖北省武漢市華中科技大學(xué)文華學(xué)院電子與信息工程系信息大樓
B423Address:B423,Information Building,Department of Electronic and Information Engineering,Wenhua College,Huazhong University of Science and Technology,Wuhan 430074,Hubei,P.R.China
Automatic detection of cell nucleus in pathological imagesbased on multi-curvature contour features
ZHANG Yi1,PANG Bao-chuan2
(1.Department of Electronic and Information Engineering,Wenhua College,
Huazhong University of Science and Technology,Wuhan 430074;
2.Department of Electronic and Information Engineering,
Huazhong University of Science and Technology,Wuhan 430074,China)
Abstract:Nucleus automatic detection is not only an important part of pathological image analysis, but also one of the primary bottlenecks to improve the analysis accuracy of the technology. The reason lies in that the pathological slice exhibits uneven layering and staining, nucleus crowding or overlapping. In order to improve the accuracy of the nucleus detection, we design a nucleus model of multi-curvature contour. The nucleus contour features are extracted by multi-curvature orientation energy filter. Then the contour features, along with the cell nucleus ground truth, are put into a boosting algorithm, which creates a pixel classifier to classify pixels into foreground and background. In the end, the mean-shift algorithm produces the confidence co-efficiency of the nucleus for each location. Experimental results show that in comparison with other state-of-art cell nuclei detection methods, our method is more robust to conditions such as biological variations, different staining and illumination conditions, and touching or partial occlusions.
Key words:nucleus detection;multi-curvature;pattern recognition;machine learning
1引言
病理檢查是通過顯微鏡觀察活體組織樣本,以確定病變的程度和原因。由于人類大腦和視覺系統(tǒng)的局限性,病理圖像的人工診斷存在耗時、費力、易誤判、主觀性強等不足。近年來,病理樣本的計算機視覺自動檢測越來越被人們所重視,已成為病理檢查的有效工具之一[1]。
細胞核自動檢測與分割,既是自動病理分析的重要步驟,也是解決該問題的主要障礙,原因在于傳統(tǒng)病理切片制作過程中,不可避免會出現(xiàn)分層不均勻、細胞核聚集等情況。而且,染色過程中造成的顏色純度和光照亮度差異,也為細胞核檢測帶來了挑戰(zhàn)。因此,在病理圖像中,提出準確有效的細胞核檢測與分割方法,是當(dāng)前該領(lǐng)域研究的核心熱點。為了達到此目的,傳統(tǒng)研究方法必須對大量細胞特征進行檢測,包括各類細胞和組織的形態(tài)、形狀、紋理等。
本文主要基于細胞核輪廓特征,來解決細胞核檢測和定位問題。相比其他特征,輪廓信息在病理圖像分析中具有突出優(yōu)勢。例如,輪廓特征具有染色和光照不變性,并能準確反映細胞核的形態(tài)和結(jié)構(gòu)。本文通過多曲率方向能量濾波器提取輪廓信息;利用boosting算法融合不同曲率和方向的輪廓信息,進行像素分類;最后基于密度估計來檢測細胞核中心,應(yīng)用均值漂移算法得到細胞核中心檢測的置信度。
2細胞核檢測模型
在細胞核檢測中,對于聚集或重疊的細胞核,輪廓圖像比原始圖像具有更高的識別率。病理圖像中的細胞核輪廓相對其他特征具有顯著優(yōu)勢:極大的染色和光照不變性、較強的形態(tài)和結(jié)構(gòu)描述性,并且輪廓特征沿著細胞核邊緣更易提取,相比之下,其他局部描述器,如細胞核紋理,在背景環(huán)境混亂或染色質(zhì)分布不均時,無法實現(xiàn)可靠匹配。因此,輪廓特征是細胞核檢測的最有效特征,本文將輪廓定義為細胞核的外圍邊緣,或細胞核與背景的邊界。
Figure 1 Cell nucleus model 圖1 細胞核模型
下一步將討論如何將多曲率方向能量濾波器與空間先驗?zāi)P拖嘟Y(jié)合,以確定邊緣的存在。
3多曲率輪廓信息提取
本節(jié)中定義一種多曲率方向能量濾波器,確定了細胞核輪廓模型的參數(shù),結(jié)合空間先驗?zāi)P?,得到輪廓先驗概率,以提取輪廓?/p>
3.1多曲率方向能量濾波器
方向能量OE(Orientation Energy)在計算機視覺領(lǐng)域被作為一種基本工具使用[2]。在方向θ上的OE定義為:
(1)
OE濾波器已被證實在自然圖像的輪廓和紋理分析中起到了極大的作用[3,4]。然而,將OE應(yīng)用于細胞核輪廓依然存在著挑戰(zhàn)。主要原因在于細胞紋理區(qū)域太大,特別是病理圖像尤為突出,以至于OE在紋理區(qū)域得到過多的假響應(yīng),而事實上并非細胞核邊緣。而且,細胞粘連和重疊的現(xiàn)象也會導(dǎo)致在使用OE時產(chǎn)生邊緣漏檢。
本文改進了傳統(tǒng)的OE,在提取細胞核邊緣方向時,也提取了邊緣曲率信息,結(jié)合曲率參數(shù)定義多曲率方向能量濾波器MCOE(Multi-CurvatureOrientationEnergy),圖2c和圖2d分別表示當(dāng)曲率為k時MCOE的奇、偶對稱濾波器核。
Figure 2 Traditional OE and MCOE filter kernels 圖2 傳統(tǒng)OE與MCOE的奇偶對稱濾波器核
假設(shè)邊緣方向為θ,曲率為k,尺度為σ,則MCOE可定義為:
(2)
Figure 3 MCOE filter kernels under different curvatures 圖3 不同曲率下MCOE濾波器核示意圖
其中σk表示MCOE對圖像噪聲的響應(yīng)。
Figure 4 Comparison of traditional OE and MCOE filters 圖4 傳統(tǒng)OE濾波器與多曲率MCOE濾波器的輪廓檢測對比
3.2輪廓特征提取
假設(shè)某細胞核中心位置為c,要試圖定位曲率為k且方向為θ的輪廓邊緣,則邊緣Ek,θ的位置可表示為xk,θ=c+uk,θ,其中uk,θ為邊緣相對中心的位移。在建立輪廓位置分布時,若細胞核邊緣相對細胞核中心的空間分布呈高斯分布,大小為Σk,θ,期望為μk,θ,那么邊緣的空間先驗分布可表示為:
其中,μk,θ、Σk,θ是通過獨立學(xué)習(xí)每條邊緣獲得的參數(shù),其目的在于表示多曲率多方向的輪廓邊緣之間的相對空間位置分布。
邊緣Ek,θ最大概率的分布位置可表示為:
輪廓最大響應(yīng)hk,θ將作為分類器的輸入特征,可表示為:
3.3輪廓特征提取的參數(shù)選擇
方向不變性假設(shè)也可應(yīng)用于空間先驗?zāi)P停欢?,?dāng)建立邊緣相對細胞核中心的位置分布的模型時,情況會更加復(fù)雜。若旋轉(zhuǎn)矩陣Θ定義為:
4像素分類
本節(jié)將詳述怎樣利用boosting滑動窗口分類器來融合各種曲率和方向的輪廓信息。圖像的輪廓信息提取后,像素分類器在整個圖像上分類,得到像素為細胞核的置信度與概率。
4.1檢測分類
4.2訓(xùn)練分類器
Figure 5 Illustration of training example selection strategy 圖5 訓(xùn)練樣本選擇策略
5細胞核中心檢測
運用上一節(jié)的方法,可以得到各像素上細胞核存在的概率,這些概率是由軟分類器在每個像素上獨立獲得的。然而,由常識可知,鄰近像素的概率并非統(tǒng)計獨立。例如,鄰近像素均被判別為細胞核像素,它們一般屬于同一細胞核,而不是不同的細胞核。在細胞核中心檢測中,目標是對每個細胞核的中心位置進行定位。因此,如何通過像素概率得到細胞核的中心位置,成為細胞核中心檢測的關(guān)鍵。
其中,K是帶寬為h的高斯核,一般可以設(shè)定為典型的細胞核半徑值。
6實驗與評估
利用本文的細胞核檢測器來檢測一組標準參照數(shù)據(jù)集,以評估性能。原始圖像和相關(guān)的數(shù)據(jù)來源于加州大學(xué)圣塔芭芭拉分校UCSB(UniversityofCaliforniaSantaBarbara)生物圖像信息學(xué)中心提供的標準參照數(shù)據(jù)集[11,12]。數(shù)據(jù)集包括58個H&E染色的乳腺癌病理研究圖像,大小為896×768,其中26個為惡性腫瘤圖像,32個為良性腫瘤圖像。每張圖像被劃分成200×200的多個窗口。
將本文方法與文獻[13,14]中提出的高斯拉普拉斯算法LoG(LaplaceofGaussian)進行對比。為了客觀性,將數(shù)據(jù)分為兩組,其中訓(xùn)練集有29個圖像,檢測集為另外29個圖像,并用兩種方法進行訓(xùn)練和檢測。
首先對比兩種方法下的軟檢測結(jié)果。圖6a和圖6b分別展示了原始病理圖像和人工檢測的細胞核參照標準。圖6c和圖6d分別表示LoG和本文方法的檢測結(jié)果,對比可知,本文方法檢測到更大范圍的細胞核,并且對于聚集的細胞核,本文方法比LoG具有更高的置信度。原因可能在于LoG使用前景與背景區(qū)域的差異來實現(xiàn)檢測,當(dāng)發(fā)生聚集時,細胞核區(qū)域與相鄰區(qū)域無法分辨,從而降低了結(jié)果的置信度。本文方法中,使用超完備輪廓特征集來解決這一問題。當(dāng)在中心像素周圍檢測到一組特定結(jié)構(gòu)的邊緣時,即可判定細胞核存在,而不用考慮粘連部分邊緣的缺失。
Figure 6 Example of confidence map 圖6 置信度圖示例
對同一圖像的局部區(qū)域進行檢測的結(jié)果如圖7所示,圖中黑色圓點表示正確檢測TP(TruePositive),白色圓點表示誤報FP(FalsePositive),圖7a和圖7b分別表示LoG與本文方法的檢測結(jié)果。對比可知,本文方法顯示了更多的正確檢測,即使在染色或照明不均、背景混亂、細胞核重疊的情況下,檢測器依然能保持較好的性能,特別是對重疊區(qū)域的檢測效果顯著。然而,當(dāng)細胞核形態(tài)異常時,本文方法難免產(chǎn)生錯誤檢測。例如,圖7b中右側(cè)的一個細胞核,體積明顯增大,且形狀呈不規(guī)則改變,使用該方法檢測,得到如圖7b中圓點所標示的兩個響應(yīng),即該異常細胞核被錯誤地判定為兩個細胞核。
Figure 7 Cell nucleus detection examples 圖7 細胞核檢測結(jié)果示例
為了比較兩種方法的全面性能,使用兩種相關(guān)的測度。當(dāng)軟決策確定圖轉(zhuǎn)化成最終檢測結(jié)果時,需要使用一個全局閾值來過濾掉弱置信度。不同的閾值對應(yīng)不同檢測精確度(Precision)和反饋度(Recall)。圖8繪制了Precision和Recall之間的變化關(guān)系曲線。精確度指正確檢測到的樣本數(shù)量與所有參與檢測的樣本數(shù)量之比;反饋率指正確檢測到的樣本數(shù)量與真實存在細胞核的樣本數(shù)量的比例。已知標準參照的細胞核位置,當(dāng)檢測結(jié)果定位于距標準位置五個像素之內(nèi),則確定為正確檢測。實驗結(jié)果表明本文方法比BlobDetector更有效。
Figure 8 Precision-Recall result 圖8 Precision-Recall圖
7結(jié)束語
本文提出一種基于不同曲率和方向輪廓信息的細胞核檢測技術(shù),并用實驗和其他方法進行了對比。實驗結(jié)果表明,本文方法在生物組織結(jié)構(gòu)變異、不同染色、光照不均以及部分重疊等特殊情況下更具魯棒性。本文建立了多曲率細胞核輪廓模型,并闡述了如何從相同曲率、不同方向的輪廓模型中有效而快速地提取參數(shù)。根據(jù)經(jīng)驗選擇一定數(shù)量的曲率和方向,形成固定的數(shù)據(jù)集供檢測器學(xué)習(xí),下一步將研究如何選擇最優(yōu)輪廓集合,并結(jié)合其他特征,如細胞紋理等,以擴展本文方法。同時,在提取細胞核特征時,希望利用稀疏表示方法替代預(yù)先設(shè)定的多曲率濾波器,并且今后將著手于將本檢測器應(yīng)用于細胞核分割算法。
參考文獻:
[1]WangW,OzolekJA,SlepcevD,etal.Anoptimaltransportationsapproachfornuclearstructure-basedpathology[J].IEEETransactiononMedicalImaging, 2011,30(3):621-631.
[2]PeronaP,MalikJ.Detectingandlocalizingedgescomposedofsteps,peaksandroofs[C]//Procofthe3rdInternationalConferenceonComputerVision, 1990:52-57.
[3]MartinDR,FowlkesCC,MalikJ.Learningtodetectnaturalimageboundariesusinglocalbrightness,color,andtexturecues[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2004, 26(5):530-549.
[4]ArbelaezP,MaireM,FowlkesC,etal.Contourdetectionandhierarchicalimagesegmentation[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2011,33(5):898-916.
[5]ViolaP,JonesMJ.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures[C]//ProcofIEEEConferenceonComputerVisionandPatternRecognition, 2001:511-518.
[6]FerrariV,SchmidC.Groupsofadjacentcontoursegmentsforobjectdetection[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2008,30(1):36-51.
[7]FerrariV,HastieT,TibshiraniR.Additivelogisticregression:Astatisticalviewofboosting[J].AnnalsofStatistics,2000,28(2):337-407.
[8]HastieT,TibshiraniR,FriedmanJ.Theelementofstatisticallearning:Datamining,inference,andprediction[M].NewYork:Springer, 2009.
[9]TorralbaA,MurphyKP,FreemanWT.Sharingvisualfeaturesformulticlassandmultiviewobjectdetection[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2007,29(5):854-869.
[10]ZhouHY,YuanY,ShiCM.Objecttrackingusingsiftfeaturesandmeanshift[J].ComputerVisionandImageUnderstanding, 2009,113(3):345-352.
[11]GelascaED,ObaraB,FedorovD,etal.Abiosegmentationbenchmarkforevaluationofbioimageanalysismethods[J].BMCBioinformatics, 2009,10(11):368-379.
[12]GelascaE,ByunJ,ObaraB,etal.Evaluationandbenchmarkforbiologicalimagesegmentation[C]//ProcofInternationalConferenceonImageProcessing, 2008:1816-1819.
[13]ByunJ,VerardoM,SumengenB,etal.Automatedtoolfornucleidetectionindigitalmicroscopicimages:Applicationtoretinalimages[J].MolecularVision, 2006(12):949-
960.
[14]SantellaA,DuZ,NowotschinS,etal.Ahybridblob-slicemodelforaccurateandefficientdetectionoffluorescencelabelednucleiin3d[J].BMCBioinformatics, 2010,11(11):580-592.
張翼(1985-),女,湖北安陸人,碩士,講師,研究方向為計算機視覺和模式識別。E-mail:16497994@qq.com
ZHANGYi,bornin1985,MS,lecturer,herresearchinterestsincludecomputervision,andpatternrecognition.
龐寶川(1982-),男,湖北武漢人,博士后,研究方向為模式識別和醫(yī)學(xué)圖像處理。E-mail:12820648@qq.com
PANGBao-chuan,bornin1982,post-doctor,hisresearchinterestsincludepatternrecognition,andmedicalimageprocessing.
《計算機工程與科學(xué)》征文通知
《計算機工程與科學(xué)》是由國防科技大學(xué)計算機學(xué)院主辦的中國計算機學(xué)會會刊,是國內(nèi)外公開發(fā)行的計算機類綜合性學(xué)術(shù)刊物,現(xiàn)為月刊。 本刊歡迎關(guān)于計算機科學(xué)理論、計算機組織與系統(tǒng)結(jié)構(gòu)、計算機軟件、計算機應(yīng)用、計算機器件設(shè)備與工藝等學(xué)科領(lǐng)域方面的來稿。本刊每年出版一期高性能計算??⑶页D暝O(shè)有高性能計算專欄。
來稿論文必須未發(fā)表、未投到其他會議或期刊。
來稿要求和注意事項:
(1) 主題明確、文字精練、語句通順、數(shù)據(jù)可靠。
摘要(2) 標題、作者單位、、關(guān)鍵詞采用中英文間隔行文;請注明是否基金資助項目論文(注明項目名稱和編號) ,并注明文章中圖法分類號。務(wù)必附上所有作者中英文簡歷(姓名、性別、出生年月、籍貫、學(xué)位、職稱、研究方向) 、1寸證件照片(軍人請用便服照)、中英文通信地址、聯(lián)系電話和Email 。
(3) 作者在投稿時須注明是否是CCF會員(高級會員、普通會員、學(xué)生會員) ,若是會員,請注明會員號。第一作者是CCF會員的,將享受8.5折的版面費優(yōu)惠。
(4) 來稿請用WORD軟件編輯,格式為A4 , 40行×40列,通欄排版,正文為5 號宋體,論文長度不得低于5個標準版面,并請自留底稿。
(5) 來稿中圖形繪制要求工整、清晰、緊湊,尺寸要適當(dāng),圖中文字用6 號宋體,線為0.5 磅。
(6) 每篇論文格式要求:1 引言;……;最后是結(jié)束語。引言和結(jié)束語中盡量不用圖和表。附錄應(yīng)放參考文獻之后。參考文獻限已公開發(fā)表的。
參考文獻(7) 來稿文責(zé)自負,要遵守職業(yè)道德,如摘引他人作品,務(wù)請在中予以著錄。署名的作者應(yīng)為參與創(chuàng)作,對內(nèi)容負責(zé)的人。文章發(fā)表后,如不同意其他報、刊、數(shù)據(jù)庫等轉(zhuǎn)載、摘編其作品,請在來稿時聲明。
(9)本刊對來稿按100元/篇的標準收取稿件審理費。對已決定刊用的稿件按230元/頁的標準收取版面費。稿件刊登后,按國家有關(guān)規(guī)定酌致稿酬(含與本刊簽約的其他出版物轉(zhuǎn)摘的稿酬),同時贈送當(dāng)期樣刊兩本。
聯(lián)系地址:410073 湖南省長沙市國防科技大學(xué)《計算機工程與科學(xué)》編輯部
聯(lián)系電話:0731-84576405電子郵件:jsjgcykx@163.net
投稿主頁:http://www.joces.org.cn