程年 俞晨 寧靜艷
摘 要:利用深度學習網絡對組織病理圖片進行分類,以減少病理學家工作量,達到利用計算機輔助治療的效果。提出利用在兩種預訓練好的框架下提取的特征進行訓練,并研究了多級分類,該成果有利于癌癥后期治療,更加方便臨床醫(yī)學應用;利用遷移學習能夠減少訓練時間,并解決數(shù)據(jù)集不足的問題;通過數(shù)據(jù)增強的方法,可有效提高分類準確度。
關鍵詞:深度學習;乳腺癌病理圖片;數(shù)據(jù)增強;遷移學習
DOI:10. 11907/rjdk. 182847 開放科學(資源服務)標識碼(OSID):
中圖分類號:TP301文獻標識碼:A 文章編號:1672-7800(2019)008-0026-03
Classification of Breast Couldcer Images Based on Deep Learning Network
CHENG Nian1,YU Cheng2,NING Jing-yang1
(1. School of Automated,Southeast University;2. Jiangsu couldcer Hospital,Southeast University,Nangjing 210096,China)
Abstract:The purpose was that the method of deep learning was used to classify histopathological images, reducing the heavy work of pathologists and achieving the effect of using computer-assisted medical care. The way that the training of features extracted under two pre-trained frameworks was proposed. At the same time, multiple classes were also studied. Classification could be beneficial to the later treatment of couldcer, which was more convenient for clinical medicine applications. The use of migration learning could preferentially reduce the training time and data set; and the data enhancement method could improve the classification accuracy.
Key Words:deep learning; breast couldcer histopathological image; data augmentation; transfer learning
作者簡介:程年(1993-),女,東南大學自動化學院碩士研究生,研究方向為模式識別與人工智能;俞晨(1980-),女,江蘇省腫瘤醫(yī)院副主任醫(yī)師,研究方向為中西醫(yī)結合治療惡性腫瘤;寧靜艷(1994-),女,東南大學自動化學院碩士研究生,研究方向為模式識別、圖像處理。
0 引言
癌癥是困擾人類的一大難題,而乳腺癌在女性中為死亡率僅次于肺癌的第二大癌癥[1],約占各種腫瘤疾病的7%-10%,也有少數(shù)男性患者[2]。針對乳腺癌的診斷有多種方式,最初是使用臨床篩查進行組織病理學分析,以精確監(jiān)測腫瘤亞類型,或使用乳腺癌組織病理圖片進行自動分類[3]。由于乳腺癌發(fā)病率不斷提高,所以醫(yī)學上對乳腺癌的診斷與治療越來越關注,同時也是各大實驗室的研究熱點[4]。雖然傳統(tǒng)乳腺癌診斷方法為臨床檢查,但病理學檢查才是判斷患者是否患有癌癥,以及癌癥為良性還是惡性最重要的標準,如圖1所示[5]。
因此,病理學圖片分析對癌癥的準確診斷與后續(xù)治療起著至關重要的作用。然而,組織病理學分析需要病理學家經過長期培訓后才能完成,而且人工分析存在許多不確定性,不同病理學家的診斷也存在很大誤差,因此將在很大程度上影響后期治療。如何提升病理學圖片分析的準確性,成為目前一個亟待解決的問題。
圖1 癌癥診斷方式
將深度學習應用于數(shù)據(jù)分析領域已取得非常好的效果,因而受到了人們的廣泛關注。深度學習由人工神經網絡演變而來,但在人工神經網絡基礎上大量增加了神經元層數(shù),因此在提取圖片特征作用域時,能夠提取到更高層次的特征[6]。將深度學習與病理學圖片分析相結合,是數(shù)字醫(yī)學界的一大創(chuàng)新,同時推動了醫(yī)學發(fā)展[7]。2005年,Xu等[8]提出一種堆疊式稀疏自動編碼器(Stacked Sparse Autoencoder,SSAE) 框架對乳腺癌組織病理圖片進行自動細胞核監(jiān)測,該方法監(jiān)測效果優(yōu)于其它9種細胞核監(jiān)測方法;Bayramoglu等[9]對數(shù)據(jù)集BreaKHis進行訓練,其采用基于放大倍數(shù)獨立的深度學習分類方法,識別率達到 83%;韓泓澤與魏賓等[10]將Ronneberger等[11]提出的U-Net應用于乳腺癌細胞檢測,首先利用U-Net卷積網絡獲取乳腺癌病理切片圖像中的特征信息,然后將提取的不同層次特征信息通過4次上采樣操作進行融合,輸出與原圖像具有相同分辨率的圖像,并得到每個像素點被分類為癌細胞的概率,該方法對乳腺癌細胞的檢測準確率超過99%;Deniz等[12]于2018年提出采用遷移學習方式對乳腺癌的組織病理學圖片進行分類,并使用預訓練好的AlexNet網絡進行微調,證明了遷移學習比支持向量機(Support Vector Machines,SVM)[13]能夠達到更好的效果。但醫(yī)學圖片是非常珍貴且稀缺的資源,因此很難得到深度學習網絡所需的數(shù)據(jù)集。組織病理學圖片不同于自然圖片,其像素數(shù)量有的可達到上億級別。本文研究的基于深度學習對乳腺圖片的分類,通過遷移學習[14]與數(shù)據(jù)增強方式解決了數(shù)據(jù)稀少的問題。本文研究的數(shù)據(jù)集來自公開數(shù)據(jù)集Breast Couldcer Histopathological Image Classification(BreakHis)(網址:https://web.inf.ufpr.br/vri/databases/breast-couldcer-histopathological-database-breakhis/),同時利用在不同倍數(shù)下預先提取的特征進行訓練,從而提高了分類準確率。
[9] BAYRAMOGLU N,KANNALA J,HEIKKIL? J.Deep learning for magnification independent breast cancer histopathology image classification[C]. International Conference on Pattern Recognition(ICPR),2016:2441-2446.
[10] 韓泓澤,魏賓,隋棟,等. 基于U-Net的乳腺癌病理切片中癌細胞檢測方法[J]. 精準醫(yī)學雜志,2018,33(6):471-473,477.
[11] RONNEBERGER O, FISCHER P, BROX T. U-Net: convolutional networks for biomedical image segmentation[C]. International Conference on Medical Image Computing & Computer-assisted Intervention, 2015.
[12] DENIZ E,ABDULKADIR ?,ZEHRA K,et al. Transfer learning based histopathologic image classification for breast cancer detection[J].? Health Information Science and Systems, 2018, 6(1):18.
[13] 劉銘,吳朝霞. 支持向量機理論與應用[J]. 科技視界,2018(23):68-69.
[14] PAN S J, YANG Q. A survey on transfer learning[J].? IEEE Transactions on Knowledge & Data Engineering,2010, 22(10):1345-1359.
[15] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[DB/OL]. https://arxiv.org/abs/1409.1556.
[16] SZEGEDY C, VANHOUCKE V, IOFFE S, et al. Rethinking the inception architecture for computer vision[C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2016:2818-2826.
[17] 田娟,李英祥,李彤巖. 激活函數(shù)在卷積神經網絡中的對比研究[J]. 計算機系統(tǒng)應用,2018,27(7):43-49.
[18] 李瓊,柏正堯,劉瑩芳. 糖尿病性視網膜圖像的深度學習分類方法[J]. 中國圖象圖形學報,2018,23(10):1594-1603.
[19] 劉鑫鵬,欒悉道,謝毓湘,等. 遷移學習研究和算法綜述[J]. 長沙大學學報,2018,32(5):28-31,36.
[20] 高友文,周本君,胡曉飛. 基于數(shù)據(jù)增強的卷積神經網絡圖像識別研究[J]. 計算機技術與發(fā)展,2018,28(8):62-65.
(責任編輯:黃 ?。?/p>