基于深度學(xué)習(xí)的人工智能技術(shù)在乳腺癌篩查及影像診斷中的應(yīng)用進(jìn)展

2019-03-19 16:37:38潘德潤秦耿耿陳衛(wèi)國

國際醫(yī)學(xué)放射學(xué)雜志 2019年1期

潘德潤秦耿耿陳衛(wèi)國*

乳腺癌是全球女性最常見的癌癥，也是女性癌癥死亡的主要原因[1]。乳腺癌如能在早期發(fā)現(xiàn)并及時治療，其治療效果也是惡性腫瘤中最佳的[2]。乳腺X線攝影是乳腺癌篩查和診斷的主要手段，可協(xié)助臨床醫(yī)生早期發(fā)現(xiàn)并及時治療乳腺癌，從而顯著降低其死亡率[3-4]。乳腺X線影像診斷通常是通過放射科醫(yī)生瀏覽每幅影像，從中識別出腫塊、鈣化、結(jié)構(gòu)扭曲及非對稱致密影等常見異常征象，同時還需要結(jié)合病人的臨床信息，這要耗費(fèi)醫(yī)生大量的精力。2006年，Hinton等[5]提出了“深度學(xué)習(xí)”的概念，它源于對人工神經(jīng)網(wǎng)絡(luò)的研究，含有多個隱藏層的多層感知器是一種深度學(xué)習(xí)結(jié)構(gòu)，能夠通過模擬人腦的層次結(jié)構(gòu)將數(shù)據(jù)從低層傳遞到高層，為最終的表示引入更多的語義信息[6]。深度學(xué)習(xí)方法已在文本、語音識別及自然圖像的分類、檢測等方面取得了重大突破[7-8]。因此，針對醫(yī)學(xué)影像（非自然圖像）領(lǐng)域開發(fā)出基于深度學(xué)習(xí)的計(jì)算機(jī)輔助診斷（computer aided diagnosis,CAD）系統(tǒng)，為放射科醫(yī)生提供診斷的第二意見，以提高診斷敏感性和特異性[9-10]，這對于乳腺癌的早期篩查及診斷尤為重要。

1 乳腺X線圖像數(shù)據(jù)集

基于深度學(xué)習(xí)的計(jì)算機(jī)乳腺癌輔助檢測/診斷系統(tǒng)對于數(shù)據(jù)的需求是很大的，在設(shè)計(jì)、評估和調(diào)整CAD系統(tǒng)的過程中，研究人員往往需要大量的數(shù)字化乳腺X線圖像[11]，它們對于比較不同研究的結(jié)果也很重要[12-13]，公開的數(shù)據(jù)集可以為研究人員開發(fā)、評估和對比評價提供一個共同基礎(chǔ)。

1.1 乳腺X線攝影數(shù)字化數(shù)據(jù)集（digital database for screening mammography,DDSM） DDSM是目前最大的乳腺X線圖像公共數(shù)據(jù)集，也最為常用[14]。該數(shù)據(jù)集是由南佛羅里達(dá)大學(xué)等機(jī)構(gòu)收集了1988—1999年2 620例病例，共10 480幅圖像。數(shù)字化圖像是通過掃描膠片獲得的，格式為無損JPEG格式，圖像大小為3 000×4 800像素，分辨率為42μm，包括內(nèi)外斜位（medial lateral oblique view,MLO）和頭尾位（carnio-caudal view，CC）視圖，具有正常、良性和惡性病變的圖像，異常病例均含有像素水平的標(biāo)簽。它還包含每個興趣區(qū)（ROI）的類型，如鈣化或腫塊，大多數(shù)乳腺X線圖像只包含一個ROI。DDSM包含病人的年齡、乳腺密度和乳腺影像報告和數(shù)據(jù)系統(tǒng) （breast imaging reporting and data system，BIRADS）注釋，圖像注釋中還包括病灶在像素水平上的邊界。用戶可在 DDSM數(shù)據(jù)集的網(wǎng)頁（http：//marathon.csee.usf.edu/Mammography/Database.html）上使用搜索引擎定義乳腺密度、掃描設(shè)備、病變病理及BI-RADS評估等關(guān)鍵詞來搜索符合標(biāo)準(zhǔn)的病例。DDSM的主要用途是促進(jìn)CAD算法之間的比較[15]。另外，一些研究者[16-17]經(jīng)過驗(yàn)證指出DDSM的精確度不適用于驗(yàn)證分割算法。

1.2 INbreast數(shù)據(jù)集 INbreast是公開可用的全視野數(shù)字乳腺X線攝影（full-field digital mammography,FFDM）數(shù)據(jù)集（http：//medicalresearch.inescporto.pt/breastresearch/GetINbreastDatabase.html），由波爾圖CHSJ乳腺中心提供。該數(shù)據(jù)集包括篩查、診斷和隨訪病例的圖像。圖像于2008年4月—2010年7月期間獲得，共115例病例，其中90例有每側(cè)乳腺2個體位（MLO和CC）的圖像，其余25例為乳腺切除術(shù)的女性，僅有單側(cè)乳腺的2個體位的圖像，共410幅圖像。圖像大小根據(jù)病人乳腺大小分為3 328×4 084或2 560×3 328像素，分辨率為70μm，保存為DICOM格式，同一病人圖像之間的對應(yīng)關(guān)系與隨機(jī)生成的病人身份標(biāo)識一起保存。該數(shù)據(jù)集包含正常圖像，含有腫塊和鈣化、結(jié)構(gòu)扭曲、非對稱致密影及多種異常征象的乳腺X線圖像，此外還提供了病人的年齡、家族史、乳腺密度和BI-RADS分類的信息。INbreast數(shù)據(jù)集的優(yōu)點(diǎn)是具備精確的輪廓注釋，便于對評估腫塊形態(tài)的算法進(jìn)行訓(xùn)練及驗(yàn)證。

1.3 乳腺X線圖像分析協(xié)會數(shù)據(jù)集（mammographic image analysis society，MIAS） MIAS的數(shù)字化圖像數(shù)據(jù)集是最早的公共數(shù)據(jù)集（https：//www.repository.cam.ac.uk/handle/1810/250394）[18]，目前仍被廣泛應(yīng)用于研究中。該數(shù)據(jù)集包含161例病例，322幅數(shù)字化MLO圖像，原始圖像由分辨率為50μm的膠片掃描獲得，然后經(jīng)過縮小、剪裁后得到1 024×1 024像素的圖像，格式為PNG。該數(shù)據(jù)集包含正常圖像以及良性、惡性病變的多種征象圖像，具有毛刺腫塊的圖像在數(shù)據(jù)集中占很高的比例。

在這3種數(shù)據(jù)集中，DDSM具有豐富的病例類型，可以很好地訓(xùn)練深度學(xué)習(xí)模型，但它的數(shù)字化圖像是通過掃描膠片獲得的，會產(chǎn)生一些偽影，且精確度不足[19]，會將某些目標(biāo)像素錯誤地分配給背景而影響準(zhǔn)確度。而INbreast為FFDM數(shù)據(jù)集，具有精確的輪廓注釋，但病例數(shù)量相對較少。MIAS數(shù)據(jù)集的缺點(diǎn)是數(shù)字化圖像的對比度分辨率較低。

2 深度學(xué)習(xí)乳腺癌影像篩查競賽

最近，一些研究人員和賽智生物網(wǎng)絡(luò)等組織發(fā)起了乳腺數(shù)字化夢想挑戰(zhàn) （DREAM Challenge），挑戰(zhàn)分為2個項(xiàng)目[20]：①開發(fā)一種可以分析數(shù)字乳腺X線圖像的預(yù)測算法;②開發(fā)能夠同時分析數(shù)字乳腺X線圖像和臨床信息的預(yù)測算法。他們收集了超過640 000幅乳腺X線圖像作為競賽數(shù)據(jù)集，并與病人的臨床數(shù)據(jù)和標(biāo)準(zhǔn)結(jié)果關(guān)聯(lián)，挑戰(zhàn)數(shù)據(jù)集不包含ROI的注釋。挑戰(zhàn)者利用數(shù)字化圖像和臨床數(shù)據(jù)集來開發(fā)預(yù)測模型，提交的模型將通過驗(yàn)證數(shù)據(jù)集進(jìn)行評分。該競賽的獲勝團(tuán)隊(duì)在DDSM和DREAM挑戰(zhàn) 數(shù) 據(jù) 集（https：//www.synapse.org/Digital_Mammography_DREAM_Challenge）上分多個階段對深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，他們用改進(jìn)后的視覺幾何組（visual geometry group,VGG）網(wǎng)絡(luò)在以病灶為中心的補(bǔ)丁中對檢測器網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練，然后以完全卷積的方式將其插入更大的網(wǎng)絡(luò)中，并以端到端的方式在完整圖像上對網(wǎng)絡(luò)進(jìn)行微調(diào)。該團(tuán)隊(duì)的預(yù)測模型在2個挑戰(zhàn)項(xiàng)目中分別達(dá)到了80.3%和80.4%的準(zhǔn)確度。

該競賽創(chuàng)造了一個數(shù)據(jù)訪問簡單的開放社區(qū)，同時激勵參賽者共同協(xié)作并實(shí)時共享結(jié)果，從中選拔出性能優(yōu)異的深度學(xué)習(xí)技術(shù)及分類器，這無疑在很大程度上加快了深度學(xué)習(xí)技術(shù)在乳腺癌篩查領(lǐng)域的發(fā)展速度。

3 深度學(xué)習(xí)技術(shù)近期進(jìn)展

隨著深度學(xué)習(xí)的發(fā)展，目前已經(jīng)有許多研究者采用深度學(xué)習(xí)方法來構(gòu)建新型CAD系統(tǒng)[21-22]。同機(jī)器學(xué)習(xí)方法一樣，深度學(xué)習(xí)也分為監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)。如卷積神經(jīng)網(wǎng)絡(luò)（convolutional neural network，CNN）就是一種監(jiān)督學(xué)習(xí)下的深度學(xué)習(xí)模型，而深度置信網(wǎng)絡(luò)（deep belief nets，DBN）是一種非監(jiān)督學(xué)習(xí)下的深度學(xué)習(xí)模型?；贑NN的模型往往需要對ROI進(jìn)行詳細(xì)的注釋[23-24]，這耗費(fèi)了大量的時間和費(fèi)用，在監(jiān)督學(xué)習(xí)尤其是醫(yī)學(xué)成像方面造成了很大的困難。因此，一些研究者對弱監(jiān)督學(xué)習(xí)方法進(jìn)行了研究[25-26]，如多示例學(xué)習(xí)（multiple instance learning，MIL），它僅需要研究者提供整幅圖像的標(biāo)簽，大大減少了訓(xùn)練成本。

3.1 CNN CNN是深度學(xué)習(xí)模型的代表性結(jié)構(gòu)，也是目前深度學(xué)習(xí)的研究熱點(diǎn)。它是一種前饋型人工神經(jīng)網(wǎng)絡(luò)[6]，具有多層網(wǎng)絡(luò)結(jié)構(gòu)，通常包含輸入層、卷積層、激活函數(shù)、池化層和全連接層。

CNN具有強(qiáng)大的特征提取能力，可以提取較高等級的特征。Jiao等[6]在2016年開發(fā)了基于CNN的CAD系統(tǒng)，對乳腺癌的腫塊進(jìn)行了分類。它主要包含一個CNN和一個決策機(jī)制。在訓(xùn)練過程中，用CNN提取了高級別和中等級別的特征，組合后對模型進(jìn)行訓(xùn)練，并且將CNN自動提取的強(qiáng)度信息與深度特征結(jié)合起來，從而更好地模擬醫(yī)生的診斷過程，取得了較好的效果。

另一方面，一些研究者研發(fā)了基于CNN的變型技術(shù)。2017年，Al-Masni等[27]提出了一種以區(qū)域深度學(xué)習(xí)技術(shù)為基礎(chǔ)的CAD系統(tǒng)，該技術(shù)是一種基于ROI的 CNN，稱之為 YOLO（You Only Look Once）。YOLO是一種代表性的端到端訓(xùn)練算法，它在具有ROI信息的乳腺X線圖像數(shù)據(jù)集中進(jìn)行訓(xùn)練，并直接優(yōu)化檢測性能。此外，YOLO學(xué)習(xí)目標(biāo)的概括性表示具有很強(qiáng)的通用性，可以同時檢測多種目標(biāo)。YOLO還可以同時學(xué)習(xí)ROI和背景，因此他們提出的CAD系統(tǒng)可以在一個CNN中完成特征提取并對乳腺腫塊檢測和分類，是一種快速、準(zhǔn)確的目標(biāo)檢測器[28]。

還有一些研究者提出了減弱對ROI注釋依賴性的CNN。Li等[20]采用全卷積設(shè)計(jì)開發(fā)了一種對完整乳腺X線圖像進(jìn)行乳腺癌診斷的端到端訓(xùn)練算法。該算法完全使用CNN，因此可以輸入任意大小的圖像。此外，它只需要在訓(xùn)練的第一階段對病變進(jìn)行注釋，訓(xùn)練模型識別局部補(bǔ)丁后，就可以將完整圖像分類網(wǎng)絡(luò)的權(quán)重初始化，之后該模型即可遷移為一個全圖分類器，可在沒有ROI注釋的情況下進(jìn)行端到端訓(xùn)練，這大大減少了對病變注釋的依賴性。與以往的方法相比，這種設(shè)計(jì)簡單且性能更加優(yōu)越。

3.2 MIL MIL是一種弱監(jiān)督學(xué)習(xí)方法，它是監(jiān)督學(xué)習(xí)的變體，將圖像表示為多示例包，基于包成分標(biāo)簽進(jìn)行分類[29-30]，這樣避免了對詳細(xì)的醫(yī)學(xué)圖像注釋的需求，大大降低了訓(xùn)練成本?！鞍焙锌勺償?shù)量的示例（補(bǔ)丁），即使只有其中一個示例屬于陽性，包也會被標(biāo)記為陽性。只有當(dāng)包中所有示例均為陰性時才會被標(biāo)記為陰性。MIL的目標(biāo)是僅基于訓(xùn)練階段的包標(biāo)簽來分類未知的包或示例。

2016年，Quellec等[31]提出了一種新型的乳腺X線圖像計(jì)算機(jī)輔助檢測與診斷系統(tǒng)，該系統(tǒng)依賴MIL范例，僅使用整體圖像水平的標(biāo)簽。他們首先將乳腺自適應(yīng)地分割為多個區(qū)域，然后從每個區(qū)域中提取檢測到的病變特征并合并，進(jìn)而把乳腺X線圖像分類為正?；虍惓?。2017年，Choukroun等[10]描述了弱監(jiān)督學(xué)習(xí)的計(jì)算機(jī)輔助檢測和診斷系統(tǒng)，通過一個建立于MIL范例上的新型深度學(xué)習(xí)框架解決了乳腺X線圖像異常結(jié)果的檢測和分類問題。他們首先將圖像分解為多個示例，通過選擇最高陽性概率的示例完成檢測任務(wù)，另外每個示例通過預(yù)訓(xùn)練網(wǎng)絡(luò)產(chǎn)生一個特征向量，然后預(yù)測其類別概率，最后將所有示例的概率匯總得出整個“包”的類別概率。該方法的特點(diǎn)是可以用MIL自動發(fā)現(xiàn)乳腺X線圖像中的判別性示例。該系統(tǒng)的結(jié)果可與在完全注釋的數(shù)據(jù)集中進(jìn)行訓(xùn)練的監(jiān)督方法相媲美。Zhu等[32]也提出一種端到端訓(xùn)練的深度MIL神經(jīng)網(wǎng)絡(luò)，用于在沒有ROI注釋的情況下對乳腺X線圖像進(jìn)行分類。其目標(biāo)是預(yù)測整個乳腺X線圖像中是否包含惡性腫塊。該研究同時使用了CNN來高效地獲取所有示例的特征。

3.3 DBN DBN是根據(jù)生物神經(jīng)網(wǎng)絡(luò)的研究及淺層神經(jīng)網(wǎng)絡(luò)發(fā)展而來的，屬于雙向深度網(wǎng)絡(luò)[33]。DBN由多層神經(jīng)元構(gòu)成，其關(guān)鍵組成元件是受限玻爾茲曼機(jī)。2016年，Dhungel等[34]使用一種深度學(xué)習(xí)和隨機(jī)森林識別器級聯(lián)的算法來檢測乳腺X線圖像中的可疑區(qū)域，該算法的第一階段由多尺度DBN[5]級聯(lián)高斯混合模型[35]組成，網(wǎng)絡(luò)選出候選區(qū)域后由深度CNN進(jìn)一步處理，篩選出的區(qū)域由隨機(jī)森林分類器進(jìn)行分析。2017年，Al-Antari等[36]提出了一種基于DBN進(jìn)行乳腺癌診斷的CAD系統(tǒng)，該系統(tǒng)包括腫塊自動檢測、ROI提取、特征提取和DBN分類模塊，其目標(biāo)是識別正常、良性和惡性乳腺組織。他們首先通過無監(jiān)督學(xué)習(xí)對受限玻爾茲曼機(jī)進(jìn)行預(yù)訓(xùn)練，然后根據(jù)反向傳播算法來調(diào)整權(quán)重并微調(diào)該網(wǎng)絡(luò)。DBN的優(yōu)點(diǎn)是可以利用所有提取的特征，并從中選擇突出特征，研究結(jié)果表明該網(wǎng)絡(luò)比傳統(tǒng)的CAD系統(tǒng)具有更高的準(zhǔn)確度。

4 小結(jié)

深度學(xué)習(xí)技術(shù)在乳腺癌影像篩查領(lǐng)域已經(jīng)有了諸多進(jìn)展。傳統(tǒng)的CAD系統(tǒng)沒有深度網(wǎng)絡(luò)，系統(tǒng)性能較差，僅能提取淺層特征。而近期提出的深度學(xué)習(xí)在乳腺癌篩查的應(yīng)用中已經(jīng)能夠逐漸接近經(jīng)驗(yàn)豐富的放射科醫(yī)師的診斷水平[37]。然而，目前的深度學(xué)習(xí)技術(shù)對ROI注釋的依賴性還沒有得到很好的解決，因此未來幾年可能會有更多關(guān)于減弱對ROI注釋需求的深度學(xué)習(xí)技術(shù)的研究。另一方面，對MIL和DBN領(lǐng)域的研究相對較少，盡管它們避免了注釋ROI的繁瑣工作，但其系統(tǒng)性能尚待提高。還有研究者[32,34]將多種深度學(xué)習(xí)技術(shù)聯(lián)合運(yùn)用，對乳腺X線圖像中可疑區(qū)域進(jìn)行檢測和分類，這在一定程度上改善了模型的性能。此外，還需創(chuàng)建大型公共可用的數(shù)據(jù)集，使其圖像具有較高的精確度、分辨率及多樣性的特點(diǎn)，這將有助于訓(xùn)練出性能優(yōu)越的CAD模型。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

基于深度學(xué)習(xí)的人工智能技術(shù)在乳腺癌篩查及影像診斷中的應(yīng)用進(jìn)展

1 乳腺X線圖像數(shù)據(jù)集

2 深度學(xué)習(xí)乳腺癌影像篩查競賽

3 深度學(xué)習(xí)技術(shù)近期進(jìn)展

4 小結(jié)