潘德潤 秦耿耿 陳衛(wèi)國*
乳腺癌是全球女性最常見的癌癥,也是女性癌癥死亡的主要原因[1]。乳腺癌如能在早期發(fā)現(xiàn)并及時治療,其治療效果也是惡性腫瘤中最佳的[2]。乳腺X線攝影是乳腺癌篩查和診斷的主要手段,可協(xié)助臨床醫(yī)生早期發(fā)現(xiàn)并及時治療乳腺癌,從而顯著降低其死亡率[3-4]。乳腺X線影像診斷通常是通過放射科醫(yī)生瀏覽每幅影像,從中識別出腫塊、鈣化、結(jié)構(gòu)扭曲及非對稱致密影等常見異常征象,同時還需要結(jié)合病人的臨床信息,這要耗費(fèi)醫(yī)生大量的精力。2006年,Hinton等[5]提出了“深度學(xué)習(xí)”的概念,它源于對人工神經(jīng)網(wǎng)絡(luò)的研究,含有多個隱藏層的多層感知器是一種深度學(xué)習(xí)結(jié)構(gòu),能夠通過模擬人腦的層次結(jié)構(gòu)將數(shù)據(jù)從低層傳遞到高層,為最終的表示引入更多的語義信息[6]。深度學(xué)習(xí)方法已在文本、語音識別及自然圖像的分類、檢測等方面取得了重大突破[7-8]。因此,針對醫(yī)學(xué)影像(非自然圖像)領(lǐng)域開發(fā)出基于深度學(xué)習(xí)的計(jì)算機(jī)輔助診斷(computer aided diagnosis,CAD)系統(tǒng),為放射科醫(yī)生提供診斷的第二意見,以提高診斷敏感性和特異性[9-10],這對于乳腺癌的早期篩查及診斷尤為重要。
基于深度學(xué)習(xí)的計(jì)算機(jī)乳腺癌輔助檢測/診斷系統(tǒng)對于數(shù)據(jù)的需求是很大的,在設(shè)計(jì)、評估和調(diào)整CAD系統(tǒng)的過程中,研究人員往往需要大量的數(shù)字化乳腺X線圖像[11],它們對于比較不同研究的結(jié)果也很重要[12-13],公開的數(shù)據(jù)集可以為研究人員開發(fā)、評估和對比評價提供一個共同基礎(chǔ)。
1.1 乳腺X線攝影數(shù)字化數(shù)據(jù)集 (digital database for screening mammography,DDSM) DDSM是目前最大的乳腺X線圖像公共數(shù)據(jù)集,也最為常用[14]。該數(shù)據(jù)集是由南佛羅里達(dá)大學(xué)等機(jī)構(gòu)收集了1988—1999年2 620例病例,共10 480幅圖像。數(shù)字化圖像是通過掃描膠片獲得的,格式為無損JPEG格式,圖像大小為3 000×4 800像素,分辨率為42μm,包括內(nèi)外斜位(medial lateral oblique view,MLO)和頭尾位(carnio-caudal view,CC)視圖,具有正常、良性和惡性病變的圖像,異常病例均含有像素水平的標(biāo)簽。它還包含每個興趣區(qū)(ROI)的類型,如鈣化或腫塊,大多數(shù)乳腺X線圖像只包含一個ROI。DDSM包含病人的年齡、乳腺密度和乳腺影像報告和數(shù)據(jù)系統(tǒng) (breast imaging reporting and data system,BIRADS)注釋,圖像注釋中還包括病灶在像素水平上的邊界。用戶可在 DDSM數(shù)據(jù)集的網(wǎng)頁(http://marathon.csee.usf.edu/Mammography/Database.html)上使用搜索引擎定義乳腺密度、掃描設(shè)備、病變病理及BI-RADS評估等關(guān)鍵詞來搜索符合標(biāo)準(zhǔn)的病例。DDSM的主要用途是促進(jìn)CAD算法之間的比較[15]。另外,一些研究者[16-17]經(jīng)過驗(yàn)證指出DDSM的精確度不適用于驗(yàn)證分割算法。
1.2 INbreast數(shù)據(jù)集 INbreast是公開可用的全視野數(shù)字乳腺X線攝影 (full-field digital mammography,FFDM)數(shù)據(jù)集(http://medicalresearch.inescporto.pt/breastresearch/GetINbreastDatabase.html), 由波爾圖CHSJ乳腺中心提供。該數(shù)據(jù)集包括篩查、診斷和隨訪病例的圖像。圖像于2008年4月—2010年7月期間獲得,共115例病例,其中90例有每側(cè)乳腺2個體位(MLO和CC)的圖像,其余25例為乳腺切除術(shù)的女性,僅有單側(cè)乳腺的2個體位的圖像,共410幅圖像。圖像大小根據(jù)病人乳腺大小分為3 328×4 084或2 560×3 328像素,分辨率為70μm,保存為DICOM格式,同一病人圖像之間的對應(yīng)關(guān)系與隨機(jī)生成的病人身份標(biāo)識一起保存。該數(shù)據(jù)集包含正常圖像,含有腫塊和鈣化、結(jié)構(gòu)扭曲、非對稱致密影及多種異常征象的乳腺X線圖像,此外還提供了病人的年齡、家族史、乳腺密度和BI-RADS分類的信息。INbreast數(shù)據(jù)集的優(yōu)點(diǎn)是具備精確的輪廓注釋,便于對評估腫塊形態(tài)的算法進(jìn)行訓(xùn)練及驗(yàn)證。
1.3 乳腺X線圖像分析協(xié)會數(shù)據(jù)集(mammographic image analysis society,MIAS) MIAS的數(shù)字化圖像數(shù)據(jù)集是最早的公共數(shù)據(jù)集(https://www.repository.cam.ac.uk/handle/1810/250394)[18], 目前仍被廣泛應(yīng)用于研究中。該數(shù)據(jù)集包含161例病例,322幅數(shù)字化MLO圖像,原始圖像由分辨率為50μm的膠片掃描獲得,然后經(jīng)過縮小、剪裁后得到1 024×1 024像素的圖像,格式為PNG。該數(shù)據(jù)集包含正常圖像以及良性、惡性病變的多種征象圖像,具有毛刺腫塊的圖像在數(shù)據(jù)集中占很高的比例。
在這3種數(shù)據(jù)集中,DDSM具有豐富的病例類型,可以很好地訓(xùn)練深度學(xué)習(xí)模型,但它的數(shù)字化圖像是通過掃描膠片獲得的,會產(chǎn)生一些偽影,且精確度不足[19],會將某些目標(biāo)像素錯誤地分配給背景而影響準(zhǔn)確度。而INbreast為FFDM數(shù)據(jù)集,具有精確的輪廓注釋,但病例數(shù)量相對較少。MIAS數(shù)據(jù)集的缺點(diǎn)是數(shù)字化圖像的對比度分辨率較低。
最近,一些研究人員和賽智生物網(wǎng)絡(luò)等組織發(fā)起了乳腺數(shù)字化夢想挑戰(zhàn) (DREAM Challenge),挑戰(zhàn)分為2個項(xiàng)目[20]:①開發(fā)一種可以分析數(shù)字乳腺X線圖像的預(yù)測算法;②開發(fā)能夠同時分析數(shù)字乳腺X線圖像和臨床信息的預(yù)測算法。他們收集了超過640 000幅乳腺X線圖像作為競賽數(shù)據(jù)集,并與病人的臨床數(shù)據(jù)和標(biāo)準(zhǔn)結(jié)果關(guān)聯(lián),挑戰(zhàn)數(shù)據(jù)集不包含ROI的注釋。挑戰(zhàn)者利用數(shù)字化圖像和臨床數(shù)據(jù)集來開發(fā)預(yù)測模型,提交的模型將通過驗(yàn)證數(shù)據(jù)集進(jìn)行評分。該競賽的獲勝團(tuán)隊(duì)在DDSM和DREAM挑 戰(zhàn) 數(shù) 據(jù) 集 (https://www.synapse.org/Digital_Mammography_DREAM_Challenge)上分多個階段對深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,他們用改進(jìn)后的視覺幾何組(visual geometry group,VGG)網(wǎng)絡(luò)在以病灶為中心的補(bǔ)丁中對檢測器網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,然后以完全卷積的方式將其插入更大的網(wǎng)絡(luò)中,并以端到端的方式在完整圖像上對網(wǎng)絡(luò)進(jìn)行微調(diào)。該團(tuán)隊(duì)的預(yù)測模型在2個挑戰(zhàn)項(xiàng)目中分別達(dá)到了80.3%和80.4%的準(zhǔn)確度。
該競賽創(chuàng)造了一個數(shù)據(jù)訪問簡單的開放社區(qū),同時激勵參賽者共同協(xié)作并實(shí)時共享結(jié)果,從中選拔出性能優(yōu)異的深度學(xué)習(xí)技術(shù)及分類器,這無疑在很大程度上加快了深度學(xué)習(xí)技術(shù)在乳腺癌篩查領(lǐng)域的發(fā)展速度。
隨著深度學(xué)習(xí)的發(fā)展,目前已經(jīng)有許多研究者采用深度學(xué)習(xí)方法來構(gòu)建新型CAD系統(tǒng)[21-22]。同機(jī)器學(xué)習(xí)方法一樣,深度學(xué)習(xí)也分為監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)。如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)就是一種監(jiān)督學(xué)習(xí)下的深度學(xué)習(xí)模型,而深度置信網(wǎng)絡(luò)(deep belief nets,DBN)是一種非監(jiān)督學(xué)習(xí)下的深度學(xué)習(xí)模型?;贑NN的模型往往需要對ROI進(jìn)行詳細(xì)的注釋[23-24],這耗費(fèi)了大量的時間和費(fèi)用,在監(jiān)督學(xué)習(xí)尤其是醫(yī)學(xué)成像方面造成了很大的困難。因此,一些研究者對弱監(jiān)督學(xué)習(xí)方法進(jìn)行了研究[25-26],如多示例學(xué)習(xí)(multiple instance learning,MIL),它僅需要研究者提供整幅圖像的標(biāo)簽,大大減少了訓(xùn)練成本。
3.1 CNN CNN是深度學(xué)習(xí)模型的代表性結(jié)構(gòu),也是目前深度學(xué)習(xí)的研究熱點(diǎn)。它是一種前饋型人工神經(jīng)網(wǎng)絡(luò)[6],具有多層網(wǎng)絡(luò)結(jié)構(gòu),通常包含輸入層、卷積層、激活函數(shù)、池化層和全連接層。
CNN具有強(qiáng)大的特征提取能力,可以提取較高等級的特征。Jiao等[6]在2016年開發(fā)了基于CNN的CAD系統(tǒng),對乳腺癌的腫塊進(jìn)行了分類。它主要包含一個CNN和一個決策機(jī)制。在訓(xùn)練過程中,用CNN提取了高級別和中等級別的特征,組合后對模型進(jìn)行訓(xùn)練,并且將CNN自動提取的強(qiáng)度信息與深度特征結(jié)合起來,從而更好地模擬醫(yī)生的診斷過程,取得了較好的效果。
另一方面,一些研究者研發(fā)了基于CNN的變型技術(shù)。2017年,Al-Masni等[27]提出了一種以區(qū)域深度學(xué)習(xí)技術(shù)為基礎(chǔ)的CAD系統(tǒng),該技術(shù)是一種基于ROI的 CNN,稱之為 YOLO(You Only Look Once)。YOLO是一種代表性的端到端訓(xùn)練算法,它在具有ROI信息的乳腺X線圖像數(shù)據(jù)集中進(jìn)行訓(xùn)練,并直接優(yōu)化檢測性能。此外,YOLO學(xué)習(xí)目標(biāo)的概括性表示具有很強(qiáng)的通用性,可以同時檢測多種目標(biāo)。YOLO還可以同時學(xué)習(xí)ROI和背景,因此他們提出的CAD系統(tǒng)可以在一個CNN中完成特征提取并對乳腺腫塊檢測和分類,是一種快速、準(zhǔn)確的目標(biāo)檢測器[28]。
還有一些研究者提出了減弱對ROI注釋依賴性的CNN。Li等[20]采用全卷積設(shè)計(jì)開發(fā)了一種對完整乳腺X線圖像進(jìn)行乳腺癌診斷的端到端訓(xùn)練算法。該算法完全使用CNN,因此可以輸入任意大小的圖像。此外,它只需要在訓(xùn)練的第一階段對病變進(jìn)行注釋,訓(xùn)練模型識別局部補(bǔ)丁后,就可以將完整圖像分類網(wǎng)絡(luò)的權(quán)重初始化,之后該模型即可遷移為一個全圖分類器,可在沒有ROI注釋的情況下進(jìn)行端到端訓(xùn)練,這大大減少了對病變注釋的依賴性。與以往的方法相比,這種設(shè)計(jì)簡單且性能更加優(yōu)越。
3.2 MIL MIL是一種弱監(jiān)督學(xué)習(xí)方法,它是監(jiān)督學(xué)習(xí)的變體,將圖像表示為多示例包,基于包成分標(biāo)簽進(jìn)行分類[29-30],這樣避免了對詳細(xì)的醫(yī)學(xué)圖像注釋的需求,大大降低了訓(xùn)練成本?!鞍焙锌勺償?shù)量的示例(補(bǔ)丁),即使只有其中一個示例屬于陽性,包也會被標(biāo)記為陽性。只有當(dāng)包中所有示例均為陰性時才會被標(biāo)記為陰性。MIL的目標(biāo)是僅基于訓(xùn)練階段的包標(biāo)簽來分類未知的包或示例。
2016年,Quellec等[31]提出了一種新型的乳腺X線圖像計(jì)算機(jī)輔助檢測與診斷系統(tǒng),該系統(tǒng)依賴MIL范例,僅使用整體圖像水平的標(biāo)簽。他們首先將乳腺自適應(yīng)地分割為多個區(qū)域,然后從每個區(qū)域中提取檢測到的病變特征并合并,進(jìn)而把乳腺X線圖像分類為正?;虍惓?。2017年,Choukroun等[10]描述了弱監(jiān)督學(xué)習(xí)的計(jì)算機(jī)輔助檢測和診斷系統(tǒng),通過一個建立于MIL范例上的新型深度學(xué)習(xí)框架解決了乳腺X線圖像異常結(jié)果的檢測和分類問題。他們首先將圖像分解為多個示例,通過選擇最高陽性概率的示例完成檢測任務(wù),另外每個示例通過預(yù)訓(xùn)練網(wǎng)絡(luò)產(chǎn)生一個特征向量,然后預(yù)測其類別概率,最后將所有示例的概率匯總得出整個“包”的類別概率。該方法的特點(diǎn)是可以用MIL自動發(fā)現(xiàn)乳腺X線圖像中的判別性示例。該系統(tǒng)的結(jié)果可與在完全注釋的數(shù)據(jù)集中進(jìn)行訓(xùn)練的監(jiān)督方法相媲美。Zhu等[32]也提出一種端到端訓(xùn)練的深度MIL神經(jīng)網(wǎng)絡(luò),用于在沒有ROI注釋的情況下對乳腺X線圖像進(jìn)行分類。其目標(biāo)是預(yù)測整個乳腺X線圖像中是否包含惡性腫塊。該研究同時使用了CNN來高效地獲取所有示例的特征。
3.3 DBN DBN是根據(jù)生物神經(jīng)網(wǎng)絡(luò)的研究及淺層神經(jīng)網(wǎng)絡(luò)發(fā)展而來的,屬于雙向深度網(wǎng)絡(luò)[33]。DBN由多層神經(jīng)元構(gòu)成,其關(guān)鍵組成元件是受限玻爾茲曼機(jī)。2016年,Dhungel等[34]使用一種深度學(xué)習(xí)和隨機(jī)森林識別器級聯(lián)的算法來檢測乳腺X線圖像中的可疑區(qū)域,該算法的第一階段由多尺度DBN[5]級聯(lián)高斯混合模型[35]組成,網(wǎng)絡(luò)選出候選區(qū)域后由深度CNN進(jìn)一步處理,篩選出的區(qū)域由隨機(jī)森林分類器進(jìn)行分析。2017年,Al-Antari等[36]提出了一種基于DBN進(jìn)行乳腺癌診斷的CAD系統(tǒng),該系統(tǒng)包括腫塊自動檢測、ROI提取、特征提取和DBN分類模塊,其目標(biāo)是識別正常、良性和惡性乳腺組織。他們首先通過無監(jiān)督學(xué)習(xí)對受限玻爾茲曼機(jī)進(jìn)行預(yù)訓(xùn)練,然后根據(jù)反向傳播算法來調(diào)整權(quán)重并微調(diào)該網(wǎng)絡(luò)。DBN的優(yōu)點(diǎn)是可以利用所有提取的特征,并從中選擇突出特征,研究結(jié)果表明該網(wǎng)絡(luò)比傳統(tǒng)的CAD系統(tǒng)具有更高的準(zhǔn)確度。
深度學(xué)習(xí)技術(shù)在乳腺癌影像篩查領(lǐng)域已經(jīng)有了諸多進(jìn)展。傳統(tǒng)的CAD系統(tǒng)沒有深度網(wǎng)絡(luò),系統(tǒng)性能較差,僅能提取淺層特征。而近期提出的深度學(xué)習(xí)在乳腺癌篩查的應(yīng)用中已經(jīng)能夠逐漸接近經(jīng)驗(yàn)豐富的放射科醫(yī)師的診斷水平[37]。然而,目前的深度學(xué)習(xí)技術(shù)對ROI注釋的依賴性還沒有得到很好的解決,因此未來幾年可能會有更多關(guān)于減弱對ROI注釋需求的深度學(xué)習(xí)技術(shù)的研究。另一方面,對MIL和DBN領(lǐng)域的研究相對較少,盡管它們避免了注釋ROI的繁瑣工作,但其系統(tǒng)性能尚待提高。還有研究者[32,34]將多種深度學(xué)習(xí)技術(shù)聯(lián)合運(yùn)用,對乳腺X線圖像中可疑區(qū)域進(jìn)行檢測和分類,這在一定程度上改善了模型的性能。此外,還需創(chuàng)建大型公共可用的數(shù)據(jù)集,使其圖像具有較高的精確度、分辨率及多樣性的特點(diǎn),這將有助于訓(xùn)練出性能優(yōu)越的CAD模型。