歐陽汝珊 林小慧 馬捷
2020年國際癌癥研究機構(gòu)中心報告顯示,全球女性乳腺癌發(fā)病率居于首位,且死亡率逐年上升[1]。近期有研究[2]數(shù)據(jù)表明,中國乳腺癌的發(fā)病年齡為40~50歲,較歐美女性早約10年。早期發(fā)現(xiàn)、早期診斷及早期治療可有效降低我國女性乳腺癌死亡率,提高生存率和生活質(zhì)量。乳腺疾病的影像診斷方法包括X線攝影、超聲、MRI等,乳腺X攝影是目前唯一被美國食品藥物管理局(FDA)證實可有效降低乳腺癌死亡率的影像學(xué)方法;而乳腺X線攝影受腺體密度影響,易掩蓋或遺漏致密型乳腺內(nèi)的非鈣化性病變。深度學(xué)習(xí)(deep learning,DL)在乳腺X線攝影臨床數(shù)據(jù)中的應(yīng)用,顯著提高了醫(yī)生工作效率和閱片穩(wěn)定性,減少了病人召回率,在乳腺癌檢出方面,逐漸顯現(xiàn)其優(yōu)勢[3]。
最早應(yīng)用于乳腺X線攝影的人工智能(artificial intelligence,AI)技術(shù)是計算機輔助診斷/檢測(computeraided diagnosis/detection,CAD)系統(tǒng),傳統(tǒng)CAD性能不穩(wěn)定,假陽性率高,高度依賴人工選擇及分類器整合特征。隨著機器學(xué)習(xí)算法的成熟,基于影像組學(xué)及DL的CAD系統(tǒng)取得了很大進展,可顯著提高影像科醫(yī)師的診斷效率及準確度[3]。影像組學(xué)是將數(shù)字醫(yī)學(xué)圖像轉(zhuǎn)換為可挖掘的高維數(shù)據(jù)的方法,但在高維的特征空間中人工提取出有區(qū)分性的高質(zhì)量特征存在一定的困難,需要大量時間和經(jīng)驗[4]。不同于影像組學(xué),DL方法包括多個處理層的感知器,每一層均為典型的神經(jīng)網(wǎng)絡(luò),能夠通過模擬人腦的層次結(jié)構(gòu),低層神經(jīng)網(wǎng)絡(luò)可以自動學(xué)習(xí)和提取特征,高層神經(jīng)網(wǎng)絡(luò)可根據(jù)提取的有效特征進行分類[5-6]。DL網(wǎng)絡(luò)有很多種,主要包括多層神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)、遞歸神經(jīng)網(wǎng)絡(luò)、長短期記憶網(wǎng)絡(luò)、時間卷積網(wǎng)絡(luò)、多層自動編碼等。應(yīng)用較為廣泛的是CNN(圖1),它由許多堆疊的卷積層組成[7]。DL神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程包括2種學(xué)習(xí)方法:①有監(jiān)督學(xué)習(xí),根據(jù)標記圖像的特征描述學(xué)習(xí),通過標簽和變量知道不同數(shù)據(jù)集之間的關(guān)系。②無監(jiān)督學(xué)習(xí),只處理數(shù)字和原始數(shù)據(jù),描述了無標簽訓(xùn)練樣本數(shù)據(jù)對各層參數(shù)進行訓(xùn)練的學(xué)習(xí)。弱監(jiān)督學(xué)習(xí)由監(jiān)督學(xué)習(xí)演變而來,只需要研究者提供整幅圖像的標簽,不需要所有的訓(xùn)練樣本數(shù)據(jù)的信息[6,8]。目前神經(jīng)網(wǎng)絡(luò)的訓(xùn)練大多是通過監(jiān)督學(xué)習(xí)來進行,無監(jiān)督學(xué)習(xí)與弱監(jiān)督學(xué)習(xí)應(yīng)用較少[9]。
圖1 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
由于影像醫(yī)生工作量大,且乳腺診斷經(jīng)驗有限,因而會影響診斷準確性。尤其是亞洲女性的乳腺密度較為致密,增加了影像醫(yī)生對病變檢出的困難[10]。將DL技術(shù)用于乳腺癌的影像學(xué)篩查,可以輔助影像醫(yī)生對病人進行診斷,提高影像醫(yī)生的工作效率,并有利于提升影像醫(yī)生閱片的準確性。Yamaguchi等[11]提出一種提高篩查工作效率的方法,即當AI判斷能力被證明與影像醫(yī)生判斷能力相當時,僅由AI系統(tǒng)判斷乳腺X線影像為正常乳腺或良性病變則不需要影像醫(yī)生的判斷,這種AI預(yù)選能力可能會減輕影像醫(yī)生的工作量。該研究收集5萬個乳腺癌影像、1萬個良性病變影像以及1萬個正常乳腺影像,利用CNN構(gòu)建了一個基于DL的系統(tǒng),該系統(tǒng)的敏感度和特異度分別約為85%和90%。Rodriguez-Ruiz等[12]使用CNN、特征分類器和影像分析算法構(gòu)建的DL系統(tǒng)對乳腺影像進行1-10的評分,將AI評分閾值設(shè)為5分,5分以下的影像認為是正常,影像醫(yī)生只讀取≥5分的乳腺影像,影像醫(yī)生的工作量將減少47%,但是會漏掉7%的真陽性影像;閾值設(shè)為2分時,≥2分的影像被認為異常,醫(yī)生工作量減少17%,僅漏掉1%的真陽性影像。由此可見,即使閾值分數(shù)較低的時候,也能有效地減少影像醫(yī)生的工作量。Rodríguez-Ruiz等[13]比較了影像醫(yī)生在有DL系統(tǒng)輔助與沒有DL系統(tǒng)輔助下閱片的效果,在DL系統(tǒng)輔助下診斷的受試者操作特征曲線下面積(AU C)為89%,高于無輔助的87%,且診斷敏感度及特異度均有提高。
對臨床工作有價值的DL系統(tǒng),應(yīng)該是在不降低敏感度或特異度的情況下顯著提高工作流程效率的輔助診斷工具。如果DL系統(tǒng)的準確度不能達到影像醫(yī)生的期望,增加了假陽性率或者假陰性率,則并不能有效地輔助缺乏經(jīng)驗的年輕影像醫(yī)生[14],所以對于缺乏經(jīng)驗的年輕影像醫(yī)生來說,在鑒別乳腺良、惡性病變的分類時采用DL系統(tǒng)加以輔助,有望得到較高的診斷敏感度和特異度,可以有效地降低召回率。根據(jù)美國放射學(xué)院(American College of Radiology,ACR)2013年第5版乳腺影像報告和數(shù)據(jù)系統(tǒng)(Breast Imaging Reporting and Data System,BI-RADS)標準,主要征象包括鈣化、腫塊、結(jié)構(gòu)扭曲以及不對稱[15]。目前,在乳腺X線攝影中,DL對腫塊和鈣化的診斷價值較突出,在結(jié)構(gòu)扭曲與不對稱方面研究較少。
3.1 腫塊 腫塊在乳腺X線攝影上表現(xiàn)復(fù)雜,BIRADS對腫塊的判讀依據(jù)腫塊的形狀、邊緣、密度及伴隨征象。醫(yī)生對腫塊的評估具有很強的主觀性,且對乳腺密度較為致密的影像判讀存在漏診以及信心不足的情況?;诖罅坑?xùn)練的DL系統(tǒng)不受醫(yī)生個人經(jīng)驗的影響,可以客觀判讀有無腫塊及其良惡性的可能,且具有良好的穩(wěn)定性。Dhungel等[16]采用基于貝葉斯優(yōu)化的系統(tǒng)將腫塊檢出后,用深度學(xué)習(xí)結(jié)構(gòu)化輸出分割腫塊,最后利用CNN對腫塊進行良惡性的分類,該方法的敏感度和特異度分別達到98%和70%,并且具有較低的假陽性率及假陰性率。2017年Al-Masni等[17]提出一個基于區(qū)域DL方法(you-only-look-once,YOLO)的AI系統(tǒng),可以對影像預(yù)處理,并采用多卷積深層進行特征提取,置信度模型檢測腫塊以及使用全連接神經(jīng)網(wǎng)絡(luò)(fully connected neural network,FCNN)對腫塊進行分類,該系統(tǒng)對腫塊良、惡性分類的敏感度為93.2%、特異度為78%,總體準確度達85.52%。2020年Al-Antari等[18]使用YOLO系統(tǒng)檢測腫塊,但是在腫塊分割上使用了一種新的深度網(wǎng)絡(luò)分割模型-全分辨率卷積網(wǎng)絡(luò)(fu ll resolution convolutional network,FRCN),并且對比了CNN、ResNet50和InceptionResNet-V2這3種分類模型的敏感度、特異度及準確度,結(jié)果發(fā)現(xiàn),InceptionResNet-V2的分類效果優(yōu)于其他2個模型的效果,敏感度為97.33%,特異度為90.47%,總體準確度為95.32%,f1值為94.40%,AUC為93.91%。該模型的診斷特異度與準確度均較2017年提出的模型有明顯的提高,可見集成DL系統(tǒng)的性能優(yōu)于傳統(tǒng)DL方法。綜上所述,性能得到不斷提高的DL系統(tǒng)有助于影像醫(yī)生對腫塊的準確分類,降低誤診率。
3.2 鈣化 乳腺X線攝影對鈣化的顯示具有獨特優(yōu)勢,而微小鈣化往往是乳腺癌的早期表現(xiàn),甚至是唯一表現(xiàn)。大量研究者利用乳腺鈣化的特點,設(shè)計出非常多且診斷效能高的模型。Fanizzi等[19]在提出將影像進行正/異常分類后,利用嵌入式方法提取10個特征可區(qū)分良惡性興趣區(qū),進一步對影像上的聚集微鈣化進行良惡性分類,該模型的中位AUC值達92.08%,準確度為88.46%。Suhail等[20]提出利用改進的Fisher線性判別分析方法結(jié)合支持向量機(support vector machine,SVM)分類對微鈣化進行良、惡性的分類,平均準確度達到96%。Melekoodappattu等[21]提出一種新的基于極限學(xué)習(xí)機-果蠅優(yōu)化算法(extreme learning machine-fruitfly optimization algorithm,ELM-FOA)的分類方法。該方法與SVM和樸素貝葉斯分類器(n a?ve bayes classifier,N B)等分類器相比,其對微鈣化診斷的敏感度、特異度等都更佳,準確度達到99.04%。DL對于微鈣化的良、惡性分類的準確性、敏感性以及特異性都在不斷提升,現(xiàn)有的算法對微鈣化已經(jīng)有了準確的判斷。
致密的乳腺密度提示女性患乳腺癌的風險增加,是乳腺癌的獨立危險因素。在乳腺X線攝影上由于較為致密的乳腺密度可能會遮擋可疑病變,所以檢測較為致密的乳腺時,對病變的敏感性較差[22]。另外,乳腺密度并不致密的女性也存在患乳腺癌的風險,DL技術(shù)不僅能單純的根據(jù)乳腺X線攝影影像的乳腺密度進行風險評估,更能結(jié)合臨床風險因素以及乳腺X線攝影所提供的信息,預(yù)測患乳腺癌的風險。Yala等[23]利用DL構(gòu)建一個風險預(yù)測的混合DL模型(Hybrid DL),該模型綜合了病人問卷和電子病歷回顧中顯示的風險因素信息及乳腺X線攝影得到的信息,據(jù)此評估病人5年內(nèi)患乳腺癌的風險,該模型在絕經(jīng)前女性中的AUC值為0.79,在絕經(jīng)后的女性中的AUC值為0.70。Dembrower等[24]使用了Inception-ResNet-v2模型,將乳腺X線攝影影像、影像采集時年齡和一些參數(shù)(乳腺厚度、壓縮力等)輸入模型,得到一個乳腺癌風險評分。該模型的AUC值比基于乳腺密度構(gòu)建的風險模型更高,達到0.65,并且具有更低的假陰性率(31%),對于更具侵襲性的乳腺癌,這種差異更大。利用預(yù)測風險模型結(jié)合臨床信息評估乳腺癌病人預(yù)后情況,對于臨床工作具有重大的意義。首先可以提高篩查者警惕性,從而實現(xiàn)早期診斷和治療;其次還能幫助臨床醫(yī)生為病人制定更為個性化的治療方案,達到更好的預(yù)后效果。
數(shù)字乳腺斷層攝影(digital breast tomosynthesis,DBT)和增強乳腺X線攝影(contrast-enhanced spectral mammography,CESM)作為乳腺X線攝影衍生的新技術(shù),與傳統(tǒng)乳腺X線攝影相比,提高了診斷效能,但DBT延長了醫(yī)生的判讀時間,CESM存在背景強化的問題。DBT通過對受壓的乳腺行多角度投照,可獲得一系列三維斷層影像。DBT的應(yīng)用克服了腺體組織重疊的影響,一定程度上提高了乳腺癌的檢出率和診斷符合率,但DBT的閱片時間相對于乳腺X線攝影更長。Geras等[25]將基于DL算法的CAD系統(tǒng)用于DBT,與不采用CAD系統(tǒng)的診斷結(jié)果相比,在診斷效果相同的情況下,有CAD輔助時閱片時間平均減少23.5%,但DBT空間分辨率較低,增加了CAD系統(tǒng)對腫塊精準自動分割的難度,所以在DBT上應(yīng)用的CAD系統(tǒng)仍有待完善。CESM是將傳統(tǒng)X線攝影技術(shù)與對比增強相結(jié)合,利用多數(shù)惡性腫瘤富含新生血管的特點,通過注射對比劑使腫瘤成像。注射對比劑后,在致密型乳腺中隱匿的病灶可以在CESM的減影圖上呈現(xiàn),顯示更多的病灶信息,從而提高了致密型乳腺的病灶檢出率,但其存在背景強化的問題,一定程度上影響了對病灶的診斷[26]。Patel等[27]的研究表明,使用基于DL算法的CAD-CESM的診斷敏感度并沒有提高,甚至低于醫(yī)生的診斷敏感度。這可能與CESM可用的訓(xùn)練數(shù)據(jù)集量太小有關(guān)。因此,目前DL在DBT及CESM的應(yīng)用尚不成熟,有待于拓展訓(xùn)練集及算法的進一步研究以提升效能。
目前DL仍然面臨著許多挑戰(zhàn):①訓(xùn)練一個性能穩(wěn)定、準確率高的模型需要大量樣本集,這樣才能夠涵蓋病變的微小特征。目前的很多研究都只有很少的數(shù)據(jù)集或者應(yīng)用公開的數(shù)據(jù)集,如果使用其他數(shù)據(jù)集去測試這些模型可能會存在偏倚[28]。②現(xiàn)有的研究顯示,基于DL的系統(tǒng)雖然診斷敏感度和特異度均高于低年資影像醫(yī)生的水準,但是仍低于有經(jīng)驗的影像診斷醫(yī)生的診斷水平[9]。③DL系統(tǒng)目前尚不能將乳腺X線攝影先前檢查的信息與后面檢查的信息進行比較,而放射科醫(yī)生可以對比前后影像資料,得到更多的信息[29]。④結(jié)構(gòu)扭曲及不對稱在乳腺X線攝影上的表現(xiàn)不如腫塊和鈣化常見,診斷這2種病變需要經(jīng)驗豐富的影像醫(yī)生標注;只有得到準確的訓(xùn)練集數(shù)據(jù),才能訓(xùn)練出準確的模型,因而DL在結(jié)構(gòu)扭曲及不對稱檢出方面的研究仍較少。⑤目前DL仍然集中于對病變進行一個單純的良惡性分類,僅有少數(shù)研究關(guān)于DL對病變進行BI-RADS分類,且性能欠佳,有待進一步研究。雖然DL系統(tǒng)真正走進臨床應(yīng)用還需要一段距離,但是DL系統(tǒng)的蓬勃發(fā)展與無限潛力將加速其完善性能以達到影像醫(yī)生的期望。