白宛鷺,邢 華,李海濱*
(1.北華大學(xué)附屬醫(yī)院 乳腺外科,吉林 吉林 132011;2.吉林大學(xué)中日聯(lián)誼醫(yī)院 乳腺外科,吉林 長春 130033)
乳腺癌已經(jīng)成為女性最常見的癌癥,核磁共振成像(MRI)在乳腺癌診斷、治療和預(yù)后評估中的作用已逐漸被臨床醫(yī)師認可。隨著計算機技術(shù)的進步,深度學(xué)習(xí)已應(yīng)用于醫(yī)學(xué)的諸多領(lǐng)域,提高了診斷準確率和診療效率。本文就深度學(xué)習(xí)技術(shù)在乳腺癌MRI診斷及亞型識別的研究進展進行綜述。
目前乳腺疾病的常規(guī)檢查方法包括:彩色多普勒超聲、乳腺鉬靶、MRI等方法。動態(tài)增強MRI檢查是乳腺MRI診斷的必要檢查序列;T1加權(quán)像(T1WI)可以很好的體現(xiàn)乳腺脂肪和腺體的分布情況;而T2加權(quán)像(T2WI)可以分辨液體成分,這些序列可以提供乳腺腫瘤更多的信息。動態(tài)增強(DCE)MRI檢查具有較高的空間分辨率和時間分辨率,通過無間距掃描,獲得圖像重建,可發(fā)現(xiàn)小乳腺癌,對于診斷有更高的靈敏性。有研究表明,以病理結(jié)果為標準回顧超聲診斷時發(fā)現(xiàn),超聲檢查雖具有操作便捷,成本較低等特點,但對非典型圖像認識不足,較易誤診[1]。另有研究人員將乳腺超聲及MRI對乳腺腫物的診斷以病理為“金標準”進行對比,結(jié)果顯示MRI對乳腺腫物診斷的靈敏性、特異性和準確性均明顯高于超聲[2]。
目前臨床更多的是醫(yī)生得到影像學(xué)圖像后根據(jù)臨床經(jīng)驗的診斷,Uematsu等[3]在MRI圖像上發(fā)現(xiàn)了三陰性乳腺癌特點,即單灶性病變、腫塊病變、腫塊邊緣光滑、邊緣增強不均勻、增強模式持續(xù)以及T2加權(quán)圖像信號強度非常高的MR成像結(jié)果。Youk等[4]發(fā)現(xiàn)三陰性乳腺癌在DCE-MRI和彌散加權(quán)像(DWI)MRI上表現(xiàn)出了一些不同于雌激素受體(ER)+和HER2+的特征。這些方法雖正確,但具有一定醫(yī)生的主觀因素,耗費精力與時間,使患者無法較快的了解自己的病情,降低臨床就診率。放射組學(xué)的研究模式推動了MRI乳腺診斷中的應(yīng)用。通過提取乳腺MRI的放射組學(xué)特征,可以通過有監(jiān)督和無監(jiān)督的經(jīng)典機器學(xué)習(xí)算法訓(xùn)練識別腫瘤良惡性和分子亞型的模型。關(guān)于放射組學(xué)及其相關(guān)的傳統(tǒng)機器學(xué)習(xí)研究本文不做更多的綜述。
深度學(xué)習(xí)在計算機視覺領(lǐng)域已經(jīng)成功應(yīng)用,在醫(yī)學(xué)影像分析中也獲得巨大進展。關(guān)于乳腺癌MRI的深度學(xué)習(xí)研究也從傳統(tǒng)的機器學(xué)習(xí)模型向深度學(xué)習(xí)模型發(fā)展,從分析流程角度和任務(wù)角度,本文就深度學(xué)習(xí)在乳腺癌MRI診斷中的應(yīng)用進行綜述。
深度學(xué)習(xí)的興起和突出表現(xiàn)及在圖像識別、分割、標記等方向的成功應(yīng)用,向傳統(tǒng)的機器學(xué)習(xí)策略提出了挑戰(zhàn)。深度學(xué)習(xí)在乳腺癌MRI方向的應(yīng)用也使乳腺癌MRI診斷和亞型識別等能力得到進一步提升。
在MRI圖像上診斷乳腺癌及鑒別其分子亞型上主要需要三大步驟:數(shù)據(jù)集的選取、數(shù)據(jù)集預(yù)處理、構(gòu)建模型和驗證。對于數(shù)據(jù)集的選取通常來源于網(wǎng)絡(luò)公開數(shù)據(jù)集或各中心的數(shù)據(jù)集,而現(xiàn)擁有的數(shù)據(jù)集均存在數(shù)據(jù)量少、形式單一等缺點,無法滿足訓(xùn)練網(wǎng)絡(luò)模型的需求,同時考慮到不同的深度學(xué)習(xí)模型需要不同的數(shù)據(jù)類型,故需要對數(shù)據(jù)集進行預(yù)處理。如陳彤[5]將2400幅288×288尺寸的DICOM格式數(shù)據(jù)通過旋轉(zhuǎn)、鏡像、剪裁等數(shù)據(jù)增強方法,得到6000個數(shù)據(jù)樣本,用于滿足訓(xùn)練需求。但在公共數(shù)據(jù)集中得到的核磁共振成像樣本,由于是從不同設(shè)備采集,其像素之間存在差異,可能影響最終結(jié)果。Zhu等[6]選擇了最常出現(xiàn)的空間分辨率為目標分辨率,并將所有圖像配準到這一分辨率中,然后使用雙線性插值將具有其他空間分辨率的核磁共振成像縮放至目標分辨率,再將其按比例剪裁,隨機平移和旋轉(zhuǎn)并可得到一個同像素且較大的數(shù)據(jù)集。
從頭開始訓(xùn)練是訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)最直接的方法,此方法的成功需要兩個重要的因素:數(shù)據(jù)集和網(wǎng)絡(luò)結(jié)構(gòu)。目前的神經(jīng)網(wǎng)絡(luò)包含數(shù)十層甚至數(shù)百層,導(dǎo)致有眾多的參數(shù)需要訓(xùn)練,這就對龐大的數(shù)據(jù)集有嚴格的要求。而MRI圖像數(shù)據(jù)集可用數(shù)據(jù)恰恰不足,對于提高數(shù)據(jù)集并訓(xùn)練模型極具挑戰(zhàn)性。遷移學(xué)習(xí)是目前研究的主要方法,主要分為兩步,第一步使用較大的自然數(shù)據(jù)集對模型進行預(yù)訓(xùn)練,也可基于其他的醫(yī)學(xué)影像數(shù)據(jù)集進行預(yù)訓(xùn)練;第二步也是目前作為研究熱點的一步,是用所要研究的數(shù)據(jù)集上對預(yù)先訓(xùn)練好的模型進行微調(diào)。
乳腺癌病灶檢測和分割是實現(xiàn)乳腺腫瘤良惡性鑒別和亞型識別的前提。包括乳腺癌放射組學(xué)特征的提取,都需要提高MRI的分割能力。深度學(xué)習(xí)在圖像分割中表現(xiàn)突出,也在乳腺MRI領(lǐng)域中得到應(yīng)用[7]。U-Net是乳腺癌MRI病灶分割最常用的深度學(xué)習(xí)算法,基于此發(fā)展的3D U-Net在充分的訓(xùn)練下,能夠達到放射住院醫(yī)師的診斷準確率[8]。此外還包括區(qū)域掩膜卷積神經(jīng)網(wǎng)絡(luò)[9]。陳彤[5]將深度神經(jīng)網(wǎng)絡(luò)YOLACT網(wǎng)絡(luò)進行微調(diào),引入難樣本挖掘機制,并以MRI乳腺圖像數(shù)據(jù)庫為數(shù)據(jù)集進行模型訓(xùn)練,與YOLACT網(wǎng)絡(luò)、Mask R-CNN網(wǎng)絡(luò)進行對比,發(fā)現(xiàn)與原模型相比準確率更高,與Mask R-CNN相比運行速度更快。還有研究基于DENSE項目的篩查數(shù)據(jù),共對來自4581名女性的致密型乳腺進行的MRI檢查,判斷正常和發(fā)現(xiàn)MRI病變的深度學(xué)習(xí)模型ROC下的AUC平均面積為0.83(95%CI 0.80-0.85)[10]。周潔潔等[11]選取152例乳腺病變患者,運用模糊C均值聚類法切割病灶,對于乳腺非腫塊型病變,選用區(qū)域生長法獲得腫瘤邊界,并對各切割病灶進行分析獲得多個特征參數(shù)進行后續(xù)分割。
深度學(xué)習(xí)的一個分支CNN在醫(yī)學(xué)影像分析方面也取得了長足的進步。CNN是一種臨床上常用的深度學(xué)習(xí)網(wǎng)絡(luò),主要應(yīng)用于病理和影像學(xué)圖像的識別與分析,并有報道表明其在分割、異常檢查、疾病分類和診斷等各種臨床任務(wù)中具有巨大潛力[12]。卷積神經(jīng)網(wǎng)絡(luò)在圖像分類任務(wù)中表現(xiàn)突出。乳腺MRI分類的主要任務(wù)之一就是基于CNN進行良惡性鑒別。Truhn等[13]對人工神經(jīng)網(wǎng)絡(luò)(ANN)與CNN對乳腺MRI圖像的良惡性診斷進行研究,結(jié)果表明盡管對ANN方法進行了調(diào)整,但CNN準確率仍高于ANN。應(yīng)用ResNet50模型[14]把病灶周圍組織的特征考慮進來,結(jié)合放射組學(xué)進行良惡性鑒別,與單獨使用腫瘤或使用較大的框相比,使用包含近端周圍組織的最小邊界框作為輸入具有更高的準確性。深度學(xué)習(xí)還把不同檢查時間點的動態(tài)增強MRI數(shù)據(jù)進行整合分析,如應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短期記憶網(wǎng)絡(luò)(LSTM)。
盡管對于提取MRI特征的乳腺癌亞型預(yù)測方面取得了很大的成功,這些研究都主要依賴于半自動特征提取的方法,關(guān)于亞型識別的傳統(tǒng)機器學(xué)習(xí)模型遠多于深度學(xué)習(xí)建模[15]。遷移學(xué)習(xí)和CNN也是應(yīng)用深度學(xué)習(xí)進行乳腺癌亞型識別的主要方法之一。Zhu[16]等人為應(yīng)用預(yù)先訓(xùn)練的VGGNet網(wǎng)絡(luò)使用MRI數(shù)據(jù)集對乳腺癌分子亞型進行分類,由于該方法使用的是預(yù)先訓(xùn)練的網(wǎng)絡(luò)提取特征,可再用提取的特征訓(xùn)練傳統(tǒng)網(wǎng)絡(luò)模型,避免過擬合的出現(xiàn)。如前所述,T1WI、 T2WI和 DWI是常用的多參數(shù)乳腺MRI成像方法。有人應(yīng)用CNN提取多參數(shù)MRI特征預(yù)測Ki-67高表達亞型獲得了0.875的AUC值[15]。整合多參數(shù)MRI CNN在術(shù)前預(yù)測腋窩淋巴結(jié)轉(zhuǎn)移的準確率達到0.970,AUC值為0.996[17]?;谌橄侔㎝RI影像的深度學(xué)習(xí)還能實現(xiàn)預(yù)測新輔助治療的療效,準確率達到70%[18]。有人[19]將216名乳腺癌患者的術(shù)前MRI圖像進行處理,將其在三維仿射矩陣中隨機旋轉(zhuǎn)獲得更多圖像,并制定了14層CNN,使乳腺癌分子亞型預(yù)測的準確率達70%。在判斷乳腺癌分子亞型的研究中,把患者分為3個亞型,即HR+/HER2-、 HER2+和三陰性乳腺癌,CNN和LSTM的準確率均較高,部分驗證集的準確率分別達到了0.91和0.83[20]。
目前較大規(guī)模的乳腺MRI數(shù)據(jù)集還十分有限。迫切需要建立數(shù)據(jù)量大,圖像信息豐富,有專業(yè)標記信息的乳腺MRI影像數(shù)據(jù)集,為訓(xùn)練專業(yè)領(lǐng)域的病灶分割,良惡性腫瘤分類和亞型識別提供數(shù)據(jù)支持。同時還要考慮到不同掃描參數(shù)可能對后續(xù)分析的影響,如何標注數(shù)據(jù)集,如何充分利用多中心或不同來源的數(shù)據(jù)也是研究的方向之一。
可解釋研究是乳腺癌MRI深度學(xué)習(xí)研究的另一方向。深度學(xué)習(xí)的圖像分割和分類效果令研究者滿意,但所提取的特征和決定背后的邏輯仍然無法解釋清晰。因此進一步的探討乳腺癌MRI深度學(xué)習(xí)研究中存在的“可解釋性”問題是該領(lǐng)域的研究方向之一,這樣的研究目前還不多[15]。
多組學(xué)研究也是目前研究的熱點。目前的研究主要是探討不同組學(xué)之間的相關(guān)性。結(jié)合分子組學(xué)和病理組學(xué)等多組學(xué)的信息,可以對腫瘤的認識更加全面,有助于對預(yù)后、分型和療效等的判斷。但目前把乳腺MRI同時結(jié)合分子組學(xué)和病理組學(xué)的研究有限[21]。
因此應(yīng)用乳腺MRI影像數(shù)據(jù)運用深度學(xué)習(xí)算法,創(chuàng)建更大的數(shù)據(jù)庫、并在此基礎(chǔ)上優(yōu)化更為便捷的模型、快速發(fā)現(xiàn)腫瘤并提取乳腺癌各個亞型的特征并進行可解釋分析,融合多組學(xué)信息并用于臨床,是今后所要探索的方向。