李潔,劉光耀,樊鳳仙,胡萬均,白玉萍,張靜*
作者單位:1.蘭州大學(xué)第二醫(yī)院核磁共振科,蘭州 730030;2.蘭州大學(xué)第二臨床醫(yī)學(xué)院,蘭州 730030;3.甘肅省功能及分子影像臨床醫(yī)學(xué)研究中心,蘭州 730030
腦膠質(zhì)瘤是中樞神經(jīng)系統(tǒng)最常見的原發(fā)性腫瘤,跨越兒童到老人各個年齡段。在全身腫瘤中,膠質(zhì)瘤五年病死率排第三,尤其是膠質(zhì)母細胞瘤(glioblastoma,GBM)的中位總生存期僅約為12~15 個月[1-2]。由于低級別彌漫性膠質(zhì)瘤具有向高級別轉(zhuǎn)變的特征,無法達到完全治愈,使腦膠質(zhì)瘤成為最具破壞性的癌癥代表之一,患者術(shù)后神經(jīng)功能障礙、精神障礙,生活質(zhì)量下降以及巨大的經(jīng)濟負擔都會影響患者生活質(zhì)量,因此膠質(zhì)瘤的早期診斷及分級、基因突變狀態(tài)、規(guī)范治療、療效評估對優(yōu)化患者術(shù)后護理、提高術(shù)后生活質(zhì)量至關(guān)重要。人工智能的快速發(fā)展,為精準醫(yī)療帶來曙光[3],尤其在醫(yī)學(xué)影像領(lǐng)域的發(fā)展最可觀[4]。影像組學(xué)能挖掘常規(guī)影像所不能顯示的內(nèi)部特征,反映膠質(zhì)瘤復(fù)雜的異質(zhì)性信息。如何應(yīng)用人工智能技術(shù)和影像組學(xué)方法提高腦膠質(zhì)瘤術(shù)前診斷能力并應(yīng)用于治療決策是目前研究的熱點。筆者針對基于MRI 的深度學(xué)習(xí)(deep learning,DL)和影像組學(xué)在腦膠質(zhì)瘤鑒別診斷、分級、基因分型及預(yù)后等方面的研究現(xiàn)狀進行綜述,并探討以后的發(fā)展方向。
人工智能是計算機科學(xué)的一個分支,能夠分析復(fù)雜的醫(yī)學(xué)數(shù)據(jù),其快速發(fā)展為未來精準、個體化醫(yī)療帶來曙光,可用于許多疾病的診斷、治療和預(yù)測結(jié)果,其實現(xiàn)主要依靠機器學(xué)習(xí)和DL。DL[5]是一門源于人工神經(jīng)網(wǎng)絡(luò)的研究,本質(zhì)是一個高度復(fù)雜的非線性回歸方法,運算程序較復(fù)雜。DL 屬于機器學(xué)習(xí)方法的一個分支,傳統(tǒng)機器學(xué)習(xí)算法如決策樹、隨機森林、支持向量機(support vector machine,SVM)等需要預(yù)先進行人工分割并提取特征,而DL 可以準確高效地自動提取數(shù)據(jù)特征,避免了手工分割的煩瑣性及誤差性,大大節(jié)約了人力、時間和財力。DL 模型較多,目前常用的是卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)模型。
影像組學(xué)是一種圖像分析方法,是荷蘭學(xué)者Lambin 等[6]于2012 年提出,將其定義為“采用高通量技術(shù)從影像圖像中提取成像特征,創(chuàng)建可利用的數(shù)據(jù)庫”。影像組學(xué)方法的具體步驟包括獲取圖像、病變ROI 勾畫及分割、提取影像學(xué)特征、特征篩選、建立預(yù)測模型并驗證等[7]。影像組學(xué)主要有兩種類型:基于特征的影像組學(xué)(即經(jīng)典影像組學(xué))和基于DL 的影像組學(xué)(deep learning-based radiomics,DLR),前者不需要大型數(shù)據(jù)集,而后者需要更大的數(shù)據(jù)集[8]。DLR 通過對圖像進行歸一化、直接從深度神經(jīng)網(wǎng)絡(luò)來獲得影像組學(xué)特征,與經(jīng)典的影像組學(xué)方法不同,不涉及額外的特征提取操作,因此不會因為特征計算而引入額外的錯誤[9]。影像組學(xué)具有非侵入性、客觀性、準確性及可重復(fù)性較高的特點,在腫瘤性病變中發(fā)展最快,目前已廣泛應(yīng)用于膠質(zhì)瘤、肺癌、乳腺癌、前列腺癌等腫瘤的診斷、分期或分級、基因預(yù)測、治療效果評價以及預(yù)后判斷等方面。
腦膠質(zhì)瘤屬于腦內(nèi)最常見的原發(fā)性腫瘤,隨著WHO 中樞神經(jīng)系統(tǒng)腫瘤分類方法的更新,膠質(zhì)瘤的分級、基因分型越來越詳細[10]。膠質(zhì)瘤的治療以手術(shù)切除為主,切除范圍、放化療方法、療效以及生存期與腫瘤級別及基因分型有密切關(guān)系。膠質(zhì)瘤病理組織學(xué)檢查是一種傳統(tǒng)且可靠的診斷方法,但它通常需要很長時間、復(fù)雜的程序才能獲得病理結(jié)果[11]。術(shù)前穿刺活檢也可以作為標準,但屬于有創(chuàng)性操作,且活檢不能獲得完整腫瘤的組織,無法提供腫瘤真實的信息。因此膠質(zhì)瘤的術(shù)前MRI成為膠質(zhì)瘤診斷、治療決策、預(yù)后評估等方面的重要支柱[12]。目前常規(guī)序列包括T1 加權(quán)成像(T1 weighted imaging,T1WI)、T2加權(quán)成像(T2 weighted imaging,T2WI)、液體衰減反轉(zhuǎn)恢復(fù)(fluid attenuated inversion recovery,F(xiàn)LAIR)序列、T1WI對比增強序列(T1 contrast enhancement weighted imaging,T1CE);功能序列包括擴散加權(quán)成像(diffusion weighted imaging,DWI)、擴散張量成像(diffusion tensor imaging,DTI)、灌注加權(quán)成像(perfusion weighted imaging,PWI)等。基于常規(guī)和功能MRI的DL和影像組學(xué)已廣泛用于腦膠質(zhì)瘤術(shù)前鑒別診斷、分級、基因分型及預(yù)后等方面研究[13-14]。
腦膠質(zhì)瘤的MRI 表現(xiàn)與其他腫瘤、非腫瘤性病變會有重疊相似之處,例如低級別膠質(zhì)瘤與腦炎、高級別膠質(zhì)瘤與脫髓鞘病變、GBM 與原發(fā)性中樞神經(jīng)系統(tǒng)淋巴瘤(primary central nervous system lymphoma,PCNSL)和轉(zhuǎn)移瘤等,因此準確鑒別腦膠質(zhì)瘤與其他疾病是影像診斷的第一步。
Zhang等[15]應(yīng)用DL方法鑒別GBM、PCNSL和脫髓鞘病變,AUC達到了0.954~1.000,Nakagawa 等[16]應(yīng)用多序列MRI 構(gòu)建影像組學(xué)模型區(qū)分GBM與PCNSL,取得了0.98的高AUC值,結(jié)果證明DL 和影像組學(xué)在腦膠質(zhì)鑒別診斷方面具有較高的效能。但是,關(guān)于二者能否為影像醫(yī)生節(jié)省更多的時間,多個研究團隊對此進行了研究。Wu 等[17]分別構(gòu)建Alexnet、ResNet-50 和Inception-v3 三個卷積網(wǎng)絡(luò)模型以區(qū)分彌漫性膠質(zhì)瘤與腦炎,結(jié)果顯示三個模型的AUC 值均超過了0.9,而兩名神經(jīng)放射科醫(yī)生評估的AUC 分別為0.891、0.770。Han 等[18]分別建立基于T2WI的單參數(shù)影像組學(xué)模型和基于T2WI、T1WI的多參數(shù)影像組學(xué)模型以區(qū)分腦炎與Ⅱ級膠質(zhì)瘤,AUC 為0.980、0.988,明顯高于兩位影像醫(yī)師評估的AUC (0.661、0.722)。但以上研究樣本量較小,其結(jié)果還需慎重解釋。
總體而言,DL 和影像組學(xué)在膠質(zhì)瘤鑒別方面具有良好的性能,可能相當于、甚至略高于影像醫(yī)生的診斷水平。但是以上研究均是針對單發(fā)病灶,而實際工作中多發(fā)性病灶鑒別更加困難;而且DL 和影像組學(xué)對于體積較小病灶無法判斷,可能與二者自身局限性有關(guān);未來尚需進一步優(yōu)化計算機算法提高其性能。
依據(jù)2007年WHO中樞神經(jīng)系統(tǒng)腫瘤分類將腦膠質(zhì)瘤由低到高分為Ⅰ~Ⅳ級,級別不同,侵襲、浸潤特征不同,治療方案與預(yù)后也存在差異,術(shù)前分級是制訂治療計劃的首要問題[19]。既往影像醫(yī)生根據(jù)腫瘤部位、形態(tài)、邊緣、內(nèi)部信號及強化特征進行主觀判斷分級,導(dǎo)致術(shù)前分級欠準確。影像組學(xué)最早應(yīng)用于膠質(zhì)瘤是預(yù)測術(shù)前分級。穆建華等[20]基于T2WI、T1CE圖像,結(jié)合三種機器學(xué)習(xí)方法建立了六種單序列影像組學(xué)模型以區(qū)分高級別(Ⅲ級和Ⅳ級)與低級別膠質(zhì)瘤(Ⅰ級和Ⅱ級),AUC 值均在0.8 以上。Tian 等[21]從常規(guī)MRI、DWI和動脈自旋標記(arterial spin labeling,ASL)圖像中提取特征,使用SVM分類器構(gòu)建影像組學(xué)模型,區(qū)分Ⅱ級與Ⅲ級和Ⅳ級的AUC 為0.987,準確率為96.8%,區(qū)分級Ⅲ級與Ⅳ級的AUC為0.992,準確率為98.1%。諸多研究證明,影像組學(xué)已成為一種有前途的非侵入性膠質(zhì)瘤分級方法,多參數(shù)模型較單序列模型效能較好,而且將功能MRI 納入模型后,效能亦得到提升。但并不是序列越多越好[22],尋找最佳組合序列是以后研究的探索方向。
與影像組學(xué)方法相比,DL 在術(shù)前神經(jīng)膠質(zhì)瘤分級中的應(yīng)用性能更高[23]。Li 等[24]分別開發(fā)了影像組學(xué)和CNN 模型預(yù)測膠質(zhì)瘤分級,CNN 模型的準確率、AUC 都優(yōu)于影像組學(xué)模型。Gutta 等[25]使用CNN 方法對237 名膠質(zhì)瘤患者進行級別分類,與傳統(tǒng)機器學(xué)習(xí)相比,CNN 模型的準確率提高了23%。常用的CNN 模型有2D CNN、3D CNN。Zhuge 等[26]對同一組數(shù)據(jù)分別應(yīng)用2D-Mask R-CNN 和3D-ConvNet 進行Ⅱ級膠質(zhì)瘤與Ⅲ級、Ⅳ級分類,準確率分別為96.3%、97.1%,顯示3D CNN 稍優(yōu)于2D CNN DL 網(wǎng)絡(luò),這與Mzoughi 等[27]的研究結(jié)果一致。其原因在于3D CNN 是將整個腫瘤體積傳送到學(xué)習(xí)網(wǎng)絡(luò)中,利用了整個腫瘤空間信息。也有研究提出將DL 與影像組學(xué)結(jié)合探索其性能。Zhang 等[28]基于DTI 衍生的圖像提取了深度特征、紋理特征和形狀特征,采用SVM 構(gòu)建分類模型,實現(xiàn)了98%的最高準確率,AUC 達到了0.99,與其他研究相比,模型性能確有提高,但是二者結(jié)合的研究較少,未來還需進一步探索其在膠質(zhì)瘤分級以及其他應(yīng)用方面的能力。
以上研究均是依據(jù)2007版WHO中樞神經(jīng)系統(tǒng)腫瘤分類進行的。2021 年《Neuro-Oncology》發(fā)布了第五版WHO 中樞神經(jīng)系統(tǒng)腫瘤分類,提出首先需要明確膠質(zhì)瘤基因分型,才能進一步對進行腫瘤分級[29]。以后膠質(zhì)瘤的分級研究應(yīng)按照最新版本進行,但DL與影像組學(xué)的方法依舊適用。
2016年WHO中樞神經(jīng)系統(tǒng)腫瘤分類增加了基因分型,認為結(jié)合細胞形態(tài)和基因分型,能更準確地指導(dǎo)臨床制訂輔助放療、化療等方案。最新版分類亦強調(diào)了基因分型在膠質(zhì)瘤分類、分級中作用。其中,異檸檬酸脫氫酶(isocitrate dehydrogenase,IDH)基因突變與術(shù)后制訂化療方案有關(guān),1p/19q共缺失狀態(tài)在膠質(zhì)瘤分類、分級中揮著核心作用,O6-甲基鳥嘌呤-DNA甲基轉(zhuǎn)移酶(O6-methylguanine-DNA methyltransferase,MGMT)啟動子的甲基化與高級別膠質(zhì)瘤術(shù)后治療的有效性相關(guān)[30-31]。由于術(shù)后經(jīng)病理組織檢測基因分型需要的時間較長,延誤了膠質(zhì)瘤患者的治療,因此,急需在術(shù)前基于MRI特征預(yù)測膠質(zhì)瘤基因分型以滿足臨床治療需要。目前以預(yù)測IDH突變狀態(tài)的研究較廣泛、成熟。
無論是基于常規(guī)MRI、還是功能MRI,影像組學(xué)和DL 在預(yù)測膠質(zhì)瘤基因分型同樣具有較大的潛能[32-33]。Chang 等[34]應(yīng)用2D CNN 學(xué)習(xí)分析259 名膠質(zhì)瘤患者的常規(guī)MRI 圖像(T2WI、T1WI、FLAIR、T1CE)的特征,對IDH-1 突變狀態(tài)、1p/19q 共缺失狀態(tài)和MGMT啟動子甲基化狀態(tài)進行分類,準確率分別為94%、92%、83%。Choi等[35]開發(fā)了一種基于動態(tài)磁敏感對比灌注MRI圖像的DL 網(wǎng)絡(luò)模型,對463 名膠質(zhì)瘤患者的IDH 基因型進行分類,驗證集、測試集的準確率分別為92.8%、91.7%,AUC 分別達到了0.98、0.95。最新的MRI 技術(shù)如酰胺質(zhì)子轉(zhuǎn)移成像(amide proton transfer,APT)也被證明是預(yù)測腦膠質(zhì)瘤基因分型的重要序列[31]。
雖然多序列MRI 模型在腫瘤分級方面的診斷性能較高,但在預(yù)測IDH 基因型時,與單序列模型診斷性能相當[36]。Bangalore 等[37]使用3D Dense-UNets訓(xùn)練網(wǎng)絡(luò),分別創(chuàng)建了基于T2WI圖像的單序列模型,和基于T2WI、FLAIR、T1CE圖像的多序列模型,結(jié)果顯示兩種模型在預(yù)測IDH基因突變狀態(tài)方面的準確率分別為97.14%、97.12%,AUC 分別為0.98、0.99,差異無統(tǒng)計學(xué)意義,Kim等[36]基于功能磁共振圖像的研究結(jié)果與其一致。但是薛彩強[38]等研究認為應(yīng)用T2WI 和T1CE 的聯(lián)合序列模型預(yù)測MGMT 啟動子甲基化效能優(yōu)于單一序列。綜上所述,預(yù)測膠質(zhì)瘤基因分型的最佳組合序列還有待進一步研究。
3.4.1 腦膠質(zhì)瘤術(shù)后放療后真、假性進展的鑒別
膠質(zhì)瘤尤其是高級別膠質(zhì)瘤術(shù)后需要常規(guī)進行放射治療,但放療會引起鄰近腦組織放射性壞死,早期MRI 表現(xiàn)與腫瘤復(fù)發(fā)浸潤難以鑒別,這將會潛在性延誤復(fù)發(fā)患者的治療時機。因此區(qū)分真、假性進展對腦膠質(zhì)瘤的進一步治療決策至關(guān)重要,是膠質(zhì)瘤術(shù)后隨訪的重大挑戰(zhàn)。已經(jīng)證明多參數(shù)MRI組學(xué)、DL為二者鑒別提供了有力工具,診斷性能明顯優(yōu)于神經(jīng)影像醫(yī)生[39]。多項研究[40-41]證明在鑒別膠質(zhì)瘤放療后真、假性進展時,多序列MRI模型性能優(yōu)于單個序列,影像組學(xué)與DL結(jié)合的模型性能較優(yōu)。
Kim等[42]將DWI、PWI納入鑒別GBM真假性進展的多序列影像組學(xué)模型,AUC 值高于基于常規(guī)MRI、DWI、PWI 等單序列模型,明顯提高了診斷性能。Metz 等[43]發(fā)現(xiàn)DTI 的衍生圖,尤其是各向異性分數(shù)圖,在預(yù)測GBM 復(fù)發(fā)方面亦具有較大潛力。盡管功能MRI 能夠提供一些定量指標來量化膠質(zhì)瘤術(shù)后殘腔周圍的異常信號,基于功能MRI 的影像組學(xué)和DL 在鑒別膠質(zhì)瘤術(shù)后真假性進展方面優(yōu)于常規(guī)MRI,但是功能成像操作復(fù)雜度高、檢查時間過長,且費用較高,可重復(fù)性不強,實際效果并不理想。
3.4.2 腦膠質(zhì)瘤術(shù)后生存預(yù)測
隨著醫(yī)療技術(shù)逐漸發(fā)展,腦膠質(zhì)瘤治療取得了較大的進展,但高級別膠質(zhì)瘤的患者存活率仍然很低,尤其GBM 中位總生存期僅約為12~15 個月,五年生存率不到10%,能否利用人工智能早期預(yù)測膠質(zhì)瘤無進展生存期和總生存期是患者及家屬、研究者關(guān)注的問題。已有研究證明在不需要考慮膠質(zhì)瘤級別的情況下,基于MRI 的影像組學(xué)可用于預(yù)測膠質(zhì)瘤的生存情況[44-45]。但是手動分割的影像組學(xué)特征在觀察者內(nèi)和觀察者間的變異性很敏感,DL的自動工作流程可以避免這種差異。Feng 等[46]基于3D U-Net DL 網(wǎng)絡(luò)開發(fā)了一種分割、提取影像組學(xué)特征的線性模型來預(yù)測患者的總體存活率,在低級別膠質(zhì)瘤、GBM中均具有較高的預(yù)測準確率,并取得2018年BraTS挑戰(zhàn)賽冠軍的佳績,為膠質(zhì)瘤生存期預(yù)測研究提供了基石。Han等[47]的研究證明結(jié)合了深度特征和影像組學(xué)特征的模型可以有效將高級別膠質(zhì)瘤患者分為長期和短期生存者。
除了腫瘤本身級別、異質(zhì)性及基因分型與預(yù)后相關(guān)外,患者的年齡、體能狀態(tài)、切除范圍等臨床因素也影響預(yù)后。影像組學(xué)與DL 通過挖掘腫瘤內(nèi)部影像特征,與臨床因素結(jié)合,提高了預(yù)測術(shù)后生存期的能力。Zhang 等[48]利用從多參數(shù)MRI中提取特征和臨床風(fēng)險因素相結(jié)合構(gòu)建了用于評估GBM 患者生存期的影像組學(xué)列線圖,訓(xùn)練集、驗證集的一致性指數(shù)分別是0.971和0.974。Huang等[49]將降維后的MRI特征與年齡、腫瘤分級等臨床特征結(jié)合到隨機森林回歸模型中進行生存預(yù)測,亦顯示了較好的優(yōu)勢。
以上對于膠質(zhì)瘤術(shù)后生存預(yù)測的研究多為回顧性研究,納入的患者術(shù)后治療方案不統(tǒng)一,而且影響患者生存期的因素除了研究中所提到的年齡、體能狀態(tài)、手術(shù)及影像特征之外,還有患者心理因素、術(shù)后營養(yǎng)狀況等難以評估的因素,因此在未來的研究中,應(yīng)前瞻性納入統(tǒng)一治療方案的患者,還可以與基因組學(xué)、代謝組學(xué)、蛋白質(zhì)組學(xué)等信息相結(jié)合,增強對腫瘤內(nèi)部信息的辨別能力,提高生存預(yù)測能力。
DL 和影像組學(xué)以非侵入性方式提高了腦膠質(zhì)瘤術(shù)前診斷、分級的準確性,預(yù)測基因分型方面性能良好,且與臨床因素結(jié)合能評估術(shù)后生存期。但目前研究的樣本量較小,且數(shù)據(jù)單一,可靠的預(yù)測模型需要大量數(shù)據(jù)進行訓(xùn)練,建立多中心的數(shù)據(jù)庫十分必要,未來挑戰(zhàn)在于創(chuàng)建適用于多中心數(shù)據(jù)的更穩(wěn)定的方法。利用DL 和影像組學(xué)方法幫助診斷以及治療腦膠質(zhì)瘤勢必成為未來發(fā)展的主流方向。
作者利益沖突聲明:全體作者均聲明無利益沖突。