李高仙,徐 成,任嘉梁
[1.山西醫(yī)科大學(xué)醫(yī)學(xué)影像學(xué)系,山西 太原 030001;2.山西省人民醫(yī)院MR室,山西 太原 030012;3.通用電氣藥業(yè)(上海)有限公司,上海 210000]
直腸癌是消化道最常見惡性腫瘤之一,其病理分期是影響治療及預(yù)后的關(guān)鍵因素。MRI是目前臨床評(píng)估直腸癌最有價(jià)值的方法,尤其對(duì)顯示腸壁結(jié)構(gòu)、腸壁浸潤(rùn)深度及周圍臟器受累情況具有優(yōu)勢(shì),并在直腸癌術(shù)前分期方面取得了新的突破[1-3]。影像組學(xué)的出現(xiàn)進(jìn)一步擴(kuò)大了醫(yī)學(xué)圖像的應(yīng)用范疇[4-5],在預(yù)測(cè)腫瘤預(yù)后[6-7]、術(shù)前腫瘤分期[8]和評(píng)價(jià)療效[9]方面具有潛在臨床應(yīng)用價(jià)值。本研究對(duì)比直腸癌患者術(shù)前MRI與術(shù)后病理結(jié)果,選擇MR結(jié)構(gòu)(高分辨T2WI)和功能(DWI)圖像,結(jié)合局部腫瘤自身特征及臨床資料,探討基于高分辨T2WI的影像組學(xué)術(shù)前判定直腸癌T分期的臨床價(jià)值。
1.1 一般資料 收集2016年3月—2018年3月就診于山西省人民醫(yī)院、經(jīng)術(shù)后病理證實(shí)為直腸腺癌的191例患者的臨床及影像學(xué)資料,男109例,女82例,年齡40~87歲,平均(63.4±10.9)歲。納入標(biāo)準(zhǔn):①經(jīng)病理確診為原發(fā)性直腸腺癌并接受根治術(shù);②術(shù)后有完整的包括T分期的病理報(bào)告;③術(shù)前2周內(nèi)接受MR檢查,并有所有序列包括病灶的完整圖像;④MR檢查前未經(jīng)過任何治療。排除標(biāo)準(zhǔn):①M(fèi)R檢查禁忌者及無法耐受檢查者;②既往有其他器官腫瘤病史;③圖像質(zhì)量差,運(yùn)動(dòng)偽影明顯,影響圖像分割及影像組學(xué)特征提取。本研究經(jīng)山西省人民醫(yī)院倫理委員會(huì)批準(zhǔn),所有患者均簽署知情同意書。
1.2 儀器與方法 采用Siemens Avanto 1.5T MR掃描儀,12通道體部相控陣線圈。囑患者仰臥,掃描前30 min內(nèi)使用2支開塞露,進(jìn)行腸道準(zhǔn)備。掃描序列和參數(shù):①高分辨T2W,根據(jù)矢狀位圖像定位,掃描層面與腫瘤處腸管方向垂直,TR 6 680 ms,TE 97 ms,F(xiàn)OV 160 mm×160 mm,矩陣256×192,層厚3 mm,層間距0.3 mm;②DWI,軸位掃描,TR 6 200 ms,TE 78 ms,F(xiàn)OV 380 mm×380 mm,矩陣192×188.16,層厚5 mm,層間距0.5 mm,b值分別為0和800 s/mm2。
1.3 病理診斷 根據(jù)第七屆美國(guó)癌癥聯(lián)合委員會(huì)(American Joint Committee on Cancer, AJCC)TNM分期標(biāo)準(zhǔn),對(duì)所有手術(shù)切除標(biāo)本進(jìn)行病理診斷并分期。根據(jù)病理結(jié)果,將T1~T2期歸為早期,T3~T4期歸為局部進(jìn)展期。以病理結(jié)果為真值進(jìn)行模型訓(xùn)練和驗(yàn)證。
1.4 圖像分析 由2名高年資影像科醫(yī)師以盲法評(píng)價(jià)MR圖像,意見不一時(shí)協(xié)商達(dá)成共識(shí)。根據(jù)AJCC的TNM分期標(biāo)準(zhǔn),基于高分辨率T2WI上直腸壁解剖及腫瘤與黏膜下層和固有肌層的關(guān)系,將T分期定義如下:T1期,腫瘤局限于黏膜下層,且腫瘤與固有肌層之間可見高信號(hào)的黏膜下層;T2期,腫瘤延伸到固有肌層但不超過固有肌層,此時(shí)未見高信號(hào)的黏膜下層,但固有肌層完全保留;T3期,腫瘤延伸超過固有肌層進(jìn)入直腸系膜脂肪層;T4期,腫瘤侵犯周圍結(jié)構(gòu)或器官。
1.5 影像組學(xué)分析 在ITK-SNAP(Version 3.60,www.itksnap.org)軟件上進(jìn)行圖像分割[10]。由1名具有多年腹部MRI診斷經(jīng)驗(yàn)的影像科醫(yī)師在高分辨T2WI上沿腫瘤邊緣逐層手動(dòng)勾畫ROI,盡量排除未受侵的直腸壁和腸腔內(nèi)的氣體。
勾畫ROI后,將DICOM圖像和ROI輸出,進(jìn)行影像組學(xué)特征提取和分析:①數(shù)據(jù)預(yù)處理,先以中值代替所有數(shù)據(jù)中的缺失值,對(duì)特征做z-score標(biāo)準(zhǔn)化,以統(tǒng)一所有特征的尺度;②特征數(shù)降維,包括直方圖類、形態(tài)特征類和紋理特征類(共生矩陣類和步長(zhǎng)矩陣),共396個(gè)特征,其中直方圖特征42個(gè),形態(tài)特征9個(gè),紋理類特征345個(gè);使用廣義線性模型LASSO(Least Absolute Shrinkage and Selection Operator)算法進(jìn)行特征選擇(圖1),最終篩選出14個(gè)特征,包括Compactness1,Correlation_All Direction_offset4_SD,GLCM Energy_angle90_offset1,Hara Entroy,Haralick Correlation_All Direction_offset1_SD,Long Run High Grey Level Emphasis_All Direction_offset7_SD,Low Intensity Large Area Emphasis,Maximum 3D Diameter,Min Intensity,Quantile 0.025,Run Length Nonuniformity_All Direction_offset4_SD,Run Length Nonuniformity_All Direction_offset7_SD,Spherical Disproportion和Zone Percentage;③對(duì)篩選出的特征建立預(yù)測(cè)模型,通過隨機(jī)森林算法(random forest, RF)先建立組學(xué)模型,再利用組學(xué)產(chǎn)生的Rad-分值與臨床數(shù)據(jù)結(jié)合建模;④模型評(píng)估,即數(shù)據(jù)驗(yàn)證,對(duì)建立的模型進(jìn)行回歸診斷后,將驗(yàn)證數(shù)據(jù)帶入模型中進(jìn)行驗(yàn)證。
1.6 統(tǒng)計(jì)學(xué)分析 采用SPSS 22.0統(tǒng)計(jì)分析軟件和Python 3.6軟件。計(jì)量資料以±s表示,2組間比較采用獨(dú)立樣本t檢驗(yàn);計(jì)數(shù)資料比較采用χ2檢驗(yàn)。繪制預(yù)測(cè)模型的ROC曲線,計(jì)算AUC、準(zhǔn)確率、敏感度、特異度,以及F1值和Brier值,以評(píng)估模型與驗(yàn)證數(shù)據(jù)集的可預(yù)測(cè)性。采用決策曲線分析(decision curve analysis, DCA)方法,以病理結(jié)果為標(biāo)準(zhǔn),計(jì)算常規(guī)MRI診斷直腸癌T1~T2期與T3~T4期的準(zhǔn)確率、敏感度和特異度,并與影像組學(xué)模型對(duì)比。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
表1 訓(xùn)練組與驗(yàn)證組患者一般資料比較
圖1 影像組學(xué)特征的篩選 A.LASSO算法調(diào)節(jié)參數(shù)log(alpha)的選擇; B.396個(gè)影像組學(xué)特征在模型中的系數(shù),垂直線表明經(jīng)過10倍交叉驗(yàn)證后的最佳選擇log(alpha)值,獲得14個(gè)系數(shù)非零的特征
圖2 基于影像組學(xué)特征的預(yù)測(cè)模型診斷T1~T2與T3~T4分期的ROC曲線 A.訓(xùn)練組; B.驗(yàn)證組
本組191例直腸癌中,病理結(jié)果顯示早期(T1~T2期)68例,局部進(jìn)展期(T3~T4期)123例;隨機(jī)分為訓(xùn)練組和驗(yàn)證組,訓(xùn)練組134例,驗(yàn)證組57例。2組性別、年齡、腫瘤原發(fā)位置及T分期差異均無統(tǒng)計(jì)學(xué)意義(P均>0.05,表1)。
2.1 影像組學(xué)模型的構(gòu)建與驗(yàn)證 將驗(yàn)證數(shù)據(jù)帶入組學(xué)模型中,得到的混淆矩陣顯示訓(xùn)練組中陽性預(yù)測(cè)值和陰性預(yù)測(cè)值分別為0.946(70/74)和0.733(44/60);驗(yàn)證組中陽性預(yù)測(cè)值和陰性預(yù)測(cè)值分別為0.850(34/40)和0.824(14/17)。
2.2 組學(xué)模型的診斷效能 ROC曲線(圖2)結(jié)果顯示,基于影像組學(xué)特征的預(yù)測(cè)模型診斷T1~T2與T3~T4期的預(yù)測(cè)模型在訓(xùn)練組和驗(yàn)證組的AUC分別為0.927、0.885(P均<0.05),準(zhǔn)確率為0.851(114/134)、0.842(48/57),特異度為0.917(44/48)、0.700(14/20),敏感度為0.814(70/86)、0.919(34/37);F1值為0.861、0.829,Brier值為0.149、0.159。醫(yī)師以常規(guī)MRI診斷T分期的準(zhǔn)確率、敏感度和特異度分別為0.817(156/191)、0.854(105/123)、0.750(51/68)。
預(yù)測(cè)模型的訓(xùn)練組和驗(yàn)證組的Rad-分值圖(圖3)中,分值越大越傾向于直腸癌局部進(jìn)展期,分值>0代表預(yù)測(cè)為局部進(jìn)展期(T3~T4期),分值<0代表預(yù)測(cè)為早期(T1~T2期)。模型在驗(yàn)證組中的DCA(圖4)表示不同風(fēng)險(xiǎn)閾值下的凈獲益,當(dāng)風(fēng)險(xiǎn)閾值在訓(xùn)練組與驗(yàn)證組中分別為38%~95%、40%~95%時(shí),采用影像組學(xué)方法預(yù)測(cè)直腸癌病理局部進(jìn)展期的方法優(yōu)于將所有患者視為進(jìn)展期或早期。
本研究利用基于高分辨率T2WI提取的影像組學(xué)特征術(shù)前判斷直腸癌患者T分期,結(jié)果表明,作為預(yù)測(cè)模型,影像組學(xué)特征在判定T分期方面具有可行性,且診斷效能略高于醫(yī)師對(duì)于常規(guī)MRI的評(píng)估;后期通過提高數(shù)據(jù)量,有望進(jìn)一步增加模型診斷的準(zhǔn)確率。
3.1 基于MRI的影像組學(xué)模型評(píng)估直腸癌術(shù)前T分期的價(jià)值與現(xiàn)狀 目前治療直腸癌的標(biāo)準(zhǔn)方法為對(duì)早期(T1~T2期)病變行手術(shù)切除,而對(duì)局部進(jìn)展期(T3~T4期)病變先行新輔助放化療,然后再行全直腸系膜切除術(shù)。因此,術(shù)前正確區(qū)分T1~T2與T3~T4期對(duì)于臨床制定治療計(jì)劃具有重要意義。目前采用高分辨MRI術(shù)前判定直腸癌T分期的準(zhǔn)確率尚不理想,Meta分析[11]顯示其準(zhǔn)確率差異較大,范圍從44%~100%,主要原因可能為MRI定性評(píng)估受醫(yī)師主觀判斷及經(jīng)驗(yàn)水平的影響較大。
圖3 訓(xùn)練組(A)與驗(yàn)證組(B)的預(yù)測(cè)分值圖,紫色代表病理診斷為早期,藍(lán)色代表病理診斷為局部進(jìn)展期,分值越大越傾向于局部進(jìn)展期
圖4 訓(xùn)練組(A)與驗(yàn)證組(B)的DCA曲線,表示不同風(fēng)險(xiǎn)閾值下的凈獲益 (LR:預(yù)測(cè)模型;None:無處理;All:完全處理)
定量的影像組學(xué)分析在鑒定腫瘤特征方面具有一定價(jià)值,可應(yīng)用于腫瘤診斷和預(yù)后評(píng)估[12-15]。本研究結(jié)果表明,提取大量高通量影像組學(xué)特征并使用LASSO降維分析后,采用RF模型分析方法構(gòu)建影像組學(xué)模型并據(jù)此術(shù)前識(shí)別直腸癌T1~T2與T3~T4期具有一定臨床價(jià)值,有望用于指導(dǎo)臨床制定個(gè)體化治療方案、確定手術(shù)方式,與Sun等[16]的研究結(jié)果一致。本研究中使用影像組學(xué)特征結(jié)合臨床資料診斷T分期的預(yù)測(cè)模型的準(zhǔn)確率較高,且與醫(yī)師評(píng)估MRI分期相比客觀性更好。Liu等[17]基于ADC圖提取組學(xué)特征,并將偏度和熵等影像組學(xué)特征作為T3~T4期直腸癌的獨(dú)立預(yù)測(cè)因子,其結(jié)果亦表明MRI影像組學(xué)特征對(duì)于判定直腸癌T分期具有潛在價(jià)值。
3.2 采用RF算法構(gòu)建的影像組學(xué)模型對(duì)于直腸癌T分期的診斷效能 RF是一種統(tǒng)計(jì)學(xué)習(xí)理論,使用重采樣技術(shù)生成多個(gè)樣本形成的決策樹,多個(gè)決策樹聯(lián)合進(jìn)行投票,選擇票數(shù)最多的類別。與傳統(tǒng)分類方法(如線性回歸分析和邏輯回歸分析)相比,RF是一種集合算法,具有較高的準(zhǔn)確率及容忍度,其最大優(yōu)勢(shì)在于可預(yù)測(cè)多變量的數(shù)據(jù),分析復(fù)雜的非線性關(guān)系[18]。本研究從MRI及臨床資料中提取定量信息,采用RF算法建立預(yù)測(cè)模型,并通過外部驗(yàn)證模型的分類效果,發(fā)現(xiàn)預(yù)測(cè)模型對(duì)于直腸癌T分期具有良好的判別能力,有助于為個(gè)體化治療直腸癌提供依據(jù)。
F1值是一個(gè)新的機(jī)器學(xué)習(xí)指標(biāo),F(xiàn)1值是精確率和召回率的加權(quán)平均值,最佳F1值為1,最差為0。Brier值是衡量概率校準(zhǔn)的參數(shù),Brier分?jǐn)?shù)越低,預(yù)測(cè)校準(zhǔn)越好。本研究中訓(xùn)練組和驗(yàn)證組中F1值分別為0.861、0.829,Brier值分別為0.149、0.159,顯示模型具有良好的診斷效能和較高的可預(yù)測(cè)性。
本研究的局限性:①影像組學(xué)依賴于“大數(shù)據(jù)”,而此項(xiàng)單中心隊(duì)列研究樣本量相對(duì)較小,需要更大樣本量的多中心試驗(yàn)加以驗(yàn)證;②本組數(shù)據(jù)T1與T4期患者的數(shù)量不均衡,可能導(dǎo)致T分期的分組偏倚;③本研究為回顧性研究,存在不可避免的選擇偏倚;④影像組學(xué)的中心假設(shè)是基于該方法可以描述腫瘤的異質(zhì)性,并通過醫(yī)學(xué)圖像捕獲,從而輔助評(píng)估腫瘤的生物特性,但本研究無法獲得腫瘤的異質(zhì)性。
綜上所述,基于T2WI提取的影像組學(xué)特征術(shù)前判定直腸癌T分期具有可行性。