韓 冬,于 楠,張喜榮,吳宏培,任 革,呂蕊花,李 晨,賀太平*
(1.陜西中醫(yī)藥大學附屬醫(yī)院醫(yī)學影像科,3.病理科,陜西 咸陽 712021;2.陜西中醫(yī)藥大學醫(yī)學技術學院,陜西 咸陽 712046)
腎癌各亞型中,腎透明細胞癌(clear-cell renal cell carcinoma, ccRCC) 預后相對較差[1-2]。術前腫瘤分級對預測ccRCC預后和制定治療方案具有重要意義[3]。國際泌尿病理協(xié)會(International Society for Urology and Pathology, ISUP)新近發(fā)布了WHO/ISUP分級系統(tǒng),以取代Fuhrman核分級系統(tǒng)[4-5]。增強CT是早期發(fā)現(xiàn)及診斷腎腫瘤的最常用影像學方法[6],但評價腎腫瘤組織級別存在一定不穩(wěn)定性。影像組學[7-9]為腫瘤研究提供了新視角。本研究比較增強CT模型與影像組學模型預測ccRCC WHO/ISUP級別的效能。
1.1 一般資料 回顧性分析2014年3月—2019年12月131例經病理確診ccRCC患者,男86例,女45例,年齡26~88歲,平均(61.6±11.6)歲。納入標準:腹部增強CT及臨床資料完整。排除標準:①CT圖像質量差;②腫瘤呈浸潤性生長,在圖像中難以分割;③CT檢查前曾接受相關治療。按3∶2比例分層抽樣,將患者分為訓練集(n=78)和驗證集(n=53)。根據2016版腎癌WHO/ISUP病理分級標準定義Ⅰ~Ⅱ級為低級別、Ⅲ~Ⅳ級為高級別ccRCC;訓練集中、驗證集中分別包括55例低級別、23例高級別和37例低級別、16例高級別ccRCC。
1.2 儀器與方法 采用能譜GE Discovery CT 750HD 儀,能譜成像模式,行腹部CT平掃和動態(tài)增強掃描,管電流315 mAs,管電壓140 kV/80 kV瞬時切換,轉速0.5 s/r,螺距1.375:1。平掃后以流率3.5~4.0 ml/s靜脈注射對比劑碘海醇(300 mgI/ml)450 mgI/kg體質量,行皮質期、髓質期及排泄期增強掃描。
1.3 圖像分析 由2名分別具有6年和8年腹部影像學診斷經驗的主治醫(yī)師觀察圖像,有分歧時經協(xié)商決定,包括腫瘤位置、大小,是否浸潤生長,有無包膜、壞死、囊變、鈣化,腫瘤內血管、腎周脂肪侵犯、靜脈瘤栓、區(qū)域淋巴結腫大、遠處轉移及強化方式(均勻、不均勻、是否快進快出等)。
1.4 提取影像組學特征 由另1名具有6年經驗的主治醫(yī)師采用ITK-Snap (v.3.60)軟件逐層勾畫皮質期圖像中腎癌局部感興趣體積(volume of interest, VOI),包含壞死、囊變、包膜及鈣化區(qū)域,避開瘤外組織、腫瘤以外供血血管及腹膜后/腎門腫大淋巴結,保存為VOI1;2個月后由同一醫(yī)師手動修正,保存為VOI2,見圖1。采用GE A.K.軟件分別提取VOI1和VOI2的影像組學特征,包括直方圖、灰度共生矩陣、灰度大小區(qū)域矩陣、灰度行程矩陣及形狀。
1.5 建立模型及統(tǒng)計學分析 采用R語言(v.3.6.2)及SPSS 25.0統(tǒng)計分析軟件,對數(shù)據行K-S檢驗觀察其分布,以Levene's檢驗評價數(shù)據方差齊性。以±s表示,符合正態(tài)分布的計量資料,行獨立樣本t檢驗;對計數(shù)資料以Fisher精確概率法進行比較。采用組內相關系數(shù)(intra-class correlation coefficient,ICC)評價VOI1與VOI2影像組學特征的一致性,ICC>0.75為一致性好。以最小絕對收縮與選擇算子(the least absolute shrinkage and selection operator, LASSO)篩選鑒別低、高級別ccRCC的最佳影像組學特征,計算其影像組評分(radiomics score, RS)。以二元Logistic回歸分析構建基于增強CT及影像組學特征預測ccRCC級別模型,繪制列線圖,可視化回歸分析結果;評價模型中各影響因素鑒別低、高級別ccRCC的貢獻程度,獲得總得分及相應高級別ccRCC概率。以病理分級為金標準,繪制受試者工作特征(receiver operating characteristic, ROC)曲線,計算曲線下面積(area under the curve, AUC);以H-L檢驗評價2個模型在訓練集的校準度,以Delong檢驗比較其AUC差異。應用決策曲線分析(decision curve analysis, DCA)評價模型的凈獲益。P<0.05為差異有統(tǒng)計學意義。
表1 訓練集低、高級別ccRCC患者一般資料及增強CT表現(xiàn)
表2 驗證集低、高級別ccRCC患者一般資料及增強CT表現(xiàn)
訓練集及驗證集低、高級別ccRCC患者一般資料及增強CT表現(xiàn)見表1、2。
2.1 構建增強CT模型及驗證 2次提取的影像組學特征一致性好(ICC均>0.75,P均<0.05)。以簡化病理分級為因變量,納入訓練集低、高級別ccRCC間差異有統(tǒng)計學意義的變量行二元Logistic回歸分析,腫瘤浸潤生長[OR 4.73(1.18,18.96)]、包膜[OR 0.15(0.04,0.60)]和壞死[OR 8.01(1.50,42.76)]是影響ccRCC級別的獨立因素(P均<0.05),其列線圖見圖2。增強CT模型預測訓練集ccRCC級別的AUC為0.89[95%CI(0.80,0.97)],敏感度為0.83,特異度為0.84;模型的校準度佳(χ2=3.65,P=0.16);其驗證集中的AUC為0.76[95%CI(0.61,0.91)],敏感度為0.56,特異度為0.87。
2.2 構建影像組學模型及驗證 共提取396個影像組學特征,經LASSO回歸及交叉驗證確定最優(yōu)超參數(shù)lnλ為-3.27,篩選出16個影像組學特征,根據其系數(shù)的線性加權計算RS。以病理分級為因變量,將RS納入二元Logistic回歸分析,結果顯示RS是影響ccRCC級別的獨立危險因素[OR 16.40(3.36,80.05),P<0.01],其列線圖見圖3。影像組學模型預測訓練集ccRCC級別的AUC為0.98[95%CI(0.95,0.99)],敏感度為0.96,特異度為0.91,其校準度較好(χ2=1.08,P=1.00);驗證集AUC為0.85[95%CI(0.72,0.97)],敏感度為0.75,特異度為0.84。
圖1 患者女,55歲,左腎Ⅱ級 ccRCC A.增強CT示左腎上極腫塊,可見包膜(黑箭),腫瘤內見血管影(白箭),腎門淋巴結腫大(綠箭); B.于皮質期增強圖像中逐層勾畫病灶(綠色區(qū)域); C.病灶VOI
圖2 增強CT模型的列線圖
圖3 影像組學模型的列線圖
圖4 影像組學及增強CT模型的DCA圖
2.3 模型比較 訓練集中,影像組學模型的AUC大于增強CT模型(Z=2.05,P<0.05),驗證集中二者AUC差異無統(tǒng)計學意義(Z=0.95,P=0.34)。DCA顯示高風險概率閾值為0.08~1.00時,影像組學模型的凈獲益高于增強CT模型,見圖4。
目前對局限性ccRCC有多種保守治療方案,臨床需依據腫瘤生物學特性制定治療方案。CT征象可為ccRCC分級提供信息。多項研究[10-11]結果顯示,增強CT所示腫瘤邊緣、壞死、鈣化、大小、囊變、集合系統(tǒng)/腎周脂肪侵犯、區(qū)域淋巴結腫大、強化方式及強化均勻性是影響ccRCC分級的危險因素。浸潤性生長反映腫瘤惡性程度更高[11]。在本研究得出的增強CT模型中,腫瘤呈浸潤性生長、有無包膜和壞死是ccRCC分級的獨立影響因素。發(fā)生凝固性壞死是影響ccRCC預后的因素,2013年ISUP共識會議[5]認為病理報告應常規(guī)描述ccRCC是否存在壞死,出現(xiàn)壞死提示預后不良[12-13];但CHEN等[14]發(fā)現(xiàn)以病灶壞死預測高級別ccRCC敏感度高(100%)而特異度差(40%)。本研究訓練集及驗證集中不同級別ccRCC增強CT表現(xiàn)差異不完全一致,可能與驗證集樣本量較小有關,且閱片醫(yī)師主觀分析圖像得出的CT表現(xiàn)存在不穩(wěn)定性,可降低模型泛化能力。
壞死、出血或鈣化等特征可反映ccRCC生物學行為,與其級別存在相關性,故本研究勾畫VOI時未予剔除。腫瘤壞死或出血成分較多提示其級別更高,腫瘤直方圖會整體左偏;出現(xiàn)鈣化時直方圖會向右偏;若二者同時存在,直方圖會出現(xiàn)雙峰或多峰;上述成分在直方圖定量參數(shù)及更高階特征中亦有所體現(xiàn),從而影響影像組學參數(shù)值。本研究發(fā)現(xiàn)RS是ccRCC分級的獨立危險因素,而影像組學模型的診斷效能較增強CT模型更佳;影像組學模型預測訓練集及驗證集低、高級別ccRCC的區(qū)分度和校準度均較高;其在訓練集的AUC大于增強CT模型,而驗證集中2個模型的AUC差異無統(tǒng)計學意義,表明其在驗證集的區(qū)分度相近。影像組學模型在訓練集及驗證集的敏感度均高于增強CT模型,其在訓練集的特異度高于增強CT模型,但在驗證集較之稍低,表明影像組學模型預測ccRCC的真陽性率優(yōu)于增強CT模型;DCA顯示高風險概率閾值為0.08~1.00時,影像組學模型的凈獲益高于增強CT模型。
本研究的主要局限性:①僅針對皮質期增強圖像進行分析;②Ⅳ級ccRCC樣本量較少,結果可能存在偏倚;③WHO/ISUP分級多針對手術標本,而本組部分ccRCC病理分級系經穿刺活檢標本證實,小標本及腫瘤異質性對其準確性仍存在挑戰(zhàn)[15]。
總之,影像組學模型預測ccRCC WHO/ISUP分級的效能優(yōu)于增強CT模型。