彭愛琴, 費正東, 張阿娥, 湯 德
(徐州醫(yī)科大學附屬沭陽醫(yī)院醫(yī)學影像科,沭陽 223600)
鼻咽癌(nasopharyngeal carcinoma,NPC)是頭頸部常見的惡性腫瘤之一,手術(shù)及放化療可顯著提高NPC 復發(fā)的局部控制率及5 年生存率[1-3]。但其復發(fā)風險仍然很高,并已成為制約NPC 良好預后的關(guān)鍵因素[4-5]。已有研究[6-7]證實,病變區(qū)惡變是NPC 復發(fā)的核心機制,明晰局部組織的病理改變以及征象具備良好的預測價值。相較于傳統(tǒng)的鼻咽鏡對局部組織的活檢,在體成像技術(shù)尤其是磁共振成像(MRI)具有組織分辨率高、能多方位成像等優(yōu)點,已成為NPC 病情評估、腫瘤分期以及復發(fā)監(jiān)測的首選手段[8-9]。但依托MRI對NPC 復發(fā)的預測價值仍然不高。因此,本研究采用圖像定量分析技術(shù)——影像組學,以NPC 患者的MRI 影像組學特征構(gòu)建放化療后復發(fā)的預測模型并探索其性能[10],以期為臨床監(jiān)測NPC 的復發(fā)提供新的思路和方法。
收集沭陽醫(yī)院2016 年2 月至2020 年2 月門診及住院的116 例NPC 患者資料。納入標準:1)均為初診NPC 患者;2)病理診斷確診為NPC;3)經(jīng)??漆t(yī)師評估為NPC Ⅲ~Ⅳb 期[11];4)患者均已接受過系統(tǒng)的放化療治療;5)治療結(jié)束后均行鼻咽部CE-MRI 檢查;6)具備完整的MRI 影像資料和臨床資料。排除標準:1)治療后療效未達部分緩解(PR)或完全緩解(CR)的患者;2)獲得的MRI 圖像存在顯著偽影或部分圖像缺失情況的患者。治療方案包括聯(lián)合同步放化療(鉑類化療藥物)、單純放療(總劑量75~83 Gy,分30~36 次照射)以及聯(lián)合誘導化療[順鉑(DDP)+5-氟尿嘧啶(5-FU)+四氫葉酸(THFA)+左亞葉酸鈣(L-LV)]。根據(jù)2 年內(nèi)隨診的復發(fā)情況將患者分為復發(fā)組與未復發(fā)組,復發(fā)組52 例,其中男性44 例,女性8 例,平均年齡(51.4±10.2)歲;未復發(fā)組64 例,其中男性42 例,女性22 例,平均年齡(45.3±12.1)歲。本研究通過沭陽醫(yī)院倫理委員會批準(SYYY2022KS040),獲得所有受試者書面知情同意。
受試者掃描在配以8 通道相控陣頭頸聯(lián)合線圈的西門子3.0T MR 儀器上執(zhí)行。以雙側(cè)海綿墊填充固定受試者頸部,掃描范圍為顱底至胸廓入口。T1WI 增強序列參數(shù):根據(jù)受試者體質(zhì)量,經(jīng)肘靜脈注射0.2 mL·kg-1(或0.1 mmol·kg-1)釓噴酸葡胺注射液(Gd-DTPA);重復時間(repetition time,TR)=500 ms,回波時間(echo time,TE)=8.5 ms,不見野(field of view,F(xiàn)OV)=250 mm×250 mm,層厚=5.0 mm,層間距=1.0 mm,掃描時間為185 s。所有受試者的圖像(平衡期)采集完成后自影像科的影像存儲與傳輸系統(tǒng)(PACS)導出,并以DICOM 格式保存于DVD 光盤中,用于后續(xù)分析。
由本科室1 名高年資醫(yī)師(具有10 年行業(yè)經(jīng)驗)利用3D Slicer(https://www.slicer.org)圖像處理平臺的圖像編輯工具勾畫受試者MR 圖像的感興趣區(qū)(region of interest,ROI)。根據(jù)Xu 等[12]的方法對待分析的圖像進行灰白度歸一化處理,后基于python 3.6.8(https://www.python.org)中的pyradiomics(http://www.radiomics.io/pyradiomics.html)模塊實施組學特征提取,包括一階統(tǒng)計類(灰度層面描述)、形狀描述類(ROI 的形狀和大?。⒓y理類(量化ROI 的異質(zhì)性差異),以及小波(Wavelet)變換類[包括LLL(low-low-low),HHH(high-high-high),HLL(high-low-low),HHL(highhigh-low),LLH(low-low-high),HLH(high-lowhigh),LHL(low-high-low)以及LHH(low-highhigh)]。
影像組學特征的篩選由R 4.0.0 執(zhí)行,其中irr 包用于類內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)的計算,glmnet 包用于重要性特征的篩選[13]。以ICC<0.9 排除重復性較低的組學特征,隨后采用Lasso 回歸法(最小絕對收縮和選擇算子)實施進一步特征選擇,其主要步驟為在回歸系數(shù)的絕對值之和小于1 個常數(shù)的約束條件下,使殘差平方和最小化,從而能夠產(chǎn)生回歸系數(shù)。最終被選擇的特征子集用于復發(fā)組和未復發(fā)組之間的差異性篩選和預測模型的構(gòu)建。
采用SPSS 23.0 統(tǒng)計學軟件進行數(shù)據(jù)分析。采用Shapiro-Wilk test 和Levene’s test 分別對數(shù)據(jù)進行正態(tài)性檢驗和方差齊性檢驗。符合正態(tài)分布的計量資料采用均數(shù)±標準差(±s)表示,兩組間的比較采用獨立樣本t 檢驗。偏態(tài)分布的計量資料以M(Q1,Q3)表示,組間比較采用Mann-Whitney U 檢驗。計數(shù)資料采用頻數(shù)表示,組間比較采用χ2檢驗或Fisher 確切概率法。以Logistic回歸評價組學特征與NPC 復發(fā)的關(guān)系。繪制受試者工作特征(ROC)曲線并以AUC、靈敏度、特異度作為預測性能的評價指標。P≤0.05 為差異有統(tǒng)計學意義。
與未復發(fā)組相比,NPC 復發(fā)組年齡更高(t=2.894,P<0.01)和男性占比更多(χ2=5.396,P<0.05)。兩組患者體質(zhì)量指數(shù)(BMI)、臨床分期、病理類型以及平均放療劑量和放療次數(shù)比較差異均無統(tǒng)計學意義(P 均>0.05)。兩組主要病理學類型均為非角化型未分化型,其中復發(fā)組的復發(fā)間隔時間為6~22 個月,中位時間為14 個月。見表1。
表1 兩組受試者的一般資料比較
基于MR 增強圖像解析,共計851 個定量影像組學特征被獲取。根據(jù)組學特征的ICC 值選擇(ICC<0.9),130 個高重復性特征被初步篩選,見圖1。降維后的特征經(jīng)Lasso 回歸算法篩選進一步保留了12 個重要的組學特征,分別為小波(Wavelet)變換類Wavelet-LHH-Strength,Wavelet-HLLKurtosis,Wavelet-HLH-DiffEntropy,Wavelet-HLHAutocorr,Wavelet-HLL-DiffVar,Wavelet-HLLLargeAreaEmp,Wavelet-HLL-Idmn,Wavelet-HLLSkewness,Wavelet-HLL-LargeDepEmp,Wavele-HLL-SumEntropy,Wavelet-HLL-DepEntropy,Wavelet-HLL-LongRunEmp,見圖2。
圖1 ICC 特征的選擇
圖2 Lasso 二元邏輯回歸模型的特征選擇
與未復發(fā)組相比,復發(fā)組中的Wavelet-HLLKurtosis(U=513,P=0.000 1)、Wavelet-HLH-DifferenceEntropy(U=728,P=0.003 8)、Wavelet-HLHAutocorrelation(U=752,P=0.004 5)、Wavelet-HLLLargeDependenceEmphasis(U=745,P=0.003 8)、Wavelet-HLL-LongRunEmphasis(U=644,P=0.000 2)差異有統(tǒng)計學意義,其余7 個特征之間差異無統(tǒng)計學意義(P 均>0.05),見圖3、圖4。
圖3 Mann-Whitney U 檢驗進行組學特征的差異性比較
圖4 基于組學特征預測NPC 復發(fā)
以差異性組學特征納入Logistic 回歸分析,建立聯(lián)合檢測曲線,預測結(jié)果為狀態(tài)變量復發(fā)或未復發(fā),并生成ROC 曲線。5 個指標中,除Wavelet-HLL-Kurtosis 特征外,均顯示出滿意的效能;其中Wavelet-HLL-LargeDependenceEmphasis 的預測模型擬合度最佳,AUC 為0.755(95% CI:0.657~0.837),靈敏度為82.15%(95% CI:73.12~92.04),特異度為51.62%(95% CI:41.03~63.65)。當4 個特征聯(lián)合構(gòu)建后,其聯(lián)合診斷效能顯著提升,AUC為0.902(95% CI:0.824~0.953),靈敏度為74.07%(95% CI:60.33~85.04),特異度為92.86%(95% CI:80.52~98.56)。見表2。
表2 組學預測NPC 復發(fā)的模型性能
復發(fā)甚至伴發(fā)轉(zhuǎn)移是NPC 最嚴重的不良結(jié)局,早期預測并針對性防治無疑是改善NPC 預后的最有力措施。本研究成功地對NPC 患者的增強MRI T1WI 圖像實施了影像組學特征提?。?51 個),通過降維和篩選得到了與NPC 復發(fā)相關(guān)的12 個特征,并證實復發(fā)組和未復發(fā)組的5個重要影像組學特征(Wavelet-HLL-Kurtosis,Wavelet-HLH-DifferenceEntropy,Wavelet-HLHAutocorrelation,Wavelet-HLL-LargeDependenceEmphasis,Wavelet-HLL-LongRunEmphasis) 在基線時存在顯著的組間差異。進一步的結(jié)果顯示,除Wavelet-HLL-Kurtosis 外的其余4 個特征可作為NPC 復發(fā)的獨立預測因子。本研究結(jié)果不僅可作為NPC 復發(fā)研究工作中的重要補充,同時為NPC 復發(fā)的臨床防治工作提供了進一步的理論依據(jù)和參考。
相較于NPC 發(fā)病風險和機制的探索,關(guān)于NPC 復發(fā)的預測研究稍顯滯后。Wang 等[14]通過微陣列分析,發(fā)現(xiàn)NPC 患者治療后血漿miR-214-3p 表達逐漸下降,并通過Kaplan-Meier 生存曲線分析證實預處理前miR-214-3p 的高表達(≥3.12)可以有效預測NPC 復發(fā);Raghavan等[15]基于圖像紋理分析技術(shù)對58 例接受放化療后的NPC 患者MR 圖像進行分析,證實紋理特征對預測NPC 復發(fā)的效能(AUC)為0.79,其靈敏度和特異度分別為0.73 和0.71。與這些報道相比,本研究的預測模型有無創(chuàng)便捷性和預測效能平衡的優(yōu)勢, 僅在受試者治療后的單次MR 成像即可完成預測模型中的自變量采集,有力規(guī)避了血指標或生物學指標所依賴的多時間節(jié)點的有創(chuàng)收集;另外,與反映表面特性的紋理分析技術(shù)相比,影像組學能夠在傅里葉變換基礎上進一步考慮頻域和時域的拆解,這是本研究模型效能顯著高于紋理模型效能的原因。
影像組學的本質(zhì)為基于醫(yī)學圖像對大量的影像數(shù)據(jù)進行數(shù)字化的定量高通量分析[16-17],得到高保真目標信息以綜合評價腫瘤的各種表型、組織形態(tài)、細胞分子、基因遺傳等各層次信息[18]。盡管本研究提取的851 個組學特征涵蓋了包括一階統(tǒng)計類、紋理類以及小波(Wavelet)變換類三大類數(shù)據(jù),但差異性的特征有趣地集中分布在Wavelet 類中的紋理子類而不涉及一階子類,提示NPC 復發(fā)的圖像驅(qū)動可能與病變區(qū)域內(nèi)體素強度的分布無關(guān),而是與深度隱藏在濾波解析后的體素區(qū)域性和統(tǒng)計特征尺度有關(guān)。正如本研究結(jié)果所呈現(xiàn)的4 個差異性特征(Wavelet-HLHDifferenceEntropy,Wavelet-HLH-Autocorrelation,Wavelet-HLL-LargeDependenceEmphasis,Wavelet-HLL-LongRunEmphasis)分別代表著圖像中的熵差(能量退化)、自相關(guān)(信號與自身的延遲信號相乘后的乘積)、最大的“依賴”元素數(shù)目(GLDM每個元素除以GLDM 所有元素之和得到每個元素的頻率)以及長游程因子(圖像光滑/粗糙)。這些特異性特征共同效應了源圖像中NPC 治療后失調(diào)控增殖的瘤體細胞(復發(fā))在ROI 中的增殖程度和范圍。
但本研究仍存在局限性。首先,單中心的病例收集限制了入組的樣本數(shù)量。其次,基于2 年的隨訪周期可能會抑制預測模型在實際應用中的重復性(假陰性)。最后,人工勾畫的ROI 可能存在病灶邊緣信息丟失,引入深度學習及人工智能等自動分割手段或可獲得更為準確的ROI 范圍。