唐玉洪, 鄭嘉祺, 王 煥, 王 斌, 孫希文, 艾自勝
(1. 同濟(jì)大學(xué)醫(yī)學(xué)院醫(yī)學(xué)統(tǒng)計(jì)教研室,上海 200092; 2. 同濟(jì)大學(xué)附屬上海市肺科醫(yī)院影像科,上海 200433)
磨玻璃結(jié)節(jié)(ground glass nodule, GGN)主要指在CT上表現(xiàn)為云霧狀的薄影/圓形結(jié)節(jié)。研究[1]發(fā)現(xiàn),GGN以肺腺癌(lung adenocarcinoma, LUAD)居多。肺癌按照組織學(xué)分為小細(xì)胞肺癌和非小細(xì)胞肺癌,肺腺癌屬于非小細(xì)胞肺癌[2]。它主要生長(zhǎng)于肺邊緣小支氣管的黏液腺,可以有腺泡、乳頭、細(xì)支氣管肺泡或?qū)嵭陨L(zhǎng)方式[2]。2015年世界衛(wèi)生組織將肺腺癌的病理類型重新劃分為: 非典型腺瘤樣增生(atypical adenomatous hyperplasia, AAH)、原位癌(adenocarcinoma in situ, AIS)、微小浸潤(rùn)腺癌(minimally invasive adenocar-cinoma, MIA)和浸潤(rùn)性腺癌(invasive adenocar-cinoma, IA)[1,3-4]。浸潤(rùn)前病變包括原位腺癌和非典型腺瘤樣增生,浸潤(rùn)病變包括微小浸潤(rùn)腺癌和浸潤(rùn)性腺癌。GGN的侵襲性直接影響到患者的術(shù)后無(wú)病生存期[5]。影像組學(xué)是提取大量可以表征圖像內(nèi)部特征的醫(yī)學(xué)圖像技術(shù)[6]。目前,病理檢查依舊是診斷肺腺癌的金標(biāo)準(zhǔn)。利用影像組學(xué)可以實(shí)現(xiàn)非侵入式診斷疾病,既往研究的2D圖像特征僅從水平面提取。單一平面提取的2D影像組學(xué)特征無(wú)法全面描述整個(gè)瘤體特征,并且不同模型構(gòu)建的影像組學(xué)標(biāo)簽可能存在差異性。本研究將從水平面、冠狀面、矢狀面3個(gè)不同視圖分別提取影像組學(xué)特征結(jié)合不同機(jī)器學(xué)習(xí)模型構(gòu)建影像組學(xué)標(biāo)簽,探討其對(duì)GGN侵襲性的評(píng)估價(jià)值。
本研究回顧性分析同濟(jì)大學(xué)附屬上海市肺科醫(yī)院2013年11月—2018年9月經(jīng)手術(shù)石蠟病理證實(shí)為肺腺癌,CT上表現(xiàn)為GGN的患者。納入標(biāo)準(zhǔn): (1) 患者手術(shù)前1個(gè)月內(nèi)有薄層CT;(2) 對(duì)于多發(fā)病灶,術(shù)后病理結(jié)果可以與CT圖像對(duì)應(yīng);(3) 病灶直徑≤3cm;(4) CT層厚為≤2mm;(5) 經(jīng)過手術(shù)病理證實(shí)為早期肺腺癌;(6) 薄層CT上無(wú)明顯空洞。排除標(biāo)準(zhǔn): (1) 患者術(shù)前已經(jīng)進(jìn)行過肺部手術(shù);(2) 患者CT存在偽影或影像質(zhì)量不符合要求;(3) 患者CT部分序列層丟失,重建圖像不完整;(4) 患者病灶過小,無(wú)法有效提取影像特征。根據(jù)PASS 11.0軟件(美國(guó)NCSS公司),在AUC(area under the curve)取0.8下,研究所需樣本量為208例(δ為0.1,α為0.05,β為0.10)。根據(jù)入選排除標(biāo)準(zhǔn)后,研究共納入患者220例,磨玻璃結(jié)節(jié)222例。其中,不典型增生32例,原位癌65例,微浸潤(rùn)腺癌55例,浸潤(rùn)性腺癌70例。從病例報(bào)告系統(tǒng)中收集患者的年齡、性別、家族史、婚姻情況、高血壓史、糖尿病史、冠心病史、既往腫瘤史、吸煙飲酒史等臨床信息。
CT掃描均使用西門子64排或飛利浦40排螺旋CT。掃描參數(shù): 螺距1.2,掃描顯示野350mm,矩陣512×512,準(zhǔn)直寬度128mm×0.6mm,管電流150~200As;掃描層厚5mm,重建層厚1mm或 2mm;掃描方法: 均取患者仰臥位、雙臂上舉、頭部先進(jìn),掃描范圍為肺尖到肺底,包括腋窩及兩側(cè)鎖骨上區(qū)。
所有的Dicom圖像均導(dǎo)入開源軟件3D Slicer 4.8.1(URL: https:∥www.slicer.org/)。由2名放射科醫(yī)生進(jìn)行VOI(volume of interest)區(qū)域標(biāo)注,并保存為NIFTI格式。分別從VOI區(qū)域的水平面、冠狀面和矢狀面3個(gè)視圖的中間層面提取影像組學(xué)特征。使用Python語(yǔ)言對(duì)中間層面ROI(region of interest)區(qū)域進(jìn)行高斯濾波降噪,利用大律法(Otsu法)和連通區(qū)域法對(duì)病灶進(jìn)行自動(dòng)化分割提取。通過灰度直方圖法,每個(gè)視圖提取13個(gè)組學(xué)特征;灰度共生矩陣法(grey level co-matrix, GLCM),選取0°、45°、90°和135°的方向,每個(gè)視圖每個(gè)方向提取21個(gè)GLCM特征;通過灰度行程矩陣(grey level run length matrix, GLRLM),選取0°、45°、90°和135°的方向,每個(gè)視圖每個(gè)方向提取11個(gè)GLRLM特征;利用灰度區(qū)域大小矩陣(grey level size zone matrix, GLSZM),每個(gè)視圖提取11個(gè)特征;利用多重灰度區(qū)域大小矩陣(multiple grey level size zone matrix, MGLSZM),每個(gè)視圖提取11個(gè)特征。最終影像組學(xué)特征用2名放射科醫(yī)生標(biāo)注ROI區(qū)域所提取特征的均值代替。每個(gè)視圖共提取163個(gè)影像組學(xué)特征,3個(gè)視圖共提取了489個(gè)影像組學(xué)特征。
使用Python編程語(yǔ)言3.6(http:∥www.python.org)和R編程語(yǔ)言3.5.3(http:∥www.R-project.org)進(jìn)行圖像分割、影像組學(xué)特征提取、統(tǒng)計(jì)學(xué)分析和模型建立。影像組學(xué)標(biāo)簽1采用3個(gè)視圖單模型構(gòu)建(least absolute shrinkage and selection operator,LASSO回歸模型),影像組學(xué)標(biāo)簽2、3、4分別采用冠狀面視圖多模型構(gòu)建LASSO回歸模型、梯度提升決策樹模型(gradient boosting decision tree, GBDT)和樸素貝葉斯模型(naive Bayes)),影像組學(xué)標(biāo)簽5采用矢狀面視圖單模型構(gòu)建(GBDT模型),影像組學(xué)標(biāo)簽6采用水平面視圖單模型構(gòu)建(樸素貝葉斯模型)。采用Wilcoxon檢驗(yàn)(WLCX)、Pearson相關(guān)檢驗(yàn)和Relief特征選擇法進(jìn)行降維。采用LASSO回歸、GBDT和樸素貝葉斯構(gòu)建GGN侵襲性分類模型。采用分層隨機(jī)抽樣的方式選取75%的數(shù)據(jù)作為訓(xùn)練集,25%的數(shù)據(jù)作為驗(yàn)證集。采用10折交叉驗(yàn)證法進(jìn)行分類器模型參數(shù)調(diào)優(yōu)。不同視圖間影像組學(xué)特征差異性分析采用Friedman檢驗(yàn)。兩組間差異性比較采用t檢驗(yàn)、χ2檢驗(yàn)或Fisher精確檢驗(yàn)。ROC曲線差異性分析采用Delong檢驗(yàn)。P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
220名患者中,男性64名,女性156名。浸潤(rùn)前病變組和浸潤(rùn)性病變組間年齡和糖尿病史差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見表1。
表1 肺腺癌患者基本臨床特征
注: —,F(xiàn)isher精確檢驗(yàn),無(wú)統(tǒng)計(jì)量
全視圖單模型影像組學(xué)標(biāo)簽采用水平面、冠狀面和矢狀面3個(gè)視圖影像組學(xué)特征,通過WLCX+ LASSO模型來構(gòu)建(影像組學(xué)標(biāo)簽1)。共有353個(gè)影像組學(xué)特征通過Wilcoxon檢驗(yàn)(P<0.05)。采用Pearson相關(guān)檢驗(yàn)剔除高度相關(guān)自變量,以相關(guān)系數(shù)0.6為閾值,共有332個(gè)影像組學(xué)特征存在相關(guān)性。剩余21個(gè)影像組學(xué)特征納入LASSO模型進(jìn)行影像組學(xué)標(biāo)簽1的構(gòu)建。LASSO模型結(jié)果顯示,僅有11個(gè)影像組學(xué)特征用于構(gòu)建影像組學(xué)標(biāo)簽1。影像組學(xué)標(biāo)簽1的診斷準(zhǔn)確率和Kappa值見表2,AUC面積見圖1。
單視圖多模型影像組學(xué)標(biāo)簽采用冠狀面視圖影像組學(xué)特征,分別通過WLCX+LASSO、WLCX+GBDT和Relief+樸素貝葉斯3個(gè)模型來構(gòu)建(影像組學(xué)標(biāo)簽2、影像組學(xué)標(biāo)簽3和影像組學(xué)標(biāo)簽4)。對(duì)于影像組學(xué)標(biāo)簽2和影像組學(xué)標(biāo)簽3,有126個(gè)特征通過Wilcoxon檢驗(yàn),在GGN浸潤(rùn)前和浸潤(rùn)性病變兩組間存在差異(P<0.05)。以0.6的相關(guān)系數(shù)為閾值,73個(gè)特征被納入LASSO回歸模型用于構(gòu)建影像組學(xué)標(biāo)簽2。126個(gè)特征全部納入GBDT模型構(gòu)建影像組學(xué)標(biāo)簽3。影像組學(xué)標(biāo)簽4共有76個(gè)特征的Relief評(píng)分大于0.02,這76個(gè)特征全部納入樸素貝葉斯模型用于構(gòu)建影像組學(xué)標(biāo)簽4。3個(gè)影像組學(xué)標(biāo)簽具體準(zhǔn)確率和Kappa值見表2,AUC面積見圖1。
每個(gè)視圖共提取了163個(gè)影像組學(xué)特征。有69個(gè)特征在不同視圖下差異具有統(tǒng)計(jì)學(xué)意義(P<0.05,F(xiàn)riedman檢驗(yàn))。
影像組學(xué)標(biāo)簽5采用矢狀面影像組學(xué)特征,結(jié)合WLCX+GBDT模型來構(gòu)建。共有103個(gè)影像特征在結(jié)節(jié)浸潤(rùn)前和浸潤(rùn)性病變組間差異具有統(tǒng)計(jì)學(xué)意義(P<0.05),其中,GBDT選擇了71個(gè)特征用于構(gòu)建影像組學(xué)標(biāo)簽5。模型準(zhǔn)確率和Kappa值見表2,AUC面積見圖1。影像組學(xué)標(biāo)簽6采用水平面影像組學(xué)特征,結(jié)合Relief+樸素貝葉斯模型來構(gòu)建。通過Relief特征選擇法后,選取權(quán)重>0.02的特征,共有78個(gè)特征被納入之后的樸素貝葉斯分類模型中。模型準(zhǔn)確率和Kappa值見表2,AUC面積見圖1。
表2 影像組學(xué)標(biāo)簽準(zhǔn)確率
影像組學(xué)標(biāo)簽1~6分別是不同視圖結(jié)合不同模型構(gòu)建的用于預(yù)測(cè)GGN侵襲性的診斷指標(biāo),本研究采用各模型的預(yù)測(cè)概率作為影像組學(xué)標(biāo)簽的值。圖1為6個(gè)影像組學(xué)標(biāo)簽在全集、訓(xùn)練集和驗(yàn)證集上的AUC面積及其95%CI。從圖1中看出影像組學(xué)標(biāo)簽1~6在全集和訓(xùn)練集上的AUC面積和95%CI下限都超過了0.8。在全集、訓(xùn)練集和驗(yàn)證集上,影像組學(xué)標(biāo)簽5的AUC面積最高;在驗(yàn)證集上,基于樸素貝葉斯模型的影像組學(xué)標(biāo)簽4和影像組學(xué)標(biāo)簽6相較于其他影像組學(xué)標(biāo)簽而言,AUC面積較低(圖1)。
對(duì)于LASSO回歸模型而言,全視圖影像組學(xué)特征與冠狀面視圖影像組學(xué)特征的AUC面積在全集、訓(xùn)練集和驗(yàn)證集上差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),見圖2。同一視圖下,不同模型構(gòu)建的影像組學(xué)標(biāo)簽AUC面積存在差異;在全集和訓(xùn)練集上,影像組學(xué)標(biāo)簽3的AUC面積大于影像組學(xué)標(biāo)簽2和影像組學(xué)標(biāo)簽4(P<0.05),見圖3。不同視圖下,不同模型構(gòu)建的影像組學(xué)標(biāo)簽在全集和訓(xùn)練集下的AUC面積也存在差異,影像組學(xué)標(biāo)簽5的AUC面積>影像組學(xué)標(biāo)簽2與影像組學(xué)標(biāo)簽6(P<0.05),見圖4。不同視圖下,GBDT構(gòu)建的影像組學(xué)標(biāo)簽在全集和訓(xùn)練集也存在差異(P<0.05),影像組學(xué)標(biāo)簽5的AUC面積大于影像組學(xué)標(biāo)簽3。影像組學(xué)標(biāo)簽5在GGN浸潤(rùn)前與浸潤(rùn)性組間差異具有統(tǒng)計(jì)學(xué)意義(W=64,P<0.05),在驗(yàn)證集上AUC面積為0.914(95%CI: 0.836~0.992),靈敏度為79.17%,特異度為90.32%。
圖1 影像組學(xué)標(biāo)簽在全集、訓(xùn)練集和驗(yàn)證集下AUC面積與95%CIFig.1 The forest plot of AUC and 95%CI of radiomics signature scores in full dataset, training set and validation set
圖2 全視圖與單視圖影像組學(xué)標(biāo)簽AUC面積差異性比較Fig.2 The difference of AUC between radiomics signature scores in full view and coronal plane 注: 圖2為影像組學(xué)標(biāo)簽1與影像組學(xué)標(biāo)簽2在全集、訓(xùn)練集和驗(yàn)證集下的ROC曲線,其AUC面積及95%CI見圖1
圖3 冠狀面視圖下不同模型構(gòu)建的影像組學(xué)標(biāo)簽AUC面積差異性比較Fig.3 The difference of AUC among radiomics signature scores in coronal plane注: 圖3為影像組學(xué)標(biāo)簽2、影像組學(xué)標(biāo)簽3與影像組學(xué)標(biāo)簽4在全集、訓(xùn)練集和驗(yàn)證集下的ROC曲線,其AUC面積及95%CI見圖1;P12為影像組學(xué)標(biāo)簽2 vs影像組學(xué)標(biāo)簽3;P13為影像組學(xué)標(biāo)簽2 vs影像組學(xué)標(biāo)簽4;P23為影像組學(xué)標(biāo)簽3 vs影像組學(xué)標(biāo)簽4
圖4 不同視圖下不同模型構(gòu)建的影像組學(xué)標(biāo)簽AUC面積差異性比較Fig.4 The difference of AUC among radiomics signature scores in different views注: 圖4為影像組學(xué)標(biāo)簽2、影像組學(xué)標(biāo)簽5與影像組學(xué)標(biāo)簽6在全集、訓(xùn)練集和驗(yàn)證集下的ROC曲線,其AUC面積及95%CI見圖1;P12為影像組學(xué)標(biāo)簽2 vs影像組學(xué)標(biāo)簽5;P13為影像組學(xué)標(biāo)簽2 vs影像組學(xué)標(biāo)簽6;P23為影像組學(xué)標(biāo)簽5 vs影像組學(xué)標(biāo)簽6
本研究發(fā)現(xiàn): (1) 不同視角下,69個(gè)影像組學(xué)特征差異具有統(tǒng)計(jì)學(xué)意義。(2) 同一視圖下,GBDT模型構(gòu)建的影像組學(xué)標(biāo)簽在全集和訓(xùn)練集的AUC面積與LASSO回歸模型、樸素貝葉斯模型構(gòu)建的影像組學(xué)標(biāo)簽的AUC面積差異具有統(tǒng)計(jì)學(xué)意義。GBDT構(gòu)建的影像組學(xué)標(biāo)簽準(zhǔn)確率和Kappa值最高。(3) 不同視圖下,GBDT構(gòu)建的影像組學(xué)標(biāo)簽在全集和訓(xùn)練集上的AUC面積差異具有統(tǒng)計(jì)學(xué)意義。矢狀面視圖構(gòu)建的影像組學(xué)標(biāo)簽5的AUC面積大于冠狀面視圖構(gòu)建的影像組學(xué)標(biāo)簽3。
醫(yī)學(xué)圖像擁有著非侵入地評(píng)估組織特征的能力,因此它在癌癥診斷中起著重要作用。近年來,影像組學(xué)研究表明其在癌癥的良惡性、臨床分期、病理亞型、遠(yuǎn)距離淋巴結(jié)轉(zhuǎn)移和患者術(shù)后預(yù)后預(yù)測(cè)等方面都有著良好的效果[7-12]。本研究主要探討不同CT視角下提取的圖像特征組合多個(gè)機(jī)器學(xué)習(xí)模型在GGN肺腺癌亞型的侵襲性上的預(yù)測(cè)效果。盡管影像組學(xué)研究的對(duì)象都有不同,但是不同的特征選擇方法和分類器模型構(gòu)建的影像組學(xué)標(biāo)簽在同一研究對(duì)象上都會(huì)存在差異性。平均CT值、CT形態(tài)學(xué)特征和影像組學(xué)標(biāo)簽在GGN肺腺癌侵襲性或病理亞型分類上都存在診斷價(jià)值[13-17]。影像組學(xué)標(biāo)簽相比較于CT形態(tài)學(xué)特征而言,它更具有客觀性,圖像量化的特征可以排除人為的主觀因素。范麗[15]等的研究表明,影像組學(xué)標(biāo)簽結(jié)合臨床特征和CT形態(tài)學(xué)特征的個(gè)體化預(yù)測(cè)模型診斷效果優(yōu)于傳統(tǒng)CT值和單獨(dú)的影像組學(xué)標(biāo)簽。但是She等[18]發(fā)現(xiàn),年齡并不是AIS/MIA和IA分類的獨(dú)立預(yù)測(cè)因素。GGN侵襲性影像組學(xué)的研究中,WLCX、LASSO和Logistic回歸是最常用構(gòu)建影像組學(xué)標(biāo)簽的方法。研究最初提取了60到500個(gè)影像組學(xué)特征,最后通過WLCX和LASSO篩選后,用于構(gòu)建影像組學(xué)標(biāo)簽的特征僅有1~8個(gè)[15,18-22]。Parmar等[23]和Wu等[24]的研究發(fā)現(xiàn),在肺癌的生存預(yù)后和非小細(xì)胞肺癌的病理亞型分類問題上,隨機(jī)森林的預(yù)測(cè)能力最好,但是Relief特征選擇和貝葉斯模型相結(jié)合的算法的穩(wěn)定性最高。本研究沒有計(jì)算模型的穩(wěn)定性,但是就預(yù)測(cè)效果而言基于樹的集成學(xué)習(xí)模型預(yù)測(cè)效果最好,與Parmar等[23]和Wu等[24]的研究結(jié)果一致。LASSO模型由于懲罰項(xiàng)選擇的差異性,可能會(huì)損失大量的信息。而樸素貝葉斯在高維度問題上一直有著良好的預(yù)測(cè)能力,但是效果仍不及集成學(xué)習(xí)的方法。
本研究屬于回顧性隊(duì)列研究,因此存在一些不可控因素,而前瞻性研究可以控制例如CT的掃描參數(shù)、圖像重建方法等因素。同時(shí),本研究只提取了2D的影像組學(xué)特征,只能表征一個(gè)切面上的特性,切面選擇不同會(huì)導(dǎo)致研究結(jié)果的差異性。本研究采用了大律法自動(dòng)化分割結(jié)節(jié),大律法自動(dòng)分割減輕了結(jié)節(jié)提取的工作量,但是目前手工分割仍然是結(jié)節(jié)分割的金標(biāo)準(zhǔn)。由于樣本量較小,本研究沒有采用深度學(xué)習(xí)的方法構(gòu)建影像組學(xué)標(biāo)簽。深度學(xué)習(xí)方法在圖像識(shí)別上有著非常好的預(yù)測(cè)能力,但是其參數(shù)調(diào)節(jié)過于復(fù)雜,并且在小樣本上泛化能力較低,容易產(chǎn)生過擬合現(xiàn)象。
總體而言,2D影像組學(xué)特征容易受到提取切面的影響,本研究證明了不同視角提取的影像組學(xué)特征存在差異性。對(duì)比LASSO回歸模型,GBDT模型對(duì)冗余特征不敏感,而且在非線性可分的數(shù)據(jù)上預(yù)測(cè)效果更好。由矢狀面視圖結(jié)合GBDT構(gòu)建的影像組學(xué)標(biāo)簽在所有影像組學(xué)標(biāo)簽中,AUC面積最高,診斷效能最好。今后將進(jìn)一步增大樣本量,采用多中心前瞻性隊(duì)列研究的方法,并且提取3D影像組學(xué)特征融合多視圖學(xué)習(xí)的方法來構(gòu)建GGN侵襲性影像組學(xué)標(biāo)簽。