林苗苗 李凱
摘要:目的 探討基于CT平掃的影像組學(xué)模型在鑒別孤立結(jié)節(jié)型肺隱球菌(PC) 與肺腺癌的價(jià)值。方法 納入24例孤立結(jié)節(jié)型PC和54例肺腺癌患者,手動(dòng)分割對(duì)病灶感興趣區(qū)(region of interest,ROI) 進(jìn)行勾畫,并提取內(nèi)部影像組學(xué)特征,進(jìn)而篩選出最佳特征。同時(shí)采用鄰近算法(k-nearest neighbor,KNN) 、支持向量機(jī)(support vector machine,SVM) 及邏輯回歸(logistic regression,LR) 3種分類學(xué)習(xí)器構(gòu)建鑒別診斷模型。采用ROC曲線評(píng)價(jià)模型的鑒別診斷效能。結(jié)果 經(jīng)Lasso降維后共選出10個(gè)最優(yōu)影像組學(xué)特征進(jìn)行建模,采用KNN構(gòu)建的模型在訓(xùn)練集中的AUC為0.957,測(cè)試集中AUC為0.864 ;采用SVM構(gòu)建的模型在訓(xùn)練集中的AUC為0.98,測(cè)試集中AUC為0.782;采用LR構(gòu)建的模型在訓(xùn)練集中的AUC為0.953,測(cè)試集中AUC為0.80。結(jié)論 基于KNN、SVM和SVM的CT影像組學(xué)模型在鑒別診斷孤立結(jié)節(jié)型PC和肺腺癌方面都具有較好的診斷效能,其中KNN模型更為穩(wěn)定。影像組學(xué)可為孤立結(jié)節(jié)型PC與肺腺癌鑒別診斷提供新的手段。
關(guān)鍵詞:隱球菌;肺腫瘤;影像組學(xué);體層攝影,X線計(jì)算機(jī)
肺隱球菌?。╬ulmonary cryptococcosis,PC)是由隱球菌引起的一種亞急性或者慢性真菌病,常見于免疫功能受損患者,如艾滋病、接受器官移植及惡性腫瘤的患者,也可以見于健康人群,其影像學(xué)表現(xiàn)多樣,最常見為孤立結(jié)節(jié)、多發(fā)結(jié)節(jié)、團(tuán)塊及肺炎實(shí)變型[1]。當(dāng)其表現(xiàn)為孤立性結(jié)節(jié)時(shí),易被誤認(rèn)為周圍型肺癌、轉(zhuǎn)移瘤或肺結(jié)核等,容易造成誤診、漏診。隱球菌對(duì)腦膜及神經(jīng)組織有極大的親和性,常常透過(guò)血腦屏障造成嚴(yán)重中樞神經(jīng)系統(tǒng)感染,因此盡早明確診斷非常重要[2]。影像組學(xué)模型是一種通過(guò)從醫(yī)學(xué)圖像中提取的高通量定量影像組學(xué)特征建立診斷模型,為臨床實(shí)施個(gè)性化診療提供了一種新型的潛在工具[3],目前,影像組學(xué)已經(jīng)廣泛應(yīng)用于腫瘤領(lǐng)域[4~5]。本研究對(duì)影像組學(xué)模型鑒別診斷孤立結(jié)節(jié)型PC與肺腺癌的可行性進(jìn)行探討?,F(xiàn)報(bào)道如下:
1資料與方法
1.1 一般資料
回顧性分析2018年1月~2021年10月收治的24例經(jīng)術(shù)后病理證實(shí)的孤立結(jié)節(jié)型PC(PC組) 、54例病理確診肺腺癌(肺腺癌組) 的胸部CT平掃資料。PC組中男性13例,女性11例,年齡23~70歲,平均年齡(51.86±11.18) 歲,血清HIV均為陰性。肺腺癌組中男性31例,女性23例,年齡34~73歲,平均年齡(57.22±8.96) 歲。所有患者接受胸部CT檢查前均未經(jīng)任何治療,所有病灶均為單發(fā),且最大徑≤3 cm。
1.2 儀器與方法
采用美國(guó)GE公司256排螺旋CT進(jìn)行掃描?;颊呷⊙雠P位,吸氣末屏住呼吸,掃描范圍從胸廓入口至雙側(cè)腎上腺水平。掃描參數(shù):管電壓100 kv,自動(dòng)管電流,掃描層厚5 mm,重建層厚1.25 mm。
1.3 病灶分割、特征篩選及模型建立
病灶ROI分割如圖1A。每個(gè)病灶提取了1409個(gè)影像組學(xué)特征。按8∶2比例將所有樣本分為訓(xùn)練集和測(cè)試集。依次使用方差閾值法、最佳K折法及Lasso算法篩選特征,如圖1B。分別采用KNN、SVM及LR建立模型,繪制ROC曲線,以AUC、準(zhǔn)確度、敏感度及特異度評(píng)價(jià)其鑒別效能。
2結(jié)果
2.1 孤立結(jié)節(jié)型PC與肺腺癌CT影像組學(xué)特征篩選
經(jīng)特征選擇獲取針對(duì)孤立結(jié)節(jié)型PC與肺腺癌的10個(gè)較優(yōu)特征,具體如圖2。
2.2 3種孤立結(jié)節(jié)型PC與肺腺癌CT影像組模型的鑒別診斷效能
在訓(xùn)練集中,3種影像組學(xué)鑒別診斷模型的AUC比較結(jié)果為:SVM>KNN>LR;準(zhǔn)確度比較結(jié)果為SVM=LR>KNN;敏感度方面KNN、SVM及LR三者之間相同,特異度比較為SVM=LR>KNN(表1) 。所構(gòu)建的3種影像組學(xué)鑒別診斷模型在訓(xùn)練集中的ROC曲線,如圖3A。測(cè)試集中,3種影像組學(xué)鑒別診斷模型的AUC比較結(jié)果為:KNN>LR>SVM;準(zhǔn)確度比較結(jié)果為KNN=LR>SVM;敏感度方面KNN、SVM及LR三者之間相同,特異度比較為KNN=LR>SVM(表2) 。所構(gòu)建的3種影像組學(xué)鑒別診斷模型在訓(xùn)練集中的ROC曲線,如圖3B。
3討論
PC是由新型隱球菌感染引起的一種較為少見的肺真菌病,呈急性或者慢性感染過(guò)程,可經(jīng)過(guò)呼吸道,消化道或者皮膚黏膜侵入人體引起感染,其中以呼吸道吸入感染為主。近年來(lái),肺隱球菌病的發(fā)病率呈上升趨勢(shì),其中無(wú)免疫缺陷的患者也逐漸增多[6~7]。血清CrAg檢測(cè)對(duì)于HIV陰性PC患者的敏感度僅為25 %~56 %,診斷較為困難[8]。PC臨床癥狀及影像學(xué)表現(xiàn)均缺乏特異性,其中具有分葉征、毛刺征、空泡征等征象的孤立結(jié)節(jié)型PC,易被誤診為肺癌。PC是良性病變,而肺癌是惡性腫瘤,二者在治療方案選擇全然不同。PC患者治療目的主要在于控制感染,防止播散,尤其是防止隱球菌腦病發(fā)生。對(duì)于輕中癥狀患者,推薦氟康唑治療,療程為半年至1年,重癥人群加以兩性霉素B進(jìn)行誘導(dǎo)治療[9]。對(duì)于肺腺癌,尤其是早期肺癌,主要以手術(shù)治療方式為主。
既往研究多集中在結(jié)節(jié)型PC與肺腺癌的臨床特征與影像學(xué)表現(xiàn)上[10~11],研究表明暈征、支氣管充氣征、蘑菇兄弟征等征象更傾向于發(fā)生在PC,以及PC更好發(fā)于兩肺胸膜下及肺野外帶。但是當(dāng)PC表現(xiàn)為結(jié)節(jié)型且單發(fā)時(shí),且伴有分葉、毛刺征、空泡征,影像特征不典型時(shí),極易與肺癌相混淆。影像組學(xué)可以很好反映病灶異質(zhì)性,對(duì)圖像紋理信息進(jìn)行深度挖掘以及定量分析。Weiya Shi等[12]研究HIV患者的機(jī)會(huì)性肺部感染中央型病變(包括結(jié)核、非分枝桿菌、隱球菌) 的逆差距顯著高于癌癥組,并認(rèn)為良性病變同質(zhì)性較大。樊夢(mèng)思等[2]對(duì)28例結(jié)節(jié)/ 腫塊型肺隱球菌、30例肺腺癌及26例肺結(jié)核CT平掃圖像進(jìn)行影像組學(xué)分析,結(jié)果顯示CT平掃的影像組學(xué)模型可有效鑒別結(jié)節(jié)/ 腫塊型肺隱球菌、肺腺癌及肺結(jié)核。
本研究在上述基礎(chǔ)上進(jìn)一步擴(kuò)展機(jī)器學(xué)習(xí)模型的范圍,基于24例孤立結(jié)節(jié)型PC與肺腺癌的CT平掃圖像,從每個(gè)病灶提取1409個(gè)特征,再通過(guò)方差閾值法、最佳K折法及Lasso算法篩選出孤立結(jié)節(jié)型PC與肺腺癌組間差異最明顯10個(gè)影像組學(xué)特征用于構(gòu)建模型。在模型訓(xùn)練階段采用KNN、SVM及LR三種機(jī)器學(xué)習(xí)模型,結(jié)果顯示KNN模型綜合鑒別診斷效能最穩(wěn)定,除了準(zhǔn)確度,其他指標(biāo)均達(dá)到80 %以上。KNN也叫K-最近鄰算法,是著名的模式識(shí)別統(tǒng)計(jì)學(xué)方法,在學(xué)習(xí)分類算法中占有重要地位。其中K是一個(gè)參數(shù),是指包含的最近鄰的數(shù)量。它根據(jù)所有樣本的集中的數(shù)據(jù),由相似性度量選擇K個(gè)最近的鄰居并按照鄰居的類別進(jìn)行分類。KNN優(yōu)點(diǎn)在于易于理解與實(shí)現(xiàn),靈活的距離度量方法選擇,適用于處理多分類問(wèn)題及回歸問(wèn)題,適用于小樣本數(shù)據(jù)集,本研究樣本總數(shù)為78例,屬于小樣本數(shù)據(jù),這可能是KNN各項(xiàng)模型評(píng)估效能指標(biāo)都較優(yōu)越原因之一。但KNN算法也存在不足,當(dāng)樣本數(shù)量不平衡時(shí),輸入一個(gè)新樣本可以使得該樣本的K個(gè)鄰近確定樣本中大容量類樣本占據(jù)多數(shù),導(dǎo)致結(jié)果出現(xiàn)偏差。研究中孤立結(jié)節(jié)型PC與肺腺癌的樣本數(shù)量不均衡,肺腺癌樣本居多,可能導(dǎo)致KNN算法鑒別診斷新的孤立結(jié)節(jié)型PC樣本時(shí)因鄰近K樣本中肺腺癌數(shù)量占多數(shù)而被誤判為肺腺癌,這可能是導(dǎo)致KNN模型在訓(xùn)練集和測(cè)試集中準(zhǔn)確度均偏低的原因之一。
綜上所述,基于KNN、SVM及LR三種分類器構(gòu)建影像組學(xué)模型均可以較好用于鑒別診斷孤立結(jié)節(jié)型PC及肺腺癌,其中,KNN鑒別診斷效能表現(xiàn)最佳,這為臨床準(zhǔn)確診斷和個(gè)體化治療提供依據(jù)。本研究尚存不足:(1) 樣本量少;(2)僅采集平掃肺窗單層病灶圖像,難以提取病變?nèi)啃畔?(3) 未將臨床、影像特征等信息納入進(jìn)行聯(lián)合分析,有待完善。
參考文獻(xiàn)
[1]楊海,劉子姍,陳盈,等.免疫正?;颊叻坞[球菌病的CT征象分析[J].中華全科醫(yī)學(xué),2018,16(2): 279-282+290.
[2]樊夢(mèng)思,趙紅,曹捍波,等.基于CT平掃影像組學(xué)模型鑒別結(jié)節(jié)/ 腫塊型肺隱球菌病及肺腺癌與肺結(jié)核[J].中國(guó)醫(yī)學(xué)影像技術(shù),2020,36(6):853-857.
[3]Aerts HJ.The Potential of Radiomic-Based Phenotyping in Precision Medicine:A Review [J].JAMA Oncol, 2016,2(12):1636-1642.
[4]Yang L,Gu D, Wei J,et al.A Radiomics Nomogram for Preoperative Prediction of Microvascular Invasion in Hepatocellular Carcinoma [J]. Liver Cancer,2019,8(5):373-386.
[5]Jiang Y,Wang W,Chen C,et al.Radiomics Signature on Computed Tomography Imaging: Association With Lymph Node Metastasis in Patients With Gastric Cancer [J].Front Oncol,2019,9:340.
[6]谷雷,文文,賴國(guó)祥.肺隱球菌病診治進(jìn)展[J].中華醫(yī)學(xué)雜志,2020,100(4):317-320.
[7]Liu K,Ding H,Xu B,et al.Clinical analysis of non-AIDS patients pathologically diagnosed with pulmonary cryptococcosis [J]. Journal of Thoracic Disease,2016,8(10):2813-2821.
[8]Zhou Y,Lin P,Ye J,et al.The performance of serum cryptococcal capsular polysaccharide antigen test, histopathology and culture of the lung tissue for diagnosis of pulmonary cryptococcosis in patients without HIV infection [J]. Infect Drug Resist,2018,11:2483-2490.
[9]浙江省醫(yī)學(xué)會(huì)呼吸病學(xué)分會(huì).肺隱球菌病診治浙江省專家共識(shí)[J].中華臨床感染病雜志,2017,10(5):6.
[10]甘慧,張冬,文利,等.結(jié)節(jié)腫塊型肺隱球菌病的臨床特征及CT表現(xiàn)[J].中華肺部疾病雜志(電子版),2021,14(5):564-568.
[11]毛海霞,韓砆石,楊洋,等.孤立結(jié)節(jié)型肺隱球菌病與肺癌的CT鑒別診斷[J].中華臨床醫(yī)師雜志(電子版),2014,8(17):3083-3088.
[12]Shi W,Zhou L,Peng X, et al.HIV-infected patients with opportunistic pulmonary infections misdiagnosed as lung cancers: the clinicoradiologic features and initial application of CT radiomics [J]. J Thorac Dis,2019,11(6):2274-2286.