• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      免疫細(xì)胞浸潤(rùn)在非小細(xì)胞肺癌診斷與預(yù)后中的應(yīng)用

      2020-05-07 12:30:46萬輝輝劉振浩澹小秀王廣志徐勇謝鷺林勇
      生物工程學(xué)報(bào) 2020年4期
      關(guān)鍵詞:肺癌分類特征

      萬輝輝,劉振浩,澹小秀,王廣志,徐勇,謝鷺,林勇

      ·醫(yī)藥生物技術(shù)·

      免疫細(xì)胞浸潤(rùn)在非小細(xì)胞肺癌診斷與預(yù)后中的應(yīng)用

      萬輝輝1,劉振浩2,3,澹小秀1,王廣志4,徐勇1,謝鷺2,林勇1

      1上海理工大學(xué) 醫(yī)療器械與食品學(xué)院,上海 200093 2 上海生物信息技術(shù)研究中心,上海 201203 3 中南大學(xué)湘雅醫(yī)院,湖南 長(zhǎng)沙 410008 4 上海海洋大學(xué) 食品科學(xué)與技術(shù)學(xué)院,上海 201306

      免疫細(xì)胞浸潤(rùn)對(duì)癌癥的診斷與預(yù)后有著重要意義。文中收集TCGA數(shù)據(jù)庫(kù)已收錄的非小細(xì)胞肺癌腫瘤與正常組織基因表達(dá)數(shù)據(jù),利用CIBERSORT工具得到22種免疫細(xì)胞占比來評(píng)估免疫細(xì)胞浸潤(rùn)情況。以22種免疫細(xì)胞占比為特征,用機(jī)器學(xué)習(xí)方法構(gòu)建了非小細(xì)胞肺癌腫瘤與正常組織的分類模型,其中隨機(jī)森林方法構(gòu)建的模型分類效果AUC=0.987、敏感性0.98及特異性0.84。并且用隨機(jī)森林方法構(gòu)建的肺腺癌和肺鱗癌腫瘤組織分類模型效果AUC=0.827、敏感性0.75及特異性0.77。用LASSO回歸篩選22種免疫細(xì)胞特征,保留8種強(qiáng)相關(guān)特征組成的免疫細(xì)胞評(píng)分結(jié)合臨床特征構(gòu)建了非小細(xì)胞肺癌預(yù)后模型。經(jīng)評(píng)估及驗(yàn)證,預(yù)后模型C-index=0.71并且3年和5年的校準(zhǔn)曲線擬合良好,可以對(duì)預(yù)后風(fēng)險(xiǎn)度進(jìn)行準(zhǔn)確預(yù)測(cè)。本研究基于免疫細(xì)胞浸潤(rùn)所構(gòu)建的分類模型與預(yù)后模型,旨在對(duì)非小細(xì)胞肺癌的診斷與預(yù)后研究提供新的策略。

      非小細(xì)胞肺癌,免疫細(xì)胞浸潤(rùn),機(jī)器學(xué)習(xí),隨機(jī)森林,分類模型,LASSO回歸,預(yù)后模型

      肺癌是一種常見的惡性腫瘤,具有極高的發(fā)病率與死亡率[1]。據(jù)美國(guó)癌癥協(xié)會(huì)和癌癥統(tǒng)計(jì)中心統(tǒng)計(jì),每年有超過15萬肺癌患者死亡,同時(shí)每年新增確診病例數(shù)約20萬。肺癌主要有小細(xì)胞肺癌(Small cell lung cancer,SCLC) 和非小細(xì)胞肺癌(Non-small cell lung cancer,NSCLC) 兩種組織學(xué)表型,NSCLC占所有肺癌病例85%左右[2]。而NSCLC主要分為肺腺癌(Lung adenocarcinoma,LUAD) 和肺鱗癌(Lung squamous carcinoma,LUSC)[3]。

      組織病理學(xué)切片圖像的目視檢查是病理學(xué)家評(píng)估肺癌腫瘤分期、類型和亞型的主要方法之一。NSCLC的診斷是一個(gè)關(guān)鍵的過程,因?yàn)閭鹘y(tǒng)的化療以及最近的靶向治療對(duì)LUAD和LUSC的治療方案是不同的[4]。并且在缺乏明確的組織學(xué)特征的情況下,這一重要的診斷可能是具有挑戰(zhàn)性和耗時(shí)性的。面對(duì)這樣的挑戰(zhàn),許多研究人員對(duì)NSCLC診斷作出了不同的研究方案,如Yu等[5]將傳統(tǒng)的閾值和圖像處理技術(shù)與隨機(jī)森林、支持向量機(jī)或樸素貝葉斯分類器等機(jī)器學(xué)習(xí)方法相結(jié)合,區(qū)分NSCLC腫瘤和正常組織AUC達(dá)到0.85,區(qū)分LUAD和LUSC組織AUC達(dá)到0.75。在區(qū)分NSCLC腫瘤和正常組織時(shí),Girard等[6]以62種基因?yàn)樘卣鞑捎米罱嚯x法分類準(zhǔn)確率達(dá)到86%,Du等[7]以STC1 mRNA為特征通過計(jì)算約登指數(shù)得到最佳截?cái)帱c(diǎn)作分類AUC達(dá)到0.969。這些研究對(duì)NSCLC的診斷提供了新的方法,但是其診斷的效果還有較大的提升空間。

      盡管近年來微創(chuàng)手術(shù)、化療和靶向治療等方法在NSCLC治療中取得了進(jìn)步,但患者的5年生存率遠(yuǎn)遠(yuǎn)不能令人滿意,大多數(shù)地區(qū)的生存率在10%到20%之間[8]。而NSCLC的治療決策和預(yù)后在很大程度上取決于TNM分期系統(tǒng)的評(píng)估[9]。目前有許多通過引入臨床病理或其他特征來優(yōu)化分期系統(tǒng)的方案被提出,如年齡、性別、腫瘤位置等[10],甚至包括基因表達(dá)信息[11-12]。最近,也有證據(jù)表明免疫細(xì)胞浸潤(rùn)對(duì)NSCLC的臨床和預(yù)后的重要性,將免疫細(xì)胞浸潤(rùn)作為特征納入預(yù)后模型有助于臨床醫(yī)生對(duì)患者的預(yù)后進(jìn)行更可靠和準(zhǔn)確的預(yù)測(cè)[13]。

      Newman等開發(fā)出一種稱為CIBERSORT的工具[14],它可以利用多種組織類型(包括實(shí)體腫瘤) 的基因表達(dá)數(shù)據(jù)得到22種免疫細(xì)胞占比來評(píng)估免疫細(xì)胞浸潤(rùn)情況,同時(shí)在處理噪聲、未知混合物含量和密切相關(guān)的細(xì)胞類型等方面都優(yōu)于其他方法且通過流式細(xì)胞術(shù)得到很好的驗(yàn)證[15]。由于CIBERSORT優(yōu)越的性能,研究人員使用CIBERSORT對(duì)各種癌癥的免疫細(xì)胞浸潤(rùn)情況的研究越來越多[16-18]。本研究用CIBERSORT工具計(jì)算得到22種免疫細(xì)胞浸潤(rùn)情況,采用機(jī)器學(xué)習(xí)方法構(gòu)建了以22種免疫細(xì)胞占比為特征的NSCLC腫瘤與正常組織的分類模型。同時(shí)采用LASSO回歸建立了由8種免疫細(xì)胞組成的免疫細(xì)胞評(píng)分,免疫細(xì)胞評(píng)分結(jié)合臨床特征構(gòu)建了NSCLC預(yù)后模型。

      1 材料與方法

      1.1 實(shí)驗(yàn)數(shù)據(jù)

      2018年12月,從腫瘤基因組圖譜數(shù)據(jù)庫(kù)(The Cancer Genome Atlas,TCGA,https://cancergenome. nih.gov/) 檢索下載了1 007例NSCLC腫瘤組織基因表達(dá)數(shù)據(jù)和104例正常組織基因表達(dá)數(shù)據(jù)及對(duì)應(yīng)樣本的臨床數(shù)據(jù)。

      從TCGA下載的基因表達(dá)數(shù)據(jù),使用David工具[19]將ENSEMBL號(hào)轉(zhuǎn)化為基因名(Gene Symbol),并且將相同基因號(hào)的表達(dá)數(shù)據(jù)取均值作為最終基因表達(dá)數(shù)據(jù)。下載的臨床數(shù)據(jù)特征包括年齡、病理分期、T分期、N分期、M分期、性別、化療情況、煙齡、隨訪日期、生存狀況。對(duì)于生存資料缺失、隨訪日期缺失或小于一個(gè)月的臨床數(shù)據(jù)進(jìn)行剔 除,然后與基因表達(dá)數(shù)據(jù)進(jìn)行匹配,最后總共獲得 812例基因表達(dá)與臨床資料都有的患者數(shù)據(jù)。

      在研究中,使用1 007例NSCLC腫瘤組織基因表達(dá)數(shù)據(jù)(510例LUAD、497例LUSC) 與104例正常組織基因表達(dá)數(shù)據(jù)構(gòu)建NSCLC腫瘤與正常組織分類模型;使用812例基因表達(dá)與臨床資料都有的NSCLC患者數(shù)據(jù)構(gòu)建NSCLC預(yù)后模型。此外從基因表達(dá)綜合數(shù)據(jù)庫(kù)(Gene Expression Omnibus,GEO) 下載了編號(hào)為GSE10245[20]非小細(xì)胞肺癌基因表達(dá)數(shù)據(jù),用于對(duì)分類模型進(jìn)行驗(yàn)證,其中40例LUAD、18例LUSC。

      1.2 分析方法

      本研究中涉及所有分析均使用R軟件(版本3.5.1) 進(jìn)行,NSCLC分類模型與預(yù)后模型構(gòu)建的方法流程如圖1所示。首先用CIBERSORT工具評(píng)估NSCLC腫瘤組織與正常組織的免疫細(xì)胞浸潤(rùn)水平,然后用機(jī)器學(xué)習(xí)方法構(gòu)建NSCLC分類模型,用LASSO回歸構(gòu)建由8種免疫細(xì)胞組成的免疫細(xì)胞評(píng)分結(jié)合臨床特征用COX回歸構(gòu)建NSCLC預(yù)后模型。

      (1) 評(píng)估免疫細(xì)胞浸潤(rùn)水平方法

      CIBERSORT工具提供了線下用R語言編寫的腳本,通過加載提供的包即可使用。CIBERSORT采用了線性支持向量回歸方法,這是一種對(duì)噪聲具有高度魯棒性的機(jī)器學(xué)習(xí)方法[21],可對(duì)包括B細(xì)胞、T細(xì)胞、自然殺傷細(xì)胞、巨噬細(xì)胞、樹突狀細(xì)胞和骨髓亞群細(xì)胞等在內(nèi)的22種免疫細(xì)胞表型進(jìn)行高度敏感性和特異性識(shí)別,22種免疫細(xì)胞類型名稱詳細(xì)信息如表1所示。在每個(gè)樣本中,22種免疫細(xì)胞占比分?jǐn)?shù)之和等于1,用這22種免疫細(xì)胞的占比分?jǐn)?shù)來評(píng)估浸潤(rùn)水平。

      (2) 機(jī)器學(xué)習(xí)與LASSO回歸方法

      分類模型采用的機(jī)器學(xué)習(xí)方法用R包‘caret’實(shí)現(xiàn),其中‘train’函數(shù)設(shè)置參數(shù)可以選擇所使用的方法,本研究中用到4種機(jī)器學(xué)習(xí)方法:神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、貝葉斯廣義線性模型和最小二乘回歸。對(duì)于隨機(jī)森林,它會(huì)為每個(gè)特征計(jì)算出準(zhǔn)確度平均降低量(Mean Decrease Accuracy)和基尼指數(shù)平均降低量(Mean Decrease Gini),這兩個(gè)值都是對(duì)特征評(píng)估的重要性指標(biāo),同時(shí)隨機(jī)森林對(duì)于其他機(jī)器學(xué)習(xí)方法的優(yōu)勢(shì)在于可以評(píng)估所有特征的重要性從而對(duì)特征進(jìn)行篩選[22]。

      LASSO回歸通過構(gòu)造一個(gè)懲罰函數(shù)得到一個(gè)較為精練的模型,從而壓縮一些回歸系數(shù),同時(shí)設(shè)定一些回歸系數(shù)為零[23]。本研究使用R包‘glmnet’通過十折交叉驗(yàn)證選取誤差最小的懲罰參數(shù)λ,來選擇22種免疫細(xì)胞中最為有效的預(yù)后標(biāo)記免疫細(xì)胞子集及其對(duì)應(yīng)的回歸系數(shù)構(gòu)建免疫細(xì)胞評(píng)分。

      (3) 模型性能評(píng)估方法

      分類模型中均用隨機(jī)抽樣將數(shù)據(jù)7︰3劃分為訓(xùn)練集與測(cè)試集,采用十折交叉進(jìn)行驗(yàn)證且重復(fù)3次。用分類準(zhǔn)確率(Accuracy) 和ROC曲線下面積(AUC) 等來評(píng)估分類模型性能。Accuracy和AUC越大,表示分類模型性能越好。準(zhǔn)確率是分類結(jié)果正確的樣本數(shù)與總樣本數(shù)的比值,公式為:

      其中,TP=true positive;TN=true negative;FP=false positive;FN=false negative;

      表1 22種免疫細(xì)胞類型名稱

      預(yù)后模型中用分層隨機(jī)抽樣將數(shù)據(jù)6︰4劃分為訓(xùn)練集和測(cè)試集。COX單因素分析用于計(jì)算變量的風(fēng)險(xiǎn)比。篩選COX單因素分析中<0.05的變量納入COX多因素分析。采用Kaplan-Meier曲線分析變量與總體生存率的關(guān)系,并且用log-rank檢驗(yàn)顯著性水平。用COX多因素分析并采用后退法篩選變量建立NSCLC預(yù)后模型。用C-index (Harrell’s concordance index) 來評(píng)估預(yù)后模型性能,并采用1 000次bootstrap抽樣方法進(jìn)行驗(yàn)證。C-index大于0.7表示預(yù)后模型穩(wěn)定,值越高性能越好。同時(shí),用3年和5年校準(zhǔn)曲線對(duì)預(yù)后模型性能進(jìn)行評(píng)估,校準(zhǔn)曲線越趨近對(duì)角線表示性能越好。

      2 結(jié)果與分析

      2.1 NSCLC分類模型分類結(jié)果

      基于機(jī)器學(xué)習(xí)的4種方法,以22種免疫細(xì)胞占比為特征,構(gòu)建了NSCLC腫瘤組織與正常組織分類的模型。四種方法構(gòu)建的模型均顯示了良好的分類效果(圖2A),從表2的分類結(jié)果中可以看出隨機(jī)森林方法效果最好,AUC=0.987、敏感性0.98及特異性0.84。同樣以22種免疫細(xì)胞占比為特征,基于機(jī)器學(xué)習(xí)的4種方法,我們構(gòu)建了LUAD、LUSC腫瘤組織的二分類模型 (圖2B)。模型分類結(jié)果如表3所示,隨機(jī)森林方法構(gòu)建的模型整體效果最好,AUC=0.827、敏感性0.75及特異性0.77。此外,我們用GEO數(shù)據(jù)庫(kù)中編號(hào)為GSE10245的數(shù)據(jù)對(duì)隨機(jī)森林方法建立的分類模型進(jìn)行驗(yàn)證,58例數(shù)據(jù)在NSCLC腫瘤與正常組織分類模型中驗(yàn)證準(zhǔn)確率為100%,在LUAD和LUSC腫瘤組織分類模型中驗(yàn)證AUC=0.753、敏感性0.68及特異性0.78 (圖2C)。

      2.2 NSCLC預(yù)后模型預(yù)測(cè)結(jié)果

      研究中訓(xùn)練集采用LASSO回歸分析選擇22種免疫細(xì)胞中最為有效的預(yù)后標(biāo)記免疫細(xì)胞子集及其對(duì)應(yīng)的回歸系數(shù)構(gòu)建免疫細(xì)胞評(píng)分(Immunocyte score,ICS),通過十折交叉驗(yàn)證后,當(dāng)懲罰參數(shù)λ=0.022時(shí),誤差達(dá)到最小,由此得到8個(gè)特征構(gòu)建的免疫細(xì)胞評(píng)分(圖3)。這8種免疫細(xì)胞分別為:活化的肥大細(xì)胞,活化的樹突狀細(xì)胞,M1巨噬細(xì)胞,M2巨噬細(xì)胞,靜止期肥大細(xì)胞,靜止期樹突狀細(xì)胞,初始B細(xì)胞,單核細(xì)胞。用免疫細(xì)胞評(píng)分做cutoff,將免疫細(xì)胞評(píng)分劃分為高低兩個(gè)組進(jìn)行生存分析,結(jié)果顯示高免疫細(xì)胞評(píng)分的NSCLC患者預(yù)后生存時(shí)間較短(HR=1.84;-value<0.000 1;中位生存時(shí)間35.77個(gè)月比57.5個(gè)月;95% CI:1.36–2.48) (圖4)。然后,免疫細(xì)胞評(píng)分結(jié)合臨床特征做COX單因素與多因素分析,使用退火法篩選特征后,最后保留4個(gè)特征:病理分期(Pathological stage),T分期(T stage),放療(Radiation therapy) 和ICS,以這4個(gè)特征構(gòu)建了NSCLC預(yù)后模型列線圖,如圖5所示。經(jīng) 1 000次bootstrap抽樣方法進(jìn)行驗(yàn)證后,C-index為0.71。

      表2 基于4種機(jī)器學(xué)習(xí)的NSCLC腫瘤組織與正常組織分類模型

      表3 基于4種機(jī)器學(xué)習(xí)的LUAD和LUSC組織分類模型

      在訓(xùn)練集中,以所有病人的風(fēng)險(xiǎn)值做cutoff,將病人分為兩組,根據(jù)兩組病人的log-rank檢驗(yàn)統(tǒng)計(jì)量來篩選病人分組閾值。如圖6所示,當(dāng)選取2.43作為cutoff時(shí),兩組病人log-rank檢驗(yàn)統(tǒng)計(jì)量達(dá)到最大,因此選取2.43第一個(gè)閾值對(duì)患者進(jìn)行分組。對(duì)剩下的患者繼續(xù)進(jìn)行分組,選取cutoff=1.7為閾值,這樣將患者分成高、中、低風(fēng)險(xiǎn)3個(gè)組。相對(duì)低風(fēng)險(xiǎn)組,中風(fēng)險(xiǎn)組HR=2.69,95% CI:1.9–3.79,高風(fēng)險(xiǎn)組HR=6.36,95% CI:4.24–9.55,經(jīng)log-rank檢驗(yàn)-value=1.45e–23。中位生存時(shí)間:低風(fēng)險(xiǎn)組61.0個(gè)月,中風(fēng)險(xiǎn)組31.7個(gè)月,高風(fēng)險(xiǎn)組20.8個(gè)月。然后,對(duì)模型預(yù)測(cè)NSCLC患者3年和5年的存活率做了校準(zhǔn)曲線(圖7A,7B),校準(zhǔn)曲線均擬合良好。用訓(xùn)練集中的免疫細(xì)胞評(píng)分公式代入測(cè)試集中,圖4B結(jié)果驗(yàn)證了高免疫細(xì)胞評(píng)分的NSCLC患者預(yù)后生存時(shí)間較短(HR=1.66;-value=0.0016;中位生存時(shí)間35.57個(gè)月比66.13個(gè)月;95% CI:1.21–2.29)。測(cè)試集中,模型預(yù)測(cè)NSCLC患者3年和5年的存活率校準(zhǔn)曲線也都擬合良好 (圖7C和圖7D)。經(jīng)1 000次bootstrap抽樣方法進(jìn)行驗(yàn)證后,C-index為0.702。綜上,經(jīng)過訓(xùn)練集模型的評(píng)估及測(cè)試集的驗(yàn)證,表明構(gòu)建的預(yù)后模型可以實(shí)現(xiàn)準(zhǔn)確的預(yù)測(cè)NSCLC患者的3年和5年存活率。

      圖3 LASSO回歸構(gòu)建免疫細(xì)胞評(píng)分

      圖4 免疫細(xì)胞評(píng)分生存分析

      圖5 NSCLC預(yù)后模型列線圖

      圖6 訓(xùn)練集中NSCLC預(yù)后模型高中低風(fēng)險(xiǎn)分組生存分析比較

      圖7 NSCLC預(yù)后模型3年和5年校準(zhǔn)曲線圖

      3 討論

      此次研究以22種免疫細(xì)胞占比為特征用機(jī)器學(xué)習(xí)方法構(gòu)建了NSCLC分類模型。與Yu等將傳統(tǒng)的閾值和圖像處理技術(shù)與機(jī)器學(xué)習(xí)方法相結(jié)合、Girard等以62種基因?yàn)樘卣鞑捎米罱嚯x法及Du等以STC1 mRNA為特征通過計(jì)算約登指數(shù)得到最佳截?cái)帱c(diǎn)將NSCLC腫瘤與正常組織分類相比,我們用隨機(jī)森林方法,構(gòu)建的NSCLC腫瘤組織與正常組織分類模型、LUAD和LUSC腫瘤組織分類模型結(jié)果顯示出更高的準(zhǔn)確度。

      通過應(yīng)用新開發(fā)的CIBERSORT工具和LASSO回歸構(gòu)建了由8種免疫細(xì)胞組成的免疫細(xì)胞評(píng)分。免疫細(xì)胞評(píng)分結(jié)合臨床特征構(gòu)建了NSCLC預(yù)后模型,經(jīng)1 000次bootstrap抽樣方法進(jìn)行驗(yàn)證后C-index為0.71。預(yù)后模型的風(fēng)險(xiǎn)度高中低分組后做生存分析,經(jīng)log-rank檢驗(yàn)-value=1.45e-23。預(yù)后模型中訓(xùn)練集與測(cè)試集的3年與5年校準(zhǔn)曲線都擬合良好,且測(cè)試集中經(jīng) 1 000次bootstrap抽樣方法進(jìn)行驗(yàn)證后C-index為0.702。模型評(píng)估與驗(yàn)證表明了該預(yù)后模型對(duì)NSCLC的預(yù)后具有良好的預(yù)測(cè)能力。

      基于免疫細(xì)胞浸潤(rùn)構(gòu)建的NSCLC分類模型和預(yù)后模型說明了免疫細(xì)胞浸潤(rùn)與其發(fā)生和發(fā)展存在的關(guān)聯(lián)。分類模型能夠有效地從NSCLC患者和健康對(duì)照人群中識(shí)別NSCLC患者(包括LUAD與LUSC患者),預(yù)后模型能夠有效地對(duì)NSCLC病人3年和5年存活率進(jìn)行預(yù)測(cè),提示不同免疫細(xì)胞類型在NSCLC發(fā)生發(fā)展過程中的作用。這一發(fā)現(xiàn)為從免疫細(xì)胞浸潤(rùn)的角度對(duì)NSCLC診斷與預(yù)后研究提供新的策略。此外,基于本研究建立的模型,我們構(gòu)建了網(wǎng)頁(yè)工具(http://www. biostatistics.online/NSCLC/home.php),供研究者實(shí)際應(yīng)用于NSCLC診斷和預(yù)后的預(yù)測(cè)。

      本研究方案雖然在NSCLC診斷與預(yù)后中取得進(jìn)展,但也存在不足之處。研究中用的是公開的數(shù)據(jù)集,不可能獲得每個(gè)病人所需的所有信息。這表明,一些患有急性感染、患有免疫系統(tǒng)疾病或服用抗炎藥的患者,有可能被納入了這項(xiàng)研究。理想情況下,這些患者應(yīng)該被排除在外。另外對(duì)于目前公開可用的腫瘤基因組圖譜數(shù)據(jù)庫(kù)中,正常肺組織基因表達(dá)數(shù)據(jù)較腫瘤組織基因表達(dá)數(shù)據(jù)少,這就導(dǎo)致了收集數(shù)據(jù)時(shí)樣本的不平衡。但是,伴隨著目前高通量基因表達(dá)檢測(cè)技術(shù)的發(fā)展,會(huì)有越來越多的基因表達(dá)數(shù)據(jù)可供研究。在未來的研究中,我們將收集更多的NSCLC患者數(shù)據(jù)及正常組織數(shù)據(jù),繼續(xù)對(duì)NSCLC的診斷與預(yù)后進(jìn)行進(jìn)一步研究。

      [1] Siegel RL, Miller KD, Jemal A. Cancer statistics, 2017. CA Cancer J Clin, 2017, 67(1): 7–30.

      [2] Mitchell PL, John T. Lung cancer in 2016: immunotherapy comes of age. Lancet Respir Med, 2016, 4(12): 947–949.

      [3] Hirsch FR, Scagliotti GV, Mulshine JL, et alLung cancer: current therapies and new targeted treatments. Lancet, 2017, 389(10066): 299–311.

      [4] Hanna N, Johnson D, Temin S, et alSystemic therapy for stage IV non-small-cell lung cancer: American society of clinical oncology clinical practice guideline update. J Clin Oncol, 2017, 35(30): 3484–3515.

      [5] Yu KH, Zhang C, Berry GJ, et alPredicting non-small cell lung cancer prognosis by fully automated microscopic pathology image features. Nat Commun, 2016, 7: 12474.

      [6] Girard L, Rodriguez-Canales J, Behrens C, et alAn expression signature as an aid to the histologic classification of non-small cell lung cancer. Clin Cancer Res, 2016, 22(19): 4880–4889.

      [7] Du YZ, Gu X H, LiL, et alThe diagnostic value of circulating stanniocalcin-1 mRNA in non-small cell lung cancer. J Surg Oncol, 2011, 104(7): 836–840.

      [8] Siegel R, Desantis C, Virgo K, et alCancer treatment and survivorship statistics, 2012. CA Cancer J Clin, 2012, 62(4): 220–241.

      [9] Ettinger DS, Wood DE, Akerley W, et alNCCN guidelines insights: non-small cell lung cancer, Version 4.2016. J Natl Compr Canc Netw, 2016, 14(3): 255–264.

      [10] Ouyang J, Sun Y, Li W, et aldbPHCC: a database of prognostic biomarkers for hepatocellular carcinoma that provides online prognostic modeling. Biochim Biophys Acta, 2016, 1860 (11 Pt B): 2688–2695.

      [11] Wu J, Zhou L, Huang L, et alNomogram integrating gene expression signatures with clinicopathological features to predict survival in operable NSCLC: a pooled analysis of 2164 patients. J Exp Clin Cancer Res, 2017, 36(1): 4.

      [12] Sun HC, Xie L, Yang XR, et alShanghai score: A prognostic and adjuvant treatment-evaluating system constructed for Chinese patients with hepatocellular carcinoma after curative resection. Chin Med J (Engl), 2017, 130(22): 2650–2660.

      [13] Liu X, Wu S, Yang Y, et alThe prognostic landscape of tumor-infiltrating immune cell and immunomodulators in lung cancer. Biomed Pharmacother, 2017, 95: 55–61.

      [14] Newman AM, Liu CL, Green MR, et alRobust enumeration of cell subsets from tissue expression profiles. Nat Methods, 2015, 12(5): 453–457.

      [15] Bindea G, Mlecnik B, Tosolini M, et alSpatiotemporal dynamics of intratumoral immune cells reveal the immune landscape in human cancer. Immunity, 2013, 39(4): 782–795.

      [16] Ali HR, Chlon L, Pharoah PD, et alPatterns of immune infiltration in breast cancer and their clinical implications: A gene-expression-based retrospective study. PLoS Med, 2016, 13(12): e1002194.

      [17] Xiong Y, Wang K, Zhou H, et alProfiles of immune infiltration in colorectal cancer and their clinical significant: A gene expression-based study. Cancer Med, 2018, 7(9): 4496–4508.

      [18] Zeng D, Zhou R, Yu Y, et alGene expression profiles for a prognostic immunoscore in gastric cancer. Br J Surg, 2018, 105(10): 1338–1348.

      [19] Huang DW, Sherman BT, Tan Q, et alThe DAVID gene functional classification tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biol, 2007, 8(9): R183.

      [20] Kuner R, Muley T, Meister M, et alGlobal gene expression analysis reveals specific patterns of cell junctions in non-small cell lung cancer subtypes. Lung Cancer, 2009, 63(1): 32–38.

      [21] Scholkopf B, Smola AJ, Williamson RC, et alNew support vector algorithms. Neural Comput, 2000, 12(5): 1207–1245.

      [22] Zhang YQ, Lin Y. Research of prediction of the response to tumor immunotherapy based on machine learning. Comp Eng Software, 2019, 40(1): 97–102 (in Chinese).張雨琦, 林勇. 基于機(jī)器學(xué)習(xí)的腫瘤免疫治療應(yīng)答預(yù)測(cè)研究. 軟件, 2019, 40(1): 97–102.

      [23] Tibshirani R. Regression Shrinkage and Selection via the Lasso. J Royal Statist Soc, 1996, 58(1): 267–288.

      Application of immune cell infiltration in the diagnosis and prognosis of non-small cell lung cancer

      Huihui Wan1, Zhenhao Liu2,3, Xiaoxiu Tan1, Guangzhi Wang4, Yong Xu1, Lu Xie2, and Yong Lin1

      1 School of Medical Instrument and Food Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China 2 Shanghai Center for Bioinformation Technology, Shanghai 201203, China 3 Xiangya Hospital, Central South University, Changsha 410008, Hunan, China 4 College of Food Science and Technology, Shanghai Ocean University, Shanghai 201306, China

      Immune cell infiltration is of great significance for the diagnosis and prognosis of cancer. In this study, we collected gene expression data of non-small cell lung cancer (NSCLC) and normal tissues included in TCGA database, obtained the proportion of 22 immune cells by CIBERSORT tool, and then evaluated the infiltration of immune cells. Subsequently, based on the proportion of 22 immune cells, a classification model of NSCLC tissues and normal tissues was constructed using machine learning methods. The AUC, sensitivity and specificity of classification model built by random forest algorithm reached 0.987, 0.98 and 0.84, respectively. In addition, the AUC, sensitivity and specificity of classification model of lung adenocarcinoma and lung squamous carcinoma tissues constructed by random forest method 0.827, 0.75 and 0.77, respectively. Finally, we constructed a prognosis model of NSCLC by combining the immunocyte score composed of 8 strongly correlated features of 22 immunocyte features screened by LASSO regression with clinical features. After evaluation and verification, C-index reached 0.71 and the calibration curves of three years and five years were well fitted in the prognosis model, which could accurately predict the degree of prognostic risk. This study aims to provide a new strategy for the diagnosis and prognosis of NSCLC based on the classification model and prognosis model established by immune cell infiltration.

      NSCLC, immune cell infiltration, machine learning, random forest, classification model, LASSO regression, prognosis model

      June 4, 2019;

      September 9, 2019

      Yong Lin. Tel: +86-21-55271119; E-mail: yong_lynn@163.com

      Lu Xie. Tel: +86-21-20283705; E-mail: luxiex2017@outlook.com

      10.13345/j.cjb.190232

      萬輝輝, 劉振浩, 澹小秀, 等. 免疫細(xì)胞浸潤(rùn)在非小細(xì)胞肺癌診斷與預(yù)后中的應(yīng)用. 生物工程學(xué)報(bào), 2020, 36(4): 740–749.

      Wan HH, Liu ZH, Tan XX, et al. Application of immune cell infiltration in the diagnosis and prognosis of non-small cell lung cancer. Chin J Biotech, 2020, 36(4): 740–749.

      (本文責(zé)編 郝麗芳)

      猜你喜歡
      肺癌分類特征
      中醫(yī)防治肺癌術(shù)后并發(fā)癥
      對(duì)比增強(qiáng)磁敏感加權(quán)成像對(duì)肺癌腦轉(zhuǎn)移瘤檢出的研究
      分類算一算
      如何表達(dá)“特征”
      不忠誠(chéng)的四個(gè)特征
      分類討論求坐標(biāo)
      數(shù)據(jù)分析中的分類討論
      教你一招:數(shù)的分類
      抓住特征巧觀察
      microRNA-205在人非小細(xì)胞肺癌中的表達(dá)及臨床意義
      丁青县| 镇江市| 义乌市| 敖汉旗| 延长县| 黄石市| 洪洞县| 德令哈市| 渝北区| 龙井市| 靖州| 黄冈市| 阿尔山市| 乌拉特后旗| 营山县| 鄂托克旗| 腾冲县| 静宁县| 扎兰屯市| 宜兰市| 渭源县| 大洼县| 常宁市| 唐海县| 古丈县| 蒙自县| 田阳县| 金沙县| 高要市| 娄底市| 荥阳市| 岢岚县| 武山县| 岳普湖县| 平顶山市| 会理县| 吉水县| 乐山市| 启东市| 玉龙| 长子县|