• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      DNA甲基化驅(qū)動的轉(zhuǎn)錄表達特征作為肝癌預后預測標志物的價值

      2020-08-28 04:14:02駱紅波曹鵬博周鋼橋
      遺傳 2020年8期
      關(guān)鍵詞:隊列甲基化基因組

      駱紅波,曹鵬博,周鋼橋,

      研究報告

      DNA甲基化驅(qū)動的轉(zhuǎn)錄表達特征作為肝癌預后預測標志物的價值

      駱紅波1,曹鵬博2,周鋼橋1,2

      1. 貴州大學醫(yī)學院,貴陽 550025 2. 軍事科學院軍事醫(yī)學研究院輻射醫(yī)學研究所,蛋白質(zhì)組學國家重點實驗室,國家蛋白質(zhì)科學中心(北京),北京 100850

      肝細胞癌(hepatocellular carcinoma,簡稱肝癌)是最常見的惡性腫瘤之一。DNA甲基化的異常是惡性腫瘤的特征之一,并被發(fā)現(xiàn)在肝癌等腫瘤的發(fā)生發(fā)展中發(fā)揮重要作用。為了能為肝癌患者提供新的臨床預后預測標志物,本研究首先采用整合組學分析策略在全基因組范圍內(nèi)鑒定與肝癌患者預后相關(guān)的DNA甲基化驅(qū)動的差異表達基因;然后,采用LASSO (least absolute shrinkage and selection operator)分析建立了10個最優(yōu)基因組合的預后預測模型。Cox比例風險回歸分析顯示,在校正臨床特征參數(shù)后,此預測模型高風險評分與患者不良預后顯著相關(guān),表明該模型具有潛在的獨立預后價值。受試者工作特征(receiver operating characteristic, ROC)曲線分析顯示該風險評分模型在預測患者短期和長期預后方面優(yōu)于其他已被報道的肝癌預后預測模型?;蚣患治?gene set enrichment analysis, GSEA)表明,高風險評分與細胞周期和DNA損傷修復通路相關(guān)。以上結(jié)果表明,本研究構(gòu)建了一個基于10個DNA甲基化驅(qū)動基因的預后風險評分模型,該模型可作為肝癌患者的潛在預后生物標志物,有助于肝癌患者的生存預后評估和治療策略的指導。

      肝癌;轉(zhuǎn)錄組;表觀基因組;預后模型

      肝細胞癌(hepatocellular carcinoma;簡稱肝癌)是最常見的原發(fā)性肝癌,也是全球范圍內(nèi)與癌癥相關(guān)死亡的主要原因之一[1]。盡管現(xiàn)代醫(yī)學的發(fā)展和多種治療策略的結(jié)合較好地改善了肝癌患者的臨床預后,但由于肝癌的高轉(zhuǎn)移或高復發(fā)率,這些患者的長期預后狀況仍然較差[2]。鑒定新的與肝癌復發(fā)及生存相關(guān)的分子,能為肝癌患者的臨床預后預測提供新的候選標志物。

      DNA甲基化(methylation)是最早被發(fā)現(xiàn)的DNA修飾類型之一。已有研究表明DNA甲基化能夠引起染色質(zhì)結(jié)構(gòu)和DNA穩(wěn)定性等發(fā)生改變,從而調(diào)控基因的表達[3]。位于啟動子區(qū)域的異常DNA甲基化通常導致抑癌基因的轉(zhuǎn)錄沉默或癌基因的高表達,從而促進腫瘤的進展[4]。因此,DNA甲基化異常在肝癌等腫瘤的發(fā)生發(fā)展中發(fā)揮重要作用[5]。

      為建立肝癌相關(guān)異常DNA甲基化所調(diào)控基因的預后預測模型,本研究通過肝癌組織的轉(zhuǎn)錄組和表觀基因組的整合分析,鑒定出一系列與肝癌預后相關(guān)的DNA甲基化驅(qū)動的差異表達基因,并建立了一個高置信的肝癌預后預測模型,為肝癌患者的預后風險分層、預后評估及治療策略的選擇提供了新的參考指標,具有一定的潛在應(yīng)用價值。

      1 材料與方法

      1.1 研究對象

      本研究主要分為3個階段:候選DNA甲基化驅(qū)動的差異表達基因的發(fā)掘階段、模型訓練階段和模型驗證階段,共包括8個肝癌隊列(1042個肝癌臨床組織樣本;表1,圖1A)。對于涉及患者臨床資料的分析,去除生存時間未知和TNM (tumour node me-tastasis)分期未知的患者。

      發(fā)掘階段:從基因表達匯編數(shù)據(jù)庫(gene expre-ssion omnibus, GEO)下載獲得2個肝癌組織及癌旁配對組織的DNA甲基化數(shù)據(jù)集(GEO: GSE89852和GSE54503),以及2個肝癌組織及癌旁配對組織的轉(zhuǎn)錄組RNA測序數(shù)據(jù)集(GEO: SRP069212和SRP-118972)。

      模型建立階段:從癌癥基因組圖譜-肝細胞癌項目(the cancer genome atlas-liver hepatocellular carci-noma, TCGA-LIHC)下載獲得level 3轉(zhuǎn)錄組RNA測序數(shù)據(jù)和DNA甲基化數(shù)據(jù)以及臨床信息數(shù)據(jù)。該隊列用于驗證發(fā)掘階段所鑒定出的DNA甲基化驅(qū)動的差異表達基因及建立和訓練預后預測模型。

      模型驗證階段:包括3個獨立的肝癌隊列。從國際癌癥基因組聯(lián)盟(international cancer genome co-nsortium, ICGC)獲得的日本肝癌項目(liver cancer- RIKEN of JP project)的轉(zhuǎn)錄組基因表達譜數(shù)據(jù)集作為第1個模型驗證隊列,從GEO下載的GSE76427以及GSE84005表達譜數(shù)據(jù)集分別作為第2和3個模型驗證隊列。

      1.2 差異表達基因及差異甲基化基因的鑒定

      針對GEO下載的RNA測序數(shù)據(jù),采用STAR軟件[6]以hg19基因組為參考進行比對,然后采用HTseq-count軟件[7]進行基因表達的定量。采用DESeq2軟件[8]進行差異表達分析,差異表達基因(differently expressed gene, DEG)的篩選標準為|log2[fold change]|≥1.5且錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.05。

      表1 本研究中涉及的所有肝癌隊列

      GEO:基因表達匯編數(shù)據(jù)庫(Gene Expression Omnibus);ICGC-LIRI-JP:國際癌癥基因組聯(lián)盟日本肝癌項目(international cancer genome consortium liver cancer-RIKEN of JP project);TCGA-LIHC:癌癥基因組圖譜-肝細胞癌項目(the cancer genome atlas-liver hepatocellular carcinoma)。

      采用ChAMP軟件[9]處理DNA甲基化數(shù)據(jù),通過limma軟件包[10]對肝癌和癌旁間每個CpG位點甲基化水平(β)進行檢驗。差異甲基化的CpG位點定義為:|Δβ|>0.25且FDR<0.05。對于匹配到多個DNA甲基化探針的基因,選擇甲基化水平倍數(shù)變化顯著的作為代表[11]。

      利用維恩圖獲得上述發(fā)掘的2個候選基因集合(即差異表達基因和差異甲基化基因)間的重疊基因,即可得到肝癌組織中相對癌旁組織“高甲基化–低表達”和“低甲基化–高表達”的基因,作為后續(xù)LASSO (least absolute shrinkage and selection operator)回歸分析的候選基因。

      1.3 預后預測評分模型的建立

      基于發(fā)掘的候選基因,采用兩個步驟來構(gòu)建預后預測評分模型。首先,通過單因素Cox回歸分析獲得與模型訓練隊列中患者總體生存期(overall survival)相關(guān)的候選基因(<0.05),然后通過具有Cox比例風險模型的LASSO回歸根據(jù)最佳懲罰因子(λ)對候選基因進行降維篩選[12]。LASSO回歸是一種根據(jù)λ縮小回歸系數(shù)的方法,一些系數(shù)可能會縮小為0,然后從模型中刪除。將具有Cox比例風險模型的LASSO回歸應(yīng)用于模型訓練隊列,然后基于10倍交叉驗證(10-fold cross validation)確定最佳懲罰因子,進而估計模型系數(shù)。如果系數(shù)為0,則刪除對應(yīng)的基因,然后將保留系數(shù)不為0的基因用于構(gòu)建預后預測評分模型。每位患者的風險分數(shù)可以通過以下公式計算得出:

      風險評分(Risk score)=(EXPgene1×βgene1)+

      (EXPgene2×βgene2)+…+(EXPgenen×βgenen)

      其中EXPgene代表某一特定基因的表達水平,βgene代表LASSO回歸系數(shù)。

      以患者總體風險評分的中位數(shù)為界,將隊列中的患者劃分為高風險組和低風險組。采用單因素和多因素Cox回歸分析計算該風險模型對總體生存期的風險比例(hazard ratios, HR)。采用時間依賴的受試者工作特征曲線(time-dependent receiver operating characteristic curve, time-dependent ROC)評估該風險模型在預測患者預后方面的性能[13]。

      1.4 列線圖的建立

      用多因素Cox回歸構(gòu)建列線圖(nomogram)來量化患者的風險評估,進而預測患者的臨床預后。分析中納入模型訓練隊列和模型驗證隊列共有的臨床參數(shù),包括:性別、年齡、腫瘤分期和基于預測模型計算的風險評分。列線圖通過rms工具包構(gòu)建,同時采用校準曲線(calibration curves)用來評價該模型在預測患者生存的準確性[14]。

      1.5 基因集富集分析

      基于KEGG基因集,采用基因富集分析(gene set enrichment analysis, GSEA)對高、低風險組(基于中位數(shù)分組)進行富集分析,鑒定與生存風險相關(guān)的信號通路,參考基因集為MsigDB (6.2版本),樣本置換檢驗1000次,F(xiàn)DR<0.05作為差異顯著性的評價標準。

      1.6 統(tǒng)計分析

      采用R 3.4.4軟件進行所有的統(tǒng)計學分析。采用survival工具包繪制Kaplan-Meier生存曲線,采用Log-rank檢驗計算生存率差異顯著性。采用2檢驗計算組間患者臨床特征分布差異。對于所有的假設(shè)檢驗,<0.05被認為有統(tǒng)計學意義。

      2 結(jié)果與分析

      2.1 鑒定肝癌組織中DNA甲基化驅(qū)動的差異表達基因

      為了鑒定肝癌中DNA甲基化變化驅(qū)動的差異表達基因,本研究在發(fā)掘隊列肝癌組織和配對癌旁組織的數(shù)據(jù)集中進行了全基因組層面的差異表達基因及差異DNA甲基化基因的整合分析。通過差異表達分析共鑒定到547個基因在肝癌組織中上調(diào)表達和291個基因在肝癌組織中下調(diào)表達(圖1B);通過差異甲基化分析共鑒定到788個基因在肝癌組織中高甲基化和5126個基因在肝癌組織中低甲基化(圖1B)。通過取這兩組基因集合的交集,在發(fā)掘隊列中共鑒定出197個“低甲基化–高表達”基因和18個“高甲基化–低表達”基因(圖1B)。在這215個基因中,有163個基因(占75.8%)在模型訓練隊列中被成功地重復,其中包括153個“低甲基化–高表達”基因和10個“高甲基化–低表達”基因。熱圖顯示這163個候選基因在發(fā)掘隊列和模型訓練隊列中DNA甲基化水平和表達水平高度一致(圖1C)。

      2.2 采用LASSO回歸分析建立由10個基因組合的肝癌預后預測評分模型

      針對這163個基因,首先在模型訓練隊列中進行了單因素Cox比例風險回歸分析,共鑒定出51個與肝癌患者預后顯著相關(guān)的候選基因(均<0.05)。隨后,LASSO回歸進一步降維篩選出其中10個有顯著性的候選基因組合用于風險模型的構(gòu)建(、、、、、、、、和;表2,圖2A)。除此之外,在模型訓練隊列中對這10個基因的基因組變異頻率進行分析,結(jié)果顯示它們均表現(xiàn)出低頻(≤10%)的點突變或拷貝數(shù)變異(表2),表明表觀遺傳的改變可能是導致這些基因在肝癌中發(fā)生表達異常的主要原因。

      基于這10個基因的表達水平及其對應(yīng)的LASSO回歸分析的系數(shù),在模型訓練隊列中建立了預后評分模型:風險評分(Risk score)=(?0.1766× EXP)+(0.08869×EXP)+(0.01347×EXP)+(0.001652×EXP)+(0.003126×EXP)+(0.03600×EXP)+(0.06524×EXP)+(0.1194×EXP)+ (0.1932×EXP)+(0.2597×EXP)。根據(jù)風險評分的中位數(shù),將肝癌患者分為高風險組和低風險組(表3)。單因素Cox比例風險回歸分析顯示,高風險評分與患者較短的總體生存率顯著相關(guān)(<0.0001;圖2B)。進一步采用多因素Cox分析校正患者的腫瘤分期,結(jié)果顯示高風險評分仍然是肝癌患者總體生存期的獨立風險因素(<0.0001;表3)。此外,該風險評分預測患者1年、2年、3年、4年和5年的生存率對應(yīng)曲線下面積AUC(areas under the curve)分別為0.82、0.74、0.72、0.68和0.66 (圖2B),提示該模型能較好預測模型隊列中患者預后情況。

      2.3 基于10個基因的肝癌預后預測評分模型在驗證隊列中表現(xiàn)出良好的預測能力

      隨后,在另外3個獨立肝癌隊列中驗證此預測評分模型的性能。在驗證隊列1(包含203例肝癌患者)中,高風險評分與肝癌患者較短的總體生存期顯著相關(guān)(=0.0015,圖2C);在校正患者的腫瘤分期后,高風險評分仍然顯示為肝癌患者總體生存期的獨立風險因素(=0.025;表3);ROC分析顯示,雖然預測模型在驗證隊列1中的預測能力略差于發(fā)掘隊列,但該模型仍具有良好的預測性能,預測模型在此隊列中預測患者1年、2年、3年和4年生存率的AUC分別為0.67、0.75、0.68和0.63 (圖2C)。在驗證隊列2(包含115例肝癌患者)中,雖然沒有臨床特征參數(shù)表現(xiàn)出顯著的預后價值(表3),但高風險評分也與肝癌患者較短的總體生存期顯著相關(guān)(= 0.0014;圖2C);風險評分預測1年、2年、3年、4年和5年生存率的AUC分別為0.63、0.60、0.63、0.69和0.69 (圖2C)。在驗證隊列3 (包含37例肝癌患者)中,雖然沒有臨床特征參數(shù)表現(xiàn)出顯著的預后價值,但是風險評分仍然與肝癌患者的總體生存期顯著相關(guān)(=0.0016;圖2C) (表3);且其預測肝癌患者1年、2年、3年和4年生存率的AUC分別達到0.79、0.71、0.66和0.57 (圖2C)。綜上,本研究建立的預測評分模型可以顯著地將肝癌患者分為預后高風險組和低風險組。

      圖1 肝癌中DNA甲基化驅(qū)動的差異表達基因的鑒定

      A:研究技術(shù)路線圖。主要包括候選DNA甲基化驅(qū)動的差異表達基因的發(fā)掘階段、模型訓練階段和模型驗證和評估階段。B:在發(fā)掘隊列中鑒定出的DNA甲基化驅(qū)動的差異表達基因數(shù)量。上圖為鑒定出的“低甲基化–高表達”基因數(shù)量,下圖為鑒定出“高甲基化–低表達”基因數(shù)量。C:在發(fā)掘隊列和模型訓練隊列中DNA甲基化驅(qū)動的差異表達基因的熱圖。左圖為基因DNA甲基化水平熱圖(平均甲基化水平),右圖為基因表達熱圖(平均表達水平)。ICGC-LIRI-JP:國際癌癥基因組聯(lián)盟日本肝癌項目(international cancer genome consortium liver cancer-RIKEN of JP project);N:肝癌癌旁組織數(shù)量;T:肝癌組織數(shù)量;TCGA-LIHC:癌癥基因組圖譜–肝細胞癌項目(the cancer genome atlas-liver hepatocellular carcinoma);β:基因的DNA甲基化水平。

      表2 10個最優(yōu)基因的Cox比例風險回歸分析結(jié)果、LASSO回歸系數(shù)和基因組變異頻率

      基因組變異頻率數(shù)據(jù)來源于cBioportal數(shù)據(jù)庫(https://www.cbioportal.org/) 癌癥基因組圖譜-肝細胞癌項目,包括點突變頻率及拷貝數(shù)變異頻率。:置信區(qū)間(confidence interval);HR:風險比例(hazard ratio)。

      2.4 整合的臨床參數(shù)與預后預測評分模型建立列線圖

      為了進一步建立可應(yīng)用于預測肝癌患者總體生存率預測的直接定量方法,在模型訓練隊列中,將預測模型評分和臨床特征參數(shù)進行多因素Cox比例風險回歸分析構(gòu)建列線圖(圖3A)。列線圖顯示,相比較其他臨床特征參數(shù),預后預測評分模型貢獻了最大的風險值(范圍為0~100) (圖3A),提示此預測模型在所有列線圖變量中的作用最為顯著。由于本研究中有2個驗證隊列生存超過4年的樣本例數(shù)較少,為了避免結(jié)果的偏倚,校正曲線圖只計算3年生存期預測的準確性。結(jié)果可見,通過列線圖構(gòu)建的模型能夠較好地預測肝癌患者的3年生存狀態(tài)(圖3B)。

      2.5 基于10個基因的肝癌預后預測評分模型優(yōu)于其他模型

      為了進一步評估此模型的預測性能,本研究比較了該預測模型與上述建立的列線圖、腫瘤分期系統(tǒng)以及3個已被報道的肝癌預后模型[Zheng等[15]的4基因模型(、、、)、Yang等[16]的3基因模型(、、)和Long等[17]的2基因模型(、)]的預測性能。有趣的是,無論是在模型訓練隊列還是在3個驗證隊列中,本研究建立的10個基因的預后預測模型與列線圖對患者總體生存期的預測性能大致相同(圖4)。經(jīng)對比發(fā)現(xiàn),此10個基因的預后預測模型和列線圖在模型訓練隊列中比其他3個已被報道的模型和腫瘤分期系統(tǒng)表現(xiàn)出更好的預測性能(圖4A)。在3個驗證隊列中,本研究的模型預測1年總體生存期(驗證隊列1~3的AUC分別為0.67、0.63和0.79),3年總體生存期(驗證隊列1~3的AUC分別為0.68、0.63和0.66)和5年總體生存期(驗證隊列2的AUC為0.69)的結(jié)果表明10個基因的預后預測模型在預測短期和長期生存期方面均表現(xiàn)出良好的性能(圖4B)。綜上所述,本研究建立的預后評分模型在預測肝癌患者總體生存期方面顯示出與整合臨床特征參數(shù)的列線圖相似的能力,且優(yōu)于傳統(tǒng)的腫瘤分期系統(tǒng)和其他已被報道的模型。

      圖2 建立和驗證10個基因的預后評分模型

      A:使用LASSO回歸分析和10倍交叉驗證構(gòu)建預后預測評分模型。左圖為基于最小原則(minimum criteria)采用10倍交叉驗證對LASSO模型進行調(diào)參,通過LASSO回歸交叉驗證計算的部分似然偏差(partial likelihood deviance)被繪制為log(λ)的函數(shù)。y軸表示部分似然偏差,x軸表示log(λ),沿x軸上方的數(shù)字表示預測變量的平均數(shù)量,紅點表示具有給定λ的每個模型的平均偏差值,穿過紅點的豎線表示偏差的上限值和下限值,垂直虛線分別表示最小誤差的λ值和最大λ值。右圖為51個預后基因的LASSO系數(shù)分布,垂直虛線表示采用10倍交叉驗證選取的基因數(shù),當基因數(shù)為10時,部分似然偏差為最小值,對應(yīng)最小λ值。B:基于LASSO系數(shù)和基因表達在模型訓練隊列建立預后模型。左圖為模型訓練隊列中肝癌患者的風險評分及生存時間的散點圖,中間圖為模型訓練隊列中不同風險評分組(中位數(shù)分組)患者的生存曲線圖,右圖為采用ROC曲線分析評估預測模型對訓練隊列中患者生存率的預測性能。C:在模型驗證隊列中驗證預后模型。左圖為模型驗證隊列中肝癌患者的風險評分及生存時間的散點圖,中間圖為模型驗證隊列中不同風險評分組(中位數(shù)分組)患者的生存曲線圖,右圖為ROC曲線分析評估預測模型對驗證隊列中患者生存率的預測性能。由于驗證隊列1和3中患者達到5年生存的數(shù)量較少,所以并未對患者5年生存率進行ROC分析??ǚ綑z驗(2)用于評價組間患者生存分布差異;組間生存差異采用Log-rank方法進行比較;ROC分析用于評估模型預測性能。AUC:曲線下面積(area under curve);:置信區(qū)間(confidence interval);HR:風險比例(hazard ratios);LASSO:最小絕對值收斂和選擇算子(least absolute shrinkage and selection operator);ROC:受試者工作特征曲線(receiver operating characteristic curve)。

      圖3 基于列線圖評估肝癌患者的預后

      Fig. 3 The nomogram for predicting the overall survival of HCC patients

      A:列線圖預測模型訓練隊列中患者1年、3年和5年的生存情況;B:校正曲線描繪列線圖預測患者3年生存與實際情況之間的一致性。粉紅色實線表示列線圖的預測性能,45°斜線表示一種理想的校正模型。TNM:腫瘤淋巴結(jié)轉(zhuǎn)移(tumor node metastasis)。

      2.6 不同的風險評分組具有生物學差異

      采用基因集富集分析(gene set enrichment ana-lysis, GSEA)探索與高風險評分或低風險評分相關(guān)的生物學信號通路(圖5A),結(jié)果顯示高風險組顯著富集于與DNA復制、細胞周期和DNA修復相關(guān)的信號通路(圖5B),表明高風險評分反映了增殖信號和DNA修復信號傳導的異常,這些通路的異常已經(jīng)被報道是腫瘤發(fā)生發(fā)展的驅(qū)動力[18]。相反地,低風險組顯著富集于與補體和凝血級聯(lián)、脂肪酸、藥物和丙酸酯代謝等肝代謝途徑(圖5B),提示低風險評分的患者保留了相對正常的肝功能,這可以保護肝癌患者免受各種藥物引起的持續(xù)藥物毒性。

      3 討論

      缺乏有效和可靠的預后生物標志物或預測模型仍然是改善肝癌患者臨床結(jié)局的主要挑戰(zhàn)。已有研究表明,表觀遺傳異常和基因組異常變化是導致肝癌發(fā)生發(fā)展的重要原因[19]。因此,迫切需要有效和可靠的表觀遺傳生物標志物作為肝癌患者預后預測指標和治療靶標。本研究基于肝癌組織的轉(zhuǎn)錄組與表觀基因組,采用整合組學的分析策略,發(fā)現(xiàn)了一系列與肝癌預后相關(guān)的DNA甲基化驅(qū)動的差異表達基因,并建立了一個高置信的肝癌預后預測模型,為肝癌患者的生存預后評估提供了候選參考標準,將有助于指導臨床治療策略的選擇。

      生物標志物不僅可以作為腫瘤患者預后預測工具,而且對測量治療反應(yīng),監(jiān)測腫瘤復發(fā)以及指導臨床決策具有重要意義。近來,已經(jīng)提出了幾個基于DNA甲基化驅(qū)動的基因建立的肝癌預后模型,包括Zheng等[15]的4基因模型、Yang等[16]的3基因模型和Long等[17]的2基因模型。但是,這些模型大多數(shù)是在小型隊列中建立或缺乏獨立隊列驗證。本研究使用大規(guī)模的模型訓練隊列(即 TCGA-LIHC,371 例肝癌組織樣本)建立了10個基因的預后預測評分模型,并在兩個公共的獨立大規(guī)模驗證隊列(即 ICGC-LIRI-JP,203例肝癌組織樣本;GSE76427,115例肝癌組織樣本)中進一步驗證了該模型。與那些已報道的預測模型和傳統(tǒng)的TNM分期系統(tǒng)相比,本研究的10個基因預后預測評分模型顯示出更優(yōu)的預測能力。此外,本研究的10個基因預后預測評分模型的預測能力與整合有風險評分模型和臨床特征的列線圖預測能力相似。因此,本研究建立的10個基因預后預測評分模型為預測肝癌患者的預后提供一種簡單而準確的方法。

      圖4 基于10個基因的肝癌預后預測評分模型的預測性能優(yōu)于其他模型

      A:模型訓練隊列中預測性能的比較;B:模型驗證隊列中預測性能的比較。采用ROC曲線分析比較本研究的10個基因預測模型與其他5個模型(列線圖模型、TNM階段、Zheng等[15]的4基因模型、Yang等[16]的3基因模型和Long等[17]的2基因模型)的預測性能。AUC:曲線下面積(area under curve);ROC:受試者工作特征曲線(receiver operating characteristic curve)。

      圖5 模型訓練隊列和驗證列中的基因集富集分析

      A:在模型訓練隊列和驗證隊列中的基因GSEA結(jié)果展示。藍色和紅色點分別表示在低風險組和高風險組(中位數(shù)分組)中顯著富集的基因集,點的大小表示為值,基因集至少在2個隊列中顯著富集(FDR<0.05)才被繪制。B:在模型訓練隊列和驗證隊列中最顯著富集基因集的GSEA圖。FDR:錯誤發(fā)現(xiàn)率(false discovery rate);GSEA:基因集富集分析(gene set enrichment analysis);NES:標準化富集分數(shù)(normalized enrichment score)。

      肝癌是一種高異質(zhì)性的腫瘤,探索與肝癌進展有關(guān)的失調(diào)基因可能有助于改善治療策略和預后。在本研究的預后預測評分模型中,這10個特征基因在肝癌組織中均呈現(xiàn)低DNA甲基化引起的高表達。GSEA分析表明,高風險評分與DNA復制、細胞增殖和DNA修復等通路改變有關(guān)。在這10個基因中,其中8個已被報道在肝癌組織中高表達。在這8個基因中,、、和已被報道與DNA損傷響應(yīng)和細胞周期檢查點密切相關(guān)[20~22];同時,、、和被發(fā)現(xiàn)參與調(diào)控多條與腫瘤進展相關(guān)的激酶通路[23~25]。其他兩個基因和尚未有與腫瘤相關(guān)的研究報道。但是,作為微管相關(guān)蛋白可以參與細胞的遷移[26];可以通過泛素化降解膽固醇受體LXR參與調(diào)節(jié)高密度脂蛋白的代謝[27]。因此,本研究首次鑒定發(fā)現(xiàn)和可以作為肝癌患者的預后標志物,它們可能在肝癌發(fā)生發(fā)展中發(fā)揮重要作用,具有成為新候選靶標的潛力。

      綜上所述,本研究通過表觀基因組和轉(zhuǎn)錄組整合分析建立的預后預測評分模型為肝癌患者預后評估提供了一種簡單而準確的方法,為患者生存的預測和治療策略的選擇提供指導。

      [1] Villanueva A. Hepatocellular carcinoma., 2019, 380(15): 1450–1462.

      [2] Samonakis DN, Kouroumalis EA. Systemic treatment for hepatocellular carcinoma: still unmet expectations., 2017, 9(2): 80–90.

      [3] Zhang JW, Xu Q, Li GL. Epigenetics in the genesis and development of cancers.(), 2019, 41(7): 567–581.張競文, 續(xù)倩, 李國亮. 癌癥發(fā)生發(fā)展中的表觀遺傳學研究. 遺傳, 2019, 41(7): 567–581.

      [4] Sun LY, Li XY, Sun ZW. Progress of epigenetics and its therapeutic application in hepatocellular carcinoma.(), 2015, 37(6): 517–527.孫凌云, 李星逾, 孫志為. 原發(fā)性肝癌的表觀遺傳學及其治療. 遺傳, 2015, 37(06): 517–527.

      [5] Tan AC, Jimeno A, Lin SH, Wheelhouse J, Chan F, Solomon A, Rajeshkumar NV, Rubio-Viqueira B, Hidalgo M. Characterizing DNA methylation patterns in pancreatic cancer genome., 2009, 3(5–6): 425–438.

      [6] Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, Batut P, Chaisson M, Gingeras TR. STAR: ultrafast universal RNA-seq aligner., 2013, 29(1): 15–21.

      [7] Kim D, Langmead B, Salzberg SL. HISAT: a fast spliced aligner with low memory requirements., 2015, 12(4): 357–360.

      [8] Love MI, Huber W, Anders S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2., 2014, 15(12): 550.

      [9] Morris TJ, Butcher LM, Feber A, Teschendorff AE, Chakravarthy AR, Wojdacz TK, Beck S. ChAMP: 450k chip analysis methylation pipeline., 2014, 30(3): 428–430.

      [10] Ritchie ME, Phipson B, Wu D, Hu YF, Law CW, Shi W, Smyth GK. Limma powers differential expression analyses for RNA-sequencing and microarray studies., 2015, 43(7): e47.

      [11] Mah WC, Thurnherr T, Chow PKH, Chung AYF, Ooi LLPJ, Toh HC, Teh BT, Saunthararajah Y, Lee CGL. Methylation profiles reveal distinct subgroup of hepatocellular carcinoma patients with poor prognosis., 2014, 9(8): e104158.

      [12] Friedman J, Hastie T, Tibshirani R. Regularization paths for generalized linear modelscoordinate descent., 2010, 33(1): 1–22.

      [13] Blanche P, Dartigues JF, Jacqmin-Gadda H. Estimating and comparing time-dependent areas under receiver operating characteristic curves for censored event times with competing risks., 2013, 32(30): 5381–5397.

      [14] Steyerberg EWS, Vergouwe Y. Towards better clinical prediction models: seven steps for development and an ABCD for validation., 2014, 35(29): 1925– 1931.

      [15] Zheng YJ, Liu YL, Zhao SF, Zheng ZT, Shen CY, An L, Yuan YL. Large-scale analysis reveals a novel risk score to predict overall survival in hepatocellular carcinoma., 2018, (10): 6079–6096.

      [16] Yang Y, Lu Q, Shao XJ, Mo BH, Nie XQ, Liu W, Chen XH, Tang Y, Deng YC, Yan J. Development of a three-gene prognostic signature for hepatitis b virus associated heap-tocellular carcinoma based on integrated transcriptomic analysis., 2018, 9(11): 1989–2002.

      [17] Long JY, Chen PP, Lin JZ, Bai Y, Yang X, Bian J, Lin Y, Wang DX, Yang XB, Zheng YC, Sang XT, Zhao HT. DNA methylation-driven genes for constructing diagnostic, prognostic, and recurrence models for hepatocellular carcinoma., 2019, 9(24): 7251–7267.

      [18] Torgovnick A, Schumacher B. DNA repair mechanisms in cancer development and therapy., 2015, 6: 157.

      [19] Feitelson MA. Parallel epigenetic and genetic changes in the pathogenesis of hepatitis virus-associated hepatocellular carcinoma., 2006, 239(1): 10–20.

      [20] Liu LL, Dai YD, Chen JN, Zeng TT, Li Y, Chen LL, Zhu YH, Li JC, Li Y, Ma S, Xie D, Yuan YF, Guan XY. Maelstrom promotes hepatocellular carcinoma metastasis by inducing epithelial-mesenchymal transition by way of Akt/GSK-3β/Snail signaling., 2014, 59(2): 531–543.

      [21] Zhang ZY, Zhu JF, Huang YS, Li WB, Cheng HQ. MYO18B promotes hepatocellular carcinoma progression by activating PI3K/AKT/mTOR signaling pathway., 2018, 13(1): 85.

      [22] Cao D, Song XH, Che L, Li XL, Pilo MG, Vidili G, Porcu A, Solinas A, Cigliano A, Pes GM, Ribback S, Dombrowski F, Chen X, Li L, Calvisi DF. Both de novo synthetized and exogenous fatty acids support the growth of hepatocellular carcinoma cells., 2017, 37(1): 80–89.

      [23] Liu P, Atkinson SJ, Akbareian SE, Zhou ZG, Munsterberg A, Robinson SD, Bao YP. Sulforaphane exerts anti-angiogenesis effects against hepatocellular carcinoma through inhibition of STAT3/HIF-1α/VEGF signalling., 2017, 7(1): 12651.

      [24] Wang HX, Wu KJ, Sun Y, Li YD, Wu MY, Qiao Q, Wei YJ, Han ZG, Cai B. STC2 is upregulated in hepatocellular carcinoma and promotes cell proliferation and migration., 2012, 45(11): 629–634.

      [25] Chen JX, Rajasekaran M, Xia HP, Zhang XQ, Kong SN, Sekar K, Seshachalam VP, Deivasigamani A, Goh BKP, Ooi LL, Hong WJ, Hui KM. The microtubule-associated protein PRC1 promotes early recurrence of hepatocellular carcinoma in association with the Wnt/β-catenin signalling pathway., 2016, 65(9): 1522–1534.

      [26] Desai A, Mitchison TJ. Microtubule polymerization dynamics., 1997, 13: 83–117.

      [27] Safran M, Dalah I, Alexander J, Rosen N, Stein TI, Shmoish M, Nativ N, Bahir I, Doniger T, Krug H, Sirota-Madi A, Olender T, Golan Y, Stelzer G, Harel A, Lancet D. GeneCards Version 3: the human gene integrator., 2010, 2010:baq020.

      Prognostic and predictive value of a DNA methylation-driven transcriptional signature in hepatocellular carcinoma

      Hongbo Luo1, Pengbo Cao2, Gangqiao Zhou1,2

      Hepatocellular carcinoma (HCC) is one of the most common cancers worldwide. DNA methylation alterations are frequently observed in malignant tumours and play critical roles in the development of cancers, including HCC. To provide novel clinical prognosis biomarkers for HCC patients, we first performed a comprehensive analysis and identified a collection of prognosis-associated genes with DNA methylation-driven expression dysregulation in HCCs. Then, we optimally established a 10-gene prognostic risk score model using the least absolute shrinkage and selection operator (LASSO) analysis. Cox's proportional hazards regression analysis revealed that the high-risk score is significantly associated with poor prognosis after being adjusted by clinical parameters, indicating its potential prognostic value. The receiver operating characteristic curve (ROC) analysis showed that this 10-gene prognostic risk score model outperformed several other publicly available models in predicting both short- and long-term prognosis. Gene set enrichment analysis revealed that the high-risk score is relevantly associated with pathways involved in cell cycle and DNA damage repair. The above results indicate that we have constructed a 10-DNA-methylation-driven-gene prognostic risk score model, which might serve as a potential prognostic biomarker for HCC patients and guide treatment decisions for patients at high risk of tumour progression.

      hepatocellular carcinoma;transcriptome;epigenome;prognostic model

      2020-05-18;

      2020-07-10

      國家科技重大專項艾滋病和病毒性肝炎等重大傳染病防治專項項目(編號:2018ZX10732202, 2017ZX10203205)資助[Supported by the National S&T Major Project (Nos. 2018ZX10732202, 2017ZX10203205)]

      駱紅波,碩士研究生,專業(yè)方向:肝癌轉(zhuǎn)錄組學。E-mail: 965589073@qq.com

      曹鵬博,博士,副研究員,研究方向: 醫(yī)學遺傳與基因組學。E-mail: birchcpb@163.com周鋼橋,博士,研究員,研究方向:醫(yī)學遺傳與基因組學。E-mail: zhougq114@126.com

      10.16288/j.yczz.20-139

      2020/7/13 11:48:46

      URI: https://kns.cnki.net/kcms/detail/11.1913.R.20200710.1712.002.html

      (責任編委: 方向東)

      猜你喜歡
      隊列甲基化基因組
      牛參考基因組中發(fā)現(xiàn)被忽視基因
      隊列里的小秘密
      基于多隊列切換的SDN擁塞控制*
      軟件(2020年3期)2020-04-20 00:58:44
      在隊列里
      豐田加速駛?cè)胱詣玉{駛隊列
      鼻咽癌組織中SYK基因啟動子區(qū)的甲基化分析
      胃癌DNA甲基化研究進展
      基因組DNA甲基化及組蛋白甲基化
      遺傳(2014年3期)2014-02-28 20:58:49
      有趣的植物基因組
      世界科學(2014年8期)2014-02-28 14:58:31
      全甲基化沒食子兒茶素沒食子酸酯的制備
      平顶山市| 大渡口区| 邵阳县| 宁明县| 鹤岗市| 保定市| 富阳市| 历史| 色达县| 天柱县| 囊谦县| 仪征市| 金乡县| 平乡县| 阿鲁科尔沁旗| 雅江县| 青川县| 左贡县| 满城县| 河池市| 牡丹江市| 曲周县| 巴林右旗| 定西市| 萨嘎县| 满洲里市| 日照市| 房山区| 徐汇区| 皋兰县| 泉州市| 东阿县| 广州市| 白河县| 东源县| 类乌齐县| 柘荣县| 永兴县| 信宜市| 绍兴县| 麻城市|