陳珂珂 唐亮 王燕
摘要:結(jié)直腸癌是來源于結(jié)腸或直腸黏膜上皮的惡性腫瘤。非編碼RNA(miRNA和LncRNA)在結(jié)直腸癌的發(fā)生與發(fā)展中起重要作用。本文擬通過對已有的結(jié)直腸癌芯片數(shù)據(jù)進行分析,篩選出結(jié)直腸癌組織中特異性表達(dá)的基因。本研究獲得四個結(jié)直腸癌芯片數(shù)據(jù):GSE54129、GSE28700、GSE99415和GSE99416。功能富集分析提示差異表達(dá)基因主要參與PI3k-Akt信號通路。
關(guān)鍵詞:GEO數(shù)據(jù)庫;結(jié)直腸癌;差異基因;非編碼RNA
結(jié)直腸癌(Colorectal?cancer)是全球范圍內(nèi)發(fā)病率最高的三種癌癥之一,因其較高的侵襲和轉(zhuǎn)移特性,結(jié)直腸癌導(dǎo)致死亡在癌癥相關(guān)的死亡中占據(jù)第二位[1]。結(jié)直腸癌的發(fā)生和進展涉及基因調(diào)控的巨大變化,包括mRNA、miRNA和IncRNA。提供早期診斷和預(yù)后信息的生物標(biāo)志物在結(jié)直腸癌治療中具有重要意義。競爭性內(nèi)源RNA(competing?endogenous?RNA,ceRNA)假說認(rèn)為mRNA、lncRNA等轉(zhuǎn)錄物可以通過miRNA應(yīng)答元件(miRNA?response?element,MRE)競爭性結(jié)合miRNA,相互聯(lián)系以及相互調(diào)控各自的表達(dá)水平,產(chǎn)生大規(guī)模的調(diào)控網(wǎng)絡(luò),進而影響他們功能的發(fā)揮[2]。這些研究極大拓展了人類基因組遺傳信息的功能,同時也展示了轉(zhuǎn)錄后調(diào)控的全新模式,為理解腫瘤疾病的發(fā)生機制提供了新思路。
在本研究中,我們充分利用GEO在線數(shù)據(jù)庫的數(shù)據(jù)集,通過分析四個微陣列數(shù)據(jù)集來比較結(jié)直腸癌樣本與癌旁組織之間的基因表達(dá)差異。對差異表達(dá)基因進行功能富集分析。研究結(jié)果將對結(jié)直腸癌發(fā)病機制提供深刻認(rèn)識。
一、材料與方法
1.表達(dá)譜芯片數(shù)據(jù)來源
本次研究中應(yīng)用到的基因表達(dá)芯片數(shù)據(jù)都是通過在基因芯片數(shù)據(jù)庫即?GEO
(http://www.ncbi.nlm.nih.gov/)中檢索并下載得到的。檢索GEO數(shù)據(jù)庫時,檢索條件為,關(guān)鍵詞:colorectal?cancer;研究類型:Expression?profiling?by?array;在檢索結(jié)果中,按標(biāo)準(zhǔn)篩選出所需的基因表達(dá)芯片數(shù)據(jù)集。
篩選標(biāo)準(zhǔn):
(1)基因表達(dá)芯片所研究的樣本,為人類總?RNA。
(2)基因表達(dá)數(shù)據(jù)集得研究目標(biāo)必須是配對的結(jié)直腸癌組織和癌旁組織。
(3)每個基因表達(dá)數(shù)據(jù)集研究的樣本數(shù)量不少于5對。
(4)基因表達(dá)數(shù)據(jù)集必須能下載到基因表達(dá)芯片的原始數(shù)據(jù)。
2.?數(shù)據(jù)的標(biāo)準(zhǔn)化、質(zhì)控與差異表迖基因篩選
2.1數(shù)據(jù)標(biāo)準(zhǔn)化
采用R軟件,利用?Bioconductor及affy包的RMA?算法處理芯片數(shù)據(jù),依次對芯片數(shù)據(jù)進行背景校正、標(biāo)準(zhǔn)化及?log2?處理。利用?MetaQC?包對標(biāo)準(zhǔn)化后的表達(dá)數(shù)據(jù)進行質(zhì)控處理。
2.2?差異表迖基因篩選
應(yīng)用穩(wěn)健的多陣列平均算法對每個序列的原始微陣列數(shù)據(jù)進行背景校正和四分位數(shù)據(jù)歸一化,并分別根據(jù)注釋文件將探針名稱作為標(biāo)記基因符號。在篩選了無相應(yīng)基因符號的探針后,計算了具有多個探針的基因符號的平均值。使用R軟件limma軟件包對選定的胃腫瘤組織及其匹配的正常樣本進行了比較。log2(fold)|>1.585和p值<0.05的?mRNA被認(rèn)為是差異表達(dá)的mRNA(DEMS),?|log2(fold)|>1和p值<0.05?的miRNA和LncRNAs被認(rèn)為是差異表達(dá)的miRNA(DEmis)和LncRNAs(DELs)。
2.3?差異表達(dá)基因的功能富集分析
利用?DAVID?數(shù)據(jù)庫(DAVID,?https://david.ncifcrf.gov/)?中的在線分析工具對得到的差異基因進行基因功能注釋(GO分析)及KEGG通路富集分析。P值<0.05為統(tǒng)計上有顯著差異。
2.4?CeRNA網(wǎng)絡(luò)構(gòu)建
利用TargetScanHuman?7.2?(http://www.targetscan.org/vert_72/)?和LncBase?Predicted?v.2?(http://carolina.imis.athena-innovation.gr/diana_tools/)預(yù)測miRNA?與?mRNA,?及miRNA與?lncRNA之間的互作關(guān)系。Target?Scan?Human?參數(shù)設(shè)置為累計加權(quán)分<?-0.4。LncBase?Predicted?v.2參數(shù)設(shè)置為miTG-score?>?0.7。利用Cytoscape(http://www.cytoscape.org/)對ceRNA網(wǎng)絡(luò)進行可視化做圖。
二、結(jié)果
1.芯片數(shù)據(jù)篩選結(jié)果
本研究獲得了用于結(jié)直腸癌分析的四個芯片數(shù)據(jù):GSE54129、GSE28700、GSE99415和GSE99416。GSE54129為基于GPL570?2.0芯片的mRNA數(shù)據(jù),其中包含111個手術(shù)切除的結(jié)直腸癌組織和21個匹配的正常組織。GSE28700為基于GPL9081?1.0?miRNA芯片的數(shù)據(jù),含有22個結(jié)直腸癌組織和22個匹配的正常組織數(shù)據(jù)。GSE99415為基于GPL18058?microRNA芯片的數(shù)據(jù),含有6個結(jié)直腸癌和6個匹配的正常組織數(shù)據(jù)。GSE99416為基于GPL16956?Agilent-045997?Arraystar?human?lncRNA?芯片的數(shù)據(jù),含6個結(jié)直腸癌組織和6個匹配的正常組織數(shù)據(jù)。
1.差異表達(dá)基因的鑒定
以|log2(fold)|>1.585和p值<0.05為閾值,在GSE54129中得到了1867條差異表達(dá)的mRNAs(966下調(diào),901上調(diào))。在GSE28700中共篩選了44個差異表達(dá)的miRNA(30下調(diào),14上調(diào))。在GSE99416?中,鑒定出4329條差異表達(dá)的LncRNAs(1974上調(diào),2355下調(diào))。
2.功能分析
圖1顯示了應(yīng)用DAVID在線數(shù)據(jù)庫鑒定的差異表達(dá)基因的前20個功能富集分析的結(jié)果。最重要的生物過程是細(xì)胞外基質(zhì)組織、血管生成、細(xì)胞黏附、表皮細(xì)胞分化和上皮細(xì)胞分化。此結(jié)果結(jié)果在KEGG路徑分析中得到驗證。差異表達(dá)基因主要參與癌癥的途徑,PI3k-Akt途徑,局灶性粘連,環(huán)受體相互作用和CYP450代謝途徑。然后,我們分別用上調(diào)和下調(diào)的差異表達(dá)基因進行了KEGG信號通路分析。值得注意的是,調(diào)控基因主要參與局灶性粘連、環(huán)受體相互作用和PI3k-Akt信號通路(表1)。
3.ceRNA?網(wǎng)絡(luò)構(gòu)建
通過TargetScanHuman和?LncBase?Predicted?v.2預(yù)測的mRNAs?和?lncRNAs?被確定為DEMis目標(biāo)基因。此外,為了篩選可靠的基因,將目標(biāo)基因與DEMS和DELS進行了比較,只選取了重疊基因(圖2)。
討論
本研究通過?GEO?數(shù)據(jù)庫檢索結(jié)直腸癌基因表達(dá)芯片數(shù)據(jù),利用生物信息學(xué)方法深入分析結(jié)直腸癌發(fā)病相關(guān)的差異表達(dá)ncRNA。功能富集分析提示差異表達(dá)基因主要參與PI3k-Akt信號通路。
研究發(fā)現(xiàn)多種lncRNAs在胃癌發(fā)生、發(fā)展中起重要作用。胃癌組織和胃癌細(xì)胞株中存在多種表達(dá)異常的lncRNAs,?其表達(dá)水平呈現(xiàn)不同的升高或者下降,在胃癌的發(fā)生、發(fā)展中發(fā)揮促癌基因或抑癌基因的作用,參與胃癌的增殖、凋亡、侵襲及轉(zhuǎn)移[3]。在胃癌中起促癌基因作用的lncRNAs主要有H19,HOTAIR,LINC00152,CCAT1等[4]。起抑癌基因作用的主要有MEG3,AC138128.1,RP11-119F7.4等[5]。
TCGA數(shù)據(jù)集miRNomes數(shù)據(jù)挖掘顯示,miR-133a、miR-133b以及miR-1在GC中持續(xù)下調(diào)[6]。微陣列法和qPCR法均在結(jié)直腸癌細(xì)胞株和原代結(jié)直腸癌組織中證實了這一結(jié)果[7]。三組結(jié)直腸癌患者及相應(yīng)的非腫瘤組織均獨立檢測miR-133在胃癌中的表達(dá)水平。結(jié)果進一步顯示miR-133的下調(diào)更有可能在腫瘤大小、浸潤深度和周圍器官轉(zhuǎn)移方面表現(xiàn)較差[8]。miR-133功能障礙是影響整體生存的獨立預(yù)后因素。此外,通過熒光素酶檢測,miR-133靶向EGFR和HER-2的3’UTR,可能阻斷細(xì)胞生長信號,抑制細(xì)胞生長,最終促進細(xì)胞凋亡[9]。此外,miR-133a在結(jié)直腸癌細(xì)胞中的表達(dá)低,抑制了細(xì)胞增殖、侵襲和誘導(dǎo)凋亡。它還可以與多種基因結(jié)合,包括結(jié)腸COL1A1,?FSCN1和泛素特異性蛋白酶39(USP?39)[10]。這些miR-133在結(jié)直腸癌中的相關(guān)研究結(jié)果,闡明了miRNA介導(dǎo)途徑抑制癌基因的新機制,為結(jié)直腸癌治療提供了新的途徑。
PI3k-Akt途徑在細(xì)胞入侵和遷移等一系列細(xì)胞反應(yīng)中扮演重要角色,這些反應(yīng)通過促進細(xì)胞增殖和抑制細(xì)胞凋亡來促進腫瘤的進展。磷脂酰肌醇-3激酶(PI3K)-Akt信號通路已被報道在人類癌癥中顯示出頻繁的變化,并被認(rèn)為與EGFR/ERBB家族受體特異性相互作用。據(jù)報道,PI3K-Akt信號通路介導(dǎo)p27的調(diào)控,與宮頸癌細(xì)胞周期阻滯和凋亡有關(guān)[11]。在骨癌中,癌癥疼痛與MCP-1密切相關(guān),MCP-1通過PI3K/Akt通路介導(dǎo)刺激脊髓小膠質(zhì)細(xì)胞[12]。
前期研究表明,磷脂酰肌醇3激酶(PI3K)/AKT/(mTOR)信號通路的靶蛋白在結(jié)直腸癌的發(fā)生發(fā)展中起著重要作用,因此可能為治療提供靶點。該通路在細(xì)胞的生長、增殖、代謝、存活和血管生成等多種功能中發(fā)揮著重要作用[12]。PI3K介導(dǎo)的生長因子信號通路通過AKT、TSC1和TSC2激活mTOR。TSC1和TSC2形成二聚體(TSC1/TSC2),間接調(diào)控mTOR活性。當(dāng)上游信號被激活時,TSC1/TSC2被AKT抑制,允許mTOR激活。在癌細(xì)胞中,PI3K-AKT活性的增加導(dǎo)致mTORC1磷酸化活化,P70S6K1-mTORC2的反饋活性降低。這些變化導(dǎo)致線粒體活性增加、血管生成、核糖體生物發(fā)生以促進蛋白質(zhì)合成、細(xì)胞生長、增殖和自噬[13]??傊?,研究結(jié)果揭示了可能參與胃癌發(fā)生的若干通路。這些結(jié)果有可能為臨床上進一步研究和闡明結(jié)直腸癌的發(fā)生提供一些幫助,并且它們有可能是結(jié)直腸癌治療的新靶點。
參考文獻(xiàn)
[1]?萬德森,?陳功.?結(jié)直腸癌的流行病學(xué)及其危險因素研究近況[J].?實用癌癥雜志,?2000,?015(002):220-222.
[2]?湯國輝,?賀修勝.?結(jié)直腸癌相關(guān)長鏈非編碼RNA的研究進展[J].?中南醫(yī)學(xué)科學(xué)雜志,?2018,?v.46(03):23-28.
[3]?Ye?H,?Lin?J,YaoX,?LiY,?LinX,?Lu?H.Overexpression?oflong?non-coding?RNA?NNT-AS1?correlates?with?tumor?progression?and?poor?prognosis?in?osteosarcoma.?Cell?Physiol?Biochem.?2018,?45:1904-1914.
[4]?Williams?GT,?Farzaneh?F.?Are?snoRNAs?and?snoRNA?host?genes?new?players?in?cancer??Nat?Rev?Cancer.?2012;12:84-88.
[5]?Yu?D,?Kahen?E,?Cubitt?CL,?et?al.?identification?of?synergistic,?clini?cally?achievable,?combination?therapies?for?osteosarcoma.?Sci?Rep.?2015,?5:16991.
[6]?Poy?MN,?Eliasson?L,?Krutzfeldt?J?et?al.?A?pancreatic?islet-specific?microRNA?regulates?insulin?secretion.?Nature,?2004,?432: 226–230.
[7]?El?Ouaamari?A,?Baroukh?N,?Martens?GA,?et?al.?miR-375?targets?3-phosphoinositide-dependent?protein?kinase-1?and?regulates?glucose-induced?biological?responses?in?pancreatic?cells.?Diabetes,?2008,?57:?2708,2717.
[8]?Gauwerky?CE,?Huebner?K,?Isobe?M,?et?al.?Activation?of?MYC?in?a?masked?t?(8;?17)?translocation?results?in?an?aggressive?B-cell?leukemia.?Proc?Natl?Acad?Sci?USA,?1989,?86:?8867–8871.
[9]?Chen?CZ,?Li?L,?Lodish?HF,?et?al.?MicroRNAs?modulate?hematopoietic?lineage?differentiation.?Science,?2004,?303:?83–86.
[10]?Pan?JJ,?Zhang?SW,?Chen?CB,?et?al.?Effect?of?recombinant?adenovirus-p53?combined?with?radiotherapy?on?long-term?prognosis?of?advanced?nasopharyngeal?carcinoma.?J?Clin?Oncol,?2008,?27(5):?799–804.
[11]?張月涵,?張春梅,?潘云.?宮頸癌與NFκB、PI3K/AKT信號通路的研究進展[J].?中國臨床研究,?2018,?31(04):565-567.
[12]?許世杰,?姚明,?徐龍生,等.?PI3K?激酶對骨癌痛大鼠及其脊髓炎癥因子表達(dá)的調(diào)節(jié)[J].?中華醫(yī)學(xué)雜志,?2016,?96(004):297-300.
[13]?[斯慶圖娜拉,?劉磊.?抑制自噬增加PI3K/AKT/mTOR信號通路抑制劑引起的胃癌細(xì)胞死亡[J].?中國實驗診斷學(xué),?2015,?000(009):1457-1460.
通訊作者:王燕,實驗師,研究方向為多基因疾病發(fā)病機制研究。
本項目受湖南省教育廳科研基金資助(19C0201)