何楚琦,鐘浩,龍鼎新
(南華大學(xué)公共衛(wèi)生學(xué)院,湖南 衡陽(yáng) 421001)
MicroRNA(miRNA)是一類廣泛存在于動(dòng)植物和某些病毒內(nèi)的單鏈非編碼小RNA,其長(zhǎng)度約20~22 個(gè) 核苷酸[1]。成熟miRNA 由原始RNA(pri-miRNA)和前體RNA(pre-miRNA)在核糖核酸酶Ⅲ(Drosha 酶和Dicer 酶)作用下逐步形成,然后通過不完全沃森- 克里克堿基配對(duì)原則與特定靶mRNA 結(jié)合,在轉(zhuǎn)錄后層面調(diào)控mRNA 使其降解或翻譯中止,從而調(diào)節(jié)靶基因的蛋白表達(dá)水平[2-4]。miRNA 調(diào)控至少30%的基因表達(dá),參與人類生命活動(dòng)中一系列重要的生物學(xué)過程[5],不僅在細(xì)胞分化增殖、器官發(fā)育過程中起著重要作用,還在疾病的發(fā)生、發(fā)展過程中扮演重要角色,為人類疾病的診斷和治療提供了重要的生物學(xué)標(biāo)志物[6]。
Hsa-miR-139-3p 屬于miR-139 基因家族,聚集于人染色體11q13.4 長(zhǎng)度為68 bp 的位置中,具體基因位點(diǎn)在chr1:72615063-72615130 處。已有的研究顯示,通過與靶基因NOB1 或MMP11 相互作用,hsamiR-139 在腫瘤的增殖和遷移中起抑制作用[7-8]。目前國(guó)內(nèi)外對(duì)miR-139-3p 的研究尚淺,且現(xiàn)有文獻(xiàn)多與腫瘤或癌癥相關(guān),其余功能仍有待研究。大數(shù)據(jù)原理下的生物信息學(xué)相對(duì)實(shí)驗(yàn)驗(yàn)證,能對(duì)靶基因及相關(guān)通路進(jìn)行大量多樣高速的預(yù)測(cè)。本研究運(yùn)用生物信息學(xué)方法預(yù)測(cè)hsa-miR-139-3p 的靶基因,并對(duì)其靶基因集合進(jìn)行功能注釋(gene ontology,GO)和信號(hào)通路富集分析(kyoto encyclopedia of genes and genome pathway,KEGG pathway)(簡(jiǎn)稱Pathway 分析),為后續(xù)對(duì)miR-139-3p 的靶基因鑒定及生物學(xué)功能研究提供理論基礎(chǔ)和思路。
使用PubMed(http://www.ncbi.nlm.nih.gov/pubmed/)、NCBI(https://www.ncbi.nlm.nih.gov/)、UCSC(http://genome.ucsc.edu/)、miRbase(http://www.mirbase.org/)等在線數(shù)據(jù)庫(kù)查找miR-139-3p 的堿基序列序列、染色體定位、物種保守性等基本信息,利用在線靶基因預(yù)測(cè)軟件Taegetscan 7.1(http://www.Targetscan.org/)、miRDB(http://www.mirdb.org/)、miRanda(http://www.Microrna.org/)、miRTar Base(http://www.mirtarbase.mbc.nctu.edu.tw/)進(jìn)行靶基因預(yù)測(cè),應(yīng)用分析軟件MEGA 7.0 和帶有BiNGO 插件的Cytoscape 3.6.0 軟件,以及DAVID(http://david.abcc.ncifcrf.gov/)進(jìn)行功能富集分析(GO 分析)和Pathway 分析[9]。
從miRbase 數(shù)據(jù)庫(kù)檢索各物種已知的miR-139-3p成熟序列,用MEGA 7.0 比對(duì)分析各物種間序列的保守性和同源性。通過PubMed 查找hsa-miR-139-3p 靶基因相關(guān)文獻(xiàn),并取Taegetscan、miRanda 和miRDB 3 個(gè)在線數(shù)據(jù)庫(kù)的hsa-miR-139-3p 靶基因預(yù)測(cè)結(jié)果交集,合并miRTarBase 數(shù)據(jù)庫(kù)中經(jīng)實(shí)驗(yàn)證實(shí)的hsa-miR-139-3p 靶基因形成靶基因集合用于后續(xù)分析。
用Cytoscape 3.6.0 軟件中的BINGO 插件實(shí)現(xiàn)靶基因集合的Geneontology 功能富集分析,投射到細(xì)胞組分(cellular component,CC)、分子功能(molecular function,MF)、生物學(xué)過程(biological process,BP)3大應(yīng)用功能。根據(jù)Geneontology 數(shù)據(jù)庫(kù)查找的基因的GO 注釋,以本物種的所有基因?yàn)楸尘盎?,用超幾何分布檢驗(yàn);利用DAVID 數(shù)據(jù)庫(kù)進(jìn)行基于KEGG 的信號(hào)轉(zhuǎn)導(dǎo)通路富集性分析,用Fisher 確切概率法檢驗(yàn);P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
利用miRBase 數(shù)據(jù)庫(kù)下載人(hsa)、小鼠(mmu)、大鼠(rno)、野豬(ssc)等8 個(gè)物種的miR-139-3p 的成熟序列。結(jié)果顯示,miR-139-3p 成熟序列GGAGACGCGGCCCUGUUGAG 在脊椎動(dòng)物中具有高度的保守性(見圖1)。
圖1 不同物種miR-139-3p 的成熟序列
表1 miR-139-3p 調(diào)控的靶基因參與人類腫瘤
通過PubMed 檢索文獻(xiàn)顯示,miR-139-3p 通過在轉(zhuǎn)錄后水平調(diào)控其靶基因參與多種腫瘤的發(fā)生、發(fā)展及預(yù)后(見表1)。Taeget Scan、miRanda 和miRDB 預(yù)測(cè)的靶基因個(gè)數(shù)分別為3 122、3 170 和38 個(gè),對(duì)上述預(yù)測(cè)結(jié)果取并集后得到30 個(gè)靶基因的數(shù)據(jù)集。另外,查找miR Tar Base 數(shù)據(jù)庫(kù)中記錄的經(jīng)雙熒光素酶報(bào)告基因?qū)嶒?yàn)、MTT/Western blotting、qRT-PCR 等方法證實(shí)的hsa-miR-139-3p 靶基因共105 個(gè),其中有 2 個(gè)靶基因(E2F6 和RAP1B)與上述并集重合,因此預(yù)測(cè)靶基因數(shù)據(jù)集與實(shí)驗(yàn)已驗(yàn)證靶基因取并集后得到133 個(gè)無重復(fù)靶基因,作為后續(xù)分析的基因總集合(見圖2)[10]。
將3 個(gè)數(shù)據(jù)庫(kù)均能預(yù)測(cè)到的靶基因133 個(gè)作GO分析,發(fā)現(xiàn)hsa-miR-139-3p 的靶基因主要富集在吞噬小泡膜、細(xì)胞外基質(zhì)黏附、髓鞘、生長(zhǎng)錐、核染色體、轉(zhuǎn)鐵蛋白受體等14 個(gè)細(xì)胞組分(P<0.05);參與交感神經(jīng)系統(tǒng)發(fā)育、心臟右心室形態(tài)發(fā)生、心內(nèi)膜形成、RNA 聚合酶啟動(dòng)子轉(zhuǎn)錄的調(diào)控、自噬體裝配、去甲腎上腺素能神經(jīng)元分化等23 個(gè)生物學(xué)過程(P<0.05);顯著富集于轉(zhuǎn)錄活性激活、蛋白結(jié)合、RNA 結(jié)合、DNA 結(jié)合、酶結(jié)合等12 個(gè)分子功能(P<0.05)。見表2。
利用DAVID 數(shù)據(jù)庫(kù)中的工具Functional Annotation對(duì)靶基因集合進(jìn)行生物通路富集分析,其中55 個(gè)靶基因具有相關(guān)生物通路。以人類全基因組為背景,發(fā)現(xiàn)hsa-miR-139-3p 的靶基因顯著富集于黏著斑信號(hào)轉(zhuǎn)導(dǎo)通路以及轉(zhuǎn)錄等基因信息處理通路中(見表3)。
圖2 Hsa-miR-139-3p 的預(yù)測(cè)靶基因個(gè)數(shù)
表2 Hsa-miR-139-3p 靶基因的GO 功能分析
續(xù)表2
續(xù)表2
表3 Hsa-miR-139-3p 靶基因KEGG 通路富集分析
LEE 等在1993年首次發(fā)現(xiàn)miRNA。緊接著第2個(gè)miRNA let-7 于線蟲體內(nèi)又被研究者發(fā)現(xiàn)從此開啟了們對(duì)miRNA 的研究大門。大多數(shù)miRNA 是一種高度保守的小分子,在不同的生物中具有相同的調(diào)節(jié)機(jī)制[24-25]。通過研究植物、動(dòng)物和病毒中的miRNA,發(fā)現(xiàn)其在物種間具有高度的保守性、時(shí)序性和組織特異性,表明miRNA 在基因表達(dá)調(diào)控中有著廣泛的作用。本研究證實(shí)miR-139-3p 序列在多個(gè)物種間高度保守,提示其對(duì)生物體有著極其重要甚至不可替代的功能。同時(shí),其序列的保守性使小鼠等模式生物成為研究miR-139-3p 生物學(xué)作用的有力工具[26]。
研究者們還發(fā)現(xiàn),miRNA 在生物體內(nèi)不參與蛋白質(zhì)合成,但在編碼蛋白的基因表達(dá)方面有著非常重要的調(diào)控作用[27]。miRNA 主要通過與靶mRNA 分子3’端非編碼區(qū)域進(jìn)行不完全或完全配對(duì),在轉(zhuǎn)錄后水平調(diào)控靶mRNA,降低其翻譯效率。而每個(gè)miRNA 都能作用于多個(gè)目標(biāo)mRNA,調(diào)控約1/3 的蛋白基因序列[28]。因此,miRNA 及其靶基因形成一個(gè)嚴(yán)密、有序的調(diào)控網(wǎng)絡(luò),在生物發(fā)育的不同時(shí)期,miRNA 通過作用于不同的基因片段,調(diào)節(jié)相應(yīng)功能蛋白的表達(dá),從而調(diào)節(jié)細(xì)胞的發(fā)育、增殖、凋亡以及腫瘤、感染等多種病理生理過程[24]。
盡管最近幾年有數(shù)百種miRNA 被陸續(xù)發(fā)現(xiàn),但是只有少量miRNA 被闡明其作用,許多miRNA 的功能還是未知。因此,預(yù)測(cè)miRNA 靶基因和認(rèn)識(shí)它們的相互作用,是了解miRNA 在不同的生理過程中的功能的關(guān)鍵。
本研究采用生物信息學(xué)方法,共預(yù)測(cè)得到133 個(gè)hsa-miR-139-3p 的靶基因,靶基因存在細(xì)胞的各個(gè)組分中,具有轉(zhuǎn)錄調(diào)控、基因表達(dá)調(diào)控和蛋白連接等分子功能,并顯著富集于發(fā)育生物學(xué)過程;信號(hào)通路顯著富集于黏著斑及基因信息處理相關(guān)通路,控制細(xì)胞生長(zhǎng)及分化的信號(hào)。大量研究發(fā)現(xiàn),miR-139-3p 在細(xì)胞增殖和分化過程中發(fā)揮著重要的調(diào)控作用,有學(xué)者發(fā)現(xiàn),經(jīng)過神經(jīng)生長(zhǎng)因子處理后的PC12 細(xì)胞中miR-139-3p 含量下降,推測(cè)miR-139-3p 能負(fù)調(diào)控神經(jīng)元分化[29]。miR-139 還能通過調(diào)節(jié)MCPIP1/IL-6 的表達(dá),誘導(dǎo)人退行性關(guān)節(jié)病軟骨細(xì)胞凋亡[30]。有研究也證明miR-139-3p 在左心室肥大和細(xì)胞凋亡中發(fā)揮信號(hào)轉(zhuǎn)導(dǎo)的作用[31]。
大量研究表明,hsa-miR-139-3p 在多種惡性腫瘤中異常表達(dá)。如hsa-miR-139-3p 在結(jié)腸癌肝轉(zhuǎn)移以及希佩爾·林道綜合征引起的嗜鉻細(xì)胞瘤中呈現(xiàn)高表達(dá)[15,32]。然而有研究發(fā)現(xiàn),hsa-miR-139-3p 在膀胱癌、結(jié)腸癌、宮頸癌等多種癌細(xì)胞內(nèi)呈現(xiàn)低表達(dá)[7-8]。且近年來已有部分研究證實(shí)hsa-miR-139-3p 是通過調(diào)控其靶基因的方式,在抑制腫瘤細(xì)胞的增殖和轉(zhuǎn)移發(fā)揮重要作用,如hsa-miR-139-3p 可通過抑制NOB1的表達(dá),進(jìn)而抑制HL 細(xì)胞的增殖和遷移[33]。在細(xì)胞凋亡和其他腫瘤過程中,miRNA 表達(dá)的雙相模式(上下調(diào)節(jié))已經(jīng)確定,因此hsa-miR-139-3p 或許可考慮作為腫瘤的早期診斷和預(yù)后的分子生物標(biāo)志物[34-36]。
綜上所述,本研究采用生物信息學(xué)方法對(duì)hsamiR-139-3p 的GO 功能富集分析和Pathway 通路富集分析等數(shù)據(jù)進(jìn)行系統(tǒng)挖掘,結(jié)果顯示hsa-miR-139-3p在生長(zhǎng)發(fā)育及腫瘤發(fā)生、發(fā)展中的作用不容忽視,且本研究結(jié)果與現(xiàn)有對(duì)miR-139-3p 調(diào)控作用的研究報(bào)道基本相符,說明生物信息學(xué)分析具有可靠性。這些分析為有關(guān)miR-139-3p 在各生物學(xué)過程中的調(diào)控機(jī)制后續(xù)探索提供一定的數(shù)據(jù)支持和研究思路。但在原始數(shù)據(jù)方面尚存在靶基因數(shù)據(jù)假陽(yáng)性率較高、基因數(shù)據(jù)尚不全面等不足,因此,本試驗(yàn)篩選出的靶基因還需驗(yàn)證,其功能和相關(guān)信號(hào)通路也有待進(jìn)一步研究[37]。