史歡歡,李 斌,史文珍,趙 寧,陳 霞,高莉潔,何 芳,韓楠楠,湯利榮,田 曄*
(1.西安市第三醫(yī)院神經(jīng)內(nèi)科,中國陜西西安 710016;2.延安大學(xué)醫(yī)學(xué)院,中國陜西延安 716000;3.漢中市中心醫(yī)院藥劑科,中國陜西漢中 723000)
長鏈非編碼RNA(long non-coding RNA,lncRNA)是一類長度大于200個核苷酸、缺乏完整開放閱讀框、不編碼蛋白質(zhì)的RNA轉(zhuǎn)錄本[1]。截止2018年1月12日,NONCODE數(shù)據(jù)庫收錄人類基因組已注釋的172 216種lncRNA轉(zhuǎn)錄本(http://www.noncode.org),數(shù)量遠(yuǎn)超過蛋白質(zhì)編碼基因。目前,lncRNA的研究覆蓋免疫系統(tǒng)、神經(jīng)系統(tǒng)等多系統(tǒng)及疾病的病理生理過程,已成為生物醫(yī)學(xué)研究的熱點。本文將從表觀遺傳學(xué)、轉(zhuǎn)錄、轉(zhuǎn)錄后水平對lncRNA在病理生理過程中的作用機制做一綜述,并探討目前l(fā)ncRNA研究中存在的問題。
lncRNA廣泛分布于細(xì)胞質(zhì)和細(xì)胞核中,主要來源于蛋白質(zhì)編碼基因中斷、染色質(zhì)重組、非編碼基因復(fù)制反移位產(chǎn)物、非編碼RNA內(nèi)部相鄰片段重復(fù)以及基因中插入轉(zhuǎn)座因子[2]。多數(shù)lncRNA由RNA聚合酶Ⅱ轉(zhuǎn)錄,可經(jīng)過剪接、5′端加帽及3′端多聚腺苷酸化加工[3,4]。研究顯示,lncRNA的表達(dá)呈現(xiàn)出組織特異性和時空特異性,即不同組織之間lncRNA的表達(dá)量不同;而同一組織或器官的不同發(fā)育階段,lncRNA的表達(dá)量也不同。lncRNA不編碼蛋白質(zhì),序列保守性低,一度被認(rèn)為是基因轉(zhuǎn)錄的“噪音”或RNA聚合酶的“副產(chǎn)品”,不具備生物學(xué)功能。但隨著相關(guān)研究的深入,lncRNA眾多功能被發(fā)現(xiàn),其在基因轉(zhuǎn)錄、剪接、蛋白質(zhì)翻譯、蛋白質(zhì)定位、干細(xì)胞多能性、細(xì)胞結(jié)構(gòu)完整性、熱休克反應(yīng)及人類疾病中發(fā)揮著重要的作用[5]。而近些年的研究發(fā)現(xiàn),部分lncRNA可編碼微肽,參與生物體生命活動[6]。
根據(jù)lncRNA與蛋白質(zhì)編碼基因的關(guān)系,可將其分為基因間型lncRNA(intergenic lncRNA)、反義型lncRNA(antisense lncRNA)、內(nèi)含子型lncRNA(intronic lncRNA)、正義型 lncRNA(sense lncRNA)及雙向型lncRNA(bidirectional lncRNA)5種(圖1)[2,7];而根據(jù)lncRNA在分子機制中的作用,可分為信號分子(signal molecule)、誘捕分子(decoy molecule)、引導(dǎo)分子(guide molecule)和骨架分子(scaffold molecule)4 種(圖 2)[8]。
2.1.1 lncRNA調(diào)控DNA甲基化
DNA甲基化是經(jīng)典的表觀遺傳學(xué)機制。在真核細(xì)胞中,CpG島胞嘧啶的嘧啶環(huán)上,DNA甲基轉(zhuǎn)移酶轉(zhuǎn)移甲基到胞嘧啶的第5個碳原子上,形成5-甲基胞嘧啶,通常表現(xiàn)出抑制基因轉(zhuǎn)錄[9]。DNA甲基化在維持基因組穩(wěn)定性、調(diào)節(jié)染色質(zhì)結(jié)構(gòu)、X染色體失活等過程中發(fā)揮重要的作用[9]。研究發(fā)現(xiàn),lncRNA在調(diào)控DNA甲基化方面呈現(xiàn)出雙向性,即lncRNA既可以促進(jìn)DNA甲基化的發(fā)生,又可發(fā)揮去甲基化的作用。促進(jìn)DNA甲基化的lncRNA,如lncRNA Xist,其招募多梳蛋白抑制復(fù)合體2(polycomb repressive complex 2,PRC2)至X染色體,可使X染色體上CpG島啟動子甲基化,抑制X染色體上基因的表達(dá)[10]。而去甲基化的lncRNA,如lncRNA H19,可通過抑制DNA甲基化甲基基團(tuán)的供應(yīng),從而阻斷DNA甲基轉(zhuǎn)移酶介導(dǎo)的DNA甲基化修飾[11]。
圖1 lncRNA的分類(根據(jù)與蛋白質(zhì)編碼基因的位置關(guān)系,由文獻(xiàn)[7]加工而來)Fig.1 Classification of lncRNAs based on the positional relationship between lncRNAs and protein-coding genes(pro原cessed from reference[7])
圖2 lncRNA的分類(根據(jù)lncRNA在分子機制中的作用)[8]Fig.2 Classification of lncRNAs based on the role of molecular mechanisms[8]
2.1.2 lncRNA調(diào)控組蛋白修飾
生物的組蛋白以八聚體的形式與DNA序列形成核小體,其氨基末端向外游離,可被眾多因子修飾,如乙?;⒓谆土姿峄?繼而動態(tài)調(diào)控不同位點基因的表達(dá)[12]。
lncRNA可介導(dǎo)組蛋白發(fā)生不同類型的修飾以調(diào)控基因表達(dá)。如lncRNA Xist募集PRC2至X染色體,除了使CpG島啟動子發(fā)生甲基化外,還可使組蛋白H3第27個氨基酸發(fā)生三甲基化(H3K27me3),從而引發(fā)整條X染色體失活[13]。Wan等[14]在毛細(xì)血管擴張性共濟(jì)失調(diào)綜合征患者中發(fā)現(xiàn),lncRNA-JADE轉(zhuǎn)錄激活HBO1組蛋白乙?;瘡?fù)合體的關(guān)鍵元件Jade1,繼而誘導(dǎo)組蛋白H4發(fā)生乙酰化;而干擾lncRNA-JADE的表達(dá)后,Jade1轉(zhuǎn)錄下調(diào),組蛋白H4乙?;揎椧矞p少。這表明lncRNA-JADE可通過調(diào)節(jié)Jade1的轉(zhuǎn)錄表達(dá)繼而調(diào)控組蛋白H4的乙?;揎?。
2.1.3 lncRNA調(diào)控染色質(zhì)重塑
真核生物的染色質(zhì)呈高度折疊的致密結(jié)構(gòu),不利于RNA聚合酶、轉(zhuǎn)錄因子等接近染色質(zhì)上的DNA,觸發(fā)基因轉(zhuǎn)錄。因此,生物在進(jìn)化過程中產(chǎn)生了相應(yīng)的染色質(zhì)重塑機制,通過對染色質(zhì)結(jié)構(gòu)進(jìn)行動態(tài)修飾而提高RNA聚合酶、轉(zhuǎn)錄因子等在染色質(zhì)DNA上的可接近性。染色質(zhì)重塑主要包括核小體轉(zhuǎn)位和染色體成環(huán)[15]。
核小體是染色質(zhì)的基本功能單位。核小體轉(zhuǎn)位是指核小體發(fā)生移動、隔離、替代和重組,使核小體處于合適的位置或濃度,從而在核小體之間形成更易轉(zhuǎn)錄的DNA區(qū)。Yu等[16]發(fā)現(xiàn),linc-RAM可介導(dǎo)SWI/SNF重塑復(fù)合體與染色質(zhì)結(jié)合,使核小體發(fā)生轉(zhuǎn)位,繼而促進(jìn)肌分化相關(guān)基因轉(zhuǎn)錄。釀酒酵母中,染色質(zhì)來源的lncRNA可與RNA結(jié)合蛋白質(zhì)的同源體Seb1結(jié)合,Seb1募集SHREC復(fù)合體,使核小體發(fā)生轉(zhuǎn)位,抑制基因轉(zhuǎn)錄[17]。SWI/SNF重塑復(fù)合體、SHREC復(fù)合體都是依賴分解ATP產(chǎn)生的能量使核小體發(fā)生轉(zhuǎn)位。
染色體成環(huán)是染色質(zhì)空間結(jié)構(gòu)的改變,即染色質(zhì)上處于不同位點的遠(yuǎn)近基因“成環(huán)”,從而使基因的轉(zhuǎn)錄更為高效。增強子RNA歸屬于lncRNA,是由增強子轉(zhuǎn)錄而來,可調(diào)控其靶基因形成染色體環(huán)。如在人類結(jié)直腸癌中,增強子CCAT1-L可以與染色質(zhì)結(jié)構(gòu)維持蛋白質(zhì)CTCE結(jié)合,繼而促進(jìn)MYC基因啟動子與增強子遠(yuǎn)程相互作用,增加MYC基因的表達(dá)[18]。lncRNA介導(dǎo)的染色體成環(huán),影響短時及組織特異性基因的表達(dá)。
lncRNA在轉(zhuǎn)錄水平對基因的調(diào)控具有多樣性。Yu等[16]發(fā)現(xiàn),linc-RAM可與MyoD基因的啟動子結(jié)合,發(fā)揮增強子活性,繼而增加MyoD轉(zhuǎn)錄表達(dá)。而Lai等[19]發(fā)現(xiàn),ncRNA-a的增強子活性是由蛋白質(zhì)復(fù)合物Mediator所介導(dǎo)。這表明lncRNA不僅可直接發(fā)揮增強子活性,還可協(xié)作復(fù)合體間接發(fā)揮增強子活性。除此之外,研究還發(fā)現(xiàn)lncRNA可通過影響轉(zhuǎn)錄因子活性來調(diào)控基因轉(zhuǎn)錄,如lncRNA Evf-2可特異性與轉(zhuǎn)錄因子Dlx-2結(jié)合,增加Dlx-5/6基因的轉(zhuǎn)錄活性[20]。近期研究發(fā)現(xiàn),lncRNA SRG1與SER3基因啟動子區(qū)域重疊,SRG1發(fā)生隨機核小體沉積,隔離RNA聚合酶Ⅱ與SER3基因的結(jié)合,使SER3轉(zhuǎn)錄受到抑制[21]。lncRNA在轉(zhuǎn)錄水平對基因表達(dá)的調(diào)控,可靶向基因轉(zhuǎn)錄過程的不同環(huán)節(jié),形成包括轉(zhuǎn)錄相關(guān)復(fù)合體、轉(zhuǎn)錄因子、RNA聚合酶等的復(fù)雜調(diào)控網(wǎng)絡(luò),精細(xì)調(diào)控基因表達(dá)。
lncRNA在轉(zhuǎn)錄后對基因表達(dá)的調(diào)控主要涉及mRNA水平、miRNA(microRNA)水平以及蛋白質(zhì)水平。
研究顯示,真核生物體蛋白質(zhì)的數(shù)量是蛋白質(zhì)編碼基因數(shù)量的4倍[22]。其主要原因在于蛋白質(zhì)編碼基因轉(zhuǎn)錄后形成的前體mRNA(pre-mRNA),在翻譯為蛋白質(zhì)前需經(jīng)過可變剪接(alternative splicing,AS)過程。AS是指通過不同的剪接模式將一個pre-mRNA剪接成多個mRNA異構(gòu)體[23]。AS極大增加了mRNA的豐度,以承擔(dān)生物體眾多生命活動。lncRNA可通過影響剪接因子的活性,繼而影響可變剪接過程。絲氨酸/精氨酸剪接因子是真核細(xì)胞重要的剪接因子,其經(jīng)磷酸化獲得活性后,可參與多種pre-mRNA的AS過程。肺腺癌轉(zhuǎn)移相關(guān)轉(zhuǎn)錄本1(metastasis-associated lung adenocarcinoma transcript 1,MALAT1)可調(diào)控絲氨酸/精氨酸剪接因子磷酸化-去磷酸化水平,進(jìn)而影響pre-mRNA的剪接[24]。而另有研究發(fā)現(xiàn),在AS過程中,lncRNA MALAT1還可作為骨架分子,募集剪接因子至pre-mRNA,從而引發(fā)剪接過程[25]。MALAT1是AS的重要調(diào)控因子,干擾MALAT1的表達(dá)或活性將顯著影響機體AS過程[26]。
lncRNA也可通過STAU1(Staufen1)介導(dǎo)的mRNA降解途徑來調(diào)控mRNA的豐度。RNA結(jié)合蛋白質(zhì)STAU1識別mRNA 3′非翻譯區(qū)(3′-untranslated region,3′-UTR)的 Staufen 結(jié)合位點(Staufen binding site,SBS)并募集UPF1(up-frameshift protein 1)至mRNA,引發(fā)mRNA的降解[27]。研究發(fā)現(xiàn),一些1/2-sbsRNAs(half-STAU1-binding site RNAs)可通過其序列中的ALU元件與mRNA 3′-UTR的ALU元件非完美配對形成SBS,為STAU1提供結(jié)合位點,引發(fā)mRNA降解[28]。1/2-sbsRNAs中可包含多個ALU元件,可同時與多個mRNA的ALU元件結(jié)合,引發(fā)多個mRNA的降解;而1/2-sbsRNAs與mRNA ALU元件的非完美配對,也可使不同的1/2-sbsRNAs介導(dǎo)同一mRNA的降解。需要指出的是,雖然1/2-sbsRNAs介導(dǎo)的mRNA降解可以有效地調(diào)控mRNA豐度,但1/2-sbsRNAs并不能介導(dǎo)所有3′-UTR含有ALU元件的mRNA發(fā)生降解。
lncRNA在miRNA水平對基因表達(dá)的調(diào)控主要通過miRNA“海綿”的方式實現(xiàn)。miRNA是一類長度在20~22 nt范圍內(nèi)的非編碼RNA,其可與Argonaute蛋白、核苷酸內(nèi)切酶Dicer等組成RNA誘導(dǎo)沉默復(fù)合體(RNA-induced silencing complex,RISC),通過識別mRNA中的miRNA反應(yīng)原件與mRNA結(jié)合,切割mRNA,從而使其降解[29]。研究發(fā)現(xiàn),部分lncRNA序列中存在miRNA反應(yīng)原件,可與RISC中的miRNA結(jié)合,繼而去除RISC對mRNA的降解。如linc-MD1結(jié)合miR-133和miR-135,去除miR-133和miR-135對轉(zhuǎn)錄因子MAML1和MEF2C mRNA的降解作用,促進(jìn)MAML1和MEF2C介導(dǎo)的肌分化基因的轉(zhuǎn)錄[30]。由此可見,lncRNA序列中可含有多個miRNA反應(yīng)原件,可同時調(diào)控多個基因的表達(dá)。
lncRNA還可影響蛋白質(zhì)功能的表達(dá)。研究發(fā)現(xiàn)lncRNA Gas5可與糖皮質(zhì)激素受體的DNA結(jié)合域結(jié)合,競爭性阻止糖皮質(zhì)激素與其受體的結(jié)合,影響糖皮質(zhì)激素受體的功能表達(dá)[31]。lncRNA除本身可與蛋白質(zhì)反應(yīng)外,相關(guān)研究更是發(fā)現(xiàn)少數(shù)lncRNA可編碼微肽,參與機體的生命活動。如上述的linc-RAM,其可編碼一段由46個氨基酸組成的微肽myoregulin,特定表達(dá)于骨骼肌,通過調(diào)節(jié)Ca2+負(fù)荷而調(diào)控骨骼肌收縮[32]。
目前,lncRNA的研究雖已廣泛開展,但仍存在一些問題:1)lncRNA的定義需要更新。lncRNA普遍被接受的定義為,一類長度大于200個核苷酸、不編碼蛋白質(zhì)的RNA。該定義中,200個核苷酸的界限主要用于將已知的短非編碼RNA(如tRNA,miRNA等)從非編碼RNA中區(qū)分,因此用大于200個核苷酸來定義lncRNA過于武斷。其次,隨著質(zhì)譜蛋白質(zhì)組學(xué)、深度RNA測序和核糖體分析等技術(shù)的應(yīng)用,一些lncRNA被發(fā)現(xiàn)含有隱性開放閱讀框[4],存在編碼蛋白質(zhì)的可能。除此之外,Williamson等[33]發(fā)現(xiàn),ASCC3 short mRNA修復(fù)紫外線輻射所造成基因損傷的功能是由其序列中的非蛋白質(zhì)編碼序列所承擔(dān),該非蛋白質(zhì)編碼序列符合目前的lncRNA定義,即ASCC3 short mRNA作為lncRNA發(fā)揮功能。由此可見,mRNA與lncRNA的定義也需要進(jìn)一步區(qū)別。綜上所述,目前l(fā)ncRNA的定義不夠準(zhǔn)確,需要更新;2)lncRNA命名缺乏統(tǒng)一原則。目前文獻(xiàn)中出現(xiàn)的lncRNA,多由科研工作者按照功能、來源等命名,沒有統(tǒng)一的命名原則,既不方便整理,也不方便科研工作者之間的交流;3)lncRNA的作用機制具有多樣化和特異性強的特點,且其本身序列的保守性低,使得不同lncRNA研究方法之間借鑒意義不高;4)目前的研究發(fā)現(xiàn),多種蛋白質(zhì)存在RNA結(jié)合域,lncRNA可能主要受到RNA結(jié)合蛋白質(zhì)的調(diào)節(jié)[34]。隨著交聯(lián)免疫共沉淀(cross-linking immunoprecipitation,CLIP)等技術(shù)的應(yīng)用,越來越多RNA結(jié)合蛋白質(zhì)已經(jīng)得到注釋并組建成數(shù)據(jù)庫,未來的研究需要對數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行分析和加工,形成與lncRNA反應(yīng)的RNA結(jié)合蛋白質(zhì)圖譜,為lncRNA進(jìn)一步的機制剖析提供便利;5)lncRNA功能的發(fā)揮主要依賴于其特定的RNA結(jié)構(gòu)域與特定蛋白質(zhì)的反應(yīng)[34]。解析lncRNA的RNA結(jié)構(gòu)域有利于進(jìn)一步認(rèn)識lncRNA的分子機制。但由于細(xì)胞內(nèi)核糖核蛋白對RNA結(jié)構(gòu)域有影響,而目前的技術(shù)尚不能獲取核糖核蛋白的晶體結(jié)構(gòu)[34],因此lncRNA的RNA結(jié)構(gòu)域研究存在挑戰(zhàn);6)比較基因組學(xué)、共表達(dá)分析等生物信息學(xué)方法的應(yīng)用為lncRNA功能預(yù)測提供了發(fā)展方向,但尚處在探索階段,因此系統(tǒng)解析lncRNA功能的相關(guān)研究仍任重道遠(yuǎn)。
lncRNA作為一大類非編碼RNA,具有重要的生物學(xué)功能,參與多種疾病的病理過程,并在部分疾病發(fā)生發(fā)展過程中扮演著生物標(biāo)記物的角色,對疾病的診斷、治療及預(yù)后評估具有參考價值[35]。目前,該領(lǐng)域的研究逐漸深入,但由于lncRNA的作用機制復(fù)雜,其研究仍面臨諸多挑戰(zhàn)。未來lncRNA的研究還需創(chuàng)新研究方法和開發(fā)更為先進(jìn)的研究技術(shù),以期能夠形成系統(tǒng)的研究體系,進(jìn)一步闡明其精確的分子機制,為臨床相關(guān)疾病的診治提供思路。