郭春霞 劉會
·綜述與講座·
LncRNA的結構研究及進展
郭春霞 劉會
長鏈非編碼RNA;結構;研究;進展
近年發(fā)現(xiàn)的長鏈非編碼RNA(long non-coding RNA,lncRNA)在細胞生長、發(fā)育、表觀遺傳學以及腫瘤和心血管疾病發(fā)生過程中,發(fā)揮重要的調(diào)控作用[1-9]。LncRNAs長度為1 000~10 000個堿基,通常是多聚腺苷酸化的,受RNA聚合酶Ⅱ催化轉錄合成[3,6,7]。LncRNAs主要分布于胞核,在胞漿中也有存在。很多l(xiāng)ncRNAs與組蛋白修飾、染色質重塑和表觀遺傳效應有關[10]。但是,表觀遺傳因子識別它們的作用機制仍然是個謎。在哺乳動物的基因組中,lncRNAs的重要性已引起研究者的重視,lncRNAs可能在DNA、組蛋白和甲基化作用因子之間提供了一個新的表觀遺傳橋梁。本文綜述了近年在lncRNAs研究方面取得的進展。在人類基因組中,超過70%的基因可進行轉錄[11],但蛋白編碼基因僅占其中的1%~2%。具有轉錄活性的非蛋白編碼基因大部分(80%~90%)是lncRNAs[12]?;趌ncRNAs的兩個主要特征,它通常被定義為:(1)轉錄本長度(>200 nt);(2)翻譯能力很低或缺失[13]。一些lncRNAs(“macroRNA”)的長度很長,能延伸至90 kB,如108 kB的Air和91 kB的kcnqlot1[14]。根據(jù)距離蛋白編碼基因的相對位置,lncRNA可進一步被分為不同類型:天然反義轉錄本(NAT)是從蛋白編碼基因的反義鏈轉錄而來,至少在一個外顯子區(qū)有基因重疊;大插入式非編碼RNA,即已知的長鏈基因間非編碼RNA(lincRNA),距離蛋白編碼基因很遠;內(nèi)含子編碼RNA是獨特的從蛋白編碼基因的內(nèi)含子區(qū)轉錄而來,既能從正義,也能從反義方向轉錄;雙向lncRNAs是從蛋白編碼基因啟動子區(qū)反向轉錄而來。由于lncRNAs具有細胞特異性、組織特異性、發(fā)育階段特異性和疾病特異性,想要對它們的數(shù)量進行精確的評估十分困難。在人體組織中,最新估算lncRNAs的數(shù)量達到了15 000[15]。然而,僅2012年就發(fā)現(xiàn)了上萬個新的lncRNAs。有關lncRNAs的機制研究有可能比核糖體更具挑戰(zhàn)性,因為lncRNAs并不是高度保守,也不是高表達的。雖然如此,RNA分子在它們的序列、二級結構或三級結構上的一系列功能元件是已被公認的。RNA干擾和RNA沉默能序列特異性地控制基因表達。核糖體開關RNA通過二級結構調(diào)節(jié)基因表達。核糖體通過其復雜的三級結構合成蛋白質。LncRNAs也可能通過這三種方式中的某一種調(diào)控基因表達。研究發(fā)現(xiàn),lncRNAs系統(tǒng)中可能存在所有這三種機制,用現(xiàn)代結構生物學技術能得到大量有用的信息。雖然有關lncRNAs三級結構的研究還遠未完成,但是通過其它已知RNA的晶體結構,能推測它們在lncRNAs分子中出現(xiàn)的可能性。
一些lncRNAs分子序列上存在著與DNA直接相互作用的區(qū)域。在某些情況下,RNA和DNA之間發(fā)生Watson-Crick堿基配對,而在某些情況下,二者之間的相互作用又符合三股螺旋機制[16]。
1.1 miRNA-解離lncRNAs 這些lncRNAs的序列上存在miRNA選擇性的結合位點,可調(diào)節(jié)蛋白編碼基因轉錄后表達水平。Linc-MD1參與肌肉分化,作為一種競爭性的內(nèi)源性RNA,能使miR-133和miR-135與它們的靶基因解離[17]。
1.2 半-STAU1結合位點RNA(1/2-sbsRNA) 這種lncRNAs通過Alu元件和mRNA的3’-UTR結合參與STAU1-介導的mRNA降解[7]。lncRNAs的Alu元件和mRNA的Alu元件之間發(fā)生不完全配對。這種相互作用可以被dsRNA結合蛋白STAU1所識別,從而介導mRNA降解。
1.3 反義lncRNAs 這些lncRNAs可與mRNA結合,并調(diào)節(jié)它們的剪接。長鏈非編碼Zeb2NAT的轉錄本,源于Zeb2 mRNA的5’剪接位點的反義序列,能阻止該區(qū)域的剪接,保留了其含有的核糖體進入位點,從而保證了該蛋白的有效翻譯。
1.4 上游lncRNAs 這些lncRNAs可與DNA啟動子區(qū)形成三螺旋復合物。來源于人二氫葉酸還原酶(DHFR)上游的lncRNAs,使上游轉錄起始于次要啟動子位點,導致轉錄因子與主要啟動子的結合減少,進而抑制基因表達[18]。此外,這些源于上游的非編碼RNA產(chǎn)物可以與DNA主要啟動子位點直接相互作用,形成一個嘌呤-嘌呤-嘧啶三螺旋體。
除了核酸序列以外,二級和三級結構在決定lncRNAs的作用模式中也起到了核心作用,它能發(fā)生特異性的結合、變構、及催化作用。
2.1 染色質重物中的雙莖環(huán) 很多l(xiāng)ncRNAs在染色質重構中都發(fā)揮著重要作用,通常和染色質修飾酶類反式結合[19]。Zhao等[20]發(fā)現(xiàn),在小鼠胚胎干細胞中有>9,000的lncRNAs,并和多梳抑制復合物2(PRC2)相互作用。電泳遷移率轉變實驗(EMSA)分析顯示,PRC2通過其四個多梳蛋白結構域之一的EZH2與lncRNAs相互作用,而它三個結構域蛋白能進一步加固這種相互作用。包括RepA/Xist、HOTAIR和Air的大量經(jīng)過鑒定的lncRNAs表明,lncRNAs中整個PRC2-相互作用家族都存在某些共同的特征。此外,lncRNAs也能與LSD1/CoREST/REST復合物結合,這在H3K4去甲基化中極為關鍵。LincRNA HOTAIR是具有這種雙功能的典型例子[3]。
HOTAIR長2.2 kB,能通過招募LSD1和PRC2組蛋白修飾復合物到靶基因位點調(diào)控HoxD和許多其他基因的表達。HOTAIR的刪除實驗結果表明,以下兩個結構域參與這種相互作用:(1)5’端的300 nt區(qū)域與PRC2結合;(2)3’末端下游的646 nt區(qū)域與LSD1結合。由于這兩個關鍵基序存在于HOTAIR的5’和3’末端,那么二者中間的這段序列究竟有什么功能。這段間隔序列是以空間組織的方式為兩個相互作用的位點提供所需的距離;還是它含有靶向作用所需要的基序,或者含有其他尚未發(fā)現(xiàn)的活化所需的其他蛋白的結合基序呢?在PRC2結合結構域內(nèi)曾發(fā)現(xiàn)一個雙莖環(huán)RNA基序。有關LSD1的結合基序內(nèi)還未發(fā)現(xiàn)類似的通用二級結構[20]。
類似于HOTAIR,Xist的一個由該區(qū)域的重復序列編碼,能結合PRC2的重復亞區(qū),長期以來被認為能形成多個雙莖環(huán)結構[21]。最近詳盡的化學分析結果與假設的二級結構元件的排布并不相符,這表明存在一個更為復雜的二次折疊,包括延長的螺旋亞結構域[22]。這需要另外一些有關PRC2與lncRNA相互作用的詳細結構/功能的研究完成以后,與PRC2相互作用的關鍵的RNA模序才能明確。
2.2 3’末端的三葉草結構與大腦發(fā)育:在lncRNAs很多不同的區(qū)域都發(fā)現(xiàn)了與tRNA類似的三葉草二級結構。它參與了lncRNAs的3’末端成熟及其亞細胞排布[23]。這包括MALAT1和Neat1,分別與核斑點及核副斑點的形成有關。在非規(guī)范成熟的MALAT1的3’末端有一個三葉草的二級元件。這個亞區(qū)在MALAT1和Neat1序列中都是最保守的元件,為tRNA-樣結構模式。這個結構元件負責為分裂和產(chǎn)生成熟的MALAT1轉錄本并招募RNase P(與tRNA分子成熟有關)。剩余的分裂片段被RNase Z/tRNA核苷轉移酶進一步處理,生成一個tRNA-樣轉錄本(mascRNA),然后進一步穿梭到胞質。具有類似3’末端加工機制的還有Neat1v2轉錄本,也能產(chǎn)生小的、獨立的tRNA-樣分子,被稱為menRNA[24]。
有趣的是,在另一個lncRNA HAR1(人類加速區(qū))的亞區(qū)也發(fā)現(xiàn)了三葉草結構。HAR1與新大腦皮層發(fā)育有關[25]。這個區(qū)域覆蓋了118個核苷酸,在脊椎動物中高度保守(在雞和黑猩猩中有2 nt的改變),但是在人體內(nèi)有較大的差異(相對黑猩猩有18個突變)[26]。在體外對人(hHAR)和黑猩猩HAR(cHAR)區(qū)域進行結構探測實驗發(fā)現(xiàn)了不同的二次折疊[25]。在黑猩猩中,cHAR采用一種相對不穩(wěn)定的、擴展的發(fā)夾結構;而在人體中,hHAR折疊成一種三葉草結構,其中包括一個4-向連接。
2.3 類固醇激素受體活化中的二級結構 有研究發(fā)現(xiàn),SRA(類固醇激素受體激活劑)能共激活多個類固醇激素受體(如ER、AR、TR、GR、RAR),并和很多蛋白直接相互作用(如SHARP、SLIRP、DAX-1、TR),這表明它在轉錄復合物中可能起到了腳手架的作用。還有研究表明SRA也和CTCF相互作用[27]。它是在人體中首次發(fā)現(xiàn)的lncRNAs之一。生化檢測顯示,它呈復雜的2D結構,由四個主要的亞結構域組成,從小的螺旋區(qū)域到復雜的多路節(jié)點都有二級結構??偟膩碚f,SRA包含25個螺旋片段,16個終端回路,15個內(nèi)部循環(huán)和5個交界區(qū)。同時,嘌呤富集區(qū)是高度保守的,且常位于單鏈區(qū),如末端,中間和連接回路。采用多序列比對進行統(tǒng)計分析表明,在整個脊椎動物中,這個結構中存在大量的螺旋。
迄今為止,還沒確定lncRNAs的三級結構。在此以以往發(fā)現(xiàn)的其他RNA的結構作為參考,并以lncRNAs為背景進行討論。概括地說,RNA的三級結構大致包括tRNA、各種核酶和配體RNA、Ⅰ類和Ⅱ類內(nèi)含子、RNA單環(huán)和四聯(lián)體、細菌核糖體的組分以及剪接體的組成元件。于2000年最初公布的核糖體的高分辨結構,引發(fā)了大量其他RNA的晶體學研究,包括各種的核糖開關RNA,TLS RNA,RNase P,信號識別顆粒,HIV-1移碼元件,端粒酶RNA區(qū)域,以及很多其它的核糖體組分[28]。然而迄今為止,得到高分辨率晶體結構的大RNA(>200 nt)仍然只有核糖體和內(nèi)含子。
Ⅰ類和Ⅱ類內(nèi)含子是從大量RNA莖環(huán)形成的RNA螺旋帽狀結構為特征的致密RNA分子中分離出來的[29,30]。這些螺旋通過各種節(jié)點連接在一起。在螺旋、循環(huán)和節(jié)點之間還存在三級連接。
端粒末端轉移酶復合物的一個重要組分是端粒末端轉移酶RNA,它直接與端粒末端轉移酶逆轉錄酶結合,作為核苷酸加入到末端著絲粒區(qū)域的模板。人端粒酶RNA由450 nt組成。在酵母中發(fā)現(xiàn),est1p在RNA上的結合區(qū)域并不固定,可發(fā)生移動,并且其功能的不受影響,這表明端粒酶RNA的區(qū)域是高度可變的[31]。
RNase P是一個核糖核酸酶,負責從tRNA上剪切下一個前體序列。結構主要由RNA決定[32]。小蛋白分子元件能增加tRNA與RNase P的親和力。這個RNA是高度結構化的,且結構緊密,類似于Ⅰ類和Ⅱ類內(nèi)含子。
在蛋白質的合成中,核糖體是普遍保守的分子[33]。在細菌中,核糖體由兩個亞基組成。小亞基(30S)包括一個1.5 kB的RNA(16S rRNA)和20種不同的蛋白。大亞基(50S)包括一個3 kB的RNA(23S rRNA),一個120 nt組成的RNA(5S rRNA)和35中不同的蛋白。這兩個亞基結合在一起,在中間形成一個大的空間,tRNA能從這里進出。多數(shù)的蛋白質因子在GTP相關中心或三個tRNA結合位點中的一個上與核糖體結合。例如,EF-Tu和EF-G在延伸循環(huán)的不同階段都能結合到核糖體的相同位點上。核糖體結構的支架是RNA,然而很多蛋白質散在穿插分布于核糖體各處,提供結構穩(wěn)定性的總體支架。功能因子能通過GTP-依賴方式保證核糖體在蛋白合成過程中的順利前進,并在蛋白質合成的不同階段介導核糖體的進入與解離。
到目前為止,NEAT1轉錄本的發(fā)現(xiàn)為lncRNAs參與四元復合物形成提供了主要證據(jù)。由同一個啟動子表達產(chǎn)生兩個表達水平相似的Neat1亞型(Neat1V1:3.7 kB和Neat1V2:22.7 kB)[34]。兩種亞型都與特異性細胞核結構核副斑點的形成有關。這些核糖核蛋白復合物的主要特征是具有三個不同的、都含有RNA-結合基序的蛋白質(如p54,PSF和PSP1)[35]。核副斑點模型的形成有賴于初始Neat1V2與PSF及p54結合,之后伴隨發(fā)生PSP1和Neat1V1募集反應的發(fā)生[34]。無論是Neat1V2、p54還是PSF1缺失,都會導致核副斑點崩解;然而,PSP1的缺失并不影響這個結構。免疫雜交和原位雜交的電子顯微鏡研究顯示,核副斑點的締合需要與多個Neat1轉錄本結合,形成一個纖維樣網(wǎng)絡[36]。
使用特異性針對Neat1亞區(qū)的探針發(fā)現(xiàn),Neat1的5’和3’末端主要分布在核副斑點的外圍,而較長的Neat1(Neat1V2)轉錄本中央?yún)^(qū)域形成核副斑點的內(nèi)部部分。核副斑點形成的直徑相對固定,但長度有很大變化。小鼠Neat1轉錄本的直徑對應于人的要短9%(2 kB),由此得出一個結論:Neat1轉錄本的長度也是這種排列長度的一個限制因素。然而,Neat1在核副斑點中最終如何完成排列仍不清楚。有可能是Neat1轉錄本之間通過RNA-RNA相互作用,形成一個大分子復合物平臺。此外,蛋白質可以作為多個Neat1V2轉錄本連接的橋梁,特別是已經(jīng)知道p54能與PSF及PSP1蛋白形成異二聚體。
5.1 LncRNAs可能不存在于核糖體樣核糖核蛋白復合物中 核糖體是迄今為止已發(fā)現(xiàn)的唯一結構>1 kB的RNA,那么,lncRNAs與核糖體在結構組成上是否有相似之處?最近對類固醇激素受體RNA激活劑(SRA)lncRNA結構研究顯示,在整體結構上,RNA的二級結構與核糖體相似。目前,沒有關于SRA lncRNA或其它lncRNAs三級結構的信息,也不清楚lncRNAs是存在于核糖核蛋白復合物中(RNPs),還是作為獨立的RNA。
通過與核糖體相比,發(fā)現(xiàn)了一些含有特異性蛋白質的長RNA復合物。在人類基因組中,蛋白編碼基因的總數(shù)據(jù)估計能達到21 000[37]。由于多數(shù)蛋白質都存在于細胞質中,由此推測胞核中蛋白的數(shù)量,即Nproteinnucl<21 000。而已鑒定lncRNAs多數(shù)位于細胞核中,據(jù)保守估計,NlncRNA,nucl>3 000,由此 NlncRNA,nucl/Nprotein,nucl>1/7。很多l(xiāng)ncRNAs與核糖體大小相當甚至比核糖體還大。以核糖體本身為例,每一個亞基中RNA分子與蛋白分子的比例NrRNA/Nrp約為1/25。因此,在人類基因組中,即使每一個特異性編碼蛋白都與一個lncRNAs形成一個復合物,lncRNAs在結構組成上能仍然不可能與核糖體相似。沒有足夠的特異性蛋白質能讓每一個lncRNAs都形成核糖體樣復合物。因此,存在于胞核中的lncRNAs不太可能存在于核糖體樣RNP復合物中。
5.2 大量的lncRNAs可能形成與端粒酶RNA、RNase P以及Ⅰ類、Ⅱ類內(nèi)含子結構類似的復合物 盡管據(jù)推測lncRNAs復合物的結構與核糖體不同,但卻并不排除它與RNase P、端粒酶RNA或Ⅰ類和Ⅱ類內(nèi)含子相似。以“RNase P樣”復合物為例,lncRNAs是高度結構化和緊密的,含有一個主要的蛋白結合位點,能與各種蛋白結合。實驗證實,SRA的二級結構是高度組織化的,提示它很可能具有這種結構;而某些lncRNAs結構分散,沒有一個緊密的核心,它可能含有幾個不同的蛋白結合位點,作為具有柔韌性的繩索結構,該結構與端粒酶RNA類似[31];而另一些lncRNAs也可能是一個獨立的、高度結構化的RNA,與Ⅰ類和Ⅱ類內(nèi)含子相似。這種lncRNAs可能只是在需要的時候與蛋白短暫地結合;也可能存在一些高度無序的lncRNAs,含有松散的蛋白結合結構域。
5.3 LncRNAs可能的結構機制 基于RNA分子的序列、二級及三級結構,出現(xiàn)了多元化的RNA機制,以及它們的組合機制。在以序列為基礎的機制,如siRNA介導的RNA干擾和miRNA介導的RNA沉默中,RNA起到了非常微小的結構作用。其主要作用是增加這些進程的序列特異性,讓RISC復合物找到它的作用靶點,進而觸發(fā)一個主要以蛋白為基礎的調(diào)節(jié)機制。
在過去的十年中,出現(xiàn)了一個新的調(diào)節(jié)機制,這個機制幾乎完全是基于RNA的二級結構[38-40]。在核糖開關RNA系統(tǒng)中,兩個二級結構彼此競爭以控制轉錄的終止,一個代謝產(chǎn)物的存在與否各選擇這兩種結構中的一種,決定了開關基因表達的啟閉。例如,在SAM-I核糖開關中,代謝產(chǎn)物(SAM)的存在能引起RNA折疊成一個緊密的配體,有利于轉錄終止子螺旋結構的形成,從而關閉SAM合成酶的基因表達。在缺乏該代謝產(chǎn)物時,形成另一種螺旋結構,抑制轉錄終止子螺旋結構的形成,開啟基因表達。
以RNA三級結構為基礎的往往是變構機制,可稱為“誘導契合”或“構象選擇”[41]。在誘導契合中,一個事件,如蛋白或配體結合,能引起一個大的構象變化。蛋白或配體的結合將打破兩種構象形成的動態(tài)平衡,而趨向于形成其中一種。以核糖體為例,不同構象的漲落常常同時存在于在不同的時相。蛋白結合或GTP水解使這種波動同步,推動不同構象間動態(tài)平衡與能量變化相適應,使核糖體在延伸周期中順利前進[42,43]。
5.4 事件的時相和順序 除了lncRNAs的三級結構,事件的順序和這些系統(tǒng)的動力學對于了解機制也是必不可缺的。例如,很多核糖體復合物的結構已經(jīng)被闡明,然而核糖體易位的機制仍然不明確??焖賱恿W研究確定了這些事件發(fā)生的整體順序[44]。單分子研究有助于闡明狀態(tài)轉換的機制。而要完全闡明機制則需要結合結構和動力學雙重方面的信息。
以lncRNAdBE-T為例說明在lncRNAs機制中可能涉及的時相,lncRNAdBE-T是表觀遺傳開關的一個關鍵組成部分,與肩肱型肌營養(yǎng)不良癥(FSHD)有關。該lncRNA具有順式作用,能在染色質上募集表觀遺傳因子D4Z4和Ash1L到DBE(D4Z4結合元件)上,促進組蛋白甲基化及4q35基因轉錄。這些事件的順序可能是:(1)轉錄;(2)lncRNA折疊;(3)表觀遺傳蛋白結合到lncRNA;(4)表觀遺傳蛋白與染色質結合;(5)表觀遺傳蛋白發(fā)揮作用(如組蛋白的甲基化)。其中每個步驟都有相應的時程。鑒別限速步驟對于理解lncRNAs的作用機制有重要意義。不同類型的lncRNAs,發(fā)生的分子事件可能完全不同。
lncRNA的表達非常廣泛,它們在很多生理過程中都起到關鍵作用,包括基因組的全局調(diào)節(jié),因此,它們參與了多種人類疾病的發(fā)生發(fā)展。
6.1 癌癥 LncRNAs在控制細胞周期、細胞凋亡和抑制腫瘤過程中起到舉足輕重的作用。LncRNAs ANRIL調(diào)節(jié)三個獨立的抑癌基因p16INK4a、p14ARF和P15INK4B,是細胞周期重要的負調(diào)控因子[45]。破壞ANRIL的表達會促進多種腫瘤的發(fā)生,包括神經(jīng)母細胞瘤、急性淋巴細胞性白血病、黑色素瘤[45]和前列腺癌。HOTAIR轉錄物是一種與HOXD基因簇有關的cis-lncRNA,當其過表達時,會反向調(diào)節(jié)HOXD的表達,引起肝癌、大腸癌和乳腺癌。卵巢癌和乳腺癌與LSINCT5 lncRNA的表達有關。該轉錄物可作用于其它幾種轉錄物,包括反義RNA Neat1和PSPC1基因,二者可編碼一種剪接調(diào)節(jié)因子[46]。在MALAT1過表達誘導的非小細胞型肺癌中,存在lncRNAs相關的可變剪切功能障礙。
6.2 代謝性疾病 雖然對于lncRNAs在代謝性疾病中的作用知之甚少,但是有研究表明,某些lncRNAs是新陳代謝和內(nèi)分泌功能的重要調(diào)節(jié)器。其中naPINK最近備受關注,它是PINK1 [PTEN(10號染色體上缺失磷酸酶和張力蛋白)誘導假定激酶1]的反義轉錄本。正如它的名字一樣,PINK1受PTEN誘導,是胰島素信號通路的重要抑制劑。PINK1的缺失與糖尿病狀態(tài)、神經(jīng)元細胞株葡萄糖攝取受損、脂肪細胞線粒體基因表達有關[47],naPINK1破壞,可能會影響葡萄糖代謝。同樣,已知的反義轉錄物H19/IGF2和甲狀腺生長因子受體α2(ERBa2)可能能調(diào)節(jié)他們的內(nèi)分泌和代謝功能[48]。在脂代謝基因中同樣涉及到lncRNAs。據(jù)報道[48],△5脫氫酶(FADS1)和急性類固醇合成調(diào)節(jié)蛋白(STAR)基因均存在lncRNAs。在動物模型中發(fā)現(xiàn),膳食脂肪含量對FADS的表達及其lncRNAs,反式D5-脫氫酶的調(diào)節(jié)是相反的。在食欲控制中也涉及到lncRNAs;最近證實,人生長素(GRHL)基因的lncRNAs能促進攝食行為。這些結果表明,lncRNAs表達異常會影響肥胖。
6.3 神經(jīng)退行性疾病和精神疾病 在AD的病因中涉及到BACE1的反義轉錄本,BACE1AS[49]。AD的一些特征是由于大腦中β-淀粉樣斑塊的聚積造成的。BACE1基因是一種完整的膜肽酶A1糖蛋白,在β-淀粉樣斑塊的聚積過程中起到關鍵作用。BACE1是兩個對急性期蛋白進行初步水解的肽酶之一,并使之在大腦中積聚。BACE1AS的水平在患有AD的受試人群中含量較高,在AD轉基因小鼠模型中含量同樣較高[49]。
在精神性疾病中也有關于lncRNAs的報道?!爸袛嗟木穹至寻Y1”DISC1基因座的中斷與精神分裂癥、情感性分裂癥、雙相情感障礙、重癥抑郁及自閉癥有關。DISC1受其lncRNAdISC2的調(diào)節(jié),后者可能也是這些失調(diào)癥狀的易感因素。精神分裂癥譜系和AD也與RELN基因及其反義轉錄本HAR1有關[50]。
6.4 心血管疾病、高血壓和中風 LncRNAs有可能會影響心血管疾病和高血壓。許多前瞻性研究發(fā)現(xiàn),影響ANRIL轉錄本表達的遺傳變異與中風的風險和復發(fā)有關。在高血壓中,七個血壓候選基因(ADD3、NPPA、ATP1A1、NPR2、CYP17A1、ACSM3和SLC14A2)與cis-lncRNA轉錄本有關。一般利尿鈉肽前體A(NPPA)的基因產(chǎn)物僅在胎兒心房和心室肌細胞表達,但發(fā)現(xiàn)其在表現(xiàn)出肥厚和心力衰竭的患者中也有再活化[51],因此被認為是心臟疾病的標志物。NPPA-AS lncRNA被認為是NPPA基因選擇性剪接的調(diào)節(jié)器。這個lncRNA有可能與心血管疾病有關。
6.5 免疫功能障礙和自我免疫 研究發(fā)現(xiàn),lncRNAs在控制先天性免疫信號系統(tǒng)中有重要作用[52]。通過對四個不同品系的小鼠研究發(fā)現(xiàn),當發(fā)生病毒性感染時,在免疫應答過程中,有近500個lncRNAs的表達發(fā)生改變[52]。細胞應激可激活生長阻滯特異轉錄本5(growth arrest specific 5,Gas5),通過糖皮質激素受體作用于不同的基因,并且是細胞凋亡的重要調(diào)節(jié)因素。在小鼠模型中Gas5與系統(tǒng)性紅斑狼瘡的易感性增加有關,可能與它與糖皮質激素的免疫抑制作用有關。還有研究發(fā)現(xiàn),在未經(jīng)治療的Graves’病的患者中,反義RNA Heg與CD14de水平和甲狀腺自身抗體有關。
近年,在生物學的不同領域發(fā)現(xiàn)了上千種新lncRNAs,很可能會揭示出一系列不同的結構和結構機制。這些機制可能基于lncRNAs序列、二級結構、三級結構,或基于這幾者的共同作用。LncRNAs結構的多元化將伴隨著一系列相應的動力學機制。由于RNA分子難以進行結晶,很有必要用一些替代方案來獲取lncRNAs的三維信息。確定lncRNAs共有的結構特征和結構/功能關系,將有助于我們理解lncRNAs在發(fā)育和疾病中的作用,為以lncRNAs為基礎的治療策略的制定奠定基礎。
LncRNAs成為真核轉錄的一個重要組成部分,參與70 %基因表達的調(diào)節(jié)。和多種生理學進程,如表觀遺傳的調(diào)控、染色質重塑和mRNA可變加工等,從而密切參與并控制重要的生理過程。它們對于多種高級功能的調(diào)控,為未來的疾病治療開辟了一個令人激動的新領域。
1 Pauli A,Rinn JL,Schier AF.Non-coding RNAs as regulators of embryogenesis.Nat Rev Genet,2011,12:136-149.
2 Wang X,Song X,Glass CK,et al.The long arm of long noncoding RNAs: roles as sensors regulating gene transcriptional programs.Cold Spring Harb Perspect Biol,2011,3: a003756.
3 Gupta RA,Shah N,Wang KC,et al.Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis.Nature,2010,464: 1071-1076.
4 Barsotti AM,Prives C.Noncoding RNAs: the missing“l(fā)inc” in p53-mediated repression.Cell,2010,142: 358-360.
5 Valadkhan S,Nilsen TW.Reprogramming of the non-coding transcriptomeduring braindevelopment.J Biol,2010,9: 56.
6 Ponting CP,Oliver PL,Reik W.Evolution and functions of long noncoding RNAs.Cell,2009,136: 629-641.
7 Gong C,Maquat LE.lncRNAs transactivate STAU1-mediated mRNAdecay byduplexing with 3’ UTRs via Alu elements.Nature,2011,470: 284-288.
8 Ietswaart R,Wu Z,Dean C.Flowering time control:another window to the connection between antisense RNA and chromatin.Trends Genet,2012,28:445-453.
9 Swiezewski S,Liu F,Magusin A,et al.Coldinduced silencing by long antisense transcripts of an Arabidopsis Polycomb target.Nature,2009,462: 799-802.
10 Surface LE,Thornton SR,Boyer LA.Polycomb group proteins set the stage for early lineage commitment.Cell Stem Cell,2010,7: 288-298.
11 Djebali S,Davis CA,Merkel A,et al.Landscape of transcription in human cells.Nature,2012,489: 101-108.
12 Kapranov P,Cheng J,Dike S,et al.RNA maps reveal new RNA classes and a possible function for pervasive transcription.Science,2007,316: 1484-1488.
13 Bánfai B,Jia H,Khatun J,et al.Long noncoding RNAs are rarely translated in two human cell lines.Genome Res,2012, 22:1646-1657.
14 Korostowski L,Raval A,Breuer G,et al.Enhancerdriven chromatin interactionsduringdevelopment promote escape from silencing by a long non-coding RNA.Epigenetics Chromatin,2011,4:21.
15 Derrien T,Johnson R,Bussotti G,et al.The GENCODE v7 catalog of human long noncoding RNAs: Analysis of their gene structure,evolution,and expression.Genome Res,2012,22: 1775-1789.
16 Bertani S,Sauer S,Bolotin E,et al.The noncoding RNA Mistral activates Hoxa6 and Hoxa7 expression and stem celldifferentiation by recruiting MLL1 to chromatin.Mol Cell,2011,43:1040-1046.
17 Martianov I,Ramadass A,Serra Barros A,et al.Repression of the humandihydrofolate reductase gene by a non-coding interfering transcript.Nature,2007,445: 666-670.
18 Guttman M,Donaghey J,Carey BW,et al.lincRNAs act in thecircuitry controlling pluripotency anddifferentiation.Nature,2011,477: 295-300.
19 Zhao J,Ohsumi TK,Kung JT,et al.Genome-wide identification of polycomb-associated RNAs by RIP-seq.Mol Cell,2010,40: 939-953.
20 Zhao J,Sun BK,Erwin JA,et al.Polycomb proteins targeted by a short repeat RNA to the mouse X chromosome.Science,2008,322: 750-756.
21 Maenner S,Blaud M,F(xiàn)ouillen L,et al.2-D structure of the A region of Xist RNA and its implication for PRC2 association.PLoS Biol,2010,8: e1000276.
22 Wilusz JE,SpectordL.An unexpected ending:noncanonical 3’ end processing mechanisms.RNA,2010,16: 259-266.
23 Sunwoo H,Dinger ME,Wilusz JE,et al.MEN epsilon/beta nuclear-retained non-coding RNAs are up-regulated upon muscledifferentiation and are essential components of paraspeckles.Genome Res,2009,19: 347-359.
24 Beniaminov A,Westhof E,Krol A.Distinctive structures between chimpanzee and human in a brain noncoding RNA.RNA,2008,14: 1270-1275.
25 Pollard KS,Salama SR,Lambert N,et al.An RNA gene expressedduring corticaldevelopment evolved rapidly in humans.Nature,2006,443: 167-172.
26 Yao H,Brick K,Evrard Y,et al.Mediation of CTCF transcriptional insulation bydEAD-box RNA-binding protein p68 and steroid receptor RNA activator SRA.Genesdev,2010,24: 2543-2555.
27 Holbrook SR.RNA structure: the long and the short of it.Curr Opin Struct Biol,2005,15: 302-308.
28 Pyle AM,F(xiàn)edorova O,Waldsich C.Folding of group II introns: a model system for large,multidomain RNAs? Trends Biochem Sci,2007,32: 138-145.
29 Chan RT,Robart AR,Rajashankar KR,et al.Crystal structure of a group II intron in the pre-catalytic state.Nat Struct Mol Biol,2012,19: 555-557.
30 Mitchell M,Gillis A,F(xiàn)utahashi M,et al.Structural basis for telomerase catalytic subunit TERT binding to RNA template and telomericdNA.Nat Struct Mol Biol,2010,17: 513-518.
31 Reiter NJ,Osterman A,Torres-Larios A,et al.Structure of a bacterial ribonuclease P holoenzyme in complex with tRNA.Nature,2010,468: 784-789.
32 Gao YG,Selmer M,Dunham CM,et al.Ramakrishnan V.The structure of the ribosome with elongation factor G trapped in the posttranslocational state.Science,2009,326: 694-699.
33 Sasaki YT,Ideue T,Sano M,et al.MENepsilon/beta noncoding RNAs are essential for structural integrity of nuclear paraspeckles.Proc Natl Acad Sci USA,2009,106: 2525-2530.
34 Fox AH,Bond CS,Lamond AI.P54nrb forms a heterodimer with PSP1 that localizes to paraspeckles in an RNA-dependent manner.Mol Biol Cell,2005,16: 5304-5315.
35 Souquere S,Beauclair G,Harper F,et al.Highly ordered spatial organization of the structural long noncoding NEAT1 RNAs within paraspeckle nuclear bodies.Mol Biol Cell,2010,21: 4020-4027.
36 Bernstein BE,Birney E,Dunham I,et al.An integrated encyclopedia ofdNA elements in the human genome.Nature,2012,489: 57-74.
37 Breaker RR.Complex riboswitches.Science,2008,319: 1795-1797.
38 Hennelly SP,Sanbonmatsu KY.Tertiary contacts control switching of the SAM-I riboswitch.Nucleic Acids Res,2011,39: 2416-2431.
39 Stoddard CD,Montange RK,Hennelly SP,et al.Free state conformational sampling of the SAM-I riboswitch aptamerdomain.Structure,2010,18: 787-797.
40 Hayes RL,Noel JK,Mohanty U,et al.Magnesium fluctuations modulate RNAdynamics in the SAM-I riboswitch.J Am Chem Soc,2012,134: 12043-12053.
41 Munro JB,Vaiana A,Sanbonmatsu KY,et al.A new view of protein synthesis: mapping the free energy landscape of the ribosome using single-molecule FRET.Biopolymers,2008,89: 565-577.
42 Sanbonmatsu KY.Computational studies of molecular machines: the ribosome.Curr Opin Struct Biol,2012,22: 168-174.
43 Whitford PC,Onuchic JN,Sanbonmatsu KY.Connecting energy landscapes with experimental rates for aminoacyl-tRNA accommodation in the ribosome.J Am Chem Soc,2010,132: 13170-13171.
44 Blanchard SC.Single-molecule observations of ribosome function.Curr Opin Struct Biol,2009,19: 103-109.
45 Zhang X,Sun S,Pu JK,et al.Long non-coding RNA expression profiles predict clinical phenotypes in glioma.Neurobioldis,2012,48: 1-8.
46 Bernardd,Prasanth KV,Tripathi V,et al.A long nuclear-retained non-coding RNA regulates synaptogenesis by modulating gene expression.EMBO J,2010,29: 3082-3093.
47 CabiancadS,Casa V,Bodega B,et al.A long ncRNA links copy number variation to a polycomb/trithorax epigenetic switch in FSHD musculardystrophy.Cell,2012,149: 819-831.
48 Rinn JL,Chang HY.Genome regulation by long noncoding RNAs.Annu Rev Biochem,2012,81: 145-166.
49 Ponting CP,Oliver PL,Reik W.Evolution and functions of long noncoding RNAs.Cell,2009,136: 629-641.
50 Cesana M,Cacchiarellid,Legnini I,et al.A long noncoding RNA controls muscledifferentiation by functioning as a competing endogenous RNA.Cell,2011,147: 358-369.
51 Guttman M,Donaghey J,Carey BW,et al.lincRNAs act in the circuitry controlling pluripotency anddifferentiation.Nature,2011,477: 295-300.
52 Sanford JR,Wang X,Mort M,et al.Splicing factor SFRS1 recognizes a functionallydiverse landscape of RNA transcripts.Genome Res,2009,19: 381-394.
10.3969/j.issn.1002-7386.2014.17.048
050051 河北省石家莊市婦幼保健院檢驗科
R 3571.1
A
1002-7386(2014)17-2666-07
2014-03-11)