李宏宇 許文濤,2
(1. 中國農(nóng)業(yè)大學(xué)食品科學(xué)與營養(yǎng)工程學(xué)院,北京 100083;2. 農(nóng)業(yè)部農(nóng)業(yè)轉(zhuǎn)基因生物安全評價(食用)重點實驗室,北京 100083)
環(huán)狀RNA(circRNA)是在RNA成熟過程中一個叫反向剪接的環(huán)節(jié)中出現(xiàn)的。代替了傳統(tǒng)的線性連接方式由上游的5′端的結(jié)合位點與下游的3′端結(jié)合位點反向連接形成環(huán)狀。環(huán)狀RNA是一類特殊的內(nèi)源性非編碼RNA,繼長鏈非編碼RNA和微小RNA之后的一類特殊群體,但是現(xiàn)在同樣有研究稱環(huán)狀RNA構(gòu)成了一類有趣的長鏈非編碼RNA群體。雖然承認(rèn)其在細(xì)胞內(nèi)的存在性已經(jīng)有30多年,但對其在細(xì)胞內(nèi)的廣泛性和高豐度是直到21世紀(jì)初期才被逐漸發(fā)現(xiàn)。環(huán)狀RNA具有穩(wěn)定的結(jié)構(gòu),可以不依靠蛋白單獨存在。環(huán)狀RNA作為一類特殊的RNA群體,由于其本身的環(huán)化結(jié)構(gòu)而不帶有正常RNA的3′和5′端,不能通過傳統(tǒng)的檢測技術(shù)檢測而被忽略,直到新一代測序技術(shù)的出現(xiàn)和發(fā)展使其可以通過去除rRNA富集之后進(jìn)行測序?qū)⑺匦聨肟茖W(xué)家的視野中[1-4]。
環(huán)狀RNA由外顯子反向剪接形成的ecircRNA、內(nèi)含子來源的inciRNA以及外顯子和內(nèi)含子都參與的EIciRNA三大類組成。很多生物信息學(xué)的方法都證明了環(huán)狀RNA 的反向剪接方式,其標(biāo)志性的剪切位點GT-AG成為檢測其存在的一個重要標(biāo)志,從來源上講,其大部分來源于外顯子和內(nèi)含子,但同樣也包含基因間的序列和非編碼的UTR區(qū)域;這些分析同時也表明不同的環(huán)狀RNA有可能來自于同一個基因座,同時出現(xiàn)一種替代環(huán)化的現(xiàn)象,這些環(huán)狀RNA序列長度在大到25 000 nt以上小到小于100 nt不等,已有研究證實在病毒和擬病毒中最小的環(huán)狀RNA為220 nt,同時其也是一個可以編碼16 kD長度蛋白的環(huán)狀RNA[1-3,5-6]。環(huán)狀RNA在很多發(fā)育過程中都起著重要的作用,如作為miRNA的海綿體,通過結(jié)合miRNA來調(diào)節(jié)miRNA 的表達(dá);與U1SnRNP結(jié)合來促進(jìn)基因的轉(zhuǎn)錄等。一些研究報道稱,環(huán)狀RNA在不同的組織和不同的發(fā)育時期的表達(dá)量不同。這意味著環(huán)狀RNA不僅是監(jiān)管和拼接的副產(chǎn)品,同時也是在基因調(diào)控上有著重要作用的功能性基因[7]。與此同時,環(huán)狀RNA對多種疾病都存在著調(diào)節(jié)作用并且可以作為其中一些疾病的生物標(biāo)記物。因此,環(huán)狀RNA的重要程度是不言而喻的。本文將對環(huán)狀RNA的形成機制、功能、尤其是檢測方法、novel 環(huán)狀RNA的鑒定以及疾病相關(guān)性一個認(rèn)知程度內(nèi)的概述。
環(huán)狀RNA是一類由3′端反向與5′端連接形成的共價閉合環(huán)狀RNA分子,環(huán)狀RNA與microRNA以及長鏈非編碼RNA在轉(zhuǎn)錄的過程中占據(jù)了總RNA含量的95%左右。首次提出環(huán)狀RNA的概念是在1976年,Sange[8]和他的同事提出高等植物中的一種類病毒RNA為環(huán)狀,稱為環(huán)狀RNA。在1979年,在電子顯微鏡下發(fā)現(xiàn)了環(huán)狀RNA為其存在性提供了有力的證據(jù)[9]。1991年,Nigro等[10]在研究RNA翻譯表達(dá)的時候發(fā)現(xiàn)很多異常拼接的RNA分子,其中腫瘤抑制基因DCC在體外發(fā)生了異常拼接。在1993年,在動物的睪丸中發(fā)現(xiàn)性別決定基因sry是一種環(huán)狀RNA[11]。但是環(huán)狀RNA在從發(fā)現(xiàn)到被重視這30年間一直被視為RNA剪接成熟過程中的異常剪接物而被忽視,直到21世紀(jì)初隨著高通量測序技術(shù)的發(fā)展和深入,環(huán)狀RNA才重新走入科學(xué)家的視野。至今為止,隨著研究的深入,已經(jīng)在線蟲、小鼠、大鼠、豬、猴子和人類等物種中發(fā)現(xiàn)了環(huán)狀RNA的存在。其中Jeck等[1]在人成纖維細(xì)胞中檢測到至少25 000種環(huán)狀RNA;Memczak等[12]在線蟲、小鼠和人體中分別找到了大約700種、1 900種和2 000種環(huán)狀RNA。未發(fā)現(xiàn)的環(huán)狀RNA仍有很多,同樣在其他物種中也必然存在豐富的環(huán)狀RNA,還有待進(jìn)一步探究。
環(huán)狀RNA是一類特殊的內(nèi)源性非編碼RNA具有高豐度、高保守性及高度的組織特異性等特點。環(huán)狀RNA在哺乳動物的組織中是非常普遍的,并且可以通過和miRNA結(jié)合及其他的方式從轉(zhuǎn)錄和非轉(zhuǎn)錄的水平上調(diào)節(jié)基因的表達(dá)。環(huán)狀RNA具有重要的調(diào)節(jié)作用,但是在剛發(fā)現(xiàn)其存在的時候,其被視為一種前體RNA成熟剪接過程中的非功能性產(chǎn)物,本質(zhì)原因即為其形成方式的獨特,并不是傳統(tǒng)的線性連接方式,而是一種特殊的剪接方式—反向剪接。其形成的環(huán)狀RNA的前體來源大體分為兩類,即外顯子和內(nèi)含子。
2.1.1 外顯子環(huán)狀RNA的形成機制 第一例被發(fā)現(xiàn)的內(nèi)源性產(chǎn)生的環(huán)狀RNA是20世紀(jì)90年代在一個對于人類細(xì)胞中DCC的轉(zhuǎn)錄研究中發(fā)現(xiàn)的。據(jù)這個實驗的研究者稱外顯子的轉(zhuǎn)錄方式超出了預(yù)期,下游的3′跳躍到了上游與5′端連接,盡管是這種不正常的連接方式,其所用的連接位點和接受位點與正常的連接方式是一樣的[13]。這種連接方式被稱為外顯子的“跳讀”[1],由此外顯子的形成方式已逐漸清晰。后來根據(jù)Jeck等[3]的研究,總結(jié)出外顯子形成環(huán)狀RNA的兩種主流形式,第一種方式為直接反向剪接,由下游的3′端跳躍到上游與5′端結(jié)合形成環(huán)狀RNA,由于其過程中發(fā)生的反向拼接現(xiàn)象,其中間部分的內(nèi)含子序列隨之一起折疊,并且在此過程中內(nèi)含子與外顯子連接的3′以及5′端連接形成套索結(jié)構(gòu),并隨之被剪切去掉,剩下的外顯子部分反向連接形成環(huán)狀結(jié)構(gòu)。第二種方式為內(nèi)含子競爭性配對結(jié)合,此種方式中pri-mRNA兩端的內(nèi)含子由于競爭性的互補配對促使外顯子發(fā)生反向折疊連接在一起,再將內(nèi)含子部分剪切除去形成外顯子部分連接的環(huán)狀RNA,如圖1。已有研究證實直接反向剪接形成環(huán)狀RNA的效率要高于內(nèi)含子競爭性配對方式形成環(huán)狀RNA,而且在機體內(nèi)這種形成方式更為普遍[14]。外顯子形成的環(huán)狀RNA可以分為單個外顯子、2個及2個以上外顯子形成的環(huán)狀RNA幾種,根本在于其剪切位點的不同。環(huán)狀RNA在體外的轉(zhuǎn)錄合成已經(jīng)得到了證實[15]。
2.1.2 內(nèi)含子環(huán)狀RNA的形成機制 剪接在某種程度上就是intron splicing即內(nèi)含子的剪接,而內(nèi)含子的進(jìn)化分類如果按剪接方式來分可以分為I類內(nèi)含子、II類內(nèi)含子(group I、II intron)和核mRNA前體內(nèi)含子(Spliceosomal introns),其中核mRNA前體內(nèi)含子(Splicesomal intron)對于外顯子形成的環(huán)狀RNA是密切相關(guān)的,而group I intron和group II intron代表了內(nèi)含子環(huán)狀RNA形成的兩種不同驅(qū)動方式[16]。
2.1.2.1 I類內(nèi)含子環(huán)狀RNA的形成方式 一個外源的鳥苷作為親核試劑去攻擊5′結(jié)合位點并與內(nèi)含子結(jié)合,經(jīng)酯基轉(zhuǎn)移后,5′端外顯子被切除并且外源的鳥嘌呤與內(nèi)含子產(chǎn)生聯(lián)系,5′端外顯子的終端3′-OH攻擊3′端拼接點,連接的外顯子和一個線性的內(nèi)含子被切除釋放。最終,由2′端羥基和5′端接受位點形成磷酸二酯鍵形成內(nèi)含子環(huán)狀RNA[17]。
2.1.2.2 II類內(nèi)含子環(huán)狀RNA的形成方式 環(huán)化的發(fā)生需要3′外顯子的提前釋放,內(nèi)含子末端的2′羥基集團攻擊5′剪接位點,通過形成磷酸二酯鍵產(chǎn)生一個5′外顯子和一個環(huán)狀RNA,如圖2[18]。
2.1.3 環(huán)狀RNA形成的調(diào)節(jié)因素 據(jù)報道,環(huán)化的區(qū)域兩側(cè)必然存在著長度不一的重復(fù)側(cè)翼內(nèi)含子序列,這是一種天然并且廣泛存在于細(xì)胞基因中的重復(fù)序列-Alu序列,其存在促進(jìn)了環(huán)狀RNA的形成,Alu序列的作用受到藤黃節(jié)桿菌(Arthrobacter luteus,ALU)限制性酶的調(diào)控。同時,有相關(guān)研究報道還有一些其他內(nèi)含子互補序列同樣對反向剪接起促進(jìn)作用。除了一些內(nèi)含子互補序列對反向剪接起促進(jìn)作用之外,一些RNA結(jié)合蛋白如肌肉生長調(diào)節(jié)因子(Muscleblind,MBL)能夠促進(jìn)環(huán)狀RNA的合成,可變剪切調(diào)節(jié)因子(Quaking,QKI)在上皮間質(zhì)轉(zhuǎn)化(Epithelial-mesenchymal transition,EMT)過程中可以調(diào)節(jié)環(huán)狀RNA的合成以及RNA結(jié)合調(diào)節(jié)蛋白(RNA binding motif protein 20,RBM20)同樣對環(huán)狀RNA的形成起調(diào)節(jié)作用[19]。
生物學(xué)特性一般是指形態(tài)、大小、結(jié)構(gòu)、顏色等理化性質(zhì),而環(huán)狀RNA的生物學(xué)特性是對其種類、分布、豐度等性質(zhì)的概括。由于環(huán)狀RNA反向剪接而成的特征,其存在很多獨特的生物學(xué)特性。
環(huán)狀RNA種類繁多,能夠由一個外顯子或者許多個外顯子構(gòu)成,環(huán)形的長度從小于100 nt到大于4 000 bp不等[3,20]。存在范圍非常廣泛,在鼠類中已經(jīng)發(fā)現(xiàn)近2 000種環(huán)狀RNA,在線蟲中發(fā)現(xiàn)超過700種。它在不同物種間有很好的保守性,有趣的是,已經(jīng)證實69種環(huán)狀RNA在人類與鼠類之間有著精準(zhǔn)的保守性。環(huán)狀RNA的表達(dá)量是非常少的,但是其在細(xì)胞中的豐度非常高。
圖1 外顯子環(huán)狀RNA的形成
圖2 內(nèi)含子環(huán)狀RNA的形成
MicroRNA作為非編碼小RNA家族中的一員,其在基因表達(dá)的調(diào)控方面具有至關(guān)重要的作用。而研究發(fā)現(xiàn)環(huán)狀RNA通過其具有microRNA海綿體的作用,可以通過與microRNA的結(jié)合來調(diào)控microRNA的作用以此間接調(diào)控著很多的生理狀態(tài)。
3.1.1 ciRS-7 在環(huán)狀RNA研究中,對microRNA的研究最多的就是miR-7,它對其他癌癥和疾病中的很多相關(guān)因素都具有調(diào)節(jié)的功能,如細(xì)胞發(fā)育、增殖和細(xì)胞凋亡[21-22]。在對許多惡性腫瘤研究發(fā)現(xiàn),它能作為很多組織的癌癥和腫瘤的抑制基因,包括乳房[23]、大腦[24]、頭部和頸部[25]、肝臟[26]和肺[27]。小腦的退化相關(guān)蛋白1的反義鏈(CDR1as),亦稱為miR-7海綿體,能夠與micror-7結(jié)合并調(diào)節(jié)其功能,這提供了第一個環(huán)狀RNA可以作為microRNA的海綿體的證據(jù)[28]。CiRS-7包含了70多個對mir-7的結(jié)合位點,并通過Argonaute蛋白質(zhì)緊密聯(lián)系在一起[29]。通過延伸和附近結(jié)合效應(yīng),這種環(huán)狀RNA對不同的miRNA分別有一個單獨的結(jié)合靶位點。而miR-671可以分裂ciRS-7/CDR1as來調(diào)節(jié)環(huán)狀RNA對miR-7的抑制作用[30]。已有研究證明了環(huán)狀RNA中ciRS-7/CRR1as的保守性和穩(wěn)定性以及對miR-7活性的調(diào)節(jié)作用。通過與miRNA結(jié)合形成復(fù)合體以及重新釋放它們來調(diào)節(jié)其活性,這是對miRNA活性研究的新發(fā)現(xiàn)。盡管這種競爭性內(nèi)源RNA的想法并不新穎,并且飽含爭議,但是環(huán)狀RNA的穩(wěn)定性足以支撐起其海綿效應(yīng)的其余優(yōu)勢了。
3.1.2 Sry circRNA 成熟的哺乳動物性別決定基因(Sex-determining region Y,Sry),能夠形成一種特殊的環(huán)狀序列[28]。這個長度在1.2kb的完全由外顯子組成的環(huán)狀RNA包含了16個miR-138的靶位點,也能起到類似于miRNA海綿體的作用。盡管這種作用和環(huán)狀RNA ciRS-7/CDR1as的作用類型相似,都是競爭性內(nèi)源RNA的方式,但是這種機制是建立在特殊的RNA序列和重復(fù)序列上的[31]。因此,這種機制是否是普遍存在的環(huán)狀RNA調(diào)節(jié)機制還有待進(jìn)一步的研究。
3.1.3 circHIPK3 Zheng等[32]的進(jìn)一步研究發(fā)現(xiàn)了一種環(huán)狀RNA circHIPK3,這是一種來自于HIPK3基因外顯子的環(huán)狀RNA。體外研究顯示,在癌細(xì)胞中沉默circHIPK3導(dǎo)致癌細(xì)胞的增長速度顯著下降。通過熒光素酶報告基因的篩選,他們觀察到circHIPK3可以結(jié)合多種microRNA,包括眾所周知的腫瘤抑制因子miR-124[33]。這說明circHIPK3通過在人類細(xì)胞中調(diào)控多種microRNA來調(diào)節(jié)細(xì)胞的生長。
3.1.4 cirITCH 最近發(fā)現(xiàn)的一種叫做cirITCH的環(huán)狀RNA,同樣有miRNA海綿的作用,通過調(diào)控mir-7和mir-20a來發(fā)揮作用。它增加了ITCH的表達(dá)水平,這是一種蛋白質(zhì)編碼基因,它會引發(fā)泛素介導(dǎo)的Dvl2退化并抑制常規(guī)的Wnt信號通路,具有整體的抗腫瘤效果[34]。
環(huán)狀RNA的產(chǎn)生對可變剪接的調(diào)節(jié)作用幾乎是已經(jīng)確定的了。這種機制基于一個事實:pre-mRNA的剪接過程主要是3′端和5′端的競爭性結(jié)合[35],而在這個過程中一旦出現(xiàn)反向剪接現(xiàn)象,外顯子將會出現(xiàn)“跳讀”現(xiàn)象,這將使原本pre-mRNA的正常剪接過程發(fā)生變化,或者導(dǎo)致其被降解。在這種案例中,環(huán)狀RNA的產(chǎn)生對于調(diào)節(jié)pre-mRNA的可變剪接過程有著重要的作用,盡管這將導(dǎo)致環(huán)狀RNAs有可能失去功能性。同時反向剪接與正常的RNA剪接成熟在pre-mRNA的后加工過程中是存在競爭性的,環(huán)狀RNA的產(chǎn)生意味著正常線性RNA的產(chǎn)量變少。
很多不同的關(guān)于環(huán)狀RNA的功能已經(jīng)被發(fā)掘出來[36],包括其他影響因素的海綿體,例如RNA結(jié)合蛋白(RNA-binding proteins,RNPs)。環(huán)狀RNAs能夠通過結(jié)合和分離這些影響因素從而阻止它們發(fā)揮作用。在這方面強有力的證據(jù)就是其上含有的結(jié)合位點,如miR-7和ciRS-7/CDR1as的關(guān)系。然而由于大多數(shù)環(huán)狀RNA的低含量,其持續(xù)影響目標(biāo)分子的能力勢必會大幅度降低[37]。
環(huán)狀RNA可以作為一些混合物的“儲藏室”,并且可以轉(zhuǎn)移這些因素去一些特別的亞細(xì)胞位置,或者可以作為某些反應(yīng)的支架。盡管環(huán)狀RNA有起始密碼子和合理的開放性閱讀框,并且在一些功能性環(huán)狀RNA上已經(jīng)發(fā)生了翻譯現(xiàn)象,如IRESes。但是其翻譯性現(xiàn)階段只在病毒中被證實了而在真核生物中還沒有確實的答案,關(guān)于其翻譯的證據(jù)到現(xiàn)在為止還是十分缺乏的
在1976年首次提出環(huán)狀RNA的概念,1979年在顯微鏡下發(fā)現(xiàn)了類病毒中的環(huán)狀RNA,1982-1988年研究者們用瓊脂糖凝膠電泳和2D凝膠電泳中都檢測到了環(huán)狀RNA的存在,測序技術(shù)的發(fā)展使環(huán)狀的檢測變得越來越容易,從只能知道其存在到能確定是何種環(huán)狀RNA,環(huán)狀RNA的檢測經(jīng)歷了長足的進(jìn)步史。
用northblot分離環(huán)狀RNA,在瓊脂糖凝膠電泳中,雖然環(huán)狀RNA的遷移速率要比線性RNA的速率慢很多,但是實際上外顯子環(huán)狀RNA相比于其他來自于同一基因的全長線性RNA以及含有重復(fù)外顯子序列的線性RNA所含有的核算數(shù)量要少的多,所以其在瓊脂糖中的遷移速度反而要更快一些[38]。更具有決定性意義的實驗是使用弱水或者靶向RNaseH進(jìn)行降解處理,在瓊脂糖凝膠電泳中未被處理的RNA遷移速率最慢,而被處理的線性RNA會出現(xiàn)兩條條帶,但是被處理后的環(huán)狀RNA只有一條條帶[11]。同時還可以用2D凝膠電泳,在此凝膠中線性RNA會跑出一條對角的直線,而環(huán)狀RNA則是從斜對角一端到另一端的拋物曲線[30,39]。但一種方法的檢測必然存在不精準(zhǔn)的地方,需要多種方法協(xié)同使用才能達(dá)到最佳效果。
環(huán)狀RNA同樣可以定量檢測,環(huán)狀RNA的pcr與普通的線性基因pcr不同,因為環(huán)狀RNA在premRNA的剪切過程中為反向剪接,其下游的3′位點與上游的5′位點結(jié)合導(dǎo)致其引物不是常規(guī)上游下游各一段引物相向擴增就可以得到結(jié)果,其junction位點處與線性RNA不同。但是其序列body處的堿基排列還是一致的,所以需要設(shè)計一種背對背引物(Divergent primer),可以反向擴增來實現(xiàn)環(huán)狀RNA的定量驗證。這種背對背引物的設(shè)計在環(huán)狀RNA的數(shù)據(jù)庫網(wǎng)站上有專門的設(shè)計專欄,如圖3[40-41]。
4.2.1 環(huán)狀RNA單組學(xué)建庫 環(huán)狀RNA單獨建庫,其最關(guān)鍵的步驟在于去掉線性RNA及rRNA,單獨留下環(huán)狀RNA進(jìn)行后續(xù)建庫。
首先分離mRNA,通過磁珠法,利用磁珠上結(jié)合的oligo dT捕獲帶有poly A尾的mRNA,此時未與磁珠結(jié)合的環(huán)狀RNA存在于緩沖體系中,收集上清,通過乙醇沉淀的方法,得到去除mRNA后的RNA,而磁珠捕獲的mRNA可以用來構(gòu)建轉(zhuǎn)錄組文庫,為了后續(xù)與環(huán)狀RNA信息進(jìn)行聯(lián)合分析。
下一步需要去除核糖體rRNA及其他線性RNA。首先采用rRNA清除試劑盒,用單鏈DNA探針ssDNA probe特異性的雜交rRNA,形成DNARNA雙鏈產(chǎn)物,用RNase H對其進(jìn)行降解,之后用DNase I降解探針,再用RNase R進(jìn)一步降解線性RNA,乙醇沉淀得到最終的環(huán)狀RNA。
最后通過片段化、反轉(zhuǎn)錄、尾端修復(fù)、加接頭及PCR擴增等常規(guī)建庫流程得到最終的環(huán)狀RNA文庫,采用PE150測序策略,一般5 G的數(shù)據(jù)量就可以達(dá)到分析要求。
4.2.2 全轉(zhuǎn)錄組建庫 全轉(zhuǎn)錄組包括mRNA、環(huán)狀RNA、lncRNA等RNA的全部信息,其建庫策略為只去除核糖體rRNA,不去除其余的線性RNA,通過構(gòu)建一個全轉(zhuǎn)錄組文庫,結(jié)合不同生物信息學(xué)的分析方法來獲得全部的轉(zhuǎn)錄信息,并最終進(jìn)行聯(lián)合分析。
全轉(zhuǎn)錄組建庫的關(guān)鍵在于去除核糖體rRNA,其大部分環(huán)節(jié)與環(huán)狀RNA單組學(xué)建庫是一致的,都是通過探針雜交并特異性酶解法去除DNA-RNA結(jié)構(gòu)上的rRNA,并進(jìn)行后續(xù)建庫。測序策略仍為PE150,數(shù)據(jù)量要求10 G以上。
在過去的20年里,人們對于環(huán)狀RNA的研究已經(jīng)取得了巨大的進(jìn)步,但是起初對于環(huán)狀RNA的忽視主要源于對其的檢測技術(shù)不完整,并且沒有特異性、有效的環(huán)狀RNA序列信息,因此在檢測技術(shù)不斷發(fā)展的過程中出現(xiàn)了大量不同的檢測算法。
2012年,Salzman等[2]提出了一種依賴于基因注釋的算法,在這種算法中環(huán)狀RNA能在已經(jīng)比對基因組且進(jìn)行外顯子邊界注釋的標(biāo)準(zhǔn)數(shù)據(jù)庫的基礎(chǔ)上被檢測出來,并且通過增加錯誤發(fā)現(xiàn)率(False discovery rate,F(xiàn)DR)的方法篩選出質(zhì)量最優(yōu)的比對片段來提升這種算法的準(zhǔn)確率[20]。然而他們的算法主要依賴于已經(jīng)注釋的基因,對于那些還沒有完全注釋的基因不能精確的檢測;并且這種建立在數(shù)據(jù)基礎(chǔ)上的篩選有可能對那些低覆蓋率的測序區(qū)域或者測序深度不夠的區(qū)域起不到最好的檢測效果。Memczak等[12]提出了利用GT-AG這段真核生物中特有的前體RNA剪切過程中的保守位點為信號來篩選出一些新的環(huán)狀RNA;也有一些相似的算法用于尋找有miRNA海綿體功能的環(huán)狀RNA[42]。但這些算法均采用了兩部分序列比對的方式,這可能導(dǎo)致某些不具有此特征的環(huán)狀RNA未被篩選出來,且這些算法在剔除假陽性方面可能無效。
Jeck等[1]采用了另外一種方式,比較RNase處理過和未處理的序列篩選出環(huán)狀RNA的候選序列,并且剔除假陽性。這種方法對于環(huán)狀RNA的檢測更加敏感,并且能估算環(huán)狀RNA的相對含量;然而這種方法在富集的過程中可能出現(xiàn)偏差,并且富集的過程是必不可少的。相較于環(huán)狀RNA檢測算法,序列比對算法發(fā)展歷史久遠(yuǎn),并且一些是被特定設(shè)計用于局部和分裂位點比對的。BWA-MEM利用空位延伸模型提出了一種可以提供最大準(zhǔn)確率的局部比對位點,更加高效準(zhǔn)確的算法。
Segemehl[43]用一種加強的后綴陣列針對保守位點檢測的算法,且比其競爭對手在檢測剪切位點上有更高的準(zhǔn)確率。此后,Gao又提出了一種用sam格式中的CIGAR值進(jìn)行分析,從sam文件中掃描PCC信號(paired chiastic clipping signals)。對于splicing信號(GT,AG)比較弱的,算法會從文件中抽取外顯子邊界位置,并用已知的邊界來過濾假陽性。因為環(huán)狀RNAs是環(huán)狀拼接模式,在其拼接的過程中會出現(xiàn)不同的比對結(jié)果,這些成熟的比對算法有可能使環(huán)狀RNA的檢測有更高的準(zhǔn)確率和效率,而如果沒有這些算法,則假陽性的出現(xiàn)是不可避免的。
通過上述分子生物學(xué)與生物信息學(xué)以及不同檢測算法的結(jié)合,我們能夠得到準(zhǔn)確率很高的環(huán)狀RNA,這些環(huán)狀RNA可以通過查找環(huán)狀RNA數(shù)據(jù)庫來確定其是否為新的環(huán)狀RNA。例如,環(huán)狀RNABase、deepBase、circBase、Circ2Traits等數(shù)據(jù)庫。這些數(shù)據(jù)庫中包含序列的查找,編號的確定以及引物的設(shè)計多種功能。確定其為新的環(huán)狀RNA之后要對其功能進(jìn)行實際驗證。
圖3 環(huán)狀RNA檢測圖
由于環(huán)狀RNA較多情況下作為miRNA海綿體存在,可以采取AGO2免疫沉淀法分析環(huán)狀RNA結(jié)合的miRNA。環(huán)狀RNA本身結(jié)合著大量的AGO2蛋白,并且可以通過RIP確認(rèn)。將環(huán)狀RNA序列插入到螢火蟲熒光素酶報道基因下游,通過環(huán)狀RNA在結(jié)合miRNA后能夠產(chǎn)生脫腺苷化,從而產(chǎn)生降解活性,抑制LUC酶活。并以此來判斷環(huán)狀RNA與哪些miRNA發(fā)生作用,進(jìn)而對miRNA進(jìn)行富集,通過miRNA靶基因預(yù)測來尋找其下游轉(zhuǎn)錄基因,并進(jìn)行pcr和western blot驗證基因的表達(dá)量以及蛋白的活性的變化,以此來判斷環(huán)狀RNA的功能。
鑒定環(huán)狀結(jié)合的具體的miRNA,可以構(gòu)建螢火蟲熒光素酶的miRNA篩選文庫。每個miRNA都和螢火蟲熒光素酶報道基因一同轉(zhuǎn)染進(jìn)入細(xì)胞中。從而可以確定具體是哪些miRNA發(fā)生作用,并進(jìn)行下一步驗證。
5.2.1 環(huán)狀RNA的Northern blot驗證 Northern blot是一種很傳統(tǒng)的驗證基因的手段,通過瓊脂糖凝膠電泳針對特定的基因設(shè)計它的探針來檢測其存在性,但是環(huán)狀RNA的特殊性決定了其探針的設(shè)計不同于普通線性RNA。對于外顯子環(huán)化環(huán)狀RNA,建議探針盡可能跨backsplice junction位點;對內(nèi)含子環(huán)化環(huán)狀RNA,可圍繞內(nèi)含子區(qū)域設(shè)計探針。
5.2.2 環(huán)狀RNA的過表達(dá)驗證 過表達(dá)驗證在基因功能的驗證是一種很流行的方法,環(huán)狀RNA過表達(dá)思想主要源于環(huán)狀RNA生物形成機制,已有多篇文章報道環(huán)狀RNA成環(huán)機制,目前比較公認(rèn)的成環(huán)機制為環(huán)狀RNA側(cè)翼序列的堿基互補配對,稱之為Alu結(jié)構(gòu)?;诃h(huán)狀RNA側(cè)翼Alu序列特征,PCR擴增含側(cè)翼Alu序列的目標(biāo)DNA序列,隨后依據(jù)對應(yīng)限制性內(nèi)切酶位點進(jìn)行酶切,進(jìn)而連接pEGFP-C1載體。連接載體進(jìn)而轉(zhuǎn)染對應(yīng)細(xì)胞樣本,定量PCR檢測轉(zhuǎn)染效率[44]?;赿ivergent primer驗證環(huán)狀RNA 過表達(dá)倍數(shù)[45]。
過表達(dá)策略:(1)擴增目標(biāo)區(qū)域包含環(huán)狀RNA側(cè)翼Alu序列或內(nèi)部堿基互補序列,側(cè)翼上下游1kb處過表達(dá)效率更佳;(2)目標(biāo)區(qū)域擴增基于基因組DNA為模版。
5.2.3 環(huán)狀RNA的敲除 環(huán)狀RNA敲除思路主要針對環(huán)狀RNA反向剪接接口處序列信息設(shè)計siRNA,對于內(nèi)含子環(huán)化環(huán)狀RNA,也可針對內(nèi)含子區(qū)域設(shè)計相應(yīng)siRNA進(jìn)行干擾。背對背引物驗證環(huán)狀RNA敲除倍數(shù)。
敲除策略:(1)外顯子環(huán)化環(huán)狀RNA,針對反向剪接連接位點前后序列設(shè)計siRNA。(2)內(nèi)含子環(huán)化環(huán)狀RNA,除針對反向剪接連接位點前后序列設(shè)計siRNA序列以外,也可針對內(nèi)含(3)子區(qū)域序列設(shè)計siRNA。每個siRNA設(shè)計對應(yīng)的對照,反向剪接連接位點一端互補配對,另一端錯配。
6.1.1 環(huán)狀RNA與心血管疾病的關(guān)系 缺血性心臟病是發(fā)達(dá)國家致死率和發(fā)病率居高不下的疾病之一。第一個被驗證的環(huán)狀RNA cANRIL,其與單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)關(guān)系密切,有猜測這些改變了cANRIL的剪切拼接過程導(dǎo)致INK4A/ARF位點的表達(dá),從而使動脈粥樣硬化的發(fā)病率增高[5]。同時缺氧也是致使動脈粥樣硬化發(fā)病的關(guān)鍵因素之一,而此因素同樣受到環(huán)狀RNA的調(diào)控[46]。Greene 等[47]也表明環(huán)狀 RNA cZNF292是受到內(nèi)皮細(xì)胞缺氧因素的調(diào)控并控制血管的生成,環(huán)狀RNA在人類心臟組織中高度表達(dá),與關(guān)鍵心臟基因TTN、RYR2、DMD都有聯(lián)系。
6.1.2 環(huán)狀RNA與阿耳滋海默氏病的關(guān)系 最初的研究表明環(huán)狀RNA在腦組織中的表達(dá)量很高[32],并且有可能參與到突觸功能和神經(jīng)可塑性的調(diào)控當(dāng)中[48]。Lukiw等[49]的研究支持了這種說法,他們發(fā)現(xiàn)了老年癡呆癥(AD)患者大腦的海馬區(qū)是錯誤調(diào)控的,患者的海馬區(qū)的miR-7/ciRS-7調(diào)控系統(tǒng)是錯亂的,miR-7的上調(diào)導(dǎo)致了ciRS-7的缺失以及其它一些與此AD疾病相關(guān)的靶基因表達(dá)量的下調(diào),包括泛素接合酶(UBE2A)蛋白。UBE2A是泛素循環(huán)中的一個重要因素,它通過吞噬作用幫助清除淀粉樣肽。它在AD患者大腦中的缺失會導(dǎo)致淀粉狀蛋白的生成,促使阿耳滋海默氏病即老年癡呆癥發(fā)病。
6.1.3 環(huán)狀RNA與糖尿病的關(guān)系 糖尿病是長期不健康的生活狀態(tài)造成的后果,早期檢測和更好的治療方法是必要的。Xu等[50]的研究表示過表達(dá)miR-7基因的轉(zhuǎn)基因小鼠β細(xì)胞導(dǎo)致糖尿病的發(fā)生。同時該研究也表明過表達(dá)ciRS-7會抑制miR-7功能,進(jìn)而改善胰島素分泌。MiR-7的潛在靶基因已通過生物信息學(xué)分析確定,包括Myrip(調(diào)節(jié)胰島素分泌顆?;颍┖蚉ax6(增強胰島素轉(zhuǎn)錄基因)。
6.2.1 環(huán)狀RNA與胃癌的關(guān)系 盡管許多發(fā)達(dá)國家胃癌的發(fā)病率顯著下降,但胃癌仍是世界癌癥中死亡率最高的疾病之一。Li等[51]的研究已經(jīng)確定了環(huán)狀RNA hascirc002059是一種與胃癌有關(guān)的環(huán)狀RNA。其發(fā)現(xiàn)與健康對照組相比,患者的胃組織中此環(huán)狀RNA的表達(dá)量是下調(diào)的。此外,在胃癌患者的血漿樣本中發(fā)現(xiàn)了hsacirc002059,與健康對照組相比,其含量明顯降低。類似地,Chen等[52]的研究已經(jīng)確定了circPVT在胃癌組織中被上調(diào),并通過調(diào)控miR-125家族的成員來促進(jìn)細(xì)胞增殖。
6.2.2 環(huán)狀RNA與膀胱癌的關(guān)系 膀胱癌起源于膀胱的上皮內(nèi)層,是全球排在第9位的最常見的癌癥之一。在膀胱癌中,使用高通量微陣列技術(shù)同樣發(fā)現(xiàn)了環(huán)狀 RNA[53]。通過這種方法,Zhong等[53]的研究發(fā)現(xiàn)與鄰近的非腫瘤組織相比,在膀胱癌發(fā)現(xiàn)2種下調(diào)的環(huán)狀RNA circFAM169A,circTRIM24和4個明顯被上調(diào)的環(huán)狀RNA circTCF25、circZFR、circPTK2和circBC048201。此外,在癌組織中,circTCF25可以通過調(diào)節(jié)miR-103a-3p和miR-107,從而提高CDK6基因的表達(dá)。這與癌癥的發(fā)展密切相關(guān)。
6.2.3 環(huán)狀RNA與肝細(xì)胞癌的相關(guān)性 肝細(xì)胞癌(HCC)是肝臟疾病中的一種主要的惡性腫瘤,有慢性肝病和肝硬化的患者患病率居高。Zheng等[32]的研究表明與正常組織相比,在HCC中發(fā)現(xiàn)的環(huán)狀RNA出現(xiàn)異常表達(dá)的現(xiàn)象。Qin等[54]在HCC中發(fā)現(xiàn)了hsacir0001649,并發(fā)現(xiàn)與相鄰的正常肝組織相比,這一環(huán)狀RNA的表達(dá)明顯下降。與此形成對照的是,Shang等[55]已經(jīng)確定了另一種環(huán)狀RNA hsacir0005075,與正常組織相比在HCC中其表達(dá)量是明顯下調(diào)的。與此類似,Yu等[56]在HCC中檢測了先前發(fā)現(xiàn)的ciRS-7,發(fā)現(xiàn)它的表達(dá)在HCC腫瘤組織中與鄰近的非腫瘤組織相比是顯著下調(diào)的。由于ciRS-7對mir-7有海綿作用,進(jìn)一步的驗證中包括對ciRS-7的敲除和mir-7的過度表達(dá),發(fā)現(xiàn)ciRS-7作為一種致癌基因,一定程度上是通過對miR-7的調(diào)控來影響HCC進(jìn)行的。
迄今為止,我們所知道的環(huán)狀RNA的種類以及功能仍然只占總環(huán)狀RNA的一小部分,還有很多環(huán)狀RNA待人們?nèi)グl(fā)掘,環(huán)狀RNA作為一類有調(diào)節(jié)功能的RNA,其在對人體研究中必然占據(jù)重要位置。高效快捷準(zhǔn)確的檢測及鑒定技術(shù)將成為重點發(fā)展的領(lǐng)域,從RNA序列數(shù)據(jù)庫中對環(huán)狀RNA進(jìn)行預(yù)測及鑒定首先是要了解和抓住環(huán)狀RNA在細(xì)胞中廣泛存在的特點;其次在各種檢測技術(shù)和算法中去除假陽性以及對環(huán)狀RNA的富集是關(guān)鍵。環(huán)狀RNA具有穩(wěn)定的結(jié)構(gòu)和高度的保守性,這些都是其能在不同的生物中發(fā)揮重要作用的依據(jù),而除了miRNA海綿體、調(diào)節(jié)基因表達(dá)以及與RNA蛋白結(jié)合等作用外,其還有一些未證實的作用需要人們繼續(xù)對環(huán)狀RNA的功能進(jìn)行更全面和廣泛的鑒定。也因為環(huán)狀RNA的高度保守性以及穩(wěn)定性使其能夠成為癌癥的典型標(biāo)志物,現(xiàn)階段發(fā)現(xiàn)的環(huán)狀RNA都是可以不依賴蛋白獨立存在的,環(huán)狀結(jié)構(gòu)使其不容易被RNA酶類降解,所以只在某些特定癌癥中存在的環(huán)狀RNA的表達(dá)量變化將直觀體現(xiàn)出一些特定癌癥的變化情況,可以作為癌癥的標(biāo)志物,能夠用于如肝細(xì)胞癌、乳腺癌、胃癌等一些特定癌癥的診斷標(biāo)志物,以及早期預(yù)防和后期治療的有效手段,通過過表達(dá)或者抑制特定環(huán)狀RNA可以達(dá)到抑制癌癥的惡化的目的,而對于環(huán)狀RNA的快速檢測以及特定癌癥環(huán)狀RNA作用的探索將因此成為一個重要的研究方向;隨著單細(xì)胞環(huán)狀RNA測序技術(shù)的逐漸完善,可以從單細(xì)胞層面了解不同細(xì)胞間環(huán)狀RNA的區(qū)別,有些環(huán)狀RNA只在某些特定的細(xì)胞中存在,因此環(huán)狀RNA同樣可以作為標(biāo)志物來區(qū)分同一組織不同區(qū)域的細(xì)胞;同時環(huán)狀RNA無論是作為miRNA海綿體對基因表達(dá)的調(diào)控,還是其反向剪切的方式與正常線性RNA生成的剪切方式存在競爭關(guān)系,其都有調(diào)控生命進(jìn)程的作用,環(huán)狀RNA可以作為調(diào)控細(xì)胞生存狀態(tài)的關(guān)鍵物質(zhì)。因此,對于環(huán)狀RNA自身結(jié)構(gòu)功能性以及其轉(zhuǎn)錄過程中競爭性機制的研究也將成為重要議題。
同時環(huán)狀RNA的研究還存在著很多問題需要解決。環(huán)狀RNA的具體合成機制,其合成過程中涉及到的酶及剪切過程等詳細(xì)環(huán)節(jié)需要研究完善;環(huán)狀RNA參與生長發(fā)育過程中的許多環(huán)節(jié),但是環(huán)狀RNA的移動觸發(fā)信號還不是很清楚;環(huán)狀RNA可以作為miRNA的海綿體,但是其無論與一個miRNA反應(yīng)還是多個miRNA反應(yīng),以及miRNA、環(huán)狀RNA、目的基因之間的具體調(diào)控機制需要進(jìn)一步完善;如何預(yù)測環(huán)狀RNA的三級結(jié)構(gòu)以及它們之間的相互作用需要更系統(tǒng)的探討。這些都預(yù)示著環(huán)狀RNA在將來很長一段時間里都會是研究的重點。