劉盼盼
【摘 要】逆轉(zhuǎn)錄轉(zhuǎn)座子是真核生物基因組中普遍存在的一類可移動(dòng)的遺傳因子,是基因組的重要組成成分。它們以RNA為中間媒介,在基因組中通過(guò)不斷自我復(fù)制增加拷貝數(shù),影響基因的活性以及基因組的結(jié)構(gòu),進(jìn)而導(dǎo)致物種的遺傳多樣性,在生物體的進(jìn)化過(guò)程中發(fā)揮重要作用。DNA測(cè)序技術(shù)的快速發(fā)展使我們獲得了大量的組學(xué)資源,為全基因組水平的逆轉(zhuǎn)錄轉(zhuǎn)座子的系統(tǒng)分析提供了可能。
【關(guān)鍵詞】LTR逆轉(zhuǎn)錄轉(zhuǎn)座子;結(jié)構(gòu)特征;鑒定方法
ClassⅠ又被稱為逆轉(zhuǎn)錄轉(zhuǎn)座子,逆轉(zhuǎn)錄轉(zhuǎn)座子根據(jù)結(jié)構(gòu)的不同又被分為L(zhǎng)TR逆轉(zhuǎn)錄轉(zhuǎn)座子和non-LTR逆轉(zhuǎn)錄轉(zhuǎn)座子,non-LTR逆轉(zhuǎn)錄轉(zhuǎn)座子包括長(zhǎng)散布原件(LINE)和短散布原件(SINE)。non-LTR的長(zhǎng)度從數(shù)千堿基(如典型的LINE)到500bp(多數(shù)的SINE)不等。non-LTR反轉(zhuǎn)錄轉(zhuǎn)座子的不完全逆轉(zhuǎn)錄會(huì)產(chǎn)生很多小片段,例如MITE。這些轉(zhuǎn)座子的長(zhǎng)度也是大小不一的,例如MULE,是在擬南芥中發(fā)現(xiàn)的其長(zhǎng)度是從444bp-19397bp不等。non-LTR反轉(zhuǎn)錄轉(zhuǎn)座子具有與LTR反轉(zhuǎn)錄轉(zhuǎn)座子完全不同的結(jié)構(gòu)和復(fù)制機(jī)制。 non-LTR反轉(zhuǎn)錄轉(zhuǎn)座子,在哺乳動(dòng)物基因組中首次發(fā)現(xiàn),但也在植物,真菌和無(wú)脊椎動(dòng)物中被鑒定出來(lái)。根據(jù)所有已知的LTR的RT序列和所有已知non-LTR反轉(zhuǎn)錄轉(zhuǎn)座子的系統(tǒng)進(jìn)化分析,顯然是同源的,表明這兩個(gè)主要類別來(lái)自共同的祖先。需要強(qiáng)調(diào)的是,在大多數(shù)基因組中,具備完整序列的轉(zhuǎn)座子是很少的。大多數(shù)都是非自主轉(zhuǎn)座的轉(zhuǎn)座子,甚至是一些很小的片段。LTR逆轉(zhuǎn)錄轉(zhuǎn)座子包括五個(gè)不同的亞族,Ty1-copia,BEL,DIRS和Ty-3 Gypsy,ERV(vertebrate retrovirus)它們廣泛分布于動(dòng)物和植物中。BEL逆轉(zhuǎn)錄轉(zhuǎn)座子主要在后生動(dòng)物中發(fā)現(xiàn)較多。所有的LTR逆轉(zhuǎn)錄轉(zhuǎn)座子在結(jié)構(gòu)特征,序列排列特點(diǎn)以及轉(zhuǎn)座機(jī)制上都是非常相似的,通常翻譯gag和pol兩個(gè)基因,包含在一個(gè)開(kāi)放閱讀框或者兩個(gè)開(kāi)放閱讀框里面,LTR逆轉(zhuǎn)錄轉(zhuǎn)座子與逆轉(zhuǎn)錄病毒十分相似,而根據(jù)是否能夠進(jìn)行自主的轉(zhuǎn)座,逆轉(zhuǎn)錄轉(zhuǎn)座子又可以分為兩大類,一類是自主型的逆轉(zhuǎn)錄轉(zhuǎn)座子,本身具備完整的結(jié)構(gòu)可以進(jìn)行自主的轉(zhuǎn)座過(guò)程,另一類為非自主轉(zhuǎn)座子,主要是在植物中發(fā)現(xiàn)的如LARDS和TRIM,非自主型的轉(zhuǎn)座子,必須在自主轉(zhuǎn)座子的存在下才可以進(jìn)行轉(zhuǎn)座。非自主轉(zhuǎn)座子的長(zhǎng)度根據(jù)研究也在500-5000bp不等。
一般gag基因形成的蛋白主要包括三種都與病毒蛋白外殼類似:MA(matrix)基質(zhì)蛋白,CA(capsid)蛋白外殼,,NC(nucleocapsid)核殼體,gag形成的多聚蛋白一般進(jìn)化非??焖院苌儆盟麄儊?lái)做系統(tǒng)進(jìn)化分析,pol基因是聚合酶基因,能夠翻譯成各種與轉(zhuǎn)座有關(guān)的蛋白,主要包括4種蛋白的結(jié)構(gòu)域,有RT,INT,RNaseH,而RT與RNaseH往往是連續(xù)的,又經(jīng)常被稱為RT/RNaseH,通常這段序列比較保守可以用來(lái)對(duì)不同轉(zhuǎn)座子進(jìn)行進(jìn)化分析,RT序列是最為保守的, gag蛋白與逆轉(zhuǎn)錄病毒衣殼蛋白高度相似,某種程度上揭示著逆轉(zhuǎn)錄轉(zhuǎn)座子與逆轉(zhuǎn)錄病毒存在進(jìn)化上的關(guān)系。Pol基因含有編碼多蛋白的長(zhǎng)ORF,該基因編碼的蛋白及其作用:整合酶(INT),逆轉(zhuǎn)錄酶(RT)和RNase H(RH)。RT和RH參與反轉(zhuǎn)錄轉(zhuǎn)座子的復(fù)制和轉(zhuǎn)座,INT幫助逆轉(zhuǎn)錄轉(zhuǎn)座子的DNA形式整合到宿主基因組中。盡管Ty1 / Copia和Ty3 / Gypsy的基本結(jié)構(gòu)相似,但Pol基因中的結(jié)構(gòu)域順序不同,即Ty1 / Copia中的PR-INT-RT-RH和Ty3/Gypsy中的PR-RT-RH-INT。在ORF的末端是長(zhǎng)末端的重復(fù)序列(LTRs),LTRs的長(zhǎng)度在也在幾十個(gè)堿基到幾千個(gè)堿基之間,一般結(jié)構(gòu)為5-TG……CA-3,LTRs不翻譯任何的蛋白,只有與逆轉(zhuǎn)錄活動(dòng)有關(guān)的啟動(dòng)子與終止子,5端緊挨著引物結(jié)合位點(diǎn)(PBS),大約有18bp,能夠與特定的tRNA結(jié)合,是逆轉(zhuǎn)錄起始的第一步;3端緊挨著多嘌呤位點(diǎn)(PPT),可以作為引物,從而促進(jìn)轉(zhuǎn)座過(guò)程中第二條cDNA鏈的合成。 LTR的五個(gè)超家族又具有各自的結(jié)構(gòu)特點(diǎn),所含酶的種類也是有所差異的。
LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的各個(gè)分類具有各個(gè)家族明顯的結(jié)構(gòu)特征,Gypsy, BEL/PAO與Copia之間在結(jié)構(gòu)上有所不同,主要的差異在于整合酶的位置不同,但這個(gè)分布特點(diǎn)并不是絕對(duì)的,也會(huì)有一些例外的情況出現(xiàn),例如Gypsy超家族里面的Gmer1本身整合酶是位于逆轉(zhuǎn)錄酶上游的,而DIRS與Ngaro與其他幾類逆轉(zhuǎn)錄轉(zhuǎn)座子的則區(qū)別比較大,這兩類逆轉(zhuǎn)錄轉(zhuǎn)座子屬于YR(酪氨酸重組酶)逆轉(zhuǎn)錄轉(zhuǎn)座子,酪氨酸重組酶(YR)逆轉(zhuǎn)錄轉(zhuǎn)座子在植物,原生生物,真菌以及各種動(dòng)物中包括脊椎動(dòng)物,棘皮動(dòng)物和線蟲(chóng)中都有發(fā)現(xiàn),YR逆轉(zhuǎn)錄轉(zhuǎn)座子的“gag-RT-RNaseH”結(jié)構(gòu)域排列,類似于 LTR逆轉(zhuǎn)錄轉(zhuǎn)座子,但YR逆轉(zhuǎn)錄轉(zhuǎn)座子缺少Pro,典型結(jié)構(gòu)包含反向末端重復(fù)序列(ITR),內(nèi)部ORF和由側(cè)翼ITR序列的重復(fù)衍生的內(nèi)部互補(bǔ)區(qū)(ICR)構(gòu)成。YR它不編碼天冬氨酸蛋白酶(pep)或DDE型整合酶,YR通常負(fù)責(zé)位點(diǎn)相似或相同DNA序列之間的特異性重組。 YR逆轉(zhuǎn)錄轉(zhuǎn)座子又可以分為DIRS,Ngaro和VIPER三個(gè)家族。 DIRS逆轉(zhuǎn)錄轉(zhuǎn)座子與其他兩個(gè)YR逆轉(zhuǎn)錄轉(zhuǎn)座子家族的不同之處在于存在保守的甲基轉(zhuǎn)移酶(MT)結(jié)構(gòu)域,類似于各種噬菌體編碼的MT,Ngaro逆轉(zhuǎn)錄轉(zhuǎn)座子與DIRS逆轉(zhuǎn)錄轉(zhuǎn)座子有相似的ORF,但側(cè)翼重復(fù)的方向不同。DIRS逆轉(zhuǎn)錄轉(zhuǎn)座子由反向重復(fù)分隔,但Ngaro逆轉(zhuǎn)錄轉(zhuǎn)座子的兩側(cè)是直接重復(fù)(稱為A1,A2,B1和B2)。最早被鑒定出來(lái)的DIRS逆轉(zhuǎn)錄轉(zhuǎn)座子主要來(lái)自粘菌Dictyostelium discoideum, DIRS逆轉(zhuǎn)錄轉(zhuǎn)座子在植物,真菌,原生生物和動(dòng)物的廣泛分布表明該類型的轉(zhuǎn)座子在真核生物進(jìn)化的早期出現(xiàn)。DIRS逆轉(zhuǎn)錄轉(zhuǎn)座子與其他LTR逆轉(zhuǎn)錄轉(zhuǎn)座子轉(zhuǎn)座機(jī)制也有一些不同,其他的LTR逆轉(zhuǎn)錄轉(zhuǎn)座子形成的染色體外的DNA分子是線性的而DIRS逆轉(zhuǎn)錄轉(zhuǎn)座子的復(fù)制最有可能導(dǎo)致圓形染色體外分子。這些可能通過(guò)編碼的酪氨酸重組酶催化的重組反應(yīng)插入宿主基因組中。而ERV1則更為特殊,具有另外的ORF框,稱為env,其編碼具有感染性的蛋白質(zhì),env基因存在于逆轉(zhuǎn)錄病毒中,pol基因內(nèi)的結(jié)構(gòu)域順序也是重新排列。