• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      毛竹長末端重復(fù)序列反轉(zhuǎn)錄轉(zhuǎn)座子的全基因組特征及進(jìn)化分析

      2021-07-12 10:39:16陳婭欣周明兵
      關(guān)鍵詞:轉(zhuǎn)座子拷貝數(shù)毛竹

      陳婭欣,周明兵

      (浙江農(nóng)林大學(xué) 省部共建亞熱帶森林培育國家重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 311300)

      轉(zhuǎn)座子(transposable elements, TEs)是一種自私的基因組“寄生蟲”,能夠增加拷貝數(shù)并改變其在宿主基因組中的位置[1]。轉(zhuǎn)座子由于具有突變的可能,會對鄰近基因表達(dá)產(chǎn)生潛在的危害,并導(dǎo)致染色體重排,對基因組的穩(wěn)定性構(gòu)成威脅[2?4]。轉(zhuǎn)座子根據(jù)其轉(zhuǎn)座中間產(chǎn)物被分為2類,其中Ⅰ類轉(zhuǎn)座子包括復(fù)制黏貼式反轉(zhuǎn)錄轉(zhuǎn)座子(retrotransposons, REs)[5],Ⅱ類轉(zhuǎn)座子包括剪切黏貼式轉(zhuǎn)座子[6]。Ⅰ類轉(zhuǎn)座子根據(jù)其內(nèi)部的結(jié)構(gòu)可以分為 LTR類(long terminal repeat retrotransposons)[6]、DIRS類 (dictyostelium intermediate repeat sequence elements)[7]、PLE類 (penelope-like elements)[8]、LINE類 (long interspersed nuclear elements)[9]、SINE類(short interspersed nuclear elements)[10]。其中LTR反轉(zhuǎn)錄轉(zhuǎn)座子是至今為止研究最多的一類[6]。LTR反轉(zhuǎn)錄轉(zhuǎn)座子具有4個(gè)結(jié)構(gòu)特點(diǎn)。第一,在序列兩端有1對靶位點(diǎn)重復(fù)序列(target site repeats,TSD),約4~6 bp[11];第二,5′端和3′端有1對長為幾十到幾千bp不等高度相似的長末端重復(fù)序列[12];第三,LTR主要包括GAG衣殼蛋白編碼區(qū)和POL多蛋白編碼區(qū)(polyprotien),其中POL包括RH核糖核苷酸酶(ribonuclease h,RNaseH)、RT反轉(zhuǎn)錄酶(reverse transcriptase)、INT整合酶(integrase)和AP蛋白酶(aspartic proteinase)。還有一些Retrovirus和ENV超家族(superfamily)的LTR含有ENV序列(envelope protein, EN或ENV)[13];第四,在5′端附近有1個(gè)引物結(jié)合位點(diǎn)(primer binding site,PBS),可調(diào)控其基因組RNA反轉(zhuǎn)錄所必需的tRNA引物,它以染色體外線性DNA(extrachromosomal linear DNA, eclDNA)的形式產(chǎn)生LTR反轉(zhuǎn)錄轉(zhuǎn)座子生命周期中間體。在3′端附近有1個(gè)富嘌呤位點(diǎn)(poly purine trait,PPT)[14],協(xié)助反轉(zhuǎn)錄的完成。根據(jù)LTR反轉(zhuǎn)錄轉(zhuǎn)座子開放閱讀框(open reading frames,ORF)的完整性分為自主LTR反轉(zhuǎn)錄轉(zhuǎn)座子和非自主LTR反轉(zhuǎn)錄轉(zhuǎn)座子[15]。自主LTR反轉(zhuǎn)錄轉(zhuǎn)座子又可以根據(jù)POL中RT、INT和RH編碼序列的排列方式,分為Ty1-copia 超家族(5′-INT-RT-RH-3′)和Ty3-gypsy超家族(5′-RH-RH-INT-3′)[16]。根據(jù)每個(gè)超家族的序列同源性(80-80-80的分類規(guī)則[17])可以分為不同的家族。根據(jù)LTR反轉(zhuǎn)錄轉(zhuǎn)座子的同源性、蛋白結(jié)構(gòu)、進(jìn)化關(guān)系可以劃分為不同的譜系,如梨Pyrus基因組中 被劃分為 Ale、Ivana、Bianca、Angela、Tar、Tat、Athila、Renia、Crm、Galadriel、Tekay等11個(gè)譜系[18]。LTR反轉(zhuǎn)錄轉(zhuǎn)座子的活性包括轉(zhuǎn)錄活性和轉(zhuǎn)座活性。轉(zhuǎn)錄是轉(zhuǎn)座的第1步,許多LTR反轉(zhuǎn)錄轉(zhuǎn)座子在植物雜交、多倍體化或在環(huán)境挑戰(zhàn)下發(fā)生去甲基化,被轉(zhuǎn)錄激活[19]。轉(zhuǎn)座活性不僅包括轉(zhuǎn)錄活性,還受轉(zhuǎn)錄后調(diào)控,如植物基因組為了抑制轉(zhuǎn)座子的活性通過轉(zhuǎn)錄基因沉默(transcriptional gene silencing, TGS)機(jī)制抑制它們的能力[20]。如果TGS得到緩解,則受21~22個(gè)核苷酸作用的轉(zhuǎn)錄后基因沉默機(jī)制(post-transcriptional gene silencing, PTGS)會將靶向轉(zhuǎn)座子轉(zhuǎn)錄物進(jìn)行降解[21],所以在實(shí)驗(yàn)條件下LTR反轉(zhuǎn)錄轉(zhuǎn)座子很難被轉(zhuǎn)座激活。在整個(gè)植物王國中LTR反轉(zhuǎn)錄轉(zhuǎn)座子的進(jìn)化特別成功,不斷復(fù)制轉(zhuǎn)座,導(dǎo)致基因組大小增加,基因組尺寸產(chǎn)生差異。在被子植物基因組之間由于幾個(gè)LTR反轉(zhuǎn)錄轉(zhuǎn)座子家族的擴(kuò)增,產(chǎn)生一些巨大的基因組。例如2 400 Mb玉米Zeamays[22]和400 Mb水稻Oryzasativa[23]的基因組中LTR反轉(zhuǎn)錄轉(zhuǎn)座子家族數(shù)相同,但是玉米基因組中5個(gè)譜系的LTR反轉(zhuǎn)錄轉(zhuǎn)座子拷貝數(shù)較高。即使是親緣關(guān)系很近的品種,LTR反轉(zhuǎn)錄轉(zhuǎn)座子也會促使它們的基因結(jié)構(gòu)產(chǎn)生巨大差異。如玉米與大芻草Zeamexicana是近親,但是大芻草的基因組比玉米大1倍[24]。LTR反轉(zhuǎn)錄轉(zhuǎn)座子在植物基因組中處于動態(tài)變化的過程,不僅會擴(kuò)增,也會丟失,不平衡重組(illegitimate recombi nation)和非法重組(unequal recombination)活動就是丟失的主要原因[25?26]。不平衡重組和非法重組的產(chǎn)物主要包括含有TSD位點(diǎn)的solo LTR,不含TSD位點(diǎn)的Truncated LTR[27]。預(yù)測LTR反轉(zhuǎn)錄轉(zhuǎn)座子可以通過4種方式[28]:比較基因組法(comparative genomic methods)[29]、重復(fù)序列從頭算起法(de novo repeat discovery)[30]、同源比對法 (homology-based methods)[31]、基于結(jié)構(gòu)預(yù)測法 (structure-based methods)。基于結(jié)構(gòu)預(yù)測法是通過LTR反轉(zhuǎn)錄轉(zhuǎn)座子的序列結(jié)構(gòu)和轉(zhuǎn)座機(jī)制分析來捕獲,如LTR_STRUC、LTR_FINDER、LTRharvest、LTR_par、LTR_Rho等[32]。毛竹Phyllostachysedulis具有較高的經(jīng)濟(jì)和生態(tài)價(jià)值,其種植面積在中國的竹子總種植面積(443 萬hm2)中占73.76%[33]。2018年第2版毛竹基因組的公布[34]為深入分析毛竹基因組中LTR反轉(zhuǎn)座子提供了良好的條件。本研究運(yùn)用了LTRharvest的方法[35],對第2版毛竹基因組中的LTR反轉(zhuǎn)錄轉(zhuǎn)座進(jìn)行預(yù)測,并對LTR反轉(zhuǎn)錄轉(zhuǎn)座子的結(jié)構(gòu)、在基因組中的分布特征、插入時(shí)間等進(jìn)行系統(tǒng)分析,以期能了解毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子對基因組的影響。

      1 材料與方法

      1.1 毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的鑒定與分類

      第2版毛竹基因組序列、基因組注釋文件來自毛竹基因組數(shù)據(jù)庫(http://bamboo.bamboogdb.org/#/download)[34]。先利用LTRharvest軟件[35]預(yù)測毛竹基因組LTR反轉(zhuǎn)錄轉(zhuǎn)座子,利用cd-hit根據(jù)80-80-80的分類規(guī)則[17]進(jìn)行序列同源性聚類,然后利用LTRdigestion[36]注釋各個(gè)LTR反轉(zhuǎn)錄轉(zhuǎn)座子結(jié)構(gòu)域。接著根據(jù)LTR反轉(zhuǎn)錄轉(zhuǎn)座子的POL編碼區(qū)RT、INT和RH的順序?qū)⑵浞譃門y1-Copia(INT-RT-RH)和Ty3-Gypsy (RT-RH-INT)2個(gè)超家族[16]。根據(jù)序列中的GAG和POL編碼區(qū)與Gypsy Database 2.0網(wǎng)站中(http://gydb.org/index.php/Phylogeny: POL_LTR_retroelements)植物典型的 Tork、Reftrofit、Sire、Oryco、Del、Reina、Crm、Tat、Galadriel和Athila 譜系對應(yīng)編碼區(qū)的同源性,進(jìn)一步將2個(gè)超家族分為10個(gè)譜系[35]。最后利用RepeatMakser軟件分析LTR反轉(zhuǎn)錄轉(zhuǎn)座子在毛竹基因組中的含量[31]。

      1.2 毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子插入時(shí)間計(jì)算

      使用MA等[37]對每條結(jié)構(gòu)完整的毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間進(jìn)行計(jì)算:①對每條結(jié)構(gòu)完整的LTR反轉(zhuǎn)錄轉(zhuǎn)座子的兩端LTR序列利用MUSCLE軟件[38](使用默認(rèn)參數(shù))進(jìn)行比對;②利用JUCKESCANTOR的方法[39]計(jì)算堿基突變頻率(K);③利用公式T=K/(2r)計(jì)算插入時(shí)間,T表示時(shí)間,r表示生物鐘,r=1.3×10?8bp·a?1[37]。

      2 結(jié)果與分析

      2.1 毛竹中LTR反轉(zhuǎn)錄轉(zhuǎn)座子的鑒定和分類

      由表1所示:得到1 014 565條LTR反轉(zhuǎn)錄轉(zhuǎn)座子,占整個(gè)毛竹基因組的54.97%。毛竹中LTR反轉(zhuǎn)錄轉(zhuǎn)座子比例與其他基因組相比,低于玉米基因組的70.1%[22],相近于高粱Sorghumbicolor基因組的55%[40],遠(yuǎn)高于水稻基因組的26%[23]。其中兩端具有完整LTR序列,編碼結(jié)構(gòu)域完整的LTR反轉(zhuǎn)錄轉(zhuǎn)座子(full-length LTR)有7 731條,兩端具有完整LTR序列,編碼結(jié)構(gòu)域不完整的LTR反轉(zhuǎn)錄轉(zhuǎn)座子(solo LTR)有13 656條(其余不含TSD位點(diǎn)的LTR反轉(zhuǎn)錄轉(zhuǎn)座子忽略不計(jì))。然后按照WICKER等[16]提出的真核生物轉(zhuǎn)座子的分類方法,將blastn(all-vs-all)的方法和80-80-80的規(guī)則相結(jié)合,對7 731條完整的LTR反轉(zhuǎn)錄轉(zhuǎn)座子進(jìn)行分類,共分為1 562個(gè)家族。

      毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子分為Ty1-copia和Typ3-gypsy 2個(gè)超家族,在1 562個(gè)LTR反轉(zhuǎn)錄轉(zhuǎn)座子家族中有819個(gè)家族屬于Ty1-Copia 超家族,共包括433 137條序列,長度為400 788 135 bp,占毛竹基因組的21.01%。743個(gè)家族屬于Ty3-Gypsy超家族,共包括581 429條序列,長度為647 905 081 bp,占毛竹基因組的33.96%(表2)。Ty3-gypsy與Ty1-copia數(shù)量之比為1.3∶1.0,低于大豆Glycinemax(1.4∶1.0)[19]和玉米 (1.6∶1.0)[22],遠(yuǎn)低于水稻 (4.9∶1.0)[41]和高粱 (3.7∶1.0)[40],但遠(yuǎn)高于苜蓿Medicagosativa(0.3∶1.0)[42]。

      根據(jù)LTR反轉(zhuǎn)錄轉(zhuǎn)座子不同家族之間的進(jìn)化關(guān)系和結(jié)構(gòu)特征,Ty1-copia超家族和Ty3-gypsy超家族可以被分為多個(gè)不同的譜系[42?43]。根據(jù)Gypsy Database2.0[37]中植物典型的譜系序列特征,對毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子進(jìn)行分類,將Ty1-copia超家族分為4個(gè)譜系,分別為Tork、Retrofit、Sire、Oryco;Ty3-gypsy超家族分為6個(gè)譜系,分別為Del、Reina、Crm、Tat、Galadriel、Athila。其中Tork包含236個(gè)家族,Reftrofit包含342個(gè)家族,Sire包含136個(gè)家族,Oryco包含105個(gè)家族,Del包含207個(gè)家族,Reina包含249個(gè)家族,Crm包含47個(gè)家族,Tat包含238個(gè)家族,Galadriel包含1個(gè)家族,Athila包含1個(gè)家族。在Ty1-copia超家族的4個(gè)譜系中,Sire的含量最高(達(dá)11.01%),緊隨其后的是Tork(6.51%)。在 Ty3-gypsy超家族的 4個(gè)譜系中,Del的含量最高 (達(dá) 17.51%),緊隨其后的是Tat(12.06%)(表1)。Tat和Del在植物中普遍存在并且是植物所特有的。ENV域在Sire中被識別,CHR域在Del和Reina中被識別(表1~2)。

      表 1 毛竹 LTR 反轉(zhuǎn)錄轉(zhuǎn)座子超家族分類Table 1 Classification of LTR retrotransposons superfamily of moso bamboo genome

      表 2 毛竹 LTR 反轉(zhuǎn)錄轉(zhuǎn)座子譜系特征Table 2 Structure of LTR retrotransposon family of moso bamboo

      2.2 毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的PBS偏好性及LTR序列長度分析

      在轉(zhuǎn)座過程中,PBS是LTR反轉(zhuǎn)錄轉(zhuǎn)座子反轉(zhuǎn)錄開始的重要位點(diǎn),因?yàn)長TR反轉(zhuǎn)錄轉(zhuǎn)座子開始反轉(zhuǎn)錄時(shí)tRNA會結(jié)合到RNA的PBS處,然后通過反轉(zhuǎn)錄酶合成cDNA[45]。不同超家族和譜系的LTR反轉(zhuǎn)錄轉(zhuǎn)座子對PBS具有不同的偏好性。由表3所示:MetCAT24是轉(zhuǎn)座子反轉(zhuǎn)過程中使用頻率最高的PBS位點(diǎn),占4.05%,比其他的位點(diǎn)要高,其次是LysTTT和LysTTT10。表3中Ty1-copia和Ty3-gypsy超家族對PBS位點(diǎn)的偏好性呈相反趨勢,MetCAT24是Ty1-copia超家族中使用最多的PBS位點(diǎn),LysTTT是Ty3-gypsy超家族使用最多的PBS位點(diǎn),但在Ty1-copia超家族中頻率很低,僅有1個(gè)。LTR序列是LTR反轉(zhuǎn)錄轉(zhuǎn)座子中特有的,它們位于LTR反轉(zhuǎn)錄轉(zhuǎn)座子的5′端和3′端,是一對高度相似的序列,通常較長的LTR反轉(zhuǎn)錄轉(zhuǎn)座子具有更長的LTR序列,結(jié)構(gòu)也更加完整。所以把5′端LTR作為參照,對LTR序列長度進(jìn)行統(tǒng)計(jì),結(jié)果如圖1顯示。對LTR反轉(zhuǎn)錄轉(zhuǎn)座子而言,LTR序列長度與其全長序列的長度成正比。

      表 3 LTR 反轉(zhuǎn)錄轉(zhuǎn)座子 PBS 使用統(tǒng)計(jì)Table 3 Usage status of PBS in LTR retrotransposons

      圖 1 LTR反轉(zhuǎn)錄轉(zhuǎn)座子全長與LTR序列長度的相關(guān)性Figure 1 Correlation of length between LTR and LTR retrotransposons

      2.3 毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間分布

      對21 387個(gè)含有TSD位點(diǎn)的毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間進(jìn)行統(tǒng)計(jì),如圖2和圖3所示。毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間集中于0~2.0 Ma,其中插入最旺盛的是在1.0~1.5 Ma,有4 426 個(gè),占21.06%,插入較少的是在3.0 Ma之前,有891個(gè),僅占2.61%,插入時(shí)間為0的有508個(gè)(占1.4%),說明這部分LTR反轉(zhuǎn)錄轉(zhuǎn)座子可能還具有轉(zhuǎn)座潛力。Del轉(zhuǎn)座頻率最高,有4 777個(gè)拷貝,占22.62%,且在0.5~1.5 Ma轉(zhuǎn)座活動最為旺盛,其次為Sire和Tat。而Retrofit、Oryco、Reina、Crm轉(zhuǎn)座頻率都較低,Retrofit最低,僅有1 527個(gè)拷貝,占6.91%。以上數(shù)據(jù)說明毛竹基因組中LTR反轉(zhuǎn)錄轉(zhuǎn)座子在0~2.0 Ma內(nèi)大量復(fù)制增長,且還處于不斷增長的狀態(tài),但增長趨勢在減弱。

      圖 2 毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子各個(gè)譜系的插入時(shí)間Figure 2 Insertion time distribution of different lineages of moso bamboo LTR retrotransposons

      圖 3 毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子超家族的插入時(shí)間Figure 3 Insertion times of superfumily of moso bamboo LTR retrotransposons

      3 討論

      3.1 第2版毛竹基因組的公布提高有助于LTR反轉(zhuǎn)錄轉(zhuǎn)座子準(zhǔn)確鑒定

      HU等[46]利用第1版毛竹基因組數(shù)據(jù)分析了LTR反轉(zhuǎn)錄轉(zhuǎn)座子的分布結(jié)構(gòu)和進(jìn)化模式。但由于第1版毛竹基因組數(shù)據(jù)的碎片化嚴(yán)重,限制了對LTR反轉(zhuǎn)錄轉(zhuǎn)座子的完整預(yù)測。毛竹第2版基因數(shù)據(jù)的覆蓋范圍、精準(zhǔn)度都有所提高,完整性達(dá)95.2%[34],相比玉米(92.2%)[22]要高,與水稻(95.6%)[23]接近,所以本研究的結(jié)果準(zhǔn)確性較高。然而,LTR反轉(zhuǎn)錄轉(zhuǎn)座子是一種重復(fù)序列[47],軟件無法準(zhǔn)確逐條識別,產(chǎn)生假陰性。在不同的基因組中LTR反轉(zhuǎn)錄轉(zhuǎn)座子所占的比例不同,如在酵母基因組中占3%[48],在玉米基因組中占70.1%[22],分布特點(diǎn)也有所差異,且基因組中還存在其他重復(fù)序列,所以也很容易產(chǎn)生假陽性。因此,利用較完整的毛竹第2版基因組,能在一定程度上避免誤差。

      在本研究中,通過對第2版毛竹基因組的注釋共得到1 014 565條LTR反轉(zhuǎn)錄轉(zhuǎn)座子(表1),占基因組的54.7%,較對第1版毛竹基因組注釋的結(jié)果(1 954 616,39.83%,不包括未知LTR)數(shù)量有所下降,比例有所上升。對7 731條結(jié)構(gòu)完整的LTR反轉(zhuǎn)錄轉(zhuǎn)座子進(jìn)行家族分類,共劃分為1 562個(gè)家族,較第1版(959個(gè))也有所上升。通過對LTR反轉(zhuǎn)錄轉(zhuǎn)座子的結(jié)構(gòu)完整性判斷,solo-LTR較完整LTR反轉(zhuǎn)錄轉(zhuǎn)座子比例更高(S/F為1.77),說明可能毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子不平衡重組和非法重組的活動頻率較高,這可能是由于毛竹基因組在不斷進(jìn)化的過程中對轉(zhuǎn)座子產(chǎn)生抑制,碎片化嚴(yán)重。但在第1版毛竹基因組中完整的LTR反轉(zhuǎn)錄轉(zhuǎn)座子的占比更高(S/F為0.28),這是由于第1版基因組不完整所以信息顯示不全面??偟膩碚f,第2版毛竹基因組在轉(zhuǎn)座子的注釋、鑒定、家族和超家族的分類等方面都相比第1版毛竹基因組更加準(zhǔn)確,但是依然存在數(shù)萬條短的組裝碎片,因此本研究對毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的注釋仍是保守值,隨著毛竹基因組的更加完善會有更多的LTR反轉(zhuǎn)錄轉(zhuǎn)座子被發(fā)現(xiàn)。

      3.2 不同譜系的毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子在進(jìn)化過程中具有不同的分化和擴(kuò)增活性

      根據(jù)Gypsy Database 2.0網(wǎng)站中植物典型的譜系序列特征,毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子共分為Sire、Oryco、Retrofit、Tork、Crm、Del、Reina、Tatol、Galadriel、Athila 等 10 個(gè)譜系。其中 Retrofit、Reina和Tat是數(shù)量最多的3個(gè)譜系。Galadriel和Athila在植物界中雖然廣泛存在[15],但在毛竹基因組發(fā)現(xiàn)較少。一方面可能是Athila的大小通常為8.5~12.0 kb,并且具有相對較長的LTR序列(1.5~2.5 kb),很難被LTRhavest程序識別[35];另一方面,毛竹基因組的不完整和碎片化,可能會遺漏Galadriel和Athila。

      將毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的譜系與水稻[47]、擬南芥Arabidopsisthaliana[49]進(jìn)行比較,發(fā)現(xiàn)毛竹的10個(gè)譜系包含了雙子葉植物和單子葉植物共同的進(jìn)化特征,這是它們分裂后分化的結(jié)果[50],其中Tork是例外,它在毛竹、水稻、擬南芥中并無明顯差異,這表明Tork相對其他譜系更加保守。并且毛竹與水稻亞科在LTR反轉(zhuǎn)錄轉(zhuǎn)座子都為多拷貝和多進(jìn)化譜系并存,而擬南芥的譜系數(shù)則相對較少[49],這可能是由于不同進(jìn)化速率導(dǎo)致的結(jié)果。

      在不同譜系之間,LTR反轉(zhuǎn)錄轉(zhuǎn)座子增殖差異較大。在毛竹Ty1-copia超家族中,Retrofit的LTR反轉(zhuǎn)錄轉(zhuǎn)座子家族數(shù)量最多(342個(gè)),但拷貝數(shù)僅占15.78%,相比之下,Sire只有136個(gè)家族,拷貝數(shù)卻達(dá)11.1%,占比最高。這種情況在Ty3-gypsy超家族更為顯著,Reina包含249個(gè)家族,拷貝數(shù)卻僅占2.06%,Crm只有47個(gè)家族,拷貝數(shù)所占比例比Reina還高一些。各譜系中LTR反轉(zhuǎn)錄轉(zhuǎn)座子的數(shù)量反映了它們最近的擴(kuò)增情況,而各譜系中家族的數(shù)量則代表了歷史上不同的分化情況。因此,不同譜系的LTR反轉(zhuǎn)錄轉(zhuǎn)座子在進(jìn)化過程中具有不同的分化和擴(kuò)增活性。

      3.3 毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子插入時(shí)間主要集中在0~2.0 Ma

      LTR反轉(zhuǎn)錄轉(zhuǎn)座子兩端的LTR序列是相同的,但在不斷轉(zhuǎn)座過程中,LTR序列會發(fā)生突變并分化,根據(jù)剪輯替換速率,可以得出LTR反轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間[31]。毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間在0~1.5 Ma呈直線式遞增,但在大于1.5 Ma呈指數(shù)衰減,總體上呈現(xiàn)拋物線形式,與小麥Triticum aestivum[51]、桑樹Morusnotabilis[52]類似,這說明毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子的插入時(shí)間主要集中于0~2.0 Ma,在1.5 Ma處于轉(zhuǎn)座活動爆發(fā)期,但其增長趨勢處于回縮的狀態(tài)。

      毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子在大于5.0 Ma區(qū)域缺失,可能原因:第一,5.0 Ma之前的老LTR反轉(zhuǎn)錄轉(zhuǎn)座子與年輕的LTR反轉(zhuǎn)錄轉(zhuǎn)座子發(fā)生重組,所以無法識別[42];第二,根據(jù)PENG等[33]的研究,在7.0~12.0 Ma中,毛竹基因組發(fā)生了四倍體事件,之后又不斷進(jìn)化為二倍體,在這個(gè)過程中毛竹基因組經(jīng)歷了較大的選擇壓力,所以5.0 Ma之前的毛竹LTR反轉(zhuǎn)錄轉(zhuǎn)座子在基因組中被刪除或嚴(yán)重破壞,無法通過結(jié)構(gòu)預(yù)測和同源性比對來鑒定。

      猜你喜歡
      轉(zhuǎn)座子拷貝數(shù)毛竹
      毛竹Mariner-like element自主轉(zhuǎn)座子的鑒定與生物信息學(xué)分析*
      線粒體DNA拷貝數(shù)變異機(jī)制及疾病預(yù)測價(jià)值分析
      地熊蜂基因組中具有潛在活性的轉(zhuǎn)座子鑒定
      節(jié)骨草和毛竹苗
      胎兒染色體組拷貝數(shù)變異與產(chǎn)前超聲異常的相關(guān)性分析
      花葉矢竹轉(zhuǎn)錄組中的轉(zhuǎn)座子表達(dá)分析
      DNA序列拷貝數(shù)變化決定黃瓜性別
      毛竹護(hù)筍養(yǎng)竹技術(shù)探討
      毛竹幼林四季管理技術(shù)
      線粒體DNA拷貝數(shù)的研究新進(jìn)展
      宁乡县| 根河市| 麻江县| 垣曲县| 连州市| 苗栗市| 石嘴山市| 依安县| 阿拉善左旗| 万山特区| 大港区| 托克托县| 通河县| 汉川市| 德保县| 兴仁县| 噶尔县| 油尖旺区| 海门市| 卢湾区| 永吉县| 岢岚县| 竹北市| 吉木乃县| 玛沁县| 宜宾市| 惠来县| 淮阳县| 固镇县| 清水河县| 德江县| 英山县| 张家港市| 通州市| 宝兴县| 阜南县| 湟源县| 洛阳市| 满城县| 营山县| 徐水县|