虞 杭,張得芳,2,樊光輝,2,王占林,2
(1.青海大學,青海西寧 810016; 2.青海省農林科學院/青海高原林木遺傳育種實驗室,青海西寧 810016)
枸杞(Lyciumbarbarum)屬于茄科(Solanaceae)枸杞屬(LyciumL.)落葉灌木,是重要的藥用資源,其果、葉、根等均能被利用,在中藥配方中有重要地位[1-2]。枸杞的營養(yǎng)含量非常豐富,富含蛋白質、維生素和多種氨基酸,還有類胡蘿卜素以及鈣、鐵、鋅、硒等對人體有益的元素,有很高的藥用價值和保健效果。枸杞不僅有美容養(yǎng)生和抗衰老的功效,還具有抗癌、降血糖、降血脂以及護眼等功能[3-7]。
轉錄組是指某個物種或細胞在某一條件下所有轉錄產物的集合。RNA-Seq技術能夠在單核苷酸水平對特定物種的整體轉錄活動進行檢測,以提供最全面的轉錄組信息[8-12]。同樣,RNA-Seq技術的應用也非常普遍,利用此技術鑒定油菜(BrassicacampestrisL.)葉片干旱脅迫應答相關基因,從轉錄組水平揭示油菜適應干旱脅迫環(huán)境的分子機制[13];在果樹學中通過追蹤柑橘(CitrusreticulataBlanco)、葡萄(VitisviniferaL.)、香蕉(MusananaLour.)等10個常見果樹的RNA-Seq實例,研究具體應用進展[14];在地道藥材形成機制研究以及改善牦牛基因結構信息上也起到了至關重要的作用[15]。
簡單重復序列(simple sequence repeat,簡稱SSR)又稱微衛(wèi)星,是核苷酸串聯(lián)重復單元(1~6個核苷酸),在真核及原核生物基因組中都有分布,SSR標記可分為表達序列標簽SSR(EST-SSR)和基因組SSR[16-22]。此標記技術具有高多態(tài)性、高重復性和較廣的覆蓋面等特點,目前在構建植物的遺傳圖譜、分析遺傳多態(tài)性上有較普遍的應用,對遺傳多樣性評價和種質鑒定也起到了很大的幫助[17,23-25]。EST-SSR是在已有EST序列的基礎上,用電子篩選鑒別SSR,再用PCR檢測,避免了SSR引物開發(fā)過程中的克隆和測序步驟,很好地利用了現(xiàn)有數據,節(jié)約了開發(fā)成本[26]。
本研究對枸杞轉錄組進行測序,通過對不同基因序列長度類型微衛(wèi)星的統(tǒng)計與分析,了解枸杞轉錄組SSR的特征及組成,并將其與基因組SSR進行分析比較,從而進一步了解枸杞基因組SSR和轉錄組SSR在分布特征上的變化規(guī)律。
2015年春天在青海省林業(yè)科學研究所枸杞種質資源圃,采集青杞1號的新梢頂端剛長出的幼葉作為試驗材料,采集葉片后立即放入液氮罐冷凍并帶回實驗室,保存于-80 ℃冰箱中。
采用植物總RNA提取試劑盒(北京天根生化科技有限公司)提取總RNA,按照試劑盒要求進行操作。
用帶有Oligo(dT)的磁珠富集mRNA,然后加入fragmentation buffer將mRNA打斷成短片段,以mRNA為模板,用6堿基隨機引物合成第1鏈cDNA,然后加入緩沖液、dNTPs、DNA polymeraseⅠ、RNase H合成第2鏈cDNA,再用AMPure XP beads純化雙鏈cDNA。將處理后的cDNA先進行末端修復、加A尾并連接測序接頭,再用AMPure XP beads進行選擇。最后進行PCR擴增,并用AMPure XP beads純化產物,得到最終的文庫。把不同文庫按照有效濃度及目標下機數據量的需求pooling后進行Illumina HiSeq測序。
利用Misa軟件對測序結果進行SSR查找,從較短的表達序列標簽中挖掘SSR標記位點,識別SSR的重復單元并找尋其側翼序列,并對數據進行整理分析[27]。其中參數設定為:1~6堿基重復最短的重復數,依次為10、6、5、5、5、5個重復。
在本次測序結果中,對枸杞轉錄組多堿基重復的微衛(wèi)星進行統(tǒng)計。2堿基重復單元和3堿基重復單元的SSR含量最多,分別占SSR統(tǒng)計總數的49.27%、48.22%,之后依次是4堿基重復(2.18%)、5堿基重復(0.18%)、6堿基重復(0.15%)。含有66種不同重復堿基組成的2堿基重復微衛(wèi)星,還有由不同重復堿基組成的3堿基、4堿基、5堿基、6堿基重復微衛(wèi)星,分別有188、59、9、8種。通過對測得的低覆蓋度的枸杞轉錄組的序列進行微衛(wèi)星查找,從總長為75 398 046 bp的 111 921 個重疊中共查找出5 411個SSR;而基因組中SSR含量最多的是3堿基重復單元,約占SSR統(tǒng)計總數的66.51%。對測得基因組的序列進行微衛(wèi)星查找,從總長為 260 163 757 bp 的880 315個重疊中共查找出14 733個SSR[28]。利用微衛(wèi)星密度公式計算得,轉錄組平均每 13 934.2 bp 出現(xiàn)1個SSR,而基因組平均每17 658.6 bp出現(xiàn)1個SSR[28]。
由圖1可知,轉錄組中在66種2堿基重復單元中,AG/CT基序的數量最多,共1 285個,占48.20%,其次是AT/AT共845個,占31.70%;AC/GT共531個,占19.92%;CG/CG共5個,占0.19%。
由圖2可知,在188種3堿基重復單元中,AAC/GTT基序的數量最多,共690個,占26.44%,其次是AAG/CTT,共675個,占25.87%;ATC/ATG共345個,占13.22%;AAT/ATT共340個,占13.03%;ACC/GGT共185個,占7.10%;其余3堿基重復單元數量均較少。
由圖3可知,59種4堿基重復單元中,重復類型數量最大的基序為AAAT/ATTT,共35個,占29.66%,其次主要是AAAG/CTTT共34個,占28.81%;AAAC/GTTT共20個,占16.95%。
由圖4可知,5堿基重復單元中,AAAAG/CTTTT共2個,占20%,其余均為1個,各占10%。
由圖5可知,6堿基重復單元中的基序均為1個,各占12.50%。
綜合分析,轉錄組中2堿基重復數量最多,其次是3堿基重復,其中2堿基重復的優(yōu)勢序列為AG/CT、AT/AT,而6堿基重復豐度最低。
基因組中,在2堿基重復微衛(wèi)星中AT/TA基序重復的數量最多,共1 806個,占44.7%;在61種3堿基重復單元中,GTT/CAA基序的數量最多,共2 744個,占28.0%,其次是ACA共738個,占7.5%;ATC共709個,占7.2%;AAC共483個,占4.9%;ATG共427個,占4.4%;其余3堿基重復單元數量均較少[28]。
綜合分析,基因組中3堿基重復數量最多,2堿基重復數量僅次于3堿基重復,其中3堿基重復的優(yōu)勢序列為GTT/CAA、ACA、ATC;同樣6堿基重復豐度最低。
經計算得,枸杞轉錄組SSR的平均長度為16.19 bp,最長為62 bp,最短為12 bp,其中主要以12~18 bp的微衛(wèi)星為主,占總數的81.76%,長度>18 bp的微衛(wèi)星僅占總數的 18.24%。枸杞基因組SSR的平均長度為13.81 bp,最長為36 bp,最短為12 bp。其中主要以12~14 bp的微衛(wèi)星為主,占總數的64.80%。長度>14 bp的微衛(wèi)星僅占總數的35.20%[28]。
經測序分析,轉錄組中在總長為75 398 046 bp的有效讀長中發(fā)現(xiàn)有5 411個微衛(wèi)星分布,平均每13 934.2 bp出現(xiàn)1個微衛(wèi)星;基因組中在總長為260 163 757 bp的有效讀長中發(fā)現(xiàn)有14 733個微衛(wèi)星分布,平均每17 658.6 bp出現(xiàn)1個微衛(wèi)星[28]。轉錄組SSR和基因組SSR的分布存在明顯差異,轉錄組2堿基重復數量最多,而基因組中則是3堿基最豐富(表1)。并利用SSR密度計算公式D=N/L算出密度。式中:L代表重疊群總長(Mb);N代表各重復微衛(wèi)星數量(個);D代表不同重復微衛(wèi)星密度(個/Mb)。
表1 轉錄組與基因組不同長度重復單元微衛(wèi)星所占比例及分布密度比較
枸杞轉錄組平均每13 934.2 bp出現(xiàn)1個微衛(wèi)星,分布密度為71.6個/Mb。2堿基重復數量最多,占總數的49.3%,其次3堿基重復數量與2堿基相近,占48.2%,其余重復所占比例均較少。2堿基重復單元中,基序數量從多到少分別為AG/CT、AT/AT、AC/GT;3堿基重復單元中分別為AAC/GTT、AAG/CTT、ATC/ATG等。與轉錄組相比,基因組平均 17 658.6 bp 出現(xiàn)1個微衛(wèi)星,分布密度為56.6個/Mb,小于轉錄組分布密度?;蚪M中3堿基重復最為普遍,所占比例較大,為66.5%,其次是2堿基重復,為27.4%,2、3堿基重復數量差距較大,其余重復所占比例均較小。2堿基重復單元中,基序數量較多的分別為AT/TA、GT/TA、AC/CA;3堿基重復單元中分別為GTT/CAA、ACA、ATC等。轉錄組SSR與基因組SSR分布特征差異較大,轉錄組中2堿基重復數量最多,而基因組中則是3堿基重復數量最多,基因組基序數量與種類也與轉錄組存在顯著差異。
同為茄科植物的辣椒(CapsicumannuumL.),從轉錄組SSR上看,不考慮單堿基重復,2、3堿基重復分別占19.16%、23.18%,堿基重復數量相近,其余重復占很小比例。2堿基重復單元中以AG/CT基序數量最多,占58.02%;3堿基重復單元中以AAC/GTT基序數量最多,占27.8%[29]。辣椒基因組SSR基序中2、3堿基重復分別占22.59%、29.01%,AT/AT、AAT/ATT分別是2堿基和3堿基重復單元中數量最多的基序。由此可見辣椒轉錄組SSR與基因組SSR分布特征較為類似,2、3堿基的重復數量都較為接近,且3堿基重復略多于2堿基重復[30]。
茄科的另一物種馬鈴薯(SolanumtuberosumL.)與上述2種植物的SSR分布特征又有不同。馬鈴薯轉錄組SSR,以寧薯4號為例,SSR重復類型從2核苷酸重復到9核苷酸重復均有,其中3堿基重復為主要的重復類型,占58.2%,其次是6堿基重復和2堿基重復,分別占12.8%、10.7%,3堿基重復單元中GAA/TTC基序出現(xiàn)的次數最多,占7%[31]。在基因組SSR中,單堿基重復、2堿基重復、3堿基重復這3種重復類型占總SSR位點的94.16%,而4~6堿基重復占 1.24%[32]。可見馬鈴薯轉錄組SSR與基因組SSR無論是重復的堿基類型還是主要重復類型都存在較大差異。
有研究發(fā)現(xiàn),單堿基重復和2堿基重復類型的SSR大多位于非編碼區(qū),而有部分3堿基重復類型位于編碼區(qū),在試驗中發(fā)現(xiàn),基因組SSR中,3堿基重復類型要明顯多于2堿基重復類型。簡化基因組測序是通過對基因組特定區(qū)域進行測序來反映部分基因組序列結構信息的測序技術,而表達序列標簽(EST)中SSR結構及分布廣,不僅可以存在于內含子,也存在于編碼區(qū)、非編碼區(qū)和調控區(qū),數量龐大的SSR在基因組中分布均勻,可代表整個基因組??梢娫谵D錄組SSR中2、3堿基重復所占比例較大,而且重復數量相近。
根據本次試驗結果分析表明,枸杞轉錄組SSR與基因組SSR分布在主要堿基重復類型上和主要的基序數量上都存在較顯著差異,基因組序列能夠幫助轉錄組注釋數據,而轉錄組數據也可對校正基因組注釋信息和發(fā)現(xiàn)新基因起到幫助,可為研究枸杞性狀及多態(tài)性提供參考依據。