趙儒楠,褚曉潔,劉 維,何倩倩,祝遵凌,3*
(1.南京林業(yè)大學(xué)風(fēng)景園林學(xué)院,南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心,江蘇 南京 210037;2.浙江師范大學(xué)化學(xué)與生命科學(xué)學(xué)院,浙江 金華 321004;3.南京林業(yè)大學(xué)藝術(shù)設(shè)計學(xué)院,江蘇 南京 210037)
葉綠體(chloroplast)是綠色植物進行光合作用的細胞器,具有可自主遺傳的基因組,即葉綠體基因組(chloroplast genome)[1]。絕大多數(shù)植物的葉綠體基因組是1個雙鏈環(huán)狀DNA,具有1個長單拷貝區(qū)(LSC)、1個短單拷貝區(qū)(SSC)以及2個反向重復(fù)區(qū)(IRa和IRb)4個區(qū)域[2]。絕大多數(shù)高等植物葉綠體基因組的結(jié)構(gòu)特征與基因組成相對保守[3-4],但因樹種間的雜交、樹種進化以及基因漸滲等原因?qū)е虏煌瑯浞N的葉綠體基因組結(jié)構(gòu)會發(fā)生不同程度的變異。葉綠體基因組具有單親遺傳的特性,研究表明裸子植物的葉綠體基因組是父系遺傳,而大多數(shù)被子植物葉綠體基因組為母系遺傳,還有一小部分被子植物葉綠體基因組為雙親遺傳或父系遺傳[5-6]。葉綠體基因組包含著大量的DNA信息,其中很多基因是重要的DNA條形碼,因此葉綠體基因被廣泛用于樹種分類、系統(tǒng)發(fā)育、樹種起源以及避難所等研究中。
鵝耳櫪屬(Carpinus)是樺木科(Betulaceae)植物中進化最大的類群之一[7],目前全屬包含約50種,我國約有33種,其中有27種為我國特有種[8-9],這些樹種中還有一些是瀕危的樹種,例如普陀鵝耳櫪(C.putoensis)。目前僅有一小部分鵝耳櫪屬樹種的葉綠體基因組被測序、組裝。如普陀鵝耳櫪[11]、天臺鵝耳櫪(C.tientaiensis)[12]、太魯閣鵝耳櫪(C.hebestroma)[13]、寶華鵝耳櫪(C.oblongifolia)[14]以及疏花鵝耳櫪(C.laxiflora)[15]等少數(shù)幾個樹種,其他鵝耳櫪屬樹種的葉綠體基因組特征以及鵝耳櫪屬樹種葉綠體基因組的種間變異情況,尚缺乏充分研究。由于鵝耳櫪屬樹種間普遍存在雜交、漸滲等現(xiàn)象,所以到目前為止鵝耳櫪屬的進化機制與樹種間的系統(tǒng)發(fā)育關(guān)系尚未得到充分闡明[16-17]。此外,葉綠體基因在植物樹種形成與系統(tǒng)發(fā)育研究中扮演者重要角色,由于大多數(shù)葉綠體基因在不同屬中存在不同程度的變異,因此研究適用于不同屬的樹種界定與系統(tǒng)發(fā)育分析的葉綠體基因是十分必要的[17-18]。對鵝耳櫪屬葉綠體基因組的結(jié)構(gòu)特征及變異情況進行分析對今后鵝耳櫪屬樹種系統(tǒng)發(fā)育及DNA條形碼的選擇具有重要意義。
本研究通過對鵝耳櫪屬16種的葉綠體基因組進行比較分析,以進一步了解鵝耳櫪屬樹種葉綠體基因組成及結(jié)構(gòu)特征,揭示IR區(qū)邊界收縮與擴張,為進一步研究鵝耳櫪屬的系統(tǒng)發(fā)育關(guān)系、樹種鑒定以及基因組進化研究奠定基礎(chǔ),同時為鵝耳櫪屬DNA條形碼的開發(fā)提供參考。
于GenBank數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/genbank)中檢索已發(fā)表葉綠體全基因組序列的鵝耳櫪屬樹種信息,共檢索到16個樹種信息,下載其葉綠體基因組序列。檢索到的16個樹種名稱、基因組登錄號[11-16,18]見表1。
表1 鵝耳櫪屬樹種及其葉綠體基因組GenBank登錄號Table 1 The species of Carpinus and their chloroplast GenBank accession numbers
本研究以天目鐵木(Ostryarehderiana,GenBank登錄號NC_028349.1)的葉綠體基因組作為參考,以在線工具GeSeq(https://chlorobox.mpimp-golm.mpg.de/geseq.html)對16個鵝耳櫪屬樹種的葉綠體基因組進行了基因注釋。隨后利用Geneious 10.2.2軟件(https://www.geneious.com/)統(tǒng)計葉綠體基因組各類型基因數(shù)目、GC含量以及LSC、SSC和2個IR區(qū)長度等信息。
為了直觀展示鵝耳櫪屬葉綠體基因組基本特征,利用在線工具OGDRAW (https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)[19]繪制鵝耳櫪屬葉綠體基因組結(jié)構(gòu)圖譜。在葉綠體基因組4個區(qū)連接位點差異分析中,利用IRscope (https://irscope.shinyapps.io/irapp/)[20]可視化鵝耳櫪屬葉綠體基因組邊界收縮擴張。在鵝耳櫪屬葉綠體基因組序列變異分析中,利用基因組在線分析程序mVISTA (http://genome.lbl.gov/vista/index.shtml)[21],以Shuffle-LANGAN模式進行葉綠體全基因組比較。
以麻櫟(Quercusacutissima,GenBank登錄號NC_039429.1)為外類群,利用BioEdit 7.2.5 (http://www.mbio.ncsu.edu/BioEdit/BioEdit.html)對葉綠體全基因組進行序列比對。將葉綠體基因組序列首尾對齊后,以MEGA 10.1.7(https://www.megasoftware.net/)[22]中的ME法(minimum-evolution method)構(gòu)建系統(tǒng)進化樹,利用Bootstrap method進行重復(fù)檢驗,重復(fù)1 000次。
鵝耳櫪屬16個樹種的葉綠體基因組圖譜見圖1。由圖1可知,鵝耳櫪屬16種植物的葉綠體全基因組均為雙鏈環(huán)形結(jié)構(gòu),均具一個4分體結(jié)構(gòu),包含1個LSC、1個SSC、2個IR區(qū),它們的葉綠體基因組大小為158 681~160 583 bp,其中歐洲鵝耳櫪(C.betulus)最大,雷公鵝耳櫪(C.viminea)最小,兩者相差1 902 bp。LSC區(qū)長度為87 808~89 445 bp,SSC區(qū)長度為17 184~18 872 bp,IR區(qū)長度為26 032~27 568 bp。川黔千金榆(C.fangiana)、千金榆(C.cordata)、紫脈鵝耳櫪(C.purpurinervis)、多脈鵝耳櫪(C.polyneura)、云南鵝耳櫪(C.monbeigiana)以及疏花鵝耳櫪的IRa與IRb長度完全相同,其余鵝耳櫪屬樹種的IRa與IRb區(qū)長度僅相差1~3 bp。各樹種GC含量為36.30%、36.40%或36.50%,差異較小。
圖1 鵝耳櫪屬樹種葉綠體基因組圖譜Fig.1 Gene map of chloroplast of Carpinus species
鵝耳櫪屬16個樹種葉綠體基因組比較結(jié)果見表2。由表2可以發(fā)現(xiàn),鵝耳櫪屬16種的葉綠體基因組各基因數(shù)量相對保守,其中總基因數(shù)為122~126個,普陀鵝耳櫪的總基因數(shù)最少,川黔千金榆的總基因數(shù)最多。核糖體RNA(rRNA)數(shù)量最為保守,所有樹種均為8個。轉(zhuǎn)運RNA(tRNA)數(shù)為29~31個,其中天臺鵝耳櫪、普陀鵝耳櫪、紫脈鵝耳櫪、巖生鵝耳櫪(C.rupestris)、歐洲鵝耳櫪和雷公鵝耳櫪為29個,美洲鵝耳櫪(C.caroliniana)和川黔千金榆的tRNA數(shù)為31個,其余各樹種均為30個。蛋白編碼基因數(shù)為85或86個,其中普陀鵝耳櫪和太魯閣鵝耳櫪的蛋白編碼基因為85個,其余各樹種的蛋白編碼基因均為86個。
表2 鵝耳櫪屬16個樹種葉綠體基因組比較Table 2 Comparison of chloroplast genomes of 16 Carpinus species
由于葉綠體基因組為環(huán)形結(jié)構(gòu),為具有1個LSC、1個SSC和2個IR區(qū)的4分體結(jié)構(gòu),所以葉綠體基因組存在IRb-LSC、IRb-SSC、IRa-SSC以及IRa-LSC這4個邊界。在葉綠體基因組進化過程中,其邊界會發(fā)生擴張或收縮。鵝耳櫪屬葉綠體基因組在序列長度、基因組成以及GC含量等方面相對保守,但4個邊界存在多樣性(圖2)。
鵝耳櫪屬16種的IRb-LSC邊界均位于ribosomalproteinS19(rps19)和rpl2的基因間區(qū)或rps19的編碼區(qū)。其中昌化鵝耳櫪(C.tschonoskii)、川陜鵝耳櫪(C.fargesiana)、美洲鵝耳櫪、太魯閣鵝耳櫪、紫脈鵝耳櫪、疏花鵝耳櫪和寶華鵝耳櫪的IRb-LSC邊界位于rps19的編碼區(qū),而巖生鵝耳櫪、多脈鵝耳櫪、云南鵝耳櫪、雷公鵝耳櫪、歐洲鵝耳櫪、天臺鵝耳櫪、普陀鵝耳櫪、川黔千金榆和千金榆的IRb-LSC邊界位于rps19和rpl2的基因間區(qū)(圖2)。
除美洲鵝耳櫪外,鵝耳櫪屬絕大多數(shù)種的IRb-SSC邊界與NADHdehydrogenasesubunit5(ndhF)基因存在10~156 bp的間隔,且ndhF基因位于SSC區(qū)。美洲鵝耳櫪ndhF基因缺失,其IRb-SSC邊界與mitochondriallyencodedtRNAisoleucine(trnI)基因存在152 bp的間隔。同時川黔千金榆的IRb-SSC邊界位于hypotheticalchloroplastopenreadingframe1(ycf1)假基因上。而天臺鵝耳櫪和千金榆的ycf1假基因完全位于IRb區(qū)內(nèi)(圖2)。
鵝耳櫪屬16種的IRa-SSC邊界均位于ycf1基因內(nèi),ycf1基因在IRa區(qū)中的序列長度為1 163~2 740 bp,其中僅有歐洲鵝耳櫪的ycf1基因在IRa區(qū)中的序列長度為2 740 bp,其余均為1 163~1 192 bp。此外,鵝耳櫪屬16種的IRa-LSC邊界具有較高的保守性,其邊界均位于rpl2及tRNA-His(trnH)基因的基因間區(qū)(圖2)。
圖2 鵝耳櫪屬樹種葉綠體基因組的4部分IR區(qū)邊界比較Fig.2 Comparisons of four parts of IR region boundary of chloroplast genomes in Carpinus
本研究利用mVISTA對鵝耳櫪屬葉綠體基因組序列比較結(jié)果進行可視化(圖3),結(jié)果發(fā)現(xiàn)鵝耳櫪屬葉綠體基因組排列順序基本一致,具有較高的保守性。鵝耳櫪屬葉綠體基因組非基因編碼區(qū)存在較明顯差異,變異程度較高。而基因編碼區(qū)差異較小,具有較高的保守性。在葉綠體4個部分中,LSC區(qū)的變異程度最高,而IRa區(qū)的變異程度最低。
鵝耳櫪屬葉綠體基因組中psbA、rps16、atpA、rps19、ndhF、ndhI以及ycf1等基因的編碼區(qū)存在顯著差異。此外,ycf3-tRNA-Ser(trnS)、trnS-rps4、trnH-psbA、psbZ-tRNA-Met(trnfM)、matK-rps16、rps16-tRNA-Gln(trnQ)、trnQ-psbK、ccsA-ndhD、acetyl-accD-psaI、ndhC-tRNA-trnV、tRNA-trnT-tRNA-trnL、tRNA-trnF-ndhJ、atpB-ribulose-1,5-rbcL、trnT-psbD、tRNA-trnE-trnT、tRNA-trnD-tRNA-trnY、rpl32-trnL等基因間隔區(qū)的非編碼區(qū)差異較大(圖3)。
圖3 鵝耳櫪屬樹種葉綠體基因組比對分析Fig.3 Alignment of chloroplast genome sequences of Carpinus
鵝耳櫪屬16種的葉綠體基因組中內(nèi)含子基因的編碼區(qū)長度和基因全長見表3。由表3可見,鵝耳櫪屬16種的葉綠體基因組中總檢測到11個含內(nèi)含子的蛋白編碼基因,包括rps16、atpF、rpoC1、ycf3、clpP、petB、petD、rpl16、rpl2、ndhB和ndhA。在這11個含內(nèi)含子的蛋白編碼基因中,基因長度變異主要來源于內(nèi)含子長度或編碼區(qū)長度。絕大部分基因的編碼區(qū)長度較為保守,其中petD和ndhB基因的內(nèi)含子長度以及基因長度在16種間無任何變化。clpP基因的編碼區(qū)長度在各樹種間無任何變化,僅有內(nèi)含子長度存在變異,在天臺鵝耳櫪和普陀鵝耳櫪中發(fā)現(xiàn)petB基因缺失或內(nèi)含子丟失。rpl2基因的全長在16種間無任何變化,但內(nèi)含子長度存在改變。其余各基因在內(nèi)含子長度或編碼區(qū)長度均存在少量改變。
表3 鵝耳櫪屬16種的葉綠體基因組中含內(nèi)含子基因的編碼區(qū)長度和基因全長Table 3 Length of the coding region and the intron-containing gene in chloroplast genome of 16 species in Carpinus bp
圖4 基于鵝耳櫪屬葉綠體基因組序列構(gòu)建的系統(tǒng)發(fā)育樹Fig.4 Phylogenetic tree based on chloroplast genome sequence of Carpinus
以麻櫟為外類群,將鵝耳櫪屬16種的葉綠體全基因組序列比對后,進行系統(tǒng)發(fā)育分析(圖4)。系統(tǒng)發(fā)育樹將鵝耳櫪屬劃分為千金榆組與鵝耳櫪組,千金榆組最先從鵝耳櫪屬中分離出來,是鵝耳櫪屬的原始組。鵝耳櫪組中歐洲鵝耳櫪與美洲鵝耳櫪由于地理隔離,與其他鵝耳櫪屬樹種存在較遠的親緣關(guān)系。而其余鵝耳櫪屬樹種可分為2支,雷公鵝耳櫪、巖生鵝耳櫪、天臺鵝耳櫪和普陀鵝耳櫪為1支;多脈鵝耳櫪、川陜鵝耳櫪、昌化鵝耳櫪、云南鵝耳櫪、疏花鵝耳櫪、紫脈鵝耳櫪、太魯閣鵝耳櫪以及寶華鵝耳櫪為另1支。
被子植物的葉綠體基因組大小多為120~160 kb,其結(jié)構(gòu)與序列具有高度保守性[23-24]。鵝耳櫪屬樹種的葉綠體基因組均為雙鏈環(huán)狀結(jié)構(gòu),在結(jié)構(gòu)上為包含1個LSC區(qū)、1個SSC區(qū)以及2個IR區(qū)的4分體結(jié)構(gòu)。鵝耳櫪屬樹種的葉綠體基因組長度均在160 kb左右,不同鵝耳櫪屬樹種葉綠體基因長度最大差異僅為1 902 bp,這也表明鵝耳櫪屬樹種具有較長的葉綠體基因組。一般而言,植物葉綠體基因組LSC區(qū)長為80~90 kb,SSC區(qū)長為16~27 kb,IR區(qū)長為20~28 kb[24]。本研究發(fā)現(xiàn),鵝耳櫪屬樹種LSC區(qū)長度為88~90 kb,SSC區(qū)長度為17~19 kb,IR長度為26~28 kb,可以發(fā)現(xiàn)鵝耳櫪屬樹種具有較大的葉綠體基因組主要是其擁有較大的LSC區(qū)和IR區(qū)。
IR區(qū)在維持葉綠體基因組的穩(wěn)定性中起到重要作用[25-26],長的IR區(qū)可以使葉綠體基因組免受結(jié)構(gòu)重排的影響,而大多數(shù)失去IR區(qū)的葉綠體基因組比沒有失去IR區(qū)的葉綠體基因組經(jīng)歷了更多的結(jié)構(gòu)重排[27]。被子植物葉綠體基因組IR區(qū)為20~30 kb,鵝耳櫪屬樹種IR區(qū)為26~28 kb,因此鵝耳櫪屬樹種葉綠體基因組可以具有較高的保守性。雖然IR區(qū)中基因的突變率明顯低于位于單拷貝區(qū)的基因[28],但絕大多數(shù)被子植物IR區(qū)的擴張與收縮如同基因和內(nèi)含子的缺失一樣具有高突變性[29],因此鵝耳櫪屬IR與SC邊界存在明顯的多樣性。
鵝耳櫪屬自被建立為屬以來,其分類以及系統(tǒng)發(fā)育研究備受關(guān)注。迄今為止,仍有諸多新種被逐漸發(fā)現(xiàn),例如香港鵝耳櫪(C.insularis)[30]、嵐皋鵝耳櫪(C.langaoensis)[31]、西藏鵝耳櫪(C.tibetana)[32]、大苞鵝耳櫪(C.gigabracteatus)[33]等。早在20世紀,Chen等[34]利用ITS序列、rbcL基因以及形態(tài)特征對樺木科進行系統(tǒng)發(fā)育研究,發(fā)現(xiàn)鵝耳櫪屬與鐵木屬是姊妹類群。魯志強[35]利用ITS序列對鵝耳櫪屬30個樹種進行界定,初步將30個鵝耳櫪屬樹種分為9 個種和3個復(fù)合種,但復(fù)合種的界定和分類以及系統(tǒng)發(fā)育關(guān)系仍需進一步深入研究。前人對鵝耳櫪屬樹種的系統(tǒng)發(fā)育研究多集中在屬間系統(tǒng)發(fā)育關(guān)系方面,對于鵝耳櫪屬種間的系統(tǒng)發(fā)育分析仍有待進一步研究。
在植物樹種分類以及系統(tǒng)發(fā)育研究中,葉綠體基因組的某些片段或基因常作為DNA條形碼被廣泛使用,例如matK和rbcL。楊霄月[17]利用樺木科24個樹種的葉綠體基因組及ITS序列對樺木科進行系統(tǒng)發(fā)育分析,發(fā)現(xiàn)鵝耳櫪屬與鐵木屬為姊妹類群,此外matK、rbcL、rpoB以及rpoC1等常用的DNA 條形碼只在少數(shù)類群中具有較多數(shù)量的變異位點。本研究在鵝耳櫪屬葉綠體基因組序列變異分析中發(fā)現(xiàn),psbA、rps16、atpA、rps19、ndhF、ndhI以及ycf1等基因的編碼區(qū)在鵝耳櫪屬樹種間存在明顯差異,這些基因或許可以作為鵝耳櫪屬系統(tǒng)發(fā)育研究的DNA條形碼。葉綠體基因組為系統(tǒng)發(fā)育研究提供了新的證據(jù),但鵝耳櫪屬樹種因存在廣泛的雜交與基因漸滲,導(dǎo)致其分類以及系統(tǒng)發(fā)育研究存在諸多困難,在今后的研究中仍需利用多種方法與數(shù)據(jù)進一步闡明鵝耳櫪屬樹種的系統(tǒng)發(fā)育關(guān)系以及分類關(guān)系。同時,鵝耳櫪屬樹種中僅有少數(shù)樹種的葉綠體基因組完成測序,為了更加全面地揭示鵝耳櫪屬樹種葉綠體基因組特性及其系統(tǒng)發(fā)育關(guān)系,未來也還需要對更多的鵝耳櫪樹種進行葉綠體基因組測序。
本研究利用鵝耳櫪屬16個樹種的葉綠體基因組,對鵝耳櫪屬樹種葉綠體基因組進行比較分析,最終發(fā)現(xiàn)鵝耳櫪屬樹種葉綠體基因組長度差異較小,最大差異僅為1 902 bp,其中歐洲鵝耳櫪葉綠體基因組最長,雷公鵝耳櫪最短。鵝耳櫪屬樹種葉綠體基因組具有較高的保守性,其基因排列順序基本一致,未檢測到大規(guī)模的倒位或基因重排,但其IR與SC邊界存在明顯的多樣性。比較發(fā)現(xiàn),鵝耳櫪屬葉綠體基因組非基因編碼區(qū)存在較明顯差異,而基因編碼區(qū)差異較小,具有較高的保守性。系統(tǒng)發(fā)育分析支持將鵝耳櫪屬樹種劃分為千金榆組與鵝耳櫪組,葉綠體全基因組序列在一定程度上可以說明鵝耳櫪屬樹種的系統(tǒng)發(fā)育關(guān)系,為進一步的系統(tǒng)發(fā)育與進化研究提供依據(jù)。鵝耳櫪屬葉綠體基因組中psbA、rps16、atpA、rps19、ndhF、ndhI以及ycf1等基因的編碼區(qū)存在明顯差異,這些可以為開發(fā)新的DNA條形碼提供參考。