尹明華 張嘉欣 樂蕓 何凡凡 黃添慧 張牧彤
摘要:茶樹大面白(Camellia sinensis cv. ‘Damianbai)在1985年被全國農作物品種審定委員會認定為國家品種,其起源以及與其他茶樹品種之間的進化關系尚不清晰。以茶樹大面白為試驗材料,采用高通量測序技術對茶樹大面白葉綠體全基因組進行測序、組裝、注釋,采用生物信息學軟件對其葉綠體的基因組特征、系統(tǒng)發(fā)育和密碼子偏好性進行分析。結果表明,茶樹大面白葉綠體基因組全長157 129 bp,為典型的四分體結構,包括1個LSC區(qū)(86 687 bp)、1個SSC區(qū)(18 282 bp)和2個IR區(qū)(包括IRa和IRb,均為26 080 bp)。大面白葉綠體基因組共注釋到135個功能基因,包括90個CDS基因;8個rRNA基因和37個tRNA基因。共檢測到52個SSR和50個Longrepeat,SSR只有A/T單核苷酸重復序列,Longrepeat只存在正向重復和回文重復2種類型。茶樹大面白葉綠體基因組密碼子使用偏性主要受自然選擇的影響,受內部突變壓力的影響小。茶樹大面白葉綠體基因有14個最優(yōu)密碼子(AAU、GAU、UGU、AAA、UAA、GCA、GCU、GGU、CCU、GUA、CGU、CUU、AGU、UCU)。茶樹大面白與鳳凰單叢茶白銀(Camellia sinensis isolated Baiyin cultivar Phoenix Dancong Tea,OL690374)親緣關系較近。本研究分析了大面白茶樹葉綠體基因組序列特征及系統(tǒng)發(fā)育進化關系,為加強茶樹大面白種質鑒定及其資源多樣性的開發(fā)利用提供了參考依據。
關鍵詞:茶樹大面白;葉綠體基因組;序列特征;密碼子偏好性;最優(yōu)密碼子;系統(tǒng)發(fā)育分析
中圖分類號:S571.1;S326???????????? 文獻標識碼:A????????????? 文章編號:1000-369X(2024)03-411-20
Genomic Characteristics, Codon Preference, and Phylogenetic Analysis of Chloroplasts of Camellia sinensis cv. ‘Damianbai
YIN Minghua1,2,3,4, ZHANG Jiaxin1, LE Yun1, HE Fanfan1, HUANG Tianhui1, ZHANG Mutong1
1. College of Life Sciences, Shangrao Normal University, Shangrao 334001, China; 2. Shangrao Agricultural Technology Innovation Research Institute, Shangrao 334001, China; 3. Majiayou Industry Research Institute of Shangrao Normal University, Shangrao 334001, China; 4. Key Laboratory of Protection and Utilization of Medicinal and Edible Plant Resources in Shangrao City, Shangrao 334001, China
Abstract: ‘Damianbai was approved as a national tea cultivar by the National Crop Variety Approval Committee in 1985, but its origin and evolutionary relationship with other tea resources are still unclear. Using ‘Damianbai as the experimental material, high-throughput sequencing technology was used to sequence, assemble and annotate the entire chloroplast genome of ‘Damianbai. In order to provide a basis for studying its phylogenetic evolutionary relationship, bioinformatics software was used to analyze the characteristics, phylogeny, and codon preference of its chloroplast genome. The results show that the chloroplast genome of the tea cultivar ‘Damianbai had a total length of 157 129 bp and was a typical tetrad structure, including 1 LSC region (86 687 bp), 1 SSC region (18 282 bp), and 2 IR regions (including IRa and IRb, both of which were 26 080 bp). A total of 135 functional genes were annotated in the chloroplast genome of ‘Damianbai, including 90 CDS genes, 8 rRNA genes, and 37 tRNA genes. A total of 52 SSRs and 50 Longrepeat sequences were detected in the chloroplast genome of ‘Damianbai. The SSRs had only A/T single nucleotide repeat sequences, while Longrepeat sequences had only two types: forward repeat and palindrome repeat. The codon usage bias in the chloroplast genome of tea cultivar ‘Damianbai was mainly influenced by natural selection, and was less affected by internal mutation pressure. The chloroplast gene of tea cultivar ‘Damianbai had 14 optimal codons (AAU, GAU, UGU, AAA, UAA, GCA, GCU, GGU, CCU, GUA, CGU, CUU, AGU, UCU). The Camellia sinensis cv. ‘Damianbai had a close genetic relationship with Camellia sinensis isolate Baiyin cultivar Phoenix Dancong Tea (OL690374). This study analyzed the chloroplast genome sequence characteristics and phylogenetic relationships of ‘Damianbai, which provided a reference basis for strengthening the identification of tea cultivar ‘Damianbai and the development and utilization of its resource diversity.
Keywords: Camellia sinensis cv. ‘Damianbai, chloroplast genome, sequence characteristics, codon usage bias, optimal codons, phylogenetic analysis
茶樹(Camellia sinensis)為山茶科山茶屬多年生、自交不親合、異花授粉、高度遺傳異質性的常綠植物,是古老的非酒精飲料經濟作物[1-2]。我國茶樹種質資源豐富,種間雜交頻繁,核基因組大,重復序列多,基因組雜合度高,常多倍體化,起源、進化和分類復雜,保護、鑒定、開發(fā)和利用難度較大[3-4]。茶樹大面白(C. sinensis cv. ‘Damianbai)是江西省上饒市廣信區(qū)上滬公社紅區(qū)林場于1968—1984年從廣信區(qū)上滬鄉(xiāng)洪水坑群體茶園通過系統(tǒng)選育而成,1985年全國農作物品種審定委員會認定為國家品種(編號:GS13018-1985)[5-7]。大面白茶樹一般發(fā)芽早(3月上旬),開采早(4月上中旬),育芽強,芽肥壯,持嫩性強,夏梢旺盛,新梢輪次多,葉背密生白色茸毛,適合制作綠茶、紅茶和烏龍茶,如上饒白眉和仙臺大白等[8]。大面白扦插繁殖能力較強,河南、湖南、安徽、廣東等省份均有引種[9]。但對于大面白的進化和發(fā)展歷程,以及與其他茶樹品種之間的進化關系尚不清晰。
葉綠體是綠色植物進行代謝活動的活性中心,也是植物進行光合作用和次生代謝物合成的重要場所[10]。植物的綠色組織中一般均具有葉綠體,葉綠體是植物細胞內最重要、最普遍的質體,也是三大遺傳物質載體之一,更是細胞內獨立且具有半自主性的細胞器之一[11]。葉綠體內獨立的遺傳物質——葉綠體基因組,為100~250 kb的雙鏈環(huán)狀DNA,可編碼120~130個基因,結構較為簡單,普遍母系遺傳,與光合作用、轉錄和翻譯等相關,目前引起了學者的廣泛關注[12]。葉綠體基因組一般具有四分體結構,由大單拷貝區(qū)(Large single copy,LSC)、小單拷貝區(qū)(Small single copy,SSC)以及2個反向重復區(qū)(Inverted repeat,IRa和IRb)組成,規(guī)模小,拷貝數多,結構穩(wěn)定,序列高度保守,遺傳重組率低,已被廣泛應用于植物的DNA條形碼開發(fā)、物種鑒定、物種演化和系統(tǒng)發(fā)育等[13]。植物葉綠體基因組進化的一個重要特征是其密碼子的偏好性[14]。葉綠體基因組中編碼同一種氨基酸的不同密碼子視為同義密碼子,植物種類的葉綠體基因組不同,或同一葉綠體基因組的基因不同,同義密碼子的使用頻率存在差異,這種使用同義密碼子不均衡的現(xiàn)象被稱為同義密碼子使用偏好性[15]。研究葉綠體基因組密碼子的偏好性,有助于探究植物分子進化的效率以及外源蛋白質表達的效率[16]。影響葉綠體基因組密碼子偏好性的因素主要有環(huán)境選擇、堿基突變、基因漂變等[17]。葉綠體基因工程已經成為植物基因工程十分重要的研究領域,目前廣泛應用于基因工程、分子標記開發(fā)以及系統(tǒng)發(fā)育分析等方面[18]。
目前,有關茶樹葉綠體基因組結構特征、系統(tǒng)發(fā)育以及密碼子偏好性方面的研究多有報道。趙許朋等[19]研究表明,貴定鳥王茶葉綠體基因組全長157 071 bp,共注釋基因138個,與茶親緣關系較近,其中與信陽10號的親緣關系最近;佟巖等[20]研究表明,大理茶(C. taliensis)葉綠體密碼子偏好性的主要因素是自然選擇,與禿房茶(C. gymnogyna)聚為一支,是栽培茶的近緣種;黎巷汝等[21]研究表明,6個武夷名叢品種的葉綠體基因組的長度為157 024~157 126 bp,6個武夷名叢品種并未聚為一支,其中大紅袍和肉桂與龍井43的分支較近,半天妖與安化茶聚為一支,水金龜與鐵觀音聚為一支,白雞冠和鐵羅漢分別聚成單個分支;劉振等[22]研究表明,三倍體茶樹品種西蓮1號基因組全長為157 038 bp,西蓮1號與其他栽培型茶樹品種(C. sinensis var. sinensis)處于系統(tǒng)發(fā)育樹的末端,屬于進化的茶樹資源類型;閆明慧等[4]研究表明,茶樹信陽10號葉綠體基因組大小為157 041 bp,與福建鐵羅漢關系最近,推測可能來源于相同母本,與韓國茶Chamnok和Sangmok、福建白雞冠、云南德宏茶的親緣關系也較近;葉曉倩等[23]的研究表明,龍井43葉綠體基因組大小為157 085 bp,龍井瓜子、龍井長葉、龍井圓葉和中茶102聚為一支,自展支持率為100%,葉綠體基因片段可有效區(qū)分茶樹品種間的親緣關系;Li等[1]的研究表明,全球易危物種、我國特有野生山茶資源大苞山茶(C. granthamiana)葉綠體總基因組大小為157 001 bp,共鑒定出131個基因,與茶樹(C. sinensis)聚為一支,相似值為100%;Li等[24]的研究表明,大紅袍茶樹葉綠體總基因組大小為157 077 bp,共鑒定出137個基因,與茶樹龍井(C. sinensis cv. ‘Longjing)聚為一支;Peng等[25]對栽培型和野生型茶樹進行了比較和進化分析,發(fā)現(xiàn)栽培型茶樹的葉綠體基因組大小為157 025~157 100 bp,栽培型比野生型茶樹更保守。栽培型茶樹的核苷酸多樣性高于野生型,變化最大的基因為ycf1,ycf1在栽培型茶樹中已經分化。但關于茶樹大面白的葉綠體基因組組裝、注釋、基因組特征、系統(tǒng)發(fā)育以及密碼子偏好性方面的研究尚未見報道。
本研究利用高通量測序技術對大面白茶樹進行葉綠體全基因組測序組裝,對葉綠體基因組圖譜和序列特征進行表征,分析大面白葉綠體基因組密碼子使用的偏好性,探究茶樹大面白與其近緣物種的IR邊界差異,明確其在山茶屬植物系統(tǒng)發(fā)育中的位置。本研究不僅可為大面白茶樹物種鑒定、遺傳多樣性分析以及分子育種等研究提供理論基礎,也可為山茶屬植物的系統(tǒng)發(fā)育研究提供更豐富的葉綠體基因組數據。
1 材料與方法
1.1 材料
大面白茶樹(代號:DMB)地栽苗由江西茗龍實業(yè)集團有限公司提供。
1.2 方法
1.2.1 DNA提取和測序
大面白茶樹葉片的總DNA提取、DNA純度的檢測、DNA文庫的初步定量、DNA文庫插入片段的檢測、DNA文庫有效濃度的準確定量以及DNA文庫的測序分別采用改良的CTAB法[26]、NanoDrop 2000分光光度計(美國,Thermo Scientific公司)法、美國Invitrogen Qubit? 2.0熒光定量儀法、Agilent 2100生物分析儀系統(tǒng)法、實時熒光定量PCR (Real-time quantitative PCR,RT-qPCR)法和DNBSEQ-T7測序儀平臺(華大智造)法(廣州佰數生物科技有限公司,Bio&Data Biotechnologies)。
1.2.2 葉綠體全基因組的組裝與注釋
利用Fastp v.0.20.1軟件將大面白茶樹葉片DNA文庫原始數據進行過濾,去除低質量數據,即可獲得Clean Data。大面白茶樹葉綠體基因組的組裝采用Noveplastys軟件[27],利用GenBank上全部山茶屬的完整葉綠體作為種子序列,過濾掉非葉綠體基因組序列,K-mer設置為49、59和69(類似兩個序列之間的overlap)進行組裝,組裝結果表明序列一致且自動環(huán)化,說明組裝結果沒有受到核基因組污染[28]。茶樹大面白葉綠體基因組圖譜的制作采用GeSeq[29]、tRNAscan-SE[30]和OGDRAW軟件[31]。大面白葉綠體基因組序列提交至NCBI(https://www.ncbi.nlm.nih.gov),登錄號為PP024603。
1.2.3 葉綠體基因組特征分析
大面白葉綠體基因組LSC、SSC、IRa和IRb的GC含量的分析和統(tǒng)計、SSR分析、Longrepeat分析、同義密碼子相對使用度(Relative synonymous codon usage,RSCU)的計算和分析分別采用CGViewServer軟件[32]、MISA(MIcroSAtellite identification tool)軟件[33]、REPuter軟件[34]、CodonW軟件[35]。茶樹大面白及其16個近緣種(表1序號1~17)葉綠體基因組變異圈圖的繪制和序列相似性的計算均采用Gview軟件[36];葉綠體基因組IR結構變異的繪圖以及核苷酸多態(tài)性(Nucleotide polymorphism,Pi)的計算分別采用IRscope軟件[37]和NADnaSP 6.0軟件[38];茶樹大面白及其51個山茶科山茶屬(Camellia)近緣種和山茶科木荷屬(Schima)2個外群種(表1)葉綠體基因組的序列比對和建樹分別采用MAFFT 7.0軟件[39]和FastTree 2.1.10軟件[40]。近緣種選取的原則:進化樹采用從NCBI中能夠獲得的全部山茶屬51個物種葉綠體序列進行分析,其他特征比較則從全部山茶屬51個物種中不同進化樹分支上選擇16個(含大面白共17個)代表序列進行分析。
1.2.4 葉綠體基因組密碼子使用偏好性分析
GC3-GC12(Neutrality-plot)、ENC-plot、PR2-plot和最優(yōu)密碼子參考佟巖等[20]的方法進行分析。
2 結果與分析
2.1 大面白茶樹葉綠體基因組的質控數據
利用Fastp v.0.20.1軟件可將茶樹大面白葉片DNA文庫Raw Data原始數據進行過濾,去除低質量Reads(表2)。由表2可知,經過過濾后,可獲得茶樹大面白葉片DNA文庫高質量Clean Data。
2.2 大面白茶樹葉綠體基因組的基本結構
大面白茶樹葉綠體基因組全長157 129 bp,結構呈現(xiàn)為雙鏈環(huán)狀分子,為典型的四分體結構,包括1個LSC區(qū)(86 687 bp)、1個SSC
區(qū)(18 282 bp)和2個IR區(qū)(包括IRa和IRb,均為26 080 bp)(圖1)。茶樹大面白葉綠體基因組平均GC含量為37.29%,其中IR區(qū)的GC含量(42.96%)最高,其次是LSC區(qū)(35.30%),GC含量最低的是SSC區(qū)(30.53%)。
2.3 茶樹大面白葉綠體基因組的基因組成
茶樹大面白葉綠體基因組共注釋到135個功能基因(表3),包括90個編碼蛋白(Coding sequence,CDS)基因,8個核糖體RNA(rRNA)基因和37個轉運RNA(tRNA)基因。trnK-UUU、trnI-GAU(2個拷貝)、
trnA-UGC(2個拷貝)、trnG-UCC、trnV-UAC、trnL-UAA、rpoC1、ndhB(2個拷貝)、ndhA、rpl2(2個拷貝)、rpl16、petB、atpF、petD、rps16、rps12(2個拷貝)基因具有2個外顯子;rps12(2個拷貝)、clpP1、ycf3(pafI)基因具有3個外顯子;ycf3(pafI)和clpP1基因具有2個內含子;trnK-UUU、ndhA、rpl16、trnI-GAU(2個拷貝)、rps16、trnA-UGC(2個拷貝)、clpP1、petB、rpoC1、petD、atpF、trnG-UCC、ndhB(2個拷貝)、rpl2(2個拷貝)、trnV-UAC、rps12(2個拷貝)、trnL-UAA基因具有1個內含子;trnK-UUU內含子最大(2 488 bp),trnL-UAA內含子最?。?25 bp);有83個基因(23個tRNA基因和60個CDS基因)完全在LSC區(qū);有12個基因(1個tRNA基因和11個CDS基因)完全在SSC區(qū);有18個基因(4個rRNA基因,7個tRNA基因和7個CDS基因)完全在IRB和IRA區(qū),7個CDS基因為ycf2、ndhB、rpl2、rps7、rpl23、ycf15(2個拷貝);有1個CDS基因(ycf1)在SSC-IRB連接處;有1個CDS基因(rps19)在LSC-IRB連接處;有1個CDS基因(ycf1)在SSC-IRA連接處。
2.4 茶樹大面白葉綠體基因組SSR和Longrepeat分析
茶樹大面白葉綠體基因組共檢測到52個SSR(表4),只包括單核苷酸重復序列,其中23個為A重復(44.23%),29個為T重復(55.77%)。
茶樹大面白16個近緣種葉綠體基因組(MN086819、MZ817088、MT773373、MT773375、OL690374、OL690348、OL690347、OL690350、OL690357、OL690369、OL690351、OL690370、OL690366、OL690360、KF562708、OL840043)的SSR數量分別為51、51、53、52、53、54、54、54、54、52、52、52、51、53、56、56,SSR數量平均為53,也以A/T單核苷酸重復序列為主,說明茶樹大面白及其16個近緣種葉綠體基因組SSR偏好A/T單核苷酸重復。茶樹大面白葉綠體基因組共檢測到50個Longrepeat(表5),包括分散重復(Dispersed repeats,D)和回文重復(Palindromic repeats,P),其中分散重復22個(30~82 bp),回文重復28個(30~26 080 bp)。分散重復只包括正向重復(Forward repeats,F(xiàn))、反向重復(Reverse repeats,R)和互補重復(Complement repeats,C)3種類型。茶樹大面白葉綠體基因組分散重復只有正向重復一種類型。
2.5 葉綠體基因組比對分析
茶樹大面白及其16個近緣種葉綠體基因組的變異圈圖(圖2)、mVIST結構變異圖(圖
3)和Pi多樣性指數分析圖(圖4)表明,茶樹大面白及其16個近緣種的葉綠體基因組序列高度保守,但LSC和SSC區(qū)的基因還是存在較大的序列差異。由圖4可知,茶樹大面白葉綠體基因組核苷酸多樣性的變化范圍為0~0.003 06;茶樹大面白葉綠體基因組非編碼區(qū)的變異程度高于基因編碼區(qū),4個區(qū)的變異性從高到低依次為LSC區(qū)>SSC區(qū)>IR區(qū),其中IR區(qū)最為保守;通過Pi(≥0.001 38)篩選出10個高變異區(qū)域,均位于LSC和SSC區(qū),LSC區(qū)有9個高變異區(qū)域:matK、trnK-UUU、matK_rps16、psbZ_trnG-GCC、trnG-GCC、trnG-GCC_trnfM-CAU、trnF-GAA、rbcL_accD、accD;SSC區(qū)有1個高變異區(qū)域:ycf1-2。
2.6 葉綠體基因組的SC/IR邊界分析
茶樹大面白及其16個近緣種葉綠體基因組四分體結構的SC/IR邊界收縮擴張情況(圖5)表明,茶樹大面白及其16個近緣種葉綠體基因組的4個邊界較為保守。LSC/IRb(JLB)邊界均位于rps19基因內,rps19基因在IRb區(qū)內長為46 bp,在LSC區(qū)內長為233 bp;IRb/SSC(JSB)邊界均位于ycf1基因內,ycf1基因在SSC區(qū)內長為2 bp,在IRb區(qū)內長為1 071 bp。SSC/IRa(JSA)邊界均位于ycf1基因內,ycf1基因在SSC區(qū)長為4 545~4 553 bp,ycf1基因在IRa區(qū)長為1 069 bp。IRa/LSC(JLA)邊界均位于IRa區(qū)的rpl2基因和LSC區(qū)的trnH基因之間,trnH基因距離IRb/SSC(JLA)邊界均為1 bp。
2.7 茶樹大面白葉綠體基因組密碼子使用偏性分析
2.7.1 同義密碼子的偏性分析
茶樹大面白及其16個近緣種葉綠體基因組CDS基因密碼子3個位置GC含量的平均值為37.90%,GC1、GC2、GC3的平均值分別為45.84%、39.41%、28.44%,3個位置GC含量的變化趨勢為GC3<GC2<GC1(圖6);茶樹大面白葉綠體基因組90個CDS基因密碼子的ENC值介于24.103~61.000,平均值為46.46,87個基因的ENC值>35,3個基因的ENC值<35,密碼子偏性較弱(圖7);茶樹大面白16個近緣種葉綠體基因組CDS基因密碼子的ENC值也介于24.103~61.000,平均值為46.50,1 392個基因的ENC值>35,48個基因的ENC值<35,密碼子偏性同樣較弱(圖7)。茶樹大面白葉綠體基因組90個CDS基因序列共有31個RSCU>1的密碼子,在這31個密碼子中,除UUG、AUG外,其余都以A、U結尾;茶樹大面白16個近緣種葉綠體基因組CDS基因序列共有496個RSCU>1的密碼子,在這496個密碼子中,除UUG、AUG外,其余也均以A、U結尾,密碼子同樣偏好以A、U結尾。
2.7.2 中性繪圖分析(GC3-GC12分析)
大面白茶樹及其16個近緣種葉綠體基因的GC3含量在17.14%~42.19%,GC12含量在24.70%~62.50%,二者絕大多數沿對角線上方分布(圖8)。兩者的相關系數r=0.020 784 6(R2=0.000 432),說明GC12與GC3顯著相關。回歸系數為0.021,內部突變貢獻率僅2.1%,自然選擇貢獻率為97.9%,表明茶樹大面白及其16個近緣種葉綠體基因組密碼子使用偏性主要受自然選擇的影響,而受內部突變壓力的影響小。
2.7.3 ENC-plot分析
茶樹大面白及其16個近緣種葉綠體基因組大部分基因的有效密碼子數(ENC)大于35,主要集中在40~55,大部分基因位于標準曲線的下方(圖9),表明大部分基因ENC的實際值與預期值存在較大差異,且GC3值分布較為集中,可見自然選擇是影響茶樹大面白葉綠體基因組密碼子使用偏性的重要原因,密碼子使用偏性受突變的影響較小。
2.7.4 PR2-plot分析
從G3/GC3軸看,茶樹大面白及其16個近緣種葉綠體基因組中較多的基因分布于PR2-plot圖的下部分(圖10),說明4種堿基在同義密碼子第3位上存在C>G現(xiàn)象。從A3/AU3軸看,茶樹大面白及其16個近緣種葉綠體基因組中較多的基因分布于PR2-plot圖的左部分(圖10),說明4種堿基在同義密碼子第3位上存在T>A現(xiàn)象。如密碼子使用存在偏性只受內部突變壓力影響時,C和G以及A和T在第3位上的分布應相等,說明茶樹大面白及其16個近緣種葉綠體基因組密碼子使用偏好性同時受突變和自然選擇的影響,且受自然選擇影響更大。
2.7.5 最優(yōu)密碼子確定
茶樹大面白葉綠體基因滿足相對同義密碼子使用度(Relative synonymous codon usage,RSCU)>1(高頻率密碼子)且ΔRSCU(=RSCU高表達-RSCU低表達)≥0.08的最優(yōu)密碼子有AAU、GAU、UGU、AAA、UAA、GCA、GCU、GGU、CCU、GUA、CGU、CUU、AGU、UCU(表6),共14個,均以A、U結尾。說明茶樹大面白葉綠體基因組密碼子偏好性是以A和U結尾。
2.8 系統(tǒng)發(fā)育分析
基于大面白茶樹及其51個山茶科山茶屬(Camellia)近緣種和山茶科木荷屬(Schima)2個外群種葉綠體基因組構建的系統(tǒng)發(fā)育樹(圖11)表明,茶樹大面白[DMB,Camellia sinensis cv. Damianbai]與鳳凰單叢茶白銀C. sinensis isolate Baiyin cultivar Phoenix Dancong Tea(OL690374)、鳳凰單叢茶棕蓑挾C. sinensis isolate Zongsuoxie cultivar Phoenix Dancong Tea(OL690348)、鳳凰單叢茶老仙翁C. sinensis isolate Laoxianweng cultivar Phoenix Dancong Tea(OL690347)、鳳凰單叢茶宋種C. sinensis isolate Songzhong cultivar Phoenix Dancong Tea(OL690350)、鳳凰單叢茶肉桂香C. sinensis isolate Rouguixiang cultivar Phoenix Dancong Tea(OL690357)單獨聚為一分支。在這個分支中,茶樹大面白[DMB,Camellia sinensis cv. Damianbai]又與鳳凰單叢茶白銀C. sinensis isolate Baiyin cultivar Phoenix Dancong Tea(OL690374)單獨成一小分支。說明茶樹大面白[DMB,Camellia sinensis cv. Damianbai]與鳳凰單叢茶白銀C. sinensis isolate Baiyin cultivar Phoenix Dancong Tea(OL690374)親緣關系較近。
3 討論
植物葉綠體基因組一般有4個區(qū),包括LSC、SSC、IRa和IRb,大面白茶樹葉綠體基因組的結構與絕大多數植物葉綠體基因組的結構一樣,呈閉合環(huán)狀雙鏈結構,具有典型的四分體結構[41]。本研究對大面白茶樹及其16個近緣種的葉綠體基因組進行了比較。結果表明,大面白及其16個近緣種之間葉綠體基因組高度相似,基因組長度為156 691~157 100 bp(大面白茶樹茶樹最長,為157 129 bp),總GC含量均為37.90%,IR區(qū)的GC含量高于LSC區(qū)和SSC區(qū),IR區(qū)具有4個rRNA(rrn16、rrn23、rrn4.5、rrn5)基因,這可能是導致IR區(qū)GC含量較高的原因[42]。研究表明,葉綠體基因組中最保守的區(qū)域是IR區(qū),IR邊界的收縮與擴張決定著植物葉綠體基因組進化過程中的葉綠體基因組長度[43],也可反映物種在進化過程中的關系[44]。本研究對茶樹大面白及其16個近緣種的葉綠體基因組進行了詳細比較,發(fā)現(xiàn)非編碼區(qū)的變異程度高于基因編碼區(qū),4個區(qū)的變異性從高到低依次為LSC區(qū)>SSC區(qū)>IR區(qū),其中IR區(qū)是最為保守的區(qū)域,IR區(qū)的收縮或擴張對基因組長度影響較小。因此,推測茶樹大面白及其16個近緣種葉綠體基因組大小的差異可能是由LSC區(qū)和SSC區(qū)的基因間隔區(qū)的插入或缺失所引起的[45]。
研究表明,茶樹葉綠體基因組一般可編碼97~141個基因,其中有60~100個CDS基因、24~47個tRNA基因和8個rRNA基因。大多CDS基因只含1個內含子,但cloP、clpP和ycf3等基因含2個內含子[46]。本研究表明,茶樹大面白葉綠體基因組的ycf3(pafI)和clpP1基因具有2個內含子,ycf3(pafI)是光系統(tǒng)Ⅰ復合物穩(wěn)定積累所必需的,茶樹大面白的ycf3(pafI)內含子增益可能有助于詮釋光合作用的演化機制[2];茶樹大面白葉綠體基因組的ycf15基因具有4個拷貝,武夷名叢葉綠體基因組的ycf15基因也具有4個拷貝[21],而貴定鳥王茶[19]和三倍體茶樹西蓮1號[22]葉綠體基因組的ycf15基因只有2個拷貝,信陽10號[4]、印度阿薩姆茶和云抗10號[25]葉綠體基因組無ycf15基因。可見,山茶屬植物葉綠體基因ycf15雖有完整的編碼框,但轉錄后無任何功能,推測葉綠體DNA轉錄后加工可能涉及非功能基因的復雜剪接。
植物基因組的重要組成部分是重復序列[19]。葉綠體基因組中的SSR復制率高,遺傳共顯性,多態(tài)性高,母系遺傳,廣泛應用于植物基因表達、遺傳調控、物種鑒定及群體遺傳多態(tài)性等方面[47]。本研究對茶樹大面白及其16個近緣種葉綠體基因組的SSR進行比較分析表明,茶樹大面白及其16個近緣種的SSR類型(主要為A/T)和數目(51~56)基本一致,進一步證明了植物葉綠體基因組一般由短polyA或polyT重復構成SSR位點、且SSR位點很少具有C或G串聯(lián)重復的觀點。葉綠體基因組除了SSR,還有Longrepeat。Huang等[48]發(fā)現(xiàn)山茶屬存在正向重復序列、回文序列及反向重復序列共3種Longrepeat類型,趙許朋等[19]發(fā)現(xiàn)貴定鳥王茶葉綠體基因組Longrepeat只存在正向重復和回文重復2種類型樹。本研究中,茶樹大面白葉綠體基因組共檢測到50個Longrepeat,包括分散重復D(30~82 bp)22個和回文重復P(30~26 080 bp)28個,其中分散重復D只包括正向重復,茶樹大面白葉綠體基因組Longrepeat也只存在正向重復和回文重復2種類型,與貴定鳥王茶的研究結果一致。說明茶樹大面白和貴定鳥王茶的Longrepeat重復類型豐富度略低于其他茶樹品種。Longrepeat重組活性較強,可以介導葉綠體基因組的可逆重組,調節(jié)葉綠體基因組的分子構象,使其結構呈現(xiàn)多樣性,導致高等植物葉綠體基因組不斷擴大和復雜化,從而推動了高等植物的不斷進化[19]。茶樹大面白和貴定鳥王茶由于包含較少數量的長重復序列,其葉綠體基因組更小且不易形成多環(huán)結構,導致其葉綠體基因組在進化過程中的重組頻率較低[48]。因此,與其他茶樹品種相比,茶樹大面白和貴定鳥王茶Longrepeat重復類型豐富度略低,表明茶樹大面白和貴定鳥王茶這2個地方茶樹品種的進化水平較低。
遺傳密碼是識別和傳遞生物體遺傳信息的載體,在生物遺傳和變異中起著重要作用[49]。在進化過程中植物葉綠體基因組密碼子會通過自然選擇、基因突變、蛋白質結構變化等手段產生一定的偏好性,影響密碼子偏好性的因素一般有基因的GC含量、長度、翻譯效率、表達水平及tRNA豐度等[20]。分析植物葉綠體基因組密碼子的偏好性對于研究葉綠體基因工程、物種間的親緣關系及物種的進化具有十分重要的作用[50]。茶樹大面白中14個最優(yōu)密碼子大部分以A/U結尾,與大理茶(C. taliensis)[20]的研究結果一致。ENC-plot、GC3-GC12和PR2-plot等分析結果表明,茶樹大面白葉綠體基因密碼子偏性主要受自然選擇的影響,受內部堿基突變的影響較少,這也與大理茶(C. taliensis)[20]的研究結果一致。茶樹大面白的野生種、半野生種和栽培種的生長環(huán)境較為穩(wěn)定,上饒廣信區(qū)栽培和管理模式日趨生態(tài)化,茶樹大面白葉綠體基因組的密碼子偏好性受人工選擇、基因突變等影響較小,其葉綠體基因組的密碼子偏性較弱。如長期經過人工栽培馴化,葉綠體基因組的密碼子偏好性可由基因突變和自然選擇共同發(fā)揮作用。
山茶屬植物為異花授粉,種間甚至屬間雜交十分普遍,再加上自然雜交和人工選育,山茶屬植物的種間界限不是很清晰,傳統(tǒng)的形態(tài)解剖學依據很難明確山茶屬植物的分類[20],植物的葉綠體基因組可用于山茶屬植物的系統(tǒng)發(fā)育及其物種鑒定等[51]。本研究結果顯示,山茶屬物種聚為1支,木荷屬2個物種單獨聚為1支,該結果與Rawal等[52]的研究結果一致,表明葉綠體基因組序列能夠作為區(qū)分山茶屬與其他屬親緣關系的分類依據。為了進一步揭示茶樹大面白在山茶屬種間的親緣關系,本研究選取了茶樹大面白及其51個山茶科山茶屬(Camellia)近緣種和山茶科木荷屬(Schima)2個外群種,利用FastTree軟件GTR模型(Generalized time-reversible model)構建ML系統(tǒng)發(fā)育樹。結果表明,茶樹大面白[DMB,Camellia sinensis cv. Damianbai]與鳳凰單叢茶白銀C. sinensis isolate Baiyin cultivar Phoenix Dancong Tea(OL690374)、鳳凰單叢茶棕蓑挾C. sinensis isolate Zongsuoxie cultivar Phoenix Dancong Tea(OL690348)、鳳凰單叢茶老仙翁C. sinensis isolate Laoxianweng cultivar Phoenix Dancong Tea(OL690347)、鳳凰單叢茶宋種C. sinensis isolate Songzhong cultivar Phoenix Dancong Tea(OL690350)、鳳凰單叢茶肉桂香C. sinensis isolate Rouguixiang cultivar Phoenix Dancong Tea(OL690357)單獨聚為一分支。在這個分支中,茶樹大面白[DMB,Camellia sinensis cv. Damianbai]又與鳳凰單叢茶白銀[C. sinensis isolate Baiyin cultivar Phoenix Dancong Tea(OL690374)]單獨成一小分支。說明茶樹大面白[DMB,Camellia sinensis cv. Damianbai]與鳳凰單叢茶白銀[C. sinensis isolated Baiyin cultivar Phoenix Dancong Tea(OL690374)]親緣關系較近。
綜上所述,大面白茶樹葉綠體基因組全長157 129 bp,為典型的四分體結構,包括1個LSC區(qū)(86 687 bp)、1個SSC區(qū)(18 282 bp)和2個IR區(qū)(包括IRa和IRb,均為26 080 bp)。茶樹大面白葉綠體基因組共注釋到135個功能基因,包括90個CDS基因,8個rRNA基因和37個tRNA基因。大面白茶樹葉綠體基因組共檢測到52個SSR和50個Longrepeat,SSR只有A/T單核苷酸重復序列,Longrepeat只存在正向重復和回文重復2種類型。大面白茶樹葉綠體基因組密碼子使用偏性主要受自然選擇的影響,而受內部突變壓力的影響小。大面白茶樹葉綠體基因具有14個最優(yōu)密碼子(AAU、GAU、UGU、AAA、UAA、GCA、GCU、GGU、CCU、GUA、CGU、CUU、AGU、UCU)。茶樹大面白(C. sinensis cv. Damianbai)與鳳凰單叢茶白銀C. sinensis isolate Baiyin cultivar Phoenix Dancong Tea(OL690374)親緣關系較近。本研究結果揭示了大面白茶樹葉綠體基因結構及與其他茶樹進化關系,可為大面白茶樹遺傳多樣性、種群歷史動態(tài)以及其系統(tǒng)發(fā)育與親緣關系研究奠定理論基礎。隨著基因組測序的發(fā)展,結合基因組、細胞器基因組深入研究茶樹大面白密碼子使用規(guī)律,并結合形態(tài)、細胞、化學等研究共同揭示大面白茶樹的起源、進化,以及茶樹大面白如何參與山茶屬種間的起源進化也是后續(xù)研究的重要方向之一。
參考文獻
79Li W X, Shi X G, Guo W X, et al. Characterization of the complete chloroplast genome of Camellia granthamiana (Theaceae), a Vulnerable species endemic to China [J]. Mitochondrial DNA B Resource, 2018, 3(2): 1139-1140.
80楊雨青, 譚娟, 汪芳, 等. 茶樹葉綠體基因組的研究與應用進展[J]. 生物技術通報, 2024, 40(2): 1-11.
Yang Y Q, Tan J, Wang F, et al. Research and application progress in chloroplast genome of tea plant (Camellia sinensis) [J]. Biotechnology Bulletin, 2024, 40(2): 1-11.
81Xia E H, Tong W, Wu Q, et al. Tea plant genomics: achievements, challenges and perspectives [J]. Horticulture Research, 2020, 7(1): 7. doi: 10.1038/s41438-019-0225-4.
82閆明慧, 劉柯, 王滿, 等. 信陽10號葉綠體基因組及其系統(tǒng)進化[J]. 茶葉科學, 2021, 41(6): 777-788.
Yan M H, Liu K, Wang M, et al. Complete chloroplast genome of Camellia sinensis cv. Xinyang 10 and its phylogenetic evolution [J]. Journal of Tea Science, 2021, 41(6): 777-788.
83王士圻. 名茶新魁——上饒白眉[J]. 蠶桑茶葉通訊, 1986(1): 31-32.
Wang S Q. Famous tea new leader: Shangrao white eyebrow [J]. Newsletter of Sericulture and Tea, 1986(1): 31-32.
84王士圻. 上饒“白眉”炒制技術要點[J]. 茶業(yè)通報, 1983(6): 44.
Wang S Q. Key points of frying techniques for Shangrao white eyebrows [J]. Journal of Tea Business, 1983(6): 44.
85黃奮文, 黃積安. 福丁大毫、上饒大面白不同行距種植對茶葉產量的影響[J]. 蠶桑茶葉通訊, 1988(4): 4-7.
Huang F W, Huang J A. The effect of different row spacing planting on tea yield in Fuding Damao and Shangrao Damanbai [J]. Newsletter of Sericulture and Tea, 1988(4): 4-7.
86王士圻. 茶樹良種——大面白的選育及其鑒定報告[J]. 茶業(yè)通報, 1981(5): 40-45.
Wang S Q. Breeding and identification report of a good tea tree variety: Damianbai [J]. Journal of Tea Business, 1981(5): 40-45.
87王士圻.茶樹良種——上饒大面白[J].蠶桑茶葉通訊, 1978(2): 4-5.
Wang S Q. Excellent tea tree variety: Shangrao Damianbai [J]. Newsletter of Sericulture and Tea, 1978(2): 4-5.
88Cao P H, Wang D, Gao S, et al. OsDXR interacts with OsMORF1 to regulate chloroplast development and the RNA editing of chloroplast genes in rice [J]. Journal of Integrative Agriculture, 2023, 22(3): 669-678.
89Zhang G L, Feng C, Kou J, et al. Phylogeny and divergence time estimation of the genus Didymodon (Pottiaceae) based on nuclear and chloroplast markers [J]. Journal of Systematics and Evolution, 2023, 61(1): 115-126.
90Park T. Complete chloroplast genome sequence of Solanum iopetalum, one of the tuber-bearing wild potato relatives [J]. Mitochondrial DNA Part B, 2023, 8: 347-351.
91Li B Z, Li Y, Li Z F, et al. The complete chloroplast genome of Impatiens mengtszeana (Balsaminaceae), an endemic species in China [J]. Mitochondrial DNA Part B, 2022, 7(2): 367-369.
92Bourret J, Borvet? F, Bravo I G. Subfunctionalisation of paralogous genes and evolution of differential codon usage preferences: the showcase of polypyrimidine tract binding proteins [J]. Journal of Evolutionary Biology, 2023, 36(10): 1375-1392.
93Tan F, Banerjee A K, Deng J, et al. Characterization of the complete chloroplast genome of Firmiana hainanensis (Malvaceae), an endemic and vulnerable tree species of China [J]. Mitochondrial DNA Part B, 2023, 8(1): 57-60.
94Singhal S, Kumar U, Alqahtani T, et al. An insight into codon pattern analysis of autophagy genes associated with virus infection [J]. Current Pharmaceutical Design, 2023, 29(14): 1105-1120.
95Chu D, Wei L. Characterizing the heat response of Arabidopsis thaliana from the perspective of codon usage bias and translational regulation [J]. Journal of Plant Physiology, 2019, 240: 153012. doi: 10.1016/j.jplph.2019.
153012.
96Zhu Y A, Wang S, Xie J, et al. The complete chloroplast genome of Rubus ellipticus var. obcordatus, an edible and medicinal dual-purpose plant [J]. Mitochondrial DNA Part B, 2022, 7(2): 406-408.
97趙許朋, 崔奎, 耿苗苗, 等. 貴定鳥王茶的葉綠體基因組特征[J]. 西南農業(yè)學報, 2023, 36(11): 2348-2357.
Zhao X P, Cui K, Geng M M, et al. Chloroplast genome characteristics of Guiding Niaowang tea [J]. Southwest China Journal of Agricultural Sciences, 2023, 36(11): 2348-2357.
98佟巖, 黃薈, 王雨華. 森林茶園古茶樹大理茶葉綠體基因組密碼子偏好性及系統(tǒng)發(fā)育研究[J]. 茶葉科學, 2023, 43(3): 297-309.
Tong Y, Huang H, Wang Y H. Analysis of codon usage bias and phylogenesis in the chloroplast genome of ancient tea tree Camellia taliensis in forest-tea garden [J]. Journal of Tea Science, 2023, 43(3): 297-309.
99黎巷汝, 趙雅琦, 張艷, 等. 武夷名叢葉綠體基因組序列特征及系統(tǒng)發(fā)育分析[J]. 南方農業(yè)學報, 2023, 54(5): 1352-1362.
Li X R, Zhao Y Q, Zhang Y, et al. Chloroplast genome sequence features and phylogenetic analysis of Wuyi Mingcong [J]. Journal of Southern Agriculture, 2023, 54(5): 1352-1362.
100劉振, 趙洋, 楊培迪, 等. 三倍體茶樹‘西蓮1號葉綠體基因組特征及系統(tǒng)發(fā)育分析[J]. 茶葉通訊, 2023, 50(2): 166-175.
Liu Z, Zhao Y, Yang P D, et al. Characterization and phylogenetic analysis of the complete chloroplast genome of triploid tea plant Xilian 1 [J]. Journal of Tea Communicatio, 2023, 50(2): 166-175.
101葉曉倩, 趙忠輝, 朱全武, 等. 茶樹‘龍井43葉綠體基因組測序及其系統(tǒng)進化[J]. 浙江大學學報(農業(yè)與生命科學版), 2014, 40(4): 404-412.
Ye X Q, Zhao Z H, Zhu Q W, et al. Entire chloroplast genome sequence of tea (Camellia sinensis cv.Longjing 43): a molecular phylogenetic analysis [J]. Journal of Zhejiang University (Agriculture & Life Sciences), 2014, 40(4): 404-412.
102Li L, Hu Y F, Wu L , et al. The complete chloroplast genome sequence of Camellia sinensis cv. Dahongpao: a most famous variety of Wuyi tea (Synonym: Thea bohea L.) [J]. Mitochondrial DNA Part B, 2021, 6(1): 3-5.
103Peng J, Zhao Y L, Dong M, et al. Exploring the evolutionary characteristics between cultivated tea and its wild relatives using complete chloroplast genomes [J]. BMC Ecology and Evolution, 2021, 21(1): 71. doi: 10.1186/s12862-021-01800-1.
104Doyle J J. A rapid DNA isolation procedure for small quantities of fresh leaf tissue [J]. Phytochem Bull, 1987, 19(1): 11-15.
105Dierckxsens N, Mardulyn P, Smits G. NOVOPlasty: de novo assembly of organelle genomes from whole genome data [J]. Nucleic Acids Research, 2016, 45(4): e18. doi: 10.1093/nar/gkw955.
106Chen S F, Zhou Y Q, Chen Y R, et al. Fastp: an ultra-fast all-in-one FASTQ preprocessor [J]. Bioinformatics, 2018, 34(17): i884-i890.
107Tillich M, Lehwark P, Pellizzer T, et al. GeSeq: versatile and accurate annotation of organelle genomes [J]. Nucleic Acids Research, 2017, 45(W1): W6-W11.
108Lowe T M, Eddy S R. tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence [J]. Nucleic Acids Research, 1997, 25(5): 955-964.
109Lohse M, Drechsel O, Bock R. OrganellarGenomeDRAW (OGDRAW): a tool for the easy generation of high-quality custom graphical maps of plastid and mitochondrial genomes [J]. Current Genetics, 2007, 52(5/6): 267-274.
110Grant J R, Stothard P. The CGView Server: a comparative genomics tool for circular genomes [J]. Nucleic Acids Research, 2008, 36: 181-184.
111Thiel T, Michalek W, Varshney R, et al. Exploiting EST databases for the development and characterization of gene-derived SSR-markers in barley (Hordeum vulgare L.) [J]. Theoretical & Applied Genetics, 2003, 106(3): 411-422.
112Kurtz S, Choudhuri J V, Ohlebusch E, et al. REPuter: the manifold applications of repeat analysis on a genomic scale [J]. Nucleic Acids Research, 2001, 29(22): 4633-4642.
113Sharp P M, Li W H. Codon usage in regulatory genes in Escherichia coli does not reflect selection for ‘rare codons [J]. Nucleic Acids Research, 1986, 14(19): 7737-7749.
114Domselaar G V. Interactive microbial genome visualization with GView [J]. Bioinformatics, 2010, 26(24): 3125-3126.
115Amiryousefi A, Hyv?nen J, Poczai P. IRscope: an online program to visualize the junction sites of chloroplast genomes [J]. Bioinformatics, 2018, 34(17): 3030-3031.
116Rozas J, Rozas R. DnaSP, DNA sequence polymorphism: an interactive program for estimating population genetics parameters from DNA sequence data [J]. Bioinformatics, 1995, 11(6): 621-625.
117Katoh K, Standley D M. MAFFT multiple sequence alignment software version 7: improvements in performance and usability [J]. Molecular Biology and Evolution. 2013, 30(4): 772-780.
118Price M N, Dehal P S, Arkin A P. FastTree 2-approximately maximum-likelihood trees for large alignments [J]. Plos One, 2010, 5(3): e9490. doi: 10.1371/journal.pone.0009490.
119Zhang C, Li S Q, Xie H H, et al. Comparative plastid genome analyses of Rosa: Insights into the phylogeny and gene divergence [J]. Tree Genetics & Genomes, 2022, 18(3): 20. doi: 10.1007/s11295-022-01549-8.
120縱丹, 黃嘉城, 段曉盟, 等. 無籽刺梨及其近緣種葉綠體基因組序列比較分析[J]. 福建農林大學學報(自然科學版), 2024, 53(1): 39-47.
Zong D, Huang J C, Duan X M, et al. Comparative analyses on chloroplast genome sequence of Rosa sterilis and its related species [J]. Journal of Fujian Agriculture and Forestry University (Natural Science Edition), 2024, 53(1): 39-47.
121Kaila T, Chaduvla P K, Saxena S, et al. Chloroplast genome sequence of pigeonpea (Cajanus cajan (L.) Millspaugh) and Cajanus scarabaeoides (L.) Thouars: genome organization and comparison with other legumes [J]. Frontiers in Plant Science, 2016, 7: 1847. doi: 10.3389/fpls.2016.01847.
122Park I, Yang S, Kim W J, et al. The Complete chloroplast genomes of six Ipomoea species and indel marker development for the discrimination of authentic pharbitidis semen (seeds of I. nil or I. purpurea) [J]. Frontiers in Plant Science, 2018, 9: 965. doi: 10.3389/fpls.2018.00965.
123Yang Y, Dang Y Y, Li Q, et al. Complete chloroplast genome sequence of poisonous and medicinal plant Datura stramonium: organizations and implications for genetic engineering [J]. Plos One, 2014, 9(11): e110656. doi: 10.1371/journal.pone.0110656. eCollection 2014.
124Fan L, Li L, Hu Y F, et al. Complete chloroplast genomes of five classical Wuyi tea varieties (Camellia sinensis, Synonym: Thea bohea L.), the most famous oolong tea in China [J]. Mitochondrial DNA Part B, 2022, 7(4): 655-657.
125Li X W, Gao H H, Wang Y T, et al. Complete chloroplast genome sequence of Magnolia grandiflora and comparative analysis with related species [J]. Science China Life Sciences, 2013, 56(2): 189-198.
126Huang H, Shi C, Liu Y, et al. Thirteen Camellia chloroplast genome sequences determined by high-throughput sequencing: genome structure and phylogenetic relationships [J]. BMC Evolutionary Biology, 2014, 14(1): 151. doi: 10.1186/1471-2148-14-151.
127Geng X S, Huang N, Zhu Y L, et al. Codon usage bias analysis of the chloroplast genome of cassava [J]. South African Journal of Botany, 2022, 151: 970-975.
128Ramesh G A, Mathew D, John K J, et al. Chloroplast gene matK holds the barcodes for identification of Momordica (Cucurbitaceae) species from Indian subcontinent [J]. Horticultural Plant Journal, 2022, 8(1): 89-98.
129Yang C J, Wang K, Zhang H, et al. Analysis of the chloroplast genome and phylogenetic evolution of three species of Syringa [J]. Molecular Biology Reports, 2023, 50(1): 665-677.
130Rawal H C, Kumar P M, Bera B, et al. Decoding and analysis of organelle genomes of Indian tea (Camellia assamica) for phylogenetic confirmation [J]. Genomics, 2020, 112(1): 659-668.