王玉良, 王 松
(安徽科技學(xué)院 生命與健康科學(xué)學(xué)院院,安徽 鳳陽 233100)
大戟(Euphorbiapekinensis)是大戟屬(Euphorbia)大戟科(Euphorbiaceae)的一種多年生草本植物。大戟屬植物遍布全球,數(shù)量超過2 000種,是世界性被子植物大屬之一,以通體具白色乳汁和獨(dú)有的杯狀聚傘花序?yàn)橹饕R(shí)別特征。主要分布于非洲和中、南美洲;約有80種大戟屬植物分布于我國(guó)的西南和西北[1]。大戟屬的很多植物可以入藥,大戟即其中之一。大戟也稱京大戟、湖北大戟,分布于除新疆、西藏、臺(tái)灣和云南的全國(guó)各地,北方尤為普遍[2]。大戟作為中藥材使用已經(jīng)有2 000余年歷史,根含黃酮、萜類等,具有抗炎、抗白血病等作用[3]。大戟市場(chǎng)流通品種比較混亂,作為正品大戟使用的藥材來源有大戟和茜草科(Rubiaceae)紅大戟(Knoxiavalerianoides),作為非正品使用的有豆科(Leguminosae)的美麗胡枝子(Lespedezaformosa)(草大戟)和瑞香科(Thymelaeaceae)狼毒(Stellerachamaejasme)(綿大戟)[4],各地多以紅大戟作為主流品種使用[5-6]。因?yàn)榇箨獙僦参锷瞽h(huán)境呈現(xiàn)多樣性,因而外形特征差異較大。有人提出大戟屬應(yīng)再行劃分[7];而有的學(xué)者依據(jù)分子資料,認(rèn)為該屬應(yīng)擴(kuò)大[8];基于傳統(tǒng)形態(tài)分類學(xué)性狀,大戟科有狹義的分類系統(tǒng)[9]和廣義的分類系統(tǒng)[10]。目前,無論大戟屬還是大戟科,其范圍的界定仍然難于統(tǒng)一,傳統(tǒng)上,大戟科曾被拆分為十幾個(gè)科[1],而最新資料表明,大戟科可以拆分為4個(gè)科,即葉下珠科(Phyllanthaceae),核果木科(Putranjivaceae),狹義的大戟科(Euphorbiaceae)和蚌殼木科(Peraceae)。因此,對(duì)野生種群的大戟葉綠體基因組的遺傳多樣性進(jìn)行研究,無論對(duì)種質(zhì)資源保護(hù)還是物種鑒定,都顯得很重要。截至目前,關(guān)于大戟葉綠體基因組的研究未見報(bào)道。本研究通過對(duì)大戟葉綠體基因組的結(jié)構(gòu)進(jìn)行解析,為進(jìn)一步研究大戟遺傳背景、種質(zhì)資源保護(hù)與開發(fā)利用、以及在植物系統(tǒng)發(fā)育進(jìn)化等方面奠定基礎(chǔ)。
野生大戟(EuphorbiapekinensisRupr.)幼嫩新鮮葉片采自鳳陽縣(117°33′35.4″E,32°52′53.6″N),自封袋密封帶回實(shí)驗(yàn)室,無菌水沖洗若干次,自然晾干后-80 ℃下存放。憑證標(biāo)本存放于安徽科技學(xué)院標(biāo)本室(AHSTU003289)。
1.2.1 DNA的提取、純化和測(cè)序 采用CTAB法提取葉片基因組總DNA[10]。DNA質(zhì)量和完整性采用瓊脂糖凝膠電泳檢測(cè),濃度和含量利用NanoDrop2000(Thermo Scientific,美國(guó))檢測(cè),樣品達(dá)到測(cè)序要求后,送南京集思慧遠(yuǎn)生物公司(www.jcdetect.cn)構(gòu)建DNA基因組文庫,利用Illumina HiSeq 4000(Illumina, San Diego, CA USA)、采用雙端(PE)策略進(jìn)行高通量測(cè)序,讀長(zhǎng)PE150,共獲得原始數(shù)據(jù)2.28 G。利用NGS QC Toolkit進(jìn)行質(zhì)量控制,運(yùn)行perl程序去除接頭和低質(zhì)量序列,參數(shù)默認(rèn)。
1.2.2 葉綠體基因組的組裝與注釋 篩選出的clean reads 在GetOrganelle中組裝[11],最大組裝延伸輪數(shù)設(shè)置為15,K-mer值和參考數(shù)據(jù)庫默認(rèn),組裝在Linux系統(tǒng)下運(yùn)行,挑選最優(yōu)K-mer值下的結(jié)果,用于后續(xù)的注釋。葉綠體基因組的注釋用在線軟件GeSeq(Https://chlorobox.mpimp-golm.mpg.de/geseq.html)完成[12],選中tRNAscan-SE和ARAGORN預(yù)測(cè)tRNA。然后用Geneious R11軟件進(jìn)行手動(dòng)校正[13]。將注釋好的.GB格式文件,使用GB2sequin在線軟件(Https://chlorobox.mpimp-golm.mpg.de/GenBank2Sequin.html),轉(zhuǎn)化成tbl和sqn格式的文件,借助在線系統(tǒng)(Https://www.ncbi.nlm.nih.gov/WebSub/)提交到Genbank[14]。葉綠體基因組圖利用在線工具OGDRAW繪制[15]。
1.2.3 密碼子偏好性分析 相對(duì)同義密碼子(Relative Synonymous Codon Usage,RSCU)使用情況利用Mega X軟件計(jì)算和分析。計(jì)算公式為:
式中,第i個(gè)氨基酸的第j個(gè)密碼子的出現(xiàn)次數(shù)用Xij表示;編碼第i個(gè)氨基酸的同義密碼子的數(shù)量用ni表示。當(dāng)RSCU的值大于1時(shí),表示該密碼子的使用有正偏好性(頻率較高);RSCU=1表示該密碼子的使用無偏好;在RSCU的值小于1的時(shí)候,表示該密碼子的使用有負(fù)偏好性(頻率較低)。
1.2.4 系統(tǒng)進(jìn)化分析 為了確定大戟的系統(tǒng)位置,自NCBI數(shù)據(jù)庫中下載23種大戟科植物、2種黃楊科植物的葉綠體基因組,連同本研究提交的大戟的葉綠體基因組,構(gòu)建系統(tǒng)發(fā)育樹,26種植物的名稱和NCBI登錄號(hào)見圖3。
使用在線程序MAFFT 7(https://mafft.cbrc.jp/alignment/server/),對(duì)26種植物的葉綠體基因組進(jìn)行多重比對(duì)。與大戟科親緣關(guān)系較近的黃楊科植物黃楊木(Buxusmicrophylla)和頂花板凳果(Pachysandraterminalis)設(shè)置為為外類群,比對(duì)結(jié)果導(dǎo)入MEGA X,構(gòu)建最大似然(Maximum Likelihood,ML)系統(tǒng)發(fā)育樹(Bootstrap 重復(fù)1 000 次)。
測(cè)序后共得到25 944 616條長(zhǎng)度約為150 bp 的clean reads,Q20和Q30分別為97.43%和92.64%。利用GetOrganelle進(jìn)行de novo組裝,經(jīng)注釋后得到大戟葉綠體基因組(GenBank登錄號(hào):MZ707776)。大戟葉綠體基因組大小162 002 bp,為呈典型四段式結(jié)構(gòu)的雙鏈環(huán)狀DNA:大單拷貝區(qū)LSC、小單拷貝區(qū)SSC,以及將二者分開的2個(gè)反向重復(fù)區(qū)域(inverted repeat regions,IRa/IRb),3個(gè)區(qū)域的大小分別為90 225 bp、18 067 bp和26 857 bp??傕奏?GC)和總嘌呤(AT)含量分別為35.7%和64.3%,有明顯的AT偏向性(表1)。IR區(qū)有4個(gè)GC含量較高的rRNA基因,因而該區(qū)GC含量最高(56.67%)。這與其他葉綠體基因組的分析結(jié)果是一致的[16]。
表1 大戟葉綠體基因組的堿基組成
大戟葉綠體基因組包括85個(gè)蛋白質(zhì)編碼基因(含9個(gè)重復(fù)基因)、8個(gè)rRNA基因(含4個(gè)重復(fù)基因)和36個(gè)tRNA基因(含16個(gè)重復(fù)基因)??偦驍?shù)量129個(gè),非重復(fù)基因100個(gè)。在反向重復(fù)區(qū)域(Ira和IRb),有rpl2、rps12和rpl23三個(gè)核糖體蛋白大亞基基因、rps7和rps19兩個(gè)核糖體蛋白小亞基基因、1個(gè)NADH脫氫酶基因(ndhB)、ycf1、ycf2和ycf15三個(gè)未知功能的基因,以及6個(gè)tRNA基因(trnI基因有兩個(gè)拷貝)和4個(gè)rRNA基因。ycf1基因分布在SSC和IRb的交界(圖1)。在SSC區(qū),共有10個(gè)CDS和1個(gè)tRNA基因(trnL)。絕大多數(shù)的基因在LSC 區(qū),有57個(gè)CDS和17個(gè)tRNA基因(表2)。
圖1 大戟葉綠體基因組基因分布圖
表2 大戟葉綠體基因組各區(qū)的基因組成
在功能上,把大戟葉綠體的全部基因分為4類(表3):自我復(fù)制基因、光合作用相關(guān)基因、成熟酶基因(matK)、囊膜蛋白(cemA)等其他基因。所有基因中總共有11個(gè)內(nèi)含子,其中6個(gè)在IR區(qū),其他均在LSC區(qū)(trnL外除)。其中atpF、ndhB、rpoC1、rpl2、trnA、trnI、trnK、trnL和trnV基因各有1個(gè)內(nèi)含子,clpP和ycf3有2個(gè)。位于LSC區(qū)的trnK-UUU基因序列最長(zhǎng)(2 589 bp),matK基因位于其中。
有機(jī)體基因選擇簡(jiǎn)并密碼子有一定偏向性。研究發(fā)現(xiàn),大戟葉綠體全基因組共有64種密碼子、編碼全部20種氨基酸。密碼子數(shù)量從230個(gè)到2 575個(gè),相對(duì)密碼子的使用比例從最小的0.43到最大的2.11。Met和Trp只有1個(gè)密碼子,其余的2~6個(gè)密碼子(圖2)。
表3 大戟葉綠體基因組基因的類別
圖2 大戟葉綠體基因組20種氨基酸和終止密碼子相對(duì)同義密碼子使用(RSCU)
利用24個(gè)大戟科植物葉綠體基因組(23種自NCBI下載)作為內(nèi)類群、2個(gè)黃楊科植物葉綠體基因組為外類群,采用最大似然法構(gòu)建系統(tǒng)發(fā)育樹,以確定大戟的系統(tǒng)位置。在ML系統(tǒng)樹中,24種大戟科植物大致呈4個(gè)分支:白飯樹屬(Flueggea)、算盤子屬(Glochidion)和葉下珠屬(Phyllanthus)聚為一個(gè)分支;核果木屬(Drypetes)的6個(gè)種聚為一支;巴豆屬(Croton)、麻風(fēng)樹屬(Jatropha)、野桐屬(Mallotus)和蓖麻屬(Ricinus)聚為一支;木薯屬(Manihot)、橡膠樹屬(Hevea)、油桐屬(Vernicia)和東京桐屬(Deutzianthus)聚為一支;而大戟屬的6個(gè)種聚為一支。分析結(jié)果強(qiáng)烈支持大戟與同屬的E.ebracteolata聚為一支,互為姊妹類群。同時(shí),ML系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu)中,大戟屬的6個(gè)種聚為一大支,支持率為100%,與傳統(tǒng)分類學(xué)的分類結(jié)果完全一致(圖3)。
圖3 24種大戟科植物葉綠體基因組序列及其外類群構(gòu)建的系統(tǒng)進(jìn)化樹
中藥材的研究具有較大的意義[17-18]。為了保護(hù)傳統(tǒng)中藥大戟的野生種質(zhì)資源,已有不少學(xué)者對(duì)大戟進(jìn)行了各個(gè)方面的研究,如生態(tài)適宜性[5]、化學(xué)成分[19]、藥理藥性[20]、生藥鑒定[21-22]、部分基因的克隆與分析[23]等,而大戟葉綠體全基因組的研究鮮有報(bào)道。本文研究結(jié)果表明,大戟葉綠體基因組總體結(jié)構(gòu)與其他高等植物相似,例如,全長(zhǎng)在160 kbp左右,IR區(qū)的嘧啶(GC)含量比LSC區(qū)和SSC區(qū)的要高,基因組中存在著功能未知的基因等。與大多數(shù)被子植物一樣,因?yàn)镮Rb/SSC邊界的擴(kuò)張,導(dǎo)致ycf1基因處于IRb和SSC的邊界。
除了作為外類群的兩種黃楊科植物外,在傳統(tǒng)分類學(xué)中,本研究涉及的14屬、24種植物均屬大戟科。ML系統(tǒng)樹基本支持傳統(tǒng)的分類,即ML系統(tǒng)樹支持葉下珠族(Trib. Phyllantheae)、核果木屬(Drypetes)和大戟屬各自成為一個(gè)自然類群。其中本文所涉及的葉下珠族的種類在APG IV中已經(jīng)劃歸到新成立的葉下珠科(Phyllanthaceae),核果木屬的種類葉已經(jīng)獨(dú)立為核果木科(Putranjivaceae)[24]。6個(gè)大戟屬的種類聚為一支(仍屬大戟科),且與APG IV的葉下珠科和核果木科親緣關(guān)系較為疏遠(yuǎn)(圖3)。傳統(tǒng)分類結(jié)果、ML系統(tǒng)樹分析結(jié)果和APG IV(2016)分類結(jié)果基本一致,在ML系統(tǒng)樹中,這些分支都具有較高的支持率,表明傳統(tǒng)上利用杯狀聚傘花序和通體具有乳汁這兩個(gè)性狀作為大戟屬的鑒別性特征,仍具有可操作性。同時(shí),在ML系統(tǒng)樹中,葉下珠屬的兩個(gè)種并沒有被聚為親緣關(guān)系最近的兩個(gè)種,而是苦味葉下珠先是與算盤子屬的饅頭樹形成一個(gè)親緣關(guān)系最近的分枝,之后該分枝再與葉下珠屬的余柑子互為姊妹類群,而且受到了強(qiáng)烈的支持,APG IV對(duì)類群的處理沒有到種一級(jí)水平,因此,形成這種現(xiàn)象的原因值得進(jìn)一步研究。