夏銘澤 張雨 余靜雅 張發(fā)起
摘?要:?多裂駱駝蓬為西北荒漠地區(qū)常見植物,具有抗風固沙、防止水土流失、抑菌殺蟲和抗腫瘤等功效。為了增加駱駝蓬屬植物開發(fā)利用的強度,彌補其基因功能、代謝通路等分子生物學研究層面的空缺,該文利用Illumina高通量測序平臺對多裂駱駝蓬葉片進行轉錄組測序,根據(jù)測序結果進行轉錄組數(shù)據(jù)拼接、功能注釋、序列水平和表達水平等分析。結果表明:共獲得7 723 653 900 bp核苷酸序列信息,拼接組裝得到78 641條Unigene,預測出55 535條CDS序列。與多個數(shù)據(jù)庫對比后,獲得33 184個NR數(shù)據(jù)庫注釋信息;31 835個GO數(shù)據(jù)庫注釋信息;17 206個KOG數(shù)據(jù)庫Unigene功能分類信息;7 617個KEGG數(shù)據(jù)庫代謝通路注釋信息。對單核苷酸多態(tài)性位點和微衛(wèi)星信息進行檢測分析,共發(fā)現(xiàn)86 113個SNP位點,6 987個SSR信息。該研究首次獲得并分析了多裂駱駝蓬的轉錄組數(shù)據(jù),通過基因比對、CDS預測、通路注釋、SNP檢測和SSR檢測等方法,對該植物的基因、通路以及分子標記等方面有了初步的認識,為本種植物后續(xù)研究及資源的開發(fā)利用奠定了基礎。
關鍵詞: 多裂駱駝蓬, 轉錄組分析, 基因注釋, SNP, SSR
中圖分類號:?Q943
文獻標識碼:?A
文章編號:?1000-3142(2021)04-0503-11
Abstract:?Peganum multisectum is a common plant in arid-desert areas of Northwest China, which has the effects of resisting wind and sand fixation, preventing soil erosion, inhibiting bacteria and insects, and resisting tumor. But the lack of molecular biology research on this plant, such as gene function and metabolic pathway, leads to its underutilization. Here in this study, the transcriptomes of P. multisectum leaves were sequenced by the platform of Illumina. According to the sequencing results, we analyzed splicing, functional annotation, sequence level and expression level of the transcriptome data. Then we obtained a total of 7 723 653 900 bp nucleotide sequence information, assembled 78 641 Unigene sequences and predicted 55 535 CDS sequences. After comparing with several databases, 33 184 NR database annotation information, 31 835 GO database annotation information, 17 206 KOG database Unigene functional classification information and 7 617 KEGG database metabolic pathway annotation information were obtained. In addition, we detected a total of 86 113 single nucleotide polymorphism sites and 6 987 microsatellite information. In this study, transcriptome data of P. multisectum were obtained and analyzed for the first time. These analyses not only shed light on the molecular information of P. multisectum, but also provide a certain reference for the post research, development and utilization of this plant.
Key words: ?Peganum multisectum, transcriptome analysis, gene annotation, SNP, SSR
1753年植物學家林奈(Carl Linnaeus)以駱駝蓬(Peganum harmala)為模式種建立了駱駝蓬屬(Peganum L.)(徐朗然和黃成就,1993)。該屬在《中國植物志》中屬于蒺藜科(Zygophyllaceae)(徐朗然和黃成就,1993),在Flora of China中屬于駱駝蓬科(Peganaceae),在APG Ⅳ系統(tǒng)中屬于白刺科(Nitrariaceae)駱駝蓬亞科(Subfam. Peganoideae Engl.)(Angiosperm Phylogeny Group et al.,2016)。駱駝蓬屬植物為多年生草本,全世界共6種,中國有3種,即駱駝蒿(Peganum nigellastrum)、駱駝蓬(P. harmala)和多裂駱駝蓬(P. multisectum),主要分布于新疆、寧夏、青海、甘肅和內(nèi)蒙古的荒漠或半荒漠地區(qū)(徐朗然和黃成就,1993)。多裂駱駝蓬是中國特有種(段金廒等,1998),該植物對各種生境的適應力強于駱駝蒿和駱駝蓬(劉媖心,1995),具有旱生植物的典型特征,如根系發(fā)達,葉片深裂且裂片較細,有較強的耐旱特性。此外,多裂駱駝蓬植物體生長繁茂,在改善西北荒漠環(huán)境中發(fā)揮著抗風固沙和防止水土流失的重要作用(馬驥和王勛陵,1998;程琳等,2018)。該種資源豐富,僅甘肅省年產(chǎn)量超過1億Kg(樊崢嶸和姚新生,1992)。近年來的研究表明,駱駝蓬屬植物具有抑菌殺蟲(薛林貴等,2005)、抗腫瘤(陳豫等,2015)等多種藥理學活性;提取物和生物堿對多種植物種子的萌發(fā)有抑制作用(劉建新,2003;劉建新等,2008)。段金廒等(1998)從多裂駱駝蓬中分離并鑒定了22種化合物,劉建新等(2011)研究顯示外源一氧化氮可以保護鹽脅迫下多裂駱駝蓬幼苗的光合系統(tǒng)。目前,對多裂駱駝蓬的研究主要集中在藥理活性、種子萌發(fā)及幼苗生長方面。已報道的分子序列僅見于Zhao等(2011)利用trnL-F片段和psbA-trnH片段對駱駝蓬屬植物的鑒定,基因注釋信息亦不完善,阻滯了與藥物活性成分合成相關的代謝通路的研究。因此,亟需利用基因組或轉錄組數(shù)據(jù)來拓展分子生物學信息。
轉錄組(transcriptome)是指生物體的細胞或組織在特定時空條件下轉錄出的RNA的總和(張春蘭等,2012)。較基因組而言,轉錄組僅涉及被轉錄的基因,可以更有效地針對功能基因及其代謝通路進行研究(周華等,2012)。隨著近年來高通量測序技術的發(fā)展,其測序時間和測序成本大大降低(Shendure & Ji,2008),越來越多的學者將高通量測序技術應用到轉錄組研究中,從而獲得來自不同基因的海量RNA序列數(shù)據(jù)。如葉興狀等(2019)對瀕危珍稀植物半楓荷(Semiliquidambar cathayensis)進行轉錄組分析,發(fā)現(xiàn)了控制藥效合成的轉錄因子家族;Zhang et al.(2014)對青藏高原特有植物唐古紅景天(Rhodiola tangutica)植物進行比較轉錄組分析,為解釋該植物可用于預防高原反應的機制提供了分子水平的依據(jù);李彥等(2018)分析了山地虎耳草(Saxifraga sinomontana)的轉錄組微衛(wèi)星位點信息,為該物種遺傳多樣性研究提供了理論依據(jù);付蘇宏等(2019)研究了菊葉香藜(Dysphania schraderilana)轉錄組數(shù)據(jù)庫中的FPPS基因,對該植物倍半萜類化合物的生物合成奠定了基礎。目前,已有部分具藥用價值的植物完成轉錄組測序工作,如人參(Panax ginseny)(鄒麗秋等,2016)、三七(P. notoginseng)(黃勛等,2017)、甘草(Glycyrrhiza uralensis)(張春榮等,2015)、烏頭(Aconitum carmichaelii)(張大燕等,2017)和金鐵鎖(Psammosilene tunicoides)(孟文俊,2019)等,為進一步研究藥用植物的功能基因及代謝通路提供了分子基礎。
駱駝蓬屬植物資源豐富,為增加本屬植物開發(fā)利用的強度,應對其基因功能、代謝通路等進行深入研究。因此,本文選取多裂駱駝蓬葉片為研究材料,利用Illumina Hiseq 2500高通量測序平臺對其進行首次轉錄組測序,建立該物種轉錄組數(shù)據(jù)庫,通過生物信息學方法對Unigene進行功能注釋、代謝途徑及SSR檢測等分析,挖掘多裂駱駝蓬具有藥效和抗干旱作用的功能基因,為進一步研究該植物代謝通路和遺傳多樣性奠定基礎,也為今后本屬植物的開發(fā)利用和保護提供理論依據(jù)。
1?材料與方法
1.1 材料
多裂駱駝蓬植株采自青海省共和縣鐵蓋鄉(xiāng)(36°06′56.61″ N、100°41′41.74″ E, 2 594 m)。將采集的成熟植物葉片放入液氮中快速冷凍,返回實驗室后放入-80 ℃超低溫冰箱保存。憑證標本(Zhang2018013)存放在中國科學院西北高原生物研究所青藏高原生物標本館(HNWP)中。
1.2 方法
1.2.1 RNA提取?從多裂駱駝蓬的葉片材料中提取總RNA,用瓊脂糖凝膠電泳分析RNA的降解程度以及是否有污染;用Nanodrop 2000初步檢測RNA的純度(A260/A280應在1.9~2.0范圍內(nèi));使用Agilent 2100測定樣品的RIN值以確定RNA完整性。
1.2.2 拼接組裝?利用Illumina Hiseq 2500高通量測序平臺進行測序,得到的原始圖像數(shù)據(jù)由CASAVA堿基識別(base calling)后轉化為原始測序數(shù)據(jù)(Raw reads)。該數(shù)據(jù)文件包含測序得到的堿基序列(reads)信息及其對應的堿基測序質(zhì)量信息。質(zhì)量評估后對所得的原始測序數(shù)據(jù)進行過濾:去除接頭(adapter)序列;去除含有未知堿基的序列;從序列兩端起始,去除低質(zhì)量的堿基。過濾后的測序數(shù)據(jù)為Clean reads,使用軟件Trinity(Grabherr et al.,2011)(版本為2.4.0;參數(shù)設置為min_kmer_cov=2,其余為默認設置)將該數(shù)據(jù)組裝成轉錄本,并取每條基因中最長的轉錄本作為Unigene,以此作為后續(xù)分析的參考序列。
1.2.3 功能注釋?使用NCBI BLAST+(https://blast.ncbi.nlm.nih.gov/Blast.cgi)將Unigene序列與CDD、KOG、COG、NR、NT、PFAM、Swissprot和TrEMBL數(shù)據(jù)庫比對,獲得基因的功能注釋信息。首先根據(jù)Swissprot數(shù)據(jù)庫和TrEMBL數(shù)據(jù)庫的蛋白注釋結果,結合Uniprot(UniProt,2018)的注釋信息得到GO注釋。使用軟件KAAS(KEGG Automatic Annotation Server)(Moriya,2007)將Unigene序列與KEGG基因數(shù)據(jù)庫進行BLAST或GHOST比較,以此來獲得基因的功能注釋信息。首先根據(jù)NR、Swissprot、TrEMBL的最佳比對結果按其優(yōu)先級順序確定Unigene的ORF讀碼框;然后根據(jù)標準密碼子表確定其CDS序列(Coding Sequence,氨基酸序列),同時將未比對上的Unigene通過TransDecoder軟件預測其CDS序列。
1.2.4 SNP和SSR的篩選與統(tǒng)計?以組裝好的Unigene作為參考序列,使用BCFtools(版本為2.4.3)(Quinlan,2010)找出其中的SNP位點,參數(shù)為質(zhì)量值大于20且覆蓋度大于8,對篩選出的SNP突變類型進行統(tǒng)計分析。使用MISA(版本為1.0.1)(Thiel,2003)檢測Unigene序列中的SSR信息,檢測的類型包括完美型(perfect)及復合型(compound)的SSR。微衛(wèi)星各重復單元的篩選標準為二核苷酸SSR至少重復6次,三核苷酸SSR至少重復5次,四核苷酸至少重復5次,五核苷酸至少重復5次,六核苷酸至少重復5次。使用Excle(版本為Microsoft Office 2016)軟件對SSR的類型、數(shù)量等進行統(tǒng)計分析。
2?結果與分析
2.1 轉錄組數(shù)據(jù)組裝及Unigene獲取
對多裂駱駝蓬葉片mRNA進行測序,共獲得51 491 026條Raw reads,包含7 723 653 900 bp的核苷酸序列信息,平均每條read的長度為150 bp,長度大于30 bp序列的占比為93.76%,GC百分比為47.65%。對Raw reads進行過濾,獲得50 104 364條Clean reads,包含7 257 449 296 bp的核苷酸序列信息,平均每條read的長度為144.85 bp,長度大于30 bp序列的占比為95.06%,GC百分比為47.46%。
用Trinity軟件對Clean reads進行de novo組裝后獲得148 317個Transcript,去冗余后獲得78 641條Unigene,其總的核苷酸數(shù)分別為117 421 439、52 289 971個(表1)。Unigene長度在200~300 nt之間的有31 316條,占比39.82%;在300~2 000 nt之間的有42 524條,占比54.07%;長度超過2 000 nt的有4 801條,占比6.10%(圖1:A)。同時,對多裂駱駝蓬Unigene的編碼序列進行預測,共獲得55 535條CDS序列。CDS序列長度在100~200 nt之間的有12 541條,占比22.58%;在200~300 nt之間的有15 311條,占比27.57%;在300~2 000 nt之間的有 26 416 條,占比47.57%;長度超過2 000 nt的有1 267條,占比2.28%(圖1:B)。
2.2 轉錄組基因功能注釋
將Unigene分別與CDD、KOG、NR、NT、PFAM、Swissprot、 TrEMBL、 GO和KEGG數(shù)據(jù)庫進行比對并注釋基因功能(表2)。其中,注釋到NR數(shù)據(jù)庫、TrEMBL數(shù)據(jù)庫和GO數(shù)據(jù)庫的基因數(shù)目最多,分別有33 184、32 887、31 835個,占總基因數(shù)目的42.2%、41.82%、40.48%;注釋到KEGG數(shù)據(jù)庫的基因數(shù)目最少,為3 875個,僅占總基因數(shù)目的2.97%??傮w而言,共有38 598個Unigene基因經(jīng)過多數(shù)據(jù)庫比對后成功注釋,仍有40 043個Unigene基因未能獲取注釋信息。
2.3 NR數(shù)據(jù)庫Unigene近似物種比對
將Unigene與NR數(shù)據(jù)庫進行比對,結果顯示有33 184個Unigene獲得注釋信息,占Unigene總數(shù)的42.2%。通過與NR庫的比對,揭示了多裂駱駝蓬轉錄組序列與庫中物種的近似情況,結果顯示該物種與甜橙(Citrus sinensis)的相似序列最多,有7 078條,占NR庫注釋的Unigene總數(shù)的21.33%;其次為克萊門柚(C. clementina),有4 827條,占NR庫注釋的Unigene總數(shù)的14.55%。此外,部分物種還與多裂駱駝蓬有大量基因序列相類似,如可可(Theobroma cacao)、葡萄(Vitis vinifera)、麻瘋樹(Jatropha curcas)、蓖麻(Ricinus communis)、 棗(Ziziphus jujuba)、 毛果楊 (Populus trichocarpa)、雷蒙德氏棉(Gossypium raimondii)和大麥(Hordeum vulgare),這些物種與多裂駱駝蓬相似的基因序列共有7 218條,共占NR庫注釋的Unigene總數(shù)的21.75%。其余42.37%的注釋Unigene分布于其他561個物種中(圖2)。
2.4 Gene Ontology數(shù)據(jù)庫Unigene功能分析
在GO數(shù)據(jù)庫中比對駱駝蓬轉錄組Unigene,有31 835條Unigene獲得210 748條注釋信息。所有注釋信息分為三大類,即生物學過程(biological process)、細胞組分(cellular component)和分子功能(molecular function)。所有大類可細分為67個二級分類。對Unigene在二級分類中的分布情況進行統(tǒng)計分析,結果顯示細胞(cell)和細胞部分(cell part)類型的Unigene最多,分別為23 443、23 399個,分別占GO注釋信息總數(shù)的73.64%、73.50%。此外,細胞過程(cellular process)、連接(binding)、細胞器(organelle)、代謝過程(metabolic process)和細胞膜(membrane)類型的Unigene也較多,分別有21 154(66.45%)、18 776(58.98%)、18 689(58.71%)、18 477(58.04%)和10 999(34.55%)條注釋信息。化學引誘劑活性(chemoattractant activity)、生物相(biological phase)和形態(tài)發(fā)生素(morphogen activity)類型的注釋信息較少(圖3)。
2.5 KOG數(shù)據(jù)庫Unigene功能分類
在KOG數(shù)據(jù)庫中比對駱駝蓬轉錄組Unigene,結果顯示共17 206條Unigene獲得注釋信息,被分為25類(圖4)。其中,一般功能預測基因(general function prediction only)、翻譯后修飾、蛋白質(zhì)折疊和分子伴侶(posttranslational modification, protein turnover, chaperones)、信號傳導機制(signal transduction mechanisms)獲得注釋最多,分別有2 179、2 049和1 871條。細胞活性(cell motility)獲得注釋最少,僅6條(圖4)。
2.6 KEGG數(shù)據(jù)庫Unigene代謝通路分析
使用KEGG數(shù)據(jù)庫對Unigene序列進行比對注釋,代謝通路分析結果顯示多裂駱駝蓬轉錄組中共有3 875個Unigene獲得7 617條代謝通路注釋信息。這些通路信息可分為四大類,分別為細胞進程(cellular processes)、環(huán)境信息處理(environmental information processing)、遺傳信息處理(genetic information processing)和新陳代謝(metabolism)。這四大類可進一步分為23個小類(圖5)。其中,翻譯(translation)和信號傳導(signal transduction)獲得注釋信息最多,分別有662條和590條;信號分子和相互作用(signaling molecules and interaction)及膜運輸(membrane transport)的注釋最少,有2條和21條。
所有注釋的代謝通路信息中,共有240個Unigene與藥物活性成分合成相關。其中,51個Unigene參與了萜類骨架生物合成通路(KEGG數(shù)據(jù)庫通路ID:ko00900),5個Unigene參與了單萜類生物合成通路(KEGG數(shù)據(jù)庫通路ID:ko00902),9個Unigene參與了二萜類生物合成通路(KEGG數(shù)據(jù)庫通路ID:ko00904),9個Unigene參與了倍半萜類和三萜類生物合成通路(KEGG數(shù)據(jù)庫通路ID:ko00909),這些通路均與萜類物質(zhì)合成相關。有62個Unigene參與了苯丙烷類生物合成通路(KEGG數(shù)據(jù)庫通路ID:ko00940),這與苯丙素類物質(zhì)合成相關。此外,還有13個Unigene參與了黃酮類生物合成通路(KEGG數(shù)據(jù)庫通路ID:ko00941),16個Unigene參與了易喹啉生物堿生物合成通路(KEGG數(shù)據(jù)庫通路ID:ko00950),31個Unigene參與了泛醌和其他萜類醌生物合成通路(KEGG數(shù)據(jù)庫通路ID:ko00130),19個Unigene參與了花生四烯酸類生物合成通路(KEGG數(shù)據(jù)庫通路ID:ko00590)。
多裂駱駝蓬在干旱生境下仍有較強的適應力(劉媖心,1995)。通過轉錄組數(shù)據(jù)分析發(fā)現(xiàn),多裂駱駝蓬葉片轉錄信息包含有多個脫落酸(abscisic acid, ABA)合成相關基因,即ZEP(zeaxanthin epoxidase)基因、AAO3(abscisic-aldehyde oxidase)基因和PYL(abscisic acid receptor)基因。此外,還有茉莉酸 (jasmonic acid, JA)合成相關基因,即LOX(lipoxygenase)基因、TGA(transcription factor)基因、JAR1(jasmonic acid-amino synthetase)基因、AOS(hydroperoxide dehydratase)基因和MYC2(transcription factor)基因。已有研究表明,脫落酸和茉莉酸的合成可以增加植物的抗逆能力(張春榮等,2015)。
2.7 多裂駱駝蓬Unigene序列單核苷酸多態(tài)性檢測分析
對多裂駱駝蓬Unigene序列進行檢測,共發(fā)現(xiàn)86 113個單核苷酸多態(tài)性(SNP,single nucleotide polymorphsims)位點。對這些SNP位點進行類型統(tǒng)計,結果顯示轉換突變類型的SNP有58 486個(占67.92%),顛換突變類型的SNP有27 627個(占32.08%)。在轉換突變類型中,由鳥嘌呤轉換為腺嘌呤的突變最多(15 042個),其次為胞嘧啶轉換為胸腺嘧啶的突變(15 000個),表明G→A和C→T二者發(fā)生頻率相差不大。在顛換突變類型中,由腺嘌呤顛換為胸腺嘧啶的突變最多(4 136個),而鳥嘌呤顛換為胞嘧啶的突變最少(2 700個)(圖6)。
2.8 多裂駱駝蓬Unigene序列微衛(wèi)星信息分析
利用軟件MISA對多裂駱駝蓬Unigene進行微衛(wèi)星位點(SSR,simple sequence repeat)進行檢測,共檢測出3 399個SSR。對SSR類型進行統(tǒng)計,結果顯示復合型(compound)SSR和完美型(perfect)SSR分別有442個和2 957個,其發(fā)生頻率為4.32%(檢測出的SSR數(shù)量與總序列數(shù)目的比值)。從分布情況來看,多裂駱駝蓬轉錄組序列中平均每15.38 kb(序列總長度與SSR總數(shù)目的比值)出現(xiàn)一個SSR,表明該物種轉錄組SSR數(shù)量較為豐富。在完全型SSR中,三核苷酸重復占45.01%;二核苷酸重復次之,占38.22%;四核苷酸重復、五核苷酸重復和六核苷酸重復分別占2.53%、0.65%和0.59%。
3?討論與結論
多裂駱駝蓬是西北荒漠地區(qū)的常見植物,因其根系發(fā)達,具有良好的水土保持作用(馬驥和王勛陵,1998),且該植物作為維族、蒙古族和藏族的常用草藥(徐小平等,2008;李凱等,2015)已有長久的歷史。多裂駱駝蓬在西北地區(qū)資源量巨大,為了合理有效地利用這一植物資源,我們通過轉錄組測序的手段以獲取其序列信息及基因表達特征。
本研究通過對多裂駱駝蓬葉片進行轉錄組測序,共獲得了51 491 026條Raw reads和50 104 364條Clean reads。拼接組裝得到78 641條Unigene,N50長度為1 154,平均長度為664.92 bp,比半楓荷(葉興狀等,2019)、胡盧巴(Trigonella foenum-graecum)(Patel et al.,2014)、川芎(Ligusticum chuanxiong)(袁燦等,2017)、狼毒(Stellera chamaejasme)(楊艷芳等,2017)和東北紅豆杉(Taxus cuspidata)(吳瓊等,2012)Unigene的平均長度更長,說明本研究拼接所得長序列Unigene較多,并對Unigene的編碼序列進行預測,共獲得55 535條CDS序列。所得長序列Unigene的增多可能與測序物種的差異有關。
將Unigene序列與CDD、KOG、COG、NR、NT、PFAM、Swissprot、TrEMBL、GO和KEGG共10個數(shù)據(jù)庫比對,共有38 598條(49.08%)序列經(jīng)過多數(shù)據(jù)庫比對后成功注釋,但仍有40 043條(50.92%)未得到準確定位,這一現(xiàn)象在許多物種的轉錄組結果中均有出現(xiàn),如樟樹(Cinnamomum camphora)(江香梅等,2014)、黃秋葵(Abelmoschus esculentus)(Schafleitner et al.,2013)和紫背天葵(Begonia fimbristipula)(張少平等,2016)。這可能與某些Unigene片段長度太短、相關數(shù)據(jù)庫基因注釋信息不完善或者該物種存在新基因等因素有關。通過與NR庫的比對,顯示多裂駱駝蓬與甜橙、克萊門柚、可可和葡萄等物種具有大量相似基因序列。多裂駱駝蓬與四個同科植物僅有14條相似基因序列,分別為白刺(Nitraria tangutorum)7條、N. retusa 4條、駱駝蓬2條和小果白刺(N. sibirica)1條,或與白刺科植物基因組、轉錄組數(shù)據(jù)嚴重缺乏有關。通過比對GO數(shù)據(jù)庫,獲得31 835條Unigene的210 748個功能分類信息,通過比對KOG數(shù)據(jù)庫,獲得17 206個Unigene注釋信息,因此對多裂駱駝蓬Unigene的功能分布狀況有了初步的了解。此外,對拼接組裝的78 641條Unigene進行代謝通路分析,通過比對KEGG數(shù)據(jù)庫最終獲得3 875條(4.93%)Unigene的7 617條代謝通路注釋信息,注釋類別可分為四大類,其中定位到新陳代謝相關通路的基因數(shù)最多,占總注釋量的47.15%,表明多裂駱駝蓬代謝活動能力較強,之后這四大類可細分為23個小類,其中翻譯和信號傳導獲得注釋信息最多。將注釋基因映射到藥物合成相關通路,發(fā)現(xiàn)有240個Unigene與藥物合成通路相關,參與合成的次生代謝產(chǎn)物類型有萜類、苯丙素類、黃酮類、生物堿類等,這為后續(xù)多裂駱駝蓬藥用活性成分的研究提供了基礎數(shù)據(jù)。此外,在多裂駱駝蓬轉錄組中還發(fā)現(xiàn)多個脫落酸和茉莉酸的合成相關基因,甘草(張春榮等,2015)的干旱脅迫研究表明此類基因與抗干旱脅迫作用相關,推測此類基因與多裂駱駝蓬適應西北干旱環(huán)境的特性有關。
多裂駱駝蓬轉錄組SSR的發(fā)生頻率為4.32%,與檢索條件相同(即不包含單核苷酸SSR)的其他物種相比,高于馬尾松(Pinus massoniana)(2.22%)(杜明鳳和丁貴杰,2018)、冷蒿(Artemisia frigida)(2.61%)(岳春江等,2016)、杜仲(Eucommia ulmoides)(2.91%)(黃海燕等,2013)和杉木(Cunninghamia lanceolata)(3.16%)(吳夏雷等,2018),與紅松(P. koraiensis)(4.24%)(張振等,2015)和燈盞花(Erigeron breviscapus)(4.79%)(陳茵等,2014)相差較小,明顯低于半夏(Pinellia ternata)(16.24%)(王森等,2014)和刺梨(Rosa roxburghii)(20.37%)(鄢秀芹等,2015)。這種差異可能是與物種選擇、組裝方法或篩選軟件的不同有關。此外,該物種轉錄組SSR的優(yōu)勢基元為三核苷酸重復,這與馬尾松(杜明鳳和丁貴杰,2018)、杉木(吳夏雷等,2018)、刺梨(鄢秀芹等,2015)等研究結果相一致。有研究表明,轉錄區(qū)的三核苷酸重復在面對自然選擇時表現(xiàn)出積極響應的作用,且該基序是在編碼區(qū)受到重大突變壓力時而存在的一種豐富的核苷酸重復基序(李彥等,2018),即當植物表現(xiàn)出某些抗逆性時三核苷酸重復分布較為豐富,多裂駱駝蓬具有較強的耐干旱能力進一步證實了該結論。此外,我們推測,隨著干旱環(huán)境的脅迫,該物種產(chǎn)生了相應的抵御和適應機制,并逐漸形成了豐富的三核苷酸重復結構。通過分析和挖掘多裂駱駝蓬轉錄組SSR信息,可為今后該物種SSR分子標記的開發(fā)及其遺傳多樣性研究提供生物信息學基礎。
本研究首次獲得了多裂駱駝蓬的轉錄組數(shù)據(jù),通過生物信息學的方法對該數(shù)據(jù)進行分析,內(nèi)容涵蓋基因比對、CDS預測、通路注釋、SNP檢測和SSR檢測,對該植物的基因、通路以及分子標記等方面有了初步的認識,彌補了本植物在分子數(shù)據(jù)方面的空缺,也進一步豐富了白刺科植物的轉錄組數(shù)據(jù)庫,同時也為多裂駱駝蓬的物種分化研究、譜系地理學研究、遺傳多樣性研究和系統(tǒng)發(fā)育學研究提供了數(shù)據(jù)保障,為本種植物資源的開發(fā)利用奠定了基礎。
參考文獻:
ANGIOSPERM PHYLOGENY GROUP, CHASE MW, CHRISTENHUSZ MJM, et al., 2016. An update of the angiosperm phylogeny group classification for the orders and families of flowering plants: APG IV[J]. Bot J Linn Soc, 181(1): 1-20.
CHEN Y, LI CT, JIANG NH, et al., 2014. SSR information in Erigeron breviscapus transcriptome and popymorphism analysis[J]. Chin J Chin Mat Med, 39(7): 1220-1224.[陳茵, 李翠婷, 姜倪皓, 等, 2014. 燈盞花轉錄組中SSR位點信息分析及其多態(tài)性研究[J]. 中國中藥雜志, 39(7): 1220-1224]
CHEN Y, LI K, ZHANG HL, et al., 2015. Diversity of bacterial communities in rhizosphere soil of Peganum harmala L. in desert steppe[J]. Medical Inform, 28(4): 380-381.[陳豫, 李凱, 張洪亮, 2015. 中藥駱駝蓬抗腫瘤作用的研究進展[J]. 醫(yī)學信息, 28(4): 380-381]
CHENG L, CHEN JX, LI YL, et al., 2018. Diversity of bacterial communities in rhizosphere soil of Peganum harmala L. in desert steppe[J]. Arid Zone Res, 35(4): 977-983.[程琳, 陳吉祥, 李彥林, 等, 2018. 荒漠草原植物駱駝蓬根際土壤細菌群落分析[J]. 干旱區(qū)研究, 35(4): 977-983.]
DU MF, DING GJ, et al., 2018. Analysis of SSR loci of functional gene linked to drought resistance based on transcriptome sequences in Pinus massoniana under drought stress[J]. Sci Silv Sin, 31(5): 12-22.[杜明鳳, 丁貴杰, 2018. 基于馬尾松干旱轉錄組的抗旱功能SSR位點分析[J]. 林業(yè)科學研究, 31(5): 12-22.]
DUAN JA, ZHOU RH, ZHAO SX, et al., 1998. Studies on the chemical constituents of Peganum multisectum Maxim Ⅰ. The alkaloids from seeds and antitumour activity[J]. J China Pharm Univ, 29(1): 21-23.[段金廒, 周榮漢, 趙守訓, 等, 1998. 多裂駱駝蓬化學成分研究: I.種子生物堿類成分及其抗腫瘤活性[J]. 中國藥科大學學報, 29(1): 21-23.]
FAN ZR, YAO XS, 1998. Constituents and pharmacological effects of Peganum[J]. J Shenyang Pharm Univ, 9(2): 144-151.[樊崢嶸, 姚新生, 1992. 駱駝蓬屬(Peganum)植物成分及藥理作用[J]. 沈陽藥科大學學報, 9(2): 144-151.]
FU SH, LEI M, ZHANG YQ, et al., 2019. Mining and bioinformatic analysis of FPPS gene from Dysphania schraderiana transcriptome database[J]. Guihaia, 39(6): 831-842.[付蘇宏, 雷鳴, 張勇群, 等, 2019. 菊葉香藜轉錄組數(shù)據(jù)庫中FPPS基因的挖掘與生物信息學分析[J]. 廣西植物, 39(6):831-842.]
GRABHERR M, YASSOUR M, LEVIN J,et al., 2011. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nat Biotechnol, 29(7): 644.
HUANG HY, DU HY, WUYUN TN, et al., 2013. Development of SSR molecular markers based on transcriptome sequencing of Eucommia ulmoides [J]. Sci Silv Sin, 49(5): 176-181.[黃海燕, 杜紅巖, 烏云塔娜, 等, 2013. 基于杜仲轉錄組序列的SSR分子標記的開發(fā)[J]. 林業(yè)科學, 49(5): 176-181.]
HUANG X, JIN J, YU J, et al., 2017. Transcriptome sequencing of Panax pseudoginseng and identification of key enzyme genes in triterpenoids saponin biosynthesis[J]. Genom Appl Biol, 36(6): 2531-2538.[黃勛, 金健, 余潔, 等, 2017. 羽葉三七的轉錄組測序與三萜皂苷生物合成的關鍵酶基因的識別[J]. 基因組學與應用生物學, 36(6): 2531-2538.]
JIANG XM, WU YF, XIAO FM, et al., 2014. Transcriptome analysis for leaves of five chemical types in Cinnamomum camphora[J]. Hereditas, 36(1): 58-68.[江香梅, 伍艷芳, 肖復明, 等, 2014. 樟樹5種化學類型葉片轉錄組分析[J]. 遺傳, 36(1): 58-68.]
LI K, XUE XQ, ZHANG HL, 20015. Research progress on extraction technology and anti-tumor mechanism of effective components from Peganum harmala[J]. Xinjiang J Trad Chin Med, 33(2): 80-82.[李凱, 薛小青, 張洪亮, 2015. 駱駝蓬有效成分的提取工藝及抗腫瘤機制研究進展[J]. 新疆中醫(yī)藥, 33(2): 80-82.]
LIU JX, 2003. Effects of extracts of P. multisectum Maxim Bobr on seed germination and seedling growth and physiological character of oat[J]. J Triticeae Crops, 36(6): 117-119.[劉建新, 2003. 多裂駱駝蓬提取物對燕麥種子萌發(fā)和幼苗生長及生理特性的影響[J]. 麥類作物學報, 23(4): 117-119.]
LIU JX, HU HB, WANG X, 2008. Study on allelopathy of aqueous extract from Peganum multisectum (Maxim.) Bobr. on Perennial Ryegrass (Lolium perenne L.) and its physiological-biochemical manifestation[J]. Acta Agr Sin, 16(4): 374-379.[劉建新, 胡浩斌, 王鑫, 2008. 多裂駱駝蓬水浸液對多年生黑麥草的化感作用與生理生化表現(xiàn)[J]. 草地學報, 16(4): 374-379.]
LIU JX, WANG X, LI BP, 2011. Effects of exogenous nitric oxide donor on photosynthesis and xanthophyll cycle of Peganum multisectum seedlings under NaCl stress[J]. J Desert Res, 31(1): 137-141.[劉建新, 王鑫, 李博萍, 2011. 外源一氧化氮供體對鹽脅迫下多裂駱駝蓬幼苗光合作用和葉黃素循環(huán)的影響[J]. 中國沙漠, 31(1): 137-141.]
LIU YX, 1995. A study on origin and for mation of the chinese desert floras[J]. J Syst Evol, 33(2): 131-141.[劉媖心, 1995. 試論我國沙漠地區(qū)植物區(qū)系的發(fā)生與形成[J]. 植物分類學報, 33(2): 131-141.]
MA J, WANG XL, 1998. the species and distribution of genus Peganum L. in the desert area of China[J]. J Desert Res, 18(2): 131-136.[馬驥, 王勛陵, 1998. 中國荒漠地區(qū)駱駝蓬屬植物種類與分布[J]. 中國沙漠, 18(2): 131-136.]
MENG WJ, ZHANG AL, JIANG LX, et al., 2019. Cloning and bioinformatics analysis of Psammosilene tunicoides transcription factor ptMYC2[J]. Guihaia, 39(10): 1350-1358.[孟文俊, 張愛麗, 蔣樂曉, 等, 2019. 金鐵鎖轉錄因子ptMYC2的克隆和生物信息學分析[J]. 廣西植物, 39(10): 1350-1358.]
MORIYA Y, ITOH M, OKUDA S, et al., 2007. KAAS: an automatic genome annotation and pathway reconstruction server[J]. Nucl Acids Res, 35(Suppl. 2): W182-W185.
PATEL S, SHAH D, PANCHAL H, 2014. De Novo RNA seq assembly and annotation of Trigonella foenum-graecum L. (SRR066197)[J]. Legume Genom Genet, 5(7) 1-7.
QUINLAN A, HALL I, 2010. BEDTools: a flexible suite of utilities for comparing genomic features[J]. Bioinformatics, 26(6): 841-842.
SCHAFLEITNER R, KUMAR S, LIN CY, et al., 2013. The okra(Abelmoschus esculentus) transcriptome as a source for gene sequence information and molecular markers for diversity analysis[J]. Gene, 517 (1): 27-36.
SHENDURE J, JI H, 2008. Next-generation DNA sequencing[J]. Nat Biotechnol, 26(10): 1135.
THIEL T, MICHALEK W, VARSHNEY R, et al., 2003. Exploiting EST databases for the development and characterization of gene-derived SSR-markers in barley (Hordeum vulgare L.)[J]. Theor Appl Genet, 106(3): 411-422.
UNIPROT C, 2018. UniProt: A worldwide hub of protein knowledge[J]. Nucl Acids Res, 47(D1): D506-D515.
WANGS, ZHANG Z, JIANG NH, et al., 2014. SSR information in transcriptome of Pinellia ternata[J]. J Chin Med Mat, 37(9): 1566-1569.[王森, 張震, 姜倪皓, 等, 2014. 半夏轉錄組中的SSR位點信息分析[J]. 中藥材, 37(9): 1566-1569.]
WU Q, DUAN XQ, CHEN X, et al., 2012. EST-SSRs markers of Taxus chinensis based on high throughput sequencing[J]. Chin J Chin Mat, 37(24): 3728-3733.[吳瓊, 段小群, 陳旭, 等, 2012. 基于高通量測序的紅豆杉EST-SSRs標記研究[J]. 中國中藥雜志, 37(24): 3728-3733.]
WU XL, DONG L, SUN YH, et al., 2018. Development of EST-SSR molecular marker based on sequences of Cunninghami lanceolata transcripts under drought stress[J]. J NE For Univ, 46(2): 1-5.[吳夏雷, 董黎, 孫宇涵, 等, 2018. 基于干旱脅迫下杉木轉錄組序列的EST-SSR分子標記開發(fā)[J]. 東北林業(yè)大學學報, 46(2): 1-5.]
XU LR, HUANG CJ, 1993. Flora Reipublicae Popularis Sinicae[M]. Beijing: Science Press, 43(1): 123-126.[徐朗然, 黃成就, 1993. 中國植物志[M]. 北京: 科學出版社, 43(1): 123-126.]
XU XP, BU R, CHEN XH, 2008. Investigation on resource distribution and evaluation of medicinal prospect of Peganum harmala in Northwest China[M]. J Shaanxi Coll Trad Chin Med, 31(6): 70-71.[徐小平, 卜瑞, 陳興華, 2008. 我省及西北地區(qū)駱駝蓬資源分布狀況調(diào)查與藥用前景評估[J]. 陜西中醫(yī)學院學報, 31(6): 70-71.]
XUE LG, ZHAO GL, WANG YM, 2005. Studies on the inhibition and disinsection of fungistatic agent extracted from Peganum multisectum Bobr.[J]. Microbiology, 32(1): 48-51.[薛林貴, 趙國林, 王毅民, 2005. 多裂駱駝蓬提取液的抑菌殺蟲作用研究[J]. 微生物學通報, 32(1): 48-51.]
YAN XQ, LIU M, AN HM, 2015. Analysis on SSR information in transcriptome and development of molecular markers in Rosa roxburghii[J]. Acta Hortic Sin, 42(2): 341-349.[鄢秀芹, 魯敏, 安華明, 2015. 刺梨轉錄組SSR信息分析及其分子標記開發(fā)[J]. 園藝學報, 42(2): 341-349.]
YANG YF, LIU HW, QIU DY, 2017. Transcriptome characterization of Stellera chamaejasme with illumina sequencing technology[J]. Chin Trad Herb Drugs, 48(22): 4740-4747.[楊艷芳, 劉洪偉, 邱德有, 2017. 基于高通量測序的瑞香狼毒轉錄組數(shù)據(jù)分析[J]. 中草藥, 48(22): 4740-4747.]
YE XZ, LIU D, LUO JJ, et al., 2019. Transcriptome analysis for rare and endangered plants of Semiliquidambar cathayensis[J]. Bull Bot Res, 39(2): 276-286.[葉興狀, 劉丹, 羅佳佳, 等, 2019. 瀕危珍稀植物半楓荷的轉錄組分析[J]. 植物研究, 39(2): 276-286.]
YUAN C, PENG F, YANG ZM, et al., 2017. EST-SSR identification, markers development of Ligusticum chuanxiong based on Ligusticum chuanxiong transcriptome sequences[J]. Chin J Chin Mat, 42(17): 3332-3340.[袁燦, 彭芳, 楊澤茂, 等, 2017. 川芎轉錄組SSR分析與EST-SSR標記的開發(fā)[J]. 中國中藥雜志, 42(17): 3332-3340.]
YUE CJ, CHEN CC, GUO FX, et al., 2016. Data mining of simple sequence repeats in transcriptome sequences of Mongolia medicinal plant Artemisia frigida Willd[J]. J Agric Sci Technol, 18(6): 31-43.[岳春江, 陳川川, 郭鳳仙, 等, 2016. 蒙藥冷蒿轉錄組SSR信息分析[J]. 中國農(nóng)業(yè)科技導報, 18(6): 31-43.]
ZHAN GZ, ZHANG HG, MO C, et al., 2015. Transcriptome sequencing analysis and development of EST-SSR markers for Pinus koraiensis [J]. Sci Silv Sin, 51 (8): 114-120.[張振, 張含國, 莫遲, 等, 2015. 紅松轉錄組SSR分析及EST-SSR標記開發(fā)[J]. 林業(yè)科學, 51 (8): 114-120.]
ZHANG CL, QIN ZJ, WANG GZ, et al., 2012. Transcriptome and RNA-seq technology[J]. Biotechnol Bull, (12): 51-56.[張春蘭, 秦孜娟, 王桂芝, 等, 2012. 轉錄組與RNA-Seq技術[J]. 生物技術通報, (12): 51-56.]
ZHANG CR, SANG XY, QU M, et al., 2015. De novo sequencing and analysis of root transcriptome to reveal regulation of gene expression by moderate drought stress in Glycyrrhiza uralensis[J]. Chin J Chin Mat, 40(24): 4817-4823.[張春榮, 桑雪雨, 渠萌, 等, 2015. 基于轉錄組測序揭示適度干旱脅迫對甘草根基因表達的調(diào)控[J]. 中國中藥雜志, 40(24): 4817-4823.]
ZHANG DY, WEN H, WANG W, et al., 2017. Transcriptional analysis of terpenoid biosynthesis in Aconitum carmichaelii[J]. Chin J Exp Trad Med Form, 32(16): 45-50.[張大燕, 文歡, 王偉, 等, 2017. 烏頭萜類生物合成代謝的轉錄組學分析[J]. 中國實驗方劑學雜志, 32(16): 45-50.]
ZHANG FQ, GAO QB, KHAN G, et al., 2014. Comparative transcriptome analysis of aboveground and underground tissues of Rhodiola algida, an important ethno-medicinal herb endemic to the Qinghai-Tibetan Plateau.[J]. Gene, 553(2): 90-97.
ZHANG SP, HONG JJ, QIU SL, et al., 2016. Sequencing and analysis of the transcriptome of Gynura bicolor[J]. Acta Hortic Sin, 43(5): 935-946.[張少平, 洪建基, 邱珊蓮, 等, 2016. 紫背天葵高通量轉錄組測序分析[J]. 園藝學報, 43(5): 935-946.]
ZHAO T, WANG ZT, BRANFORD-WHITE CJ, et al., 2011. Classification and differentiation of the genus Peganum indigenous to China based on chloroplast trnL-F and psbA-trnH sequences and seed coat morphology.[J]. Plant Biol, 13(6): 940-947.
ZHOU H, ZHANG X, LIU TY, et al., 2012. Data processing and gene discovery of high-throughput transcriptome sequencing[J]. Jiangxi Sci, 30(5): 607-611.[周華, 張新, 劉騰云, 等, 2012. 高通量轉錄組測序的數(shù)據(jù)分析與基因發(fā)掘[J]. 江西科學, 30(5): 607-611.]
ZOU LQ, KUANG XJ, LI Y, et al., 2016. De novo sequencing and analysis of root transcriptome to reveal regulation of gene expression by moderate drought stress in Glycyrrhiza uralensis[J]. Chin J Chin Mat, 41(22): 4138-4143.[鄒麗秋, 匡雪君, 李瀅, 等, 2016. 人參屬藥用植物轉錄組研究進展[J]. 中國中藥雜志, 41(22): 4138-4143.]
(責任編輯?蔣巧媛)