• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      藏茵陳基源植物皺邊喉毛花的全長轉(zhuǎn)錄組信息分析

      2023-08-20 07:59:07韓霜徐浩余靜雅韓赟張發(fā)起
      廣西植物 2023年7期
      關鍵詞:轉(zhuǎn)錄因子

      韓霜 徐浩 余靜雅 韓赟 張發(fā)起

      摘 要:? 皺邊喉毛花為藏藥藏茵陳基源植物之一,其包含豐富的藥用成分。為進一步了解皺邊喉毛花轉(zhuǎn)錄組,豐富其基因注釋、代謝通路等遺傳信息,該研究利用PacBio測序平臺對皺邊喉毛花葉片進行全長轉(zhuǎn)錄組測序。結(jié)果表明:(1)全長轉(zhuǎn)錄組測序共獲得17 Gb的高質(zhì)量數(shù)據(jù),對795 698 個環(huán)形一致性序列(CCS)序列進行聚類和去冗余,最終獲得87 814 條高質(zhì)量的全長轉(zhuǎn)錄本。(2)與7個數(shù)據(jù)庫比對后,共有277 451 條轉(zhuǎn)錄本注釋成功,其中注釋到NR數(shù)據(jù)庫的轉(zhuǎn)錄本最多,有39 214 條。26 396 條轉(zhuǎn)錄本成功注釋到KOG數(shù)據(jù)庫中,共有26 個子類。39 104 條轉(zhuǎn)錄本注釋到KEGG數(shù)據(jù)庫中,涉及6 個主要通路和40 個子通路。39 102 條轉(zhuǎn)錄本注釋到GO數(shù)據(jù)庫中,按分子功能、生物學過程和細胞成分3大類對注釋成功的轉(zhuǎn)錄本進行分類。(3)SSR分析共鑒定到22 861 個SSR,其中單堿基重復最為豐富;共檢測到1 874 個轉(zhuǎn)錄因子和15 166 個長非編碼RNA(LncRNA),而注釋到轉(zhuǎn)錄本最多的轉(zhuǎn)錄因子家族是C3H。(4)篩選出55 條與單萜類及黃酮類化合物合成相關的轉(zhuǎn)錄本。該研究結(jié)果豐富了皺邊喉毛花的轉(zhuǎn)錄組信息,為進一步篩選皺邊喉毛花藥用成分合成相關的關鍵基因提供了重要的遺傳資源。

      關鍵詞: 皺邊喉毛花, 全長轉(zhuǎn)錄組, 代謝通路, 轉(zhuǎn)錄因子, 長非編碼RNA

      中圖分類號:? Q943

      文獻標識碼:? A

      文章編號:? 1000-3142(2023)07-1335-12

      收稿日期:? 2022-11-21

      基金項目:? 第二次青藏高原科學考察研究項目(2019QZKK05020102); 青海省科技國際合作專項(2021-HZ-807)。

      第一作者: 韓霜(1998- ),碩士研究生,主要從事高山植物多樣性研究,(E-mail)hanshuang@nwipb.cas.cn。

      通信作者:? 張發(fā)起,博士,研究員,研究方向為高山植物多樣性,(E-mail)fqzhang@nwipb.cas.cn。

      Full-length transcriptome information for Tibetan medicine

      “Zangyinchen” of original plant Comastoma polycladum

      HAN Shuang1,2, XU Hao1,2, YU Jingya1,2,? HAN Yun1,2, ZHANG Faqi1*

      ( 1. Key Laboratory of Adaptation and Evolution of Plateau Biota, Northwest Institute of Plateau Biology, Chinese Academy of Sciences,

      Xining 810001, China; 2. College of Life Sciences, University of Chinese Academy of Sciences, Beijing 100039, China )

      Abstract:? Comastoma polycladum is one of the original plant of Tibetan medicine “Zangyinchen”, which contains abundant medical components. To further know the transcriptome of C. polycladum and enrich its genetic information of gene annotation and metabolic pathway, the Pacbio sequencing platform was used to perform full-length transcriptome sequencing? of C. polycladum leaves. The results were as follows: (1) A total of 17 Gb of sequencing data was collected, and 87 814 high-quality full-length transcripts were obtained by clustering and de-redundancy of 795 698 circular consistency sequences (CCSs) sequences. (2) Comparing with seven databases, 277 451 transcripts were annotated successfully, and in NR database with 39 214 transcripts annotated the most transcripts. A total of? 26 396 transcripts were annotated to the KOG database,? with 26 subcategories, and a total of 39 104 transcripts with six major pathways and 40 secondary pathways to the KEGG database. A total of 39 102 transcripts were annotated to the GO database, which were divided into three major categories: molecular function, biological process and cellular component. (3) SSR analysis yielded 22 861 SSRs, with single-base repeats being the most abundant. A total of? 1 874 transcription factors and 15 166 long non-coding RNAs (LncRNAs) were identified, and the C3H transcription factor family had the most annotated transcripts. (4) A total of? 55 transcripts involved in the synthesis of monoterpenes and flavonoids were screened out. These results enrich the transcriptome information of C. polycladum, and? provide significant genetic resources for further screening of candidate genes related to the synthesis of medicinal components of C. polycladum.

      Key words:? Comastoma polycladum, full-length transcriptome, metabolic pathway, transcription factor, LncRNA

      藏茵陳是青藏高原藏藥八珍之一,龍膽科植物是藏茵陳入藥源植物中的主要植物,多以川西獐牙菜、濕生扁蕾、橢圓葉花錨和喉毛花屬植物入藥,常用于熱癥、肝膽病及血液病等疾病的治療(唐麗等,2007)。近年來的研究表明,這些基源植物包含豐富的藥用成分,主要為環(huán)烯醚萜、黃酮類化合物,在保肝、抗氧化、抗病毒等方面具有顯著效果(延璽等,2008;董天驕等,2011;楊青松等,2013)。龍膽科(Gentianaceae)喉毛花屬(Comastoma)植物是藏茵陳基源植物之一(鐘國躍等,2010),對喉毛花屬植物的研究目前主要集中在細胞學、胚胎學、生態(tài)學、系統(tǒng)發(fā)育研究及天然產(chǎn)物學上(劉建全和何廷農(nóng),1996;張嬋等,2014;劉小翠等,2016;Zhang et al.,2021;劉真等,2021)。劉真等(2021)在長梗喉毛花的化學成分研究中發(fā)現(xiàn)25個化合物,其抗炎活性較高并對人體癌細胞株具有抑制作用。喬涌起等(2012)在長梗喉毛花植物中分離得到正丁醇化學成分,為進一步深入研究其化學成分奠定基礎。然而,有關喉毛花屬植物的基因注釋信息尚未見報道,限制了對次級代謝產(chǎn)物合成相關代謝通路及功能基因的研究。因此,需要利用測序技術(shù)豐富喉毛花植物的轉(zhuǎn)錄組遺傳信息。

      隨著測序技術(shù)的發(fā)展,越來越多的學者將高通量測序技術(shù)應用到植物轉(zhuǎn)錄組研究(Wang et al.,2016;Zhu et al.,2017;朱興正等,2018)。二代測序讀長的限制導致所拼接得到的轉(zhuǎn)錄本不夠完整,而三代測序技術(shù)正好彌補了這一缺點,其能夠完成長讀長測序,測序過程無需打斷,嚴格執(zhí)行RNA樣品提取與檢測、建庫及測序等環(huán)節(jié)的工作,最終得到高質(zhì)量的全長轉(zhuǎn)錄本信息(王瑞嫻和李川,2019;張子敬等,2020)。對沒有參考基因組的植物而言,全長轉(zhuǎn)錄組(full-length transcriptome)測序為其研究提供了可能,解決了轉(zhuǎn)錄本拼接較短、信息不完整的難題(趙陸滟等,2019)。因此,三代測序技術(shù)成為深入挖掘基因組數(shù)據(jù)的有效手段之一(趙陸滟等,2019)。近年來,有許多學者研究了青藏高原地區(qū)藥用植物的全長轉(zhuǎn)錄組。在這些研究案例中,對老芒麥(Elymus sibiricus)的轉(zhuǎn)錄組解析成功并挖掘到其落粒相關候選基因,為篩選低落粒老芒麥新品種提供了參考(張俊超,2020)。丹參(Salvia miltiorrhiza)的全長轉(zhuǎn)錄組揭示了丹參酮二萜類化合物的生物合成的相關基因(Xu et al.,2015)。蒙古黃芪(Astragalus membranaceus var. mongholicus)全長轉(zhuǎn)錄組解析了次生代謝產(chǎn)物生物合成的相關基因(Li et al.,2017)。這些研究案例說明全長轉(zhuǎn)錄組對藥用植物關鍵基因的挖掘具有顯著優(yōu)勢,為進一步研究藥用植物的功能基因提供了新的思路和參考。

      喉毛花屬的皺邊喉毛花(Comastoma polycladum)為青藏高原特有植物(Ho & Liu,2001,2015)。目前對皺邊喉毛花的研究主要集中在系統(tǒng)發(fā)育研究上。為進一步了解喉毛花屬下物種植物體內(nèi)的次級代謝產(chǎn)物,應對相關轉(zhuǎn)錄組進行深入研究,本研究以皺邊喉毛花為對象,基于PacBio測序平臺對其全長轉(zhuǎn)錄組進行測序,獲取的數(shù)據(jù)用于功能注釋、可變剪切分析、SSR分析、轉(zhuǎn)錄因子分析及長非編碼RNA等分析。通過與公共數(shù)據(jù)庫比對,篩選藥用相關成分合成相關的代謝通路和轉(zhuǎn)錄本。全長轉(zhuǎn)錄組能夠為皺邊喉毛花藥用成分合成相關的關鍵基因的篩選提供重要的遺傳資源。

      1 材料與方法

      1.1 試驗材料

      新鮮幼葉采集于海南藏族自治州共和縣(地理坐標為100°53′58.44″ E、36°22′19.00″ N,海拔為3 518 m),采集后迅速置于液氮罐中保存,后將其轉(zhuǎn)移至-80 ℃的超低溫冰箱中,用于后續(xù)RNA提取。憑證標本(Zhang2018026)存放于中國科學院西北高原生物研究所青藏高原生物標本館(HNWP)。

      1.2 方法

      1.2.1 RNA提取和文庫構(gòu)建

      采用Total RNA Extractor(Trizol)試劑法(Connolly et al.,2006)提取皺邊喉毛花的總RNA,瓊脂糖凝膠電泳檢測RNA降解程度及污染情況,并評估其質(zhì)量和完整性。檢測合格的RNA樣品用于構(gòu)建皺邊喉毛花全長轉(zhuǎn)錄組測序文庫。具體操作如下:在反轉(zhuǎn)錄酶的作用下,以Oligo DT為引物、目標mRNA為模板,進行反轉(zhuǎn)錄,通過低循環(huán)PCR擴增全長cDNA,利用NEBNext End repair/dA-tailing Module末端修讀及加poly(A)尾,ONT SQKLSK109試劑盒及NEBNext Quick Ligationg Module用于測序接頭的連接。建好的文庫采用PromethION(Oxford Nanopore Technologies公司,英國)測序平臺進行測序。

      1.2.2 數(shù)據(jù)處理 測序完成后對原始數(shù)據(jù)進行過濾,去除接頭以及低質(zhì)量的reads。采用軟件SMRTlink v8.0(https://www.pacb.com/support/software-downloads)進行過濾和處理。參數(shù)設置:-minLength 50(最小長度為50 bp),-maxLength 15 000(最大長度為15 000 bp),-minPasses 1(最小的fullpass數(shù)為1)。利用subread.bam文件得到環(huán)形一致性序列(circular consistency sequence,CCS),對其進行分類,搜尋并聚類FLNC序列,得到consensus序列。利用Arrow軟件對得到的consensus序列進行校正,獲得高質(zhì)量的全長優(yōu)化序列(polished consensus)用于后續(xù)分析,最終統(tǒng)計得到有效數(shù)據(jù)。為提高數(shù)據(jù)的準確性,利用LoRDEC軟件(Salmela & Rivals,2014)對轉(zhuǎn)錄本進行校正,生成校正序列(corrected consensus)。利用CD-HIT 軟件(Fu et al.,2012)對校正后的轉(zhuǎn)錄本進行冗余分析。

      1.2.3 全長轉(zhuǎn)錄組序列分析 對去冗余后的序列進行基因功能注釋,所使用的數(shù)據(jù)庫包括非冗余蛋白數(shù)據(jù)庫(Non-Redundant Protein Database,NR, Deng et al.,2006)、蛋白質(zhì)家族域數(shù)據(jù)庫(Protein Families Database,Pfam, Finn et al.,2014)、蛋白質(zhì)真核同源數(shù)據(jù)庫(Eukaryotic Orthologous Groups,KOG, Koonin et al.,2004)、蛋白質(zhì)原核同源數(shù)據(jù)庫(Cluster of Orthologous Groups of Proteins,COG,Tatusov et al.,2003)、東京基因與基金組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG,Minoru et al.,2004)、基因本體論數(shù)據(jù)庫(Gene Ontology,GO,Ashburner et al.,2000)、核酸序列數(shù)據(jù)庫(Nucleotide Sequence Database,NT)和SwissProt數(shù)據(jù)庫(a manually annotated and reviewed protein sequence database)等,以此獲得更全面的基因功能信息。

      1.2.4 全長轉(zhuǎn)錄組結(jié)構(gòu)分析 利用iTAK v 1.7a軟件(參數(shù)設置:-f 3F)對皺邊喉毛花進行轉(zhuǎn)錄因子(transcription factor,TF)預測(Zheng et al.,2016)。利用MISA(MIcroSAtellite Identification Tool) v 1.0軟件檢測簡單重復序列標記(simple sequence repeats,SSR),設置單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸及六核苷酸的最少重復次數(shù)分別為10、 6、 5、 5、 5、 5,其余參數(shù)默認(Beier et al.,2017)。利用CNCI v 2(Coding-Non-Coding Index,Sun et al.,2013)、plek v 1.2(Predictor of Long Non-coding RNAs and mRNAs Based on k-mer Scheme,Li et al.,2014)、CPC2 v 0.1(Coding Potential Calculator 2,Kang et al.,2017)軟件以及Pfam數(shù)據(jù)庫(Finn et al.,2014)對PacBio測序數(shù)據(jù)進行編碼潛能預測(參數(shù)設為默認),獲得的長非編碼RNA(long non-coding RNA,LncRNA)用于后續(xù)分析。

      2 結(jié)果與分析

      2.1 全長轉(zhuǎn)錄組測序及組裝

      經(jīng)SMRT (Single-Molecule Real-Time) 測序共獲得17 Gb的原始數(shù)據(jù)。對其過濾后獲得17 315 066 個subreads?;趕ubread.bam文件獲得795 698 個CCS序列,N50長度為2 143 bp,最大長度為16 860 bp,最小長度為60 bp,平均長度為2 337 bp(表1)。經(jīng)分類獲得695 698 條FLNC序列,N50長度為2 055 bp,最大長度為12 952 bp,最小長度為52 bp。對其聚類后獲得87 814 條consensus序列,最大長度為8 269 bp,最小長度為338 bp,N50長度為2 219 bp。對consensus序列進行校正后,獲得87 814 條校正序列,N50長度為2 221 bp。我們對冗余前后的序列長度頻數(shù)分布情況進行了統(tǒng)計(圖1)。

      2.2 全長轉(zhuǎn)錄組功能注釋

      共有277 451 條轉(zhuǎn)錄本成功注釋到7 個數(shù)據(jù)庫中,其中注釋到NR數(shù)據(jù)庫的轉(zhuǎn)錄本最多,有39 214 條,注釋到KOG數(shù)據(jù)庫的轉(zhuǎn)錄本最少,有26 396 條(圖2)。26 722、39 102條轉(zhuǎn)錄本分別注釋到GO數(shù)據(jù)庫和KEGG數(shù)據(jù)庫中。39 592 條轉(zhuǎn)錄本注釋到至少一個數(shù)據(jù)庫中,16 273 條轉(zhuǎn)錄本注釋到所有數(shù)據(jù)庫中。從不同數(shù)據(jù)庫中選擇5 個常用的數(shù)據(jù)庫進行韋恩圖繪制(圖3)。

      2.2.1 KOG注釋 與KOG數(shù)據(jù)庫比對后,共有29 531 條基因被注釋成功。按KOG分類可分為26 個類型(圖4)。其中,注釋到只有一般功能預測(4 757 條)、翻譯后修飾、蛋白轉(zhuǎn)運(3 369 條)和信號傳遞機制(2 766 條)的基因最多。然而,細胞活性(9 條)和未命名蛋白(5 條)注釋到的基因最少。

      2.2.2 GO注釋 GO是描述基因功能的一套分類系統(tǒng),可全面描述生物體中基因和基因產(chǎn)物的屬性(Blake & Harris, 2008)。共有39 102 條轉(zhuǎn)錄本注釋到了GO數(shù)據(jù)庫,根據(jù)注釋結(jié)果對得到的轉(zhuǎn)錄本進行分類(圖5)。注釋到生物過程、細胞成分、分子功能3大類,分別有25個、18個、11個子類,共54個子類。然而,注釋到細胞殺死(2 條)和行為(1 條)的基因最少。在細胞成分中,注釋到細胞和細胞部分的基因最多(均為5 252 個),而突觸(5 條)、突觸部分(5 條)和細胞連接(4 條)子類中涉及的基因最少;在分子功能中,注釋到結(jié)合(16 037 條)和催化活性(12 400 條)的基因最多,而金屬伴活動分子功能調(diào)節(jié)器(2 條)子類中涉及的基因最少;在生物過程中,注釋到代謝過程(12 848 條)和細胞過程(11 558 條)的基因最多,而細胞殺死(2 條)和行為(1 條)子類中涉及的基因最少。

      2.2.3 KEGG注釋 根據(jù)KO與Pathway的關聯(lián)性進行KEGG代謝通路分類。與KEGG數(shù)據(jù)庫比對后,成功注釋的基因有62 457 條。這些注釋基因被分到6個主要通路(代謝、遺傳信息處理、細胞過程、環(huán)境信息處理、組織系統(tǒng)和人類疾病)和40 個子通路中(表2)。其中,涉及基因最多的主通路為代謝(128 條),其次為組織系統(tǒng)(77 條)、人類疾病(68 條)和環(huán)境信息處理(36 條),最少為細胞過程(25 條)和遺傳信息處理(22 條)。涉及基因最多的子通路為信號轉(zhuǎn)導(3 283 條),其次為碳代謝(2 468 條)和翻譯(2 460 條),最少為信號分子和互作作用(1 條)。

      2.3 藥用相關的代謝通路

      龍膽科植物包含環(huán)烯醚萜、黃酮類及三萜類化合物等藥效成分(楊青松等,2013)。根據(jù)KEGG轉(zhuǎn)錄本注釋結(jié)果,統(tǒng)計及分析與藥效成分相關的次級代謝通路(表3)。 其中包括單萜類生物合成(13 條)、倍半萜類和三萜類生物合成(27 條)、類黃酮生物合成(36 條)、黃酮和黃酮醇生物合成(4 條)。統(tǒng)計這些代謝通路中可能與環(huán)烯醚萜、黃酮等藥效成分合成相關的轉(zhuǎn)錄本。

      2.4 SSR分析

      對皺邊喉毛花的全長轉(zhuǎn)錄組進行SSR分析后,共檢測到22 861 個SSR信息位點。共獲得6種SSR重復類型,其中單堿基重復類型(Mono-nucleotide,Mono-,13 750 個)最豐富,其次為三堿基重復類型(Tri-nucleotide,Tri-,5 811 個)、二堿基重復類型(Di-nucleotide,Di-,2 807 個)、四堿基重復類型(Tetra-nucleotide,Tetra-,573 個)和六堿基重復類型(Hexa-nucleotide,Hexa-,199 個),而五堿基重復類型(Penta-nucleotide,Penta-,178個)最少。統(tǒng)計6個重復類型中不同長度范圍重復序列的分布情況,結(jié)果顯示9~12 bp長度的重復序列最豐富,其次是5~8 bp、13~16 bp、17~20 bp長度的重復序列,而21~24 bp長度的重復序列最少(圖6)。

      2.5 轉(zhuǎn)錄因子分析

      轉(zhuǎn)錄因子是一些表達的蛋白質(zhì)分子,能與基因順式作用元件專一性結(jié)合,對基因轉(zhuǎn)錄進行調(diào)控(劉強等,2000)。本研究預測結(jié)果顯示共獲得1 874個轉(zhuǎn)錄因子(圖7)。其中注釋到轉(zhuǎn)錄本最多的轉(zhuǎn)錄因子家族是C3H(120 個),其次為bZIP(Basic Leucine Zipper,112 個)、bHLH(Basic/Helix-Loop-Helix,110 個)和MYB-related(109 個),而TUB(31 個)、C2C2-GATA(30 個)轉(zhuǎn)錄因子家族數(shù)量最少。

      2.6 長非編碼RNA分析

      長鏈非編碼RNA(LncRNA)不編碼蛋白質(zhì),利用CNCI、CPC2、plek和Pfam方法對其進行編碼潛能預測。共檢測到15 166 個LncRNA,其中CNCI、CPC2、plek和Pfam分別檢測到2 276個、5 295個、6 655個、10 480個LncRNA,4種軟件檢測到的共有

      LncRNA有1 110 個。統(tǒng)計4種方法預測的LncRNA數(shù)目繪制韋恩圖(圖8)。

      3 討論與結(jié)論

      皺邊喉毛花是藏茵陳基源植物之一,植物體內(nèi)含有大量的藥用成分,但對其轉(zhuǎn)錄組的認識較淺, 基因功能相關研究的報道較少。為進一步了解皺邊喉毛花藥用價值,我們開展次級代謝產(chǎn)物合成相關基因功能研究。利用PacBio測序平臺解析全長轉(zhuǎn)錄組,獲取更完整的轉(zhuǎn)錄本信息。通過測序共獲得17 315 066 條Subreads,平均長度為1 620 bp,N50長度為1 505 bp,說明全長轉(zhuǎn)錄組測序讀長較長且連續(xù)性較高。為獲得更準確且可靠的數(shù)據(jù),對Subread進行聚類及校正后,得到87 814 條高質(zhì)量的全長轉(zhuǎn)錄本。N50長度大于1 000 bp(2 221 bp)說明其組裝完整性較好,能夠滿足后續(xù)轉(zhuǎn)錄組信息分析的要求。

      通過與7個公共數(shù)據(jù)庫的比對,我們獲得了大量有用的轉(zhuǎn)錄本注釋信息,共有277 451 條轉(zhuǎn)錄本成功注釋到這些數(shù)據(jù)庫中,其中注釋到NR、KEGG數(shù)據(jù)庫中的轉(zhuǎn)錄本數(shù)量最多。NR數(shù)據(jù)庫比對結(jié)果顯示與皺邊喉毛花比對率排名前十的物種為咖啡(Coffea canephora)、芝麻(Sesamum indicum)、牽牛(Ipomoea nil)等,表明皺邊喉毛花與這些植物具有較高同源性。然而,能與皺邊喉毛花比對上的同科植物較少,這反映出公共數(shù)據(jù)庫中龍膽科植物的基因組信息十分匱乏。

      藏茵陳基源植物包含豐富的環(huán)烯醚萜、黃酮及三萜類等藥用成分(楊青松等,2013),本研究從對皺邊喉毛花全長轉(zhuǎn)錄組的分析中檢測到與其藥用合成相關的55條轉(zhuǎn)錄本,包括生物堿、萜類、苯丙素類、黃酮類、糖苷類、醌類、聚酮類、有機酸及酚類等。黃酮作為具有多種生物活性的多酚類化合物,廣泛存在于植物體內(nèi),在人體疾病治療中起到顯著效果(Hostetler et al.,2017)。萜類化合物在植物的生長和發(fā)育中發(fā)揮重要作用,常應用于食品、制藥和化學工業(yè)中(Tholl,2015)。本研究分析得到多個黃酮類與萜類化合物合成相關的轉(zhuǎn)錄本,有助于挖掘黃酮類及萜類化合物合成相關的關鍵基因,這為我們今后開展皺邊喉毛花關鍵基因克隆研究提供基礎數(shù)據(jù)。

      SSR位點廣泛分布于真核生物基因組(張楠等,2013)。本研究SSR分析結(jié)果顯示,單堿基重復類型最為豐富,類似情況在其他藥用植物中也有體現(xiàn),如山莨菪(Anisodus tanguticus)、鳳丹(Paeonia suffruticosa)、羅布麻(Apocynum venetum)等(謝冬梅等,2017;張雨等,2020;趙雪艷等,2020)。除去對單堿基重復的統(tǒng)計,皺邊喉毛花植物中三堿基重復類型最為豐富,這與藥用植物甘葛藤(Pueraria thomsonii)和全萼秦艽(Gentiana lhassica)結(jié)果一致,而在紅花這個物種中二堿基重復最為豐富,這種差異可能與SSR位點進化速率不同、設定的檢索參數(shù)以及樣品來源有關(Chen et al.,2018;李延龍等,2020;梅瑜等,2021)。轉(zhuǎn)錄因子是一類能夠特異結(jié)合DNA且調(diào)節(jié)轉(zhuǎn)錄的蛋白質(zhì)(劉強等,2000)。本研究鑒定出的1 874個轉(zhuǎn)錄因子中,C3H、bZIP、bHLH及MYB-related轉(zhuǎn)錄因子家族在皺邊喉毛花中數(shù)量較多,豐富了喉毛花屬的轉(zhuǎn)錄因子信息。MYB-related作為植物中最大的轉(zhuǎn)錄因子家族,參與調(diào)控植物的生長發(fā)育、次生代謝及逆境脅迫等生物學過程(陳清等,2009)。在關于MYB轉(zhuǎn)錄因子家族的研究中,前人已證實該基因家族能夠提高植物的耐寒能力,促進果實著色,并在鹽脅迫調(diào)控中發(fā)揮重要作用(Allan et al.,2008;Dubos et al.,2010;Jaakola,2013;陳娜等,2015)。bZIP 轉(zhuǎn)錄因子作為真核生物轉(zhuǎn)錄因子中分布最廣、最保守的一類轉(zhuǎn)錄因子,參與植物的生長發(fā)育、光信號轉(zhuǎn)導、生物和非生物脅迫應答(楊穎等,2009)。已有研究證實bZIP轉(zhuǎn)錄因子家族能夠增強擬南芥抗旱能力,并參與其低溫、高鹽等脅迫的應答反應(Choi et al.,2000;Kang et al.,2002)。bHLH作為植物中最大的轉(zhuǎn)錄因子家族之一,在細胞發(fā)育和細胞活性中發(fā)揮著重要作用,并參與植物中次級代謝產(chǎn)物合成相關基因表達的調(diào)控,如類黃酮、花青素等次級代謝物(Gonzalez et al.,2008;張全琪等,2011;Zhao et al.,2013)。MYB-related和bZIP轉(zhuǎn)錄因子家族與植物的非生物脅迫相關,皺邊喉毛花主要分布在青藏高原地區(qū),該地區(qū)氣溫低,晝夜溫差大,這些轉(zhuǎn)錄因子家族是否參與皺邊喉毛花的響應脅迫應答反應,還需進一步研究。LncRNAs是一類長度超過200 nt、能夠調(diào)控基因的表達、參與多個生物學過程和通路的長非編碼RNA(Wan et al.,2019)。本研究共預測到15 166個LncRNAs,豐富了喉毛花屬植物的長非編碼RNA信息,為后續(xù)進一步探索LncRNA在喉毛花屬植物中的具體生物功能及作用機制提供了數(shù)據(jù)支持。

      本研究利用PacBio測序平臺對皺邊喉毛花進行了測序及拼接。獲得的大量測序數(shù)據(jù)用于功能注釋、可變剪切分析、SSR分析、轉(zhuǎn)錄因子分析及長非編碼RNA預測等。通過與KEGG的比對,篩選出藥用相關成分合成相關的代謝通路和轉(zhuǎn)錄本,為皺邊喉毛花藥用成分合成相關的關鍵基因的篩選提供重要的遺傳資源。

      參考文獻:

      ALLAN AC, HELLENSE RP, LAING WA, 2008. MYB transcription factors that colour our fruit [J]. Trends Plant Sci, 13(3): 99-102.

      ASHBURNER M, BALL CA, BLAKE JA, et al., 2000. Gene Ontology: tool for the unification of biology [J]. Nat Genet, 25(1): 25-29.

      BEIER S, THIEL T, MNCH T, et al., 2017. MISA-web: a web server for microsatellite prediction [J]. Bioinformatics, 33(16): 2583-2585.

      BLAKE JA, HARRIS MA, 2008. The Gene Ontology (GO) project: structured vocabularies for molecular biology and their application to genome and expression analysis [J]. Curr Protoc Bioinf, 23(1): 721-729.

      CHEN J, TANG XH, REN CX, et al., 2018. Full-length transcriptome sequences and the identification of putative genes for flavonoid biosynthesis in safflower [J]. BMC Genomics, 19(1): 548.

      CHEN N, CHI XY, PAN LJ, et al., 2015. Advances in MYB transcription factors during salt-stress regulation in plants [J]. Plant Physiol J, 51(9): 1395-1399.? [陳娜,? 遲曉元,? 潘麗娟,? 等,? 2015. MYB轉(zhuǎn)錄因子在植物鹽脅迫調(diào)控中的研究進展 [J]. 植物生理學報,? 51(9):? 1395-1399.]

      CHEN Q, TANG HR, DONG XL, et al., 2009. Progress in the study of plant MYB transcription factors [J]. Genomics Appl Biol, 28(2): 365-372.? [陳清,? 湯浩茹,? 董曉莉,? 等,?? 2009. 植物Myb轉(zhuǎn)錄因子的研究進展 [J]. 基因組學與應用生物學,? 28(2):? 365-372.]

      CHOI H, HONG J, HA J, et al., 2000. ABFs a family of ABA-responsive element binding factors [J]. J Biol Chem, 275(3): 1723-1730.

      CONNOLLY MA, CLAUSEN PA, LAZAR JG, 2006. Preparation of RNA from plant tissue using trizol [J]. Cold Spring Harb Protoc, 2006(1): pdb.prot4105. DOI: 10.1101/pdb.prot4105.

      DENG YY, LI JQ, WU SF, et al., 2006. Integrated NR database in protein annotation system and its localization [J]. Comp Eng, 32(5): 71-74.

      DONG TJ, CUI YL, TIAN JS, et al., 2011. Advances of studies on natural iridoids [J]. Chin Trad Herb Drugs, 42(1): 185-194.? [董天驕,? 崔元璐,? 田俊生,? 等,? 2011. 天然環(huán)烯醚萜類化合物研究進展 [J]. 中草藥,? 42(1):? 185-194.]

      DUBOS C, STRACKE R, GROTEWOLD E, et al., 2010. MYB transcription factors in Arabidopsis [J]. Trends Plant Sci, 15(10): 573-581.

      FINN RD, BATEMAN A, CLEMENTS J, et al., 2014. Pfam: the protein families database [J]. Nucl Acid Res, 42(D1): D222-D230.

      FU LM, NIU BF, ZHU ZW, et al., 2012. CD-Hit: Accelerated for clustering the next-generation sequencing data [J]. Bioinformatics, 28(23): 3150-3152.

      GONZALEZ A, ZHAO MZ, LEAVITT JM, et al., 2008. Regulation of the anthocyanin biosynthetic pathway by the TTG1/bHLH/MYB transcriptional complex in Arabidopsis seedlings [J]. Plant J, 53(5): 814-827.

      HO TN, LIU SW, 2001. A worldwide monograph of Gentiana [M]. Beijing: Science Press.

      HO TN, LIU SW, 2015. A worldwide monograph of Swertia and its allies [M]. Beijing: Science Press.

      HOSTETLER GL, RALSTON RA, SCHWARTZ SJ, 2017. Flavones: food sources, bioavailability, metabolism, and bioactivity [J]. Adv Nutr, 8(3): 423-435.

      JAAKOLA L, 2013. New insights into the regulation of anthocyanin biosynthesis in fruit [J]. Trends Plant Sci, 18(9): 477-483.

      KANG JY, CHOI HI, IM MY, et al., 2002. Arabidopsis basic leucine zipper proteins that mediate stress-responsive abscisic acid signaling [J]. Plant Cell, 14(2): 343-357.

      KANG YJ, YANG DC, KONG L, et al., 2017. CPC2: A fast and accurate coding potential calculator based on sequence intrinsic features [J]. Nucl Acid Res, 45(W1): W12-W16.

      KOONIN EV, FEDOROVA ND, JACKSON JD, et al., 2004. A comprehensive evolutionary classification of proteins encoded in complete eukaryotic genomes [J]. Genome Biol, 5(2): R7.

      LI AM, ZHANG JY, ZHOU ZY, 2014. PLEK: a tool for predicting long non-coding RNAs and messenger RNAs based on an improved k-mer scheme [J]. BMC Bioinf, 15: 311.

      LI J, HARATA-LEE Y, DENTON MD, et al., 2017. Long read reference genome-free reconstruction of a full-length transcriptome from Astragalus membranaceus reveals transcript variants involved in bioactive compound biosynthesis [J]. Cell Discov, 3: 17031.

      LI YL, ZHANG HM, CUI YG, et al., 2020. Analysis on SSR information in full-length transcriptome and development of molecular markers in Allium tuberosum [J]. Acta Hortic Sin, 47(4): 759-768.? [李延龍,? 張華敏,? 崔蘊剛,? 等,? 2020. 韭菜全長轉(zhuǎn)錄組SSR信息分析及分子標記開發(fā) [J]. 園藝學報,? 47(4):? 759-768.]

      LIU JQ, HE TN, 1996. The embryological studies of Comastoma pulmonarium (Gentianaceae) [J]. Acta Phytotaxon Sin, 34(6): 577-585.? [劉建全,? 何廷農(nóng),? 1996. 喉毛花的胚胎學研究 [J]. 植物分類學報, 34(6): 577-585.]

      LIU Q, ZHANG GY, CHEN SY, 2000. The structure and regulatory role of plant transcription factors [J]. Chin Sci Bull, 45(14): 1465-1474. [劉強,張貴友,陳受宜,2000. 植物轉(zhuǎn)錄因子的結(jié)構(gòu)與調(diào)控作用 [J].? 科學通報, 45(14): 1465-1474.]

      LIU Z, QI YY, WU HY, et al., 2021. Chemical constituents of Tibetan medicine Comastoma pedunculatum whole herb [J]. J Chin Med Mat, 44(6): 1397-1404.? [劉真,? 祁艷艷,? 吳海燕,? 等,? 2021. 藏藥長梗喉毛花的活性成分研究 [J]. 中藥材,? 44(6):? 1397-1404.]

      LIU XC, ZHAO Y, ZENG QY, et al., 2016. Determination of five effective components in Comastoma pulmonarium by HPLC [J]. Chin J Trad Chin Med Pharm, 31(9): 3760-3762.? [劉小翠,? 趙英,? 曾擎屹,? 等, 2016. HPLC法測定喉毛花植物中5種有效成分的含量 [J]. 中華中醫(yī)藥雜志,? 31(9):? 3760-3762.]

      MEI Y, LI XR, CAI SK, et al., 2021. Full-length transcriptome analysis of a homology of medicine and food of Pueraria thomsonii [J]. Acta Agric Boreal-Sin, 36(5): 10-17.?? [梅瑜,? 李向榮,? 蔡時可,? 等,? 2021. 藥食同源植物甘葛藤的全長轉(zhuǎn)錄組分析 [J]. 華北農(nóng)學報,? 36(5):? 10-17.]

      MINORU K, SUSUMU G, SHUICHI K, et al., 2004. The KEGG resource for deciphering the genome [J]. Nucl Acid Res, 32(Database issue): D277-D280.

      QIAO YQ, CUI BS, TANG L, et al., 2012. Chemical constituents of n-BuOH extract of Comastoma pedunculatum [J]. Chin J Chin Mat Med, 37(16): 2360-2365.? [喬涌起,? 崔保松,? 唐麗,? 等,? 2012. 長梗喉毛花正丁醇部位化學成分研究 [J]. 中國中藥雜志,? 37(16):? 2360-2365.]

      SALMELA L, RIVALS E, 2014. LoRDEC: Accurate and efficient long read error correction [J]. Bioinformatics, 30(24): 3506-3514.

      SUN L, LUO HT, BU DC, et al., 2013. Utilizing sequence intrinsic composition to classify protein-coding and long non-coding transcripts [J]. Nucl Acid Res, 41(17): e166.

      TANG L, JIN ZN, MEN MJ, et al., 2007. Recent progress and utilization of tibetan medicine Zangyinchen [J]. J CUN (Nat Sci Ed), 2(16): 176-178.? [唐麗,? 金振南,? 門美佳,? 等,? 2007. 藏藥藏茵陳的研究進展及開發(fā)利用 [J]. 中央民族大學學報(自然科學版),? 2(16):? 176-178.]

      TATUSOV RL, FEDOROVA ND, JACKSON JD, et al., 2003. The COG database: an updated version includes eukaryotes [J]. BMC Bioinf, 4: 41.

      THOLL D, 2015. Biosynthesis and biological functions of terpenoids in plants [J]. Adv Biochem Eng Biotechnol, 148: 63-106.

      WAN HF, JIA XW, ZOU PF, et al., 2019. The single-molecule long-read sequencing of Scylla paramamosain [J]. Sci Rep, 9(1): 1-11.

      WANG B, TSENG E, REGULSKI M, et al., 2016. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing [J]. Nat Commun, 7: 11708.

      WANG RX, LI C, 2019. Application of full-length transcriptome sequencing in non-model plant transcriptome research [J]. Mol Plant Breed, 17(2): 502-508.? [王瑞嫻,? 李川,? 2019. 全長轉(zhuǎn)錄組測序技術(shù)在非模式植物轉(zhuǎn)錄組學研究中的應用 [J]. 分子植物育種,? 17(2):? 502-508.]

      XIE DM, YU NJ, HUANG LQ, et al., 2017. Next generation sequencing and transcriptome analysis of root bark from Paeonia suffruticosa cv. Feng Dan [J]. Chin J Chin Mat Med, 42(15): 2954-2961.? [謝冬梅,? 俞年軍,? 黃璐琦,? 等,? 2017. 基于高通量測序的藥用植物“鳳丹”根皮的轉(zhuǎn)錄組分析 [J]. 中國中藥雜志,? 42(15):? 2954-2961.]

      XU JH, ZENG Q, YE FY, et al., 2021. Genetic relationship of Populus qiongdaoensis in Populus based on full-length transcriptome sequences, nuclear genes and chloroplast genes [J]. J Beijing For Univ, 43(10): 28-37.? [徐家洪,? 曾晴,? 葉富余,? 等,? 2021. 基于全長轉(zhuǎn)錄組序列、核基因與葉綠體基因分析瓊島楊在楊屬的親緣關系 [J]. 北京林業(yè)大學學報,? 43(10):? 28-37.]

      XU ZC, PETERS RJ, WEIRATHER J, et al., 2015. Full-length transcriptome sequences and splice variants obtained by a combination of sequencing platforms applied to different root tissues of Salvia miltiorrhiza and tanshinone biosynthesis [J]. Plant J, 82(6): 951-961.

      YAN X, LIU HQ, ZOU YQ, et al., 2008. Physiological activity and research advance in synthesis of flavonoids [J]. Chin J Org Chem, 28(9): 1534-1544.? [延璽,? 劉會青,? 鄒永青,? 等,? 2008. 黃酮類化合物生理活性及合成研究進展 [J]. 有機化學,? 28(9):? 1534-1544.]

      YANG QS, ZHAO Y, ZHANG HH, et al., 2013. Geographic distribution and utilization of the gentianaceae endemic Zangyinchen medicinal plant in northwest Yunnan [J]. J Yunnan Minzu Univ (Nat Sci Ed), 22(3): 176-181.? [楊青松,? 趙艷,? 張海浩,? 等,? 2013. 龍膽科藏茵陳類民族藥原植物在滇西北的地理分布與資源利用 [J]. 云南民族大學學報 (自然科學版),? 22(3):? 176-181.]

      YANG Y, GAO SQ, TANG YM, et al., 2009. Advance of bZIP transcription factors in plants [J]. J Trit Crop, 29(4): 730-737.? [楊穎,? 高世慶,? 唐益苗,? 等,? 2009. 植物bZIP轉(zhuǎn)錄因子的研究進展 [J]. 麥類作物學報,? 29(4):? 730-737.]

      YU JY, XIA MZ, XU H, et al., 2022. Comparative transcriptome analysis of three Artemisia species in Qinghai Tibet Plateau [J]. Bull Bot Res, 42(2): 200-210.? [余靜雅,? 夏銘澤,? 徐浩,? 等,? 2022. 青藏高原地區(qū)3種蒿屬植物轉(zhuǎn)錄組比較分析 [J]. 植物研究,? 42(2):? 200-210.]

      ZHAO L, GAO LP, WANG HX, et al., 2013. The R2R3-MYB, bHLH, WD40, and related transcription factors in flavonoid biosynthesis [J]. Funct Integr Genomics, 13(1): 75-98.

      ZHAO LY, CAO SY, LONG YS, et al., 2019. Applications and research progresses of full-length transcriptome sequencing in plants [J]. J Plant Genet Resour, 20(6): 1390-1398.? [趙陸滟,? 曹紹玉,? 龍云樹,? 等,? 2019. 全長轉(zhuǎn)錄組測序在植物中的應用研究進展 [J]. 植物遺傳資源學報,? 20(6):? 1390-1398.]

      ZHAO XY, WANG Q, YANG S, et al., 2020. The transcriptome sequencing and analysis of the medicinal plant Apocynum venetum [J]. Mol Plant Breed, 18(8): 2503-2511.? [趙雪艷,? 王琪,? 楊莎,? 等,? 2020. 藥用植物羅布麻的轉(zhuǎn)錄組測序及分析 [J]. 分子植物育種,? 18(8):? 2503-2511.]

      ZHANG C, HU LJ, WANG Y, 2014. Reproductive allocation of three sympatric Comastoma (Gentianaceae) species [J]. Guihaia, 34(1): 38-45.? [張嬋,? 胡莉娟,? 王赟,? 2014. 三種同域分布喉毛花的繁殖分配 [J]. 廣西植物,? 34(1):? 38-45.]

      ZHANG JC, 2020. Identification and functional analysis of candidate genes foe seed shattering in Elymus sibiricus based on transcriptome sequencing [D]. Lanzhou: Lanzhou University: 1-2.? [張俊超,? 2020. 基于轉(zhuǎn)錄組測序挖掘老芒麥落粒候選基因及其功能分析 [D]. 蘭州: 蘭州大學: 1-2.]

      ZHANG N, SUN GL, DAI JG, et al., 2013. Sequencing and analysis of the transcriptome of Ginkgo biloba L. cells [J]. Chin Biotechnol, 33(5): 112-119.? [張楠,? 孫桂玲,? 戴均貴,? 等,? 2013. 銀杏細胞轉(zhuǎn)錄組高通量測序及分析 [J]. 中國生物工程雜志,? 33(5):? 112-119.]

      ZHANG QQ, ZHU JH, NI YM, et al., 2011. The structure and function of plant bHLH transcription factors [J]. J Trop Subtrop Bot, 19(1): 84-90.? [張全琪,? 朱家紅,? 倪燕妹, ?等,? 2011. 植物bHLH轉(zhuǎn)錄因子的結(jié)構(gòu)特點及其生物學功能 [J]. 熱帶亞熱帶植物學報,? 19(1):? 84-90.]

      ZHANG Y, XIA MZ, ZHANG FQ, 2020. Transcriptome analysis for medicinal plant Anisodus tanguticus [J]. Bull Bot Res, 40(3): 458-467.? [張雨,? 夏銘澤,? 張發(fā)起,? 2020. 藥用資源植物山莨菪的轉(zhuǎn)錄組信息分析 [J]. 植物研究,? 40(3):? 458-467.]

      ZHANG Y, YU JY, XIA MZ, et al., 2021. Plastome sequencing reveals phylogenetic relationships among Comastoma and related taxa (Gentianaceae) from the Qinghai-Tibetan Plateau [J]. Ecol Evol, 11(22): 16034-16046.

      ZHANG ZJ, LIU YR, ZHANG SJ, et al., 2020. The principle of the third generation sequencing technology and its application in biological field [J]. Chin J Anim Sci, 56(6): 11-15.? [張子敬,? 劉燕蓉,? 張順進,? 等,? 2020. 第三代測序技術(shù)的方法原理及其在生物領域的應用 [J]. 中國畜牧雜志,? 56(6):? 11-15.]

      ZHENG Y, JIAO C, SUN HH, et al., 2016. ITAK: A program for genome-wide prediction and classification of plant transcription factors, transcriptional regulators, and protein kinases [J]. Mol Plant, 9(12): 1667-1670.

      ZHONG GY, WANG CH, LIU X, et al., 2010. The resources and usage status of the commonly used Tibetan medicinal crop“Dida” [J]. World Sci Technol-Mod Trad Chin, 12(1): 122-128.? [鐘國躍,? 王昌華,? 劉翔,? 等,? 2010. 常用藏藥“蒂達(藏茵陳)”的資源與使用現(xiàn)狀調(diào)查 [J]. 世界科學技術(shù):? 中醫(yī)藥現(xiàn)代化,? 12(1):? 122-128.]

      ZHU FY, CHEN MX, YE NH, et al., 2017. Proteogenomic analysis reveals alternative splicing and translation as part of the abscisic acid response in Arabidopsis seedlings [J]. Plant J, 91(3): 518-533.

      ZHU XZ, XIA LF, CHEN LB, et al., 2018. Full-length transcriptome analysis of protected cultivation ‘Yuncha 1 (Camellia sinensis var. assamica) [J]. J Tea Sci, 38(2): 193-201.? [朱興正,? 夏麗飛,? 陳林波,? 等,? 2018. 保護品種云茶1 號茶樹全長轉(zhuǎn)錄組測序分析 [J]. 茶葉科學,? 38(2): 193-201.]

      (責任編輯 鄧斯麗)

      猜你喜歡
      轉(zhuǎn)錄因子
      番茄花器官發(fā)育相關轉(zhuǎn)錄因子的研究進展
      人RAG2基因5′近端染色質(zhì)結(jié)構(gòu)定量差異分析及可接近區(qū)域轉(zhuǎn)錄調(diào)控機制研究
      與植物種子油脂合成相關的MADS—box轉(zhuǎn)錄因子研究進展
      求知導刊(2016年34期)2017-03-02 18:25:25
      NF—κB信號通路抗肝纖維化的研究進展
      植物Trihelix轉(zhuǎn)錄因子家族的分類、結(jié)構(gòu)和功能研究進展
      轉(zhuǎn)錄因子Foxd3、Sox2在宮頸上皮內(nèi)瘤樣病變中的表達臨床意義
      栽培小麥Brock中轉(zhuǎn)錄因子基因WRKY的克隆與表達分析
      DREB轉(zhuǎn)錄因子及其在植物抗逆育種中的應用進展
      水稻滲透脅迫抑制表達基因的克隆與表達分析
      蘋果TCP轉(zhuǎn)錄因子家族生物信息學分析
      三亚市| 开封市| 仪陇县| 和政县| 徐水县| 灵寿县| 青铜峡市| 许昌市| 磴口县| 新田县| 长治市| 井研县| 长白| 兴海县| 石林| 甘肃省| 雷州市| 湖南省| 佛山市| 青龙| 扶风县| 仁寿县| 安新县| 西盟| 余江县| 长寿区| 建德市| 运城市| 娱乐| 渝北区| 肥西县| 遵化市| 南陵县| 普格县| 禹州市| 岗巴县| 分宜县| 延川县| 武宁县| 台南县| 清丰县|