秦煜 鄭向麗 林鐘員
摘 要:為了解紅萍在不同氮濃度脅迫下紅萍轉(zhuǎn)錄組中SSR、SNP分子標(biāo)記的詳細(xì)情況,分析轉(zhuǎn)錄組數(shù)據(jù)中分布的SSR和SNP位點(diǎn)。通過提取紅萍根和葉的RNA,構(gòu)建cDNA文庫并利用二代測序平臺進(jìn)行高通量測序,利用MISA對測序數(shù)據(jù)進(jìn)行SSR特征分析,同時采用軟件STAR進(jìn)行比對并通過GATK進(jìn)行SNP識別。結(jié)果表明:紅萍轉(zhuǎn)錄組共有9 009個SSR位點(diǎn),SSR位點(diǎn)頻率為30.12%。其中,以三核苷酸重復(fù)和單核苷酸重復(fù)為主,分別占總比例的43.66%和26.41%。SNP位點(diǎn)有439 217個,包括轉(zhuǎn)換類型(282 532個)和顛換類型(156 685個);轉(zhuǎn)換類型占比(64.33%)顯著大于顛換類型(35.67%)。C/T在所有變異類型中所占比率最高,占總量的17.33%;G/A 位居其次(17.01%)。紅萍轉(zhuǎn)錄組SSR和SNP位點(diǎn)豐富,可為紅萍遺傳多樣性、遺傳結(jié)構(gòu)與分化以及功能基因的開發(fā)利用等研究提供依據(jù)。關(guān)鍵詞:紅萍;轉(zhuǎn)錄組;SSR;SNP
中圖分類號:S 511.41 ??文獻(xiàn)標(biāo)志碼:A?? 文章編號:0253-2301(2023)06-0044-05
DOI: 10.13651/j.cnki.fjnykj.2023.06.006
Characteristic Analysis of SSR and SNP in Azolla imbircata Basedon Transcriptome Sequencing
QIN Yu1,2, ZHENG Xiang-li3, LIN Zhong-yuan1,4*
(1. College of Geography and Oceanography, Minjiang University, Fuzhou, Fujian 350002, China;
2. College of Future Technology, Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China;
3. Institute of Agricultural Ecology, Fujian Academy of Agricultural Sciences, Fuzhou, Fujian 350002, China;
4. Fuzhou Technological Innovation Center of Seawater Planting Industry, Fuzhou, Fujian 350002, China)
Abstract: In order to understand the detailed information of SSR and SNP molecular markers in the transcriptome of Azolla imbircata under different nitrogen concentration stress, the SSR and SNP loci distributed in the transcriptomic data were analyzed. By extracting RNA from the roots and leaves of Azolla imbircata, the cDNA library was constructed and the high-throughput sequencing was performed using the next generation sequencing platform. The SSR characteristics of the sequencing data were analyzed using MISA, and the software STAR was used for the comparison and the SNP identification was performed by GATK. The results showed that: there were a total of 9009 SSR loci in the transctiptome group of Azolla imbircata, and the frequency of SSR loci was 30.12%. Among them, the trinucleotide and mononucleotide repeats were the two most SSR type, which accounted for 43.66% and 26.41% of the total repeats, respectively. There were 439217 SNP loci, including the conversion types (282532) and transversion types (156685). The proportion of conversion types (64.33%) was significantly higher than that of transversion types (35.67%). Among all the variation types, C/T had the highest proportion, accounting for 17.33% of the total SNP loci, followed by G/A with 17.01%. The transcription group of Azolla imbircata had abundant SSR and SNP loci, which could provide a basis for the study of genetic diversity and the genetic structure and differentiation, as well as the development and utilization of functional genes.
Key words: Azolla imbircata; transcriptome group; SSR; SNP
紅萍,也稱為滿江紅,是一種小型水生浮游蕨類植物,它的葉腔內(nèi)共生著固氮的魚腥藻,具有高效的固氮能力。它起源于晚白堊紀(jì)之前,在植物進(jìn)化上處在獨(dú)特的位置[1];同時,也是地球上生長最快的植物之一,是潛在的重要碳匯[2]。在最佳生長狀態(tài)時,紅萍的倍殖時間僅為2~5 d[3]。紅萍既能無性繁殖,又能有性繁殖,孢子果作為紅萍的有性器官,一般在一定的季節(jié)交替時期生成[4]。紅萍具有重要經(jīng)濟(jì)價值和生態(tài)效益,比如作為人類的食物、動物的飼料、農(nóng)田中重要生物肥料,以及可應(yīng)用于藥物生產(chǎn)、沼氣生產(chǎn)和水體凈化等[5]。紅萍特別是在家畜飼料的潛在應(yīng)用價值方面?zhèn)涫苻r(nóng)業(yè)界的關(guān)注[6-7]。福建省農(nóng)業(yè)科學(xué)院建設(shè)有國家紅萍種質(zhì)資源圃,保存著來自世界各地紅萍種質(zhì),共有500多份。但是,很少有對紅萍種質(zhì)遺傳結(jié)構(gòu)方面、基因功能開發(fā)等的研究。紅萍主要為無性繁殖,新老品種數(shù)量繁多且易混雜,實(shí)際應(yīng)用中有時對一些品種混雜及親本無法區(qū)分和判斷。陳堅等[8]指出解決紅萍系統(tǒng)學(xué)問題需要分子生物學(xué)技術(shù)手段。SSR和SNP分子標(biāo)記對于種質(zhì)資源鑒定和遺傳多樣性分析尤為有效。因此,十分有必要挖掘可用于紅萍種質(zhì)分類鑒定的SSR和SNP分子標(biāo)記。雖然細(xì)綠萍基因組已經(jīng)被解析,但其他紅萍品種的基因組仍未見報道[2]。紅萍在分子生物學(xué)水平的研究報道較少,其組學(xué)研究也相對滯后。迄今為止,紅萍轉(zhuǎn)錄組應(yīng)用在孢子果誘導(dǎo)[9-10]、共生關(guān)系[2, 11]、激素信號[12-13]、維管結(jié)構(gòu)發(fā)育[14]、高氮脅迫[15]等挖掘候選基因研究。Coppenolle等[16]應(yīng)用隨機(jī)引物擴(kuò)增多態(tài)性DNA (RAPD)分析25個紅萍的系統(tǒng)關(guān)系;Pereira等[17]開發(fā)了RAPD分子標(biāo)記區(qū)分不同紅萍品種;Sood等[18]利用RFLP構(gòu)建可靠的指紋圖譜鑒別不同的紅萍品種;鐘珍梅等[19]利用ISSR分子標(biāo)記對雜交紅萍后代進(jìn)行鑒定分析。雖有上述紅萍的分子標(biāo)記研究報道,但至今尚未有通過轉(zhuǎn)錄組測序分析紅萍SSR和SNP分布特征的研究報道。其他蕨類植物轉(zhuǎn)錄組挖掘分子標(biāo)記研究值得借鑒。比如,Mossion等[20]研究報道了蕨類植物扇羽陰地蕨轉(zhuǎn)錄組范圍的SNP分析其倍性及遺傳結(jié)構(gòu)。Yang等[21]研究報道了SSR分子標(biāo)記可用于研究所有水蕨居群的遺傳變異及其地理分布模式。本研究基于前期工作中對紅萍在不同濃度氮脅迫的轉(zhuǎn)錄組數(shù)據(jù),使用MISA(MIcroSAtellite identification tool)軟件和GATK2分別鑒定所有轉(zhuǎn)錄組中的SSR和SNP位點(diǎn)信息,分析其分布及組成特征,將為今后紅萍遺傳多樣性、遺傳結(jié)構(gòu)與分化以及功能基因的開發(fā)利用等研究提供依據(jù)。
1 材料與方法
1.1 轉(zhuǎn)錄組測序數(shù)據(jù)
材料來自福建省農(nóng)業(yè)科學(xué)院國家紅萍種質(zhì)資源圃,供試紅萍品種為覆瓦狀滿江紅500。培養(yǎng)溫度25℃光照14 h/溫度18℃黑暗10 h。材料分別用含0、30和90 mg·L-1的總氮濃度(利用NH4NO3配制)處理5 d后,分別采集葉和根,液氮速凍后超低溫冰箱保存。提取紅萍RNA,構(gòu)建測序文庫,利用Illumina平臺測序。去冗余后的Clean data利用Trinity(https://github.com/trinityrnaseq/trinityrnaseq/wiki)以De novo組裝策略進(jìn)行組裝,獲得Unigene序列
[22]。
1.2 SSR和SNP分析方法
通過MISA(MIcroSAtellite identification tool)工具對篩選得到的1 kb以上的Unigene搜索SSR位點(diǎn)。按重復(fù)類型分類,可分為:單核苷酸重復(fù)、二核苷酸重復(fù)、三核苷酸重復(fù)、四核苷酸重復(fù)、五核苷酸重復(fù)和六核苷酸重復(fù)6種類型。
利用Picard-tools v1.41和samtools v0.1.18整理去除重復(fù)序列和融合比對的每個樣本bam,并通過GATK2對變異位點(diǎn)的功能、位置和突變類型統(tǒng)計,識別SNP位點(diǎn)[23]。
2 結(jié)果與分析
2.1 紅萍轉(zhuǎn)錄組測序及SSR檢索結(jié)果
完成了18個紅萍樣品的轉(zhuǎn)錄組測序,獲得118.29 Gb Clean data,Q30堿基百分比在94%以上。組裝共得到100 043條Unigene,其中長度在1 kb以上的Unigene有29 907條。Unigene的N50為1 634 bp,組裝完整性較高?;赨nigene庫的基因結(jié)構(gòu)分析,其中SSR分析共獲得9 009個SSR標(biāo)記。
2.2 紅萍轉(zhuǎn)錄組SSR特征分析
2.2.1 紅萍轉(zhuǎn)錄組SSR位點(diǎn)數(shù)量與密度分布 由表1可知,從紅萍轉(zhuǎn)錄組中SSR重復(fù)類型分析結(jié)果看,9 009個SSR中,以三核苷酸重復(fù)型SSR數(shù)最多,達(dá)3 933個,占總比例為43.66%,出現(xiàn)頻率為13.15%;其次為單核苷酸重復(fù),占總比例為26.41%,出現(xiàn)頻率為7.95%。
由圖1可知,從紅萍轉(zhuǎn)錄組SSR基序類型分布看,不同類型的SSR密度分布不同。經(jīng)篩選后的1 kb以上的Unigene序列長度共有61 Mb。本研究發(fā)現(xiàn)三核苷酸重復(fù)型SSR密度最高,為64.48%,核苷酸重復(fù)型SSR密度次之,為39.00%,而五核苷酸和六核苷酸重復(fù)型SSR密度最低,均為0.30%。
2.2.2 紅萍轉(zhuǎn)錄組SSR基序重復(fù)類型和長度 由表2可知,紅萍轉(zhuǎn)錄組中SSR重復(fù)數(shù)主要分布為5~23次,其中集中在5~15次的SSR占比為99.39%,且重復(fù)數(shù)隨著基序核苷酸數(shù)的增加呈現(xiàn)下降趨勢,說明SSR重復(fù)數(shù)存在一定的分布特征。單核苷酸重復(fù)類型最多,有12種類型,重復(fù)數(shù)包括10~20和23,其中10次重復(fù)占比最高,占單核苷酸SSR位點(diǎn)的52.96%。核苷酸重復(fù)基序有6種重復(fù)單元長度,其中含23次重復(fù)。
由圖2可知,紅萍轉(zhuǎn)錄組SSR位點(diǎn)序列長度分布在10~222 bp,其中長度在10~14 bp的SSR位點(diǎn)有3 521個,長度在15~19 bp的有4 351個,長度在20~29 bp有697個,長度在30~49 bp的有130個,長度在50~100 bp的有185個,長度>100 bp僅有125個,占比分別為39.08%、48.30%、7.74%、1.44%、2.05%、1.39%(圖2)。其中,SSR長度為15 bp的位點(diǎn)數(shù)量最多,占總位點(diǎn)的28.64%;長度為18 bp的SSR位點(diǎn)數(shù)量次之,占總位點(diǎn)的15.18%。
2.3 紅萍轉(zhuǎn)錄組SNP位點(diǎn)分析
由圖3可知,對紅萍100 043條序列進(jìn)行SNP位點(diǎn)識別,成功搜索到SNP位點(diǎn)439 217個,包括282 532個轉(zhuǎn)換類型和156 685個顛換類型;轉(zhuǎn)換類型(64.33%)顯著大于顛換類型(35.67%)。C/T在所有變異類型中所占比率最高,占總量的17.33%;G/A 位居其次(17.01%),且這兩種變異均屬于轉(zhuǎn)換類型。在顛換類型中,A/T所占比例最高,占總量的4.59%;A/C 所占比例最低,占總量的4.20%。
3 討論與結(jié)論
隨著測序技術(shù)的發(fā)展,新一代測序技術(shù)為更多物種的基因組研究提供了可能。測序產(chǎn)生的大量數(shù)據(jù)為挖掘SSR和SNP等分子標(biāo)記提供了寶貴的資源。本研究利用MISA軟件對不同濃度氮脅迫紅萍轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,檢測到了9 009個SSR位點(diǎn)。在紅萍轉(zhuǎn)錄組SSR類型中,三核苷酸重復(fù)類型所占的比例最大(43.66%)。三核苷酸重復(fù)基序是蕨類植物芒萁的主要SSR基序[24],紅萍的該核苷酸重復(fù)基序情況與芒萁類似。三核苷酸重復(fù)基序含量最高的原因可能是相較于其他的重復(fù)類型更加穩(wěn)定,因?yàn)槊?個堿基對應(yīng)翻譯成1個氨基酸,生物體為保證蛋白質(zhì)結(jié)構(gòu)的穩(wěn)定性,使得序列極少發(fā)生移碼突變[25]。SSR多態(tài)性高低進(jìn)行分類,SSR序列長度小于12 bp其多態(tài)性極低,SSR序列長度在12~19 bp其多態(tài)性中等,SSR序列長度大于等于20 bp其多態(tài)性較高[26]。SSR多態(tài)性的高低是評價其可作為分子標(biāo)記的標(biāo)準(zhǔn),而SSR長度是影響SSR多態(tài)性的主要因素。紅萍的SSR序列長度在15~19 bp的比例為48.30%,推測本研究紅萍轉(zhuǎn)錄組SSR多態(tài)性屬于中等,表明后續(xù)開發(fā)分子標(biāo)記具有較大的應(yīng)用潛力。
通過對紅萍轉(zhuǎn)錄組SNP分析發(fā)現(xiàn),含有439 217個SNP位點(diǎn),并且轉(zhuǎn)換位點(diǎn)比顛換位點(diǎn)所占比例高。其中C/T轉(zhuǎn)換的比例最高,可能是C易于甲基化,脫氨后轉(zhuǎn)變成T,與前人研究一致。紅萍SNP 轉(zhuǎn)換概率約為顛換的1.80倍,小于理論值(轉(zhuǎn)換的概率:顛換的概率=0.5),屬于轉(zhuǎn)換偏差現(xiàn)象。類似情況在不少植物中也存在,最早在水稻中發(fā)現(xiàn)[27]。出現(xiàn)該現(xiàn)象可能與紅萍在水環(huán)境中進(jìn)化過程的選擇相關(guān)。
綜上,利用新一代高通量轉(zhuǎn)錄組測序技術(shù),開發(fā)紅萍SSR和SNP分子標(biāo)記不失為一種可行的方法。通過大數(shù)據(jù)篩選通用性高、覆蓋度廣的分子標(biāo)記,為紅萍種質(zhì)資源鑒定及功能基因的開發(fā)利用提供一定的理論依據(jù)。
參考文獻(xiàn):
[1]QIU YL, YU J.Azolla-a model organism for plant genomic studies[J].Genomics, Proteomics & Bioinformatics, 2003, 1(1):15-25.
[2]LI F W, BROUWER P, CARRETERO-PAULET L, et al.Fern genomes elucidate land plant evolution and cyanobacterial symbioses[J].Nature plants, 2018, 4(7):460-472.
[3]ZIMMERMAN W J.Biomass and pigment production in three isolates of Azolla II.Response to light and temperature stress[J].Annals of Botany, 1985, 56(5):701-709.
[4]唐龍飛, 鄭德英.我國紅萍育種概況及其展望[J].福建農(nóng)業(yè)學(xué)報, 1993, 8(1):40-43.
[5]WAGNER G M.Azolla: A review of its biology and utilization[J].Botanical Review, 1997, 63(1):1-26.
[6]KUMAR U, KUMAR A, UMAKANTA N, et al.Nutrient profiling and identification of genetic marker for Azolla sp[C]∥XXIII International Grassland Congress-IGC, 2015; 2015.
[7]KHARE A, CHATTERJEE A, MONDAL M, et al.Effect of supplementing Azolla microphylla on feed intake and blood parameters in growing crossbred female calves[J].Indian Journal of Animal Nutrition, 2016, 33(2):224-227.
[8]陳堅,徐國忠.滿江紅屬系統(tǒng)學(xué)研究的新進(jìn)展[J].植物學(xué)通報, 2001,18(4):485-489.
[9]BROUWER P, BRUTIGAM A, KLAHOGLU C, et al.Azolla domestication towards a biobased economy?[J].New Phytologist, 2014, 202(3):1069-1082.
[10]DIJKHUIZEN L W, TABATABAEI B E S, BROUWER P, et al.Far-Red Light-Induced Azolla filiculoides Symbiosis Sexual Reproduction: Responsive Transcripts of Symbiont Nostoc azollae Encode Transporters Whilst Those of the Fern Relate to the Angiosperm Floral Transition[J].Frontiers in Plant Science, 2021, 12:693039.
[11]EILY A N, PRYER KM, LI F-W.A first glimpse at genes important to the Azolla-Nostoc symbiosis[J].Symbiosis, 2019, 78(2):149-162.
[12]DE VRIES J, FISCHER A M, ROETTGER M, et al.Cytokinin-induced promotion of root meristem size in the fern Azolla supports a shoot-like origin of euphyllophyte roots[J].New Phytologist, 2016, 209(2):705-720.
[13]DE VRIES S, DE VRIES J, TESCHKE H, et al.Jasmonic and salicylic acid response in the fern Azolla filiculoides and its cyanobiont[J].Plant, Cell & Environment, 2018, 41(11):2530-2548.
[14]BROUWER P, BRUTIGAM A, BUIJS V A, et al.Metabolic Adaptation, a Specialized Leaf Organ Structure and Vascular Responses to Diurnal N2 Fixation by Nostoc azollae Sustain the Astonishing Productivity of Azolla Ferns without Nitrogen Fertilizer[J].Frontiers in Plant Science, 2017, 8:442.
[15]ZHENG X, LIN Z, LU J, et al.De novo transcriptome analysis reveals the molecular regulatory mechanism underlying the response to excess nitrogen in Azolla spp.[J].Aquatic Toxicology, 2022, 248:106202.
[16]COPPENOLLE BV, WATANABE I, HOVE CV, et al.Genetic diversity and phylogeny analysis of Azolla based on DNA amplification by arbitrary primers[J].Genome, 1993, 36(4):686-693.
[17]PEREIRA A L, MARTINS M, OLIVEIRA M M, et al.Morphological and genetic diversity of the family Azollaceae inferred from vegetative characters and RAPD markers[J].Plant Systematics and Evolution, 2011, 297:213-226.
[18]SOOD A, PRASANNA R, SINGH PK.Fingerprinting of freshly separated and cultured cyanobionts from different Azolla species using morphological and molecular markers[J].Aquatic Botany, 2008, 88(2):142-147.
[19]鐘珍梅,黃勤樓,黃毅斌,等. 7種紅萍的生物學(xué)特性研究與ISSR分子標(biāo)記[J]. 熱帶作物學(xué)報, 2011, 32(10):1873-1877.
[20]MOSSION V, DAUPHIN B, GRANT J, et al.Transcriptome-wide SNPs for Botrychium lunaria ferns enable fine-grained analysis of ploidy and population structure[J].Molecular Ecology Resources, 2022, 22(1):254-271.
[21]YANG X, LONG Z, GICHIRA A, et al.Development of microsatellite markers in the tetraploid fern Ceratopteris thalictroides (Parkeriaceae) using RAD tag sequencing[J].Genetics and Molecular Research, 2016, 15(15):gmr7550.
[22]GRABHERR M G, HAAS B J, YASSOUR M, et al.Full-length transcriptome assembly from RNA-Seq data without a reference genome[J].Nature Biotechnology, 2011, 29(7):644-652.
[23]MCKENNA A, HANNA M, BANKS E, et al.The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data[J].Genome Research, 2010, 20(9):1297-1303.
[24]劉麗婷,溫強(qiáng),黃小春,等.蕨類植物芒萁幼孢子體轉(zhuǎn)錄組高通量測序及特征分析[J].林業(yè)科學(xué)研究, 2016, 29(4):500-507.
[25]METZGAR D, BYTOF J, WILLS C.Selection against frameshift mutations limits microsatellite expansion in coding DNA[J].Genome Research, 2000, 10(1):72-80.
[26]TEMNYKH S, DECLERCK G, LUKASHOVA A, et al.Computational and experimental analysis of microsatellites in rice (Oryza sativa L.): frequency, length variation, transposon associations, and genetic marker potential[J].Genome Research, 2001, 11(8):1441-1452.
[27]MORTON B R.Neighboring base composition and transversion/transition bias in a comparison of rice and maize chloroplast noncoding regions[J].Proceedings of the National Academy of Sciences, 1995, 92(21):9717-9721.
(責(zé)任編輯:柯文輝)
收稿日期:2023-05-20
作者簡介:秦煜,男,1999年生,碩士研究生,主要從事水生植物分子生物學(xué)研究。
*通信作者:林鐘員,男,1988年生,博士,副教授,主要從事海藻、水生植物功能基因組學(xué)研究(E-mail:lzy2019@mju.edu.cn)。
基金項(xiàng)目:福建省自然科學(xué)基金項(xiàng)目(2020J01862)。