梅 瑜,徐世強(qiáng),顧 艷,孫銘陽,周 芳,李靜宇,張聞婷,王繼華
(廣東省農(nóng)業(yè)科學(xué)院作物研究所/廣東省農(nóng)作物遺傳改良重點實驗室/廣東省道地南藥資源保護(hù)與利用工程中心,廣東 廣州 510640)
【研究意義】藥用植物遺傳資源是優(yōu)良品種選育的基礎(chǔ)。近年來隨著市場需求的增長,導(dǎo)致野生資源枯竭、馴化栽培品種品質(zhì)參差不齊。利用高通量測序技術(shù)能夠精準(zhǔn)評價藥用資源,解析其藥用活性的合成途徑和調(diào)控機(jī)制,有利于藥用資源的保護(hù)和利用?!厩叭搜芯窟M(jìn)展】艾蒿(Artemisia argyi),是菊科蒿屬植物,多年生草本或略呈半灌木狀,具濃烈香氣,全草入藥,有溫經(jīng)、祛濕、散寒、止血、安胎、通經(jīng)活絡(luò)等功效。艾蒿中的揮發(fā)油類[1]、黃酮類、萜類、生物堿類、多糖類[2]等天然化學(xué)產(chǎn)物和大量微量元素[3],具有鎮(zhèn)咳平喘、殺菌消炎、益氣活血、溫經(jīng)活絡(luò)、抗氧化等功效[4],艾灸具有增強(qiáng)免疫力和抗炎作用。其黃酮的主要成分包括甲基黃酮類、槲皮素和柚皮素等[5]。胡倩等[6]利用AB-8 型大孔樹脂分離純化了艾葉總黃酮提取物(TFEFAA),采用HPLC分析獲得TFEFAA 的主要成分為棕矢車菊素和異澤蘭黃素,雖然其質(zhì)量分?jǐn)?shù)分別只有0.6%和0.20%,但能顯著增加SOD 酶、GSHPx 酶活力,且降低MDA 含量,能有效清除自由基和提高機(jī)體抗氧化能力。艾蒿還可作為天然的殺蟲劑、植物染料和飼料添加劑。艾蒿藥用功能顯著、價格低廉,因此在醫(yī)藥、農(nóng)業(yè)、工業(yè)等領(lǐng)域被廣泛利用,也受到學(xué)者們青睞。艾蒿品種較多,分布較為廣泛,藥用歷史悠久。梅全喜[7]記載艾蒿20 多種,紅足蒿(紅腳艾)是其中之一。三元宮碑文記載,1600 年前葛洪、鮑菇夫婦在羅浮山用紅腳艾為當(dāng)?shù)匕傩罩尾?,因此羅浮山紅腳艾在嶺南地區(qū)較有代表性,又稱“紅艾”“鮑姑艾”,別名神艾,與北艾、蘄艾同屬于菊科蒿屬艾草種植物。嶺南紅腳艾為菊科紅足蒿(Artemisia rubripesNakai),生長在陽光充足的田野,莖枝呈紫紅色,多有橫臥地下根狀莖伴匍匐生長,植株最高1 m 左右,香氣醇厚,基本為野生。紅腳艾常用于艾灸,是臨床應(yīng)用艾葉的來源之一。其蛋白質(zhì)中含有16 種常見氨基酸,7 種為必需氨基酸,必需氨基酸占總氨基酸的40.97%,功能性氨基酸占總氨基酸的53.6%,且葉小絨少,味略苦(其他品系艾草較苦)[8],因此廣東當(dāng)?shù)厝顺⒓t腳艾用作主要的食材原料之一?!颈狙芯壳腥朦c】目前,艾蒿的研究多集中于化學(xué)成分的分離鑒定、提取工藝優(yōu)化,以及藥理作用研究,而紅腳艾相關(guān)研究較少,尤其對紅腳艾組學(xué)研究和次生代謝產(chǎn)物合成途徑解析及化合物合成關(guān)鍵基因鑒定等未見報道?!緮M解決的關(guān)鍵問題】由于紅腳艾基因組信息缺乏,本研究利用高通量測序平臺Illumina HiSeq 2500,選擇紅腳艾不同組織進(jìn)行混合DNA 池測序,通過Trinity 軟件de novo 組裝獲得紅腳艾轉(zhuǎn)錄組Unigene 庫,并基于公共數(shù)據(jù)庫對Unigene 進(jìn)行功能注釋,為后續(xù)的次生代謝產(chǎn)物合成途徑研究、相關(guān)功能基因挖掘及驗證提供基礎(chǔ)數(shù)據(jù)。
供試材料紅腳艾蒿(A.rubripesNakai)種植于廣東省農(nóng)業(yè)科學(xué)院作物研究所南藥資源圃,由王繼華研究員鑒定。選擇長勢基本一致的健康植株,采摘葉片,用錫箔紙包裹迅速置于液氮中。
紅腳艾總RNA 采用生工生物Total RNA Extractor kit(B511311-0025)進(jìn)行提取,用1%瓊脂糖電泳檢測總RNA 的完整性,用Qubit?2.0熒光計Life Tech(Invitrogen)對總RNA 進(jìn)行定量。
紅腳艾RNA 樣品檢測合格后進(jìn)行轉(zhuǎn)錄組測序。利用Illumina?NEBNext?UltraTMRNA Library Prep Kit 制備測序文庫,之后使用Agilent Bioanalyzer 2100 評估文庫質(zhì)量;構(gòu)建合格文庫后,利用Illumina Hiseq 2500 平臺進(jìn)行測序,獲得雙端測序數(shù)據(jù);過濾原始數(shù)據(jù)中的接頭、低質(zhì)量(reads≤35 nt)和ploy-N 堿基的序列,獲得clean data,計算GC、Q20、Q30 含量及序列重復(fù)水平;采用Trinity 軟件進(jìn)行de novo 拼接組裝,用RSeQC 軟件去除冗余序列獲得Unigene,并評估基因表達(dá)水平[9-10]。利用BLAST 軟件[11],基于NR、GO、COG、KOG、KEGG 等數(shù)據(jù)庫[12-18]對組裝的Unigene 進(jìn)行功能注釋。
使用MISA 微衛(wèi)星識別工具鑒定簡單重復(fù)序列(Simple Sequence Repeat,SSR)并進(jìn)行分析。
利用Illumina Hiseq 2500 平臺對紅腳艾RNA樣品進(jìn)行轉(zhuǎn)錄組測序后,去掉含有接頭和低質(zhì)量的序列,共得到7.24 Gb clean data,24 126 043 條reads,GC 含量為44.67%,各樣品Q30 堿基百分比均不小于92.57%,說明文庫構(gòu)建質(zhì)量良好,試驗數(shù)據(jù)可靠。經(jīng)de novo 組裝,共得到173 093個轉(zhuǎn)錄本,平均長度為891.24 bp,N50 為1 406 bp,序列長度大于500 bp 的有96 861 個,占總序列數(shù)目的55.96%;轉(zhuǎn)錄本去冗余后得到85 991 個Unigene,平均長度為616.87 bp,N50 為925 bp,其中30 533 個(35.51%)序列長度大于500 bp,有14 408 個(16.75%)序列長度在1 000 bp 以上(表1)。
表1 紅腳艾轉(zhuǎn)錄組測序結(jié)果統(tǒng)計Table 1 Statistics of transcriptome sequencing results of Artemisia rubripes Nakai
通過BLAST軟件將獲得的85 991個Unigene序列與不同功能數(shù)據(jù)庫進(jìn)行比對,共注釋到47 216個(54.91%)Unigene(表2)。其中,NR數(shù)據(jù)庫(40 802個,47.45%)、KOG數(shù)據(jù)庫(26 171個,30.43%)、GO數(shù)據(jù)庫(23 203個,26.98%)和KEGG數(shù)據(jù)庫(16 846個,19.59%),COG數(shù)據(jù)庫注釋到的Unigene數(shù)量最少(12 810個,14.9%)。
表2 Unigene 的功能注釋統(tǒng)計Table 2 Statistics of functional annotation of Unigene
2.2.1 NR 功能注釋 NR 數(shù)據(jù)庫注釋結(jié)果顯示,紅腳艾與向日葵(Helianthus annuus)的單基因匹配率(13 552 個,15.76%)最高,其次是萵苣(Lactuca sativa,9 187 個,10.68%)、洋薊(Cynara cardunculusvar.scolymus,6 609 個,7.69%),與菊花(Chrysanthemum×morifolium)、莫氏黑粉菌(Moesziomyces antarcticusT-34)、青稞(Hordeum vulgaresubsp.Vulgare)的單基因匹配均小于400個??梢?,紅腳艾與菊目菊科物種的相似度高。
2.2.2 GO 功能注釋 GO 注釋結(jié)果(圖1)顯示,紅腳艾有23 203 個Unigene 被歸為生物過程(43 283 個,50.33%)、細(xì)胞組成(47 818 個,55.79%)和分子功能(27 375 個,31.83%)三大類共51 個功能分類。在分子功能中,催化活性(12 156 個,14.14%)和結(jié)合(11 434 個,13.30%)注釋到的Unigene 較多;在細(xì)胞組分中,細(xì)胞(9 631 個,11.20%)和細(xì)胞部分(9 607個,11.17%)注釋到的Unigene 較多;生物過程中,代謝過程(11 847 個,13.78%)和分子過程(10 948 個,12.73%)注釋最豐富。
圖1 紅腳艾Unigene 的GO 功能分類Fig.1 Classification of GO function of Artemisia rubripes Nakai Unigene
2.2.3 KEGG代謝通路分析 從KEGG數(shù)據(jù)庫注釋結(jié)果來看,16 846 個Unigene 參與到130 條代謝途徑中。其中核糖體途徑注釋的基因較豐富(824 個,4.89%),其次是碳代謝(604 個,3.59%)、剪切體(503 個,2.99%)、內(nèi)質(zhì)網(wǎng)中蛋白質(zhì)加工(474個,2.81%)和氨基酸生物合成(466 個,2.77%)等。參與類黃酮生物合成的基因有49 個,僅占0.29%。萜類作為自然界中結(jié)構(gòu)多、種類多的天然化合物,其生物合成分為前體合成、骨架構(gòu)建和后修飾3 部分。本研究獲得萜類骨架合成過程Unigene 105 個,參與直接前體GPP(Geranyl-PP)、IPP(Isopentenyl-PP)及DMAPP(Dimethylallyl-PP)的形成,參與單萜生物合成相關(guān)的Unigene 有13個,參與二萜生物合成的Unigene 有27 個,參與倍半萜和三萜生物合成相關(guān)的Unigene 有14 個,萜類經(jīng)細(xì)胞色素P450 等酶修飾后形成化合物,如二萜類化合物對腫瘤有一定治療作用,二萜類激素Gas 對植物發(fā)育具有調(diào)控作用,三萜皂苷具有很高的藥用價值等。
2.2.4 KOG 功能分類 KOG 數(shù)據(jù)庫分析結(jié)果(圖2)顯示,紅腳艾26 171 個Unigene 被注釋到25個KOG 功能分類中。其中,一般功能預(yù)測的基因最多,共有5 458 個,占20.86%;其次是信號傳導(dǎo)機(jī)制相關(guān)基因(2 976 個,11.37%),翻譯后修飾、蛋白質(zhì)周轉(zhuǎn)、伴侶基因(2 862 個,10.94%),翻譯、核糖體結(jié)構(gòu)與生物發(fā)生相關(guān)基因(1 690 個,6.46%),轉(zhuǎn)錄相關(guān)基因(1 527 個,5.83%),細(xì)胞內(nèi)運(yùn)輸、分泌和囊泡轉(zhuǎn)運(yùn)相關(guān)基因(1 374個,5.25%),碳水化合物運(yùn)輸和代謝相關(guān)基因(1 319 個,5.04%),與次生代謝物生物合成、運(yùn)輸和分解代謝相關(guān)基因(1 164 個,4.45%)等,細(xì)胞運(yùn)動注釋到的基因最少,僅18 個,占0.07%;未知功能的基因有1 491 個,需在后期挖掘其功能。
圖2 紅腳艾Unigene 的KOG 功能分類Fig.2 Classification of KOG function of Artemisia rubripes Nakai Unigene
2.2.5 COG 功能注釋 COG 數(shù)據(jù)庫功能注釋結(jié)果(圖3)形式,共有12 810 個Unigene 被注釋到25 個COG 功能分類中。其中,翻譯、核糖體結(jié)構(gòu)與生物發(fā)生的基因最多,有1 525 個,占11.9%;其次是一般功能預(yù)測基因(1 515 個,11.83%),翻譯后修飾、蛋白質(zhì)轉(zhuǎn)運(yùn)、伴侶基因(1 287 個,10.05%),信號傳導(dǎo)機(jī)制相關(guān)基因(1 106 個,8.63%),碳水化合物運(yùn)輸和代謝相關(guān)基因(1 098 個,8.57%)等;注釋基因最少的是RNA 加工與修飾,僅13 個,占0.1%;另有277 個Unigene 被注釋到未知功能基因,762 個Unigene 與次生代謝生物合成、運(yùn)輸和分解代謝相關(guān),占5.95%。
圖3 紅腳艾Unigene 的COG 功能分類Fig.3 Classification of COG function of Artemisia rubripes Nakai Unigene
利用MISA 軟件篩選得到10 00 bp 以上的紅腳艾Unigene 并進(jìn)行SSR 分析,結(jié)果(圖4)鑒定出6 種類型、3 529 個SSR 標(biāo)記。其中,單堿基重復(fù)SSR(p1)最多,共檢測到1 684 個位點;其次是三堿基重復(fù)SSR(p3)共檢測到1 017 個,雙堿基重復(fù)SSR(p2)有539 個,復(fù)合型重復(fù)SSR(c)有232 個,四堿基重復(fù)SSR(p4)有37個,五堿基重復(fù)SSR(p5)和六堿基重復(fù)SSR(p6)較少,分別為5 個和11 個。
圖4 紅腳艾Unigene 的SSR 位點分析Fig.4 SSR sites analysis of Artemisia rubripes Nakai Unigene
紅腳艾歷史上主要分布于嶺南地區(qū),惠州市的博羅縣、羅浮山及廣州市番禺區(qū)等地皆有縣志及通史記載,但近代以來對其研究與利用很少。隨著本草組學(xué)技術(shù)的發(fā)展,許多藥用植物基因組得到解析,也使得很多資源得以利用和保護(hù)[19]。由于藥用植物基因組學(xué)研究晚于大眾作物,因此轉(zhuǎn)錄組學(xué)成了本草基因組學(xué)研究的重要手段之一。本研究借助高通量測序技術(shù)對紅腳艾轉(zhuǎn)錄組進(jìn)行了初步探究,共獲得7.24 Gb clean data,GC含量為44.67%,Q30堿基百分比達(dá)到92.57%以上;通過Trinity 進(jìn)行de novo 組裝,共得到173 093 個轉(zhuǎn)錄本,對組裝的轉(zhuǎn)錄本去冗余后共獲得85 991個Unigene,平均長度為616.87 bp,N50 為925 bp,說明紅腳艾的組裝質(zhì)量較好,能夠滿足后續(xù)數(shù)據(jù)分析的要求。
通過數(shù)據(jù)庫比對,注釋到47 216 個Unigene,與向日葵(H.annuus)、萵苣(L.sativa)、洋薊(C.cardunculusvar.scolymus)等菊科植物匹配基因最多,另有45.09%的Unigene 未被注釋,可能由于蒿屬植物組學(xué)報道較少或組裝的序列較短等原因?qū)е拢?0]。在KEGG 代謝通路分析中,核糖體途徑、蛋白質(zhì)加工、氨基酸生物合成途徑注釋的基因較豐富,可能與氨基酸種類、總氨基酸含量較高有關(guān),而參與類黃酮生物合成的基因有49 個,僅占0.29%,這可能是紅腳艾側(cè)柏酮含量極低的原因。本研究結(jié)果可為紅腳艾功能基因挖掘、次級代謝物質(zhì)合成通路解析提供幫助,也可為中藥指紋圖譜構(gòu)建和種質(zhì)資源鑒定保存及分子輔助良種選育提供基礎(chǔ)[21]。
SSR 分子標(biāo)記具有豐度高、共顯性和多等位性等優(yōu)點[22],可利用現(xiàn)有的數(shù)據(jù)庫資源開發(fā)SSR 引物。本研究鑒定到紅腳艾SSR 位點3 529 個,可為其分子標(biāo)記開發(fā)、遺傳多樣性分析、種質(zhì)資源鑒定與優(yōu)選、分子標(biāo)記育種等奠定理論基礎(chǔ),為利用分子手段鑒定、區(qū)分紅腳艾品種及評價其質(zhì)量提供依據(jù)。
本研究通過高通量測序技術(shù)獲得了紅腳艾的轉(zhuǎn)錄組信息特征,經(jīng)de novo 組裝共獲得85 991個Unigene,有47 216 個Unigene 在NR、KEGG、COG、KOG、GO 和Pfam 數(shù)據(jù)庫獲得功能注釋。KEGG 代謝通路中,有16 846 個Unigene 參與氨基酸、萜類、黃酮類等130 條代謝途徑,其中有466 個Unigene 參與氨基酸合成、49 個Unigene 參與黃酮類合成。同時在紅腳艾中還鑒定到3 529 個SSR 標(biāo)記,通過獲得的紅腳艾遺傳標(biāo)記位點分布和Unigene,可進(jìn)行SSR 引物設(shè)計,為紅腳艾種質(zhì)資源遺傳改良、分子輔助育種奠定基礎(chǔ)。