張俊環(huán)++孫浩元++楊麗++姜鳳超++王玉柱
摘要:近幾年,果樹植物全基因組測序研究迅速升溫,多個果樹基因組圖譜被陸續(xù)公布,為果樹分子生物學(xué)和比較基因組學(xué)研究提供了大量的數(shù)據(jù)信息。通過比較分析已經(jīng)完成全基因組測序的11種我國主栽果樹的測序研究結(jié)果,就果樹植物的起源和進化、重要農(nóng)藝性狀相關(guān)基因的發(fā)掘以及測序結(jié)果的應(yīng)用前景方面進行了概述。
關(guān)鍵詞:果樹;全基因組;測序;進化;功能基因
中圖分類號:Q78文獻標(biāo)志碼:A[HK]
文章編號:1002-1302(2016)12-0006-06[HS)][HT9.SS]
收稿日期:2016-07-27
基金項目:國家自然科學(xué)基金(編號:31270709、31401836);北京市自然科學(xué)基金(編號6162012)。
作者簡介:張俊環(huán)(1974—),女,山東菏澤人,博士,副研究員,現(xiàn)主要從事果樹分子生物學(xué)研究工作。Tel:(010)82595857;E-mail:zhang_junhuan@163.com。
通信作者:王玉柱,博士,研究員,現(xiàn)主要從事果樹育種研究工作。Tel:(010)82592521;E-mail:chinabjwyz@126.com。
果樹作為重要的經(jīng)濟作物,在國內(nèi)外農(nóng)業(yè)生產(chǎn)中均占有重要的地位。但是由于果樹生命周期較長、基因組的雜合度較高、重復(fù)序列較多、且大多果樹因自交不親和而導(dǎo)致遺傳背景不清晰,這些因素限制了果樹分子生物學(xué)研究和全基因組測序研究的進程。然而,近些年,隨著測序技術(shù)的發(fā)展、測序效率的提高和測序成本的降低,果樹植物的全基因組測序工作在全球迅速展開,自2007年完成第一個果樹植物葡萄(Vitis vinifera)基因組測序以來,不到10年時間,已有14種果樹植物的全基因組測序工作相繼完成。這些果樹種類的全基因組測序結(jié)果為果樹分子生物學(xué)研究搭建出了龐大的資源平臺,不僅有助于了解果樹的基因組結(jié)構(gòu)和功能,而且對于探索果樹植物的起源與進化、開展重要功能基因的定位和克隆、加速分子育種進程等均具有重要的指導(dǎo)意義。本文通過分析其中11種我國主栽果樹的全基因組測序研究結(jié)果,圍繞果樹植物尤其是薔薇科植物的起源和進化、典型功能組分的代謝通路及其相關(guān)基因,以及測序結(jié)果的應(yīng)用前景方面進行分析和討論。
1主要果樹植物的測序結(jié)果基本數(shù)據(jù)
已完成全基因組測序并公布草圖的14種果樹植物中,既包括熱帶亞熱帶常綠果樹香蕉、甜橙、番木瓜和菠蘿,也包括北方落葉果樹蘋果、梨、棗等,其中我國自主完成測序的樹種就有6個。測序材料除甜橙(Citrus sinensis)采用純合度相對較高的雙單倍體材料外,其余5個樹種均是采用遺傳背景相對不清晰、雜合度較高的二倍體栽培品種(梨Pyrus bretschneideri、棗Ziziphus jujuba、獼猴桃Actinidia chinensis和菠蘿Ananas comosus)或野生品種(梅花Prunus mume)(表1)[1]。測序技術(shù)主要采用第二代測序技術(shù)Illumina平臺。與第一代Sanger測序技術(shù)相比,第二代測序技術(shù)降低了測序成本,提高了測序速率,且測序覆蓋度更高,尤其是Illumina HiSeq 2000測序技術(shù)平臺以高通量、高分辨率、高精度和價格低廉等優(yōu)勢發(fā)揮著巨大作用,已成功應(yīng)用于多種果樹植物的全基因組或轉(zhuǎn)錄組測序研究。
2果樹植物的起源和進化事件
已完成測序的植物基因組進化過程研究結(jié)果表明,全基因組復(fù)制事件幾乎發(fā)生于每個植物的進化過程中。全基因組復(fù)制存在古老的全基因組復(fù)制(old whole-genome duplications,old WGD)和近代的全基因組復(fù)制(recent whole-genome duplications,recent WGD)2種方式。在雙子葉植物中,古老的全基因組復(fù)制也被稱為古六倍體化(paleohexaploidization)進化或者三倍化復(fù)制(triplicated arrangement),又稱γ事件[2-7]。單子葉植物中古老的全基因組復(fù)制事件與雙子葉植物有所不同,包括ρ、σ和τ等3種不同的進化事件[8]。近代的全基因組復(fù)制過程伴隨基因的丟失和基因新功能的產(chǎn)生,是大多數(shù)雙子葉植物進化的主要動力。表2給出了這11種果樹植物在進化過程中所發(fā)生的全基因組復(fù)制事件。
由表2看出,這11種果樹植物全部都經(jīng)歷了古老的WGD,并且菠蘿還發(fā)生了2次。已完成測序的這些真雙子葉植物基因組的六倍體化過程都發(fā)生在相似的時間,即是在單子葉植物與雙子葉植物的分化之后,薔薇類分支(Eurosids clade)分化之前,早于葡萄科和薔薇科的分化,也早于鼠李科(Rhamnaceae)和薔薇科(Rosaceae)的分化,大約在1.4億年前。在約0.872億年前,棗和薔薇科(包括梨、蘋果、桃、梅和草莓)發(fā)生了分化[9]。葡萄基因組首次解析了全基因組三倍化復(fù)制事件,被視為古六倍體化進化機制的實例,隨后蘋果、草莓、甜橙等基因組結(jié)構(gòu)的分析均支持雙子葉植物祖先的古代六倍體是單一起源的假說。另外,值得注意的是,作為單子葉植物的香蕉基因組,在進化過程中,沒有發(fā)生禾本科植物的ρ、σ或τ復(fù)制,而是發(fā)生了與雙子葉植物相似的γ復(fù)制事件[10]。[FL)]
由表2還可以看出,相對于進化過程中普遍發(fā)生的古老的全基因組復(fù)制事件,在這11種果樹植物中僅有蘋果、梨、獼猴桃和香蕉4種果樹基因組發(fā)生了近代的WGD事件。通過共線性區(qū)域分析,發(fā)現(xiàn)獼猴桃進化過程中發(fā)生3次基因組倍增歷史事件,1次古老的全基因組復(fù)制(γ事件)和2次近代的全基因組復(fù)制事件(Ad-α和Ad-β),后2次分別發(fā)生在0.267億年前和0.729億~1.014億年前[6]。薔薇科的梨與蘋果、草莓則都經(jīng)歷了1.4億年前雙子葉植物所共有的古六倍化事件,并發(fā)生了1次全基因組復(fù)制事件。之后大約在 0.30 億~0.45億年前,梨和蘋果又經(jīng)歷了1次全基因組復(fù)制事件,而梨與蘋果的分化大約發(fā)生在0.054億~0.215億年前[11]。同為薔薇科的草莓、梅、桃與蘋果發(fā)生分化后,并沒有出現(xiàn)過較近時期的全基因組復(fù)制事件[4-5,12],葡萄、甜橙、棗基因組在近代也均未發(fā)生全基因組復(fù)制事件[2,7,9]。棗的基因組在歷史進化中經(jīng)歷了復(fù)雜的染色體斷裂、融合及片段重組過程。甜橙基因組在從雙子葉植物古六倍體祖先進化過程中則發(fā)生了頻繁的染色體易位和融合事件,至少有49次發(fā)生在9條染色體上。特別值得注意的是,在4號染色體上僅發(fā)生1次易位和融合事件,而其他染色體均發(fā)生多次(3~12次)染色體內(nèi)的易位和融合過程[7]。
多個薔薇科果樹植物全基因組測序的完成,使人們對薔薇科植物基因組的起源和進化過程有了更深入的了解。通過草莓屬與李屬間389個薔薇科標(biāo)記在2個基因組間共線性區(qū)域的分析,為薔薇科9條祖先染色體的重建提供了更廣泛的證據(jù)[4]。在梅全基因組序列圖譜的基礎(chǔ)上,結(jié)合已完成的蘋果和草莓基因組序列,分析了它們在進化過程中的染色體變化,進一步成功重建出了薔薇科植物的9條祖先染色體[5],并深入分析了蘋果屬、草莓屬和李屬3個屬所分別經(jīng)歷的不同染色體融合、斷裂和復(fù)制事件,即從9條祖先染色體的進化過程中,梅經(jīng)歷了至少11次的斷裂和11次的融合過程,蘋果發(fā)生了1次近代WGD和5次融合,而草莓則經(jīng)歷了15次的融合過程。梨染色體進化研究再次證明,有9條祖先染色體不僅是蘋果亞科的起源,也是整個薔薇科植物的祖先[11]。
3果樹重要經(jīng)濟性狀相關(guān)基因的揭示
在全基因組測序過程中,每個果樹種類都注釋到了龐大的基因數(shù)目,均在2.5萬個以上(表1),通過進一步的分析,發(fā)掘出了與抗性增強、果實發(fā)育和品質(zhì)形成相關(guān)的重要基因,不僅有利于本物種優(yōu)質(zhì)、高抗品種或類型的培育,而且對于其他種類果樹抗性及果實品質(zhì)改良也將起重要借鑒作用。
3.1控制香氣物質(zhì)合成的基因
果實的香氣物質(zhì)主要包括酯類、醇類、酮類、醛類、萜類和揮發(fā)性酚類等次生代謝物質(zhì),主要來自于萜類代謝、苯丙烷類代謝和脂氧合酶途徑[13]。不同果實中香氣物質(zhì)的類型不同,也就形成了不同種類果樹的果實有著各自特異的香氣。
草莓果實的香味物質(zhì)主要來源于脂肪酸代謝、萜類化合物代謝和苯丙烷代謝途徑,有7個基因家族與這些揮發(fā)性組分的產(chǎn)生有關(guān),包括?;D(zhuǎn)移酶、萜烯合酶和小分子O-甲基轉(zhuǎn)移酶等[4]。葡萄酒的香氣直接與促進萜烯類(樹脂、芳香精油類次生代謝物)合成的萜烯合酶(TPSs)基因有關(guān)[2]。在葡萄的基因組中,發(fā)現(xiàn)有89個與萜烯類合成相關(guān)的功能基因和27個擬功能基因。α-亞麻酸代謝途徑與梨的香氣形成相關(guān)。在梨基因組中分析揮發(fā)性物質(zhì)產(chǎn)生的3個主要途徑(脂肪酸、氨基酸和碳水化合物)相關(guān)的基因,發(fā)現(xiàn)在蘋果和梨中參與α-亞麻酸代謝途徑的脂氧合酶(lipoxygenase,LOX)和乙醇脫氫酶(alcohol dehydrogenase,ADH)的基因數(shù)目較多。而促進香味物質(zhì)釋放的β-葡萄糖苷酶基因中,僅有20%在梨果實中表達,大多香味物質(zhì)仍以結(jié)合態(tài)存在,這可能是梨香味不明顯的原因[11]。Zhang等在對梅花香味分子機制的研究中,首次發(fā)現(xiàn)了能直接催化生成梅花花香中重要成分乙酸苯甲酯的苯甲醇乙酰基轉(zhuǎn)移酶BEAT基因,該基因在梅花基因組中顯著擴增至34個,遠(yuǎn)遠(yuǎn)超過蘋果中的16個、草莓14個、葡萄4個。34個基因中有26個是呈簇分布的,最大一簇包括12個基因,并呈串聯(lián)重復(fù)分布。由此推測這些擴張的BEAT基因的劑量效應(yīng),增加了乙酸苯甲酯的含量,從而使梅花具有獨特的花香[5]。
3.2控制花青素合成的基因
花青素是使果實(包括果皮和果肉)呈現(xiàn)紅色的重要成分,是黃酮類化合物的一種,是重要的抗氧化物質(zhì),也是果實具有漂亮外觀和內(nèi)在保健價值的重要組分。
Shulaev等對草莓轉(zhuǎn)錄因子MYB家族的研究表明,MYB123是草莓花色素合成的重要調(diào)節(jié)因子。草莓中有187個MYB類轉(zhuǎn)錄因子,其中R2R3 MYBs與擬南芥在類黃酮和花青素的合成功能上有較高的同源性。通過擬南芥苯丙烷代謝途徑中的20個R2R3 MYBs序列與草莓基因組進行Blast分析,鑒定出25個高度同源的序列,其中擴張最大的分支是控制原花色素水平的MYB123,在草莓中至少有6個成員,是草莓中花色素合成的重要調(diào)控因子[4]。已測序的紅肉獼猴桃“紅陽”果實中也含有較高的花青素,但基因組數(shù)據(jù)顯示獼猴桃中與花青素合成有關(guān)的關(guān)鍵酶沒有發(fā)生擴張,而在類黃酮合成路徑中,與葡萄和甜橙相比,獼猴桃中的查爾酮異構(gòu)酶(chalcone isomerase)、黃烷酮3-脫氫酶(flavanone 3-hydroxylase)和類黃酮3-O-脫氫酶3個基因家族發(fā)生了擴張,暗示這3個基因家族與獼猴桃花青素的合成密切相關(guān)[6]。
3.3與維生素C積累相關(guān)的基因
維生素C,也稱L-抗壞血酸(L-ascorbic acid,AsA),其含量是衡量果實營養(yǎng)價值的重要指標(biāo)之一,特別是棗、獼猴桃和柑橘類均以果實富含維生素C而著稱,并得到消費者的廣泛喜愛。維生素C積累機制的研究也一直是果樹科研工作者努力的方向。
Xu等分析了甜橙果實中AsA上游的4個合成分支途徑的關(guān)鍵酶基因,半乳糖醛酸代謝途徑的許多基因都發(fā)生了上調(diào)。特別是半乳糖醛酸酯分支途徑的3個關(guān)鍵酶基因(PG、PME和GalUR)發(fā)生了明顯的上調(diào),其中編碼D-半乳糖醛酸還原酶的基因(GalUR)是這一代謝途徑的限速酶基因。同時在柑橘基因組中鑒定出18個GalUR同源基因,是已測序植物中最多的。進一步對薔薇類Malvidae clade家族部內(nèi)關(guān)系較近的4個樹種(柑橘、可可、番木瓜和擬南芥)進行進化分析,發(fā)現(xiàn)在甜橙內(nèi)表現(xiàn)擴張的GalUR基因分成2個簇,一簇包括4個基因,另一簇有7個基因,并且可能是串聯(lián)復(fù)制,這2個基因簇在維生素C含量較高的番木瓜中也表現(xiàn)出了擴張。[WTBX][STBX]GalUR-12[WTBZ][STBZ]與草莓中的GalUR基因序列有著高度的相似性和較近的進化關(guān)系,并且已經(jīng)證實該基因與產(chǎn)生特異的維生素C有關(guān)。所有證據(jù)表明甜橙果實中半乳糖醛酸酯途徑的基因發(fā)生了高度的擴張,并且GalUR基因在AsA積累過程中發(fā)揮最大的作用[7]。
在獼猴桃中,雖然合成維生素C的主要途徑(L-半乳糖途徑)的基因沒有發(fā)生擴張,但是與抗環(huán)血酸合成有關(guān)的其他基因家族出現(xiàn)了擴張,如Alase(aldonolactonase)、APX(L-ascorbate peroxidase)、MIOX(myo-inositol oxygenase)和維生素C再生途徑中的MDHAR(monohydroascorbate reductase)基[JP3]因家族等??赡苁怯捎讷J猴桃基因組發(fā)生近代的2次WGD事件過程中導(dǎo)致產(chǎn)生了促進維生素C積累的其他基因家族[6]。[JP]
棗果同時具有甜橙和獼猴桃2種積累維生素C的分子機制,即一方面通過L-半乳糖合成AsA的途徑得到大幅度加強(類似甜橙),另一方面AsA再生途徑中的關(guān)鍵基因家族MDHAR出現(xiàn)極顯著擴張(類似獼猴桃)。Liu等分析了AsA的4個合成路徑和1個再循環(huán)利用途徑中的關(guān)鍵酶基因,發(fā)現(xiàn)GDP-D-甘露糖3,5差向異構(gòu)酶和GDP-L-半乳糖磷酸化酶(L-半乳糖途徑的2個關(guān)鍵酶)和再循環(huán)利用途徑中的關(guān)鍵酶(monodehydroascorbate reductase,MDHAR)表現(xiàn)為持續(xù)升高的表達水平[9]。
與其他6個薔薇目基因組水平的比較,在棗果實中 GDP-L-半乳糖磷酸化酶是正向選擇基因,而MDHAR表現(xiàn)為顯著的擴張。7個薔薇目樹種(包括棗)與1個富含AsA甜橙間的系統(tǒng)發(fā)育關(guān)系的研究結(jié)果表明,有5個主要的MDHAR基因亞家族,亞家族Ⅳ和Ⅴ是棗和薔薇類特有的。在沒有經(jīng)歷近代的WGD事件的物種如草莓、桃、梅、桑椹、棗和甜橙中的基因組中只有1個MDHAR拷貝(亞家族Ⅰ、Ⅱ和Ⅲ),而在經(jīng)歷了近代WGD事件的蘋果和梨中卻有2個或更多的拷貝[9]。
3.4糖代謝相關(guān)的基因
果實的糖代謝對果實風(fēng)味和色澤的形成以及其他營養(yǎng)成分的代謝具有重要影響,是決定果實品質(zhì)和商品價值的主要因素。葉片同化的光合產(chǎn)物是果實糖積累的主要來源。蘋果、梨等薔薇科果樹,葉片光合產(chǎn)物以山梨醇為主要形態(tài),而非薔薇科植物以蔗糖為主。
蘋果、梨和草莓中,山梨醇代謝途徑相關(guān)的山梨醇轉(zhuǎn)運酶(SOT)、山梨醇脫氫酶(SDH)和山梨醇-6-磷酸脫氫酶(S6PDH)3個基因家族的基因數(shù)目多于非薔薇類植物。[WTBX][STBX]S6PDH、SDH和SOT[WTBZ][STBZ]基因家族在蘋果和梨中發(fā)生了擴張,這3個基因家族都屬于蘋果亞科的特有分支[11]。盡管蘋果和梨親緣關(guān)系很近,但[WTBX][STBX]S6PDH[WTBZ][STBZ]基因數(shù)目上的差異還是很大的,梨中有4個[WTBX][STBX]S6PDH[WTBZ][STBZ]成員,而蘋果有11個。梨中的4個[WTBX][STBX]S6PDH[WTBZ][STBZ]基因分成2簇,分別在5號和2號染色體上,而蘋果中只有位于10號染色體上的一個基因簇,其他成員分布于不同的染色體上,表明[WTBX][STBX]S6PDH[WTBZ][STBZ]基因在蘋果中的擴張和梨中的收縮可能發(fā)生在從共同祖先分化之后。梨中共15個SDH基因,來源相同,集中成簇分布在1號和7號染色體上。在系統(tǒng)發(fā)育樹上交叉成對,說明SDH基因是經(jīng)WGD事件進行擴張的。而在蘋果中的15個SDH分布較分散,且是不同的基因起源,暗示可能是有潛在的轉(zhuǎn)換事件發(fā)生。梨和蘋果中都存在樹種特異的SOT基因,也說明在從共同的薔薇類祖先分化后,SOT基因繼續(xù)擴張。
非薔薇類的棗果實發(fā)育前期,果實中的主要糖類是果糖和葡萄糖,成熟期的棗果中蔗糖和總糖含量在增加,以蔗糖為主。棗中注釋到393個與淀粉和蔗糖代謝相關(guān)、98個與半乳糖代謝有關(guān)、67個與果糖和甘露糖代謝有關(guān)、195個與氨基糖和核苷酸糖代謝有關(guān)的基因。與其他已測序的薔薇科果樹相比,這些基因家族在棗中都有一定程度上的擴張[9]。
3.5解除休眠的基因
梅、杏、桃、櫻桃等李屬(Prunus)果樹是春季開花較早的果樹種類。Zhang等探索了與梅花在低溫下打破休眠并開花的分子機制,共鑒定出6個與休眠相關(guān)的MADS-box轉(zhuǎn)錄因子DAM基因,在基因組中呈串聯(lián)重復(fù)分布。梅中這6個DAM基因是源自一系列復(fù)制事件產(chǎn)生的,順序是[WTBX][STBX]PmDAM1、PmDAM3、PmDAM2、PmDAM5、PmDAM4和PmDAM6[WTBZ][STBZ],DAM基因的這種分子進化模式是李屬植物特有的,在桃中也存在,但在蘋果和草莓中均沒有發(fā)現(xiàn)這些串聯(lián)基因[5],可能與桃、梅、杏、櫻桃等李屬植物春季開花早于其他大多種類的果樹有關(guān)。
DAM基因受C-repeat-binding transcription factors(CBF)轉(zhuǎn)錄因子的調(diào)控。在桃和果梅中[WTBX][STBX]DAM4-DAM6[WTBZ][STBZ]轉(zhuǎn)錄起始端上游1 000 bp區(qū)域有保守的CBF轉(zhuǎn)錄因子位點。在梅中,鑒定出13個CBF同源基因和7個CBF調(diào)節(jié)子、LEA蛋白。在DAM基因的上游,梅中有比桃更多的[WTBX][STBX]DAM4、DAM5和DAM6[WTBZ][STBZ]的CBF結(jié)合位點,并且發(fā)現(xiàn)3個新的位點,1個在[WTBX][STBX]DAM1[WTBZ][STBZ]的上游,2個在[WTBX][STBX]DAM6[WTBZ][STBZ]的上游。因此推測DAM基因和過多的CBF結(jié)合位點是梅花提早解除休眠的關(guān)鍵因子,使得梅對低溫非常敏感,從而導(dǎo)致梅花在早春開花[5]。
3.6自交不親和基因
自交不親和性一直是果樹分子遺傳生物學(xué)的研究熱點之一,根據(jù)花粉不親和表型的不同遺傳方式,植物拒絕自體花粉的再生障礙分為孢子體自交不親和(sporophytic self-incompatibility,SSI)和配子體自交不親和(gametophytic self-incompatibility,GSI)[14]。薔薇科多種果樹如梨、蘋果、甜櫻桃、杏、果梅、李和扁桃等表現(xiàn)出配子體型自交不親和性,由S位點復(fù)等位基因控制,包括2個連鎖基因:一個是在雌蕊組織中特異表達的S-RNase基因;一個是花粉中特異表達的SFB(S-haplotype-specific F-box)基因[15-16]。梨基因組研究結(jié)果表明,在S-基因座預(yù)測到6個SFB候選基因,并且呈現(xiàn)串聯(lián)重復(fù)形式,不同于在蘋果和草莓中的隨機分布。另外發(fā)現(xiàn)梨與蘋果在S-基因座上都有高度重復(fù)序列,而草莓基因組中沒有,重復(fù)序列在GSI中的功能還有待于進一步研究[11]。
3.7果實成熟相關(guān)的基因
果實成熟過程是果實發(fā)育的重要生物學(xué)特征,有著重要的經(jīng)濟價值。在番茄中有16個與果實成熟相關(guān)的基因,而在柑橘中僅檢測到其中的3個:ETR(或NR)、[WTBX][STBX]MADS-RIN和BP0353(或PHYF[WTBZ][STBZ]),可能與呼吸躍變型(番茄)和非呼吸躍變型(柑橘)2種不同的成熟機制有關(guān)。尤其是在草莓和番茄果實正常發(fā)育成熟過程所必需的MADS-RIN基因,在柑橘果實發(fā)育中出現(xiàn)了顯著的上調(diào),再次證實了MADS-RIN是2種呼吸類型果實成熟的關(guān)鍵調(diào)節(jié)子[7]。
3.8抗病基因
抗病性是所有果樹植物都關(guān)注的重要性狀,因此在全基因組解析中也對抗病性相關(guān)的基因進行了重點分析。參與植物抗病性的基因主要是R基因,其編碼的蛋白具有極高的結(jié)構(gòu)相似性,如亮氨酸拉鏈(leucine zipper,LZ)、核苷酸結(jié)合位點(nucleotide binding site,NBS)、跨膜區(qū)域(transmembrane domain,TM)、富含亮氨酸重復(fù)(leucine-rich repeats,LRR),以及與果蠅Toll蛋白及哺乳動物白細(xì)胞介素-1受體(toll and interleukin-1 receptor,TIR)的細(xì)胞外相似區(qū)域等。NBS-LRR基因是植物R基因中分布最廣和數(shù)量最大的1個基因家族。在它們編碼蛋白的近N端處存在NBS,而在近C端則存在LRR;而且不同的基因N端還可能包括1個或多個下列2種保守結(jié)構(gòu):卷曲螺旋(coiled coi1,CC)基序和TIR基序[17]。
在已測序的果樹植物研究中主要分析了R基因的9個類型:CC-NBS-LRR、CC-NBS、leucine-rich repeat receptor-like kinase(LRR-RLK)、NBS-LRR、NBS、TIR-CC-NBS-LRR、TIR-CC-NBS、TIR-NBS-LRR和TIR-NBS。其中數(shù)量最多的R基因是LRR-RLK、NBS-LRR和TIR-NBS-LRR 3個類型,而TIR-CC-NBS類型占比最少,多數(shù)物種中數(shù)量是0[5,9]。
由表3看出,在棗與其他11種測序果樹基因組NBS-R基因的比較分析中,指出LRR-RLK類型的R基因在每一種果樹R基因中的數(shù)量均是最高,而與梅中的研究結(jié)果不同,占據(jù)數(shù)量最多的是NBS-LRR或TIR-NBS-LRR;并且對相同果樹基因組鑒定出的幾種R基因的數(shù)量也不同,如蘋果基因組在與梅相比時,鑒定出972個R基因[5],在與梨比較時鑒定出1 312(992+320)個[11],而在與棗相比時,共鑒定出 1 511 個R基因[9],可能是與參考的標(biāo)準(zhǔn)序列有關(guān)。
盡管不同研究給出的R基因數(shù)目有所差異,但物種間橫向比較的結(jié)果表明,基因組較大的果樹植物如蘋果基因組中的R基因數(shù)目總是相對最高的1個樹種,而基因組較小的草莓中R基因的數(shù)目是最少的。
另外,已有研究指出梨與蘋果中R基因的數(shù)目有雙重差異。梨中有396個NBS類R基因,占蘋果(992個)的399%,并且梨中CC-NBS-LRR基因在數(shù)量上超過TIR-NBS-LRRs類型,而蘋果則相反。除了NBS基因,梨基因組中有403個LRR-kinase基因和11個其他的CC-LRR-Kinase基因,高于蘋果中的320個[11]。
獼猴桃基因組中有261個RLK-LRR,多于葡萄中的232個,與梅中的253個相近[6]。梅中的253個LRR-RLK分為19個基因亞族,其中LRR-Ⅺ和LRR-Ⅻ亞家族呈現(xiàn)顯著擴張,類似的擴張也出現(xiàn)在可可和擬南芥基因組。另外,除了R基因,梅花基因組中還存在很多PR基因家族,尤其是[WTBX][STBX]PR10[WTBZ][STBZ]基因家族顯著擴張,并且串聯(lián)分布,[WTBX][STBX]PR10[WTBZ][STBZ]的主要成員串聯(lián)形成1個小于100 kb的基因簇,而在其他薔薇科植物中沒有發(fā)現(xiàn)該基因簇。[WTBX][STBX]PR10[WTBZ][STBZ]基因簇可能與梅花的耐鹽、耐旱以及抵抗真菌等抗逆性相關(guān)[5]。
在已測序的11個物種中,棗中CC-NBS-LRR類基因是最豐富的。849個R基因中有115個CC-NBS-LRR類基因。17%的棗R基因有1個核苷酸結(jié)合配體結(jié)構(gòu)(APAF-1、R-蛋白和CRD-4結(jié)構(gòu)域),是正選擇基因,是棗抗病性進化的重要基礎(chǔ)[9]。
果樹中R基因的進化分析結(jié)果表明其有一個共同特點,即R基因在染色體上不是隨機分布,而是以串聯(lián)重復(fù)形式排列,并且是集中到某一或幾條染色體上。梨中超過30%的R基因是成簇分布的,主要在2、5和11號染色體上[11],有1/3的獼猴桃R基因是集中分布在10個簇內(nèi)。棗有16%(140個)R基因分布在9號染色體上,表明抗性基因的進化可能與其他植物一樣,是串聯(lián)重復(fù)和分化的[6]。
4果樹全基因組測序結(jié)果的應(yīng)用與展望
雖然果樹植物基因組的測序和組裝面臨較大的困難,但從已完成全基因組測序的14種果樹的分析結(jié)果來看,基因組組裝的結(jié)果質(zhì)量均較高。通過進一步的生物信息學(xué)分析揭示出該物種起源和控制果實性狀有關(guān)基因的重要基礎(chǔ)信息。全基因組測序數(shù)據(jù),為世界果樹基因組學(xué)的研究奠定了重要的信息基礎(chǔ),可為今后其他果樹種類的測序研究提供直接的序列數(shù)據(jù)參考,為同源物種或近緣物種重要性狀相關(guān)基因的發(fā)現(xiàn)、克隆、功能驗證和進化分析方面的研究提供極大的便利。
4.1有利于進行轉(zhuǎn)錄組測序和關(guān)鍵調(diào)控基因挖掘
全基因組序列信息資源的獲得,一是可以方便進行同源或近緣果樹種類的轉(zhuǎn)錄組測序研究,可對不同品種類型、不同組織、不同發(fā)育階段、不同栽培措施處理的材料進行基因表達分析,從而可篩選控制重要性狀的關(guān)鍵候選基因。Shi等以發(fā)表的桃基因組為參考,對果梅雌蕊敗育相關(guān)基因進行了轉(zhuǎn)錄組分析,初步篩選出與果梅雌蕊發(fā)育相關(guān)的36個基因[18]。二是通過轉(zhuǎn)錄組分析還可進一步提供大量的SSRs和SNP等分子標(biāo)記,這些序列信息、表達情況以及分子標(biāo)記將有助于通過遺傳圖譜進行果樹的關(guān)鍵農(nóng)藝性狀QTL定位,并開發(fā)與優(yōu)異性狀緊密連鎖的分子標(biāo)記,應(yīng)于用果樹分子標(biāo)記輔助育種。Wang等參考桃基因組的8個scaffold,成功構(gòu)建了甜櫻桃的高密度遺傳圖譜,并將與樹干直徑相關(guān)的基因定位到3個連鎖群的4個位點[19],為下一步候選基因的篩選、克隆、鑒定奠定了基礎(chǔ)??梢?,全基因組序列信息資源的獲得,將會大大加快同種或近緣果樹種類的分子育種進程。
4.2有利于進行比較基因組學(xué)研究
多個近緣物種基因組信息的獲得,利于在比較基因組學(xué)進行更全面、更深入的研究。通過深入比較分析2種植物基因組序列的共線性關(guān)系,分析研究植物的起源和進化關(guān)系,同時探索控制植物重要性狀的重要染色體片段或基因群,也可為重要基因的發(fā)現(xiàn)及克隆提供重要參考信息。Illa等通過比較薔薇科的基因組,構(gòu)建出薔薇科家族祖先的假想基因組,并指出小的染色體倒位的發(fā)生是薔薇科進化或薔薇科內(nèi)蘋果屬和李屬分化的重要起因[20]。
4.3基因組的3D結(jié)構(gòu)將成為未來研究的熱點
線性DNA信息的獲得已經(jīng)是基因組研究的重大進展,但是僅有基因組序列信息還遠(yuǎn)遠(yuǎn)不能揭示基因的精準(zhǔn)調(diào)控和異常表達現(xiàn)象。隨著研究的不斷深入和全基因組序列圖譜的完成,對基因組結(jié)構(gòu)、功能的研究將愈加廣闊和深入。隨著2009年Hi-C技術(shù)的提出和發(fā)展,國內(nèi)外科研人員已開始關(guān)注基因組的三維結(jié)構(gòu)。目前在人類基因組與疾病關(guān)系的研究方面,已有突出的進展。Tang等利用先進的3D基因組作圖策略、3D基因組仿真和超分辨率顯微鏡,探究了細(xì)胞核中的3D基因組結(jié)構(gòu)及其與基因表達和疾病的關(guān)系,并第一次鑒別出了染色質(zhì)蛋白CTCF和cohesin介導(dǎo)的人類基因組高階和詳細(xì)的拓?fù)浣Y(jié)構(gòu)[21]。細(xì)胞核內(nèi)基因組的3D結(jié)構(gòu)影響著基因的表達和DNA復(fù)制[22-23]。隨著基因組3D結(jié)構(gòu)研究技術(shù)的不斷開發(fā)和發(fā)展,果樹植物基因組的3D結(jié)構(gòu)研究也將有望迅速開展起來。
隨著測序技術(shù)、生物信息學(xué)分析技術(shù)的發(fā)展和各種生物學(xué)新技術(shù)的不斷出現(xiàn),果樹基因組學(xué)研究將會得到更快更好的發(fā)展,果樹全基因組及其拓?fù)浣Y(jié)構(gòu)也將逐漸被一一解析,基因組學(xué)的發(fā)展必將會解決傳統(tǒng)育種方法中存在的盲目性,有望實現(xiàn)通過最有效、最快速的方法獲得定點改良和多種優(yōu)良性狀聚合的最優(yōu)果樹品種類型。
[HS2*2][HT8.5H]參考文獻:[HT8.SS]
[1][ZK(#]Arumuganathan K,Earle E D. Nuclear DNA content of some important plant species[J]. Plant Molecular Biology Reporter,1991,9(3):208-218.
[2]Jaillon O,Aury J M,Noel B,et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla[J]. Nature,2007,449(7161):463-467.
[3]Velasco R,Zharkikh A,Affourtit J,et al. 2010. The genome of the domesticated apple (Malus×domestica Borkh.)[J]. Nature Genetics,2007,42(10):833-839.
[4]Shulaev V,Sargent D J,Crowhurst R N,et al. The genome of woodland strawberry (Fragaria vesca)[J]. Nature Genetics,2011,43(2):109-116.
[5]Zhang Q X,Chen W B,Sun L D,et al. The genome of Prunus mume[J]. Nature Communication,2012,3(4):1318-1325.
[6]Huang S,Ding J,Deng D,et al. Draft genome of the kiwifruit Actinidia chinensis[J]. Nature Communication,2013,4(4):2640-2649.
[7]Xu Q,Chen L L,Ruan X A,et al. The draft genome of sweet orange (Citrus sinensis)[J]. Nature Genetics,2013,45(1):59-66.
[8]Ming R,VanBuren R,Wai C M,et al. The pineapple genome and the evolution of CAM photosynthesis[J]. Nature,2015,47(2):1435-1441.
[9]Liu M J,Zhao J,Cai Q L,et al. The complex jujube genome provides insights into fruit tree biology[J]. Nature Communication,2014,5:5315-5326.
[10][ZK(#]DHont A,Denoeud F,Aury J M,et al. The banana (Musa cuminata) genome and the evolution of monocotyledonous plants[J]. Nature,2012,488(7410):213-217.
[11]Wu J,Wang Z W,Shi Z B,et al. The genome of pear (Pyrus bretschneideri Rehd.)[J]. Genome Research,2013,23(2):396-408.
[12]Verde I,Abbott A G,Scalabrin S,et al. The high-quality draft genome of peach (Prunus persica) identifies unique patterns of genetic diversity,domestication and genome evolution[J]. Nature Genetics,2013,45(5):487-494.
[13]Osbourn A E,Lanzotti V. Plant-derived natural products[M]. Berlin:Springer Science Business Media,2009:405-431.
[14]McClure B A,F(xiàn)ranklin-Tong V. Gametophytic self-incompatibility:understanding the cellular mechanisms involved in “self” pollen tube inhibition[J]. Planta,2006,224(2):233-245.
[15]Zhang S L,Huang S X,Kitashiba H,et al. Identification of S-haplotype-specific F-box gene in Japanese plum (Prunus salicina Lindl.)[J]. Sexual Plant Reproduction,2007,20(1):1-8.
[16]Donia A,Ghada B,Hend B T,et al. Identification,evolutionary patterns and intragenic recombination of the gametophytic self incompatibility pollen gene (SFB) in Tunisian Prunus species (Rosaceae)[J]. Plant Molecular Biology Reporter,2016,34(1):339-352.
[17]Pan Q L,Wendel J,F(xiàn)luhr R. Divergent evolution of plant NBS-LRR resistance gene homologues in dicot and cereal genomes[J]. Journal of Molecular Evolution,2000,50(3):203-213.
[18]Shi T,Gao Z H,Wang L J,et al. Identification of differentially-expressed genes associated with pistil abortion in Japanese apricot by genome-wide transcriptional analysis[J]. PLoS One,2012,7(10):e47810-47822.
[19]Wang J,Zhang K C,Zhang X M,et al. Construction of commercial sweet cherry linkage maps and QTL analysis for trunk diameter[J]. PLoS One,2015,10(10):e141261-141270.
[20]Illa E,Sargent D J,Girona E L,et al. Comparative analysis of rosaceous genomes and the reconstruction of a putative ancestral genome for the family[J]. BMC Evolutionary Biology,2011,11(1):9-21.
[21]Tang Z,Luo O J,Li X,et al. CTCF-mediated human 3D genome architecture reveals chromatin topology for transcription[J]. Cell,2015,163(7):1611-1627.
[22]Bickmore W A,Van Steensel B. Genome architecture:domain organization of interphase chromosomes[J]. Cell,2013,152(6):1270-1284.
[23]Tjong H,Li W,Kalhor R,et al. Population-based 3D genome structure analysis reveals driving forces in spatial genome organization[J]. Proceedings of the National Academy of Sciences of the United States of America,2016,113(12):1663-1672.