金志強(qiáng)
摘? 要:香蕉基因組學(xué)研究已逾20年,取得了一些進(jìn)展。本文從全基因組測(cè)序、亞基因組分化、基因水平上的染色體結(jié)構(gòu)變異、多倍體背景下的染色體交換及基因組擴(kuò)張與功能等5個(gè)方面,論述了香蕉基因組學(xué)研究取得的進(jìn)展,并對(duì)未來基因組學(xué)研究的重點(diǎn)方向進(jìn)行了展望。
關(guān)鍵詞:香蕉;基因組學(xué);A基因組;B基因組
中圖分類號(hào):S668.1? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
Abstract: Banana genome has been studied for more than 20 years, and some progress has been made. In this paper, the achievements of banana genomics research were reviewed from five aspects: whole genome sequencing, subgenome differentiation, chromosomal structural variation at genome level, chromosome exchange under polyploid background, genome expansion and function.
Keywords: banana (Musa L.); genomics; A genome; B genome
DOI: 10.3969/j.issn.1000-2561.2020.10.007
基因組學(xué)(genomics)是研究基因組(genome)的科學(xué)。從分子遺傳學(xué)的角度,基因組是指一個(gè)生物體或一個(gè)細(xì)胞器所有DNA分子的總和[1]?;蚪M學(xué)的發(fā)展是以1990年10月1日啟動(dòng)人類基因組計(jì)劃(Human Genome Project, HGP)作為起點(diǎn)的,至2000年在全世界科學(xué)家的共同努力下,覆蓋大部分基因組的基因組序列草圖繪制完成[2]。同年,在植物中,擬南芥(Arabidopsis thaliana)基因組測(cè)序結(jié)果[3]即將發(fā)表時(shí),全球香大蕉改良組織(A Global Programme for Musa Improvement, ProMusa)的部分科學(xué)家,于4月6—8日在法國蒙彼利埃(Montpellier, France)召開學(xué)術(shù)研討會(huì)。與會(huì)者認(rèn)識(shí)到,“植物基因組學(xué)是一個(gè)新興的領(lǐng)域,它有望描述植物的整個(gè)基因庫。從植物基因組學(xué)的研究中獲得的信息將有助于理解基因是如何使植物作為一個(gè)活的有機(jī)體發(fā)揮其功能的,以及所有植物的功能多樣性是如何與單個(gè)基因組的簡(jiǎn)單變化相關(guān)聯(lián)的。植物基因組學(xué)最終可能被用來對(duì)植物進(jìn)行基因改造,使其在不同的生物、生態(tài)和文化環(huán)境中獲得最佳性能,從而造福于人類和環(huán)境”。會(huì)議接近尾聲時(shí),就香蕉基因組學(xué)研究達(dá)成了相當(dāng)程度的共識(shí)。各方同意成立一個(gè)全球香蕉基因組學(xué)聯(lián)盟(The Global Musa Genomics Consortium,以下簡(jiǎn)稱“聯(lián)盟”),共同開啟香蕉基因組測(cè)序及相關(guān)研究[4]。2001年7月17—20日,“聯(lián)盟”在美國弗吉尼亞州阿靈頓(Arlington, USA)的美國國家科學(xué)基金會(huì)(National Science Foundation, NSF)舉行了第一次會(huì)議。出席會(huì)議的科學(xué)家們對(duì)剛破譯的擬南芥基因組、水稻基因組及其他成就感到歡欣鼓舞,他們迫切希望香蕉能成為下一個(gè)被破譯的植物基因組[5]。出席這次會(huì)議的有來自全球12個(gè)國家的科學(xué)家?;诜▏r(nóng)業(yè)國際合作研究發(fā)展中心(Centre de Coopération Internationale en Recherche Agronomique pour le Développement, CIRAD),以及國際熱帶農(nóng)業(yè)研究所(International Institute of Tropical Agriculture, IITA)和國際上其他科學(xué)家的相關(guān)研究基礎(chǔ),會(huì)議在“聯(lián)盟”的目標(biāo)、策略、預(yù)期成果、測(cè)序的成本測(cè)算、成果分享方式、實(shí)施戰(zhàn)略、資源分享方式、運(yùn)作方式等方面達(dá)成共識(shí)[6]。以“聯(lián)盟”成立為時(shí)間節(jié)點(diǎn),香蕉基因組學(xué)研究至今已有20多年。雖然未能如期成為第三個(gè)破譯基因組的植物,但仍然取得一些重要進(jìn)展,綜述如下。
香蕉(包括大蕉)是世界上最重要的水果之一,在全球糧食作物排行榜上排名第四,是最早被馴化的作物之一,現(xiàn)廣泛分布于熱帶與亞熱帶地區(qū),是數(shù)百萬人的主食,對(duì)熱帶和亞熱帶發(fā)展中國家的糧食和經(jīng)濟(jì)安全具有重大意義[7]。
香蕉為單子葉植物,屬芭蕉科(Musaceae)芭蕉屬(Musa L.)。芭蕉屬植物約有50多個(gè)野生種,分為4個(gè)組(section)。其中,紅蕉組(Callimusa)和澳蕉組(Australimusa)的植物染色體數(shù)目為2n=20(x=10);真蕉組(Eumusa)和美蕉組(Rhodochlamys)的植物染色體數(shù)目為2n=22(x=11)[8]。大多數(shù)栽培香蕉都來自真蕉組的兩個(gè)野生種,即Musa acuminata(A基因組)和Musa balbisiana(B基因組)。Musa acuminata種內(nèi)雜交和Musa acuminata與Musa balbisiana的種間雜交導(dǎo)致了這些A-和B-基因組的各種組合,這些基因組分為AA、AAA、AB、AAB、ABB和ABBB共6種類型[9]。還有少數(shù)的M. schizocarpa(S基因組,2n=22)(x=11)[10]和Musa textilis(T基因組,2n=20)(x=10)[11]。但絕大多數(shù)食用品種是三倍體,其基因組的組成為AAA、AAB和ABB。
1? 繪制了完整的香蕉野生親本的基因組序列草圖
目前市場(chǎng)上90%以上用于鮮食的和進(jìn)出口的三倍體香蕉品種都屬于三倍體無性系的Cavendish和GrosMichel亞群(subgroup),均起源于Musa acuminata。Cavendish和GrosMichel的出現(xiàn)被認(rèn)為是Musa acuminata產(chǎn)生不減數(shù)配子的部分不育二倍體亞(品)種與產(chǎn)生正常單倍體配子的可育二倍體亞(品)種雜交的結(jié)果[12]。在Musa acuminata中,還發(fā)現(xiàn)了一些亞種,其中,malaccensis亞種被認(rèn)為是為三倍體香蕉(AAA)貢獻(xiàn)了其中的1條A染色體[12],這個(gè)樣本采自馬來西亞彭亨州(Pahang),故名‘Pahang,于20世紀(jì)40年代后期引入牙買加香蕉理事會(huì)基因庫(Banana Board Jamaica Genebank)[13]。香蕉基因組計(jì)劃啟動(dòng)后,率先進(jìn)行了‘Pahang的基因組測(cè)序工作。
1.1? A基因組的序列測(cè)定
早在1996年就采用花藥培養(yǎng)的方法獲得了‘Pahang的雙單倍體(doubled haploid,DH)植株(DH-Pahang)[13]。以此為材料進(jìn)行全基因組測(cè)序,可以顯著降低基因組的雜合度,有利于測(cè)序后拼接與組裝。從20世紀(jì)90年代至21世紀(jì)初期,分子標(biāo)記技術(shù)廣泛應(yīng)用于香蕉種質(zhì)資源鑒定、遺傳多樣性和系統(tǒng)發(fā)育以及基因組組成等方面的研究。例如:擴(kuò)增片段長度多態(tài)性(amplified fragment length polymorphism, AFLP)[14]、限制性片段長度多態(tài)性(restriction fragment length polymorphisms, RFLP)[12, 15]、微衛(wèi)星(microsatellites)[16-19]。多樣性陣列技術(shù)(diversity arrays technology, DArT)是一種基于DNA雜交的分子標(biāo)記技術(shù),可在不需要序列信息的情況下同時(shí)檢測(cè)多個(gè)基因組位點(diǎn)的變異。Risterucci等[20]利用此技術(shù),分析了168個(gè)Musa基因型,共鑒定出836個(gè)標(biāo)記并用于基因分型(genotyping),其中10%對(duì)A基因組特異,能夠在不同染色體倍性構(gòu)成的相關(guān)性分析中以該基因組部分為靶點(diǎn)。因DArT標(biāo)記在檢測(cè)香蕉種質(zhì)基因組組成和揭示聚類方面的準(zhǔn)確性,被用于構(gòu)建香蕉基因組的遺傳連鎖圖。DArT和SSR相結(jié)合,以M. acuminata中2個(gè)遺傳距離較遠(yuǎn)的亞種(microcarpa亞種材料‘Borneo為母本,malaccensis亞種材料‘Pisang Lilin為父本)雜交,獲得180個(gè)F1后代個(gè)體,構(gòu)建了由SSR和DArT標(biāo)記組成的親本圖譜[21]。用于DH-Pahang測(cè)序的遺傳連鎖圖,就是據(jù)此技術(shù)繪制的。根據(jù)測(cè)序DH-Pahang的親本‘Pahang的自交后代,繪制了一張遺傳圖譜。因自交后代自然條件下育性較低,用胚拯救技術(shù)[22]盡量減少自交后代個(gè)體數(shù)量的損失,從而減少潛在的分離偏差。用652個(gè)標(biāo)記(589個(gè)SSR和63個(gè)DArT)對(duì)180個(gè)‘Pahang自交后代的基因分型數(shù)據(jù)作為“異花授粉”群體確定連鎖群。LOD閾值為5.0時(shí),可以識(shí)別11個(gè)連鎖群中的9個(gè):LG2、LG3和LG5~LG11。通過對(duì)等位基因比率和模式的詳細(xì)分析以及NJ樹(Neighbor-Joining)分析區(qū)分了LG1和LG4。這11個(gè)連鎖群就成為DH-Pahang測(cè)序組裝后錨定在染色體上的基礎(chǔ)。
采用Sanger測(cè)序(20×)和Illumina(50×)測(cè)序方法對(duì)細(xì)菌人工染色體(bacterial artificial chromosome, BAC)文庫(BAC library)進(jìn)行測(cè)序。最先在burmannica亞種的一份來自加爾各答植物園的材料,命名為‘Calcutta 4[23],構(gòu)建了BAC library[24]。采取類似的方法,2008年構(gòu)建了‘Pahang的BAC文庫[25]。用于測(cè)序的2個(gè)分別由HindIII和BamHI酶切的DH-Pahang的BAC文庫,分別命名為MAMH(Musa acuminata malaccensis HindIII)和MAMB(Musa acuminata malaccensis BamHI)。MAMB含23 040個(gè)克隆,平均為140 kb,代表估算基因組的6.2倍。對(duì)這個(gè)文庫進(jìn)行BAC-end測(cè)序,共產(chǎn)生了2 750萬個(gè)Roche/454單端序列(single reads)和210萬個(gè)Sanger reads,代表了流式細(xì)胞儀估計(jì)的DH- Pahang基因組523 Mb大小的20.53× 覆蓋范圍。組裝(assembly)序列包括了24 425個(gè)contigs和7 513個(gè)scaffolds,總長度472.2 Mb,占預(yù)測(cè)DH- Pahang基因組大小的90%。組裝序列的90%分布在647個(gè)scaffolds中,N50(將序列從長到短排序,將它們的長度相加,長度正好為總長度的50%時(shí)的那條序列的長度)為1.3 Mb。組裝序列的70%(332 Mb)錨定在了‘Pahang遺傳圖譜的11個(gè)Musa連鎖群上。2012年發(fā)布了Musa acuminata的全基因測(cè)序結(jié)果[26]。完成A基因組測(cè)序是香蕉基因組學(xué)研究的一個(gè)重要里程碑,標(biāo)志著香蕉基因組學(xué)研究取得了重大突破,歷時(shí)12年。
2016年,采用新技術(shù)又對(duì)A基因組的數(shù)據(jù)進(jìn)行了修訂。建立了一個(gè)5 kb的DH-Pahang mate-pair文庫,并使用Illumina HiSeq 2000以40的基因組覆蓋率對(duì)其進(jìn)行了測(cè)序。用模塊化的生物信息學(xué)軟件改進(jìn)基因組序列組裝,進(jìn)一步完善了Musa acuminata基因組序列草圖。分離群體的基因分型(genotyping by sequencing,GBS)和paired-end測(cè)序用于檢測(cè)和糾正scaffolds組裝錯(cuò)誤。用GBS標(biāo)記將scaffolds錨定在假分子上,避免了遺傳圖譜構(gòu)建過程中標(biāo)記排序的繁瑣步驟。此外,構(gòu)建了1個(gè)基因組圖譜,用于將scaffolds組裝成超級(jí)scaffolds。最后,將校正過的基因注釋構(gòu)建了1個(gè)新的組裝序列。這種方法將scaffolds總數(shù)從7513個(gè)減少到1532個(gè)(即減少80%),N50從1.3 Mb(65個(gè)scaffolds)增加到3.0 Mb(26個(gè)scaffolds)。89.5%的組裝序列錨定在11條染色體上,而之前僅70%的組裝序列錨定在染色體上,未知位點(diǎn)(N)由17.3%減少到10.0%[27],基因組序列質(zhì)量得到明顯提高。
1.2? B基因組的序列測(cè)定
香蕉的生產(chǎn)分為兩大類,一類是甜香蕉或甜點(diǎn)香蕉(sweet banana或dessert banana),也稱鮮食蕉(banana),既供當(dāng)?shù)叵M(fèi),又供出口。另一類是烹飪香蕉(cooking banana,ABB),果實(shí)通常在食用前先煮、烤或炸,還有一類是大蕉(plantain,AAB)亞群主要為當(dāng)?shù)叵M(fèi)而生產(chǎn)[28]。全球近40%的香蕉生產(chǎn)涉及A/B種間三倍體品種,占香蕉總產(chǎn)量的18%,主要種植在西非和中/南美洲。在西非和中非,估計(jì)約有7000萬人從大蕉中獲取超過四分之一的食物能量需求。鑒于B基因組的重要性,2012年,中國熱帶農(nóng)業(yè)科學(xué)院聯(lián)合法國CIRAD、華大基因等國內(nèi)外多家單位,開始了B基因組的測(cè)序工作。
野生M. balbisiana為栽培香蕉品種提供了B基因組,目前沒有亞種的報(bào)道。所用的測(cè)序材料是野生二倍體基因型Pisang Klutuk Wulong(PKW, 2n=2x=22),是一種黑莖的Musa balbisiana,爪哇語中‘Klutuk是種子和烏龍黑(wulung black)的意思?;驇熘械腜KW材料是在印度尼西亞收集的[29]。為降低測(cè)序的雜合度,按照Grapin等的方法獲得雙單倍體(double haploid PKW, DH-PKW)材料[22],進(jìn)行了全基因組測(cè)序。由于測(cè)序技術(shù)的進(jìn)步,B基因組測(cè)序采用PacBio單分子測(cè)序(113×)和Illumina測(cè)序(166×)的方法,共獲得58.9 Gb的PacBio單分子長reads,86.3 Gb的Illumina pair-end和mate-pair reads用于組裝。獲得492.77 Mb scaffolds,contig N50為1.83 Mb,scaffold N50為5.05 Mb,覆蓋了95%的基因組序列,經(jīng)評(píng)估,其基因組完整性達(dá)到91.3%。構(gòu)建了DH-PKW的高通量染色體構(gòu)象捕獲(high- throughput chromosome conformation capture, Hi-C)文庫,生成72 Gb(138×)的Hi-C pair-end reads。進(jìn)行重復(fù)消除、分類和質(zhì)量評(píng)價(jià),進(jìn)行唯一的有效定位,結(jié)果將430 Mb(87.27%)和94.0%的基因組,以A基因組為參考序列,定位在11條染色體上。B基因組的測(cè)序技術(shù)先進(jìn)性、測(cè)序深度、基因組覆蓋度、contig N50、scaffold N50、定位到染色體上的序列長度都顯著高于A基因組。于2019年發(fā)布測(cè)序結(jié)果[30],被Springer Nature遴選為2019年亮點(diǎn)工作之一,指出“該論文是2019年Springer Nature精選的最受歡迎的論文之一,反映了產(chǎn)生重要影響的頂尖研究”。
2? 香蕉亞基因組的分化
通過對(duì)越來越多的基因組數(shù)據(jù)分析表明,全基因組復(fù)制(whole-genome duplications, WGDs)在被子植物基因組進(jìn)化中起著重要作用[31]。Lescot等人通過來自13個(gè)BAC文庫的1.3 Mb的A基因組序列,并與4個(gè)先前測(cè)序的BAC進(jìn)行了注釋和分析,推導(dǎo)了與單子葉植物,以及A、B基因組可能的分化時(shí)間。首次提出了Musa系譜(Musa lineage)中WGD事件的證據(jù)[32]。經(jīng)過深度測(cè)序后發(fā)現(xiàn),A基因組的11條染色體之間存在一種復(fù)雜的旁系同源關(guān)系(paralogous relationship),發(fā)生了兩次WGD(表示為α和β),在α/β復(fù)制之前,已經(jīng)重復(fù)了的基因簇(duplicated gene clusters)被初步組裝成代表祖先基因組的12個(gè)Musa祖先基因塊(ancestral blocks),包含的重復(fù)片段覆蓋222 Mb。根據(jù)Ks(同義突變率)在旁系同源基因簇對(duì)之間的分布,推導(dǎo)出兩次WGD約發(fā)生在65 Mya(million years ago)。12個(gè)Musa祖先塊體之間的其他物種的同源關(guān)系顯示出更高的Ks值,這表明另外一個(gè)更古老的復(fù)制事件(表示為γ)發(fā)生在大約100 Mya[26]。
與其他單子葉植物相比,香蕉譜系的進(jìn)化速度相對(duì)較慢[33]?;趯?duì)519個(gè)單拷貝直系同源基因(orthologous genes)的系統(tǒng)發(fā)育分析表明,A和B基因組最近的分化時(shí)間約為5.4 Mya,它們的共同祖先與禾本科植物的分化時(shí)間約為134 Mya。這估計(jì)與A和B基因組之間4.6 Mya的分化時(shí)間相近。4.6 Mya的分化時(shí)間是根據(jù)17個(gè)BAC克?。ò?3.5 kb的編碼序列)的測(cè)序結(jié)果估計(jì)得出[32]。5.4 Mya比之前估計(jì)的20.9 Mya(由3個(gè)基因和1個(gè)內(nèi)部轉(zhuǎn)錄間隔區(qū)估計(jì))或27.9 Mya(由19F基因估計(jì))時(shí)間更近[34-35]。在全基因組系統(tǒng)發(fā)育分析研究中,增加樣本的信息量,將有助于更準(zhǔn)確地估計(jì)分化時(shí)間。
植物經(jīng)三輪WGD后,緊接著進(jìn)行基因組二倍化(diploidization)和消減(fractionation),包括染色體重排(chromosomal rearrangement)、基因丟失(gene loss)和偏好保留(biased retention)[36]。在二倍化和消減之后,A和B基因組開始獨(dú)立進(jìn)化,表現(xiàn)出了分化差異。發(fā)現(xiàn)了9038個(gè)基因家族在A、B基因組、水稻(Oryza sativa)、短柄草(Brachypodium distachyon)和葡萄(Vitis vinifera)中都是保守的。相反,A基因組中的348個(gè)基因家族以及B基因組639個(gè)基因家族具有特異性。分化后,A基因組中有1761個(gè)基因家族擴(kuò)張,203個(gè)基因家族收縮;B基因組中有392個(gè)基因家族擴(kuò)張,1008個(gè)基因家族收縮。說明B基因組對(duì)基因組的收縮比A基因組更為敏感[30]。通過京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes, KEGG)對(duì)B基因組中顯著擴(kuò)張的基因家族(P<0.05)的富集途徑分析表明,其富集在光合作用和次生代謝的生物合成,包括與肌醇、淀粉和蔗糖代謝相關(guān)的代謝途徑,亞油酸和花生四烯酸等。植物產(chǎn)生的次生代謝產(chǎn)物多樣性高,除了能緩解各種非生物脅迫外,還具有抵御多種食草動(dòng)物和病原體的顯著功能[37],與之前B基因組提高對(duì)生物和非生物脅迫的耐受性有關(guān)的研究結(jié)果是一致的[38]。
3? 基因組水平上的染色體結(jié)構(gòu)變異
3.1? A基因組染色體的易位
染色體易位是染色體結(jié)構(gòu)變化的一種主要形式。M. acumicata種內(nèi)分為6~9個(gè)亞種(banksii、burmannica、malaccensis、microcarpa、zebrina、burmannicoides、truncata、siamea和errans),這些亞種在東南亞的陸地區(qū)域和島嶼上產(chǎn)生地理隔離后,發(fā)生了分化[39-40]。人類的遷徙,導(dǎo)致了這些亞種之間的接觸[41],出現(xiàn)了亞種間雜種。細(xì)胞遺傳學(xué)研究表明,在減數(shù)分裂時(shí)染色體配對(duì)在亞種內(nèi)的二價(jià)體中一般是規(guī)則的,但在某些多價(jià)體和亞種間雜種的單價(jià)體是不規(guī)則的,因此導(dǎo)致這些亞種間的雜種生育率降低[42-43]。這個(gè)結(jié)果也說明亞種間的染色體結(jié)構(gòu)變異而導(dǎo)致減數(shù)分裂時(shí)出現(xiàn)了染色體配對(duì)的不規(guī)則性。
借助于A基因組測(cè)序結(jié)果,可以從DNA水平上揭示染色體易位發(fā)生。用SNP標(biāo)記野生M. acuminata亞種burmannicoides中的1份材料‘Calcutta 4[23]的自交后代分離情況,用mate-pair測(cè)序序列與malaccensis Pahang[26]參考序列進(jìn)行比對(duì),研究染色體重排。從123份野生和栽培香蕉材料的全基因組測(cè)序數(shù)據(jù)中,鑒定了染色體結(jié)構(gòu)的特征片段之間的連接。結(jié)果在‘Calcutta 4中發(fā)現(xiàn)了兩個(gè)大的相互易位:一個(gè)是2號(hào)染色體240 kb遠(yuǎn)端區(qū)域與8號(hào)染色體7.2 Mb遠(yuǎn)端區(qū)域的互換;另一個(gè)涉及到1號(hào)染色體20.8 Mb遠(yuǎn)端區(qū)域與9號(hào)染色體11.6 Mb遠(yuǎn)端區(qū)域的互換。上述兩個(gè)大的相互易位可能起源于burmannica亞種基因群[44]。
在另一個(gè)亞種M. acuminata ssp. malaccensis,通過mate-pair測(cè)序、細(xì)菌人工染色體熒光原位雜交技術(shù)(bacterial artificial chromosome and fluorescence in situ hybridization technology, BAC- FISH)、靶向PCR和DArT測(cè)序(DArT sequencing)標(biāo)記在其子代中的分離情況,分別從1號(hào)染色體遠(yuǎn)端3 Mb和4號(hào)染色體遠(yuǎn)端10 Mb鑒定出1個(gè)雜合子相互易位,表明其后代中產(chǎn)生了高度分離偏差(segregation distortion),減少了1號(hào)和4號(hào)染色體之間的重組和連鎖。結(jié)果表明,子代中這兩個(gè)染色體結(jié)構(gòu)是相互排斥的,重排的染色體結(jié)構(gòu)優(yōu)先傳遞到子代。染色體重排在三倍體品種中普遍存在,但僅在野生malaccensis中存在。表明這種重排發(fā)生在M. acuminata的malaccensis亞種中。這種重排在香蕉多樣性中的傳播機(jī)制可能在三倍體品種的出現(xiàn)中起了作用[45]。其他亞種是否存在另外的易位,還需進(jìn)一步的研究。
3.2? A、B基因組間染色體的易位與倒位
A與B基因組間大片段結(jié)構(gòu)變異(large structural variations)的第一個(gè)證據(jù)是根據(jù)種間雜交后代染色體分離而提出的[46]。從全基因組水平上,采用共線性(synteny)分析表明A和B基因組之間的基因組共線性和序列相似性很高。在A和B基因組之間鑒定出了72個(gè)大的共線性區(qū)塊(large syntenic blocks),其中的15個(gè)都包含超過900個(gè)基因?qū)?。這72個(gè)共線性區(qū)塊占A基因組的75.02%(其中含23%轉(zhuǎn)座元件)和68.01%的B基因組(含22%轉(zhuǎn)座元件)。
在A和B基因組分化之后,它們之間發(fā)生了兩個(gè)大的易位(translocation)和兩個(gè)倒位(inversion)。其中一個(gè)大的相互易位發(fā)生在B基因組1號(hào)染色體上的7.09 Mb和A基因組3號(hào)染色體上的7.03 Mb。一個(gè)倒位發(fā)生在B基因組的5號(hào)染色體(9.39 Mb)和A基因組的5號(hào)染色體上(8.83 Mb)[30]。這些易位和倒位在早前的遺傳圖譜上也有體現(xiàn)[47],通過共線性比對(duì),更為準(zhǔn)確地確定了易位的大小和位置。這種易位和倒位是遺傳多樣性增加的一種方式[48]。
4? 香蕉多倍體中亞基因組染色體的同源交換和替換
多倍體化似乎是植物進(jìn)化史上的一個(gè)常見事件[49]。大多數(shù)香蕉品種是多倍體的,具有不同程度的倍性和基因組背景[50]。為了解在多倍體背景下A、B基因組的同源交換,采用重測(cè)序的方法對(duì)三倍體和二倍體不同倍性,以及不同基因型香蕉進(jìn)行了重測(cè)序。重測(cè)序數(shù)據(jù)與A(Pahang)和B(PKW)基因組同時(shí)比對(duì),確定了唯一能定位的reads用于分析覆蓋深度、變異調(diào)用和每條染色體上的同源交換。這些分析證實(shí),香蕉種質(zhì)的基因組組成,在大多數(shù)情況下,與以往基于形態(tài)特征的基因組分類一致。在粉蕉(ABB)中鑒定了48個(gè)同源交換的片段,包括9個(gè)從B-到A-亞基因組的交換和39個(gè)反向交換。在Kamaramasenge(AAB)中,還發(fā)現(xiàn)了4個(gè)從B-到A-亞基因組的同源交換片段,并在第10條染色體上A-亞基因組替換了B-亞基因組。在Pelipita(ABB)中,第2、7和11號(hào)染色體的A亞基因組被B亞基因組替換,6、9和10號(hào)染色體上有18個(gè)同源交換片段[30]。之前通過基因組原位雜交的研究結(jié)果表明了Pelipita的8A和25B染色體組成,與先前的基因組原位雜交研究一致[51]。說明在多倍體背景下,A、B基因組的同源交換和替換,是構(gòu)成多倍體香蕉遺傳多樣性的重要方面。
對(duì)于三倍體粉蕉A、B亞基因組同源基因在不同組織、果實(shí)發(fā)育和成熟的不同階段以及非生物脅迫處理后的香蕉幼苗中的表達(dá)水平進(jìn)行分析,在A、B亞基因組間共鑒定出25 717對(duì)同源基因。在同源基因?qū)χ校?1.83%得到了共線性分析的證實(shí)。對(duì)所有同源基因?qū)Φ谋磉_(dá)進(jìn)行分析,以確定三倍體粉蕉中B/A表達(dá)倍數(shù)變化的分布。log2(RPKM B/RPKM A)為1.2/1,其中RPKM(reads per kilobase per million mapped reads)代表每百萬reads中來自于某基因每千堿基長度的reads數(shù),這與2/1的基因組組成值不同。這個(gè)結(jié)果可以用劑量補(bǔ)償來解釋[52]。選取1075對(duì)在A基因組上調(diào)表達(dá)的同源基因,和4032對(duì)在B基因組中上調(diào)表達(dá)的同源基因進(jìn)行KEGG富集分析。結(jié)果表明,在B基因組中具有表達(dá)優(yōu)勢(shì)的基因與2-氧羰基水楊酸代謝和精氨酸生物合成途徑有關(guān)(Q<0.05),而在A亞基因組中具有表達(dá)優(yōu)勢(shì)的基因在KEGG途徑中沒有顯著富集。利用加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析,對(duì)那些具有表達(dá)顯性的基因構(gòu)建了一個(gè)基因共表達(dá)網(wǎng)絡(luò)。結(jié)果表明,87個(gè)顯性表達(dá)基因與A基因組的4302個(gè)基因互作,295個(gè)顯性表達(dá)基因與B基因組的4612個(gè)基因互作。KEGG途徑富集分析表明,A、B基因組共表達(dá)網(wǎng)絡(luò)中的基因通常與淀粉、蔗糖代謝等代謝途徑有關(guān)。特別是,泛醌和其他萜類醌生物合成、光合作用-觸角蛋白、類胡蘿卜素生物合成和其他聚糖降解途徑在A基因組中特別豐富。B基因組中的硒復(fù)合代謝和氰胺酸代謝途徑特別豐富(Q<0.05)[30]。這些結(jié)果說明,在多倍體香蕉中,A和B基因在染色體發(fā)生上同源片段交換,并表現(xiàn)出功能分化,這些功能分化可能表現(xiàn)在轉(zhuǎn)錄水平上。
5? 香蕉A、B基因組擴(kuò)張與功能
5.1? 基因組擴(kuò)張與乙烯生物合成
乙烯在果實(shí)采后呼吸躍變成熟的調(diào)控中起著關(guān)鍵作用[53]。乙烯生物合成途徑中的關(guān)鍵酶包括S-腺苷-L-蛋氨酸合酶(S-adenosyl-L-methionine synthase, SAMS)、1-氨基環(huán)丙烷-1-羧酸合酶(1-aminocyclopropane-1-carboxylic acid synthase, ACS)和1-氨基環(huán)丙烷-1-羧酸氧化酶(1-aminocyclopropane-1-carboxylic acid oxidase, ACO)[54]。從A基因組中鑒定出了12個(gè)SAMS、11個(gè)ACS和11個(gè)ACO基因,在B基因組中鑒定了10個(gè)SAMS、11個(gè)ACS和18個(gè)ACO基因[30],與單子葉植物和真雙子葉植物中的其他7個(gè)測(cè)序植物物種相比[55],這是一個(gè)顯著的擴(kuò)張。鑒定了來自A和B基因組的28對(duì)同源基因,對(duì)這些基因?qū)υ诎臀鹘叮∕usa AAA group, cv. Cavendish, BX)和粉蕉A基因組(Musa ABB group, cv. Pisang Awak, FJ)的表達(dá)模式進(jìn)行了分析,發(fā)現(xiàn)其與粉蕉B亞基因組表現(xiàn)出相似的表達(dá)模式。有趣的是,8對(duì)基因在B基因組中表現(xiàn)出同源表達(dá)優(yōu)勢(shì),5對(duì)基因在FJ的A基因組中優(yōu)勢(shì)表達(dá)[30]。
ACS和ACO以前都被證明是乙烯生物合成中的限制酶[56]。在10對(duì)ACS基因中,MaACS7/ MbACS7是Ma-ACS1的同源基因,在果實(shí)成熟過程中(主要在B基因組中)高水平表達(dá)。MbACS6和MbACS7在一個(gè)大的共線性模塊中是旁系同源基因(該共線性模塊包含19個(gè)基因?qū)Γ?,這些基因?qū)Ψ謩e與MaACS6和MaACS7保持著共線性和緊密的進(jìn)化關(guān)系,這表明這些基因是通過WGD復(fù)制而來。在9個(gè)ACO基因?qū)χ?,?對(duì)(MaACO2/MbACO6、MaACO3/MbACO7和MaACO8/MbACO13)在果實(shí)成熟過程中高水平表達(dá),并主要在B基因組中表達(dá)。MaACO2/MbACO6和MaACO3/MbACO7分別處于A基因組的5號(hào)染色體和B基因組的6號(hào)染色體,處于1個(gè)線性模塊中,屬于同一個(gè)系統(tǒng)發(fā)育分支。這些結(jié)果表明,MaACO2/MbACO6和MaACO3/MbACO7是獨(dú)立起源的,在果實(shí)成熟過程中發(fā)揮重要作用[30]。
基因復(fù)制是產(chǎn)生新的遺傳多樣性的主要機(jī)制,是真核生物產(chǎn)生新遺傳多樣性和進(jìn)化創(chuàng)新的基礎(chǔ)[57]。與A基因組中的11個(gè)ACO基因相比,B基因組中的ACO基因顯著擴(kuò)張到18個(gè)成員,包括位于3號(hào)染色體上的MbACO2、MbACO3、MbACO4、MbACO5,位于6號(hào)染色體上的MbACO8、MbACO9、MbACO11和位于scaffold中的MbACO16、MbACO18,是由B基因組中的串聯(lián)重復(fù)(tandem duplications)驅(qū)動(dòng)的。在B基因組擴(kuò)增的ACO基因中,MbACO2和MbACO3在果實(shí)成熟期表現(xiàn)出很強(qiáng)的表達(dá)水平,在果實(shí)采后6 d(days postharvest, DPH)粉蕉中的log2RPKM>11,這與乙烯躍變期一致。此外,MbACO8、MbACO9、MbACO11、MbACO16、MbACO18在開花后0 d(days post flowering, DAF)在根和果實(shí)中高表達(dá)。這些基因?qū)儆谕粋€(gè)簇,它們的表達(dá)模式與它們的復(fù)制高度一致,表明B基因組中ACO基因的擴(kuò)張和進(jìn)化有助于組織發(fā)育和果實(shí)成熟[30]。在采后成熟過程中,F(xiàn)J比BX成熟快與乙烯生物合成和果實(shí)成熟相關(guān)基因?qū)Φ娘@性表達(dá)以及B基因組中ACO家族的擴(kuò)張有關(guān)。
5.2? 基因組擴(kuò)張與淀粉代謝
淀粉是植物中最廣泛和最豐富的貯藏碳水化合物,也是香蕉果實(shí)的主要成分,在香蕉果實(shí)發(fā)育過程中大量積累(約占干重的60%~75%),導(dǎo)致大淀粉顆粒(約8~30 nm)的存在,以及在收獲后成熟期間幾乎完全轉(zhuǎn)化為可溶性糖[58-60]。負(fù)責(zé)淀粉生物合成的主要酶[61](sugars will eventually be exported transporter, SWEET; sucrosetransporter, SUT; sucrose synthase, SuSy; UDP-glucose pyro- phosphorylase, UGPase; ADP-glucose pyrophos- phorylase, AGPase; granule-bound starch synthase, GBSS; soluble starch synthase, SSS; starch branch- ing enzyme, SBE; starch debranching enzyme, DBE)和降解淀粉的主要酶(α-amylase, AMY; β-amylase, BMY; starch phosphorylase, DPE)由多基因家族編碼。在A基因組中鑒定了101個(gè)淀粉代謝相關(guān)基因,其中77個(gè)參與淀粉合成途徑,24個(gè)參與淀粉降解途徑。在B基因組中鑒定出淀粉合成途徑中的68個(gè)基因,以及淀粉降解途徑中的28個(gè)基因[30]。
在淀粉合成途徑中,9個(gè)基因家族中的5個(gè)(SuSy、GBSS、SSS、SBE和DBE)與其他7種植物(包括番茄和葡萄)相比,在香蕉的A和B基因組中表現(xiàn)出明顯的擴(kuò)張。在這些家族的A和B基因組中鑒定了54個(gè)同源基因?qū)?。其中?7個(gè)同源基因?qū)υ诟⑷~和果實(shí)組織中具有表達(dá)優(yōu)勢(shì),其中7對(duì)在A亞基因組中占優(yōu)勢(shì),20對(duì)在B亞基因組中占優(yōu)勢(shì)。因此,淀粉合成途徑在B基因組中的不同組織中比在A基因組中更為活躍。那些在B亞基因組中顯性表達(dá)的基因?qū)χ校诠麑?shí)采前0 DAF和20 DAF時(shí),MbSWEET17、MbSuSy1、MbSuSy2和MbSuSy9的表達(dá)水平較高,表明對(duì)果實(shí)發(fā)育過程中的淀粉合成起重要作用。相比之下,大多數(shù)淀粉合成相關(guān)基因(A或B基因組特有)表現(xiàn)出低表達(dá)水平[30]。
在淀粉降解途徑中基因組注釋表明,與其他7種植物相比,AMY和BMY家族在香蕉A和B基因組中有明顯的擴(kuò)張。從A和B基因組中鑒定了21個(gè)同源基因?qū)?。在這些基因?qū)χ校?1個(gè)具有顯性表達(dá),并且在果實(shí)成熟期間與B基因組相關(guān)。在顯性表達(dá)基因中,MbAMY-2、MbAMY-3、MbAMY-8、MbBMY-6、MbBMY-8和MbDPE-2在果實(shí)成熟過程中表現(xiàn)出高表達(dá)。MbAMY-1、MbAMY-2、MbAMY-3、MbAMY-4、MbAMY-5和MbAMY-6、MbAMY-7、MbAMY-8顯示出緊密的親緣關(guān)系和進(jìn)化關(guān)系,表明這些基因是從串聯(lián)拷貝復(fù)制的。MbBMY-5、MbBMY-8和MbBMY-6、MbBMY-12是B基因組處于1個(gè)共線性模塊中的兩個(gè)旁系同源基因?qū)?,顯示出密切的進(jìn)化關(guān)系,表明這些基因來源于WGD[41]。綜上所述,表明B基因組中串聯(lián)驅(qū)動(dòng)的AMY復(fù)制和WGD驅(qū)動(dòng)的BMY復(fù)制有助于淀粉降解。B基因組中淀粉生物合成相關(guān)基因的顯性表達(dá)可能導(dǎo)致FJ果實(shí)發(fā)育過程中淀粉積累增加。此外,與淀粉降解相關(guān)的基因在B基因組中的顯性表達(dá)也可能導(dǎo)致FJ中淀粉降解的升高[30]。因此,在果實(shí)發(fā)育和成熟過程中,B基因組在淀粉代謝途徑中分別導(dǎo)致顯著的淀粉積累和降解。
6? 展望
6.1? 繼續(xù)廣泛進(jìn)行基因組測(cè)序工作
由于基因組測(cè)序技術(shù)的進(jìn)步,全基因組測(cè)序已成為基因組學(xué)的一個(gè)常規(guī)技術(shù),越來越多的植物物種(品種)都已完成了全基因組測(cè)序。據(jù)不完全統(tǒng)計(jì),截至2018年12月31日,僅園藝植物就有181種完成測(cè)序[62]。據(jù)估計(jì)全球約有39.1萬種陸地植物,此外還有8000種綠藻,與其他生物界相比,它們的基因組異常多樣,從10 Mb到100 Gb不等,目前已獲得的全基因組數(shù)據(jù)還遠(yuǎn)遠(yuǎn)不能滿足人類的需求[63]。因此,有學(xué)者提出了萬種植物基因組測(cè)序計(jì)劃(10 000 Plants Project, 10 kP),旨在將我們對(duì)植物基因組的了解擴(kuò)大到比目前所知范圍更廣的物種[64]。香蕉的基因組測(cè)序雖然取得了一些進(jìn)展,除了兩個(gè)野生親本外,還有2個(gè)野生近緣種——Musa itinerans[65]和M. schizocarpa(S基因組)[66]也進(jìn)行了全基因組測(cè)序。因?yàn)樗鼈儾皇菑念^獲得的,沒有將這些最終組裝序列與現(xiàn)有參考序列進(jìn)行比較,且基因組的連續(xù)性較差,得到的組裝序列是片段化的,影響了數(shù)據(jù)的使用?,F(xiàn)保存在國際生物多樣性組織香蕉種質(zhì)資源轉(zhuǎn)運(yùn)中心(Bioversity International Musa Germplasm Transit Centre, ITC)的1500多種可食和野生香蕉種質(zhì),被認(rèn)為是全球香蕉多樣性最豐富的保存庫。全世界大約有500個(gè)香蕉品種,然而,在全世界種植的所有品種中,超過40%只屬于一個(gè)基因狹窄的群體——Cavendish亞群。要加快栽培品種的選育,就必須借助于全基因組測(cè)序,深入了解其基因來源、演化規(guī)律等。在A、B基因組測(cè)序基礎(chǔ)上,加快幾個(gè)野生亞種的序列測(cè)定,對(duì)品種的遺傳構(gòu)成加以解析。
6.2? 盡快啟動(dòng)表型組學(xué)研究
隨著基因組學(xué)技術(shù)的不斷擴(kuò)展,基因組學(xué)研究已經(jīng)取得了很大的進(jìn)步。然而,基因組學(xué)數(shù)據(jù)對(duì)作物改良的影響仍然遠(yuǎn)遠(yuǎn)不能令人滿意,遠(yuǎn)沒有達(dá)到“聯(lián)盟”成立之初所預(yù)見的那樣“對(duì)植物進(jìn)行基因改造,使其在不同的生物、生態(tài)和文化環(huán)境中獲得最佳性能,從而造福于人類和環(huán)境”。這在很大程度上是由于缺乏有效的表型數(shù)據(jù)。收集有用的高質(zhì)量表型數(shù)據(jù)的能力落后于目前產(chǎn)生高通量基因組學(xué)數(shù)據(jù)的能力。因此,從基因組學(xué)轉(zhuǎn)移到表型組學(xué)(phenomics)是基因組學(xué)研究的必然結(jié)果[67]。表型分析是一項(xiàng)困難而復(fù)雜的研究工作,其難點(diǎn)表現(xiàn)在:(1)有效的表型分析。有效的表型被認(rèn)為是彌合數(shù)量性狀基因型-表型差距的關(guān)鍵因素[67],利用大量種質(zhì)資源發(fā)現(xiàn)候選數(shù)量性狀位點(diǎn)(quantitative trait locus, QTL)對(duì)足夠廣泛的性狀進(jìn)行表型定位,從而發(fā)現(xiàn)QTL/基因,并克隆重要基因以用于分子育種。(2)表型的穩(wěn)定性。表型的穩(wěn)定性必須要進(jìn)行大量的重復(fù)試驗(yàn),才能在復(fù)雜多變的環(huán)境中對(duì)群體或種質(zhì)進(jìn)行表型分型,以便捕捉到有益性狀的代表性變異,如生物和非生物脅迫耐受性、產(chǎn)量、品質(zhì)等,并且要證明這些性狀可以穩(wěn)定遺傳。(3)表型的分析方法。通過使用高通量有效的表型分析技術(shù)篩選大量種質(zhì)資源,加快植物育種進(jìn)程[68]。目前在其他植物中已經(jīng)使用的高通量有效的分析技術(shù)包括非侵入性成像、光譜學(xué)、圖像分析、機(jī)器人技術(shù)、高性能計(jì)算設(shè)備和建立表型數(shù)據(jù)庫等,系統(tǒng)地收集表型數(shù)據(jù)。這些現(xiàn)代表型組學(xué)平臺(tái)和工具旨在記錄植物生長、發(fā)育、結(jié)構(gòu)、光合作用或生物量等性狀的數(shù)據(jù),在一天之內(nèi)記錄成百上千株植物,這是一場(chǎng)表型組學(xué)革命。對(duì)于香蕉而言,這一切似乎還很遙遠(yuǎn)。目前,表型數(shù)據(jù)的收集還處在對(duì)資源或品質(zhì)的性狀描述階段。香蕉的表型組學(xué)研究的挑戰(zhàn)在于大多數(shù)品種來源單一,性狀間的差異很小,增加了表型分型的難度。香蕉的繁殖方式大多是無性繁殖,性狀的穩(wěn)定性要通過長期觀察才能獲得,需要耗費(fèi)大量人力物力。香蕉植株高大,增加了設(shè)備、設(shè)施的投入,成本高。這些都制約著香蕉表型組學(xué)的研究。
6.3? 今后一段時(shí)間的重點(diǎn)工作
香蕉基因組學(xué)研究的20年歷程,雖然取得了一些積極進(jìn)展,但將基因組學(xué)研究成果應(yīng)用于新品種的創(chuàng)制仍需進(jìn)一步努力。目前應(yīng)著重從以下3個(gè)方面積極開展工作:一是加大種質(zhì)資源引進(jìn)、收集、鑒定和評(píng)價(jià),擴(kuò)大資源擁有量;二是圍繞香蕉系統(tǒng)演化、遺傳物質(zhì)結(jié)構(gòu)變異與馴化、不育性和營養(yǎng)繁殖等重大科學(xué)問題,持續(xù)深入開展基因組學(xué)研究;三是加強(qiáng)轉(zhuǎn)基因育種[69]、基因編輯[70]等技術(shù)研究,加快新功能基因的應(yīng)用。
參考文獻(xiàn)
楊煥明. 基因組學(xué)[M]. 北京: 科學(xué)出版社, 2016: 3-5.
Lander E S, Linton L M, Birren B, et al. Initial sequencing and analysis of the human genome[J]. Nature, 2001, 409(6822): 860-921.
Irish B M, Cuevas H E, Simpson S A, et al. Musa spp. germplasm management: microsatellite fingerprinting of USDA-ARS national plant germplasm system collection[J]. Crop Science, 2014, 54(5): 2140-2151.
Risterucci A M, Hippolyte I, Perrier X, et al. Development and assessment of Diversity Arrays Technology for high-throughput DNA analyses in Musa[J]. Theoretical and Applied Genetics, 2009, 119(6): 1093-1103.
Hippolyte I, Bakry F, Seguin M, et al. A saturated SSR/DArT linkage map of Musa acuminata addressing genome rearrangements among bananas[J]. BMC Plant Biology, 2010, 10(1): 65.
Bakry F, Assani A, Kerbellec F. Haploid induction: Androgenesis in Musa balbisiana[J]. Fruits, 2008, 63(1): 45-49.
ProMusa. Improving understanding of banana: Calcutta 4[EB/OL]. [2020-07-12]. http://www.promusa.org/Calcutta+4.
Vilarinhos A D, Piffanelli P, Lagoda P, et al. Construction and characterization of a bacterial artificial chromosome library of banana (Musa acuminata Colla)[J]. Theoretical and Applied Genetics, 2003, 106(6): 1102-1106.
Piffanelli P, Vilarinhos A D, Safar J, et al. Construction of bacterial artificial chromosome (BAC) libaries of banana (Musa acuminata and Musa balbisiana)[J]. Fruits, 2008, 63(6): 375-379.
DHont A, Denoeud F, AuryJ-M, et al. The banana (Musa acuminata) genome and the evolution of monocotyledonous plants[J]. Nature, 2012, 488(7410): 213-217.
Martin G, Baurens F-C, Droc G, et al. Improvement of the banana “Musa acuminata” reference sequence using NGS data and semi-automated bioinformatics methods[J]. BMC Genomics, 2016, 17: 243.
NoyerJ L, Causse S, Tomekpe K, et al. A new image of plantain diversity assessed by SSR, AFLP and MSAP markers[J]. Genetica, 2005, 124(1): 61-69.
ProMusa. Improving understanding of banana: Pisang Klutuk Wulung[EB/OL]. [2020-07-25]. http://www.promusa. org/Pisang+Klutuk+Wulung.
Wang Z, Miao H X, Liu J H, et al. Musa balbisiana genome reveals subgenome evolution and functional divergence[J]. Nature Plants, 2019, 5(8): 810-821.
Van de Peer Y, Fawcett J A, Proost S, et al. The flowering world: a tale of duplications[J]. Trends in Plant Science, 2009, 14(12): 680-688.
Lescot M, Piffanelli P, Ana Y Ciampi, et al. Insights into the Musa genome: Syntenic relationships to rice and between Musa species[J]. BMC Genomics, 2008, 9(1): 58.
Givnish T J, Zuluaga A, Spalink D, et al. Monocot plastid phylogenomics, timeline, net rates of species diversification, the power of multi-gene analyses, and a functional model for the origin of monocots[J]. American Journal of Botany, 2018, 105(11): 1-23.
Christelová P, Valárik M, H?ibová E, et al. A multi gene sequence-based phylogeny of the Musaceae (banana) fa mily[J]. BMC Evolutionary Biology, 2011, 11(1): 103.
Janssens S B, Vandelook F, De Langhe E, et al. Evolutionary dynamics and biogeography of Musaceae reveal a correlation between the diversification of the banana family and the geological and climatic history of Southeast Asia[J]. New Phytologist, 2016, 210(4): 1453-1465.
Mandáková T, Andrew D, Gloss A D, et al. How diploidization turned a tetraploid into a pseudotriploid[J]. American Journal of Botany, 2016, 103(7): 1187-1196.
Bennett R N, Wallsgrove R M. Secondary metabolites in plant defence mechanisms[J]. New Phytologist, 2010, 127(4): 617-633.
Davey M W, Gudimella R, Harikrishna J A, et al. A draft Musa balbisiana genome sequence for molecular genetics in polyploid, inter- and intra-specific Musa hybrids[J]. BMC Genomics, 2013, 14(1): 683.
Daniells J, Jenny C, Karamura D, et al. Musalogue: a catalogue of Musa gemplasm[M]//Arnaud E, Sharrock S. Diversity in the genus Musa. Montpellier: INIBAP, France, 2001.
Perrier X, De Langhe E, Donohue M, et al. Multidisciplinary perspectives on banana (Musa spp.) domestication[J]. Proceedings of the National Academy of Sciences USA, 2011, 108(28): 11311-11318.
Fauré S, Noyer J L, Horry J P, et al. A molecular marker-based linkage map of diploid bananas (Musa acuminata)[J]. Theoretical and Applied Genetics, 1993, 87(4): 517-526.
Fauré S, Bakry F, González de Leon D. Cytogenetic studies of diploid bananas[M]//Breeding banana and plantain for resistance to diseases and pests. Montpellier: CIRAD- FLHOR, 1993: 77-92.
Shepherd K. Cytogenetics of the genus Musa[C]. Montpellier: INIBAP, France, 1999.
Dupouy M, Baurens F-C, Derouault P, et al. Two large reciprocal translocations characterized in the disease resistance-rich burmannica genetic group of Musa acuminata[J]. Annals of Botany, 2019, 124(2): 319-329.
Martin G, Carreel F, Coriton O, et al. Evolution of the banana genome (Musa acuminata) is impacted by large chromosomal translocations[J]. Molecular Biology Evolution, 2017, 34(9): 2140-2152.
Noumbissié G B, Chabannes M, Bakry F, et al. Chromosome segregation in an allotetraploid banana hybrid (AAAB) suggests a translocation between the A and B genomes and results in eBSV-free off springs[J]. Molecular Breeding, 2016, 36(4): 38.
Baurens F-C, Guillaume Martin G, Hervouet C, et al. Recombination and large structural variations shape interspecific edible bananas genomes[J]. Molecular Biology and Evolution, 2019, 36(1): 97-111.
Saxena R K, Edwards D, Varshney R K. Structural variations in plant genomes[J]. Briefings in Functional Genomics, 2014, 13(4): 296-307.
Soltis P S, Marchant D B, Van de Peer Y, et al. Polyploidy and genome evolution in plants[J]. Current Opinion in Genetics & Developmen, 2015, 35: 119-125.
Jesus O N D, Silva S D O E, Amorim E P, et al. Genetic diversity and population structure of Musa accessions in ex situ conservation[J]. BMC Plant Biology, 2013, 13(1): 41.
DHont A, Paget-Goy A, Escoute J, et al. The interspecific genome structure of cultivated banana, Musa spp. revealed by genomic DNA in situ hybridization[J]. Theoretical and Applied Genetics, 2000, 100(2): 177-183.
Guo M, Davis D, Birchler J A, et al. Dosage effects on gene expression in a maize ploidy series[J]. Genetics, 1996, 142(4): 1349-1355.
Rahul K, Ashima K A, Sharma A K. Role of plant hormones and their interplay in development and ripening of fleshy fruits[J]. Journal of Experimental Botany, 2014, 65(16): 4561-4575.
Yang S F, Hoffman N E. Ethylene biosynthesis and its regulation in higher plants[J]. Annual Review of Plant Physio logy, 1984, 35: 155-189.
Li L, Stoeckert C J, Roos D S. OrthoMCL: Identification of ortholog groups for eukaryotic genomes[J]. Genome Research, 2003, 13(9): 2178-2189.
Adams D O, Yang S F. Ethylene biosynthesis: Identification of1-aminocyclopropane-1-carboxylic acid as an intermediate in the conversion of methionine to ethylene[J]. Proceedings of the National Academy of Science USA, 1979, 76(1): 170-174.
Teh B T, Lim K, Yong C H, et al, The draft genome of tro pical fruit durian (Durio zibethinus)[J]. Nature Genetics, 2017, 49(11): 1633-1641.
Hubbard N L, Pharr D M, Huber S C. Role of sucrose phosphate synthase in sucrose biosynthesis in ripening bananas and its relationship to the respiratory climacteric[J]. Plant Physiology, 1990, 94(1): 201-208.
do Nascimento J R O, Júnior A V, Bassinello P Z, et al. Beta-amylase expression and starch degradation during banana ripening[J]. Postharvest Biology and Technology, 2006, 40(1): 41-47.
Jourda C, Cardi C, Gibert O, et al. Lineage-specific evolutionary histories and regulation of major starch metabolism genes during banana ripening[J]. Frontiers in Plant Science, 2016, 7: 1778.
Martin C, Smith A M. Starch biosynthesis[J]. Plant Cell, 1995, 7(7): 971.
Chen F, Song Y, Li X, et al. Genome sequences of horticultural plants: past, present, and future[J]. Horticulture Research, 2019, 6: 112.
Kersey P J. Plant genome sequences: past, present, future[J]. Current Opinion in Plant Biology, 2019, 48: 1-8.
Twyford A D. The road to 10,000 plant genomes[J]. Nature Plants, 2018, 4(6): 312-313.
Wu W, YangY, He W, et al. Whole genome sequencing of a banana wild relative Musa itinerans provides insights into lineage specific diversification of the Musa genus[J]. Scientific Reports, 2016, 6: 31586.
Belser C, Istace B, Denis E, et al. Chromosome-scale assemblies of plant genomes using nanopore long reads and optical maps[J]. Nature Plants, 2018, 4(11): 879-887.
Mir R R, Reynolds M, Pinto F, et al. High-throughput phenotyping for crop improvement in the genomics era[J]. Plant Science, 2019, 282: 60-72.
Tuberosa R. Phenotyping for drought tolerance of crops in the genomics era[J]. Frontiers in Physiology, 2012, 3: 347.
Dale J, James A, Paul J-Y, et al. Transgenic Cavendish bananas with resistance to Fusarium wilt tropical race 4[J]. Nature Communication, 2017, 8(1): 7-15.
Maxmen A. CRISPR might be the bananas only hope against a deadly fungus[J]. Nature, 2019, 574: 15.