• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      楊樹和柳樹基因組共線性的可視化分析

      2018-05-18 01:25:12徐逸卿杜思源蔣安納王啟昂薛倚鷺
      江蘇農(nóng)業(yè)科學(xué) 2018年8期
      關(guān)鍵詞:共線性同源柳樹

      徐逸卿,杜思源,蔣安納,王啟昂,薛倚鷺

      (南京林業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院,江蘇南京210037)

      在楊柳科中,楊屬和柳屬是姐妹屬[1],它們廣泛地分布在北半球地區(qū),具有適應(yīng)力強(qiáng)、生長迅速、易繁殖、用途廣等特點(diǎn),是維護(hù)生態(tài)環(huán)境和解決木材短缺的重要物種[2]。楊屬和柳屬各自擁有相對較小的基因組,隨著研究的大量開展以及基因組資源的迅速增長,楊柳科植物成為了木本植物在遺傳學(xué)研究中的模式生物。在楊屬中,毛果楊(Populus trichocarpa)的全基因組測序及染色體的組裝早在2006年就已經(jīng)完成[3],是第一個(gè)被測序的木本植物,之后楊屬的物種陸續(xù)被測序;在柳屬中,簸箕柳(Salix suchowensis)的全基因組測序、染色體組裝分別于 2014、2016年完成[4-5]。細(xì)胞遺傳學(xué)研究表明,楊屬和柳屬這2個(gè)屬主要包含二倍體植物,其單倍型染色體數(shù)目是19對(n=19)[6]。在將楊樹的基因組和柳樹的遺傳圖譜進(jìn)行比較時(shí),研究人員經(jīng)發(fā)現(xiàn)了染色體裂變、融合等現(xiàn)象[7]。但是遺傳圖譜與基因組相比,精度較低,因此需要通過對基因組信息進(jìn)行分析來研究楊柳科的進(jìn)化機(jī)制。

      基因共線性是指在具有同源性關(guān)系的2個(gè)物種中,其基因組中有共同的連鎖基因,且同源基因的相對順序具有較高保守性的現(xiàn)象[8]。在生物進(jìn)化中,基因組會在全基因組復(fù)制、染色體重組、染色體倒位和易位等過程中發(fā)生結(jié)構(gòu)和數(shù)量的變化[9-10]。因此,基因組的共線性分析在非編碼序列的確認(rèn)[11]、新測序物種的注釋[12]和全基因組復(fù)制事件的估計(jì)[8]等過程中具有重要作用。本研究使用 MCScanX[13]、VGSC[14]這2個(gè)軟件分別進(jìn)行共線性分析和作圖,對楊樹和柳樹的種內(nèi)、種間基因組同源關(guān)系進(jìn)行分析,并繪制相應(yīng)的關(guān)系圖,進(jìn)而探討導(dǎo)致楊屬和柳屬進(jìn)化的基因組機(jī)制。本研究結(jié)果可為研究楊柳科祖先基因組復(fù)制事件提供重要依據(jù)。

      1 材料與方法

      1.1 試驗(yàn)數(shù)據(jù)

      本試驗(yàn)采用楊柳科的毛果楊和簸箕柳這2個(gè)物種進(jìn)行基因組內(nèi)和基因組間的共線性分析,從而確定楊樹和柳樹的進(jìn)化機(jī)制。毛果楊是第一個(gè)被用于全基因組測序的樹種,具有生長速度快、基因組較小、經(jīng)濟(jì)價(jià)值高等特點(diǎn)。2006年,Tuskan等利用鳥槍測序法完成毛果楊基因組的測序,結(jié)果表明,毛果楊基因組內(nèi)含有堿基對4.85億個(gè),染色體19對,推測基因數(shù)量為45 555個(gè)[3]。隨著國內(nèi)外有關(guān)研究的大量開展,毛果楊現(xiàn)已成為木本植物研究中的模式物種[15]。毛果楊的全基因組信息可從JGI數(shù)據(jù)庫[16]下載,下載地址為http://genome.jgi.doe.gov/pages/dynamicOrganismDownload.jsf?organism=Ptrichocarpa。由于大多數(shù)林木研究物種的世代周期較長,多為高大的喬木,實(shí)際操作麻煩,而柳屬中的簸箕柳的世代周期只有1年,個(gè)體較小,取材方便,并且易于栽培,對環(huán)境要求不高,可以極大提高研究人員的試驗(yàn)效率,因此簸箕柳成為了木本植物研究的新熱點(diǎn)。Dai等于2014年完成了簸箕柳的全基因組測序[4],共發(fā)現(xiàn)了26 599個(gè)編碼基因,其中20 261個(gè)基因與楊樹基因同源。柳樹的全基因組信息發(fā)布的網(wǎng)址為 http://115.29.234.170/willow,可以直接下載。下載的數(shù)據(jù)包括全基因組的序列(Fasta格式,https://en.wikipedia.org/wiki/FASTA_format)和基因注釋文件(GFF格式,www.gmod.org/wiki/GFF3),這些都被廣泛應(yīng)用于常見的基因組裝軟件和數(shù)據(jù)庫。

      1.2 試驗(yàn)工具軟件

      全基因組數(shù)據(jù)為科研人員提供了大量的信息,在全基因組水平上進(jìn)行共線性分析是比較基因組學(xué)的重要研究內(nèi)容。因此,越來越多研究共線性的方法被提出,早期的軟件多采用傳統(tǒng)的聚類算法,如 OrthoCluster[17-18]、ADHoRe[19]和 Maxgap Clusters by Multiple Sequence Comparison(簡 稱MCMuSeC)[20],對鄰近的基因?qū)M(jìn)行匹配。這些軟件在計(jì)算過程中由于影響因素較多,結(jié)果的可靠性并不是很高。另一種常見的算法是使用動(dòng)態(tài)算法線性雙向匹配基因?qū)Γ⑶依谩板^基因”對相鄰的線性基因進(jìn)行打分。此類軟件包括ColinearScan[21]、MCScanX[8]和 SyMAP[12]等。ColinearScan利用基因組蛋白質(zhì)的比對序列確定同源基因?qū)κ欠翊嬖冢行У仡A(yù)測了待測基因的共線性。SyMAP的優(yōu)點(diǎn)在于尋找共線性基因的速度很快,但是由于參數(shù)的設(shè)置只能識別大片段的共線性基因,小片段的共線性基因很容易被漏掉。MCScanX(簡稱Multiple Collinearity Scan)是目前最流行的共線性分析軟件,它采用匹配的錨點(diǎn)掃描多個(gè)基因中的序列或子序列,然后對假定的同源染色體區(qū)域進(jìn)行匹配計(jì)分,最后給出計(jì)算的共線性分值。綜上所述,本試驗(yàn)選用MCScanX軟件作為共線性分析的主要工具。

      上述共線性分析軟件的側(cè)重點(diǎn)集中在數(shù)據(jù)的處理上,缺少了對下游數(shù)據(jù)分析結(jié)果的可視化,絕大多數(shù)都沒有提供可視化的輸出接口。因此,近年來出現(xiàn)了一些專門進(jìn)行共線性圖形化的軟件,例如 SynChro[22]、GSV[23]和 Easyfig[24],但是這些軟件只能提供雙線圖的顯示,顯示效果不直觀并且也不利于導(dǎo)出和發(fā)表。Circos是科學(xué)可視化領(lǐng)域一個(gè)著名的圖形化工具,它可以將基因匹配與比較分析異同的結(jié)果用圓形圖案表示出來,提供點(diǎn)陣圖和矢量圖的輸出,在生物信息學(xué)研究中很受歡迎[25]。但它也僅限于圓形圖形的處理,使得共線性研究受到了一定程度的限制。為了彌補(bǔ)這些不足,MCScanX設(shè)計(jì)并實(shí)現(xiàn)了15個(gè)用于共線性分析和顯示的工具,并提供了點(diǎn)圖、圓圖、雙線圖等多種展示類型,實(shí)用性很強(qiáng)。然而,MCScanX只能允許用戶在命令行的環(huán)境中進(jìn)行操作,并且只能輸出低分辨率的點(diǎn)陣圖,在高通量測序逐漸普及的今天,成為了數(shù)據(jù)精細(xì)化分析的瓶頸。VGSC(A Web-Based Vector Graph Toolkit of Genome Synteny and Collinearity)[14]是 2016年最新發(fā)布的共線性分析作圖的在線平臺,自發(fā)布以來,該在線平臺已經(jīng)在生物學(xué)領(lǐng)域得到了廣泛應(yīng)用,不僅推動(dòng)了生物進(jìn)化分析的發(fā)展,也給基因家族分析、結(jié)構(gòu)變異、新物種全基因組注釋等方面帶來了極大的便利。該平臺最大的優(yōu)勢就在于分析結(jié)果的矢量圖輸出能力。如表1所示,經(jīng)過比較,本試驗(yàn)選用VGSC繪制楊、柳物種基因組內(nèi)與組間共線性關(guān)系圖。

      表1 共線性可視化軟件基本信息

      VGSC可以利用用戶上傳的GFF格式的基因注釋文件和共線性分析生成的關(guān)系文件計(jì)算并生成對應(yīng)的圖形結(jié)果。如圖1所示,VGSC提供了圓圖、條狀圖、散點(diǎn)圖和雙線圖4種不同的圖形。用戶可以根據(jù)研究的需要,選取并創(chuàng)建合適類型的圖形,并且每種類型都支持高分辨率的點(diǎn)陣圖(如BMP、JPEG和PNG)和高清晰度的矢量圖的輸出方式(如PDF、EPS和SVG)。VGSC的一個(gè)重要的特性就是它的矢量圖輸出能力,如圖2演示了點(diǎn)陣圖像和矢量圖形在細(xì)節(jié)表現(xiàn)中的差異,隨著高通量測序的不斷發(fā)展,新測序技術(shù)帶來的海量數(shù)據(jù)常常生成巨幅的運(yùn)算結(jié)果。因此,在進(jìn)行比對時(shí),矢量圖形的大小無關(guān)性和方向無關(guān)性的特點(diǎn),對研究的開展及其報(bào)告的展示產(chǎn)生了積極的意義。

      1.3 分析過程

      楊柳基因組內(nèi)、基因組間的共線性分析流程分別如圖3、圖4所示。在進(jìn)行基因組內(nèi)共線性研究時(shí),第1步是利用序列比對檢索工具BLASTp,分別將該物種內(nèi)的每條染色體與其他所有染色體進(jìn)行蛋白質(zhì)序列比對,得到各自的比對結(jié)果;在進(jìn)行組間共線性分析時(shí),對楊樹基因組和柳樹基因組進(jìn)行1次全基因組比對檢索。第2步是利用MCScanX計(jì)算比對結(jié)果的BLAST文件和GFF格式的基因注釋進(jìn)行計(jì)算,得到共線性分析結(jié)果collinearity文件。第3步是在VGSC的在線服務(wù)平臺上傳得到的collinearity文件和GFF格式的基因注釋文件,配置參數(shù)并作圖得到共線性圖形,保存為矢量圖形便于進(jìn)一步分析。

      具體地講,圖5、圖6分別演示了第3步VGSC對楊樹、柳樹基因組內(nèi)和基因組間共線性作圖的參數(shù)。VGSC的圖形繪制流程與常見的圖形化工具類似,首先,它提供了圓圖、條狀圖、散點(diǎn)圖和雙線圖4種不同的圖形,其中圓圖能夠直觀展現(xiàn)1條染色體和多條染色體之間的共線性關(guān)系,雙線圖則更適合展現(xiàn)2條染色體間的共線性關(guān)系。在進(jìn)行基因組內(nèi)和組間共線性繪圖時(shí),我們分別選取圓圖、雙線圖作為輸出圖形。其次,上傳BLASTp工具的比對結(jié)果和GFF基因注釋文件。再次,對繪圖參數(shù)進(jìn)行配置,包括圖形的大小、輸出文件格式和共線性分析的染色體名稱。

      2 結(jié)果與分析

      以上共線性分析及作圖對于揭示楊柳科植物的近源關(guān)系具有積極的作用。通過觀察楊樹的共線性分析圓形圖可以發(fā)現(xiàn),各個(gè)染色體間同源片段的整體分布情況與Tuskan等的研究結(jié)果[3]大致一致,但是由于基因組信息的不斷更新而造成了一些小差異(圖7)。楊樹基因組內(nèi)的每條染色體都可以在其他染色體上找到同源片段,柳樹基因組內(nèi)也是如此。通過比較楊樹和柳樹對應(yīng)的染色體的同源片段分布情況,我們可以發(fā)現(xiàn)只有Ⅰ、Ⅲ、Ⅵ和ⅩⅥ這4條染色體的同源關(guān)系圖存在較大差異(圖7),其余15條染色體幾乎一樣。通過試驗(yàn)還可以發(fā)現(xiàn),楊樹的1號染色體的上半部分的同源基因片段在其3號染色體上,而柳樹的1號染色體的上半部分的同源基因片段在6號染色體上。楊樹的16號染色體的同源基因片段在其6號染色上,而柳樹16號染色體的同源基因片段基本上在3號染色體上。假設(shè)楊樹和柳樹基因組之間的差異是由1號染色體和16號染色體之間的重排引起的,為了驗(yàn)證此猜想,可以對楊樹和柳樹基因組中相應(yīng)的染色體進(jìn)行共線性分析比較。如圖8所示,在對楊樹和柳樹基因組間共線性進(jìn)行分析時(shí),除了1號染色體和16號染色體這2組染色體間存在較大的差異,其他組染色體間的共線性關(guān)系都很高。而楊樹1號染色體與柳樹16號染色體,以及柳樹1號染色體與楊樹16號染色體共線性分析結(jié)果顯示,楊樹1號染色體的上半部分與柳樹的16號染色體同源,而下半部分與柳樹的1號染色體同源。楊樹16號染色體的同源片段存在于柳樹1號染色體的上半部分。這一發(fā)現(xiàn)為發(fā)生在1號染色體和16號染色體間的斷裂融合提供了有力證據(jù)。除此之外,楊樹和柳樹基因組內(nèi)和基因組間的共線性分析結(jié)果表明,還存在一些染色體間的重排現(xiàn)象。Hou等采用簡單序列重復(fù)(simple sequence repeats,簡稱SSR)標(biāo)記分析進(jìn)一步驗(yàn)證了楊樹、柳樹的1號染色體與16號染色體間發(fā)生了重排[5]。

      3 討論與結(jié)論

      共線性分析軟件的出現(xiàn)極大地推動(dòng)了基因共線性分析的發(fā)展,近年來,更多的工具能夠讓用戶以在線形式快速高效地將共線性分析結(jié)果以高清晰度的矢量圖或高質(zhì)量點(diǎn)陣圖的方式輸出。通過比對分析VGSC繪制的楊樹、柳樹基因組內(nèi)和基因組間共線性關(guān)系圖,筆者發(fā)現(xiàn)基因組內(nèi)不同染色體間存在大量重復(fù)片段,并且基因組間大多數(shù)染色體間的共線性關(guān)系很高。這一現(xiàn)象說明,楊樹和柳樹的分化是在古四倍體基因組二倍化之后完成的。經(jīng)過基因組間的共線性分析,筆者發(fā)現(xiàn)了2個(gè)大的染色體重排現(xiàn)象,由此推測1號染色體與16號染色體間發(fā)生了斷裂融合,這一結(jié)果說明楊樹和柳樹沒有同時(shí)進(jìn)行分化,而是一個(gè)物種是由另一個(gè)物種進(jìn)化而來的。Dorn等研究表明,楊樹的進(jìn)化早于柳樹,因此可以推測楊樹向柳樹進(jìn)化的過程:古四倍體祖先的基因組在染色體的斷裂融合之后進(jìn)行了二倍化,由此出現(xiàn)了楊樹[26-27]。楊樹在進(jìn)化的過程中,其1號染色體和16號染色體間發(fā)生了重排事件,進(jìn)而出現(xiàn)了現(xiàn)代柳樹的祖先。綜上所述,本研究結(jié)合了MCScanX的分析工具和VGSC的高質(zhì)量圖形化服務(wù),更直觀地再現(xiàn)了楊樹和柳樹基因組內(nèi)和基因組間染色體基因的對應(yīng)關(guān)系,推測了楊屬和柳屬進(jìn)化的機(jī)制,為楊柳科植物的起源提供了重要依據(jù),為更好地認(rèn)識楊柳科植物打下了基礎(chǔ)。

      參考文獻(xiàn):

      [1]Heywood V H,Moore D M,Richardson IB K,et al.Flowering plants of the world[M].Oxford:Oxford University Press,1993:316.

      [2]Isebrands JG,Richardson J.21st session of the international poplar commission(IPC 2000).Poplar and willow culture:meeting the needs of society and the environment[J].Art Education,2000,41(1):9-17.

      [3]Tuskan G A,di Fazio S,Jansson S,et al.Supporting online material for the genome of black cottonwood,Populus trichocarpa(Torr.&Gray)[J].Science,2006,313(5793):1596-1604.

      [4]Dai X,Hu Q,CaiQ,etal.Thewillow genome and divergentevolution from poplar after the common genome duplication[J].Cell Research,2014,24(10):1274-1277.

      [5]Hou J,Ye N,Dong Z,et al.Major chromosomal rearrangements distinguish willow and poplar after the ancestral“Salicoid”genome duplication[J].Genome Biology&Evolution,2016,8(6):1868-1875.

      [6]Blackburn K B,Harrison JW H.A preliminary account of the chromosomes and chromosome behaviour in the salicaceae[J].Annals of Botany,1924,38(150):361-378.

      [7]Berlin S,Lagercrantz U,Arnold S V,et al.High-density linkage mapping and evolution of paralogs and orthologs in Salix and Populus[J].BMC Genomics,2010,11(1):129.

      [8]Tang H,Bowers JE,Wang X,et al.Synteny and collinearity in plant genomes[J].Science,2008,320(5875):486-488.

      [9]Dujon B,Sherman D,F(xiàn)ischer G,et al.Genome evolution in yeasts[J].Nature,2004,430(6995):35-44.

      [10]Nakatani Y,Takeda H,Kohara Y,et al.Reconstruction of the vertebrate ancestral genome reveals dynamic genome reorganization in early vertebrates[M].Japan:Springer,2011.

      [11]Lyons E,Pedersen B,Kane J,et al.Finding and comparing syntenic regions among Arabidopsis and the outgroups papaya,poplar,and grape:CoGe with rosids[J].Plant Physiology,2008,148(4):1772-1781.

      [12]Soderlund C,Bomhoff M,Nelson W M.SyMAP v3.4:a turnkey synteny system with application to plant genomes[J].Nucleic Acids Research,2011,39(10):e68.

      [13]Wang Y,Tang H,Debarry J D,et al.MCScanX:a toolkit for detection and evolutionary analysis of gene synteny and collinearity[J].Nucleic Acids Research,2012,40(7):e49.

      [14]Xu Y,Bi C,Wu G,et al.VGSC:A web-based vector graph toolkit of genome synteny and collinearity[J]. Biomed Research International,2016,2016(1):7823429.

      [15]張 勇,張守攻,齊力旺,等.楊樹——林木基因組學(xué)研究的模式物種[J].植物學(xué)報(bào),2006,23(3):286-293.

      [16]Grigoriev IV,Nordberg H,Shabalov I,et al.The genome portal of the Departmentof Energy JointGenome Institute[J].Nucleic Acids Research,2012,40:D26-D32.

      [17]Vergara IA,Chen N.Using OrthoCluster for the detection ofsynteny blocks among multiple genomes[M]//Current Protocols in Bioinformatics.John Wiley&Sons Inc,2009.

      [18]Zeng X,Nesbitt M J,Pei J,etal.OrthoCluster:a new tool formining synteny blocks and applications in comparative genomics[C]//Proceedings of the International Conference on Extending Database TechnologyAdvances in Database Technology,2008:656-667.

      [19]Vandepoele K,Saeys Y,Simillion C,et al.The automatic detection of homologous regions(ADHoRe) and its application to microcolinearity between Arabidopsis and rice[J]. Genome Research,2002,12(11):1792.

      [20]Ling X,He X,Xin D.Detecting gene clusters under evolutionary constraint in a large number of genomes[J].Bioinformatics,2009,25(5):571-577.

      [21]Wang X,Shi X,Li Z,et al.Statistical inference of chromosomal homology based on gene colinearity and applications to Arabidopsis and rice[J].BMC Bioinformatics,2006,7(1):447.

      [22]Drillon G,Carbone A,F(xiàn)ischer G.SynChro:a fast and easy tool to reconstruct and visualize synteny blocks along eukaryotic chromosomes[J].PLoSOne,2014,9(3):e92621.

      [23]Revanna K V,Chiu C C,Bierschank E,et al.GSV:a web-based genome synteny viewer for customized data[J]. BMC Bioinformatics,2011,12(1):316.

      [24]Sullivan M J,Petty N K,Beatson SA.Easyfig:a genome comparison visualizer[J].Bioinformatics,2011,27(7):1009-1010.

      [25]Gascoyne R D,Krzywinski M,Birol I,et al.Circos:an information aesthetic for comparative genomics[J].2009,

      [26]Dorn R D.A synopsis of American Salix[J].Canadian Journal of Botany,2011,54(24):2769-2789.

      [27]Skvortsov A K. Willows of Russia and adjacent countries:taxonomical and geographical revision[M].Joensuu:University of Joensuu Press,1999:1-307.

      猜你喜歡
      共線性同源柳樹
      藥食同源
      ——紫 蘇
      兩岸年味連根同源
      以同源詞看《詩經(jīng)》的訓(xùn)釋三則
      銀行不良貸款額影響因素分析
      文氏圖在計(jì)量統(tǒng)計(jì)類課程教學(xué)中的應(yīng)用
      ——以多重共線性內(nèi)容為例
      不完全多重共線性定義存在的問題及其修正建議
      柳樹
      會治病的柳樹
      虔誠書畫乃同源
      柳樹的春天
      陵水| 娱乐| 和龙市| 陇西县| 肇庆市| 那曲县| 大理市| 玛纳斯县| 天祝| 易门县| 什邡市| 体育| 贡嘎县| 黔江区| 高要市| 石林| 合川市| 改则县| 盈江县| 花垣县| 襄樊市| 思茅市| 汉寿县| 大厂| 七台河市| 太原市| 汾阳市| 博野县| 龙陵县| 奉贤区| 武宣县| 卢氏县| 洮南市| 南雄市| 望奎县| 八宿县| 张家川| 阿拉善右旗| 谢通门县| 吉安市| 绥阳县|