• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      陸地棉MADS-box 家族基因鑒定及組織特異性表達分析

      2020-10-10 03:03:54張愛王彩香宿俊吉張先亮史春輝劉娟娟彭云玲馬雄風
      棉花學報 2020年5期
      關鍵詞:外顯子擬南芥結構域

      張愛,王彩香,宿俊吉,張先亮,史春輝,劉娟娟,彭云玲,馬雄風,4*

      (1.甘肅農(nóng)業(yè)大學農(nóng)學院,蘭州730070;2.甘肅省干旱生境作物學重點實驗室/ 甘肅農(nóng)業(yè)大學生命科學技術學院,蘭州730070;3.中國農(nóng)業(yè)科學院棉花研究所,河南 安陽455000;4.鄭州大學農(nóng)學院,鄭州450001)

      MADS-box 基因廣泛存在于植物、動物和真菌中, 所編碼的蛋白為轉(zhuǎn)錄因子。 植物MADS-box 基因被分為Type Ⅰ型和MIKC 型兩類[1]。 Type Ⅰ型基因通常有1~2 個外顯子,編碼蛋白質(zhì)含高度保守的MADS 結構域, 依據(jù)MADS 結構域的差異進一步分為Mα、Mβ 和Mγ三類[2]。 MIKC 型基因有6~8 個外顯子,編碼蛋白包含MADS-box(M 結構域)、Intervening 結構域(I 結構域)、Keratin-like 結構域(K 結構域)和C 端結構域4 種保守結構域, 依據(jù)I 結構域的不同進一步分為MIKCC型和MIKC*型。 根據(jù)基因功能和序列特征差異,MIKCC型基因又可以分為14 個 亞 類:AGAMOUS-LIKE 17 (AGL17)、AGL15、AGL6、AGL12、SHORT VEGETATIVE PHASE (SVP)、SEPALLATA(SEP)、AGAMOUS(AG)、APETALA1 (AP1)、APETALA3/PISTILATA(AP3/PI)、GGM13 (BS)、FLOWERING LOCUSC(FLC)、TM8、TM3 和GpMADS4[3],MIKC*型基因又分為P 類基因和S 類基因[4-6]。

      在擬南芥、 水稻等模式植物的研究中發(fā)現(xiàn),MADS-box 基因所編碼的轉(zhuǎn)錄因子能夠通過形成多聚復合體的方式參與植物生長發(fā)育的生命進程。 例如,Type Ⅰ基因AGL23 參與胚乳發(fā)育、雌配子體發(fā)育和葉綠體形成[7],AGL62 基因在種子發(fā)育中起重要作用[8]。 MIKC 型基因FLC 是擬南芥春化的主要決定因素,AG 基因影響胚珠發(fā)育和花形態(tài)建成,SEP3 與生長素信號轉(zhuǎn)導有關[9-11]。此外,Zhang 等[12]在桃(Prunus persica)中發(fā)現(xiàn)PpMADS1 可以促進果實成熟,劉國琴等[13]發(fā)現(xiàn)梨(Pyrus pyrifolia white pear group)芽內(nèi)休眠的解除受PpMADS1 和PpMADS2 基因調(diào)控。 前人對MADS-box 基因的研究探索了其在植物生長發(fā)育中的作用機制, 驗證了其功能多樣化,也反映出MADS-box 基因在植物中的重要作用。

      MADS-box 基因的編碼蛋白作為1 類重要轉(zhuǎn)錄因子,參與調(diào)控棉花開花和纖維生長等發(fā)育進程。 有研究認為,棉花MADS-box 基因與細胞的伸長相關, 這類基因可能參與赤霉素(Gibberellins,GAs)合成途徑,影響棉纖維伸長[14-15]。也有研究發(fā)現(xiàn),GhMADS22 可能具有促進棉花開花、延緩衰老、通過脫落酸(Abscisic acid,ABA)信號途徑提高植物對非生物脅迫抗性的作用[16]。另有研究證明,MADS-box 家族基因GhSOC1 能促使棉花提前開花,莖生葉數(shù)量增加,過表達該基因能使棉花花器官發(fā)生變異[17]。 陸地棉(Gossypium hirsutum L.)作為棉花4 大栽培種之一,其種植面積占棉花總種植面積90%以上[18],研究陸地棉MADS-box 家族基因?qū)Ω牧缄懙孛拊缡煨?、纖維品質(zhì)等性狀具有重要意義。 周娜等[19]利用2015年最初完成的陸地棉參考基因組序列[20],通過生物信息學方法鑒定到100 個陸地棉MIKCC基因, 并認為MIKCC基因可能受miRNA 調(diào)控,從而調(diào)控陸地棉生長發(fā)育。 Ren 等[21]也鑒定出110個MIKC 型基因, 通過遺傳轉(zhuǎn)化擬南芥證明GhAGL17.9(MIKCC基因)正調(diào)控LFY 基因促進開花。 綜上所述,我們發(fā)現(xiàn)目前MADS-box 基因家族的生物信息學研究主要集中于MIKC 型基因,而對于Type Ⅰ型基因研究很少。 本研究在前人基礎上, 利用2019 年最新組裝的陸地棉參考基因組[22],從全基因組水平鑒定陸地棉Type Ⅰ型及MIKC 型MADS-box 家族全部基因,對該家族基因開展染色體定位、 多序列比對聚類分析、Motif 預測和基因結構鑒定等多方面研究, 并對該家族Type Ⅰ型及MIKC 型基因進行組織特異性表達分析,以期為棉花分子育種提供基因資源和理論依據(jù)。

      1 材料和方法

      1.1 陸地棉MADS-box 基因家族成員鑒定及染色體定位

      陸地棉全基因組蛋白序列數(shù)據(jù)來自Cotton-FGD 網(wǎng)站[23](https://cottonfgd.org/about/download.html),從Pfam 網(wǎng)站[24](https://pfam.xfam.org/)下載MADS-box 家族HMM 模型文件SRF-TF(PF00319)和K-box(PF01486),使 用HMMER 3.0 軟件[25]鑒定陸地棉MADS-box 家族基因,閾值E<1e-5。 利用Pfam 網(wǎng)站[24](https://pfam.xfam.org/)和SMART 網(wǎng) 站[26](http://smart.embl-heidelberg.de/) 進一步確認所鑒定MADS-box 基因編碼蛋白是否含有其保守結構域。從CottonFGD 網(wǎng)站[23](https://cottonfgd.org/jbrowse/) 獲取陸地棉MADS-box 家族基因物理位置信息文件,利用軟件MapInspect(http://www.mybiosoftware.com/mapinspect-compare-display-linkage-maps.html)繪制基因在染色體上的位置圖。

      1.2 系統(tǒng)進化樹構建分析

      從TAIR 網(wǎng)站[27](https://www.arabidopsis.org/)獲得擬南芥MADS-box 蛋白質(zhì)序列,通過基因組注釋信息 (http://rice.plantbiology.msu.edu/)[28]獲得水稻MADS-box 蛋白序列, 利用Pfam 網(wǎng)站[29](https://www.ebi.ac.uk/Tools/pfa/pfamscan/)確認所獲得擬南芥和水稻MADS-box 蛋白含有的結構域。 用ClustalW 將棉花MADS-box 蛋白序列與已經(jīng)分型的擬南芥和水稻MADS-box 蛋白進行序列比對分析,利用MEGA 7.0[30]構建系統(tǒng)進化樹,使用鄰近法(Neighbor-joining method),選擇成對刪除(Pairwise deletion),設置Bootstrap 值為1 000。

      1.3 陸地棉MADS-box 家族保守基序(motif)預測及基因結構分析

      使用MEME 在線工具[31](http://meme-suite.org/) 進行motif 預測,motif 最大發(fā)現(xiàn)數(shù)設為5,利用浙江大學Gossypium new sequence data release 網(wǎng) 站 (http://ibi.zju.edu.cn/cotton/) 獲 取MADS-box 基因結構注釋gff3 文件。 運用TBtools[32]對motif 分析結果及基因結構分析結果進行可視化。

      1.4 MADS-box 基因組織特異性表達分析

      從NCBI SRA 數(shù) 據(jù) 庫(https://www.ncbi.nlm.nih.gov/sra/?term=PRJNA248163) 獲得陸地棉標準系TM-1 根、莖、葉、花托、雌蕊、雄蕊、花萼、花瓣、花后5 d 纖維、花后10 d 纖維、花后20 d 纖維以及花后25 d 纖維12 個組織的RNA-seq 數(shù)據(jù)[20]。通過TopHat[33]和Cufflinks[33]比對到陸地棉基因組并組裝樣本轉(zhuǎn)錄本。通過計算標準化FPKM 值顯示基因的表達水平。 表達模式熱圖通過omicshare 網(wǎng) 站(https://www.omicshare.com/tools/Home/Soft/heatmap)呈現(xiàn)。

      2 結果與分析

      2.1 陸地棉MADS-box 家族基因鑒定

      為了全面準確鑒定陸地棉MADS-box 家族基因,利用最新組裝的陸地棉參考基因組[22],最終鑒定到陸地棉MADS-box 基因家族成員181 個,其中,Type Ⅰ基因占36.5%(66 個),MIKC 基因占63.5%(共115 個, 包括90 個MIKCC型和25個MIKC*型基因)(表1)。 運用CottonFGD 網(wǎng)站的信息, 分析MADS-box 基因理化性質(zhì), 發(fā)現(xiàn)85%的Type Ⅰ型基因具有1~2 個外顯子,編碼蛋白質(zhì)最小包含74 個氨基酸殘基(GH_D06G0314), 最 大 包 含593 個 氨 基 酸 殘 基(GH_A01G1960);97%的MIKCC基因含有6~8個外顯子, 編碼蛋白質(zhì)長度從174 氨基酸殘 基 (GH_D03G0830) 到315 氨 基 酸 殘 基(GH_A08G1545); 而MIKC*型基因的外顯子數(shù)目范圍較大(1~12),保守性相對較差,所編碼蛋白質(zhì)長度分布在63(GH_D04G0829)~373 氨基酸殘基(GH_D12G1969)。 分析顯示:相對TypeⅠ型和MIKC*型基因,MIKCC型基因外顯子數(shù)目及基因所編碼蛋白質(zhì)長度均比較保守。

      2.2 MADS-box 基因在染色體上的位置

      為了確定MADS-box 基因在陸地棉染色體上的分布,通過CottonFGD 網(wǎng)站獲得所鑒定181個MADS-box 基因的物理位置信息文件, 利用MapInspect 進行可視化展示,發(fā)現(xiàn)A 組染色體上分布78 個MADS-box 基因,D 組染色體上分布103 個,D 組染色體上分布的基因較多(圖1)。 進

      一步分析發(fā)現(xiàn), 除了A02、A07 和D07 染色體,Type Ⅰ型基因在其余23 條染色體上均有分布,其中染色體D13 上最多(8 個),在染色體A01、A03、A05、A06 和A10 上各有1 個。 MIKCC型基因在陸地棉26 條染色體上均勻分布, 其中在A01 和D01、A08 和D08、A09 和D09、A10 和D10 共4 對同源染色體上各有2 個MIKCC基因。MIKC*型基因分布于15 條染色體上,其中染色體D02 和D04 上分布最多,分別有4 個基因;A03、A05、A11 和D11 染色體上各有2 個MIKC*基 因;A02、A06、A07、A12、A13、D05、D06、D07 和D12 染色體上各含1 個MIKC*基因。

      表1 陸地棉MADS-box 基因外顯子數(shù)量及蛋白質(zhì)長度Table 1 The Number of exons and protein length of MADS-box genes in upland cotton

      圖1 MADS-box 基因在陸地棉染色體上的分布Fig. 1 Chromosomal distribution of MADS-box genes in upland cotton

      2.3 多序列比對及進化分析

      為了確定陸地棉MADS-box 基因同源進化關系,分別篩選100 個擬南芥MADS-box 蛋白序列(57 個Type Ⅰ型,43 個MIKC 型),71 個水稻MADS-box 蛋 白 序 列 (36 個Type I 型,35 個MIKC 型)(表2)。 使用MEGA 7.0 構建擬南芥、水稻和陸地棉Type I 型MADS-box 蛋白系統(tǒng)進化樹, 結果顯示陸地棉66 個Type I 型蛋白共被分為3 個亞家族,Mα、Mβ 和Mγ (表2 和圖2A), 其中40 個Type I 為Mα 類,21 個為Mγ類,二者數(shù)量均大于擬南芥和水稻Mα 及Mγ 蛋白數(shù)量;而陸地棉Mβ 蛋白僅有5 個,少于擬南芥和水稻Mβ 類蛋白數(shù)量。 構建擬南芥、水稻和陸地棉MIKC 型MADS-box 蛋白系統(tǒng)進化樹,發(fā)現(xiàn)陸地棉MIKC 型蛋白包含MIKCC型10 個亞家族 (AGL17、AG、SVP、AGL15、BS、AP3/PI、SOC1、AP1、AGL6 和SEP)以及MIKC* 型(圖2B)。進一步比較發(fā)現(xiàn), 擬南芥和水稻中分別有5 個和6個AP1 蛋白,而陸地棉中有11 個;對于AG 亞家族,擬南芥、水稻、陸地棉中成員數(shù)目分別是4、5和10 個;AP3/PI 亞家族中,擬南芥和水稻分別有2 個和3 個,而陸地棉有12 個該亞家族蛋白。 結果顯示,在AP1、AG、AP3/PI 亞家族中,陸地棉包含成員數(shù)量均超過擬南芥和水稻。 此外,陸地棉中與開花時間相關的SVP、AGL17、AGL6 亞家族成員數(shù)量是水稻或擬南芥蛋白數(shù)量的2 倍多;且在陸地棉中未發(fā)現(xiàn)FLC 蛋白,該類蛋白在擬南芥春化開花調(diào)控途徑中起關鍵作用(表2 和圖2B)。

      表2 擬南芥、水稻和陸地棉MADS-box 蛋白質(zhì)數(shù)目比較Table 2 Comparison of MADS-box proteins number in Arabidopsis, rice and upland cotton

      2.4 MADS-box 家族成員保守基序(motif)預測及基因結構分析

      為了確定MADS-box 基因編碼蛋白所含基序,通過MEME 在線工具預測分析發(fā)現(xiàn),Type Ⅰ型66 個基因所編碼蛋白均含有MADS 結構域(motif 2)(圖3A)。 MIKC 型基因編碼蛋白中,90個MIKCC蛋白均含有MADS 結構域(motif b)和K 結構域(motif e)(圖3B);25 個MIKC* 型蛋白均含有MADS 結構域(motif 7),含有K 結構域(motif 10)的有22 個(圖3C)。 綜上,通過保守基序分析可知,在MADS-box 家族中,所有成員均具有MADS 結構域,K 結構域僅在MIKC 類蛋白中存在,MADS-box 家族蛋白I 結構域和C 結構域的序列長度及結構保守程度較低。

      圖2 擬南芥、水稻、陸地棉MADS-box 家族成員的系統(tǒng)進化分析Fig. 2 Phylogenetic analysis of members of MADS-box family in Arabidopsis, rice and upland cotton

      圖3 陸地棉MADS-box 蛋白motif 預測結果Fig. 3 Motif prediction results of MADS-box proteins in upland cotton

      分析MADS-box 家族基因結構發(fā)現(xiàn):TypeⅠ型基因中GH_D04G0827、GH_D02G1381、GH_D06G0900、GH_A13G0811 和GH_D13G0779 包含8 ~12 個 外 顯 子,GH_D13G1667 、GH_D13G1333、GH_D13G0907、GH_D02G2153 和GH_D12G1194 分布3~4 個外顯子, 其余56 個Type Ⅰ型基因均有1~2 個外顯子(45 個基因含有1 個外顯子,11 個基因含有2 個外顯子)(圖4A);而MIKC 型基因中,同一亞家族成員外顯子結構和數(shù)量具有相似性, 例如,SEP、AGL6、AG和AP1 亞族的大多數(shù)成員均含有8 個外顯子,SOC1 和AP3/PI 基因含有7 個外顯子,BS 基因含有6 個外顯子(圖4B)。 基因長度分析結果顯示,Type Ⅰ型基因均未超過5 000 bp (base pair,堿基對);MIKC 型基因中, 基因長度是各亞族間最明顯的區(qū)別,例如:SEP 和MIKC* 類基因長度均不超過5 000 bp,AGL17 類基因中8 個基因的長度超過13 000 bp。 上述結果表明,Type Ⅰ型基因的外顯子數(shù)目和基因長度均小于MIKCC型基因。

      圖4 陸地棉MADS-box 基因結構Fig. 4 Gene structure of MADS-box genes in upland cotton

      2.5 陸地棉MADS-box 基因組織特異性表達分析

      根據(jù)基因表達分析結果可將Type Ⅰ型MADS-box 基因分為8 類。 第1 類基因在莖、葉、花托中表達, 第3、8 類基因主要在纖維中表達,第2、4、5、6、7 類基因分別在萼片、雌蕊、根、雄蕊和花瓣中高水平表達(圖5A)。

      MIKC 型基因根據(jù)表達分析結果可分為10類,分別在纖維(第1、2 類基因)、花器官(第3、4、6、7、9 和10 類)、根和莖(第5、8 類基因)中表達量較高,而葉中的表達水平很低(圖5B)。 對各組織中所表達基因進一步分析發(fā)現(xiàn),有4 個AG 基因(GH_A05G2521、GH_A05G2747、GH_D05G2764和GH_D05G2543)在纖維中特異表達。 1 個AP1基因(GH_D03G1119)和1 個AGL6 基因(GH_D07G1573)僅在萼片中表達,3 個SVP 基因(GH_A06G0328、GH_A12G1017 和GH_D12G0863)在花托中優(yōu)勢表達,此外,有5 個基因在雄蕊中特異表達, 包括4 個MIKC* 基因、1 個AP3/PI 基因。 有3 個SOC1 基因和3 個AGL17 基因在莖中表達量較高。綜上,MIKC 型基因主要在陸地棉花器官和纖維各發(fā)育階段表達。

      3 討論

      MADS-box 家族基因編碼蛋白是植物生長發(fā)育過程中的重要轉(zhuǎn)錄因子。 隨著多物種基因組測序完成,在擬南芥[34-35]、水稻[36-37]、小麥[38]、大豆[39]、番茄[40]、甘藍[41]、葡萄[42]、向日葵[43]和銀杏[3]等多種植物中對該家族基因進行了相關報道。 本研究利用最新組裝的陸地棉參考基因組數(shù)據(jù)[22],通過生物信息學方法鑒定出181 個陸地棉MADS-box家族基因(66 個Type Ⅰ型,115 個MIKC 型)。前期Ren 等[21]鑒定到110 個陸地棉MIKC 型基因,分布于25 條染色體, 染色體D01 上無MIKC 型基因分布。 我們的研究結果鑒定出115 個MIKC型基因,分布于陸地棉26 條染色體上,其中D01染色體上有2 個MIKCC基因(GH_D01G1353 和GH_D01G2157); 鑒定出66 個Type Ⅰ型基因,分布于23 條染色體上, 鑒定結果不同可能與所使用參考基因組有關。

      通過系統(tǒng)進化分析發(fā)現(xiàn),陸地棉中與花形態(tài)建成相關基因(如:AG 和AP3/PI)、開花時間相關基因(如:SVP、AGL17 和AGL6)超過擬南芥或水稻相同亞家族基因數(shù)目的2 倍,這可能是由于陸地棉基因組較大[44-45],而擬南芥和水稻基因組較小[46-50]造成的。 我們推測陸地棉MADS-box 基因在調(diào)控開花進程中,比擬南芥和水稻更加精細而復雜。 FLC 是MADS-box 基因所編碼蛋白,是1個開花抑制因子,高水平表達可抑制開花,低溫負調(diào)控FLC 轉(zhuǎn)錄及蛋白表達水平促進植物開花[51]。分析發(fā)現(xiàn),陸地棉缺失FLC 基因,這與前人研究結果一致[52],可能與陸地棉開花不需要春化有關。 此外,本次鑒定也未發(fā)現(xiàn)陸地棉AGL12 類基因, 且擬南芥與水稻的AGL12 基因均與陸地棉AP1 基因聚到1 個亞家族,這與前期Ren 等[21]的研究結果(陸地棉有2 個AGL12 基因)不同,可能與所使用參考基因組有關。

      根據(jù)前人報道,MADS-box 基因參與雌配子體發(fā)育[7]、種子發(fā)育[53]、胚及胚乳發(fā)育[8]、控制雄蕊及花瓣發(fā)育[54]、心皮形態(tài)建成[55]、與不同物種間生殖器官分界決定有關[56],并且與棉花纖維細胞伸長有關[14-15]。 通過組織特異性表達分析發(fā)現(xiàn),陸地棉MADS-box 基因在花器官和纖維中高水平表達, 例 如:Type Ⅰ型 基 因 中GH_D05G2910、GH_D09G1491 和GH_D02G2551 在纖維發(fā)育初期特異性表達,GH_A08G2258、GH_D06G1276、GH_D06G1275、GH_D10G1756 在纖維發(fā)育后期特異表達。MIKC 基因中AP3/PI 基因主要在花器官中表達,AP1 基因主要在萼片中表達,AG 基因主要在纖維中高水平表達,BS 和AGL15 類基因均可在纖維中被發(fā)現(xiàn),這些基因可能參與陸地棉開花和纖維發(fā)育調(diào)控,具體功能還需通過遺傳轉(zhuǎn)化等進一步研究。

      圖5 MADS-box 基因在陸地棉不同組織中的表達分析Fig. 5 Expression analysis of MADS-box genes from different tissues in upland cotton

      4 結論

      通過生物信息學方法,鑒定了181 個陸地棉MADS-box 家族基因,包括Type Ⅰ和MIKC 型2大類基因。 染色體定位結果顯示,Type Ⅰ基因分布于陸地棉23 條染色體,MIKC 型基因分布在陸地棉26 條染色體上。 聚類分析發(fā)現(xiàn), 陸地棉Type I 型蛋白分為3 個亞家族,MIKC 型蛋白包括MIKCC型 (包含10 個亞家族) 以及MIKC*型。Motif 預測結果顯示,陸地棉MADS-box 蛋白均含有MADS 結構域。 基因結構分析可知,MADS-box 基因外顯子和內(nèi)含子結構及長度在同一亞家族內(nèi)具有相似性。 組織特異性表達分析顯示,12 個組織中均有Type Ⅰ型基因參與表達,MIKC 基因主要在陸地棉花器官和纖維各發(fā)育階段表達量較高。對陸地棉MADS-box 家族的生物信息學分析,為了解陸地棉開花和纖維發(fā)育的基因組學研究提供了有益的借鑒,對于揭示棉花纖維品質(zhì)等重要性狀的遺傳調(diào)控機制及分子育種具有一定的理論意義和應用價值。

      猜你喜歡
      外顯子擬南芥結構域
      擬南芥:活得粗糙,才讓我有了上太空的資格
      外顯子跳躍模式中組蛋白修飾的組合模式分析
      外顯子組測序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
      蛋白質(zhì)結構域劃分方法及在線服務綜述
      外顯子組測序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
      尿黑酸對擬南芥酪氨酸降解缺陷突變體sscd1的影響
      兩種LED光源作為擬南芥生長光源的應用探究
      擬南芥干旱敏感突變體篩選及其干旱脅迫響應機制探究
      重組綠豆BBI(6-33)結構域的抗腫瘤作用分析
      組蛋白甲基化酶Set2片段調(diào)控SET結構域催化活性的探討
      宝丰县| 徐闻县| 嘉祥县| 上蔡县| 龙胜| 晴隆县| 麻城市| 临海市| 紫金县| 友谊县| 康马县| 福清市| 江达县| 绥棱县| 米易县| 双辽市| 乐业县| 巴彦淖尔市| 庄浪县| 汾西县| 鄂州市| 冕宁县| 同仁县| 镶黄旗| 庆元县| 伊宁县| 禄劝| 涞源县| 赣榆县| 乐陵市| 宁陵县| 宜良县| 炉霍县| 庄河市| 三明市| 遂川县| 静安区| 新巴尔虎左旗| 正阳县| 崇礼县| 郯城县|