牟少華, 李 娟, 李雪平, 高 健
( 國(guó)際竹藤中心 竹藤科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室, 北京 100102 )
毛竹 () 是我國(guó)獨(dú)有的傳統(tǒng)經(jīng)濟(jì)竹種(江澤慧,2002),分布范圍較廣,現(xiàn)有毛竹變型20多種(馬乃訓(xùn)等,2014)。毛竹變型在形態(tài)上表現(xiàn)出豐富的多態(tài)性,尤其是稈色性狀方面差異表現(xiàn)顯著,例如花毛竹稈為黃色,有寬窄不等的綠色縱條紋;而綠皮花毛竹稈為綠色,但節(jié)間有淡黃色細(xì)縱條紋。稈色的變異大大豐富了園林觀賞種類,提高了園林觀賞價(jià)值。毛竹竹稈性狀的遺傳變異是遺傳育種工作關(guān)注的重點(diǎn)。
目前,高通量測(cè)序技術(shù)可以分析一個(gè)物種的基因組的全貌,已經(jīng)在谷子 (Bai et al., 2013; 賈小平等,2019)、水稻 (Takagi et al., 2013)、大豆 (Qi et al., 2014; Zhou et al., 2015; 張彥威等,2016)、黃秋葵(張少平等,2017)、厚樸(尹彥棚等,2020)、菜豆 (Jeremy et al., 2010)和番茄 (Lin et al., 2014)等植物上得到了廣泛應(yīng)用。
近年來,隨著分子生物學(xué)和組學(xué)技術(shù)的發(fā)展,毛竹全基因組序列獲得公布 (Peng et al., 2013),一些與毛竹性狀相關(guān)的基因家族,如2(Wu et al., 2015)、( Bai et al., 2016)、(Sun et al., 2016)、-like(Pan et al., 2016)、-(Chen et al., 2017)、(Xie et al., 2019)、-(Liu et al., 2016)等已進(jìn)行鑒定和功能驗(yàn)證,但是在基因組層面上的研究較少,特別是毛竹變型稈色相關(guān)的研究薄弱,僅對(duì)黃槽毛竹和黃皮花毛竹兩個(gè)毛竹變型基因組序列變異進(jìn)行初步探索 (牟少華等,2020),這在一定程度上限制了毛竹遺傳育種的應(yīng)用發(fā)展。從基因水平上揭示毛竹的變異程度,是分析毛竹變型形態(tài)差異產(chǎn)生原因的重要手段之一。因此,開展毛竹變型基因組研究,揭示毛竹變型全基因組突變類型,探究黃酮類和硝酸還原酶等代謝途徑相關(guān)基因,對(duì)解析毛竹豐富的遺傳多樣性以及性狀相關(guān)的遺傳變異具有重要意義。
本研究以黃皮毛竹等4個(gè)有代表性的竹稈變異毛竹變型為研究對(duì)象,毛竹全基因組作為參考基因組,采用高通量測(cè)序技術(shù),構(gòu)建全基因組數(shù)據(jù)庫,并利用生物信息學(xué)的方法對(duì)獲得的核酸序列組裝,檢測(cè)并注釋其單核苷酸多態(tài)性(single nuclotide polymorphisms,SNP)、結(jié)構(gòu)變異(structural variation,SV)和小片段插入缺失(insertion and deletion,InDel)等,注釋變異基因功能,積累基因組序列數(shù)據(jù),以便為從全基因組水平上深入地分析毛竹的遺傳變異,為遺傳育種提供遺傳基礎(chǔ)。
供試材料選自國(guó)際竹藤中心安徽太平試驗(yàn)中心種質(zhì)資源圃。選取4個(gè)毛竹變型(表1)適量新鮮幼嫩的葉片,經(jīng)液氮罐中速凍后,放入-80 ℃冰箱凍存?zhèn)溆谩?/p>
表 1 四個(gè)毛竹變型樣品簡(jiǎn)表Table 1 Brief introduction of four variant samples of Moso bamboo
1.2.1 基因組測(cè)序 毛竹變型葉片DNA提取(Zidani et al., 2005)后,經(jīng)過打斷、損傷修復(fù)及連接接頭、PCR富集、文庫質(zhì)量檢測(cè),建成測(cè)序文庫,在Illunima Hiseq 2500測(cè)序平臺(tái)上運(yùn)行獲得原始數(shù)據(jù),將數(shù)據(jù)過濾后得到高質(zhì)量數(shù)據(jù)。
1.2.2 比對(duì)統(tǒng)計(jì) 使用BWA軟件 (Li & Durbin, 2009) 將測(cè)序數(shù)據(jù)比對(duì)定位到已測(cè)序的毛竹基因組的位置,統(tǒng)計(jì)測(cè)序深度和基因組覆蓋度等信息。
1.2.3 檢測(cè)SNP、InDel和SV 使用Picard軟件 (Gordon et al., 2012) 去重復(fù)和GATK軟件 (Mckenna et al., 2010) 預(yù)處理后,檢測(cè)SNP和InDel變異。使用BreakDancer軟件 (Chen et al., 2009) 檢測(cè)SV變異,具體方法參照牟少華等(2020)。
1.2.4 注釋SNP、InDel和SV 運(yùn)用SnpEff軟件 (Cingolani et al., 2012)注釋SNP、InDel和SV,具體方法參照牟少華等(2020)。
1.2.5 注釋功能基因 運(yùn)用BLAST軟件,對(duì)篩選得到的功能可能變異基因的基因序列與GO (Ashburner et al., 2000)、COG (Tatusov et al., 2000)和KEGG (Minoru et al., 2004)三大功能數(shù)據(jù)庫,進(jìn)行BLAST比對(duì),得到基因注釋。
4個(gè)竹種通過高通量測(cè)序得到測(cè)序數(shù)據(jù)。金絲毛竹樣品(R02)過濾后的Clean Reads最少,為82 276 884 bp;花毛竹樣品 (R04) 的Clean Reads最多,為112 054 728 bp。定位到毛竹參考基因組的占所有Clean Reads數(shù)的百分比在99.45%以上,雙端均定位到毛竹參考基因組上并且距離符合測(cè)序片段的長(zhǎng)度分布的占所有Clean Reads數(shù)的百分比在88%左右,說明參考基因組選擇合適,且相關(guān)實(shí)驗(yàn)過程不存在污染,測(cè)序Reads的比對(duì)率會(huì)高于70%。另外,比對(duì)率的4個(gè)毛竹變型與毛竹參考基因組親緣關(guān)系較近、基因組組裝質(zhì)量高,而且Reads測(cè)序質(zhì)量高。4個(gè)樣品平均覆蓋深度均在10×左右(表2)。
表 2 四個(gè)樣品數(shù)據(jù)產(chǎn)出統(tǒng)計(jì)表Table 2 Output statistics among four samples
2.2.1 SNP檢測(cè) 4個(gè)毛竹樣品檢測(cè)后獲得SNP位點(diǎn)統(tǒng)計(jì)表(表3)。其中,花毛竹樣品(R04)的SNP數(shù)量最多,為1 691 715;綠皮花毛竹樣品(R03)的SNP數(shù)量最少,為1 534 648。4個(gè)樣品中,轉(zhuǎn)換類型(transition, Ti) SNP數(shù)量與顛換類型(transversion, Tv) SNP數(shù)量的比值Ti/Tv在3.05~3.10之間,說明這些毛竹變型轉(zhuǎn)換比顛換更容易發(fā)生。雜合類型 (heterozygosity, Het) SNP數(shù)量為純合類型 (homozygosity, Homo) SNP數(shù)量的10倍左右,雜合比率為88.53%~92.01%。其中,花毛竹樣品(R04)雜合比率最高,為92.01%,說明其雜合程度最高。綠皮花毛竹樣品(R03)雜合比率最低,為88.53%。
表 3 四個(gè)樣品SNP位點(diǎn)統(tǒng)計(jì)表Table 3 SNP loci statistics in four samples
根據(jù)4個(gè)毛竹樣品與參考基因組的比對(duì)結(jié)果,匯總樣品間SNP的統(tǒng)計(jì)結(jié)果見表4,表中各數(shù)值為對(duì)應(yīng)的橫縱兩樣品之間的SNP數(shù)。從表中可以看出,金絲毛竹(R02)與綠皮花毛竹樣品(R03)間的SNP數(shù)最多。
表 4 四個(gè)樣品間的SNP統(tǒng)計(jì)表Table 4 Summary of SNPs detected between four samples
2.2.2 SNP注釋 對(duì)4個(gè)樣品SNP進(jìn)行注釋,獲得其變異位點(diǎn)發(fā)生的區(qū)域或類型(圖1)。4個(gè)毛竹變型發(fā)生在編碼區(qū)(coding sequence,CDS)區(qū)域內(nèi)的SNP數(shù)量占比均為2%左右,其中同義突變占48%左右,非同義突變占51%左右。非同義突變率與同義突變率的比值大于1,預(yù)示著有正向選擇效應(yīng)。
圖 1 黃皮毛竹(R01)的SNP注釋圖Fig. 1 SNP annotations pie of Phyllostachys edulis f. holochrysa (R01)
2.3.1 InDel檢測(cè) 對(duì)4個(gè)毛竹變型InDel進(jìn)行統(tǒng)計(jì)(表5),可以發(fā)現(xiàn)4個(gè)樣品全基因組范圍檢測(cè)出的InDel總數(shù)范圍為271 648~292 253,其中插入類型的突變總數(shù)略低于缺失突變總數(shù);編碼區(qū)檢測(cè)出的InDel總數(shù)為4 711~4 877,其中插入突變總數(shù)為缺失突變的67%左右。各樣品中,全基因組范圍內(nèi)純合突變數(shù)約為雜合突變數(shù)的2倍,編碼區(qū)純合突變數(shù)略低于雜合突變數(shù)。
表 5 四個(gè)樣品InDel統(tǒng)計(jì)表Table 5 Summary of InDels detected in four samples
對(duì)4個(gè)樣品各區(qū)域的InDel長(zhǎng)度進(jìn)行統(tǒng)計(jì)發(fā)現(xiàn),編碼區(qū)存在較多的+1、-1、+ 3、-3 類型突變,而基因組范圍存在較多的+1、-1、+ 2、-2 類型突變。其中,數(shù)值代表InDel的長(zhǎng)度(10 bp以內(nèi));大于0為插入;小于0為缺失。
將4個(gè)樣品的InDel進(jìn)行兩兩比較,統(tǒng)計(jì)結(jié)果見表6。表中各數(shù)值為對(duì)應(yīng)的橫縱兩樣品之間的InDel數(shù)。
表 6 毛竹變型間的InDel統(tǒng)計(jì)表Table 6 Summary of InDels detected between variants of Moso bamboo
2.3.2 InDel注釋 對(duì)比毛竹參考基因組的基因、CDS位置等信息,注釋各樣品InDel位點(diǎn)的發(fā)生位置以及是否為移碼突變等,具體注釋結(jié)果如圖2所示。4個(gè)毛竹變型發(fā)生在編碼區(qū)的InDel數(shù)量均在1.7%左右。移碼突變的InDel有可能會(huì)引起基因功能的改變。
圖 2 黃皮毛竹(R01) InDel注釋圖Fig. 2 InDel annotations pie of Phyllostachys edulis f. holochrysa (R01)
2.4.1 SV檢測(cè) 檢測(cè)4個(gè)樣品與參考基因組間的插入(insertion,INS)、缺失(delection,DEL)、反轉(zhuǎn)(inversion,INV)、染色體內(nèi)部易位(intra-chromosome translocation,ITX)、染色體間易位(inter-chromosomal translocation,CTX),得到的各類型SV數(shù)量統(tǒng)計(jì)見表7。其中,4個(gè)毛竹變型都表現(xiàn)為缺失類型的SV數(shù)量最多,其次為染色體內(nèi)易位類型。
表 7 四個(gè)樣品SV數(shù)量統(tǒng)計(jì)Table 7 Quantity statistics of SVs detected in four samples
2.4.2 SV注釋 檢測(cè)4個(gè)樣品SV發(fā)生位置信息,并對(duì)缺失、插入和反轉(zhuǎn)3種類型的結(jié)構(gòu)變異進(jìn)行注釋。結(jié)果表明,4個(gè)毛竹變型在各區(qū)域分布的SV總體情況一致,注釋到的變異基因數(shù)目以基因間區(qū)的缺失類型最多,其次為基因間區(qū)的插入類型(表8)。
表 8 四個(gè)毛竹變型SV注釋結(jié)果統(tǒng)計(jì)表Table 8 SV annotations in four variants of Moso bamboo
2.5.1變異基因挖掘 分別統(tǒng)計(jì)4個(gè)樣品的非同義突變的SNP以及CDS區(qū)發(fā)生InDel和SV的基因(表9),尋找可能存在功能變異的基因。在4個(gè)毛竹樣品中,花毛竹(R04)基因組存在12 555個(gè)基因變異,其中,非同義突變SNP基因?yàn)? 563個(gè),InDel基因?yàn)? 006個(gè),SV突變的基因?yàn)? 986個(gè),差異基因總數(shù)和SV突變基因數(shù)最多。在3類變異基因中,非同義突變SNP基因數(shù)最多,InDel基因數(shù)量次之,SV突變的基因最少。
表 9 四個(gè)毛竹變型的變異基因統(tǒng)計(jì)表Table 9 Summary of mutant genes in four variants of Moso bamboo
2.5.2 變異基因的功能注釋 黃皮毛竹、金絲毛竹、綠皮花毛竹和花毛竹注釋到數(shù)據(jù)庫中的變異基因數(shù)分別為7 575、7 538、7 476和7 728。變異基因GO分類統(tǒng)計(jì)結(jié)果圖(圖3)中,顯示出在3大基因功能分類體系(分子功能、細(xì)胞組件和生物過程)的56個(gè)分類內(nèi)容中所對(duì)應(yīng)的基因數(shù)和基因占比。其中,在細(xì)胞組件分類中,與葉綠素合成相關(guān)的基因有2 431個(gè);在生物過程分類中,參與類胡蘿卜素合成過程的基因有75個(gè);在分子功能分類中,與花青素合成調(diào)控以及紫外光下組織中花青素積累的相關(guān)基因有80個(gè)。4個(gè)毛竹變型在相應(yīng)的基因功能中的變異基因數(shù)目有差異,例如:花毛竹有21個(gè)與類胡蘿卜素合成相關(guān)的基因;綠皮花毛竹有17個(gè)相關(guān)基因;而黃皮毛竹有18個(gè)相關(guān)基因,基因數(shù)量和種類的差異,可能引起相應(yīng)的功能變化。深入研究葉綠素、類胡蘿卜素和花青素合成相關(guān)基因以及這些差異基因的調(diào)控途徑,有利于從DNA水平上解釋稈色的變異。
橫坐標(biāo)為GO的分類內(nèi)容,縱坐標(biāo)的左側(cè)為基因數(shù)占比,右側(cè)為基因數(shù)量。 1. 代謝過程; 2. 細(xì)胞過程; 3. 對(duì)刺激的反應(yīng); 4. 生物調(diào)節(jié); 5. 定位; 6. 定位確立; 7. 細(xì)胞組成或生物形成; 8. 分化過程; 9. 多細(xì)胞生物過程; 10. 繁殖; 11. 生殖過程; 12. 信號(hào); 13. 多組織過程; 14. 生長(zhǎng); 15. 免疫系統(tǒng)過程; 16. 死亡; 17. 細(xì)胞增殖; 18. 生物粘附; 19. 節(jié)律過程; 20. 病毒繁殖; 21. 色素沉著; 22. 運(yùn)動(dòng); 23. 細(xì)胞死亡; 24. 碳利用; 25. 細(xì)胞部分; 26. 細(xì)胞; 27. 細(xì)胞器; 28. 膜; 29. 細(xì)胞器部分; 30. 膜部分; 31. 高分子復(fù)合物; 32. 細(xì)胞外區(qū)域; 33. 膜內(nèi)腔; 34. 細(xì)胞連接; 35. 細(xì)胞外基質(zhì); 36. 類核; 37. 病毒粒子; 38. 細(xì)胞外基質(zhì)部分; 39. 細(xì)胞外區(qū)部分; 40. 病毒粒子部分; 41. 綁定; 42. 催化活性; 43. 運(yùn)輸活動(dòng); 44. 核酸結(jié)合轉(zhuǎn)錄因子活性; 45. 結(jié)構(gòu)分子活性; 46. 電子載體活性; 47. 酶調(diào)節(jié)活性; 48. 活動(dòng)分子傳感器; 49. 抗氧化活性; 50. 受體活性; 51. 蛋白結(jié)合轉(zhuǎn)錄因子活性; 52. 營(yíng)養(yǎng)庫活性; 53. 翻譯調(diào)節(jié)活性; 54. 金屬伴侶活性; 55. 蛋白質(zhì)標(biāo)記; 56. 通道調(diào)節(jié)活性。Abscissa is GO classification, the left side of the ordinate is the percentage of genes, and the right side is the number of genes. 1. Metabolic process; 2. Celluar process; 3. Response to stimulus; 4. Biological regulation; 5. Localization; 6. Establishment of localization; 7. Cellular component organization or biogenesis; 8. Developmental process; 9. Multicellular organismal process; 10. Reproduction; 11. Reproductive process; 12. Signaling; 13. Multi-organism process; 14. Growth; 15. Immune system process; 16. Death; 17. Cell proliferation; 18. Biological adhesion; 19. Rhythmic process; 20. Viral reproduction; 21. Pigmentation; 22. Locomotion; 23. Cell killing; 24. Carbon utilization; 25. Cell part; 26. Cell; 27. Organelle; 28. Membrane; 29. Organelle part; 30. Membrane part; 31. Macromolecular complex; 32. Extracellular region; 33. Membrane-enclosed lumen; 34. Cell junction; 35. Extracellular matrix; 36. Nucleoid; 37. Virion; 38. Extracellular matrix part; 39. Extracellular region part; 40. Virion part; 41. Binding; 42. Catalytic activity; 43. Transporter activity; 44. Nucleic acid binding transcription factor activity; 45. Structural molecule activity; 46. Electron carrier activity; 47. Enzyme regulator activity; 48. Molecular transducer activity; 49. Antioxidant activity; 50. Receptor activity; 51. Protein binding transcription factor activity; 52. Nutrient reservoir activity; 53. Translation regulator activity; 54. Metallochaperone activity; 55. protein tag; 56. Channel regulator activity.圖 3 黃皮毛竹(R01)變異基因的GO注釋分類圖Fig. 3 Classification of Phyllostachys edulis f. holochrysa (R01) mutant genes compared with GO database by BLAST
變異基因COG注釋分類圖(圖4)直觀顯示出COG功能分類條目上分別對(duì)應(yīng)的頻率,其中涉及到功能注釋、轉(zhuǎn)錄、復(fù)制重組修復(fù)和信號(hào)轉(zhuǎn)導(dǎo)機(jī)制的對(duì)應(yīng)數(shù)值高。獲得的功能注釋基因?yàn)? 630個(gè),參與復(fù)制、重組和修復(fù)的基因數(shù)為369個(gè),信號(hào)轉(zhuǎn)導(dǎo)機(jī)制的基因數(shù)為291個(gè),轉(zhuǎn)錄的相關(guān)基因?yàn)?22個(gè)。
圖 4 黃皮毛竹(R01)變異基因的COG注釋分類圖Fig. 4 Classification of Phyllostachys edulis f. holochrysa (R01) mutant genes compared with COG database
KEGG數(shù)據(jù)庫系統(tǒng)地分析4個(gè)毛竹變型的基因產(chǎn)物在生物學(xué)過程中的功能。以黃皮毛竹(R01)的纈氨酸、亮氨酸和異亮氨酸生物合成通路為例(圖5),注釋到57個(gè)基因參與該通路,其中23個(gè)變異基因。整個(gè)通路涉及不同的酶連接一系列生化反應(yīng)形成,其中,框內(nèi)的數(shù)字代表enzyme的號(hào)碼,紅色的框代表通路相關(guān)變異基因。
全基因組重測(cè)序可以在已知植物的基因組序列基礎(chǔ)上,對(duì)其不同品種的基因組序列進(jìn)行測(cè)序,從而找出個(gè)體與該物種間的差異性(Ley et al., 2008)。隨著毛竹全基因組序列的公開發(fā)表(Peng et al., 2013),研究毛竹不同變種或變型基因組序列差異成為可能。全基因組重測(cè)序可以檢測(cè)個(gè)體的全部基因組序列,掃描出一些與該個(gè)體生長(zhǎng)性狀密切相關(guān)的變異位點(diǎn)(宋志芳等,2017)。毛竹的地下莖中單軸散生,其不同變異類型也都是散生竹。在毛竹自身的遺傳基因漂移,以及長(zhǎng)期的栽培措施和自然環(huán)境變遷等因素的影響下,毛竹種內(nèi)產(chǎn)生了很多遺傳變異,產(chǎn)生各種獨(dú)特的結(jié)構(gòu)形態(tài),表現(xiàn)出豐富的園林觀賞性狀。其中,黃皮毛竹、花毛竹、綠皮花毛竹在竹稈顏色方面表現(xiàn)出不同程度的變異,使其具有更高的園林觀賞價(jià)值。
圖 5 黃皮毛竹(R01)變異基因的KEGG通路代謝圖Fig. 5 Pathway of Phyllostachys edulis f. holochrysa (R01) mutant genes compared with KEGG database by BLAST
對(duì)4個(gè)毛竹變異類型全基因組重測(cè)序,初步統(tǒng)計(jì)分析了其基因組數(shù)據(jù),與毛竹參考基因組進(jìn)行比對(duì),檢測(cè)其SNP、InDel和SV。SNP類型的變異分為轉(zhuǎn)換和顛換兩種,4個(gè)毛竹樣品的轉(zhuǎn)換/顛換(Ti/Tv)的比值均約等于3,說明轉(zhuǎn)換類型比顛換類型更容易發(fā)生。SNP雜合比例約為90%,說明樣品有很高的雜合度,即同源染色體上SNP位點(diǎn)含不同類型的堿基比例高。InDel位點(diǎn)數(shù)同樣能反映不同樣品與毛竹基因組之間的差異,并且編碼區(qū)的InDel會(huì)引起移碼突變,影響基因功能。SV中缺失、插入、反轉(zhuǎn)、易位4種類型的數(shù)量,反映出基因組水平上大片段的缺失、插入、倒置、易位等序列差異。通過生物信息學(xué)分析,比較不同稈色的變異類型在全基因組水平上的結(jié)構(gòu)差異,并進(jìn)行差異注釋,從而為毛竹選育提供遺傳基礎(chǔ),也為重要基因的功能研究提供有利依據(jù)。
顏色變異是植物中較常見的表型變異,其中關(guān)于水稻、擬南芥、菊花等多種植物均有葉色變異的報(bào)道。據(jù)不完全統(tǒng)計(jì),水稻葉綠體含量基因超過140個(gè)(趙紹路等,2018)。竹子中的色素分為3大類:葉綠素、花青素和類胡蘿卜素。通過功能數(shù)據(jù)庫比對(duì),對(duì)4個(gè)毛竹變型的變異基因,進(jìn)行基因功能注釋和分析。GO數(shù)據(jù)庫注釋聚類反映了毛竹變型在不同功能組分類中基因數(shù)目和基因產(chǎn)物的屬性,其中與稈色變異有關(guān)的葉綠素、類胡蘿卜素和花青素等色素合成相關(guān)基因作為重點(diǎn)關(guān)注對(duì)象進(jìn)行分析。COG數(shù)據(jù)庫注釋了基因產(chǎn)物的直系同源分類,不同分類對(duì)應(yīng)的基因數(shù)目差別很大,反映了不同條件下的生理或者代謝偏好等。 KEGG數(shù)據(jù)庫將基因和多種酶形成通路,有氨基酸生物合成、類胡蘿卜素生物合成、類黃酮生物合成、 萜類化合物的生物合成、植物激素信號(hào)轉(zhuǎn)導(dǎo)、參與卟啉和葉綠素代謝等顯著富集。其中,葉綠體、類胡蘿卜素和花青素等色素合成相關(guān)通路,是與稈顏色相關(guān)的主要代謝通路。
結(jié)合不同稈色毛竹變型的生物學(xué)和生理學(xué)特性,研究全基因組序列色素合成相關(guān)基因,有助于從基因水平上解析其稈色變異原因。有研究表明,毛竹不同變異類型在葉綠素含量、β胡蘿卜素含量等生理指標(biāo)中存在顯著性差異(陳建華等,2011),株型較大的花毛竹生理指標(biāo)值比較小型的龜甲竹、綠槽毛竹大(晏育存,2011)。毛竹變型ISSR和AFLP分子標(biāo)記分析表明,變型間的遺傳變異程度較小(阮曉賽,2008)。在參考黃槽毛竹和黃皮花毛竹兩個(gè)稈色變異毛竹變型的研究結(jié)果(牟少華等,2020)基礎(chǔ)上,通過對(duì)黃皮毛竹等4個(gè)毛竹變異類型重測(cè)序, 進(jìn)行DNA水平的變異基因功能注釋,可以分析基因產(chǎn)物在細(xì)胞中的代謝途徑及功能,尤其是對(duì)黃酮類、類胡蘿卜素、硝酸還原酶等合成通路的深入分析,為揭示相關(guān)代謝通路有關(guān)基因提供重要理論依據(jù),對(duì)于探究毛竹變型稈色變異有重要意義。另外,顏色變異通常是一個(gè)不穩(wěn)定的性狀。例如,花毛竹在不同的生境條件下有可能變回全部綠色或者變成綠皮花毛竹,這表明竹類植物的顏色變異在遺傳上不是一個(gè)穩(wěn)定的性狀。因此,從分子機(jī)制上探索顏色變異有其復(fù)雜性,其代謝調(diào)控還需要進(jìn)一步研究。
采用第二代高通量重測(cè)序技術(shù),對(duì)4個(gè)毛竹變型材料進(jìn)行全基因組重測(cè)序研究,對(duì)其單核苷多態(tài)性、小片段插入缺失和結(jié)構(gòu)變異進(jìn)行分析和注釋,篩選可能發(fā)生功能變異的基因。將變異基因與GO、COG、KEGG等功能數(shù)據(jù)庫進(jìn)行比對(duì),每樣品都有7 000多個(gè)變異基因得到功能注釋。GO注釋分類包括細(xì)胞組件、分子功能和生物過程3個(gè)基因功能分類體系的56個(gè)功能組,在細(xì)胞組件分類中,葉綠素合成相關(guān)基因有2 431個(gè);在生物過程分類中,參與類胡蘿卜素合成過程的基因有75個(gè);在分子功能分類中,參與花青素合成調(diào)控以及紫外光下組織中花青素積累的相關(guān)基因有80個(gè)。COG分類表明參與復(fù)制、重組和修復(fù)的基因數(shù)為369個(gè),信號(hào)轉(zhuǎn)導(dǎo)機(jī)制的基因數(shù)為291個(gè),轉(zhuǎn)錄的相關(guān)基因?yàn)?22個(gè)。通過KEGG數(shù)據(jù)庫系統(tǒng)地分析變異基因參與的黃酮類、類胡蘿卜素等物質(zhì)代謝合成途徑。后續(xù)數(shù)據(jù)的深入分析將解析不同變異類型的基因家族和基因功能,初步闡析不同竹稈變異毛竹變型的分子遺傳基礎(chǔ)。