臧新山 ,耿延會 ,裴文鋒 ,吳嫚 ,李興麗 ,張金發(fā) ,于霽雯 *
(1.棉花生物學(xué)國家重點實驗室/中國農(nóng)業(yè)科學(xué)院棉花研究所/農(nóng)業(yè)農(nóng)村部棉花生物學(xué)與遺傳育種重點實驗室,河南安陽455000,中國;2.New Mexico State University,Las Cruces,New Mexico 88003,USA)
棉花是我國重要的經(jīng)濟作物之一,培育高產(chǎn)、優(yōu)質(zhì)、農(nóng)藝性狀良好的棉花品種是棉花研究人員的共同目標(biāo)。棉花質(zhì)量性狀的研究始于1906年海島棉(Gossypium barbadense)有色纖維遺傳分析[1]。我國的棉花質(zhì)量性狀遺傳研究從孫肇傳開始,后繼者有馮澤芳、孫逢吉、俞啟葆、華興鼐和奚元齡等[1]。
質(zhì)量性狀一般是受一兩個主效基因控制,遺傳行為簡單,雜交后F2分離時呈明顯的不連續(xù)變異,符合孟德爾遺傳定律。本文主要從棉花質(zhì)量性狀遺傳分析、分子標(biāo)記定位和候選基因克隆幾個方面系統(tǒng)地綜述了植株顏色、葉片顏色、葉型、苞葉、花、蜜腺、腺體和纖維8類質(zhì)量性狀。
棉花植株顏色一般呈綠色,而紅株突變體表現(xiàn)出明顯的紅色,且伴隨其他性狀變化。植株顏色質(zhì)量性狀主要包括紅株R1[2]、亞紅株Rs[3-4]和矮紅株Rd[5-6](表1)。具有紅色葉片的棉花對棉鈴象鼻蟲、棉鈴蟲具有抗性。此外,相對于經(jīng)典的紅株棉和普遍的綠株棉,亞紅株棉的光合效率更高[3]。
葉片顏色與作物的光合作用緊密相關(guān),對光合效率有重要的影響。棉花葉片顏色主要包括葉綠素缺失或改變導(dǎo)致的持久性的顏色變化和芽黃2種類型,大多數(shù)純合芽黃突變體在苗期表現(xiàn)明顯,子葉或真葉呈不同程度的黃色,花期或盛花期轉(zhuǎn)為綠色。芽黃作為1種指示性狀,在棉花雜種優(yōu)勢利用中已被棉花育種工作者廣泛應(yīng)用。棉花主要的葉片顏色調(diào)控基因見表2。
表1 植株顏色調(diào)控基因的基因符號、名稱、來源、染色體定位、連鎖的分子標(biāo)記和參考文獻Table 1 Gene symbols,names,species origins,chromosome,linkage associations,and references for cotton plant color controlling genes
棉花正常葉片一般具有5個裂片,表面平滑,常伴有茸毛和腺體,像手掌一樣,因此葉片形狀的變化容易鑒定。棉花葉型主要包括皺縮葉、帶狀葉、杯狀葉、圓形葉和雞腳葉等類型。皺縮葉形態(tài)突出,易于觀察,從1918年開始就有研究報道。雞腳葉能夠提高抗旱性,增強抗蟲能力,對棉花的品種改良有著深遠的影響。棉花葉型質(zhì)量性狀調(diào)控基因見表3。
表2 葉片顏色調(diào)控基因的基因符號、名稱、來源、染色體定位、連鎖的分子標(biāo)記、候選基因和參考文獻Table 2 Gene symbols,names,species origins,chromosome,linkage associations,candidate genes and references for cotton leaf color controlling genes
表2 (續(xù))Table 2 (Continued)
棉花在正常情況下有3片苞葉,呈心臟形,緊貼著蕾鈴,與蕾鈴發(fā)育、病蟲害防治、光合產(chǎn)物積累以及紡紗品質(zhì)有密切的關(guān)系[50]。棉花苞葉質(zhì)量性狀基因主要包括窄卷苞葉fg[51]和凋萎苞片bw1bw2[52](表 4)。
正常情況下棉花的花由苞葉、花萼和花冠包圍著的雄蕊和雌蕊組成,在開花當(dāng)天花冠張開,常異花授粉。陸地棉為白色花冠、白色花藥,海島棉為黃色花冠、黃色花藥。調(diào)控柱頭外露的基因主要為ob1[53]和ob2[54];黃色花冠調(diào)控基因Y1和Y2,與y1或y2乳白色花冠相對應(yīng),Y1調(diào)控除達爾文氏棉外所有異源四倍體的黃色花冠,而Y2基因調(diào)控達爾文氏棉[55-57]。陸地棉中,花藥顏色從深黃色到乳白色,調(diào)控基因為P1和P2。P1P1P2P2表現(xiàn)為黃色,p1p1p2p2表現(xiàn)為乳白色,雙雜合體P1p1P2p2是橘色[58-61]?;ü诨坑屑t色不規(guī)則的斑點,開花的時候非常明顯,其調(diào)控基因為R2[61-62](表5)。
表3 葉型調(diào)控基因的基因符號、名稱、來源、染色體定位、連鎖的分子標(biāo)記、候選基因和參考文獻Table 3 Gene symbols,names,species origins,chromosome,linkage associations,candidate genes and references for cotton leaf shape controlling genes
棉花蜜腺是一些害蟲的重要食物來源。棉花蜜腺比較多,蜜腺期長,成為導(dǎo)致蟲害的主要原因之一。因此,培育無蜜腺的棉花品種對棉花抗蟲具有重要意義。陸地棉有葉蜜腺、花外蜜腺和花蜜腺,葉蜜腺位于葉背葉脈上距離葉基約1 cm處的窩狀凹陷;花外蜜腺位于苞片之間或者苞片內(nèi);花蜜腺位于萼片和花瓣之間[63-64]。調(diào)控棉花無蜜腺的質(zhì)量性狀基因包括ne1和ne2(表6)。
表4 苞葉調(diào)控基因的基因符號、名稱、來源、染色體定位、連鎖的分子標(biāo)記和參考文獻Table 4 Gene symbols,names,species origins,chromosome,linkage associations,and references for cotton bract trait controlling genes
表5 花相關(guān)調(diào)控基因的基因符號、名稱、來源、染色體定位、連鎖的分子標(biāo)記和參考文獻Table 5 Gene symbols,names,species origins,chromosome,linkage associations,and references for cotton flower related controlling genes
表6 蜜腺調(diào)控基因的基因符號、名稱、來源、染色體定位、連鎖的分子標(biāo)記和參考文獻Table 6 Gene symbols,names,species origins,chromosome,linkage associations,and references for cotton nectary controlling genes
棉花的鈴、莖、葉等器官上散布著黑色或深棕色的小斑點,稱為腺體。腺體對棉花抵御病蟲有重要的作用,但同時對反芻動物和人類食用棉籽產(chǎn)生不利的影響。腺體按照其大小可以分為2種類型,較大類型腺體主要出現(xiàn)在胚軸,也會出現(xiàn)在節(jié)點,但很少出現(xiàn)在節(jié)點之間或心皮壁;小腺體出現(xiàn)在所有的軸部和胚軸、心皮壁。棉花腺體質(zhì)量性狀主要包括無腺體棉鈴 (gl1、gl6和gl1y)、有無腺體植株(gl2、Gl2s、Gl2e、gl3和Gl3r)、無腺體植株修飾基因 (gl4和gl5)和滲漏腺體基因(Lk)(表 7)。
棉花纖維被分為短絨(Fuzz)和長絨(Lint)。短絨:長度短于5 mm,緊緊貼附于種皮,類似于野生棉花種子毛;而長絨依據(jù)成熟時的平均長度可以分為3類:短纖維 (小于21 mm),長纖維(28~32 mm),超長纖維(大于 35 mm)[74]。一般區(qū)分長絨纖維和短絨的方法是,軋花時從種子上軋下來的是纖維,留在種子上的是短絨。目前在棉花上發(fā)現(xiàn)了各種與纖維發(fā)育相關(guān)的質(zhì)量性狀,主要包括光籽(N1和n2)、 列氏無纖維(Li1、Li2、Li3、Li4和Lix)、無纖維[Fbl,sma-4(ha)和sma-4(fz)]、不成熟纖維(im)和纖維顏色(Lg、Lgf、Lc1和Lc2)等變異(表 8)。
傳統(tǒng)上,對于發(fā)現(xiàn)的突變體,用遺傳標(biāo)準系TM-1、多隱性標(biāo)記系T582和多顯性標(biāo)記系T586與之雜交,進行遺傳分離分析;還可以用該突變體與已知類似的突變體雜交進行等位性分析;亦用突變體與單體或端體雜交進行染色體定位分析。近年來,分子標(biāo)記是研究質(zhì)量性狀基因的重要工具。棉花質(zhì)量性狀基因連鎖分析和分子標(biāo)記定位研究已經(jīng)取得了較大的進展,本文綜述了8類性狀的101個質(zhì)量性狀基因和等位基因,其中58個基因和等位基因(其中Rd基因定位于XIV連鎖群)被定位到了染色體上,32個基因和等位基因被定位于分子標(biāo)記之間,更重要的是,其中7個已經(jīng)被克?。ū?~8)。盡管棉花質(zhì)量性狀基因定位研究已取得了非常大的進展,但仍存在一些問題,與水稻、玉米等作物相比還存在較大差距。目前棉花中還有約一半的基因沒有被定位于染色體上,只有約30%的基因被定位于分子標(biāo)記之間,而且精細定位的基因更少。
表7 腺體調(diào)控基因的基因符號、名稱、來源、染色體定位、連鎖的分子標(biāo)記、候選基因和參考文獻Table 7 Gene symbols,names,species origins,chromosome,linkage associations,candidate genes and references for cotton gland controlling gene
表8 纖維發(fā)育調(diào)控基因的基因符號、名稱、來源、染色體定位、連鎖的分子標(biāo)記、候選基因和參考文獻Table 8 Gene symbols,names,species origins,chromosome,linkage associations,candidate genes and references for cotton fiber mutants
在這些性狀中,研究最深入的是纖維相關(guān)性狀。在本文綜述的15個纖維質(zhì)量性狀基因中,14個基因被定位于染色體上,12個基因被定位于分子標(biāo)記之間,其中4個已經(jīng)被圖位克隆(表8)。其余的質(zhì)量性狀基因依據(jù)其重要性,研究進展不盡相同。其中芽黃基因v1(表2)、雞腳葉基因L2o(表3)、顯性腺體基因Gl2e(表7)已被精細定位并進行了候選基因克隆與驗證(見下文)。
圖位克隆是質(zhì)量性狀候選基因克隆最經(jīng)典的手段,在綜述的植株顏色、葉片顏色、葉型、苞葉、花、蜜腺、腺體和纖維8類性狀中,植株顏色、苞葉、花和蜜腺4類性狀沒有相關(guān)基因被克?。黄溆?類性狀中,葉片顏色性狀克隆到v1[11-12],葉型性狀克隆到L2o[47-49],腺體性狀克隆到Gl2e[70-71],纖維性狀克隆到N1[77]、Li1[82]、Li3[87]和Lc1[95]。張?zhí)煺嫜芯繄F隊在這一研究方向貢獻較大,克隆到Gl2e、L2o、N1、v1和Li3幾個質(zhì)量性狀調(diào)控基因,其中Gl2e和N1是與陳曉亞研究團隊合作完成。
葉片顏色v1:2017年,通過集團分離分析法(Bulked segregant analysis,BSA), 從多隱性標(biāo)記基因系T582中克隆到芽黃v1基因GhCHL1,該基因編碼鎂離子螯合酶,定位于染色體D10上,對應(yīng)TM-1基因號為Gh_D10G0283(對應(yīng)At亞基因組基因號為Gh_A10G0282),進一步通過病毒誘導(dǎo)的基因沉默(Virus induced gene silencing,VIGS)技術(shù)沉默GhCHL1基因表現(xiàn)出芽黃的表型[11]。2018年,喻樹迅研究團隊通過圖位克隆的方法也克隆到該基因[12]。
葉型L2o:2016年,Zhu等克隆到調(diào)控葉型的復(fù)等位基因L2o位點GhOKRA-Dt,定位于D01染色體上,對應(yīng)雷蒙德氏棉基因號為Gorai.002G244000.1,對應(yīng)TM-1基因號為Gh_D01G2042(對應(yīng)At亞基因組基因號為Gh_A01G1801),該基因編碼同源異型-亮氨酸拉鏈(HD-Zip)轉(zhuǎn)錄因子[47]。同年,張?zhí)煺嫜芯繄F隊也克隆到該基因,利用VIGS技術(shù)抑制GhOKRA基因的表達后,葉片表型由雞腳葉變?yōu)殚熑~。過表達GhOKRA的擬南芥植株葉片出現(xiàn)分裂。序列分析發(fā)現(xiàn),闊葉棉花GhOKRA基因發(fā)生突變,會使翻譯提前中止,從而喪失了基因功能[48]。2017 年,Andres等也克隆到該基因(L-D1),同時證明其祖先種是亞雞腳葉葉型,經(jīng)典的雞腳葉葉型的啟動子存在 133 bp(base pairs)的串聯(lián)重復(fù),進而影響L-D1基因的表達量;野生型葉型的第三個外顯子存在1個8 bp的缺失,導(dǎo)致該基因提前終止翻譯[49]。
腺體Gl2e:2016年,克隆到棉花顯性無腺體Gl2e基因GoPGF,定位于A12染色體上,對應(yīng)TM-1基因號為Gh_A12G2172(對應(yīng)Dt亞基因組基因號為Gh_D12G2351)。利用VIGS技術(shù)抑制GoPGF基因的表達,棉花不再產(chǎn)生腺體器官,同時棉酚含量減少約90%。該基因全長1 428 bp,編碼1個bHLH轉(zhuǎn)錄因子,無內(nèi)含子。在有腺體材料和無腺體材料之間存在3個單核苷酸多態(tài)性位點(Single nucleotide polymorphism,SNP),導(dǎo)致1個氨基酸的差異。轉(zhuǎn)錄組分析發(fā)現(xiàn),4 293個基因在正常葉片和GoPGF基因沉默表達葉片中發(fā)生差異表達,其中2 276個基因上調(diào)表達,1 306個基因下調(diào)表達。上調(diào)表達基因主要富集在光反應(yīng)、細胞壁降解、蛋白質(zhì)合成等途徑中;下調(diào)表達基因顯著富集在次生代謝、茉莉酸信號和WRKY轉(zhuǎn)錄因子家族等[70]。這是棉花中第一個利用正向遺傳學(xué)手段圖位克隆到的基因。宋國立研究團隊也精細定位到該基因[71]。
纖維性狀:2016年,克隆到顯性光子突變體N1基因GhMML3_A12,N1突變體完全無短絨且纖維有不同程度減少。N1基因編碼1個MYBMIXTA-like(MML)轉(zhuǎn)錄因子,該基因與之前報道的GhMYB25-like基因為同一基因[96],定位于染色體A12上,對應(yīng)TM-1基因號為Gh_A12G1503(對應(yīng)Dt亞基因組基因號為Gh_D12G1628)。通過VIGS等方法進一步確定N1為MYB類轉(zhuǎn)錄因子基因GhMML3_A12。研究還發(fā)現(xiàn)GhMML3_A12在突變體N1中的低表達與天然反義轉(zhuǎn)錄本 (Natural antisense transcripts,NATs)產(chǎn)生相關(guān)[77]。
2017年,Thyssen等克隆到顯性極短纖維Li1基因GhACT_LI1(Gh_D04G0865,對應(yīng) At亞基因組基因號為Gh_A04G1367),該突變體的纖維伸長發(fā)育過早終止而導(dǎo)致成熟的纖維極端縮短,該基因編碼1個細胞肌動蛋白相關(guān)的F-actin基因,其中1個氨基酸的替換(Gly65Val)影響了細胞極性和細胞骨架紊亂,進而導(dǎo)致該表型的出現(xiàn)[82]。
2018年,克隆到長絨纖維發(fā)育Li3基因Gh-MML4_D12,編碼1個MML轉(zhuǎn)錄因子,定位于染色體D12上,對應(yīng)TM-1基因號為Gh_D12G1629(對應(yīng)At亞基因組基因號為Gh_A12G1504)。VIGS沉默GhMML4_D12基因的表達導(dǎo)致表皮細胞突起和棉纖維產(chǎn)量的顯著降低。GhMML4_D12與GhMML3串聯(lián),這2個密切相關(guān)的MIXTA基因分別與長絨纖維和短絨纖維的起始有關(guān),它們可能調(diào)控不同類型細胞的同一代謝途徑[87]。
2018年,肖月華研究團隊克隆到棉花深褐色纖維Lc1基因GhTT2-3A(Gohir.A07G020200),該基因編碼磷脂酸(Phosphatidic acid,PA)調(diào)節(jié)因子 TRANSPARENT TESTA 2(TT2)家族成員,定位于染色體A07上,對應(yīng)TM-1基因號為Gh_A07G2341(對應(yīng)Dt亞基因組基因號為Gh_D07G0169),通過轉(zhuǎn)基因等手段揭示出TT2同源基因GhTT2-3A調(diào)控PA生物合成與棉纖維的著色[95]。
本文綜述了棉花部分質(zhì)量性狀遺傳分析和基因定位的研究進展,包括植株顏色、葉片顏色、葉型、苞葉、花、蜜腺、腺體和纖維8類性狀,涉及101個基因和等位基因。到目前為止,植株顏色、苞葉、花和蜜腺4類性狀暫時沒有基因被克隆;葉片顏色、葉型和腺體3類性狀分別克隆到1個基因,分別是v1[11-12]、L2o[47-49]和Gl2e[70-71];棉花是最重要的天然纖維作物,纖維性狀克隆到4個基因,
分別是N1[77]、Li1[82]、Li3[87]和Lc1[95]。棉花質(zhì)量性狀研究雖然開始的早,但研究進展卻較慢,對于大部分質(zhì)量性狀仍然停留在分子標(biāo)記定位階段,主要原因是棉花為異源四倍體AD基因組,基因組比較復(fù)雜。
隨著棉花基因組測序數(shù)據(jù)的陸續(xù)公布,棉花質(zhì)量性狀研究進入了新的階段,進入了快速發(fā)展期。2012年,棉花D基因組雷蒙德氏棉(G.raimondii)的全基因組測序及組裝完成,基因組大小567.2 Mb,包含40 976個編碼蛋白的基因[97-98]。2014年,棉花A基因組亞洲棉石系亞1號的全基因組測序及組裝完成,基因組大小1 694 Mb,包含41 330個編碼蛋白的基因[99]。2015年,異源四倍體陸地棉品種TM-1的全基因組測序及組裝完成,基因組大小為2 173 Mb,其中At亞基因組為1 170 Mb,Dt亞基因組為753 Mb。共預(yù)測到76 943個編碼蛋白的基因,定位于染色體上的基因72 142個,其中At亞基因組基因35 056個,Dt亞基因組基因37 086個[100-101]。同樣是2015年,海島棉品種3-79和Xinhai 21全基因組測序及組裝完成,3-79全基因組大小為2.57 Gb,包含80 876個編碼蛋白質(zhì)的基因;Xinhai 21基因組大小為2.47 Gb,包含76 526個編碼蛋白質(zhì)的基因[102-103]。棉花基因組數(shù)據(jù)測序完成之后,棉花質(zhì)量性狀定位及克隆進展明顯加快。目前已經(jīng)克隆了葉片顏色性狀基因v1[11-12]、葉型性狀基因L2o[47-49]、腺體性狀基因Gl2e[68-71],纖維性狀突變基因N1[77]、Li1[82]、Li3[87]和Lc1[95],這些基因的克隆都是在上述基因組測序數(shù)據(jù)公布之后。
相信隨著棉花基因組數(shù)據(jù)的進一步完善,分子標(biāo)記越來越密,采用圖位克隆的方法定位棉花質(zhì)量性狀基因?qū)⒃絹碓饺菀?。另外,BSA[11,104]等一些新方法的出現(xiàn),使定位克隆更加快速準確。相信在不久的將來,更多的棉花質(zhì)量性狀基因?qū)豢寺〔⒔馕稣{(diào)控機理。