宋興超,安清明,張曉東,孟金柱,趙園園,吳震洋
(銅仁學(xué)院農(nóng)林工程與規(guī)劃學(xué)院/貴州省梵凈山地區(qū)生物多樣性保護(hù)與利用重點(diǎn)實(shí)驗(yàn)室,貴州 銅仁 554300)
烏骨雞的營養(yǎng)特性和藥用價(jià)值主要與其烏質(zhì)性狀密切相關(guān),該性狀是烏骨雞新品種選育的一個(gè)核心育種目標(biāo)[1]。通過分子標(biāo)記輔助選育烏度更深的烏骨雞新品種對提高烏骨雞產(chǎn)業(yè)的經(jīng)濟(jì)價(jià)值具有重要意義。烏骨雞的烏度決定于體內(nèi)黑色素沉積量的高低,而黑色素的沉積受多因子共同調(diào)控。內(nèi)皮素(EDN)是一類由內(nèi)皮細(xì)胞分泌的含有21個(gè)氨基酸殘基的內(nèi)皮縮血管肽,具有3種異構(gòu)體,分別為內(nèi)皮素1(EDN1)、內(nèi)皮素2(EDN2)和內(nèi)皮素3(EDN3),廣泛存在于脊椎動(dòng)物血管內(nèi)皮及各組織細(xì)胞[2]。在色素沉積的關(guān)鍵部位,EDN3主要由表皮中的角化細(xì)胞合成,由旁分泌途徑作用于相鄰的黑色素細(xì)胞且對早期黑色素細(xì)胞的遷移及增殖分化具有促進(jìn)作用,并可通過與其受體(EDNRB)結(jié)合促進(jìn)黑色素的合成[3-4]。已有研究表明,EDN3基因可使小鼠[5]、綿羊[6]和羊駝[7]等脊椎動(dòng)物色素沉積相關(guān)基因的表達(dá)量及黑色素含量增加,并且適當(dāng)濃度的外源性EDN3能夠促進(jìn)黑色素細(xì)胞的增殖分化。貓科動(dòng)物相鄰不同條紋及花斑的皮膚及毛囊中EDN3基因的表達(dá)量存在差異,導(dǎo)致真黑色素轉(zhuǎn)化為褐黑色素,并影響后期花紋的形成[8]。在雞上,復(fù)雜遺傳物質(zhì)的重組能夠?qū)е翬DN3基因表達(dá)蛋白含量增加,生成過量色素細(xì)胞,進(jìn)而形成烏雞的烏色表型[9-10],特別是該基因與東鄉(xiāng)綠殼蛋雞雞冠顏色及產(chǎn)蛋量存在關(guān)聯(lián)[11]。上述研究均表明,EDN3基因是脊椎動(dòng)物色素沉積的關(guān)鍵基因。
啟動(dòng)子作為結(jié)構(gòu)基因5′調(diào)控區(qū)上游的一段核苷酸序列,可供RNA聚合酶識別并與模板DNA特異性結(jié)合,是基因轉(zhuǎn)錄水平調(diào)控的中心,能夠調(diào)控基因表達(dá)的強(qiáng)度、部位及模式,保證轉(zhuǎn)錄起始的精確性和有效性[12]。EDN3基因的轉(zhuǎn)錄、表達(dá)及功能發(fā)揮在很大程度上會(huì)受到啟動(dòng)子區(qū)序列結(jié)構(gòu)特征的影響。因此,對于基因啟動(dòng)子的深入研究有助于明確其結(jié)構(gòu)、功能及其表達(dá)調(diào)控機(jī)制。然而,目前EDN3基因調(diào)控雞色素沉積的轉(zhuǎn)錄機(jī)制尚不明確。因此,本研究通過獲取雞EDN3基因啟動(dòng)子區(qū)序列,并對其核心啟動(dòng)子區(qū)、轉(zhuǎn)錄因子結(jié)合位點(diǎn)、順式作用元件和CpG島等結(jié)構(gòu)進(jìn)行生物信息學(xué)預(yù)測及分析,初步探究雞EDN3基因啟動(dòng)子區(qū)序列結(jié)構(gòu)特征,旨在為下一步開展雞EDN3基因雙熒光素酶報(bào)告基因重組載體構(gòu)建及啟動(dòng)子區(qū)轉(zhuǎn)錄活性檢測等相關(guān)研究提供借鑒與參考,同時(shí)也為深入解析EDN3基因調(diào)控烏骨雞色素沉積性狀的分子機(jī)制奠定理論基礎(chǔ)。
NCBI數(shù)據(jù)庫中尚未登錄雞EDN3基因啟動(dòng)子區(qū)序列,利用關(guān)鍵詞“EDN3 chicken”在GenBank中“Gene”數(shù)據(jù)庫進(jìn)行查詢,獲得該基因定位于雞20號染色體NC_052551.1(11 141 887~11 158 648),以起始密碼子ATG中“A”作為+1,選取52 bp外顯子1及其上游2 000 bp核苷酸序列共計(jì)2 052 bp作為EDN3基因候選啟動(dòng)子區(qū),用于結(jié)構(gòu)預(yù)測和分析。環(huán)頸雉(NW_022205322.1)、鵪鶉(NC_029535.1)、巖雷鳥(NC_064448.1)、棕硬尾鴨(NC_048912.1)、鳳頭潛鴨(NC_045574.1)、山羊(NC_030820.1)、綿羊(NC_056066.1)、牛(NC_037340.1)、豬(NC_010459.5)和人(NC_000020.11)EDN3基因啟動(dòng)子區(qū)序列均來源于Ensembl基因組數(shù)據(jù)庫。
1.2.1 雞EDN3基因啟動(dòng)子區(qū)結(jié)構(gòu)特征預(yù)測
利用不同在線軟件(表1)對雞EDN3基因啟動(dòng)子區(qū)序列的核心啟動(dòng)子區(qū)、轉(zhuǎn)錄因子結(jié)合位點(diǎn)和CpG島等結(jié)構(gòu)進(jìn)行生物信息學(xué)預(yù)測及分析。
表1 雞EDN3基因啟動(dòng)子區(qū)結(jié)構(gòu)分析軟件
1.2.2 不同物種EDN3基因啟動(dòng)子區(qū)相似性分析及系統(tǒng)進(jìn)化樹構(gòu)建
運(yùn)用DNASTAR Lasergene 17.3軟件的MegAlign程序進(jìn)行雞與其他物種EDN3基因啟動(dòng)子區(qū)序列相似性分析;基于MEGA 5.0軟件構(gòu)建不同物種EDN3基因啟動(dòng)子區(qū)序列分子系統(tǒng)進(jìn)化樹。
Promoter 2.0預(yù)測雞EDN3基因可能存在2個(gè)啟動(dòng)子臨界位置,分別為1 000 bp(預(yù)測分值0.637)和1 700 bp(預(yù)測分值0.626)。TSSW程序預(yù)測獲得2個(gè)啟動(dòng)子位置,分別為1 679 bp(得分10.45)和1 633 bp(得分7.42)。FPROM程序預(yù)測出1個(gè)潛在的啟動(dòng)子,為1 544 bp(得分3.56),相應(yīng)的TATA-box為1 514 bp(TTTAAAAG,得分6.56)。BDGP軟件預(yù)測雞EDN3基因可能存在3個(gè)潛在轉(zhuǎn)錄起始位點(diǎn)(表2),其中預(yù)測分值較高的2個(gè)潛在的轉(zhuǎn)錄起始位點(diǎn)(TSS)T和A分別位于雞EDN3基因啟動(dòng)子區(qū)5′側(cè)翼633 bp和1 547 bp處,推測592~642 bp和1 506~1 556 bp序列為雞EDN3基因潛在的核心啟動(dòng)子區(qū)域。通過上述不同算法的啟動(dòng)子和轉(zhuǎn)錄起始位點(diǎn)預(yù)測軟件的綜合分析提示,592~2 000 bp可能為雞EDN3基因潛在的候選核心啟動(dòng)子區(qū)域。
表2 雞EDN3基因潛在啟動(dòng)子區(qū)預(yù)測結(jié)果
利用DNAMAN 8.0軟件預(yù)測轉(zhuǎn)錄調(diào)控元件表明,雞EDN3基因啟動(dòng)子區(qū)存在2個(gè)CAAT-box、3個(gè)GC-box、6個(gè)TATA-box和9個(gè)E-box等基本轉(zhuǎn)錄調(diào)控元件(表3)。通過AliBaba 2.1、PROMO、Patch 1.0、JASPAR2022和AnimalTFDB 3.0在線軟件預(yù)測雞EDN3基因啟動(dòng)子區(qū)存在多個(gè)潛在轉(zhuǎn)錄因子作用元件(表4),包括Sp1、C/EBP、NF-1、Ftz、ER、E1、NF-muE1、REV-Erbα、AP-1、GCN4、Oct-1、Olf-1、GATA-1、Krox-20、MRF4、AP-4、RAP1和repressor_of_CA等識別位點(diǎn)共計(jì)51個(gè)。其中,Sp1、C/EBPα、NF-1、Ftz、ER、E1、NF-muE1、REV-Erbα的結(jié)合位點(diǎn)出現(xiàn)頻率較高,分別為20、7、4、2、2、2、2和2個(gè),其他轉(zhuǎn)錄因子結(jié)合位點(diǎn)均為1個(gè)。
表3 雞EDN3基因啟動(dòng)子區(qū)基本調(diào)控元件
表4 雞EDN3基因啟動(dòng)子區(qū)主要轉(zhuǎn)錄因子及其結(jié)合位點(diǎn)
以CpG檢測含量/期望含量(Observed/Expected ratio)>0.60,GC含量>50%,CpG島長度>100 bp作為參數(shù),基于3種不同的生物信息學(xué)在線軟件CpGFinder、MethPrimer和EMBOSS Cpgplot對雞EDN3基因2 052 bp啟動(dòng)子區(qū)進(jìn)行CpG島預(yù)測。結(jié)果顯示,CpGFinder預(yù)測雞EDN3基因存在1個(gè)CpG島,位于1 491~1 965 bp,長度為475 bp。MethPrimer和EMBOSS Cpgplot軟件預(yù)測結(jié)果一致,在相同位置預(yù)測到3個(gè)CpG島(圖1),分別位于1 338~1 449 bp和1 482~1 760 bp,長度分別為112 bp、279 bp和223 bp,表明EDN3基因啟動(dòng)子區(qū)是依賴于CpG島的調(diào)控區(qū)域。初步提示,該區(qū)域內(nèi)的SNPs可能會(huì)影響EDN3基因啟動(dòng)子的甲基化水平,推測CpG島的存在可能對EDN3因啟動(dòng)子轉(zhuǎn)錄調(diào)控起關(guān)鍵作用。
橫軸線為預(yù)測序列的位置,縱軸線為該序列的GC含量,藍(lán)色柱狀為預(yù)測的CpG島位置。
基于NCBI公共數(shù)據(jù)庫中環(huán)頸雉、鵪鶉、巖雷鳥、棕硬尾鴨、鳳頭潛鴨、山羊、綿羊、牛、豬和人的基因組數(shù)據(jù),分別獲得不同物種EDN3基因2 052 bp啟動(dòng)子區(qū)核苷酸序列,利用DNASTAR Lasergene 17.3軟件包中的MegAlign程序進(jìn)行雞與其他物種EDN3基因啟動(dòng)子區(qū)序列相似性分析。由表5可知,雞與環(huán)頸雉EDN3基因啟動(dòng)子區(qū)相似性最高為90.3%,與豬相似性最低為38.8%,初步推測雞該基因啟動(dòng)子區(qū)序列在不同物種間既具有保守性,又存在一定程度的差異。
表5 雞與其他物種EDN3基因啟動(dòng)子區(qū)同源序列的相似性
應(yīng)用MEGA 5.0構(gòu)建不同物種EDN3基因啟動(dòng)子區(qū)核苷酸序列的系統(tǒng)進(jìn)化樹(圖2)表明,該進(jìn)化樹明顯分為兩大類群,一大類為非哺乳動(dòng)物,包括雞、環(huán)頸雉、巖雷鳥、鵪鶉、棕硬尾鴨和鳳頭潛鴨;另一大類為哺乳動(dòng)物,包括綿羊、山羊、牛、豬和人。其中雞與鵪鶉同屬雞形目聚在一個(gè)小分支,親緣關(guān)系最近,與豬親緣關(guān)系最遠(yuǎn),這與相似性分析的結(jié)果基本一致。
由于真核生物啟動(dòng)子區(qū)序列結(jié)構(gòu)對基因表達(dá)具有重要調(diào)控作用,因此,多數(shù)科學(xué)工作者在解析目的基因功能時(shí)常對啟動(dòng)子序列進(jìn)行分析[13-14]。啟動(dòng)子是一段供RNA聚合酶定位用的核苷酸序列,通常位于基因5′端轉(zhuǎn)錄起始位點(diǎn)上游2 000 bp,是調(diào)控基因轉(zhuǎn)錄、表達(dá)的關(guān)鍵順式作用元件,也是利用基因工程技術(shù)改良畜禽產(chǎn)品品質(zhì)的重要組成部分[15]。因此,啟動(dòng)子序列結(jié)構(gòu)特征生物信息學(xué)預(yù)測分析對于基因表達(dá)調(diào)控研究及利用轉(zhuǎn)基因或基因編輯技術(shù)改良畜禽產(chǎn)品品質(zhì)具有重要理論意義與實(shí)踐價(jià)值。真核生物的啟動(dòng)子序列一般存在TATA-box、CAAT-box和GC-box等基本調(diào)控元件,與該基因的轉(zhuǎn)錄調(diào)控有著必然的聯(lián)系。本研究通過DNAMAN 8.0軟件預(yù)測到雞EDN3啟動(dòng)子區(qū)存在2個(gè)CAAT-box、3個(gè)GC-box、6個(gè)TATA-box和9個(gè)E-box等基本轉(zhuǎn)錄調(diào)控元件,該結(jié)構(gòu)是否可以提高雞EDN3基因的轉(zhuǎn)錄效率,有待于進(jìn)一步深入驗(yàn)證。關(guān)于基因啟動(dòng)子生物信息學(xué)預(yù)測的算法較多,不同算法的預(yù)測結(jié)果可能不盡相同,因此本研究基于Promoter 2.0、TSSW、FPROM和BDGP 4種在線啟動(dòng)子預(yù)測軟件進(jìn)行綜合比對分析。通過上述不同算法的啟動(dòng)子和轉(zhuǎn)錄起始位點(diǎn)軟件的預(yù)測結(jié)果綜合分析提示,本研究獲得的雞EDN3基因592~2 000 bp為可能的候選核心啟動(dòng)子區(qū)域,下一步將采用擴(kuò)增不同啟動(dòng)子缺失片段的方法,通過構(gòu)建雙熒光素酶重組載體,利用雙熒光素酶檢測系統(tǒng)對不同長度啟動(dòng)子片段開展活性檢測。CpG島主要位于基因的啟動(dòng)子區(qū)和第一外顯子區(qū),它的存在與否以及存在數(shù)目通常是衡量一個(gè)基因是否發(fā)生甲基化的重要前提,對基因的轉(zhuǎn)錄調(diào)控有重要作用。DNA甲基化是基因表達(dá)調(diào)控的一種重要表觀遺傳調(diào)控機(jī)制,可以改變DNA穩(wěn)定性、構(gòu)象以及與蛋白質(zhì)間的相互作用方式[16]。在脊椎動(dòng)物細(xì)胞中,啟動(dòng)子區(qū)CpG島的DNA甲基化情況與基因的表達(dá)調(diào)控密切相關(guān)[17-19]。本研究利用3種不同CpG島在線軟件均預(yù)測雞EDN3基因基因啟動(dòng)子區(qū)1 500~2 000 bp區(qū)域存在潛在的CpG島,該結(jié)構(gòu)域的存在是否可以通過降低基因甲基化的方式提高雞EDN3基因的表達(dá)水平,進(jìn)而導(dǎo)致烏骨雞烏色性狀的形成尚需深入研究。
轉(zhuǎn)錄因子(TF)也稱為反式作用因子,通過與RNA聚合酶和順式作用元件的相互識別和結(jié)合進(jìn)而調(diào)節(jié)基因的表達(dá)[20]。TF對基因在轉(zhuǎn)錄水平調(diào)控主要是通過結(jié)合到靶基因的啟動(dòng)子區(qū)域,提高靶基因的mRNA的轉(zhuǎn)錄水平,探究基因啟動(dòng)子的轉(zhuǎn)錄因子結(jié)合位點(diǎn),有助于分析調(diào)控該基因轉(zhuǎn)錄的潛在上游TF。為進(jìn)一步增加預(yù)測結(jié)果的準(zhǔn)確性,本研究利用AliBaba 2.1、PROMO、Patch 1.0、JASPAR2022和AnimalTFDB 3.0在線軟件綜合預(yù)測雞EDN3基因啟動(dòng)子區(qū)存在Sp1、C/EBPα、NF-1、Ftz、ER、E1、NF-muE1和REV-Erbα等轉(zhuǎn)錄因子潛在結(jié)合位點(diǎn)。其中,Sp1(specificity protein 1)對GC-box親和力較強(qiáng),是大多數(shù)基因的基本轉(zhuǎn)錄調(diào)控因子,在多種組織中廣泛表達(dá),幾乎參與行使機(jī)體內(nèi)所有細(xì)胞功能,在細(xì)胞增殖與分化、動(dòng)物的生長與繁殖等方面可發(fā)揮關(guān)鍵作用[21-22],該轉(zhuǎn)錄因子的數(shù)量高達(dá)20個(gè),推測位于轉(zhuǎn)錄起始位點(diǎn)上游的多個(gè)Sp1轉(zhuǎn)錄因子結(jié)合位點(diǎn)可能是調(diào)節(jié)EDN3基因穩(wěn)定表達(dá)的潛在轉(zhuǎn)錄因子,對該基因的轉(zhuǎn)錄調(diào)控起到關(guān)鍵作用,但目前還未在黑色素細(xì)胞中進(jìn)行研究證明。另外,C/EBPα、NF-1等轉(zhuǎn)錄因子結(jié)合位點(diǎn)的功能也很廣泛,能在雞不同組織和器官中發(fā)揮作用[23-24]。本研究預(yù)測的雞EDN3基因啟動(dòng)子區(qū)多個(gè)潛在的轉(zhuǎn)錄因子是否能夠?qū)υ摶虻霓D(zhuǎn)錄調(diào)控有影響,進(jìn)而影響烏骨雞烏色性狀的形成有待進(jìn)一步研究。
本研究通過預(yù)測分析NCBI數(shù)據(jù)庫中雞EDN3基因2 052 bp啟動(dòng)子區(qū)序列表明,雞EDN3基因啟動(dòng)子區(qū)存在TATA-box、GC-box、CAAT-box和E-box等基本調(diào)控元件和3個(gè)CpG島結(jié)構(gòu)域;多種在線軟件綜合預(yù)測EDN3基因啟動(dòng)子區(qū),發(fā)現(xiàn)存在多個(gè)SP1、C/EBP和NF-1等轉(zhuǎn)錄因子潛在結(jié)合位點(diǎn)。該研究可為后期烏骨雞EDN3基因結(jié)構(gòu)和功能研究提供理論依據(jù),同時(shí)為EDN3基因調(diào)控烏骨雞烏質(zhì)性狀分子機(jī)制研究提供參考。