劉志朋,代紅梅,楊 忠,張 霞,霍海龍,王 配,李衛(wèi)真,趙 筱,霍金龍*
(1.云南農業(yè)大學動物科學技術學院,昆明 650201;2.云南生物制藥有限公司,昆明 650503;3.呂梁學院生命科學系,山西 呂梁 033001;4.云南農業(yè)職業(yè)技術學院,昆明 650212;5.云南農業(yè)大學動物醫(yī)學院,昆明 650201)
精子發(fā)生(spermatogenesis)是有性生殖雄性動物的睪丸中,精原細胞經過復雜的增殖、分化以及減數分裂最終形成成熟精子的過程,歷經精原細胞、初級精母細胞、次級精母細胞、精子細胞和成熟精子等多個過程,并發(fā)生兩次減數分裂[1]。該過程高度復雜有序且受嚴密的細胞發(fā)育調控,包括內在和外在的調節(jié)以及生殖細胞和支持細胞之間的相互作用[2]。精子發(fā)生過程中基因表達調控還受到內分泌、旁分泌和自分泌信號的二次調節(jié),這些信號可通過周圍體細胞(包括支持細胞)間接傳遞[3]。在雄性生殖細胞發(fā)育過程中,組蛋白H2A和H2B泛素化[4-5]是精子發(fā)生過程中染色質重塑的重要表觀遺傳標記之一[1,6-8]。已發(fā)現E3泛素連接酶RNF8可在長形精子細胞中介導組蛋白H2A和H2B的泛素化[9],除RNF8外,也發(fā)現了其他E3泛素連接酶在精子發(fā)生過程中廣泛表達[10],表明E3泛素連接酶在雄性生殖細胞發(fā)育過程中發(fā)揮重要功能。
PHF7(PHD finger protein 7)在小鼠中是一種E3泛素連接酶,可以同時結合組蛋白H2A和H3,并在組蛋白-魚精蛋白交換之前通過結合H3K4me3/me2來特異性泛素化H2A[11],PHF7缺失會導致小鼠長形精子細胞中H2A泛素化異常,在精子形成后期阻礙組蛋白-魚精蛋白的交換,從而引起雄性不育[11]。在人類中,PHF7也被稱為睪丸發(fā)育NYD-SP6,包含兩個PHD鋅指結構域,在精子發(fā)生阻滯患者睪丸中高表達,在刺激睪丸發(fā)育或精子發(fā)生的轉錄中發(fā)揮重要作用[12]。PHF7在果蠅中具有與H3K4me3結合偏好性,能特異性結合組蛋白H3N末端尾部,并促進果蠅種系中的雄性性別決定[13]。PHF7也能作為精子染色質凝聚的關鍵因子調控減數分裂后精子細胞中組蛋白-精蛋白的交換過程,PHF7介導的組蛋白泛素化能夠減弱BRDT(一種組蛋白移除因子)的泛素化,從而減弱BRDT失調導致的組蛋白-精蛋白交換障礙,以促進精子細胞染色質凝結早期組蛋白的去除[14]。PHF7還是腫瘤形成的關鍵影響因子,在雌性果蠅生殖系干細胞中,PHF7的高表達會阻礙卵子發(fā)生,導致無配子或生殖細胞瘤表型[15],此外,在無Sxl(性連鎖致死)蛋白的前提下,PHF7的表達會通過細胞自主性機制(Jak/Stat信號通路)驅動腫瘤形成[16]。
PHF7基因在人類[12]、小鼠[11]、大鼠和雞[17]的睪丸中大量表達,并且與精子發(fā)生相關。在高度近交的公牛中也檢測到PHF7與精子發(fā)生過程相關[18]。版納微型豬近交系(BMI)是利用我國地方品種滇南小耳豬培育的豬近交系,已通過全同胞和親子交配的高度近交方式繁育41年,是生命科學領域良好的實驗動物模型和異種器官移植供體[19]。近交過程中出現的部分不育公豬導致一些家系發(fā)生了斷代現象,制約了群體數量的擴大,故研究精子發(fā)生相關基因的表達調控作用對于BMI繼代繁育具有重要的科學意義。本研究以BMI睪丸為研究材料,進行全轉錄組測序,獲得PHF7基因的表達水平,克隆該基因編碼區(qū)序列分析其分子特征,利用生物信息學對其進行功能分析、注釋基因,并構建其轉錄調控網絡,為深入研究PHF7在BMI精子生成方面的功能奠定基礎。
本研究中實驗動物的使用嚴格按照中華人民共和國科學技術部頒布的《實驗動物管理條例》執(zhí)行(批準文號:2006-398),且經云南農業(yè)大學動物保護委員會批準。屠宰12月齡版納微型豬近交系公豬4頭,立即取睪丸組織放入液氮,后轉入-80℃冰箱保存,供后續(xù)試驗。試驗所需RNAiso Plus、PrimeScriptTMⅡ1st Strand cDNA Synthesis Kit、Premix TaqTM等均購自大連TaKaRa公司。
提取睪丸組織RNA,反轉錄為cDNA,采用RNA-seq Illumina Hiseq 4000平臺進行轉錄組測序(由北京諾禾致源科技有限公司完成),利用fastp軟件[20]對測序獲得的原始數據進行質控并過濾低質量數據,包括去除接頭序列、含N比例大于10%的序列、全是A堿基的序列以及低質量序列。使用bowtie2(v.2.1.0)軟件[21]將過濾好的數據與NCBI豬核糖體參考序列數據進行比對,并去除比對上的序列。從Ensembl網站下載豬參考基因組(Sus_scrofa.Sscrofa11.1.dna.toplevel.fa)和注釋文件(Sus_scrofa.Sscrofa11.1.102.gtf),使用STAR(v.2.5.2a)軟件[22]構建參考基因組索引,并將已去除核糖體序列的數據與豬參考基因組比對。用featureCounts(v.2.0.1)軟件[23]和 Salmon(v.1.5.1)軟件[24]分別計算樣本中PHF7基因的原始表達量和TPM值校正表達量。
根據PHF7基因轉錄組數據釣取到Ensembl數據庫對應的豬PHF7轉錄本ENSSSCT 00000012519.4,利用該轉錄本序列設計特異引物(F:CGTCTCTCATCACACGCTTT;R:CTGTTCTGTC CTACGTCCC),以BMI睪丸cDNA為模板擴增PHF7基因全長編碼區(qū)。反應體系25 μL:Premix TaqTM12.5 μL,10 μmol/L PHF7上下游引物各1 μL,25 ng/μL cDNA 1 μL,H2O 9.5 μL;擴增程序:95 ℃ 5 min;95 ℃ 30 s,55 ℃ 45 s,72 ℃ 80 s,35個循環(huán);72 ℃10 min。擴增產物送昆明擎科生物公司測序。
利用Lasergene7.1校對測序的BMI PHF7序列;使用NCBI的ORFfinder查找分析PHF7的開放閱讀框;用ProtParam程序預測PHF7蛋白質的分子量、分子式、等電點、正負電荷殘基數;使用SOPMA、ProtScale和Prosite分別預測PHF7蛋白質的二級結構、疏水結構和功能位點;通過TMHMM 2.0和SignalP 5.0工具分別預測PHF7蛋白的跨膜結構和信號肽;使用MEGA-X軟件構建PHF7蛋白的系統(tǒng)發(fā)育樹;用Weblogo工具對結構域區(qū)的氨基酸序列進行保守性分析,用String 11.5進行蛋白互作網絡分析。
利用Uniprot進行GO(gene ontology)功能注釋;利用已獲得的豬RNA-seq數據進行微小RNA(micro RNA,miRNA)和長鏈非編碼RNA(long noncoding RNA,lncRNA)表達分析;使用miRanda 3.3和RNAhybrid 2.1.2軟件對潛在的調控PHF7的miRNA和lncRNA進行分析;并用Cytoscape 3.8.2繪制可視化相互作用網絡圖。
轉錄組鑒定的PHF7基因在BMI睪丸中的原始平均表達量為27 285.25,矯正平均表達量(TPM)為356.79,其轉錄本對應Ensemble數據庫中的ENSSSCT00000012519.4。 PHF7 定 位 于 豬(Sscrofa11.1)13號常染色體,全長11 830 bp,依據Ensembl網站分析發(fā)現共有11個外顯子和10個內含子(圖1A)。利用PHF7引物擴增PHF7基因的完整編碼區(qū)(CDS)及部分非編碼區(qū)(UTR),獲得1 500 bp長的產物(圖1B),編碼384個氨基酸(圖1C),對該產物測序結果進行開放閱讀框(ORF,open reading frame)分析發(fā)現,存在8個ORF,其中全長開放閱讀框ORF1(即完整CDS區(qū))1 155 bp為正確的編碼ORF(圖1D),含有兩個保守結構域,分別為ePHD_PHF7_G2E3_like和PHD_PHF7_G2E3_like(圖1C,圖1E)。
圖1 PHF7基因結構Figure 1 Gene structure of PHF7
豬PHF7蛋白質分子量43.96 kD,分子式C1889H2978N578O564S36,等電點 9.02,負電荷殘基為 45,正電荷殘基為66。PHF7蛋白質384個氨基酸的二級結構中無規(guī)則卷曲占比最大,包含230個氨基酸;α螺旋次之,包含90個氨基酸;延伸鏈51個氨基酸;β轉角最少,有13個氨基酸。蛋白質的第60、61和62位氨基酸具有最大疏水值1.811,第9位氨基酸處具有最小疏水值-3.944,N端和C端均疏水(圖2A)。含有酶磷酸化、酰胺化等活性位點(圖2B)。不含信號肽和跨膜結構。
圖2 PHF7蛋白氨基酸疏水性(A)和磷酸化位點(B)Figure 2 Hydrophobicity(A)and phosphorylation site(B)of PHF7 amino acids
9個哺乳動物PHF7氨基酸序列比較發(fā)現,BMI豬PHF7與野生雙峰駝Wild Bactrian camel(XP_006180052.1)、羊駝 Alpaca(XP_031542326.1)和灰熊 Grizzly bear(XP_026356764.1)的序列相似度最高,均大于90%;與食蟹猴Crab-eating macaque(XP_005547399.1)、黑 猩 猩 Chimpanzee(NP_001233471.1)、人 Human(NP_001308055.1)、牛Cattle(XP_002697069.2)和 山 羊 Goat(XP_005695935.1)相似度次之,均大于85%(圖3A)。9種哺乳動物PHF7氨基酸序列系統(tǒng)進化分析發(fā)現,豬與雙峰駝和羊駝聚為一支,提示在進化上豬與雙峰駝和羊駝親緣關系較近(圖3B)。結構域比對分析發(fā)現,豬PHF7氨基酸靠近N端34-145位點處的ePHD(extended plant homeodomain)和248-301處的PHD(plant homeodomain)在不同物種間的氨基酸差異位點個數分別為17和14(圖1E、圖3C和圖3D),表明這兩個結構域在哺乳動物間有較高的保守性。
圖3 不同哺乳動物PHF7氨基酸序列分析Figure 3 Amino acid sequences analysis of PHF7 from different mammals
蛋白互作網絡(PPI)分析顯示BMI PHF7與10個蛋白可能存在相互作用,包括Set1/Ash2組蛋白甲基轉移酶復合物亞基(ASH2L)、成視網膜細胞瘤結合蛋白5(RBBP5)、賴氨酸特異性去甲基化酶7A(KDM7A)、生精亮氨酸拉鏈蛋白1(SPZ1)、T復合物11(TCP11)、泛素羧基末端水解酶7(USP7)、胚胎外胚層發(fā)育蛋白(EED,多梳抑制復合體2亞基)、多梳抑制復合體2亞基(SUZ12)、激活轉錄因子7相互作用蛋白(ATF7IP)、F-Box和富含亮氨酸重復蛋白19(FBXL19),其中PHF7與EED和SUZ12蛋白間有最強的相互作用(圖4)。
圖4 豬PHF7蛋白互作網絡Figure 4 Interaction network of pig PHF7 protein
對豬PHF7的功能注釋發(fā)現,在細胞組分(cellular component)方面,其主要定位于細胞核、核質、細胞質基質、質膜、核小斑(一個離散的核外亞核結構域)、高爾基體。在分子功能(molecular function)方面,主要涉及與金屬離子結合方面的功能(圖5)。ceRNA網絡分析發(fā)現:豬PHF7主要受到8個miRNA的靶向調控(表1,圖5)。并且有10個lncRNAs可與PHF7競爭性結合ssc-miR-149,5個lncRNAs可與PHF7競爭性結合ssc-miR-769-3p,4個lncRNAs可與PHF7競爭性結合ssc-miR-324,3個lncRNAs可與PHF7競爭性結合ssc-miR-296-3p,分別有1個lncRNA與PHF7競爭性結合sscmiR-133b和ssc-miR-7142-3p(表1,圖5)。
圖5 PHF7的功能注釋及潛在的ceRNA調控網絡Figure 5 The functional annotation BMI PHF7 and potential ceRNA regulatory network
表1 PHF7基因ceRNA調控信息Table 1 ceRNA regulate PHF7 gene
本研究通過擴增BMI睪丸cDNA獲得了PHF7基因序列1 500 bp(圖1B),包括編碼序列1 155 bp,編碼384個氨基酸(圖1C、1E),序列已提交GenBank,獲得的基因登錄號為OK042304。豬PHF7蛋白包含一個典型的PHD鋅指結構域和一個非典型的擴展PHD鋅指結構域(圖1C、1E),兩者都參與轉錄激活調控。PHD和ePHD組成RING樣泛素連接酶域,該酶域在細胞周期調節(jié)和細胞對DNA損傷應答的反應中發(fā)揮作用[25],還在預防早期胚胎發(fā)生中的細胞凋亡中起重要的作用[25],含有該結構域的蛋白還是DNA損傷響應定位的核質穿梭蛋白[26],具有“讀碼器”功能,能將染色質重塑與基因轉錄的變化聯系起來[27],這些含有PHD結構域的蛋白質[28-31](如組蛋白修飾劑、轉錄因子和DNA修飾酶)的發(fā)現可為基因的靶向治療提供思路,依賴于PHD結構域對組蛋白密碼的識別,可將外源性的PHD結構域蛋白導入人體,從而靶向特定基因的轉錄激活和抑制。
有研究發(fā)現,脊椎動物PHF7基因不是從共同的PHF7祖先進化而來,而是通過來自祖先G2E3的獨立復制事件進化而來[17]。在人類中發(fā)現的PHF7同源基因(其蛋白包含兩個PHD結構域),可以挽救在雄性果蠅PHF7突變體中出現的生殖缺陷,表明該蛋白在調節(jié)雄性生殖系發(fā)育過程中的功能是保守的[17]。氨基酸序列比對發(fā)現,BMIPHF7編碼區(qū)對應的氨基酸序列與其他哺乳動物的相似度在85%以上,與雙峰駝和羊駝的相似度高達90%以上,且和二者聚為一支(圖3B),這說明豬PHF7在物種進化過程中較為保守(圖3A)。
蛋白互作分析發(fā)現,PHF7與ASH2L等10種蛋白存在可能的相互作用。其中,ASH2L和RBBP5之間的相互作用對組蛋白甲基轉移酶MLL1復合物的完整性和活性調控至關重要[32-33],ASH2L能夠識別RBBP5,介導MLL1復合物組裝,調控MLL1酶活性[32]。組蛋白去甲基化酶KDM7A控制前列腺癌的雄激素受體活性和腫瘤生長[34]。SPZ1是一個新的bHLH(basic helix-loop-helix)拉鏈蛋白,在小鼠睪丸中特異性表達,該轉錄因子在精子發(fā)生中發(fā)揮關鍵作用,可通過結合特定的DNA序列調節(jié)細胞的增殖或分化[35]。TCP11蛋白富集于小鼠長形精子細胞中,通過環(huán)磷酸腺苷/蛋白激酶A途徑使精子獲能[36]。USP7是一種對DNA復制至關重要的去泛素化酶[37],也是Wnt/β-catenin信號轉導的有效負調控因子[38]。EED和SUZ12是Polycomb repressive complex 2的組成部分,在轉錄調節(jié)過程中發(fā)揮關鍵作用[39]。ATF7IP是一種轉錄輔助因子,對于基因的激活或抑制起重要作用[40]。FBXL19是E3泛素連接酶SCF(Skp1-Cullin-F-box protein)家族成員,可調節(jié)多種細胞反應,包括細胞遷移[41]。這些潛在與PHF7互作的蛋白的發(fā)現,為深入理解PHF7的功能提供了思路。
對PHF7功能注釋發(fā)現,其主要參與金屬離子(Ca2+、Zn2+、Cd2+和Cu2+等)的結合過程,保守結構域分析也發(fā)現PHF7存在與鋅離子結合的位點(圖1E)。microRNA(miRNA)是一類負調控基因表達的非編碼RNA。靶基因預測發(fā)現,PHF7的表達可能 受 ssc-miR-149、ssc-miR-769-3p、ssc-miR-324、ssc-miR-296-3p、ssc-miR-133b、ssc-miR-7142-3p、ssc-miR-27b-3p和 ssc-miR-193a-5p等8個miRNA的調控。ssc-miR-149在巴馬小型豬垂體前葉的表達量顯著高于長白豬[42],且miR-149參與先天免疫應答、凋亡過程和多個信號通路(I-kappa B knase/NF-kappaB,toll樣和腫瘤壞死因子介導信號通路等)的生物學過程[43]。ssc-miR-769-3p屬于miR-769家族,人類中的miR-769-3p能夠促進細胞凋亡[44]。ssc-miR-324與泛素化相關基因Ube2e1、Ube2v1和Bap1的表達量呈高度負相關[45],另外,miR-324在不育男性的精液中的表達量顯著高于正常男性[46]。ssc-miR-296-3p是腫瘤進展過程中的整體抑癌因子,與各種癌癥的轉移相關[47],miR-296能加速腫瘤進程,還能通過SOCS2/STAT3增強膠質母細胞瘤(GBM)對細胞的侵襲性[48]。sscmiR-133b在細胞轉化、腫瘤發(fā)生和組織穩(wěn)態(tài)過程中發(fā)揮重要作用[49-50]。ssc-miR-7142-3p可以在閹割豬的背部脂肪組織中表達[51]。ssc-miR-27b-3p影響多能脂肪干細胞的分化,能與人PPARγ的3’UTR區(qū)應答元件結合降低PPARγ蛋白表達,從而抑制脂肪形成[52],小鼠附睪白色脂肪組織中miR-27b-3p的高表達能夠影響脂肪細胞的褐變[53]。ssc-miR-193a-5p可作為癌癥發(fā)展過程中的抑制因子[54],在前列腺癌組織中高表達[55]。本文通過miRanda和RNAhybrid預測能調控PHF7表達的miRNA,獲得的mRNA-miRNA結合自由能均小于-30 kcal,其中,miRanda的預測得分大于150分,RNAhybrid的預測P值小于0.05,所得結果具有較高的可信度。與PHF7競爭miRNA的諸多l(xiāng)ncRNA的功能,目前還未有研究報道,有待進一步研究。