馬汝海,王天驕,潘忠誠,趙雨杰,何 群*
(中國醫(yī)科大學a.公共基礎(chǔ)學院化學教研室;b.基礎(chǔ)醫(yī)學院教育部細胞生物學重點實驗室,中國遼寧沈陽 110122)
熱休克轉(zhuǎn)錄因子(heat shock transcription factor,HSF)在熱應激反應中與熱休克基因相應的啟動子結(jié)合,啟動基因的轉(zhuǎn)錄過程,最終促進熱休克蛋白(heat shock protein,HSP)的表達。目前發(fā)現(xiàn)HSF 家族有 5 個成員:HSF1、HSF2、HSF3、HSF4、HSF5;哺乳動物體內(nèi)有3種熱休克因子,即HSF1、HSF2 和 HSF4;家禽體內(nèi)有 HSF3[1~3]。
作為熱休克轉(zhuǎn)錄因子家族的成員,HSF4含有高度保守的DNA結(jié)合域[4],除調(diào)控HSP表達功能以外,也參與細胞的生長和分化過程。比如:HSF4表達與晶狀體發(fā)育相關(guān),可激活晶狀體上皮細胞分化,HSF4缺失會影響晶狀體上皮細胞熱休克蛋白的表達[5,6];Hsf4突變與白內(nèi)障發(fā)生相關(guān)[7,8];Hsf4基因缺失會抑制p53或Arf基因缺陷小鼠自發(fā)性腫瘤的發(fā)展,p53和Arf基因缺陷小鼠敲除Hsf4后其腫瘤圖譜明顯改變,淋巴瘤被顯著抑制[9];Hsf4缺陷細胞中細胞衰老與細胞周期蛋白依賴性激酶抑制劑p21和p27蛋白的表達增加[10];HSF4通過調(diào)控RAD51參與DNA損傷修復[11];在Hsf4基因敲除小鼠中DNA損傷標志基因Trx1和Ddit3的表達異常[5,6];Miles等[12]報道在SUDHL-4細胞中,HSF4可與BCL6相互作用,BCL6有調(diào)節(jié)B淋巴細胞發(fā)育和生長的功能,最新研究表明BCL6在B細胞淋巴瘤和其他癌癥的發(fā)病機制中起著重要作用[13,14]。這些研究結(jié)果提示HSF4參與了細胞生長發(fā)育等多種生理、病理過程,對HSF4可能調(diào)控的靶基因進行系統(tǒng)分析有助于了解HSF4潛在的生物學功能。因此,我們用染色質(zhì)免疫共沉淀聯(lián)合測序(chromatin immunoprecipitation sequencing,ChIP-Seq)方法對肝癌細胞系SMMC-7721中HSF4可能結(jié)合的靶序列以及可能調(diào)控的靶基因進行檢測,對潛在的靶基因進行GO(gene ontology)分析和細胞傳導通路分析,探討HSF4可能參與的生物學過程,并用MEME SUITE軟件對HSF4與DNA結(jié)合的序列模式進行了分析預測。
人肝癌SMMC-7721細胞購于中國科學院上海細胞庫,RPMI 1640培養(yǎng)基(含10%胎牛血清)購于Gibco公司(USA),所有細胞置于37℃、5%CO2的培養(yǎng)箱中常規(guī)培養(yǎng)。
染色質(zhì)免疫共沉淀由上??党缮锕咎峁┰噭┖胁f(xié)助完成。細胞的交聯(lián)和裂解:向細胞中加入終濃度為1%的甲醛交聯(lián)細胞,37℃孵育10 min,加甘氨酸至終濃度為0.125 mol/L終止交聯(lián),吸盡培養(yǎng)基,用冰冷的PBS清洗細胞2次,收集細胞。加入裂解液和蛋白酶抑制劑復合物,超聲破碎后將DNA剪切成300~400 bp的片段,分為兩部分,分別加入HSF4(艾博抗上海貿(mào)易有限公司)和IgG(艾博抗上海貿(mào)易有限公司)于4℃過夜,采用HSF4特異性單克隆抗體(艾博抗上海貿(mào)易有限公司)收集HSF4與DNA結(jié)合的靶序列,磁珠分離,分別用低鹽和高鹽洗滌液、LiCl和TE洗滌液清洗沉淀復合物,加入洗脫液洗脫,每管中加入終濃度為0.2 mol/L的NaCl于65℃解交聯(lián)過夜。DNA回收:解交聯(lián)結(jié)束后,加入RNaseA和蛋白酶K處理,用QIAquick Gel Extraction Kit富集收集凝膠回收DNA片段,測定DNA濃度(Qubit?Fluorometer)。PCR分析驗證:采用Actb作為陰性對照,Hsp70作為陽性對照,Actb-F:5′-CTAGGTCACCCACTAACGCC-3′;Actb-R:5′-GGGCACCTTTTACCCTGGAG-3′;Hsp70-F:5′-CCGCCACTCCCCCTTCCTC-3′;Hsp70-R:5′-CCGCCTTTTCCCTTCTGAGC-3′。加入T4 DNA聚合酶和Klenow polymerase對DNA進行鈍化,在3′加入A末端。采用Illumina’s genomic adapters連接DNA片段,PCR擴增,凝膠電泳后用QIAquick Gel Extraction Kit富集收集DNA產(chǎn)物。使用Agilent 1000芯片試劑盒和Agilent 2100 Bioanalyzer驗證DNA文庫質(zhì)量。最后加入0.1 mol/L NaOH產(chǎn)生單鏈DNA分子,按照TruSeq Rapid SBS Kit操作說明用Illumina HiSeq 2000進行測序。
生成的序列圖譜及圖像分析結(jié)果提交到OLB V1.8軟件讀取測序結(jié)果,Solexa CHASTITY過濾后的數(shù)據(jù)使用BOWTIE software(V2.1.0)與人類基因組(UCSC hg19)進行比對,圖譜峰值檢測采用MACS V1.4.0。
對啟動子區(qū)有HSF4結(jié)合區(qū)域的基因進行GO分析(www.geneontology.org),P≤0.05。
根據(jù)KEGG(Kyoto Encyclopaedia of Genes and Genomes)最新數(shù)據(jù),我們對啟動子區(qū)有HSF4結(jié)合區(qū)域的基因進行細胞通路分析(P≤0.05)。
提取與HSF4結(jié)合的啟動子區(qū)域的DNA序列,提交到MEME4.12.0(http://meme-suite.org/tools/meme)進行模式分析,探討DNA序列與HSF4結(jié)合的序列模式。
將建立的DNA測序文庫與hg19數(shù)據(jù)庫進行對比,使用最新的UCSC RefSeq數(shù)據(jù)庫進行基因注釋。峰值區(qū)域按照最近的TSS被分成五類,即啟動子區(qū)域:TSS上下游±2 000 bp;上游區(qū)域:從TSS上游2 000 bp起始最多達20 000 bp;內(nèi)含子區(qū)域;外顯子區(qū)域;不在上述4個區(qū)域的DNA集合區(qū)定義為基因間隔區(qū)。總共發(fā)現(xiàn)1 726個HSF4結(jié)合區(qū)域,約55.59%的HSF4結(jié)合區(qū)域位于基因間區(qū),11.54%處于上游區(qū)域,25.57%位于內(nèi)含子區(qū),1.39%位于外顯子區(qū),5.91%位于啟動子區(qū)(圖1)。
為了探討HSF4在SMMC-7721細胞系中發(fā)揮的生物學功能,我們對在啟動子區(qū)域有HSF4結(jié)合位點的102個基因序列進行聚類分析(GO分析,www.geneontology.org,P≤0.05),結(jié)果如表1和圖2所示。Cellular component(CC)分析結(jié)果共有41個基因,主要位于細胞核,部分位于細胞器,少部分位于細胞膜;molecular function(MF)分析結(jié)果顯示有18個基因,主要與核酸蛋白質(zhì)結(jié)合以及蛋白質(zhì)活性相關(guān);biological process(BP)分析結(jié)果顯示有31個基因,主要參與細胞增殖、系統(tǒng)發(fā)育、對化學藥物以及外來刺激的反應和免疫應答過程,其中一些基因參與了多個生物學過程,隸屬于不同亞項。表1列舉了GO聚類分析中各項目的靶基因數(shù)目,很多基因參與一個聚類分析中兩個或更多的亞項。
ChIP-Seq結(jié)果顯示有102個基因在啟動子區(qū)有HSF4結(jié)合區(qū)域,基于最新的KEGG數(shù)據(jù)庫,我們對這些基因進行細胞通路富集分析,結(jié)果顯示這些HSF4潛在的靶基因主要參與以下細胞通路:藥物代謝、外源物代謝、化學致癌、視黃醇代謝、酪氨酸代謝、類固醇激素合成以及催乳激素的信號轉(zhuǎn)導通路等(圖3)。
目前尚沒有看到與HSF4結(jié)合的DNA特定基序的有關(guān)報道,大多數(shù)轉(zhuǎn)錄因子(transcription factor,TF)的數(shù)據(jù)庫有關(guān)HSF家族結(jié)合基序數(shù)據(jù)多依據(jù)HSF1的基序模式。我們將在啟動子區(qū)域與HSF4結(jié)合的DNA序列提交到MEME4.12.0分析軟件,以探討在SMMC-7721細胞系中HSF4特定的DNA結(jié)合基序,結(jié)果如圖4所示。我們將編碼基因和非編碼基因啟動子序列分別進行分析,得出6個分析結(jié)果,編碼基因和非編碼基因各有3個基序模式,其中編碼基因的啟動子基序呈現(xiàn)AG或者CT的聚集簇。
表1 GO分析中參與各個功能的靶基因數(shù)量Table 1 The number of the target genes participating in GO categories
當細胞受到高溫、毒物、自由基及感染等應激原的刺激時,會發(fā)生一種普遍的防御性適應反應——熱休克反應(heat shock response,HSR)。當細胞受到應激性刺激時,細胞會通過HSR誘導熱休克蛋白(heat shock protein,HSP)表達增強,引起基因表達譜的改變,減輕應激性刺激對細胞的不良影響。HSP作為一種分子伴侶,在調(diào)控細胞穩(wěn)定性、提升細胞存活率方面發(fā)揮重要作用[15]。HSF4是HSF家族的重要成員,其發(fā)現(xiàn)較晚。已有研究顯示,HSF4能啟動HSP編碼基因的轉(zhuǎn)錄過程,促進HSP的表達,發(fā)揮耐受不良刺激、保持細胞完整性等重要適應性保護作用[16]。近來相關(guān)研究發(fā)現(xiàn),HSF4亦參與與應激性刺激無關(guān)的過程,例如:參與細胞周期、細胞分化,與HSF協(xié)同作用[17,18]。為了探討HSF4在肝癌發(fā)生機制中所起的作用,我們采用ChIP-Seq方法對全基因組HSF4與DNA結(jié)合位點進行檢測,尋找HSF4可能的靶基因,并對這些潛在的靶基因進行GO分析和細胞通路分析。分析結(jié)果顯示:這些潛在的靶基因分別參與了藥物代謝、外源性物質(zhì)代謝、化學致癌、視黃醇代謝、酪氨酸代謝、類固醇激素的合成以及催乳激素的信號轉(zhuǎn)導通路,參與了細胞發(fā)育、細胞增殖、藥物刺激應答等多種生物學過程,其中多數(shù)基因具有與蛋白質(zhì)或核酸結(jié)合的功能,與蛋白質(zhì)的活性有關(guān)。在這些基因中,有部分基因與腫瘤的形成和細胞增殖關(guān)系密切,例如,Aldh3a1、Cyp2a6和Zbtb7b。文獻報道,Aldh3a1在肝細胞癌中過表達,可激活Wnt/β信號傳導通路[19];抑制Aldh3a1表達可抑制腫瘤細胞的增殖,在組織再生過程中ALDH3A1可刺激正常細胞增殖[20];此外,前列腺癌淋巴結(jié)轉(zhuǎn)移患者中也發(fā)現(xiàn)了Aldh3a1表達上調(diào)[21]。CYP2A6是細胞色素P450酶家族的一個成員,P450是單加氧酶,參與藥物代謝以及膽固醇、類固醇和其他脂類的合成反應。Cyp2a6主要在肝臟中表達,參與多種物質(zhì)包括藥物和有毒物質(zhì)的代謝,如尼古丁代謝,并與吸煙引起的疾病密切相關(guān)[22]。Zbtb7b也稱Thpok基因,編碼產(chǎn)物為含有鋅指結(jié)構(gòu)的轉(zhuǎn)錄因子,該轉(zhuǎn)錄因子在未成熟的T細胞前體細胞系中起著調(diào)控作用[23],Thpok基因缺失會導致Cd8基因轉(zhuǎn)錄受到抑制[24],在早期結(jié)腸癌中Thpok起著免疫調(diào)節(jié)作用[25]。所有這些信息提示:HSF4可能通過調(diào)節(jié)這些潛在的靶基因,在肝癌的形成機制中發(fā)揮作用。
圖2 GO分析結(jié)果Fig.2 GO analysis map
圖3 啟動子區(qū)域有HSF4結(jié)合位點的基因的細胞通路分析Fig.3 KEGG pathway analysis of genes with HSF4 binding sites in the promoter region
圖4 SMMC-7721細胞ChIP-Seq實驗中HSF4與DNA結(jié)合位點基序分析結(jié)果Fig.4 Motifs bound by HSF4 in SMMC-7721 cells in ChIP-Seq analysis
轉(zhuǎn)錄因子在基因轉(zhuǎn)錄起始點與特定的DNA序列相結(jié)合,這段DNA片段通常為6~18 bp,轉(zhuǎn)錄因子特異識別位點的確定一直具有挑戰(zhàn)性。Hsf4的表達存在組織及細胞特異性,通常認為HSF4參與應激反應時,胞內(nèi)或胞外的信號刺激活化HSF4,使HSF4結(jié)構(gòu)改變,暴露DNA結(jié)合域,隨后活化的HSF4識別并結(jié)合熱休克基因上游的熱休克元件,從而刺激HSP的表達。
目前,在所有熱休克基因上游均發(fā)現(xiàn)“CTNGAANNTTCNAG”多個拷貝聚集區(qū)[26],一般認為熱應答元件(heat response element,HSE)中至少有兩個或以上的保守五核苷酸序列nGAAn反相交替排列,形成頭-頭(nGAAnnTTCn)和尾-尾(nTTC-nnGAAn)結(jié)構(gòu),為HSF的識別位點。但是目前有關(guān)人類HSF4與啟動子區(qū)結(jié)合的DNA特征序列尚無報道,只有HSE啟動子區(qū)的順式作用元件(HSE:CGAATTCG)的報道[27,28]。Jaspar數(shù)據(jù)庫中有關(guān)HSF結(jié)合motif只有HSF1的相關(guān)記錄:ma0319.1(mouse)[29]和 ma04888886.1(yeast)[30]。ChIP-Seq 是確定轉(zhuǎn)錄因子與DNA結(jié)合區(qū)域的主要手段,但具體的motif還需要進一步分析。MEME是一種分析DNA motif的生物信息學軟件[31],輸入結(jié)合區(qū)域的DNA序列后,通過富集分析、定位分析和聚類分析可預測出潛在的motif。我們將ChIP-Seq結(jié)果中與HSF4結(jié)合的啟動子區(qū)域的DNA序列提交給MEME4.12.0軟件,最后得到與HSF4結(jié)合的motif,分析結(jié)果顯示:潛在的靶基因DNA結(jié)合區(qū)域均存在agagag或tctctc聚集模式。
通過ChIP-Seq和生物信息學分析,我們對SMMC-7721細胞系中HSF4可能調(diào)控的靶基因以及這些靶基因在生物體中可能發(fā)揮的作用和可能參與的生物學過程進行了分析,并對HSF4與DNA結(jié)合的序列模式進行了預測,為進一步研究HSF4在肝癌形成機制中所發(fā)揮的作用提供了理論基礎(chǔ)。