楊 錦 鄒斌斌 張玉祥 王澤生
(首都醫(yī)科大學基礎(chǔ)醫(yī)學院生物化學與分子生物學系)
表皮生長因子受體(epidermal growth factor receptor,EGFR)參與調(diào)控細胞代謝、增生、遷移和分化。其過度表達可加速細胞分裂與增生,抑制凋亡,有助于血管形成,并促進癌細胞轉(zhuǎn)移[1]。人類腫瘤包括非小細胞肺癌、乳腺癌、頭頸癌、胃癌、結(jié)腸癌、食管癌、前列腺癌、膀胱癌、腎癌、胰腺癌、口腔癌等都可表達或高表達EGFR[2]。腫瘤中的EGFR表達與疾病侵襲性增強、化療抵抗增加、轉(zhuǎn)移性增強,生存率下降及臨床預后差相關(guān)[3]。
egfr基因5'調(diào)控區(qū)包括1個富含GC的啟動子,缺少保守序列TATA盒和CAAT盒,有多個位點可以起始轉(zhuǎn)錄[4]。egfr啟動子在-216G/T存在多態(tài)性并與其增加活性相關(guān)[5]。深入了解egfr基因在腫瘤內(nèi)的表達調(diào)控將有助于我們對該基因的表達進行干預,并治療相應腫瘤。進行這類研究需要大規(guī)模、多樣本的基因組重測序。盡管第二代測序成本已明顯降低,但全基因組重測序需要大量的時間和高額的成本,制約其應用于疾病研究?;蚪M目標區(qū)域重測序策略不需對全基因組進行測序,只對基因或其他感興趣的基因組區(qū)域的基因序列重新測定。國際上已發(fā)表的研究報告[6-7]均采用商業(yè)公司推出的目標序列捕獲解決方案。本研究以宮頸癌細胞系HeLa S3 egfr啟動子為模型,建立了一套簡便易行的RNA捕獲靶序列的富集體系,結(jié)合Solexa測序方法,為各種復雜人類疾病相關(guān)突變的檢測奠定良好基礎(chǔ)。
1)細胞株:宮頸癌細胞系HeLa S3(購于北京協(xié)和細胞庫)。
2)主要試劑:RPMI 1640培養(yǎng)基(美國Gibco公司);胎牛血清(fetal bovine serum,F(xiàn)BS)(美國Hyclone公司);MboI、Klenow Fragment、Klenow Fragment(3'→5'exo-)、T7 RNA Polymerase、rNTP(美國NEB公司); T4 DNA連接酶、Ex Taq(日本Takara公司);Biotin-11-dUTP(立陶宛Fermentas公司);Biotin-16-UTP(美國Ambion公司);Dynabeads M-280 Streptavidin(美國Invitrogen公司);DNA膠回收試劑盒、PCR純化試劑盒(德國Qiagen公司);引物合成單位(中國上海生工生物工程有限公司);高通量測序單位(北京六合華大基因科技股份有限公司深圳分公司)。
1)細胞培養(yǎng):在5%CO2,37℃的培養(yǎng)箱中,用含有10%FBS的RPMI 1640培養(yǎng)基對HeLa S3細胞進行培養(yǎng)。
2)DNA文庫的制備:①細胞基因組的提取:8 000 g離心1 min,收集細胞,加入終濃度為0.5 μg/μL蛋白酶K,55℃消化過夜。消化16 h后再加入終濃度為0.2 μg/μL的RNase A,在37℃水浴30 min消化RNA,酚/氯仿抽提,乙醇沉淀,加入50 μL無菌水溶解。②MboⅠ酶切基因組:取基因組2 μg,50 μL體系中加入5 μL 10×NE Buffer2,加入5 U的限制性內(nèi)切酶MboⅠ,在37℃下水浴,消化過夜。65℃水浴20 min滅活限制性內(nèi)切酶活性。③DNA片段兩端加接頭:加入2 μL 10× NE Buffer2,加入終濃度為0.1 mmol/L的dNTP,加入Klenow Fragment(3'→5'exo-)15 U,在37℃水浴30 min。將體系擴大到100 μL,加入終濃度為1×T4 DNA連接酶緩沖液,加入終濃度為0.8 μmol/L的3'端‘T’突出的Pair-end adapter 1和Pair-end adapter 2(表1),加入50 U的T4 DNA連接酶,16℃水浴過夜。④DNA片段的純化、回收:酚/氯仿抽提,乙醇沉淀,加入15 μL無菌水溶解。所得DNA用1.5%瓊脂糖膠電泳,QIAGEN試劑盒膠回收400~1 000 bp DNA,加入100 μL無菌水溶解作為雜交模板。
3)生物素標記egfr啟動子片段的RNA制備和RNA/DNA雜交捕獲:①egfr啟動子片段兩端加T7,SP6 adapter:以基因組DNA為模板,用egfr promotor primer (表1)擴增egfr啟動子片段272 bp,液體回收后加上T7,SP6 adapter(表1),用T7,SP6引物PCR擴增egfr啟動子片段,即得到帶有T7啟動子的egfr啟動子片段。②egfr啟動子片段轉(zhuǎn)錄為RNA:液體回收PCR產(chǎn)物,30 μL反應體系中含有4 mmol/L rNTP,1×T7 RNA Polymerase buffer,75 U T7 RNA Polymerase,0.3 mmol/L biotin-16-UTP,37℃水浴3 h。③egfr啟動子RNA/3C模板雜交: 200 μL反應體系中含有5×SSC buffer(0.75 mol/L NaCl,0.075 mol/L檸檬酸鈉),加入DNA模板100 μL,95℃加熱2 min,冰上1 min,加入RNA 30 μL,65℃雜交24 h。④egfr啟動子片段富集:取鏈親和素包被的Dynal磁珠10 μL,用100 μL 2×B&W緩沖液懸浮磁珠,加入100 μL的生物素化RNA/DNA,輕輕旋轉(zhuǎn),室溫下放置過夜。用200 μL 1×TWB緩沖液洗3次,70℃加熱30 min,取上清,即得到生物素化的RNA/DNA(圖1)。
圖1 RNA捕獲法技術(shù)流程圖Fig.1 Schematic representation of RNA capture method
表1 PCR引物及接頭序列Tab.1 Sequence of pair-end adapters and PCR primers
4)樣本擴增和高通量測序:50 μL反應體系中含有0.4 mmol/L PE引物(表1),0.2 mmol/L dNTPs,1.25 U Ex Taq DNA聚合酶,5 μL DNA模板。98℃變性30 s后,再依下列條件進行PCR:98℃變性10 s,62℃退火30 s,72℃延伸60 s,15個循環(huán)后,72℃延伸5 min。產(chǎn)物純化定量。RNA捕獲的樣本擴增15個循環(huán)后,進行Solexa高通量測序。
結(jié)果顯示,MboⅠ酶消化的基因組DNA產(chǎn)生從大到小均一的酶切片段,與對照基因組相比,消化比較完全(圖2)。
圖2 MboⅠ酶切基因組DNA瓊脂糖凝膠電泳Fig.2 MboⅠdigestion efficiency by gelelectrophoresis assay M:100 bp DNA ladder;1:HeLa S3 genome DNA treated by MboⅠ;2:HeLa S3 genome DNA untreated by MboⅠ with same quantity as control.
用T7 RNA Polymerase轉(zhuǎn)錄egfr啟動子272 bp,37℃水浴3 h后,用1.5%瓊脂糖凝膠電泳檢測轉(zhuǎn)錄產(chǎn)物,可見egfr啟動子RNA呈彌散分布(圖3)。
圖3 T7 RNA Polymerase轉(zhuǎn)錄egfr啟動子片段瓊脂糖凝膠電泳Fig.3 Agarose gelelectrophoresis of egfr promotor DNA transcription by T7 RNA PolymeraseM:100 bp DNA ladder;1:egfr gene promotor DNA;2:egfr promotor RNA after transcription.
分別取富集前和富集擴增后的DNA模板12 ng作模板,用egfr promotor primer(表1)擴增,產(chǎn)物液體回收純化。瓊脂糖膠電泳結(jié)果顯示egfr啟動子片段經(jīng)過RNA雜交捕獲后有富集(圖4)。
圖4 egfr啟動子片段PCR瓊脂糖凝膠電泳Fig.4 Agarose gelelectrophoresis of egfr gene promotor DNA PCRM:100 bp DNA ladder;1:egfr gene promotor PCR using template before enrichment;2:egfr gene promotor PCR using template after enrichment.
Solexa高通量測序結(jié)果的數(shù)據(jù)作為實驗組,用黑色表示,從實驗組中隨機取總條數(shù)為106reads,比對到egfr啟動子片段reads條數(shù)為1 889條,而比對到隨機挑選的notch 1、pdgf-B、src基因reads條數(shù)為2、3、3條。從人類全基因組隨機取總條數(shù)106的等長reads作為對照組,用白色表示,比對到notch 1、pdgf-B、src、egfr基因reads條數(shù)分別為3,2,3,2條。橫坐標軸表示各基因名稱,縱坐標軸表示比對到各基因片段reads條數(shù)取log值。分析顯示,RNA捕獲法在本實驗中進行全基因組egfr啟動子片段富集了630倍(圖5)。
圖5 Reads比對不同的基因分析Fig.5 Analysis of Reads mapping different genes
基因組測序分析能夠為基因DNA序列提供最真實可靠的信息,它可以比較全面地描述基因的復雜性和多樣性[8]。隨著人類基因組計劃的完成和測序技術(shù)的不斷發(fā)展,可以大規(guī)模地篩選突變基因,并對基因多態(tài)性進行檢測,有助于發(fā)現(xiàn)罕見的基因突變和腫瘤組織中基因組水平的變異[9]。但是在全基因組水平進行測序目前的費用還比較昂貴,一般課題組難以承受,基因診斷和治療技術(shù)的普及受到DNA富集方法的限制。本課題組采用RNA捕獲法將egfr啟動子片段轉(zhuǎn)錄為RNA,與基因組進行雜交富集,并洗去基因組的其他部分,用PCR擴增建立測序文庫,進行高通量測序并利用生物信息學技術(shù)進行分析,證明RNA捕獲法對egfr啟動子有明顯的富集作用。傳統(tǒng)的靶向重測序技術(shù)如PCR技術(shù),費用過高或者通量過低[6],該技術(shù)與之相比,具有一定的優(yōu)越性,它不存在偏向性,可以高效富集DNA,針對性強,簡便易行,且降低了測序成本。Nimbl Gen公司[10]推出的基于芯片雜交的全外顯子捕獲芯片,內(nèi)含210萬個寡核苷酸探針,可以捕獲人類大部分外顯子,通過測序識別在外顯子中的基因變異。Agilent公司[11]推出了基于芯片雜交和液相雜交的全基因組外顯子捕獲產(chǎn)品,捕獲探針的長度是120 bp,每管溶液中包含55 000個生物素化的RNA探針,Agilent公司還發(fā)展了在線eArray設計平臺,可以根據(jù)客戶需要自行設計探針。但是對于一般的研究單位而言,費用仍較高,需要提前訂購,在技術(shù)也并非簡便易行。
本技術(shù)利用RNA捕獲法,不僅可以對感興趣的靶區(qū)段自行設計,還可以自行制備生物素化的RNA探針,降低了成本。除了對外顯子或編碼序列設計探針外,還可以對感興趣的非編碼序列自行設計和制備RNA探針。本實驗RNA探針的長度達272 bp,而且在序列捕獲時采用較高溫度,提高了捕獲反應的特異性。本技術(shù)結(jié)合高通量技術(shù)深度測序所富集區(qū)域,而非全基因組序列,從而提高效率,降低成本。它可以用于大規(guī)模、多樣本的與疾病相關(guān)的基因和基因組水平異常的研究,包括單核苷酸多態(tài)性,基因組結(jié)構(gòu)變異,群體多態(tài)性,可變剪切等。該技術(shù)為研究人員提供了一種低成本、高效率、靈活的目標測序方法,可以適用于多種不同的應用領(lǐng)域,它的研究與發(fā)展將會在重大疾病研究中發(fā)揮重要作用。
[1] Ciardiello F,Tortora G.EGFR antagonists in cancer treat-ment[J].N Engl J Med,2008,358:1160-1174.
[2] Salomon D S,Brandt R,Ciardiello F,et al.Epidermal growth factor-related peptides and their receptors in human malignancies[J].Crit Rev Oncol Hematol,1995,19:183-232.
[3] Tabernero J.The role of VEGF and EGFR inhibition:implications for combining anti-VEGF and anti-EGFR agents[J].Mol Cancer Res,2007,5:203-220.
[4] Brandt B,Meyer-Staeckling S,Schmidt H,et al.Mechanisms of EGFR gene transcription modulation:relationship to cancer risk and therapy response[J].Clin Cancer Res,2006,12:7252-7260.
[5] Liu W,Wu X,Zhang W,et al.Relationship of EGFR mutations,expression,amplification,and polymorphisms to epidermal growth factor receptor inhibitors in the NCI60 cell lines[J].Clin Cancer Res,2007,13:6788-6795.
[6] Mamanova L,Coffey A J,Scott C E,et al.Target-enrichment strategies for next-generation sequencing[J].Nat Methods,2010,7:111-118.
[7] Gnirke A,Melnikov A,Maguire J,et al.Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing[J].Nat Biotechnol,2009,27: 182-189.
[8] Shendure J,Ji H.Next-generation DNA sequencing[J].Nat Biotechnol,2008,26:1135-1145.
[9] Hillier L W,Marth G T,Quinlan A R,et al.Whole-genome sequencing and variant discovery in C.elegans[J].Nat Methods,2008,5:183-188.
[10]Choi M,Scholl U l,Ji W,et al.Genetic diagnosis by whole exome capture and massively parallel DNA sequencing[J].Proc Natl Acad Sci USA,2009,106:19096-19101.
[11]Metzker M L.Sequencing technologies——the next generation[J].Nat Rev Genet,2010,11:31-46.