(四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)院,四川 成都 610041)
SNP-STR遺傳標(biāo)記是由短串聯(lián)重復(fù)序列位點與其相鄰的單核苷酸多態(tài)性組成的單倍型。在STR位點的側(cè)翼序列中存在SNP,可以利用等位基因特異性聚合酶鏈反應(yīng)(allele-specific polymerase chain reaction,ASPCR)技術(shù),又稱擴增受阻突變系統(tǒng)(amplification refractory mutation system,ARMS)[1],實現(xiàn)SNP和STR等位基因的同步檢測。其原理是針對STR重復(fù)結(jié)構(gòu)側(cè)翼序列中的SNP等位基因設(shè)計引物,將SNP所在的位置設(shè)置在引物3′端的3個堿基內(nèi),并通過在其兩側(cè)人為引入錯配堿基使得引物與不同SNP等位基因的結(jié)合能力存在差異,從而實現(xiàn)對其中一種SNP等位基因的選擇性擴增。ASPCR可在上千個細(xì)胞中檢測出具有序列突變的細(xì)胞[2],在腫瘤細(xì)胞異質(zhì)性[3]、母體外周血游離胎兒DNA分析[4]、親子鑒定[5]以及混合DNA分析[6-8]等方面都有著廣泛的應(yīng)用價值。
混合DNA分析是法醫(yī)遺傳學(xué)領(lǐng)域的難題之一。在現(xiàn)行法醫(yī)DNA分析體系中,以毛細(xì)管電泳為基礎(chǔ)的STR圖譜解析和似然率計算仍然是混合DNA分析的主要方法。在法醫(yī)DNA樣品中,兩個體DNA混合是出現(xiàn)頻率最高的混合類型,其中,量較大的個體DNA稱為多數(shù)成分,量較少稱為少數(shù)成分。多數(shù)成分與少數(shù)成分的比值稱為混合比例(mixture ratio)?,F(xiàn)行STR復(fù)合擴增體系在進行混合DNA分析時,其分析準(zhǔn)確度主要受到混合DNA構(gòu)成個體數(shù)以及混合比例的影響。一般而言,混合個體數(shù)越多、混合比例越大,則混合DNA的STR圖譜解析難度越大。當(dāng)混合比例超過10∶1時,少數(shù)成分的等位基因很難被檢出或容易出現(xiàn)等位基因丟失的現(xiàn)象[9]。
基于ASPCR技術(shù)復(fù)合擴增SNP-STR[10]、SNPSNP[11]、插入缺失多態(tài)性(deletion/insertion polymorphism,DIP)-STR[12]遺傳標(biāo)記的方法可以提高混合DNA的分析效能。這是因為,當(dāng)混合DNA樣本中少數(shù)成分與多數(shù)成分的SNP或插入/缺失(insertion/deletion,InDel)等位基因不同時,可以通過SNP或InDel等位基因特異性擴增少數(shù)成分所特有的STR等位基因,從而避免多數(shù)成分對少數(shù)成分的競爭性擴增抑制,進而提高對混合DNA的分析效能。這種在少數(shù)成分與多數(shù)成分之間存在差異的SNP-STR或DIPSTR遺傳標(biāo)記又被稱為信息遺傳標(biāo)記(informative marker)。之前的研究結(jié)果也驗證了這一方法的有效性,WEI等[6]以及TAN等[7]分別構(gòu)建了由8個和11個SNP-STR遺傳標(biāo)記構(gòu)成的復(fù)合擴增體系來進行混合樣本的分析,混合比例最高分別為20∶1和100∶1時,仍能得到信息遺傳標(biāo)記的完整分型。同時,WEI等[6]在觀察單位點擴增時,混合比例最高可達1000∶1。
基于SNP-STR遺傳標(biāo)記在混合DNA分析中所具有的潛在優(yōu)勢,本研究將進一步探究SNP-STR遺傳標(biāo)記在法醫(yī)DNA分析中的應(yīng)用效能。SNP-STR遺傳標(biāo)記由于結(jié)合了SNP和STR的優(yōu)勢,能夠利用少數(shù)成分所特有的SNP等位基因進行混合DNA的區(qū)分,以及使用STR等位基因在毛細(xì)管平臺上進行分型[7]。因此,為增加其實際應(yīng)用能力,本研究將在商業(yè)化試劑盒所使用的STR中篩選SNP-STR遺傳標(biāo)記,因為這些STR基因型信息與現(xiàn)有的規(guī)模化STR數(shù)據(jù)庫兼容。其次,對于兩個體DNA混合樣本,SNP-STR遺傳標(biāo)記中出現(xiàn)的信息基因型概率[12]主要取決于SNP基因座。因此,本研究選擇STR基因座重復(fù)結(jié)構(gòu)兩側(cè)300個堿基范圍內(nèi)、最小等位基因頻率大于0.1的SNP位點組成SNP-STR遺傳標(biāo)記,構(gòu)建SNP-STR遺傳標(biāo)記復(fù)合擴增體系。在設(shè)計SNP等位基因特異性引物時,較此前研究使用“分別在引物3′端第二或第三位設(shè)計錯配堿基”[6]或者“一強一稍弱”[7]的方法有所區(qū)別,本研究均在引物3′端的第三位堿基引入抑制引物-模板結(jié)合效果最強的錯配堿基。為探究該體系的法醫(yī)學(xué)效能,本研究利用四川漢族群體進行該體系的法醫(yī)遺傳學(xué)參數(shù)分析。此外,通過不同位點數(shù)量的復(fù)合擴增體系對不同混合比例的兩個體DNA混合樣本進行分析,探討SNP-STR遺傳標(biāo)記復(fù)合擴增體系在混合DNA分析中的應(yīng)用能力。
根據(jù)知情同意原則,采集103名四川漢族無關(guān)健康個體的乙二胺四乙酸(ethylenediamine tetraacetic acid,EDTA)抗凝外周血樣,置于-20℃保存?zhèn)溆谩?/p>
采用血液/細(xì)胞/組織基因組DNA提取試劑盒[天根生化科技(北京)有限公司]提取血液DNA,具體方法參照試劑盒說明書。采用Investigator Quantiplex試劑盒(德國Qiagen公司)對提取的DNA進行精確定量,具體方法參照試劑盒說明書。
為增加本研究所構(gòu)建體系與現(xiàn)有法醫(yī)STR數(shù)據(jù)庫的兼容性,本研究主要以商業(yè)化試劑盒中的STR基因座為待選位點,包括PowerPlex?21試劑盒(美國Promega公司)、Investigator IDplex Plus試劑盒(德國Qiagen公司)、EX22試劑盒(無錫中德美聯(lián)生物技術(shù)有限公司)、AGCU 21+1熒光檢測試劑盒(無錫中德美聯(lián)生物技術(shù)有限公司)、MicroreaderTM23sp ID System(北京閱微基因技術(shù)有限公司)。
SNP位點的篩選使用基于Unix Shell語言的VCFtools腳本[13-14]在 1000 Genomes數(shù)據(jù)庫[15]中完成,其篩選原則為:(1)SNP與STR重復(fù)結(jié)構(gòu)的距離小于300bp;(2)SNP位點在中國漢族群體中的最小等位基因頻率大于0.1;(3)SNP位點在中國漢族群體中為二等位基因。
利用Primer3進行在線引物設(shè)計(http://primer3.ut.ee/)。根據(jù)SNP位點設(shè)計相應(yīng)的特異性擴增引物,引物3′端為SNP位點,每個SNP位點設(shè)計兩條不同堿基末端的引物。為保證引物的擴增特異性,參照HUANG等[16]提出的錯配堿基設(shè)計原則,在引物的3′端第三位堿基處設(shè)計錯配堿基。引物長度為18~39 bp,GC含量為20%~60%,解鏈溫度(melting temperature,Tm)為55~59℃,如果在擴增中觀察到加A不全的現(xiàn)象,則在引物的5′端重新添加非人類基因組的特殊序列(GTTCTT)n。利用美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)上的Primer-BLAST工具檢測引物特異性。具體引物序列如表1~2所示。
對于每一SNP-STR遺傳標(biāo)記均設(shè)計兩對引物,其中3′端分別針對SNP位點的2個等位基因,5′端為相同的通用引物。每一SNP-STR遺傳標(biāo)記進行單位點擴增,并設(shè)置3個退火溫度(51℃、54℃、57℃)來優(yōu)化復(fù)合擴增體系。反應(yīng)體系為:2×Premix TaqDNA聚合酶(日本TaKaRa公司)5 μL,10 μmol/L等位基因特異性引物 0.5 μL,10 μmol/L 通用引物0.5 μL,模板DNA 1 ng,無核酸酶水3 μL。PCR循環(huán)條件為:95℃預(yù)變性2 min;95℃變性30 s,51℃(或54℃和57℃)復(fù)性30 s,72℃延伸30 s,共35個循環(huán);終延伸72℃ 5min。擴增片段采用8%聚丙烯酰胺凝膠電泳(polyacrylamide gel electrophoresis,PAGE)及銀染進行分型檢測。
表1 13個SNP-STR遺傳標(biāo)記的引物信息(Panel A)Tab.1 Primer information of the 13 SNP-STR markers(Panel A)
表2 13個SNP-STR遺傳標(biāo)記的引物信息(Panel B)Tab.2 Primer information of the 13 SNP-STR markers(Panel B)
利用Sanger測序驗證電泳分型結(jié)果。利用Primer3對SNP-STR遺傳標(biāo)記設(shè)計Sanger測序引物,使其擴增產(chǎn)物將SNP和STR位點均包括在內(nèi),在長度上較SNP-STR等位基因特異性擴增產(chǎn)物更長。對于擴增片段過?。?50bp左右)的引物對,在引物的5′端加上M13序列(F:TGTAAAACGACGGCCAGT;R:CAGGA AACAGCTATGACC)。
使用新設(shè)計的測序引物或M13引物進行測序,測序工作由英濰捷基(上海)貿(mào)易有限公司完成。測序引物序列見表3。
表3 測序引物序列信息Tab.3 Information of sequencing primers
續(xù)表3Continued tab.3
為盡可能減少引物間相互作用對復(fù)合擴增體系擴增效能的影響,本研究利用AutoDimer軟件[17]對上述所有等位基因特異性引物和通用引物的引物間相互作用進行分析,根據(jù)分析結(jié)果對引物序列進行調(diào)整。經(jīng)過篩選和調(diào)整,共得到13個SNP-STR遺傳標(biāo)記的26條等位基因特異性引物,并與13條各位點相應(yīng)的通用引物共同構(gòu)成26對等位基因特異性擴增引物,分成A和B兩個復(fù)合擴增體系。
復(fù)合擴增反應(yīng)體系為:2×Multiplex PCR Master Mix(德國 Qiagen 公司) 5 μL,Primer Mix 1 μL,模板DNA 1ng,無核酸酶水3μL。PCR擴增條件為:95℃預(yù)變性15 min;巢式擴增12個循環(huán),包括95℃變性30s,57~51℃(每個循環(huán)降0.5℃)復(fù)性90s,72℃延伸30 s;20個循環(huán)擴增,包括95℃變性30 s,57℃復(fù)性90s,72℃延伸30s;終延伸72℃ 60min。
擴增產(chǎn)物在3130基因分析儀(美國Thermo Fisher Scientific公司)上進行毛細(xì)管電泳分離和基因型判讀。總電泳體系為10μL,包括1μL擴增產(chǎn)物,8.9μL去離子甲酰胺,0.1μL內(nèi)標(biāo)AGCU Marker SIZ 500(無錫中德美聯(lián)生物技術(shù)有限公司)。電泳介質(zhì)為POP-7分離膠(美國Thermo Fisher Scientific公司),毛細(xì)管長36cm,進樣電壓3kV,進樣時間8s,電泳電壓9kV,時間30 min。采用GeneMapperTMIDv3.2軟件(美國Thermo Fisher Scientific公司)進行基因分型。根據(jù)2800M標(biāo)準(zhǔn)品DNA以及已通過測序得到確定SNPSTR基因型分型的樣本的電泳結(jié)果,獲得各位點不同等位基因的電泳遷移參數(shù),編寫相應(yīng)的panel文件和bin文件,建立等位基因分型標(biāo)準(zhǔn)品(ladder)。
采用該體系對103例四川漢族個體樣本進行基因分型。使用Arlequin 3.11軟件對SNP-STR遺傳標(biāo)記進行Hardy-Weinberg平衡以及連鎖不平衡(linkage disequilibrium,LD)檢驗。根據(jù)分型結(jié)果,統(tǒng)計SNPSTR單倍型數(shù)目以及不同SNP等位基因的單倍型數(shù)量和頻率。使用PowerStats v12軟件計算個體識別率(discrimination power,DP)、觀察雜合度(observed heterozygosity,Ho)、典型父權(quán)指數(shù)(typical paternity index,TPI)以及非父排除率(probability of paternity exclusion,PE)。依據(jù)CASTELLA等[12]論文中的公式,計算信息基因型概率。同時,比較SNP-STR遺傳標(biāo)記復(fù)合擴增體系與相應(yīng)STR基因座復(fù)合擴增體系的群體遺傳學(xué)參數(shù),包括累積個體識別率(cumulative discrimination power,CDP)、累積父權(quán)指數(shù)(combined paternity index,CPI)、累積非父排除率(cumulative probability of exclusion,CPE)以及平均觀察雜合度。
1.8.1 單位點等位基因特異性擴增
為明確單個SNP-STR遺傳標(biāo)記對混合樣本DNA的分析能力,本研究使用已知SNP-STR分型的DNA樣品進行混合,混合比例為1 000∶1,其中少數(shù)成分DNA量為100pg。
1.8.2 復(fù)合擴增體系對混合樣本的檢測
為明確復(fù)合擴增體系對混合DNA的檢測能力,以及體系中位點數(shù)目與檢測能力的關(guān)系,本研究共采用4種不同位點數(shù)量的復(fù)合擴增體系,分別為13、10、8和6位點,其體系構(gòu)成如表4所示。為確定混合樣本中少數(shù)成分的模板量,首先利用4個不同的DNA樣本來檢測復(fù)合擴增體系的靈敏度,DNA模板量梯度設(shè)置為100、200、300、400、600和800pg。以樣本的常規(guī)分型結(jié)果作為參照,以檢出全部SNP-STR分型的最低模板量為檢測限。
混合DNA由第103號樣本(多數(shù)成分)和第76號樣本(少數(shù)成分)構(gòu)成,混合比例設(shè)置為100∶1和500∶1兩個梯度。根據(jù)測序結(jié)果,已知此混合樣本DNA中含有6個信息遺傳標(biāo)記,分別為s2325399C-D6S1043、rs1728369C-D16S539、rs9853910A-D3S3045、rs4847015T-D1S1656、rs17651965C-CSF1PO和rs28562816G-D6S477。其中,13位點體系中含6個信息遺傳標(biāo)記,10位點體系中含5個,8位點體系中含3個,6位點體系中含2個。
表4 6、8、10、13位點體系的組成和PCR引物終濃度Tab.4 The combinations and the primer concentrations of the 6,8,10 and 13 SNP-STR multiplex system(μmol)
本研究利用凝膠電泳及Sanger測序方法來驗證等位基因引物的特異性。以rs4847015-D1S1656位點為例,圖1為該位點等位基因特異性引物的電泳結(jié)果。從圖中可以看出,只有5′端基于SNP等位基因C設(shè)計引物的泳道獲得擴增產(chǎn)物,即該位點中的SNP基因型為C純合子;STR有兩條帶,即該位點中的STR基因型為雜合子。不同退火溫度的結(jié)果顯示,57℃時的擴增特異性最好。此外,每一位點經(jīng)過測序引物或M13引物擴增后采用Sanger測序進行驗證,與電泳結(jié)果一致。
本研究共篩選出13個SNP-STR遺傳標(biāo)記,并構(gòu)建4種位點數(shù)目不同的復(fù)合擴增體系,分別為13、10、8和6位點。13位點體系的等位基因分型標(biāo)準(zhǔn)品建立結(jié)果如圖2所示,2800M標(biāo)準(zhǔn)品DNA的分型結(jié)果如圖3所示。
利用4個DNA樣本來檢測不同數(shù)目位點體系的靈敏度,每個樣本的總模板量均設(shè)置為100、200、300、400、600和800pg。檢測閾值設(shè)置為50RFU。結(jié)果表明,以檢測到完整的SNP-STR分型為依據(jù),13、10、8和6位點體系的復(fù)合擴增靈敏度分別為800、600、300和100pg。可以看出,體系的靈敏度隨位點數(shù)目的增加而降低。
SNP-STR遺傳標(biāo)記之間均符合Hardy-Weinberg平衡。對位于同一染色體上的遺傳標(biāo)記進行配對連鎖不平衡檢驗,未在此體系中檢測到連鎖不平衡。群體遺傳學(xué)參數(shù)如表5所示。
在四川漢族人群中,各位點雜合度為0.76~0.88,信息基因型概率為 0.19~0.37,TPI為 2.06~4.29,PE為0.52~0.76。SNP-STR遺傳標(biāo)記復(fù)合擴增體系與相應(yīng)STR基因座復(fù)合擴增體系的群體遺傳學(xué)參數(shù)見表6,SNP-STR遺傳標(biāo)記復(fù)合擴增體系的CDP達0.999 999 999 999 999 968,CPI為 786 032.7,CPE 為0.9999985,平均Ho為0.82,均優(yōu)于相應(yīng)STR體系。
圖1 rs4847015-D1S1656位點等位基因的特異性擴增PAGE結(jié)果Fig.1 The allele specific amplification products of rs4847015-D1S1656 based on polyacrylamide gel electrophoresis(PAGE)
圖2 13位點體系的等位基因分型標(biāo)準(zhǔn)品Fig.2 The electrophoretogram of the standard allelic ladder of the 13 SNP-STR multiplex system
圖3 2800M標(biāo)準(zhǔn)品DNA分型結(jié)果Fig.3 The typing result of the standard DNA 2800M
表5 SNP-STR復(fù)合擴增體系在四川漢族中的群體遺傳學(xué)參數(shù)Tab.5 Forensic parameters of SNP-STR multiplex amplification system in Sichuan Han population(n=103)
表6 STR與SNP-STR復(fù)合擴增體系群體遺傳學(xué)參數(shù)比較Tab.6 Comparison of the population genetic parameters between STR and SNP-STR multiplex amplification system
利用單位點等位基因特異性擴增來判斷每一位點對于混合DNA的檢測能力,結(jié)果如圖4所示,對于混合比例為1000∶1的混合DNA,每一SNP-STR遺傳標(biāo)記的等位基因特異性擴增體系均可對其中的信息遺傳標(biāo)記進行有效擴增并得到清晰的電泳峰型。
復(fù)合擴增體系的混合DNA檢測能力由4種含不同位點數(shù)目的體系進行驗證,結(jié)果如表7所示,當(dāng)混合比例為100∶1時,隨著位點數(shù)目的增加,實際檢出的信息遺傳標(biāo)記均可保持在2/3以上(已知該混合DNA樣本中共含6個信息遺傳標(biāo)記);當(dāng)混合比例為500∶1時,實際檢出的信息遺傳標(biāo)記數(shù)量較比例為100∶1時減少。
圖4 等位基因特異性引物對混合DNA中少數(shù)成分的檢測結(jié)果Fig.4 Genotyping results of the minor components in DNA mixture using allele-specific primers
表7 不同復(fù)合擴增體系分析混合樣本的結(jié)果Tab.7 Detection of DNA mixture by different multiplex amplification systems
本研究構(gòu)建的SNP-STR遺傳標(biāo)記復(fù)合擴增體系基于商業(yè)化試劑盒中的STR基因座,其中9個來源于經(jīng)過擴展的美國核心基因座(expanded U.S.core loci),7個來自歐洲標(biāo)準(zhǔn)位點(European Standard Set,ESS),所有基因座均已被廣泛使用,可以實現(xiàn)該體系所獲得的STR分型信息與現(xiàn)有法醫(yī)DNA數(shù)據(jù)庫兼容,便于其在法醫(yī)學(xué)實踐中推廣使用。與13個STR基因座組成的體系相比,SNP-STR遺傳標(biāo)記復(fù)合擴增體系具有更高的DP和PE。在特殊親子鑒定中,比如STR存在突變,或被檢父與生父存在親緣關(guān)系[5]時,為了明確父權(quán)需增加檢測多態(tài)性好且穩(wěn)定的遺傳標(biāo)記。由于SNP突變率低,而STR具有高多態(tài)性,若使用SNP-STR遺傳標(biāo)記,需要額外檢測的遺傳標(biāo)記數(shù)目將明顯下降,故SNP-STR遺傳標(biāo)記可以有效輔助親緣關(guān)系的判斷[5]。
在混合樣本中,混合比例超過10∶1的混合DNA樣本稱為不平衡混合DNA。此類DNA在分析時容易出現(xiàn)等位基因丟失,主要源于PCR過程中多數(shù)成分與少數(shù)成分對同一引物的競爭性結(jié)合會抑制少數(shù)成分DNA的擴增。等位基因特異性擴增技術(shù),在信息遺傳標(biāo)記存在的情況下,可以減少上述競爭性擴增抑制所導(dǎo)致的少數(shù)成分DNA分型丟失。但由于1個SNP-STR遺傳標(biāo)記具有2條序列上高度相似的特異性引物,且需要使用2種不同的熒光標(biāo)記來區(qū)分SNP分型,共包含3條引物,因此相較于傳統(tǒng)的STR復(fù)合擴增體系,SNP-STR遺傳標(biāo)記復(fù)合擴增體系單次檢測遺傳標(biāo)記的數(shù)目有限,不同的引物組合方式對混合樣本的檢測能力具有較大的影響。WEI等[6]在單位點擴增時,將3條引物放入同一個PCR體系中擴增,混合比例最高為20∶1時可獲得完整信息遺傳標(biāo)記分型;而將2條特異性引物分為2個體系擴增時,混合比例最高可達1000∶1。這可能是由于2條特異性引物序列高度相似,即使存在人為引入的錯配堿基,也無法完全阻止錯誤引物與模板的結(jié)合。在此基礎(chǔ)上,TAN等[7]通過在特異性引物3′端的第三位堿基引入不同的脫氧核苷酸來增大2條特異性引物的序列差異。然而,根據(jù)HUANG等[16]的實驗結(jié)果,不同的錯配堿基對于引物特異性的貢獻存在差異。因此,本研究采取了在引物3′端的第3位使用抑制引物-模板結(jié)合效果最強的錯配堿基,使2條特異性引物均實現(xiàn)最高水平的特異性。同時,為了避免同一位點序列高度相似的2條特異性引物相互競爭,本研究通過將復(fù)合擴增體系一分為二來增加體系對混合樣本的檢測能力。圖4顯示單位點擴增時,兩個體混合樣本混合比例達到1000∶1時依然可以得到少數(shù)樣本的分型,這與WEI等[6]的研究結(jié)果一致。當(dāng)進行多遺傳標(biāo)記復(fù)合擴增時,在混合比例為100∶1的情況下,隨著位點數(shù)目的增加,實際檢出的信息遺傳標(biāo)記數(shù)量均可保持在67%以上,且10位點與6位點體系能夠?qū)崿F(xiàn)信息遺傳標(biāo)記的全部檢出,這驗證了TAN等[7]的研究結(jié)果。此外,本研究進一步探索了復(fù)合擴增體系在混合比例達到500∶1時的混合分析能力,結(jié)果顯示,部分信息遺傳標(biāo)記仍可被檢出,且檢測效能隨著體系中位點數(shù)目的增加而降低,此現(xiàn)象可能與復(fù)合擴增體系中引物-引物和引物-模板間的相互作用有關(guān)。在今后的研究中,可考慮使用多個SNP-STR遺傳標(biāo)記復(fù)合擴增體系或者采用大規(guī)模并行測序(massively parallel sequencing,MPS)來進行SNP-STR分型。
綜上所述,本研究通過等位基因特異性擴增技術(shù),構(gòu)建了13個SNP-STR遺傳標(biāo)記的復(fù)合擴增體系。該體系較單獨使用相同STR基因座時具有更高的多態(tài)性,也具有更高的CDP和CPE。