高林林,王科文,李佑英,羅 俊,徐紅偉,周志全,王 琴,豐 蕾,*
(1. 杭州市公安局刑事科學(xué)技術(shù)研究所,杭州 310006;2. 公安部鑒定中心,北京 100038;3. 杭州華碩司法鑒定中心,杭州 310006;4. 建德市公安局,浙江 建德 311600)
個(gè)體的年齡推斷一直是法醫(yī)學(xué)領(lǐng)域的研究熱點(diǎn),通過(guò)骨骼、牙齒等推斷個(gè)體年齡的方法[1-2],無(wú)法用于實(shí)際案件中遇到的各種組織及體液供者的年齡推斷;通過(guò)端粒長(zhǎng)度變化來(lái)推斷年齡的定量研究尚在摸索階段[3];通過(guò)DNA甲基化水平來(lái)推斷個(gè)體年齡的研究在國(guó)內(nèi)外均已有廣泛開(kāi)展[4-7]。本研究組前期通過(guò)不同年齡段的北方男性血液樣本建立了DNA甲基化水平的年齡推斷模型,通過(guò)質(zhì)譜方法可檢測(cè)9個(gè)CpG位點(diǎn)的甲基化值,該9-CpG年齡推斷模型與同類研究相比,不僅誤差值較小,且已有實(shí)戰(zhàn)應(yīng)用案例[8-9]。但由于原計(jì)算模型針對(duì)的是河北、北京、河南等北方漢族男性,對(duì)于如浙江等我國(guó)南部地區(qū)的人群,其生活習(xí)性和遺傳背景與北方漢族個(gè)體有顯著的差異,能否使用該模型推斷年齡尚需驗(yàn)證。隨著全國(guó)Y染色體STR數(shù)據(jù)庫(kù)的不斷建設(shè),在龐大復(fù)雜的家系排查中,若能推斷出現(xiàn)場(chǎng)遺留生物檢材所屬個(gè)體的年齡,則可大幅提升排查工作效率。因此本研究通過(guò)檢測(cè)血斑樣本,采用上述模型推斷浙江漢族個(gè)體的年齡,希冀驗(yàn)證并拓展9-CpG年齡推斷模型的適用性及范圍。儀、Quantif iler?Trio DNA定 量 試 劑 盒、NanoDrop 2000c分光光度計(jì)均購(gòu)自美國(guó)Thermo Scientif ic公司;Eppendorf Pro S PCR擴(kuò)增儀(Eppendorf公司,德國(guó));蝦堿性磷酸酶(Shrimp Alkaline Phosphatase,SAP)、 MassARRAY?Clean Resin、MassARRAY質(zhì)譜儀及EpiTYPER v1.3軟件均購(gòu)自美國(guó)Agena Bioscience公司。
根據(jù)知情同意原則,采集浙江漢族男性及女性無(wú)關(guān)個(gè)體新鮮外周血樣本共196份(男100份,女96份),采樣經(jīng)公安部鑒定中心科研倫理委員會(huì)審核批準(zhǔn)。每份取約600 μL血液滴于三層折疊的白紗布上制成血斑紗布,陰干后室溫保存3~6個(gè)月。實(shí)戰(zhàn)中涉案人員的年齡分布大多集中在16~65歲,故采樣選取此年齡段個(gè)體且盡量每個(gè)年齡選取2人份,各年齡段樣本保持均等。樣本年齡段分組具體見(jiàn)圖1。
圖1 樣本年齡分布Fig.1 Age distribution of sampled individuals (male/female:indicated with blue/mauve bar)
MagAttract?M48 DNA Manual 試 劑 盒(Qiagen公司,德國(guó));EZ DNA MethylationTM試劑盒(Zymo Research公司,美國(guó));QuantStudio5熒光定量PCR
剪取三層折疊血紗布上血斑約2.0 cm×2.0 cm,采 用MagAttract?M48 DNA Manual試 劑 盒 按 照 說(shuō)明書提取基因組DNA,洗脫體積為60 μL。采用NanoDrop 2000c分光光度計(jì)測(cè)定DNA濃度及純度,所有DNA模板保存至-20 ℃?zhèn)溆谩?/p>
剪取男性及女性各13份樣本血紗布上血斑約1.0 cm×1.0 cm,采用1.3所述方法進(jìn)行DNA提取。取1 μL DNA模板采用NanoDrop 2000c分光光度計(jì)測(cè)定DNA質(zhì)量;取2 μL DNA模板采用Quantif iler?Trio DNA定量試劑盒以QuantStudio5實(shí)時(shí)熒光定量PCR儀按照試劑盒說(shuō)明書進(jìn)行DNA質(zhì)量測(cè)定。
取1 μg DNA樣本,若總量不足1 μg,則取45 μL DNA樣本,按照EZ DNA MethylationTM試劑盒說(shuō)明書進(jìn)行重亞硫酸鹽處理,轉(zhuǎn)化后的DNA采用30 μL純水洗脫,并再次采用NanoDrop 2000c分光光度計(jì)測(cè)定轉(zhuǎn)化后的DNA質(zhì)量。
9對(duì)擴(kuò)增引物均按照文獻(xiàn)[8]進(jìn)行合成。擴(kuò)增體系為5 μL,其中10×PCR 緩沖液0.5 μL,dNTP 0.04 μL,5U PCR 聚合酶0.1 μL, 2 μmol/L 引物2.0 μL,轉(zhuǎn)化后DNA(bisulfite converted DNA,BS-DNA)2.36 μL。與文獻(xiàn)方法[10]相比,引物濃度由1 μmol/L增加到2 μmol/L,PCR 聚合物從0.09 μL增加到0.1 μL。擴(kuò)增程序及SAP純化均 按照文獻(xiàn)[10]進(jìn)行。
轉(zhuǎn)錄及T裂解體系為5 μL,按文獻(xiàn)[10]配比混勻, 加入SAP純化后產(chǎn)物4 μL,37 ℃孵育3 h。4 ℃存儲(chǔ)。
96孔PCR板的每孔內(nèi)加入36 μL不含RNA酶的水以及T裂解產(chǎn)物9 μL,混勻后離心15 min,質(zhì)譜儀的樹(shù)脂盒內(nèi)加入適量純化樹(shù)脂,并將芯片放置于相應(yīng)位置,采用MassARRAY系統(tǒng)進(jìn)行檢測(cè)。
轉(zhuǎn)化回收率計(jì)算方法: 轉(zhuǎn)化后得到的單鏈DNA總量與轉(zhuǎn)化前加入的雙鏈基因組DNA總量的百分比值。
所有甲基化值采用EpiTYPER v1.3軟件進(jìn)行數(shù)據(jù)處理,并按照已建立的線性回歸方程[8]進(jìn)行個(gè)體年齡預(yù)測(cè)計(jì)算。將預(yù)測(cè)結(jié)果與人員實(shí)際年齡進(jìn)行比對(duì),計(jì)算個(gè)體預(yù)測(cè)年齡與實(shí)際年齡差值絕對(duì)值的平均值即平均絕對(duì)偏差(mean absolute deviation, MAD)值;計(jì)算個(gè)體預(yù)測(cè)年齡與實(shí)際年齡差值的平均值即平均誤差(mean error,ME),正值表示高估、負(fù)值表示低估,評(píng)估已建模型[8]對(duì)本研究樣本的適用性。采用R軟件 “l(fā)m”函數(shù)建立多元線性回歸模型,采用IBM SPSS Statistics 23對(duì)所有處理數(shù)據(jù)作t檢驗(yàn)、單因素方差分析等。
26份樣本同時(shí)用兩種不同的定量方法進(jìn)行DNA質(zhì)量測(cè)定后發(fā)現(xiàn),NanoDrop 2000c分光光度計(jì)所測(cè)定的DNA質(zhì)量均值為(9.15±4.45)ng/μL,而實(shí)時(shí)熒光PCR定量法獲得的DNA質(zhì)量均值為(3.79±2.80)ng/μL,兩者之間具有顯著性差異(P<0.05)。前者所測(cè)定的DNA量均值是后者均值的2.4倍。
所有樣本提取及轉(zhuǎn)化后的DNA定量結(jié)果(NanoDrop 2000c分光光度計(jì)測(cè)定)、轉(zhuǎn)化回收率見(jiàn)表1。不同樣本提取得到的DNA及轉(zhuǎn)化后得到的DNA總量存在顯著性差異,樣本間的甲基化轉(zhuǎn)化回收率也有明顯差異。血斑提取得到的DNA濃度最低為11.90 ng/μL,最高可達(dá)205.70 ng/μL,平均OD值(按A260/A280測(cè)算)為1.69±0.16;進(jìn)行重亞硫酸鹽轉(zhuǎn)化的DNA總量最低為535.50 ng(11.90 ng/μL×45 μL),重亞硫酸鹽轉(zhuǎn)化后DNA(bisulf iteconverted DNA,BS-DNA)總量最低為153.00 ng(5.10 ng/μL×30 μL)。
表1 不同樣本提取與轉(zhuǎn)化后DNA定量以及轉(zhuǎn)化回收率的比較Table 1 Quantity range of extracted genome DNA, bisulf ite-converted DNA and recovery rates
為進(jìn)一步分析最低的基因組DNA用量,以最終PCR擴(kuò)增所需的BS-DNA量結(jié)合轉(zhuǎn)化回收率進(jìn)行計(jì)算。BS-DNA最低濃度為5.10 ng/μL,每個(gè)PCR反應(yīng)加入2.36 μL,共7個(gè)PCR反應(yīng),因此最低需要BS-DNA 84.00 ng。按照平均轉(zhuǎn)化回收率43%計(jì)算,最低的基因組DNA用量為195.00 ng,如果按照最高轉(zhuǎn)化回收率計(jì)算,則為112.00 ng。如果使用熒光定量PCR方法定量,最低基因組DNA用量可降為46.00 ng。
100份浙江漢族男性血斑樣本作為驗(yàn)證集,對(duì)已建立的9-CpG年齡推斷模型[8]進(jìn)行年齡驗(yàn)證,其驗(yàn)證結(jié)果見(jiàn)圖2。對(duì)于100份男性樣本來(lái)說(shuō),總體MAD值為2.95歲。按照年齡段分為5個(gè)組(A-E組),分 別 為16~25、26~35、36~45、46~55、56~65歲,分別統(tǒng)計(jì)MAD最小為2.70歲,最大為3.21歲,對(duì)于前4組(16~55歲),ME均為正值,第5組(56~65歲)為負(fù)值(見(jiàn)補(bǔ)充材料表S1)。從圖2可以看出,每組高估與低估的樣本個(gè)數(shù)基本相同。
圖2 9-CpG年齡推斷原模型在男性樣本中實(shí)際年齡與預(yù)測(cè)年齡的散點(diǎn)圖Fig.2 Scattering dot plot obtained from actual age against the predicted with male samples by the 9-CpG age prediction model
96份浙江漢族女性血斑樣本在9個(gè)CpG位點(diǎn)測(cè)得的甲基化值采用已建立的9-CpG年齡推斷模型[8]進(jìn)行年齡計(jì)算,并與實(shí)際年齡進(jìn)行對(duì)比,總體MAD值為3.18歲(見(jiàn)圖3)。從補(bǔ)充材料表S2可以看出A—D組的個(gè)體推斷年齡均為高估,且每個(gè)組都只有個(gè)別樣本推斷年齡比實(shí)際年齡??;E組的預(yù)測(cè)年齡基本為低估,且ME值與前面四組比較,差異具有統(tǒng)計(jì)學(xué)意義(P=1.0×10-3)。為明確男性及女性樣本在模型驗(yàn)證中的差異,對(duì)男性及女性樣本各個(gè)位點(diǎn)的甲基化值進(jìn)行t檢驗(yàn),結(jié)果顯示CpG6、CpG7位點(diǎn)有顯著性差異(見(jiàn)補(bǔ)充材料表S3)。為進(jìn)一步優(yōu)化模型,在96份樣本中選取70%的樣本作為訓(xùn)練集,30%的樣本作為驗(yàn)證集,使用R軟件“l(fā)m”函數(shù)對(duì)原模型進(jìn)行調(diào)整優(yōu)化,優(yōu)化后的模型為:
圖3 年齡推斷原模型在女性樣本中實(shí)際年齡與預(yù)測(cè)年齡的散點(diǎn)圖Fig.3 Scattering dot plot from actual age against the predicted with female samples by the 9-CpG age prediction model
訓(xùn)練集和驗(yàn)證集的R2分別為0.94和0.93,MAD值分別為2.59歲和2.78歲(圖4)。對(duì)新模型與原模型的所有樣本預(yù)測(cè)年齡與實(shí)際年齡差值的絕對(duì)值進(jìn)行配對(duì)t檢驗(yàn),結(jié)果具有統(tǒng)計(jì)學(xué)差異(P=0.03),所有樣本采用新模型進(jìn)行年齡推斷計(jì)算所得總體MAD為2.65歲,其預(yù)測(cè)誤差值比原模型小0.53歲,新模型的預(yù)測(cè)準(zhǔn)確性更高。
圖4 新建立的年齡推斷模型中實(shí)際年齡與預(yù)測(cè)年齡的散點(diǎn)圖Fig.4 Scattering dot plot from actual age against the predicted with the modif ied 9-CpG age prediction model
在新模型中,96份女性樣本在上述的分組中,各組之間的MAD值較為均一,與原預(yù)測(cè)模型相比,其預(yù)測(cè)準(zhǔn)確度均有提升,且通過(guò)配對(duì)t檢驗(yàn),顯示MAD值在兩種預(yù)測(cè)模型中存在顯著性差異(見(jiàn)表2)。
表2 兩種預(yù)測(cè)模型MAD的比較Table 2 Comparison of MAD between two prediction approaches
本文采用EpiTYPER技術(shù)平臺(tái)對(duì)浙江漢族個(gè)體的血斑樣本進(jìn)行供者年齡推斷研究,驗(yàn)證以前建立的多元線性回歸模型的檢材適應(yīng)性與適用人群范圍?;贒NA甲基化的年齡推斷在法醫(yī)學(xué)領(lǐng)域的研究已有很多報(bào)道,在不同的研究中,CpG位點(diǎn)的選擇與組合不盡相同,而且采用的預(yù)測(cè)模型也各有不同。有學(xué)者專門比較了基于血液樣本的6種預(yù)測(cè)模型,發(fā)現(xiàn)不同的預(yù)測(cè)模型,其預(yù)測(cè)準(zhǔn)確度存在差異。多元線性回歸模型可最大程度保留原始數(shù)據(jù),且應(yīng)用最為廣泛,適于低樣本量數(shù)據(jù)建模[11]。EpiTYPER技術(shù)平臺(tái)也是DNA甲基化研究中定量檢測(cè)常用的方法,通過(guò)交叉驗(yàn)證比較發(fā)現(xiàn)其所獲得的數(shù)據(jù)準(zhǔn)確性及重復(fù)性均較高[8]。
血斑DNA樣本的甲基化檢測(cè)具有挑戰(zhàn)性。Suchiman等認(rèn)為采用EpiTYPER技術(shù)平臺(tái)檢測(cè)DNA甲基化時(shí),要想獲得較好的檢測(cè)結(jié)果,提取高純度及高分子量的基因組DNA非常重要,OD值比(A260/A280)應(yīng)在1.7~2.0之間[12]。由于附有紗布載體,本文中血斑DNA的OD值比平均為1.69±0.16,因此在進(jìn)行PCR擴(kuò)增時(shí),為了提高擴(kuò)增效率, 增加了0.05U聚合酶以及引物濃度調(diào)整為2.0 μmol/L。重亞硫酸鹽處理是甲基化檢測(cè)非常重要的一步,與常規(guī)血液樣本DNA相比,由于血斑提取到的DNA質(zhì)量較差,轉(zhuǎn)化回收率對(duì)于后續(xù)檢測(cè)更為重要。針對(duì)血液樣本DNA來(lái)說(shuō),Sam等學(xué)者比較了6種不同的重亞硫酸鹽轉(zhuǎn)化商業(yè)試劑盒,發(fā)現(xiàn)不同的試劑盒轉(zhuǎn)化回收率差異較大[13],但是對(duì)于血斑樣本DNA尚無(wú)相關(guān)報(bào)道。本文采用EZ DNA MethylationTM轉(zhuǎn)化試劑盒發(fā)現(xiàn)不同樣本間的DNA轉(zhuǎn)化回收率差異明顯,最高可達(dá)75.35%,最低僅為11.05%。
本研究中100份浙江漢族男性血斑樣本推斷年齡MAD值為2.95歲,與基于血液樣本建立的北方地區(qū)男性個(gè)體年齡的預(yù)測(cè)準(zhǔn)確性(MAD=2.89歲)基本一致,而且不同年齡組間的MAD值無(wú)顯著性差異,顯示9-CpG年齡推斷適用于浙江地域的男性血斑樣本的年齡推斷。前期建立的9-CpG年齡推斷模型針對(duì)的是男性漢族個(gè)體,本研究發(fā)現(xiàn)直接使用該模型計(jì)算女性漢族個(gè)體的年齡普遍存在高估,因此性別會(huì)影響年齡推斷結(jié)果。盡管有一些研究結(jié)果與本文不一致,如:Bekaert通過(guò)4個(gè)年齡相關(guān)位點(diǎn)檢測(cè)了105份男性樣本和101份女性樣本發(fā)現(xiàn)所建立的年齡推斷模型無(wú)性別差異[14];Correia Dias等通過(guò)對(duì)51份葡萄牙人血液樣本(男性18份,女性35份)的檢驗(yàn),也未發(fā)現(xiàn)男女樣本間的MAD值有明顯差異[15];國(guó)內(nèi)孫曉萌等通過(guò)男女樣本各40例在年齡偏差上的對(duì)比,同樣顯示無(wú)統(tǒng)計(jì)學(xué)差異[16],但筆者分析認(rèn)為可能與上述研究選取的樣本量小、CpG位點(diǎn)選取差異有關(guān)。有學(xué)者通過(guò)Illumina 450K陣列進(jìn)行全基因組甲基化測(cè)序,發(fā)現(xiàn)男性和女性個(gè)體與年齡相關(guān)的CpG位點(diǎn)不同,即使相同的CpG位點(diǎn),其相關(guān)系數(shù)也存在差異[17]。
本研究中發(fā)現(xiàn)CpG6、CpG7這兩個(gè)位點(diǎn)的甲基化值在男性樣本與女性樣本間存在著顯著性差異,導(dǎo)致原模型不適用于女性樣本。使用96份女性樣本重建線性回歸模型,總體MAD下降了0.53歲,且不同年齡組間的MAD值較為均衡,最小為2.24歲,最大為2.90歲。
本文采用分光光度計(jì)測(cè)定的單管PCR擴(kuò)增的BS-DNA量最低為12.0 ng,這個(gè)用量比LEE等[18]報(bào)道的采用SNaPshot技術(shù)進(jìn)行甲基化DNA檢測(cè)所需的BS-DNA量(>5.0 ng)稍高。但如果是采用實(shí)時(shí)熒光定量PCR法進(jìn)行測(cè)定,其BS-DNA的量也能降為5.0 ng。分光光度計(jì)測(cè)定DNA質(zhì)量不僅快速且不需任何實(shí)驗(yàn)試劑耗材,在大批量樣本的研究中具有優(yōu)勢(shì),但其準(zhǔn)確度易受到RNA、蛋白質(zhì)的影響。而實(shí)時(shí)熒光定量PCR儀在一線法醫(yī)DNA實(shí)驗(yàn)室中的使用更為普遍,其測(cè)量精度也較高,但是必須使用專門的定量試劑盒,定量成本較為昂貴。
本文在研究大批量樣本中采用了分光光度計(jì),通過(guò)兩種不同定量方法的比較,能為一線DNA技術(shù)人員利用血斑樣本進(jìn)行DNA甲基化年齡推斷提供參考數(shù)據(jù)與借鑒。有效提高DNA轉(zhuǎn)化回收率將是我們下一步研究的內(nèi)容,期望可進(jìn)一步拓展9-CpG年齡推斷模型在現(xiàn)場(chǎng)血斑檢材和樣本中的應(yīng)用。
補(bǔ)充材料
與本文相關(guān)的補(bǔ)充數(shù)據(jù)見(jiàn):http://www.xsjs-cifs.com/CN/abstract/abstract6981.shtml。