張博源 王穎希 趙 蕾 江 麗 萬 群 莊 斌趙麗健 楊瑞琴** 韓俊萍
(1)中國人民公安大學(xué)偵查學(xué)院,北京 100038;2)北京市公安局刑事偵查總隊,北京 100007;3)公安部物證鑒定中心法醫(yī)遺傳學(xué)公安部重點實驗室,北京市現(xiàn)場物證檢驗工程技術(shù)研究中心,現(xiàn)場物證溯源技術(shù)國家工程實驗室,北京 100038;4)山東第一醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院,濟南 250000;5)北京博奧晶典生物技術(shù)有限公司,北京 101111;6)北京市公安局朝陽分局刑事偵查支隊,北京 100025)
法醫(yī)DNA檢驗中常用的短串聯(lián)重復(fù)序列(short tandem repeat,STR)遺傳標記可實現(xiàn)精準個體識別,但對于STR分型入庫無比中,無目標嫌疑人,也沒有其他線索的某些案件,STR分型無法發(fā)揮作用。祖先信息標記(ancestry informative markers,AIMs)是指在不同族群間具有等位基因頻率分布差異的標記位點[1]。插入/缺失多態(tài)性(insertion/deletion polymorphism,InDel)作為一種常見的祖先信息標記,能對現(xiàn)場生物物證的族群、地域來源等特征進行預(yù)測,在個體識別無法發(fā)揮作用時,獲取更多有關(guān)種族、地域信息,進一步縮小偵查范圍[2]。傳統(tǒng)DNA檢驗技術(shù)包括DNA提取、DNA定量、PCR擴增、毛細管電泳檢測,整個過程耗時費力,且對人員技能和設(shè)備要求較高?;谖⒘骺匦酒夹g(shù)的法醫(yī)DNA現(xiàn)場快速檢驗系統(tǒng)將上述步驟集成于一體,可實現(xiàn)“樣本進-結(jié)果出”,能夠滿足公安實戰(zhàn)對DNA現(xiàn)場化和快速化檢驗的迫切需求。近年來,已有RapidHIT?200、RapidHIT?ID、ANDETM6C 3款儀器相繼推向市場,國內(nèi)外學(xué)者針對這3款儀器開展了大量驗證研究[3-5]。
QuickTargSeq全集成法醫(yī)DNA現(xiàn)場快速檢測系統(tǒng)是國內(nèi)首臺自主研發(fā)的DNA快速檢驗儀,2 h可完成法醫(yī)DNA檢驗全部流程,可用于STR個體識別,并且首次實現(xiàn)了InDel族群推斷。本研究基于前期建立的InDel族群推斷微流控芯片檢測體系,根據(jù)SWGDAM指南[6]對建立的InDel族群推斷微流控芯片檢測體系進行驗證評估,以期為實踐應(yīng)用提供參考。
本研究的檢測樣本包括口腔拭子、血卡、唾液卡及煙蒂樣本。其中口腔拭子樣本來源于實驗室人員,共107份;血卡樣本來源于國家科技資源共享服務(wù)平臺計劃項目(YCZYPT[2017]01-3),共31份,已通過公安部物證鑒定中心倫理委員會的倫理審查(編號:2017-001);唾液卡樣本取實驗室人員,共5份;煙蒂樣本取自實驗室人員,共1份;人類基因組DNA標準品9947A購自蘇州新海生物科技股份有限公司。另有36份口腔拭子樣本為實驗室人員飲食后采集,用于干擾物耐受性研究。
107份口腔拭子樣本采集時,實驗室人員漱口后使用取樣拭子在口腔內(nèi)壁左右兩側(cè)刮擦,陰干備用;5份唾液卡樣本取實驗室人員左右兩頰黏膜擦拭物,轉(zhuǎn)移至唾液卡上,陰干備用。36份用于干擾物耐受性研究的口腔拭子,實驗室人員在飲食后使用取樣拭子在口腔內(nèi)壁左右兩側(cè)刮擦,陰涼處晾干備用。
采用QIAamp?DNA Mini M48試劑盒(QIAGEN公司,德國)提取煙蒂檢材DNA,用NanoDrop 2000C分光光度計(Thermo Scientific公司,美國)進行DNA定量。將人類基因組DNA標準品9947A(初始濃度10 mg/L)進行梯度稀釋,使用QuantifilerTM人類DAN定量試劑盒(Life Technologies公司,美國)進行定量,用于靈敏度驗證。
取全集成芯片卡盒備用,卡盒中已預(yù)先存儲凍干擴增試劑、電泳試劑及緩沖液(圖1a)。在1.5 ml離心管中加入200μl直擴處理液Ⅰ和Ⅱ混合液(含80μl處理液Ⅰ和120μl處理液Ⅱ,蘇州新海生物科技股份有限公司),放入1根口腔拭子,或血卡/唾液卡6片(Φ=2 mm),震蕩5~10次,然后取60μl上述混合液加樣至擴增芯片樣本處理池復(fù)溶擴增凍干試劑。提取的煙蒂DNA樣本(初始濃度為10 mg/L)直接吸取2μl與去離子無菌水混合至60μl,加樣至擴增芯片樣本處理池復(fù)溶擴增凍干試劑。
將全集成芯片卡盒插入Quick TargSeq DNA現(xiàn)場快速檢驗儀(圖1b)進樣倉,輸入樣本信息,選擇預(yù)先設(shè)定的程序,點擊運行鍵后,儀器自動完成樣本裂解、PCR擴增、電泳分離全部流程。收集數(shù)據(jù),使用配套軟件BioStrGenotyping v2.0對結(jié)果進行分析。
Fig.1 The fully automated and integrated chip cartridge(a)and the Quick TargSeq Rapid DNA Integrated System(b)
采用人類基因組DNA標準品9947A、口腔拭子、血卡3種樣本進行靈敏度測試。將DNA標準品9947A梯度稀釋:50、25、15、10、5、2.5 ng;采集3名實驗室人員口腔拭子,每名測試人員使用取樣拭子在口腔內(nèi)壁左右兩側(cè)各刮擦1、2、3、4、5、6、7、8、9、10次;取3份血卡,使用直徑2 mm打孔器在待測血卡上取樣2、3、4、5、6、7、8片;使用全集成芯片卡盒檢測,以上每種濃度或取樣方式平行重復(fù)檢測3次。
針對口腔拭子樣本種可能存在干擾PCR擴增的物質(zhì),如附著在口腔內(nèi)壁的食物殘渣、飲料、煙草,采集3名實驗室人員在飲食、飲咖啡、飲茶、吸煙后的口腔拭子作為檢測樣本,每種取樣方式各采集3份(n=36),同時采集漱口后的口腔拭子作為陽性對照。所有樣本使用全集成芯片卡盒檢測。
對107份口腔拭子和31份血卡進行全集成檢測,統(tǒng)計成功率和分型準確率。成功率是指等位基因檢出率≥80%的樣本占全部測試樣本的比率;分型準確率是指分型成功的結(jié)果,軟件準確分型的等位基因占全部等位基因的比率[7-9]。
同時以常規(guī)PCR-CE平臺的檢測結(jié)果作為參考樣本分型,擴增體系、熱循環(huán)參數(shù)、電泳參數(shù)、數(shù)據(jù)分析方法均參考文獻設(shè)置[10]。
將38-plex InDels復(fù)合擴增體系的等位基因分型標準物(allelic ladder)在微流控芯片檢測平臺重復(fù)電泳檢測10次,計算等位基因分型標準物中各等位基因片段大小的平均值和標準差,驗證該體系的精確度。隨機選取1.7中20份分型成功的全集成檢測結(jié)果,計算等位基因片段大小與相應(yīng)的等位基因標準物的差異,驗證該體系的準確性。
選取1.7中分型成功的全集成檢測結(jié)果,統(tǒng)計每個基因座的等位基因峰高值,計算每個基因座的雜合子峰高比值(peak height ratio,PHR),計算方法參照文獻[4];評估不同熒光通道之間平衡性,評估方法參照文獻[11]。
對4類不同檢材進行全集成檢測,包括口腔拭子、血卡、唾液卡、煙蒂(其中口腔拭子、血卡和唾液卡采取直擴方式,煙蒂采取先提取DNA后檢測的方式),以測試該體系的檢材適應(yīng)性。
選取1.7中40份分型成功的全集成檢測結(jié)果,經(jīng)BioStrGenotyping v2.0軟件導(dǎo)出分型數(shù)據(jù),使用族群推斷軟件DAA v1.0軟件計算樣本的人群匹配概率(assignment match probability,AMP)和似然比(likelihood ratio,LR),運行參數(shù)為K=3,n=15。自動獲得待測樣本的人群匹配概率、似然比、祖先成分,結(jié)合祖先成分比例,當LR>100時,AMP值排序第一位的族群為測試個體的來源族群,當LR≤100時,AMP排序前兩位的族群均不排除[12]。
分別使用50、25、15、10、5、2.5 ng DNA標準品9947A作為模板進行全集成檢測,統(tǒng)計不同DNA模板量檢測結(jié)果的等位基因峰高(相對熒光強度,RFU)和等位基因檢出率(圖2)。其中峰高值隨著DNA模板量的增加而依次增加,DNA模板量為5~50 ng均可獲得完整分型,當DNA模板量低于2.5 ng出現(xiàn)等位基因丟失。因此,該體系的最低DNA檢測限為5 ng。
Fig.2 Sensitivity study for different input DNA template
Fig.3 Sensitivity study for different wipes of buccal swabs
在口腔內(nèi)壁左右兩側(cè)各刮擦1、2、3、4、5、6、7、8、9、10次,使用全集成芯片卡盒檢測。統(tǒng)計不同刮擦次數(shù)口腔拭子檢測結(jié)果的等位基因峰高和等位基因檢出率(圖3)。當刮擦次數(shù)為1~4次時,峰高值較低,等位基因檢出率從78.33%增加到92.06%;隨著刮擦次數(shù)的增加,峰高值和等位基因檢出率均依次增加,刮擦次數(shù)為8次時,等位基因檢出率達到100%,即所有樣本均能獲得完整分型;刮取次數(shù)增加至9次、10次時,等位基因檢出率分別為97.50%、96.67%,各有1份樣本在rs16416位點熒光信號過強,產(chǎn)生滲透現(xiàn)象,造成相鄰?fù)ǖ榔渌稽c等位基因錯判,影響分型結(jié)果。綜上,口腔拭子最佳刮擦次數(shù)為8次。
取Φ=2 mm血卡2、3、4、5、6、7、8片進行全集成檢測,統(tǒng)計不同血卡片數(shù)檢測結(jié)果的等位基因峰高值和等位基因檢出率(圖4)。血卡片數(shù)從2片增加到6片,等位基因峰高值依次增加,等位基因檢出率從94.15%增加至100%,6片時所有樣本均得到完整分型,7片和8片時,出現(xiàn)了不同程度的等位基因丟失現(xiàn)象。因此,本體系對血卡的最佳檢測方式為6片(Φ=2 mm)。
36份不同取樣方式口腔拭子均可獲得有效分型,其中9份飲食后和9份飲咖啡后樣本的分型準確率為100%;9份飲茶后的樣本中,有1份樣本rs2308067位點分型錯誤,分型準確率為95.83%;9份吸煙后的樣本中,有1份樣本rs5789229位點分型錯誤,分型準確率為95.65%。
應(yīng)用配對t檢驗檢測含有干擾物和不含干擾物的口腔拭子樣本分型準確率之間是否存在差異性。結(jié)果顯示,二者之間沒有呈現(xiàn)出顯著性差異(P>0.05)(表1)。
Fig.4 Sensitivity study for different pieces of dried blood spot samples
Table 1 The effect of inhibitors on concordance rate
由于部分全集成芯片卡盒出現(xiàn)斷膠現(xiàn)象,6份樣本未獲得成功分型,132份樣本(102份口腔拭子和30份血卡)分型成功。本體系的全集成檢測成功率和分型成功率統(tǒng)計結(jié)果如表2所示。
Table 2 The result of success rate and concordance rate
使用等位基因分型標準物在微流控芯片檢測平臺重復(fù)電泳檢測10次,計算allelic ladder中各等位基因片段大小的平均值和標準差,統(tǒng)計結(jié)果(圖5)顯示,10次電泳檢測所得各等位基因片段大小標準差均在0.3 bp以內(nèi)。隨機選取2.3中20份樣本的全集成檢測結(jié)果,所有等位基因與位基因分型標準物中相對應(yīng)的等位基因片段差異均不超過0.5 bp(圖6)。以上結(jié)果說明,該微流控芯片檢測體系具有較高得精確性和準確性,分型時未出現(xiàn)等位基因偏差。
選取2.3中分型成功的132份全集成檢測結(jié)果,統(tǒng)計每個基因座的雜合子峰高比值,計算平均值和標準差,其中rs1160852、rs35633537兩位點在所檢樣本中未出現(xiàn)雜合子分型,故只統(tǒng)計37個位點。由圖7可知,最大PHR值為rs3054057位點(0.965 2±0.013 6),最小PHR值為rs145415095位點(0.742 4±0.185 1),所有基因座的平均雜合子峰高比值為0.86。
Fig.5 Standard deviation of sizing precision for each locus in the allelic ladder calculated for 10 runs on Quick TargSeq systems
Fig.6 Size differences between allele and corresponding allele in allelic ladder for 20 testing samples on Quick TargSeq systems
Fig.7 Heterozygote peak height ratios(PHR)calculated from 132 testing samples in the concordance study
同時對該132份全集成檢測結(jié)果的不同熒光通道之間平衡性進行比較(表3)。藍色熒光通道(FAM標記)平衡性最好,峰高比值均值達89.65%,其余三色熒光通道分別為75.73%、72.98%和77.58%,不同熒光通道之間的峰高比值為61.96%。上述結(jié)果說明該微流控芯片檢測體系具有良好的峰高平衡性。
Table 3 Balance within one dye and among different dyes for 132 testing samples
對口腔拭子、血卡、唾液卡、煙蒂等4類不同模擬檢材進行全集成檢測,所有樣本均成功獲得分型,并與常規(guī)PCR-CE平臺檢測結(jié)果一致,整個檢測時間為2 h,部分樣本的檢測結(jié)果如圖8所示。
Fig.8 The InDel profiles of mock case samples
使用25個參考族群,對40份測試樣本結(jié)果進行個體族群來源推斷,計算得到樣本的AMP及LR值,AMP排序第一位均為東亞人群,與AMP排序第二位的人群相比LR值遠大于100,群體水平的祖先成分中的東亞成分為96.98%。主成分分析如圖9所示,其中PC1與PC2分別表示主成分1與主成分2,二者共解釋了總方差的37.34%。所有樣本與東亞人群聚為一類,與已知樣本來源信息一致。
Fig.9 The principal component analysis of 40 testing samples
基于微流控芯片技術(shù)的法醫(yī)DNA現(xiàn)場快速檢驗系統(tǒng)提升了法醫(yī)DNA檢驗現(xiàn)場化和快速化的能力,滿足了公安實戰(zhàn)的迫切需求。目前,國外推出的RapidHIT?200、RapidHIT?ID、ANDETM6C 3款商業(yè)化DNA快速檢驗儀,均是配套使用STR試劑盒進行個體識別[3-5],尚未見將快檢系統(tǒng)應(yīng)用于族群推斷領(lǐng)域。Quick TargSeq全集成法醫(yī)DNA現(xiàn)場快速檢測系統(tǒng),作為中國國內(nèi)首臺自主研發(fā)的DNA快速檢驗儀,可配套使用38-plex InDels復(fù)合擴增體系,首次實現(xiàn)了DNA快速檢驗儀器在族群推斷領(lǐng)域的應(yīng)用。本研究使用InDel族群推斷微流控芯片檢測體系,參考SWGDAM指南,對該體系進行了系統(tǒng)研究。
靈敏度研究結(jié)果顯示該芯片檢測體系在DNA模板量≥5 ng時,可獲得完整InDel分型,可以滿足大多數(shù)犯罪現(xiàn)場生物物證檢材的最低檢測限[4]。對于口腔拭子樣本,刮擦次數(shù)較少時由于DNA模板量不足會出現(xiàn)等位基因缺失,當刮擦次數(shù)較多時也出現(xiàn)等位基因缺失,原因可能是刮擦次數(shù)較多時口腔中黏蛋白或蛋白酶也會相應(yīng)增多,而這些物質(zhì)可能會抑制PCR擴增[13],并且刮擦次數(shù)較多時出現(xiàn)滲透峰而影響分型,因此最佳采集次數(shù)為口腔內(nèi)壁左右各刮擦8次。對于血卡樣本(Φ=2 mm血片),使用片數(shù)較少時同樣會由于DNA模板量不足會出現(xiàn)等位基因丟失,而使用片數(shù)較多時(7~8片)也會出現(xiàn)等位基因丟失,其原因可能是隨著血卡用量的增多,樣本所含血紅素也隨之增多,而血紅素是潛在的PCR擴增抑制劑[14]??谇粌?nèi)壁附著的食物殘渣、飲料、煙草等物質(zhì)可能成為PCR擴增的潛在干擾物,干擾物耐受性研究結(jié)果顯示,含有干擾物和不含干擾物的口腔拭子樣本分型準確率之間并未呈現(xiàn)出顯著性差異,這說明食物、咖啡、茶葉、煙草在檢測過程中的干擾效應(yīng)并不明顯。
InDel族群推斷微流控芯片檢測體系對138份樣本的全集成檢測成功率為95.65%(132/138),分型準確率為 98.85% (6 954/7 035),與RapidHIT?200、RapidHIT?ID和ANDETM6C檢 測STR的成功率(分別為85.45%、84.5%和99.98%)相當,而分型準確率與RapidHIT?200(100%)和ANDETM6C(99.98%)相當[7-9],可以實現(xiàn)對口腔拭子和血卡的準確有效分型。該體系的精確度和準確度較高,分型時不會出現(xiàn)等位基因偏差。對于分型成功的全集成檢測結(jié)果,所有基因座的平均PHR值為0.86,高于配套使用FlexPlexTM27試劑盒的ANDETM6C快檢儀的PHR值(0.81)[15]。
與常規(guī)PCR-CE平臺相比,微流控芯片檢測體系具有集成、快速、操作簡便等優(yōu)點,集成化一體檢測實現(xiàn)了“樣本進-結(jié)果出”,降低常規(guī)方法由于需要多種儀器且步驟繁瑣導(dǎo)致的樣本污染等風(fēng)險。本研究將InDel族群推斷體系與中國國內(nèi)首臺自主研發(fā)的DNA快速檢驗儀結(jié)合,2 h左右即獲得樣本的準確分型,能夠準確推斷樣本族群來源,能滿足現(xiàn)場檢測的要求,可供實際辦案選用。但也存在檢測通量較低、目前只能對口腔拭子、血卡等常規(guī)樣本檢驗等不足,未來研發(fā)人員需對系統(tǒng)進行優(yōu)化升級,提高樣本檢測通量,同時優(yōu)化提取模塊以適應(yīng)更多樣本類型的檢測。