明天悅,蔣禮蓉,劉 京,暢晶晶,侯一平,張廣峰,*,王 正,*
(1.四川大學華西基礎(chǔ)醫(yī)學與法醫(yī)學院,成都 610041;2. 公安部物證鑒定中心,北京 100038)
Y染色體為近端著絲粒類屬,為男性特有,其性別決定區(qū)域(sex-determining region of the Y,SRY)基因決定男性性別。Y染色體除兩末端各有一小部分(約占5%)的擬常染色體區(qū)域(pseudoautosomal region,PAR)可與X染色體的相應區(qū)域發(fā)生重組外,其余區(qū)域均為非重組區(qū)(non-recombining Y,NRY)或稱為男性特異性區(qū)(male-specific region,MSY)[1]。除發(fā)生突變之外,同一父系的男性個體擁有完全相同的NRY區(qū)域。Y染色體NRY單倍體遺傳的特性,使其被廣泛地應用于同男性相關(guān)的鑒定實踐中,如父系親權(quán)鑒定、家系排查、男女混合斑檢驗、大規(guī)模災難受害者身份識別、人類遷徙模式探索等[2-5]。本文結(jié)合近年來Y染色體的研究進展、相關(guān)檢測技術(shù)的發(fā)展及研究成果探討Y染色體遺傳標記在法醫(yī)學領(lǐng)域的應用和前景。
Y染色體遺傳標記主要包括衛(wèi)星DNA、小衛(wèi)星DNA、Alu插入元件、插入/缺失多態(tài)性(insertion/deletion polymorphism, InDel)、 短 串 聯(lián) 重 復 序 列(short tandem repeat, STR)和單核苷酸多態(tài)性(single nucleotide polymorphism, SNP) 等。 其 中,Y-STR和Y-SNP是目前被廣泛研究和應用于法庭科學的Y染色體遺傳標記。通常情況下,Y-STR用于定義單倍型(haplotypes),而Y-SNP用于定義單倍群(haplogroups)[6]。Y-InDel相關(guān)研究現(xiàn)尚處于前期探索階段。
Y-STR是一類具有長度多態(tài)性的DNA序列,由2~6個堿基作為核心區(qū)域串聯(lián)重復形成。與常染色體STR基因座相比,大多數(shù)Y-STR基因座具有復雜的串聯(lián)重復結(jié)構(gòu),常含有兩種以上不同的重復單位,可同時存在恒定和可變兩種重復序列[2]。由于Y染色體存在重復回文序列,某些Y-STR基因座就存在多個拷貝,即應用一對基因座特異性引物擴增時會產(chǎn)生多個PCR產(chǎn)物。這在多態(tài)性研究與應用等方面具有獨特優(yōu)勢,但在基因座判讀時卻尤需謹慎[7]。位于NRY區(qū)的Y-STR作為一個整體遺傳給子代,不同Y-STR基因座的等位基因組合稱為單倍型。這種連鎖遺傳方式使Y-STR分析效能和個體識別能力有限,需要聯(lián)合多個Y-STR基因座以獲得更多的單倍型。近年來,隨著Y-STR研究的深入,新的Y-STR基因座逐漸被發(fā)現(xiàn)及描述,并根據(jù)其應用價值被納入到商品化檢測試劑盒中[8-11]。
由于突變是造成同一父系男性個體間單倍型不一致的原因,Ballantyne等[12]通過父子對樣本對186個Y-STR基因座的突變率進行了系統(tǒng)評估,根據(jù)突變率的不同將Y-STR基因座劃分為三類:
1)快突變Y-STR(rapidly mutating Y-STR,RM Y-STR,突變率約10-2突變/代);
2)中等突變Y-STR(medium-mutating Y-STR,MM Y-STR,突變率約10-3突變/代);
3)慢突變Y-STR(slowly mutating Y-STR,SM Y-STR,突變率約10-4突變/代)。
同時他們還建議可根據(jù)應用方向選擇相應突變率的Y-STR基因座:快突變Y-STR具有區(qū)分親緣關(guān)系較近的男性個體的潛力,中等突變Y-STR適用于種群歷史和譜系研究,而慢突變Y-STR則可用于進化研究。
和阿瓦達索命咒不同,我是真實存在于這個世界上的。就在今年,在上海舉辦的一場教育論壇上,德國波鴻魯爾大學公布了一組數(shù)據(jù),來自全世界11個國家的調(diào)查結(jié)果顯示,未成年人的心理困難總分和心理疾病發(fā)病率在11歲時顯著增加……在青少年學生心理健康水平研究中,一種名為“二年級魔咒”的現(xiàn)象引起了很多專家的關(guān)注。有調(diào)查表明,孩子們的心理健康狀況在小學二年級、初中二年級、高中二年級,出現(xiàn)比較明顯的轉(zhuǎn)折和問題,尤其是初中二年級……
Y-SNP是Y染色體基因序列中特定部位由單個堿基序列變異而形成的DNA序列多態(tài)性,可表現(xiàn)為二等位基因、三等位基因或四等位基因標記,其中以二等位基因最為常見,應用也最為廣泛[13]。與Y-STR相比,Y-SNP具有極低的突變率(約為10-9突變/代),且?guī)缀醪粫霈F(xiàn)回復突變。因此,當Y-STR分型不匹配時,Y-SNP就可作為有力補充,能降低錯誤排除同一家系的風險。
研究人員已經(jīng)建立起強大且詳盡的Y-SNP 系統(tǒng)發(fā)育樹(https://isogg.org/tree/),其反映了有著共同父系祖先的現(xiàn)代人Y染色體非重組區(qū)的突變進程[14-17]。Y單倍群的分布具有明顯的地域性和人群差異性[18],通過檢測相關(guān)Y-SNP可推測生物檢材的族群地域來源。此外,應用Y-SNP可對群體之間的主要差異情況進行有效估算,不僅在遷徙研究中能扮演重要角色,而且通過估算群體的最近共祖時間(the time to the most recent common ancestor,TMRCA)還可為預測祖先起源提供線索[19]。
插入缺失多態(tài)性(insertion/deletion polymorphism,InDel)是基因組中不同大小的DNA片段因插入或缺失突變所形成的二等位基因片段長度多態(tài)性遺傳標記[20],具有低突變率、擴增片段小等優(yōu)點。InDel在人類基因組中分布廣泛,約7.2 kb就有一個InDel,其分布密度僅次于SNP。但研究發(fā)現(xiàn)性染色體上InDel的密集度低于常染色體[21]。目前,Y-InDel的研究處于起步階段,主要作為性別鑒定的輔助標記物,例如rs76041101和rs199815934被用于STR試劑盒中以彌補Amelogenin基因座易丟失的不足[22]。
隨著分子生物學方法及技術(shù)不斷發(fā)展,與刑事偵查相關(guān)的DNA檢測技術(shù)近年來也呈現(xiàn)多樣化[23]。對于Y染色體遺傳標記的檢測無論是長度多態(tài)性、序列多態(tài)性還是復合檢測能力都有進一步的探索與提升。
毛細管電泳技術(shù)(capillary electrophoresis,CE)通過在毛細管中注入特定濃度的聚合物溶液形成篩網(wǎng)狀結(jié)構(gòu),變性后的DNA單鏈在毛細管中從陰極向陽極遷移,其電泳遷移率與其大小呈線性相關(guān),在一定時間內(nèi)移動的距離不同,從而達到分離的目的[24]。毛細管電泳是目前法庭科學DNA實驗室不可或缺的平臺和工具,主要包括Thermo Fisher Scientific的3500系列基因分析儀[25]和我國公安部第一研究所研制的GA118法醫(yī)遺傳分析儀[26]。STR和InDel遺傳標記不同等位基因的堿基構(gòu)成及長度不同,各組分所帶電荷性質(zhì)、電荷數(shù)量以及相對分子量不同,在同一電場力的作用下泳動的速率各異,小片段會先通過陽極端的激光掃描。DNA單鏈上的熒光染料被激發(fā),發(fā)出特異波長的光,可被計算機獲得此熒光強度并記錄其通過檢測窗口的時間。通過熒光信號判斷該DNA來源的基因座,并與分子量內(nèi)標電泳時間進行比較即可確定各DNA片段的長度,以及與等位基因分型標準物對比可確定等位基因。目前,許多國內(nèi)外廠商提供了基于CE的Y-STR檢測試劑盒,例如Thermo Fisher Scientific的Yfiler Plus PCR amplification kit、Promega的 PowerPlex Y23 System、閱微基因的Microreader Y Prime ID System和中德美聯(lián)的AGCU Y37 kit等。但受限于熒光標記種類和檢測片段范圍,復合能力通常小于50個Y-STR基因座。
SNaPshot技術(shù)又稱為微測序,是基于熒光標記單堿基延伸原理的分型技術(shù),為一種以CE平臺開發(fā)出的SNP分型方法。SNaPshot主要分為三步:
1)通過PCR擴增包含SNP的DNA片段,并使用ExoSap(核酸外切酶Exo和堿性磷酸酶SAP)消化掉單鏈引物和剩余的dNTPs;
2)加入緊靠SNP的延伸引物、熒光標記ddNTP混合物和聚合酶進行單堿基延伸反應;
多個研究小組設(shè)計開發(fā)了基于SNaPshot技術(shù)的Y-SNP分型體系用于群體遷徙、Y形態(tài)變異、人群遺傳亞結(jié)構(gòu)、生物地理祖先推斷及族譜等項研究[27]。盡管可通過在引物5’末端加尾不同個數(shù)的核苷酸使每個延伸引物之間相差若干個堿基,從而實現(xiàn)復合多引物延伸反應,但同樣受限于熒光種類和檢測片段范圍,復合能力往往在30個SNP左右。
新一代測序技術(shù)又稱二代測序(second generation sequencing,SGS)、 下 一 代 測 序(next generation sequencing,NGS)或大規(guī)模并行測序(massively parallel sequencing,MPS),其核心思想是邊合成邊測序[23]?;贜GS技術(shù)的基因座識別是根據(jù)引物序列,可不受限于熒光染料種類,能同時對數(shù)百甚至數(shù)千個大小重疊的遺傳標記進行檢測;借助條形碼Barcode技術(shù)可實現(xiàn)對多個樣本并行測序。Illumina推出了基于DNA簇和可逆性末端終結(jié)的測序平臺[28];Thermo Fisher Scientific發(fā)布了基于半導體離子流的Ion Torrent測序平臺[29];華大基因研發(fā)了采用聯(lián)合探針錨定聚合技術(shù)(cPAS)和改進的DNA納米球(DNB)核心測序技術(shù)[30]。
經(jīng)過10多年的發(fā)展,NGS技術(shù)在測序通量、讀長、成本等方面不斷突破,為法醫(yī)學Y染色體遺傳標記的研究提供了新契機。借助于NGS技術(shù),Y-STR的序列多態(tài)性可進一步提高Y-STR單倍型的分辨率。Zhao等[31]率先使用NGS探索法醫(yī)學Y-STR序列多態(tài)性,通過對13個Y-STR序列分析,發(fā)現(xiàn)6個Y-STR的等位基因數(shù)量得到提高。Shin等[32]對23個Y-STR測序分析也顯示了類似的結(jié)果。楊凱潤等[33]研發(fā)了包括52個單拷貝Y-STR基因座、6個二拷貝Y-STR基因座、1個三拷貝Y-STR基因座和1個性別基因座的男性家系精細化排查試劑盒STRSeqTyperY68;所有基因座的擴增子長度均在350 bp以下,為冷案降解檢材提供了新檢測體系。Ralfa等[34]和Wang等[35]分別設(shè)計了基于全球人群系譜和基于中國人群的高分辨Y單倍群分型體系,可同時檢測859個和165個Y-SNP,為父源譜系鑒定和生物地理祖先推斷提供了新的技術(shù)手段。Miao等[36]在BGISEQ-500平臺上設(shè)計的STR聯(lián)合SNP分析體系(含有37個Y-STR和34個Y-SNP)為Y染色體遺傳標記的聯(lián)合檢測提供了新的思路。
牛津納米孔測序(Oxford nanopore sequencing)使用溶血素作為核酸分子的納米通道,通過判斷核酸跨膜過程的電流變化從而實現(xiàn)測序過程。單鏈核酸分子在電場力驅(qū)動下穿過納米尺寸的蛋白孔道;不同的堿基通過納米孔道會產(chǎn)生與不同阻斷程度和阻斷時間相關(guān)聯(lián)的電流信號,根據(jù)這些電流信號,就能識別每條核酸分子上的堿基信息,從而實現(xiàn)對單鏈核酸分子的測序[37]。納米孔測序讀長長(超過150 kb),速度快,數(shù)據(jù)可實時監(jiān)控,儀器(MinION)也便于攜帶;但測序數(shù)據(jù)錯誤率相對高,NGS序列對比軟件不適用,一定程度上阻礙了其在法醫(yī)學領(lǐng)域的應用。Ren等[38]利用MinION對ForenSeq DNA Signature Prep Kit制備的文庫進行測序,通過自主開發(fā)的生物信息學工作流程能對24個Y-STR基因座中的14個進行正確分型;Tytgat等[39]提出基于比對的分析方法結(jié)合參考數(shù)據(jù)庫可顯著提高分型準確性,然而,納米孔測序在法醫(yī)學領(lǐng)域目前仍處于探索階段。
當Y染色體DNA分析結(jié)論為不能排除時意味著現(xiàn)場檢材可能為嫌疑人所留,也可能源于同一父系下其他男性個體。因此,從隨機匹配概率的角度Y染色體分析匹配的證據(jù)作用不如常染色體那么有意義;但Y染色體為男性特有的性質(zhì)在法醫(yī)學特定方向應用中具有明顯的優(yōu)勢。
親權(quán)鑒定指通過分析人類基因組中具有多態(tài)性的遺傳標記,對兩份或多份檢材來源者可能存在的親緣關(guān)系進行鑒定。與常染色體STR基因座相比,Y-STR基因座的差異可以確定非親緣關(guān)系,具有更高的排除概率[40]。Y染色體NRY區(qū)獨特的單倍型父系遺傳特征,可為某些親權(quán)鑒定或其他父系血緣關(guān)系鑒定提供有效信息。韓莉莉等[41]經(jīng)對一例三聯(lián)體鑒定檢驗,指出當有1~2個常染色體基因座不符合遺傳規(guī)律而被檢個體為男性時,可補充檢驗Y染色體遺傳標記,以使鑒定結(jié)論更加準確可靠。湯美云等[42]通過在Y-STR基因座突變的全同胞兄弟鑒定中補充檢驗Y-SNP或Y-InDel,能有效避免Y-STR突變所導致的結(jié)果解釋的困難,從而提高鑒定結(jié)論的把握度。王海生等[43]通過補充檢測Y-STR分析父系遺傳關(guān)系大大提高了群體性災難事件死難者識別比對認定的準確性和效率。但由于Y染色體的遺傳方式,其遺傳標記的檢測只是對親權(quán)鑒定起到補充說明的作用,出具鑒定意見還需結(jié)合其他鑒定結(jié)果。
針對Y染色體的父系遺傳特征,主流商品化Y-STR試劑盒設(shè)計初衷在于區(qū)別不同的父系。而同一家系的男性個體因具有相同的Y-STR單倍型(排除突變)則難以通過常規(guī)的Y-STR基因座進行區(qū)分。2010年,Ballantyne等[12]將13個突變率在1.19×10-2~7.73×10-2的Y-STR確定為快突變Y-STR,因其突變率較高從而具有更高的多態(tài)性,有望用于區(qū)分男性近親屬[44-45],他們使用該體系檢測報道約66%的男性親屬可以被區(qū)分[46],進一步檢測2 378對父子對后發(fā)現(xiàn)約27%的父子具有不同的單倍型[47],從而證實快突變Y-STR具有可以區(qū)分親緣關(guān)系較近的男性個體的潛力。這13個快突變Y-STR在我國漢族[48]和彝族[49]的父子對中分辨率均達約19%。
快突變Y-STR用于區(qū)分男性近親屬已成為法醫(yī)學研究熱點,但因快突變Y-STR的數(shù)目有限,難以完全區(qū)分男性親屬個體。Ralf等[50]經(jīng)進一步篩選及驗證,設(shè)計出包含26個快突變Y-STR的RMplex。目前,快突變Y-STR基因座均為國外學者報道,隨著群體和家系數(shù)據(jù)的不斷驗證,篩選出我國主要群體的快突變Y-STR基因座和建立相應的分型體系將能為有效區(qū)分男性近親屬提供技術(shù)手段。
通過搜索與現(xiàn)場物證具有相同或相似Y-STR分型的男性個體,可以縮小偵查范圍,幫助指明案件的偵查方向。2016年,我國特大連環(huán)謀殺案——白銀案就是警方通過Y-STR單倍型進行家系搜索得以成功破獲的典型案例[51]。最近,針對一19年之久的冷案中,相關(guān)精斑檢材出現(xiàn)明顯降解,CE檢測Y-STR基因座丟失較多的情況,張弛等[52]應用STRSeqTyperY68的短擴增子優(yōu)勢,成功檢出了所有68個基因座分型并鎖定嫌疑人所在家系,為偵破該冷案提供了有力技術(shù)支持。
目前常用于構(gòu)建Y-STR數(shù)據(jù)庫的試劑盒中部分基因座的突變率較高,同一家系男性個體之間可能因突變表現(xiàn)為不同的單倍型,從而干擾家系搜索,誤導偵查方向[53]。若建庫試劑盒中快突變Y-STR基因座較多,這種可能性發(fā)生的概率將隨之增大。張廣峰等[54]利用遺傳關(guān)系清晰的大家系比較三種Y-STR分型體系(17個Y-STR 的Yfiler、27個Y-STR的Yfiler Plus和7個快突變Y-STR)在世代遺傳過程中所出現(xiàn)變異程度的差異,證實同一家系不同男性個體的Y-STR單倍型不一致與包含的基因座和突變率有關(guān),提示當分型體系中Y-STR個數(shù)較多或者含有快突變Y-STR基因座時, 排除家系尤需慎重。Liu等[55]根據(jù)大樣本量(> 7 000)分析總結(jié)Yfiler和Yfiler Plus圖譜中分別存在不多于2個不匹配Y-STR基因座或2步突變和4個Y-STR基因座不匹配或5步突變的情況下,傾向于判定為來源于同一家系。但這基于特定的Y-STR基因座,換用含有不同基因座的Y-STR試劑盒時,由于缺乏可信的納入和排除標準,就可能導致錯誤排除因而阻礙家系搜索的進程。尚蕾等[56]建議在應用Y-STR開展家系排查時,以中等突變Y-STR或慢突變Y-STR作初步比對,再以快突變Y-STR進行精細比對并根據(jù)Y-STR突變類型的不同對判定標準加以調(diào)整。
相比于Y-STR基因座,Y-SNP突變率很低,同一家系男性個體因突變造成分型不一致的概率極低,因此可穩(wěn)定反映父系譜系結(jié)構(gòu)。但Y-SNP的分辨率較低,僅依靠Y-SNP進行家系搜索,難以達到理想的分辨率。Qian等[57]在犯罪現(xiàn)場檢材Y-STR單倍型與當?shù)貐⒈燃蚁稻嬖诓黄ヅ涞那闆r下,增加檢測139個Y-SNP,在同時考量Y-STR單倍型與Y-SNP單倍群頻率的情況下,提出基于貝葉斯原理的家系搜索指數(shù)FSindex并成功鎖定嫌疑人所在家系。在此基礎(chǔ)上,Liu等[58]利用家系樣本篩選驗證出適用于中國人群體的9個慢突變Y-STR基因座(DYS593、DYS443、DYS645、DYS388、DYS531、DYS596、DYS426、DYS454和DYS455)聯(lián)合Y-SNP輔助家系排查策略,并在漢族、黎族、回族、藏族群體中進行了效能驗證。
混合斑是指包含兩名或兩名以上個體的混合生物檢材,在法醫(yī)案件常見于性犯罪案件中男性精液與女性受害者陰道液組成的混合斑,以及頭發(fā)、皮膚、唾液、指甲或口腔脫落細胞等的混合物。Y染色體遺傳標記為男性所特有,其對于混合斑男性生物成分的鑒定、不同男性個體混合物的分析和無精子或少精子混合斑中DNA的檢測意義重大[59]。Hanson等[60]研發(fā)的Y染色體靶向預擴增系統(tǒng),通過巢式PCR預擴增多個Y-STR基因座,其產(chǎn)物再通過商業(yè)化Y-STR試劑盒進一步擴增,最終能夠從性交后6~9 d收集的樣本中檢測出Y-STR分型。McDonald等[61]研究表明Y-STR分型能夠?qū)⑸飳W上無法檢測到精子的性侵案件(犯罪者為少精癥或無精癥)檢測出陽性結(jié)果,48 h內(nèi)約有30%的樣本至少產(chǎn)生1個Y-STR分型,但這類案件的外陰樣本采集的時限尚未統(tǒng)一,仍需要更深入的研究。
Purps等[62]通過常染色體試劑盒NGMSElect分別與PowerPlex Y23和Yfiler試劑盒結(jié)合檢測存放超過30個月的2 077個生物斑痕;結(jié)果表明使用Y-STR分析比使用常染色體STR分析檢出多個男性成份的可能性約高出三倍。Han等[63]探索使用激光捕獲顯微切割術(shù)和小體積PCR技術(shù)進行單精子的分離和檢測,可對來自3個個體的精子混合物進行有效識別。綜上,Y-STR分型技術(shù)對于法醫(yī)學案件中的混合斑男性成分鑒定和多個男性個體來源的混合斑的個體識別都具有明顯的優(yōu)勢和較大的應用價值。
Y染色體NRY區(qū)嚴格的父系遺傳特征為研究人類遷徙歷史提供了DNA印記;父系親屬也往往傾向于生活在其祖先所在的地理和文化區(qū)域,由此形成的Y-STR單倍型分布具有一定的群體差異,據(jù)此可以推斷種族和群體來源,全世界的Y染色體單倍群構(gòu)成了一個劃分不同人群的譜系[14]。Xue等[64]研究表明相對于Y-STR,Y-SNP突變率更低,其等位基因在人群中更容易穩(wěn)定下來,是推斷族群來源的更好的遺傳標記。NGS技術(shù)能夠?qū)Χ鄠€樣本中成百上千個SNP進行分型,利用有限的DNA實現(xiàn)高分辨率Y單倍群的劃分。Ralf等[65]使用Ion Torrent平臺對530個Y-SNP進行平行測序分型,涵蓋了整個Y樹的分支,并劃分為432個Y單倍群。2019年,該團隊進一步更新Y-SNP分型體系:包含859個Y-SNP,可推斷640個Y單倍群[34];群體樣本測試顯示單倍群R群下7個不同地理區(qū)域的群體顯示出顯著的頻率差別。針對中國人群,Hou等首先設(shè)計覆蓋到中國全部Y單倍群的框架體系(74個Y-SNP)[66],隨后根據(jù)不同民族進一步篩選Y-SNP細分單倍群,在確保絕大部分單倍群頻率小于0.05的前提下構(gòu)建了包含165個Y-SNP的NGS分型體系,并評估了靈敏度及案例類型樣本適用性[35]。近期,該課題組又完成了蒙古族Y-SNP的篩選驗證工作,檢測體系增加至 215 個 Y-SNP[67]。
具有父系遺傳特征的Y染色體NRY區(qū)遺傳標記隨著基因組學、分子生物學技術(shù)等領(lǐng)域的研究進展,在法醫(yī)學實踐中發(fā)揮著越來越重要的作用,但也面臨著現(xiàn)實挑戰(zhàn)。例如,商品化試劑盒中包含越來越多的Y-STR基因座,其中的快突變Y-STR會導致家系排查時出現(xiàn)更多不匹配結(jié)果的概率,就需要合適的統(tǒng)計學解釋與應對方案。此外,Y染色體片段缺失[68],多拷貝Y-STR異常分型[69],不同技術(shù)平臺下Y-STR分型命名差異[70-71]等都需要進一步的深入研究。同時,隨著Y染色體單倍群進化樹的不斷完善,將人類學研究中的族源推斷應用于司法實踐中,為縮小嫌疑人的排查范圍提供線索,也是一個方向。但Y-SNP的多態(tài)性有限,需要篩選出更多適合構(gòu)建中國主要群體進化樹的Y-SNP和慢突變Y-STR。此外,Y-SNP聯(lián)合慢突變Y-STR以及Y遺傳標記與其他遺傳標記聯(lián)用[72]進一步解決家系精準定位的問題也需要更為詳細的研究。當然,這些方向的研究進展將極大地促進Y染色體遺傳標記在法庭科學實踐中的應用。