靳濤, 田楊, 全言釗, 李明亮, 嚴(yán)安心, 李璐瑤
1.陜西省銅川市公安局刑偵支隊, 陜西 銅川 727000;2.公安部物證鑒定中心, 北京 100038;3.西安交通大學(xué)第一附屬醫(yī)院, 西安 710061
男性特異的Y染色體遺傳標(biāo)記已經(jīng)被廣泛應(yīng)用于個體親緣關(guān)系鑒定、家系排查及群體分析等領(lǐng)域[1-5]。研究發(fā)現(xiàn),由Y染色體上的短串聯(lián)重復(fù)序列(Y chromosome short tandem repeats, Y-STRs)組成的Y染色體單倍型可被應(yīng)用于追蹤調(diào)查未知的微量DNA男性供體,在性侵案件和家系搜索中具有特殊價值[2, 6-8]。目前,作為法醫(yī)鑒定和遺傳分析中最常用的遺傳標(biāo)記之一,Y-STR已被國內(nèi)外學(xué)者廣泛認(rèn)可并發(fā)現(xiàn)具有顯著的群體特異性[9-11]。基于法醫(yī)實際檢案的需求,一個可供全球?qū)W者公開訪問的Y-STR單倍型參考數(shù)據(jù)庫(Y-STR Haplotype Reference Database, YHRD, https://yhrd.org, 第59版)已經(jīng)建立。YHRD數(shù)據(jù)庫包含了來自世界各地不同地區(qū)和國家的多個Y-STRs群體單倍型數(shù)據(jù)。為了獲得更多更可靠的Y-STR單倍型數(shù)據(jù),研究者們不斷對世界各地區(qū)不同群體的遺傳多態(tài)性進(jìn)行調(diào)查分析,以期對現(xiàn)有的Y-STR數(shù)據(jù)進(jìn)行補(bǔ)充和完善[12]。
迄今為止,一系列Y-STR基因座相關(guān)的商用試劑盒已被開發(fā)出來用于法醫(yī)領(lǐng)域的探索應(yīng)用[10-12]。YfilerTMPlatinum 復(fù)合擴(kuò)增試劑盒(美國Thermo Fisher Scientific公司)是新開發(fā)的一個商用Y-STR基因座多重檢測系統(tǒng),可同時對多達(dá)41個Y染色體標(biāo)記進(jìn)行復(fù)合擴(kuò)增,包括38個Y-STRs基因座和3個Y-InDels(insertion/deletion, 插入缺失)基因座,擴(kuò)增片段長度在60~565 bp[13]。由于該試劑盒包含的38個Y-STRs幾乎涵蓋了目前常用的商用Y-STR試劑盒中納入的所有基因座,因此,YfilerTMPlatinum復(fù)合擴(kuò)增試劑盒不僅可以與這些先前開發(fā)的試劑盒進(jìn)行兼容,而且新位點的加入更值得我們驗證其在不同群體中的遺傳多態(tài)性和應(yīng)用價值。上述研究還發(fā)現(xiàn)檢測更多Y-STR基因座可以顯著提高無血緣關(guān)系男性的辨別能力[12]。目前大量中國和世界其他國家不同地區(qū)和群體的Y-STR單倍型數(shù)據(jù)已被報道,旨在為法醫(yī)學(xué)和群體遺傳學(xué)分析提供參考[14-15]。然而,作為位于中國西北部陜西省中部的一個重要的交通樞紐,陜西銅川地區(qū)最主要的群體——漢族群體的Y-STRs單倍型研究仍不充分。
因此,本文旨在采用YfilerTMPlatinum試劑盒檢測銅川地區(qū)漢族群體669名無關(guān)男性個體的進(jìn)行分析,獲得38個Y-STRs(DYS576、DYS389I、DYS635、DYS389II、DYS627、DYS549、DYS645、DYS460、DYS458、DYS19、YGATAH4、DYS448、DYS391、DYS557、DYS593、DYS522、DYS456、DYS390、DYS438、DYS392、DYS518、DYS444、DYS596、DYS570、DYS437、DYS449、DYS643、DYS393、DYS439、DYS481、DYS533、DYS447、DYS385、DYF387S1、DYS527)和3個Y-InDels(rs771783753、rs759551978、rs199815934)的遺傳多態(tài)性和法醫(yī)學(xué)參數(shù),為銅川地區(qū)的法醫(yī)學(xué)案件分析、個人識別和親子鑒定提供基礎(chǔ)數(shù)據(jù);同時擬探索銅川地區(qū)和其他群體之間的遺傳關(guān)系,為揭示中國不同地區(qū)的群體間的遺傳關(guān)系提供科學(xué)依據(jù)。
669份陜西省銅川地區(qū)無血緣關(guān)系的男性漢族血樣均隨機(jī)選自銅川市公安局DNA數(shù)據(jù)庫。
手工打孔血卡(直徑1 mm),用直接擴(kuò)增的方式采用YfilerTMPlatinum試劑盒擴(kuò)增。該試劑盒覆蓋38個Y-STR(DYS576、DYS389I、DYS635、DYS389II、DYS627、DYS549、DYS645、DYS460、DYS458、DYS19、YGATAH4、DYS448、DYS391、DYS557、DYS593、DYS522、DYS456、DYS390、DYS438、DYS392、DYS518、DYS444、DYS596、DYS570、DYS437、DYS449、DYS643、DYS393、DYS439、DYS481、DYS533、DYS447、DYS385、DYF387S1、DYS527)和3 Y-InDel(rs771783753、rs759551978、rs199815934)基因座。按照YfilerTMPlatinum試劑盒說明書標(biāo)準(zhǔn)程序的擴(kuò)增體系和擴(kuò)增條件進(jìn)行擴(kuò)增。擴(kuò)增產(chǎn)物用ABI 3500XL遺傳分析儀進(jìn)行電泳,然后使用分析儀自帶的GeneMapper ID-X v 1.5軟件對結(jié)果進(jìn)行分析。
采用直接計數(shù)法統(tǒng)計等位基因頻率及單倍型頻率。根據(jù)Nei’s公式分別計算相應(yīng)的基因多樣性(gene diversity, GD)、單倍型多樣性(haplotype diversity, HD)和單倍型識別率(discrimination power, DC)。公式為GD/HD=[N/(N-1)]×(1-∑Pi2),DC=k/N,其中Pi為第i個等位基因頻率或單倍型頻率,k代表樣本中單倍型的種類數(shù)目,N代表樣本總量[16]。選取YHRD數(shù)據(jù)庫中的20個參考群體(內(nèi)蒙達(dá)斡爾族、內(nèi)蒙蒙古族、湖北土家族、甘肅東鄉(xiāng)族、甘肅回族、青海回族、青海撒拉族、新疆哈薩克族、新疆維吾爾族、福建漢族、海南漢族、云南漢族、四川彝族、黑龍江漢族、日本群體、韓國群體、老撾群體、菲律賓群體、新加坡群體、泰國群體),基于YHRD數(shù)據(jù)庫中27個重復(fù)的Y-STR基因座,運(yùn)用分子方差分析(AMOVA, Molecular variance, https://yhrd.org/amova)計算群體間遺傳距離(pairwise genetic distance, Rst)。然后再根據(jù)Rst值進(jìn)行多維尺度分析圖和系統(tǒng)發(fā)育樹的構(gòu)建。利用YHRD在線構(gòu)建多維尺度分析,然后采用MEGA v7軟件[17],通過鄰接法(neighbor-joining, NJ)[18]構(gòu)建銅川漢族和20個參考群體的系統(tǒng)發(fā)育樹。
為了獲得669名銅川漢族男性個體的單倍型數(shù)據(jù)和法醫(yī)學(xué)參數(shù),本研究對獲得的原始數(shù)據(jù)進(jìn)行了統(tǒng)計分析和HD、GD值的計算。GD代表生物種群之內(nèi)和種群之間的遺傳結(jié)構(gòu)的變異,而HD是衡量一個群體變異程度的重要指標(biāo),是指樣本中隨機(jī)抽取到2個不同單倍型的頻率,HD值高的群體說明其遺傳多樣性高[16]。本研究中共觀察到657種單倍型,其中,唯一單倍型647個,重復(fù)2次的單倍型8個,重復(fù)3次的單倍型2個,單倍型頻率范圍為0.001 5~0.004 5,HD值為0.999 937 345。38個Y-STR和3個Y-InDel基因座的等位基因分布頻率及GD值見表1。38個Y-STR基因座共檢出428個等位基因,其中,包含等位基因最多的基因座是DYS385(67個),最少的基因座則是DYS437(4個),等位基因頻率為0.001 5~0.943 2。GD值范圍為0.108 9(DYS645)~0.969 9(DYS385),DC值為0.982 1。
研究還發(fā)現(xiàn),在7個單拷貝基因座(DYS390、DYS439、DYS449、DYS518、DYS557、DYS576、DYS643)上發(fā)現(xiàn)了頻率較低的雙等位基因。與常見的STR等位基因相比,含有某種序列變異的等位基因稱為微變異,本研究共檢測到45個微變異等位基因。所有微變異等位基因分布在6個基因座(DYS448、DYS458、DYS481、DYS518、DYS627、DYS645)上,共計14種微變異等位基因。其中在DYS518基因座出現(xiàn)的頻率較高(0.026 9)且種類也較多(5種)。此外,DYS448基因座上發(fā)現(xiàn)5個空等位基因。上述可能會出現(xiàn)雙等位基因、微變異或空等位基因的基因座在數(shù)據(jù)分析過程中應(yīng)格外注意。
表1 銅川漢族群體38個Y-STR和3個Y-InDel基因座的等位基因分布頻率及GD值(n=669)Table 1 Allele frequencies and gene diversities of 38 Y-STR loci and 3 Y-InDels in Tongchuan Han population (n=669)
注:A代表該位點的基因型(allele,縮寫為A),F(xiàn)代表該基因型的頻率(frequency,縮寫為F)。
為進(jìn)一步探索銅川漢族群體和國內(nèi)外其他群體間的遺傳關(guān)系,本研究利用YHRD在線軟件計算了銅川漢族群體和20個群體的遺傳距離(genetic distance, Rst)。該比較是在與Yfiler plus試劑盒重疊的27個Y-STR基因座的基礎(chǔ)上完成的。Rst值的范圍是在0~1之間,越接近0代表2個群體間的遺傳距離越小,越接近1代表2個群體間的遺傳距離越大。
如圖1,為了更形象地揭示群體間遺傳關(guān)系,基于Rst值構(gòu)建了多維尺度分析圖。MDS圖中,不同的點代表不同的群體,2個點位置越靠近代表2個群體之間的遺傳距離越小,反之代表遺傳距離大。圖中顯示銅川漢族與其他北方漢族、南方漢族及四川彝族緊密聚集在第四象限,中國北方各個少數(shù)民族則聚集第二象限和第三象限,東南亞群體主要分布在第一象限,而東亞的日本和韓國群體分布在第四象限右側(cè)邊緣。可見與銅川漢族遺傳距離最小的是福建漢族,其次是云南漢族、黑龍江漢族、四川彝族、海南漢族,而與達(dá)斡爾族最遠(yuǎn)。而基于Rst值構(gòu)建的系統(tǒng)發(fā)育樹則根據(jù)分支情況表明遺傳關(guān)系,分支越靠近代表遺傳距離越近。如圖2所示,系統(tǒng)分化樹可分為3大分支:大部分北方群體占一支(除了陜西漢族和黑龍江漢族),亞洲除中國外的其他群體占一支(包括菲律賓、新加坡、老撾、泰國群體),另外,黑龍江漢族、福建漢族2個群體與陜西漢族聚合,接著與四川彝族聚合,再與日本、韓國群體聚合,最后與云南漢族、海南漢族聚合為一支。銅川群體的分支和福建漢族分支等十分靠近,系統(tǒng)發(fā)育樹同多維尺度分析結(jié)果一樣揭示了銅川漢族與其他漢族群體密切的遺傳關(guān)系。
本研究采用YfilerTMPlatinum復(fù)合擴(kuò)增試劑盒對陜西銅川漢族669名無關(guān)男性個體進(jìn)行遺傳多態(tài)性調(diào)查,并探索銅川地區(qū)漢族與其他群體之間遺傳關(guān)系。本研究共觀察到647個唯一單倍型,單倍型頻率為0.001 5~0.004 5,HD值與DC值分別為0.999 9和0.982 1。38個Y-STR基因座中有33個基因座(除了DYS533、DYS391、DYS438、DYS437、DYS645)的GD值均大于0.6,表明38個Y-STR基因座在銅川漢族群體中具有較高遺傳多態(tài)性及系統(tǒng)鑒別效能,適合銅川漢族群體的法醫(yī)學(xué)應(yīng)用,同時可以作為傳統(tǒng)Y染色體商品試劑盒的有效補(bǔ)充。此外,YfilerTMPlatinum試劑盒含有6個Y染色體快速突變基因座(rapidly-mutating Y-STRs)[10],即DYF387S1、DYS449、DYS518、DYS570、DYS576、DYS627,由于這些位點具有較高的突變率,在群體中較傳統(tǒng)的Y-STR基因座具有更高的識別能力。
注:紅色標(biāo)記代表中國北方群體,藍(lán)色代表中國南方群體,黑色代表亞洲群體。圖1 21個群體基于27個Y-STR基因座的MDS圖Fig.1 MDS map of 27 Y-STR loci for 21 populations
注:紅色標(biāo)記代表中國北方群體,藍(lán)色代表中國南方群體,黑色代表亞洲群體。銅川漢族與各國內(nèi)外群體間的Rst值分別在圖右側(cè)標(biāo)示出來。圖2 21個群體基于27個Y-STR基因座的系統(tǒng)發(fā)育樹Fig.2 N-J phylogenetic trees of 27 Y-STR loci for 21 populations
不同的Y-STR位點組合在不同個體、家系、民族、人種及地域間存在著遺傳差異[19],這是群體遺傳學(xué)研究的理論基礎(chǔ)。在中國和世界范圍的群體比較中,本研究通過MDS展示了較明顯的地理和種族聚集特征。陜西漢族群體與其他地區(qū)的漢族群體(無論是南方還是北方漢族群體)之間遺傳關(guān)系十分接近,而中國的南方、北方漢族群體之間遺傳差異明顯。其次與彝族群體遺傳關(guān)系較近,而與地理關(guān)系很遠(yuǎn)的其他亞洲群體遺傳關(guān)系最遠(yuǎn)。由此推測,與地理位置因素相比,民族、人種因素對群體遺傳關(guān)系的影響較大,且北方漢族和南方漢族可能擁有共同的祖先,可能因早期通婚等各種因素發(fā)生了基因交流從而遺傳距離較近[15]。本研究還發(fā)現(xiàn)銅川漢族群體與中國西北回族之間的遺傳距離較小。回族是中國西北地區(qū)除漢族外的另一主要群體,自唐代古絲綢之路以來,由于商業(yè)物流和通婚,與漢族人口混居,因此漢族與回族之間的遺傳關(guān)系密切,Xie等[20]的研究也得到了同樣的結(jié)論。
然而本研究只探索了陜西漢族與部分群體之間的遺傳關(guān)系,尚未充分考慮到銅川周邊其他地區(qū)、其他民族及地理位置相對較遠(yuǎn)的其他群體之間的遺傳差異,這也是后續(xù)研究的一個重要內(nèi)容。此外,對群體遺傳結(jié)構(gòu)和祖源分析需進(jìn)一步利用Y-SNP等突變率比Y-STR更小的遺傳標(biāo)記進(jìn)行驗證[15, 20]。故后續(xù)研究中一方面要不斷補(bǔ)充其他地區(qū)和群體的Y-STR數(shù)據(jù),一方面要納入新的Y染色體遺傳標(biāo)記進(jìn)行分析,對法醫(yī)學(xué)分析、族源推斷、群體進(jìn)化等研究中提供更有意義的參考。