吳佳蕾 季安全 丁冬升 豐 蕾**葉 健**
(1)中國人民公安大學研究生院,北京 100038;2)公安部物證鑒定中心,現(xiàn)場物證溯源技術國家工程實驗室,法醫(yī)遺傳學公安部重點實驗室,北京 100038)
近年來,隨著質譜技術的不斷發(fā)展,蛋白質組學進入了高速發(fā)展的時期,并且獲得了豐碩的成果,依據(jù)質譜技術的蛋白質組學被認為是解決眾多生物學問題的有效手段[1]。基因組測序的研究成果逐漸積累,蛋白質序列數(shù)據(jù)庫不斷增加[2-4],生物信息學相關的分析工具日漸成熟[5],促使分析不同個體蛋白質組中的遺傳差異如單氨基酸多態(tài)性(single amino acid polymorphism,SAP)成為可能。
在法庭科學領域中,來源于人體的毛發(fā)是案件現(xiàn)場最為常見的生物物證之一,毛發(fā)分為毛囊和毛干兩部分,毛囊中含有細胞核基因組DNA,可采用現(xiàn)有的短串聯(lián)重復序列(short tandem repeat,STR)檢驗方法進行DNA個體識別[6],毛干中無細胞形態(tài),核DNA已高度降解,無法使用現(xiàn)有的STR檢驗方法。然而,大部分案件現(xiàn)場提取到的毛發(fā)物證并不帶有毛囊,單獨的毛干至今缺少有效的個體識別方法。目前,法庭科學對毛干的檢測主要有兩種方式:一種是運用顯微形態(tài)檢驗對毛發(fā)的外觀進行觀察比對,該方法需要主觀經(jīng)驗的判斷,缺乏科學的統(tǒng)計分析理論和基礎,其檢驗結果在實際案件中的應用面臨巨大的挑戰(zhàn)[7],在2009年美國國家科學院關于法醫(yī)學的報告《加強美國法醫(yī)學:前進之路》中被認為“非常不可靠”,之后進一步調查甚至發(fā)現(xiàn)因毛發(fā)顯微形態(tài)結果的錯誤陳述導致錯案的發(fā)生;另一種對毛干物證的檢測方法是通過測序檢測線粒體DNA的2個高變區(qū)[8-9],得到單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)的差異,由于線粒體是母系遺傳,因此該檢測具有母系遺傳的特點,存在識別率不高、具有異質性、只能排除不能認定等缺點,無法做到個體識別。嘗試利用蛋白質組學技術對人體毛干中的蛋白質進行檢測,從而獲得具有個體識別潛力的SAP位點,成為解決毛干個體識別難題的新途徑。SAP位點檢測是利用毛干蛋白進行個體識別的重要前提條件。根據(jù)中心法則,每個SAP位點都在DNA上有對應的非同義SNP(non-synonymy SNP,nsSNP)位點,可用SNP位點在東亞人群的頻率、通過乘法法則進行個體識別能力的計算[10-11]。
本文對6名成年健康志愿者毛干樣本使用離子液體法提取毛干蛋白質組、質譜檢測,提取與檢測獨立重復兩次,分析毛干樣本中蛋白質組成,而且通過自建的東亞人群SAP蛋白序列數(shù)據(jù)庫分析鑒定每名個體的SAP分型,闡明了不同個體毛干中的SAP差異性。
本文中所用人體生物樣本來源于志愿者捐贈,收集了6名中國漢族無關健康個體自然脫落頭發(fā)和口腔拭子,其中男女各半。樣本采集工作通過了公安部物證鑒定中心倫理委員會的倫理審查,并且征得了各志愿者的知情同意。每個個體取2根頭發(fā),去除毛囊及發(fā)根,剪取整根頭發(fā)的近發(fā)根端2 cm作為分析樣本。
離子液體C12Im-Cl可以破壞蛋白質中的氫鍵網(wǎng)絡,對于不同組織中的蛋白質具有很好的溶解性。取2 cm毛干單根樣本使用50%乙醇/水溶液清洗兩次,用于去除頭發(fā)表面油脂及污染物。將清洗后的毛干取出并剪碎至約1~2 mm,加入100 μl裂解液中(0.1 mol/L Tris(2-carboxyethyl)phosphine(TCEP,SIGMA),10% C12Im-Cl(m/v)溶 于0.1 mol/L Tris,pH 7.6)[12-13],水浴超聲20 min后,放入振蕩器內(nèi)繼續(xù)37℃振蕩過夜,而后取出并用細胞超聲破碎儀破碎勻漿至毛干可溶解至肉眼不可見。將毛干蛋白溶液放入95℃水浴5 min后,放入高速離心機16 000×g離心40 min。取上清液至入FASP膜離心管內(nèi)(10 k,Sartorius AG),16 000×g離 心30 min,后 用ABC溶 液(50 mmol/L NH4HCO3,pH8.0)清 洗,清 洗 完 成 后 加 入30 mmol/L碘 代 乙 酰 胺(iodoacetamide,IAA,SIGMA)的ABC溶 液 中 避 光 反 應20 min,后16 000×g離心20 min。離心完成后加入ABC溶液清洗3次。更換FASP膜下襯管。在膜上加入2 μl胰蛋白酶(2.5 g/L),37℃水浴4 h,再次加入2 μl胰蛋白酶(2.5 g/L),37℃水浴12 h。酶解完成后16 000×g離心20 min,并用Qubit定量(蛋白質定量試劑盒,Invitrogen,Thermo Fisher)所得肽段。
質譜數(shù)據(jù)由Thermo Easy-nLC 1000液相色譜和Q-Exactive組合型四極桿Orbitrap質譜儀聯(lián)用檢測獲取,上樣量為1 μg。
Nano RPLC的色譜分離條件:流動相A為98%H2O+2%ACN+0.1%FA(均為體積分數(shù));流動相B為98%ACN+2% H2O+0.1% FA(均為體積分數(shù));首先將10 μl 100%的A上樣至C18預柱(3 cm×0.15 mm),壓力為300 Bar,然后在C18毛細管柱(15 cm×0.1 mm)上以600 nl/min的流速分離肽段,梯度如下:2%B(0 min)-5%B(0.1 min)-23%B(55 min)-40% B(70 min)-80% B(72 min)-80% B(85 min)。Q-Exactive的質譜參數(shù):正離子模式,特征肽段參數(shù)的選擇:采集方式為全掃描/數(shù)據(jù)依賴二級掃描(Full MS/DD-MS2,TOPN),一級掃描范圍為m/z300~1 800,一級掃描分辨率為70 000,自動增益控制(AGC)為1×106,離子最大累積時間為60 ms;二級掃描分辨率為17 500,AGC為5×105,離子最大累積時間為60 ms,TOPN=20(前20強),隔離窗口設為m/z2,碰撞能(NCE)為28。
根據(jù)AnnoVar軟件[14-15](2019Oct24)中hg19基因組中編碼基因的Ensembl注釋,獲得包含全部參考型SAP的蛋白質序列。蛋白質編碼區(qū)域的nsSNP變異信息來源于ExAC數(shù)據(jù)庫(http://exac.broadinstitute.org),保留東亞人群中突變頻率高于0.1%的nsSNP,每個nsSNP對應1條含有突變型SAP的蛋白質序列。合并參考蛋白質序列和突變蛋白質序列數(shù)據(jù),獲得東亞人群SAP蛋白質序列數(shù)據(jù)庫。
該數(shù)據(jù)庫包含nsSNP基因組中的位置、分型和在東亞人群中的基因頻率、對應的SAP分型、SAP所在的蛋白質,共包含60 551個蛋白質上的25萬個SAP位點。
人全蛋白質數(shù)據(jù)庫搜索:質譜檢測所得質譜數(shù)據(jù)文件(*.raw)采用pFind Studio(版本3.1)進行數(shù)據(jù)庫檢索[5]。人全蛋白質數(shù)據(jù)庫下載于UniProt,版本為proteome_UP000005640,共包含74 470個蛋白質序列,采用反庫控制結果的假陽性率(FDR)。pFind軟件搜庫設置為3個漏切,全酶切,前體離子允許質量偏差為±10 ppm,碎片離子允許質量偏差為±20 ppm,F(xiàn)DR≤1%,Open Search不勾選。半胱氨酸氨基甲基化修飾(carbamidomethyl[C])為固定修飾,蛋白質N端乙?;╝cetyl[PronteinN-term])和甲硫氨酸氧化(oxidation[M])修飾為可變修飾。
東亞人群SAP蛋白質序列數(shù)據(jù)庫搜索:首先提取6個個體外顯子測序獲得的全部nsSNP,使用AnnoVar注釋獲得對應的SAP信息,并加入到自建SAP蛋白質序列數(shù)據(jù)庫中形成新的庫。使用pFind對新庫進行搜庫,參數(shù)設置同上,利用自建的數(shù)據(jù)分析流程從全部特異性肽段獲得含SAP肽段,提取SAP位點信息,并根據(jù)建庫時的SAP與nsSNP對應注釋表,獲得鑒定到的SAP位點信息、對應的SNP位點信息以及SNP位點在人群中的突變發(fā)生頻率。根據(jù)SAP與標準hg19基因組編碼SAP一致與否,分類為參考型和突變型。
上述6個個體口腔拭子提取全基因組DNA,經(jīng)NanoDrop 2000定 量 取500 ng,濃 度≥5 μg/L DNA,委托艾吉泰康生物科技(北京)有限公司進行全外顯子測序。全外顯子組測序(whole exome sequencing,WES)利用液相探針富集外顯子區(qū)域DNA序列,檢測覆蓋區(qū)域為58 Mb,測序深度≥100×,測序數(shù)據(jù)量≥9 G。
SAP位點對應至相應的SNP位點后,對SNP位點的選擇和計算采用以下原則:a.突變型SNP位點基因頻率≥0.1%;b.非同一染色體上的SNP位點為獨立遺傳;c.同一染色體上距離>2×105bp假設遺傳獨立;d.當兩個或以上位點距離在2×105bp內(nèi)時,取頻率最低SNP位點用于計算。隨機匹配概率(random matching probability,RMP)的計算使用乘法原則。以SNP不同分型在東亞人群中統(tǒng)計頻率作為等位基因頻率,假設突變型等位基因頻率為p,參考型等位基因等位基因頻率為q,則突變型純合子的基因型頻率為p2,參考型純合子的基因型頻率為q2,雜合子的基因型頻率為2pq,乘積各位點的基因型頻率計算個體隨機匹配概率。RMP=基因型頻率(SNP 1)×基因型頻率(SNP 2)×基因型頻率(SNP 3)……。
統(tǒng)計分析作圖軟件為Graph Pad。
使用離子液體前處理方法,2 cm毛干酶解后肽段為(48.19±10.12)μg(n=12,中值=49.36 μg)。來源于6個個體的12個毛干樣本,分兩個批次進行蛋白質提取與質譜檢測,A組為第一批次檢驗樣本,B組為第二批次檢驗樣本。A組6個樣本的肽段檢出為1 826~2 671個(2 180±345),蛋白質檢出數(shù)量為216~400個(284±71),特異性肽段檢出數(shù)量為771~1 012個(885±112)。B組6個樣本的肽段檢出為1 406~2 524個(1 874±389),蛋白質檢出數(shù)量為212~366個(267±68),特異性肽段檢出數(shù)量為569~951個(744±128)。兩批次12個樣本共檢出肽段數(shù)量為1 406~2 671個(2 027±385),蛋白質數(shù)量為212~400個(276±67)。特異性肽段數(shù)量為569~1 012個(814±136)。各樣本的檢出結果詳見表1。為分析毛干中蛋白質細胞組成功能,進行GO分析。對A、B兩組中組成成分中最多的前5類蛋白質作圖,發(fā)現(xiàn)組成毛干最多的5類蛋白質分別為:細胞外泌體蛋白、角蛋白絲蛋白、中間絲蛋白、髓鞘蛋白、細胞外基質蛋白(圖1)。由于角蛋白(keratin)和角蛋白相關蛋白(keratinassociated protein,KAP)是毛發(fā)的重要組成部分,單獨對其進行分析。全部12個樣本中,角蛋白和角蛋白相關蛋白共占所有檢測到蛋白質種類的25%~44%(圖2a),其中每個個體檢出的角蛋白有40~51種,角蛋白相關蛋白41~51種(圖2b)。12個樣本中共檢出52種角蛋白,其中有32種角蛋白在所有樣本均檢出,占61.5%;共檢出KAP 58種,所有樣本均有檢出的KAP為30種,占51.7%。具體的角蛋白及KAP檢出情況見表S1和S2。
Fig.1 The main cellular components of the proteins detected in hair shaft
Fig.2 The proportion and numbers for keratins and KAPs detected in hair shaft
為進一步探討批次間對于檢測結果的差異,對A、B兩個批次的實驗結果進行配對t檢驗,檢出肽段(P=0.24)、蛋白質(P=0.75)顯示批次間均無顯著性差異。兩個批次檢測到最多的前5類蛋白質是一致的,說明建立的離子液體毛干蛋白質組質譜檢測方法穩(wěn)定性良好。同時,對A、B兩組的角蛋白和角蛋白相關蛋白在該樣本所有檢出蛋白質中的占比、角蛋白檢出數(shù)量和角蛋白相關蛋白檢出數(shù)量進行配對t檢驗(P=0.75;P=0.80),發(fā)現(xiàn)兩組均沒有顯著性差異。
為分析同一個體蛋白質檢測重現(xiàn)性,對同一個人A、B兩批次的檢出蛋白質種類進行比較,蛋白質檢出重復率分別為54.7%、61.3%、63.5%、60.7%、67.8%和67.6%(圖3a)。對樣本F202A和F202B分別進行兩次質譜技術重復,蛋白質檢出重復率分別為64.4%和66.2%。通過比較質譜技術重復和樣本重復檢出蛋白質的重復率,發(fā)現(xiàn)除樣本F3相差略大,其他5個個體的兩批次檢出蛋白質重復率與質譜重復的檢出蛋白質重復率接近。對同一個體兩批次合并后作為一個樣本,分析不同樣本的檢測蛋白質一致性的累積交集與累積并集(圖3b),發(fā)現(xiàn)隨著樣本的增加共檢出(累積并集)的蛋白質數(shù)量呈上升趨勢,均檢出(累積交集)的蛋白質數(shù)量呈下降趨勢,其中6個樣本共檢出蛋白質731個,均檢出蛋白質175個。
Fig.3 Protein groups identified in hair shafts from 6 individuals
對搜庫軟件輸出的全部特異性肽段進行序列分析,提取SAP分型,與標準基因組hg19編碼SAP相比,相同的為參考型SAP,不同的為突變型SAP。結果顯示,不僅可以檢測到突變型SAP或參考型SAP,也可同時檢測到兩種分型。如在樣本M2A中,同時檢測到Sialidase-2蛋白上第41位氨基酸的兩種SAP分型,參考型SAP(R),位于肽段IPALLYLPGQQSLLAFAEQR(圖4a)和突變型SAP(Q)位于肽段IPALLYLPGQQSLLAFAEQQASK(圖4b)。根據(jù)建數(shù)據(jù)庫時的SAP與nsSNP對應的注釋表,推導出相應的nsSNP分型,即蛋白質譜檢測到的nsSNP_pro,與外顯子測序獲得的nsSNP分型進行比較分析,其中一致的SAP為validated SAP。
Fig.4 Fragment mass spectrogram of peptides including SAP
從6個個體的12樣本中共計鑒定到321個SAP,平均每個樣本鑒定到(132±17)個SAP,包含(19±4)個突變型和(113±14)個參考型(表2)。其中A組每個樣本鑒定到的SAP位點數(shù)量分別為(137±16)個,B組為(126±18)個。A組validated SAP為(127±13)個,B組為(118±17)個。經(jīng)分組t檢驗顯示,A、B兩組檢出的全部SAP、突變型和參考型SAP數(shù)量無顯著性差異(P>0.05)。所有SAP的檢出詳細信息見表S3。
為比較各樣本SAP分型的差異,去除全部檢測一致的參考型SAP位點后,僅對存在分型差異的SAP位點(即在任一樣本中檢出突變型SAP)進行了匯總(圖5),共計72個SAP位點。其中有10個位點在所有12個樣本中均有檢出,對應的nsSNP在東亞人群中的頻率分布從0.008到0.353 5。大于0.005的等位基因稱為常見等位基因(common allele),在群體中穩(wěn)定遺傳且存在顯著的個體差異性。該10個nsSNP位點均為常見等位基因,可作為個體差異性位點。
對同一個體兩個樣本中檢出的大部分位點保持了較好的一致性,也有個別樣本存在差異。例如對于rs2071560相應的SAP,F(xiàn)3、F203、M1、M2和M3的兩個批次樣本檢出的分型都是一致的,但F202的B樣本檢出了雜合分型,而A樣本只檢測到了突變型。
對12個樣本的nsSNP_pro與外顯子測序nsSNP結果比較,統(tǒng)計結果為:a.完全匹配占67%,即nsSNP_pro與nsSNP完全一致,包括突變(標黑)、雜合(標橙)、參考分型(標藍);b.半匹配占27%,即nsSNP為雜合型,而nsSNP_pro只檢測到其中一種分型,漏檢了另一種分型(標黃);c.錯誤匹配占6%,即nsSNP_pro檢出了nsSNP不存在的分型(標綠),如nsSNP為參考型純合,而nsSNP_pro檢出了突變型,或者nsSNP為突變型純合,而nsSNP_pro檢出了參考型(圖5)。
為評估獲得的SAP位點對于個體識別的區(qū)分能力,將SAP對應nsSNP的基因頻率用于隨機匹配概率的計算。出于準確性考慮,僅使用全外驗證準確的validated SAP位點計算RMP(表3)。A組RMP為3.5×10-3~1.0×10-9,中值為1.1×10-4;B組RMP為1.4×10-2~1.5×10-6,中值為1.6×10-5。經(jīng)t檢驗結果顯示,A、B兩組RMP沒有顯著性差異(P>0.05)。將每個志愿者A、B兩批次檢出的SAP合并后計算RMP,較單批次的結果降低1~2個數(shù)量級,中值達到1.3×10-6。當使用10個在12個樣本中均檢出的SAP(圖5中的TOP10)進行RMP的估算時,F(xiàn)3、F202、F203、M1、M2、M3的RMP分別為3.4×10-1、9.9×10-3、8.0×10-2、2.0×10-4、7.2×10-2、1.6×10-3。
假定半匹配和錯誤匹配是隨機的,那么理論上來說,如果一個人毛干檢測獲得的nsSNP_pro,與同一個人或其他無關個體的外顯子nsSNP驗證比較,來源于同一個體時得到的validated nsSNP_pro(self)數(shù)量最多,相應計算RMP(self)值也最低?;谝陨霞僭O,本文嘗試將每個人的nsSNP_pro結果與其他5個人的測序結果匹配后分別計算RMP(other)。結果顯示,當?shù)鞍踪|與不同的DNA進行匹配時,來源于同一個人的蛋白質和DNA檢出的validated nsSNP_pro數(shù)量最多。除樣本F3以外,基于validated nsSNP_pro(self)計算的RMP(self)也最低,且RMP(self)值越低,與其他個體DNA匹配計算得到的RMP(other)的差距就越大,即個體區(qū)分能力越高,最多可相差6個數(shù)量級(M3樣本)(表4)。對于樣本F3,由于檢測獲得的SAP位點數(shù)量偏少,計算RMP(self)值僅為10-4,盡管RMP(self)值并不是最低,但是與RMP(other)幾乎都在同一個數(shù)量級。該結果證明了即使毛干蛋白SAP分型檢測的重現(xiàn)性存在差異,但是通過與樣本的DNA序列分析比較,尤其是當RMP(self)較低時,呈現(xiàn)出了良好的個體區(qū)分能力。
Fig.5 All mutant SAPs identified in 12 samples
本文以毛干為研究對象,不僅分析了其蛋白質組成,而且針對SAP檢驗建立了相應的檢測方法,并對重現(xiàn)性、準確性進行分析,最后評估了毛干SAP的個體識別能力。2 cm以上的毛干是案件現(xiàn)場可以獲得的常見生物物證,本方法適用于實際應用需求。本方法與以往報道只使用突變型SAP位點[10-11,16-17]不同,不僅利用了突變型SAP,而且也利用了參考型SAP。在RMP計算時,參考型位點的加入和合并兩個樣本的檢測結果,降低了RMP數(shù)值,從而提升了個體識別能力。角蛋白及相關蛋白被認為是毛干中的重要組成部分。通過GO分析發(fā)現(xiàn),毛干蛋白質的組成成分中,最顯著的是細胞外泌體類蛋白,其次才是角蛋白絲蛋白類,另外還有中間絲蛋白類、髓鞘蛋白類、細胞外基質蛋白類等各種不同種類的蛋白質。毛干的蛋白質組成是多樣的,這種多樣性是獲得豐富SAP的前提。
毛干中相當大比例的SAP位點在角蛋白和角蛋白相關蛋白中[18]。將本方法與已報道的方法相比[10-11,16-17],SAP檢出能力顯著提高。不僅是因為本方法加入了參考型SAP,即使僅分析突變型SAP,在12個樣本共檢出了73個突變型SAP(有一個突變型位點在全部樣本中都檢出),多于Parker等[11]檢出的33個和Mason等[10]檢出的57個突變型SAP。分析本方法的優(yōu)勢有如下幾點。a.離子液體對疏水性蛋白具有極強的溶解能力[19-20],可以提高蛋白質的提取,而超聲過程的加入,則進一步增強了溶解能力,優(yōu)于基于尿素提取法[11]和二硫蘇糖醇(DDT)復合月桂酸鈉(SDD)提取法[10];與本研究組前期利用尿素裂解的結果[21]比較,離子液體前處理具有顯著的優(yōu)勢,酶解后同樣使用Nano-LC串聯(lián)QE質譜儀檢測,尿素法平均檢出(937±262)個肽段,而離子液體法平均檢出(2 027±385)個肽段。b.基于東亞人群的SAP數(shù)據(jù)使SAP位點的識別更具有針對性,同樣有利于SAP位點的檢出。c.受試個體全外測序中nsSNP結果與來源于公共數(shù)據(jù)的東亞人群SAP數(shù)據(jù)進行了整合,使部分不存在于公共數(shù)據(jù)庫中的SAP位點得以被檢出,如KRTAP1-1基因座上rs768488910位點(圖4),并不存在于公共數(shù)據(jù)庫中,但是通過對全外測序數(shù)據(jù)的整合,可以在樣本F202A、F202B和樣本M2A、M2B中被檢出。
本文發(fā)現(xiàn),同一個體兩批次提取的毛干樣本中,檢出蛋白質和SAP數(shù)量存在差異,但這種差異與兩次技術重復的差異接近,顯示質譜采集方式可能是導致兩次取樣差異的重要影響因素。本文使用的質譜采集方式為數(shù)據(jù)依賴型采集(datadependent acquisition,DDA),每次采集TopN個質譜峰,具有一定的隨機性[22-23],導致了兩次取樣檢出的蛋白質及SAP存在一定差異。本文通過全外測序驗證的辦法,有效保證了檢出位點的準確性,但也發(fā)現(xiàn)了半匹配的情況,即有一部分SNP位點為雜合型,SAP對應的SNP_pro僅檢出其中一種分型,甚至還發(fā)現(xiàn)了部分SAP與SNP分型完全不一致的情況。其中半匹配的情況,除DDA方法的局限性以外,還可能是因為細胞內(nèi)一條染色體轉錄與翻譯活躍,而另一條染色體上等位基因轉錄或翻譯收到抑制。而對于完全不一致的情況來說,原因比較復雜,至今仍未有確定的結論,這是今后需要深入開展研究的內(nèi)容。
在個體識別應用方面,一個人基因組序列具有唯一性,而蛋白質組檢測結果存在一定的差異性,本文首次提出以基因組為標準,通過蛋白質組SAP推導的nsSNP_pro與基因組中nsSNP匹配一致的位點并計算隨機匹配概率,從而將蛋白質組與基因組有機聯(lián)系起來。對蛋白質組和基因組來源于同一個人時,計算獲得隨機匹配概率最低(除1例因檢出SAP位點過少以外)。該個體識別計算方法為后續(xù)法醫(yī)毛干個體識別應用提出了一個有效的解決策略和應用場景,具有非常重要的應用價值。如現(xiàn)場有一根毛發(fā),有5個嫌疑人可供排查時,本方法可以給出5個人相似性排序,可為鎖定嫌疑人提供有力支撐。另外,未來還需在質譜檢測方法上,針對毛干蛋白質組檢測的特點,進一步改進毛干蛋白提取方式和加深蛋白質組檢測覆蓋度,以增加SAP檢出數(shù)量。
本文建立了一個基于離子液體的毛干蛋白質組前處理及SAP質譜檢測方法,并探索了個體識別分析流程,該方法具有毛發(fā)用量少、穩(wěn)定可重復,檢出SAP數(shù)量更多、針對東亞人群等優(yōu)勢,從隨機匹配概率計算結果來看具有較好的個體識別能力。該方法有望成為法醫(yī)DNA個體識別技術的有力補充,可以預期未來在法庭科學領域具有良好的應用前景。
附件見本文網(wǎng)絡版(www.pibb.ac.cn或www.cnki.net):
PIBB_20210281_Table S1.pdf
Table 1 The number of peptides,protein groups and unique peptides identified in 12 samples
Table 2 The number of SAP identified in 12 samples
Table 3 RMP calculated by nsSNP_pro validated correctly by exome sequencing in 12 samples
Table 4 Supposed RMP calculated by nsSNP_pro in accordance with different exomes in 12 samples
PIBB_20210281_Table S2.pdf
PIBB_20210281_Table S3.pdf