張瑾,劉開會(huì),張穎,郝金萍,張廣峰,徐小玉,暢晶晶,劉興朋,楊雪瑩,葉健
轉(zhuǎn)錄組分析在血液樣本時(shí)間和供體特征刻畫中的應(yīng)用研究
張瑾1,2,劉開會(huì)2,張穎2,郝金萍2,張廣峰2,徐小玉2,暢晶晶2,劉興朋3,楊雪瑩2,葉健1,2
1. 中國(guó)人民公安大學(xué),北京 100038 2. 公安部鑒定中心,北京 100038 3. 瑞金市公安局,瑞金 342500
案件現(xiàn)場(chǎng)生物物證信息深度挖掘與刻畫,可以為案件偵查、涉案人員查找提供豐富可靠線索,是當(dāng)前法醫(yī)DNA檢驗(yàn)的有效補(bǔ)充,也是國(guó)內(nèi)外法庭科學(xué)的研究熱點(diǎn)之一。本研究以血液樣本為研究對(duì)象,證實(shí)了0~168天內(nèi)離體血液樣本轉(zhuǎn)錄組變化的時(shí)間相關(guān)性,并建立隨機(jī)森林模型實(shí)現(xiàn)不同離體時(shí)間血液樣本分類。同時(shí),進(jìn)一步證實(shí)相同離體時(shí)間段內(nèi),不同吸煙習(xí)慣和不同性別供體來(lái)源的血液樣本轉(zhuǎn)錄本具有顯著差異,、和可以作為供體吸煙習(xí)慣判別標(biāo)志,Y染色體非重組區(qū)(non-recombining Y, NRY)的轉(zhuǎn)錄本和可以作為供體性別特征判別標(biāo)志。本研究為法庭科學(xué)領(lǐng)域建立基于轉(zhuǎn)錄組分析的血液樣本遺留時(shí)間和供體特征刻畫方法提供了理論基礎(chǔ)和實(shí)驗(yàn)依據(jù)。
法庭科學(xué);血液;遺留時(shí)間;吸煙習(xí)慣;性別
案件現(xiàn)場(chǎng)生物樣本是應(yīng)用最為廣泛的物證種類之一,可以為案發(fā)過程重建、涉案人員查找提供重要線索。隨著生命科學(xué)技術(shù)和理論研究的不斷發(fā)展,生物物證核酸深度解析為涉案人員個(gè)體識(shí)別和親權(quán)鑒定提供了重要技術(shù)手段,如目前DNA STR分析已經(jīng)成為對(duì)涉案人員進(jìn)行比對(duì)的金標(biāo)準(zhǔn)[1,2]。面對(duì)案件復(fù)雜程度和犯罪手段的不斷“升級(jí)”,深入發(fā)掘物證信息,提升物證證據(jù)能力和證明力,已經(jīng)成為法庭科學(xué)和公安技術(shù)發(fā)展的新趨勢(shì)。通過包括種族、身高、膚色、發(fā)質(zhì)、骨骼、面部特征等在內(nèi)的生物物證供體特征分析刻畫[3],供體的香煙、毒品、藥物等攝入習(xí)慣刻畫[4],供體生活時(shí)空信息刻畫[5],以及生物物證遺留時(shí)間刻畫[6],可以為案件偵辦提供更為直接、可靠、全面的偵查線索,為涉案人員的主動(dòng)查找提供技術(shù)手段。
生物物證遺留時(shí)間(time since deposition, TSD)推斷,因其在案發(fā)時(shí)間分析、犯罪過程重建、犯罪主體甄別中的重要作用,近年來(lái)備受國(guó)內(nèi)外法庭科學(xué)矚目。研究人員應(yīng)用免疫電泳[7]、光學(xué)檢驗(yàn)[8~15]、RNA降解程度分析[16~24]、DNA降解程度分析[25~27]、外源性核酸變化分析[28]等不同技術(shù)手段,從生物斑跡蘊(yùn)含的蛋白質(zhì)、核酸、微生物等不同角度,開展了生物斑跡遺留時(shí)間、生物節(jié)律等時(shí)間信息關(guān)聯(lián)關(guān)系和預(yù)測(cè)方法研究。已有研究證實(shí),離體血液樣本轉(zhuǎn)錄本丟失具有時(shí)間相關(guān)性[29]。本研究收集制備了不同離體時(shí)間血液樣本,考察了血液轉(zhuǎn)錄組在不同離體時(shí)間段的變化情況,并分析比較了血液轉(zhuǎn)錄組在供體性別、吸煙習(xí)慣特征中的差異,證實(shí)了血液轉(zhuǎn)錄組在血液離體時(shí)間、供體吸煙習(xí)慣和供體性別分析鑒定中的應(yīng)用潛力,為血液樣本時(shí)間和供體特征刻畫提供方法。
采集無(wú)關(guān)健康漢族志愿者(男性10人,女性10人)外周血液樣本,EDTA抗凝處理后,在EDTA抗凝管中置于4℃恒溫密閉保存,于不同取樣時(shí)間點(diǎn)收集樣本檢測(cè),取樣時(shí)間點(diǎn)包括新鮮采集(D0)和離體保存0.5天(D0.5)、1天(D1)、2天(D2)、4天(D4)、7天(D7)、14天(D14)、21天(D21)、28天(D28)、56天(D56)、84天(D84)、112天(D112)、140天(D140)、168天(D168)。實(shí)驗(yàn)樣本分組和組內(nèi)樣本數(shù)量見表1。本研究獲得公安部鑒定中心倫理委員會(huì)批準(zhǔn),所有志愿者均簽署知情同意書。
應(yīng)用TRIzolTMReagent (Thermo Fisher, 美國(guó))按照說(shuō)明書方法分離純化血液樣本總RNA[30],使用Ribo-ZeroTMrRNA Removal Kit (Illumina, 美國(guó))去除核糖體RNA后,使用NEBNext?Magnesium RNA Fragmentation Module (New England Biolabs, 美國(guó))將RNA打斷至250~300 bp大小的片段,使用M-Mulv reverse transcriptase system (Thermo Fisher, 美國(guó))反轉(zhuǎn)錄為cDNA,應(yīng)用Agencourt AMPure XP (Backman Coulter, 美國(guó))富集250~300 bp大小的cDNA片段,使用NEBNext?UltraTMRNA Library Prep Kit (New England Biolabs, 美國(guó))構(gòu)建文庫(kù),在Novaseq 6000 Sequencing System (Illumina, 美國(guó))測(cè)序平臺(tái)上進(jìn)行150 bp雙端測(cè)序[31,32]。下機(jī)raw data去除接頭、含N reads和低質(zhì)量reads后獲得clean data,計(jì)算Q20(測(cè)序錯(cuò)誤率<1%的序列百分比)、Q30(測(cè)序錯(cuò)誤率<0.1%的序列百分比)。選用Hisat2 v2.0.4進(jìn)行參考基因組(_Ensembl_97)定位[33,34]。選用HTSeq v0.9.1計(jì)算轉(zhuǎn)錄本FPKM (expected number of fragments per kilobase of transcript sequence per millions base pairs sequenced),即每百萬(wàn)fragments中來(lái)自某一基因每千堿基長(zhǎng)度的fragments數(shù)目[35,36]。
表1 實(shí)驗(yàn)樣本分組
吸煙組(smoker)及其對(duì)照組(control)樣本均來(lái)源于男性志愿者,入組吸煙組的志愿者均自述近2年有吸煙習(xí)慣、每日吸煙5支以上,入組對(duì)照組的志愿者均自述近2年無(wú)吸煙習(xí)慣;男性組(male)、女性組(female)、吸煙組(smoker)及其對(duì)照組(control)樣本均包含4℃恒溫密閉保存0~168天的樣本。
使用Novomagic平臺(tái)(https://magic.novogene.com)進(jìn)行主成分分析(principal component analysis, PCA)和差異轉(zhuǎn)錄本分析。使用Microsoft Excel 2010進(jìn)行相對(duì)表達(dá)比(relative expression ratio, RER)計(jì)算、相對(duì)表達(dá)比分布分析和FPKM分布分析。使用Graph-pad 5.0進(jìn)行置信區(qū)間(confidence interval, CI)統(tǒng)計(jì)。
使用R軟件randomForest包構(gòu)建隨機(jī)森林模型,使用pROC包計(jì)算AUC值,通過important函數(shù)得到MDA(mean decrease accuracy)排序[37~39]。
各組樣本合計(jì)278個(gè),均成功構(gòu)建文庫(kù)并獲得轉(zhuǎn)錄組測(cè)序數(shù)據(jù),raw reads、clean reads、Q20和Q30統(tǒng)計(jì)見表2。278個(gè)樣本平均獲得57 849 014.65條raw reads和56 644 226.98條 clean reads,堿基≥Q30占比平均為94.83%,比對(duì)到參考基因組的平均比對(duì)率為97.28%。
PCA可以應(yīng)用方差分解提取數(shù)據(jù)的主要元素和結(jié)構(gòu),樣本轉(zhuǎn)錄組結(jié)構(gòu)越相似,在PCA圖中的距離越接近,反之則距離越遠(yuǎn)[40]。本研究應(yīng)用主成分分析,考察不同離體時(shí)間血液樣本組間差異,結(jié)果表明,隨著血液樣本離體時(shí)間延長(zhǎng),樣本組間轉(zhuǎn)錄組差異逐漸增大,而同一時(shí)間段組內(nèi)樣本則具有相近的轉(zhuǎn)錄組結(jié)構(gòu)(圖1A)。同時(shí),在針對(duì)吸煙組和對(duì)照組以及男性組和女性組的PCA分析中,樣本呈現(xiàn)與不同離體時(shí)間組相似的分布規(guī)律和形態(tài),但并未表現(xiàn)出與吸煙特征或性別特征相關(guān)的分布差異(圖1,B和C)。這提示離體血液樣本轉(zhuǎn)錄組變化具有時(shí)間相關(guān)性,并且與吸煙和性別特征相比,時(shí)間特征對(duì)血液樣本轉(zhuǎn)錄組結(jié)構(gòu)差異影響更為顯著,可以根據(jù)轉(zhuǎn)錄組結(jié)構(gòu)差異刻畫血液樣本離體時(shí)間。
表2 測(cè)序質(zhì)量與數(shù)據(jù)
根據(jù)不同離體時(shí)間血液樣本的分布特征,本研究進(jìn)一步考察了相同離體時(shí)間下吸煙習(xí)慣和性別特征對(duì)血液樣本分布的影響。結(jié)果表明,在離體時(shí)間相同的血液樣本中,吸煙組與對(duì)照組樣本在0~2天、4~14天、21~56天時(shí)間段均呈現(xiàn)出不同程度的分散分布(圖1,D~G),男性組與女性組也在0~2天、4~14天、21~56天、84~168天時(shí)間段分別呈現(xiàn)出不同程度的分散分布(圖1, H~K),提示血液樣本轉(zhuǎn)錄組中可能存在可以用于吸煙習(xí)慣和性別特征判別的標(biāo)志轉(zhuǎn)錄本。
通過差異表達(dá)分析,在吸煙組中發(fā)現(xiàn)差異轉(zhuǎn)錄本25個(gè),其中上調(diào)差異轉(zhuǎn)錄本14個(gè),下調(diào)差異轉(zhuǎn)錄本11個(gè)(圖2A,表3)。參考文獻(xiàn)[16],根據(jù)以下方法計(jì)算差異轉(zhuǎn)錄本(differential expressed transcripts)與管家基因(house-keeping genes)和的相對(duì)表達(dá)比:
RER=FPKMdifferential expressed transcripts/
FPKMhouse-keeping genes
比較發(fā)現(xiàn),上調(diào)轉(zhuǎn)錄本、和下調(diào)轉(zhuǎn)錄本與管家基因、的相對(duì)表達(dá)比(RER/ACTB、RER/GAPDH、RER/ACTB、RER/ACTB和RER/GAPDH)在吸煙組和對(duì)照組樣本中具有不同的分布區(qū)域(圖3),可以作為樣本是否具有吸煙特征的判別標(biāo)志。
同時(shí),在女性樣本與男性樣本的差異表達(dá)分析中,共有差異轉(zhuǎn)錄本1577個(gè)(上調(diào)差異轉(zhuǎn)錄本1049個(gè),下調(diào)差異轉(zhuǎn)錄本528個(gè))(圖2B)。進(jìn)一步分析差異轉(zhuǎn)錄本在基因組中的定位,定位于X染色體的差異轉(zhuǎn)錄本有65個(gè),定位于Y染色體的差異轉(zhuǎn)錄本有18個(gè),其中有7個(gè)轉(zhuǎn)錄本位于Y染色體非重組區(qū)(non-recombining Y, NRY)(表4),這些轉(zhuǎn)錄本具有單倍體遺傳特性,可以用于男性性別鑒定[41]。對(duì)這些NRY轉(zhuǎn)錄本在男性、女性血液樣本中的FPKM進(jìn)行統(tǒng)計(jì),結(jié)果表明,NRY轉(zhuǎn)錄本在女性樣本中FPKM值均小于1,多數(shù)女性樣本中FPKM值為0(圖4),可以應(yīng)用NRY轉(zhuǎn)錄本的FPKM值進(jìn)行性別特征判斷。
PCA結(jié)果表明,離體血液樣本轉(zhuǎn)錄組呈現(xiàn)不同離體時(shí)間段的分散分布。本研究應(yīng)用隨機(jī)森林算法,隨機(jī)抽取70%的樣本作為訓(xùn)練集,建立了不同離體時(shí)間血液樣本分類模型。交叉驗(yàn)證結(jié)果表明,當(dāng)mtry取值11、ntree取值900時(shí),錯(cuò)誤率最低,最低為5% (圖5A),此時(shí),根據(jù)MDA排序,獲得11個(gè)重要特征變量(表5)。同時(shí)繪制ROC (receiver opera-ting characteristic)曲線,計(jì)算ROC曲線下面積AUC (area under curve),通常情況下,它的值介于1.0和0.5之間,當(dāng) AUC>0.5時(shí),AUC越接近于1,模型分類預(yù)測(cè)性能越好。本研究建立的模型中,D0~2、D4~14、D21~56和D84~168各組樣本可以根據(jù)轉(zhuǎn)錄本FPKM很好區(qū)分(AUC>0.75),其中D21~56和D84~168組間可能存在少量誤判(AUC = 0.765),與PCA分析結(jié)果一致(圖6,圖1A)。在剩余30%的樣本中進(jìn)行測(cè)試,D0~2、D4~14、D21~56和D84~168各組分類正確率分別為92.31%、85.71%、76.92%和100% (表7;圖5,B和C),表明基于血液樣本轉(zhuǎn)錄組的隨機(jī)森林模型可以有效實(shí)現(xiàn)不同離體時(shí)間血液樣本分類,為血液樣本離體時(shí)間刻畫提供方法。
圖1 主成分分析中的血液樣本分布
A:不同離體時(shí)間(0~2天、4~14天、21~56天和84~168天)血液樣本分布;B:0~168天時(shí)間段吸煙組(smoker)及對(duì)照組(control)血液樣本分布;C:0~168天時(shí)間段男性組(male)及女性組(female)血液樣本分布;D:0~2天時(shí)間段吸煙組(smoker)及對(duì)照組(control)血液樣本分布;E:4~14天時(shí)間段吸煙組(smoker)及對(duì)照組(control)血液樣本分布;F:21~56天時(shí)間段吸煙組(smoker)及對(duì)照組(control)血液樣本分布;G:84~168天時(shí)間段吸煙組(smoker)及對(duì)照組(control)血液樣本分布;H:0~2天時(shí)間段男性組(male)及女性組(female)血液樣本分布;I:4~14天時(shí)間段男性組(male)及女性組(female)血液樣本分布;J:21~56天時(shí)間段男性組(male)及女性組(female)血液樣本分布;K:84~168天時(shí)間段男性組(male)及女性組(female)血液樣本分布。坐標(biāo)軸分別表示第一、第二、第三主成分,百分比則表示該主成分對(duì)樣品差異的貢獻(xiàn)值;圖中的每個(gè)點(diǎn)表示一個(gè)樣品,同一個(gè)組的樣品使用同一種顏色表示。
圖2 供體特征相關(guān)差異轉(zhuǎn)錄本
A:吸煙組(smoker)及對(duì)照組(control)差異分析火山圖;B:男性組(male)及女性組(female)差異分析火山圖。有顯著性差異表達(dá)的基因用紅色點(diǎn)(上調(diào))和綠色點(diǎn)(下調(diào))表示,無(wú)顯著性差異表達(dá)的基因用藍(lán)色點(diǎn)表示;橫坐標(biāo)代表基因在不同樣本中表達(dá)倍數(shù)變化;縱坐標(biāo)代表基因表達(dá)量變化差異的統(tǒng)計(jì)學(xué)顯著性(|log2foldchange| > 0.5,-adjusted < 0.05)。
表3 吸煙特征相關(guān)差異轉(zhuǎn)錄本
表4 位于Y染色體非重組區(qū)的差異轉(zhuǎn)錄本
根據(jù)吸煙特征差異轉(zhuǎn)錄本與管家基因相對(duì)表達(dá)比分布,本研究選擇、和作為吸煙特征判別標(biāo)志,計(jì)算吸煙組及其對(duì)照組血液樣本、和與管家基因和的相對(duì)表達(dá)比(RER/ACTB、RER/GAPDH、RER/ACTB、RER/ACTB和RER/GAPDH),分別統(tǒng)計(jì)得出吸煙組和對(duì)照組基因相對(duì)表達(dá)比的置信區(qū)間,以≥lower 95% CI[上調(diào)轉(zhuǎn)錄組本(和)]和≤upper 95% CI[下調(diào)轉(zhuǎn)錄本()]作為“吸煙”特征的判斷標(biāo)準(zhǔn),以≤upper 95% CI[上調(diào)轉(zhuǎn)錄組本(和)]和≥lower 95% CI[下調(diào)轉(zhuǎn)錄本()]作為“不吸煙”特征的判斷標(biāo)準(zhǔn)(表6)。隨機(jī)抽取10%樣本進(jìn)行五次十折交叉驗(yàn)證,正確率最高為92.31%、最低為46.15%,其中,RER/ACTB、RER/GAPDH和RER/ACTB五次交叉驗(yàn)證平均正確率高于70%,具有較好的實(shí)踐參考意義(表7)。
圖3 吸煙特征判別標(biāo)志轉(zhuǎn)錄本與管家基因相對(duì)表達(dá)比分布圖
3個(gè)吸煙特征判別標(biāo)志轉(zhuǎn)錄本與管家基因相對(duì)表達(dá)比在對(duì)照組和吸煙組分布區(qū)域不同;藍(lán)色代表對(duì)照組(control)樣本相對(duì)表達(dá)比,黃色代表吸煙組(smoker)樣本相對(duì)表達(dá)比;D0~D168分別代表離體時(shí)間為0~168天的樣本FPKM平均值的相對(duì)表達(dá)比,total代表所有不同離體時(shí)間樣本FPKM平均值的相對(duì)表達(dá)比。
圖4 位于Y染色體非重組區(qū)基因FPKM分布
Male和female分別代表男性組和女性組;D0~D168分別代表離體時(shí)間為0~168天的樣本FPKM平均值,total代表所有不同離體時(shí)間樣本FPKM平均值。
圖5 隨機(jī)森林模型錯(cuò)誤率分布與交叉驗(yàn)證
A:隨機(jī)森林模型錯(cuò)誤率分布矩陣圖;B:測(cè)試集各分組預(yù)測(cè)概率箱形圖;C:測(cè)試集的預(yù)測(cè)概率箱形圖。測(cè)試集的預(yù)測(cè)概率值(Prob)即為在不同分組的可能性,可能性最高的分組即為模型對(duì)該樣本的分類分組,當(dāng)分類分組與樣本真實(shí)分組一致是,分類結(jié)果視為正確。
表5 隨機(jī)森林模型11個(gè)重要特征轉(zhuǎn)錄本
根據(jù)NRY轉(zhuǎn)錄本FPKM分布特征,本研究選擇在不同離體時(shí)間男性樣本中FPKM平均值均≥1的轉(zhuǎn)錄本和作為性別特征判別標(biāo)志,分別以FPKM≥1和FPKM<1作為男性和女性判斷依據(jù),隨機(jī)抽取樣本進(jìn)行5次十折交叉驗(yàn)證,正確率均為100% (表7)。
生物物證是案件現(xiàn)場(chǎng)最為常見的物證之一,不僅可以通過法醫(yī)DNA STR檢驗(yàn)為涉案相關(guān)個(gè)體識(shí)別、親子鑒定等提供重要線索,還蘊(yùn)含著RNA、DNA和微生物等更為豐富的生物分子信息,可以為供體特征[3,42]、組織來(lái)源[43~47]、生活習(xí)慣[4,6]、年齡推斷[48]、時(shí)空信息[5]等的分析與刻畫提供重要依據(jù)。其中,在生物物證離體時(shí)間推斷領(lǐng)域,已有研究證實(shí)離體生物樣本中核酸降解變化具有時(shí)間相關(guān)性,并應(yīng)用嵌套方差分析、邏輯回歸、一元二次回歸等模型建立了基于RNA降解的血液樣本離體時(shí)間分析方法。但由于樣本數(shù)量、觀測(cè)時(shí)間有限,以及DNA本身在較長(zhǎng)時(shí)間內(nèi)的穩(wěn)定性[49]、分子標(biāo)記相對(duì)單一等,尚未建立確切的現(xiàn)場(chǎng)生物斑跡遺留時(shí)間分析方法。
圖6 隨機(jī)森林模型ROC曲線及AUC值
表6 特征判別標(biāo)志及判別閾值
隨著RNA檢測(cè)技術(shù)的發(fā)展,研究人員認(rèn)為,獲得更多的RNA標(biāo)志片段,有望提升血液斑跡離體時(shí)間分析準(zhǔn)確率,可以為建立血液斑跡時(shí)間分析方法提供更為可靠的基因信息。Katelyn等[29]應(yīng)用轉(zhuǎn)錄組測(cè)序技術(shù),證實(shí)血液樣本轉(zhuǎn)錄本丟失的時(shí)間相關(guān)性,并篩選出、、、作為目的片段,應(yīng)用熒光定量PCR技術(shù)分別檢測(cè)其3′端和5′端含量變化,建立了基于、、3′端、5′端片段Cq值差值的離體時(shí)間線性回歸方程,在8份離體時(shí)間不超過1年的血液斑跡中測(cè)試,遺留時(shí)間推斷誤差不超過6周[24]。本研究同樣應(yīng)用轉(zhuǎn)錄組測(cè)序技術(shù),證實(shí)了隨離體時(shí)間延長(zhǎng),血液樣本中可檢測(cè)到的轉(zhuǎn)錄本(FPKM>1)數(shù)量下降且大量轉(zhuǎn)錄本的豐度呈現(xiàn)下降趨勢(shì),與文獻(xiàn)報(bào)道一致。在此基礎(chǔ)上,本研究基于主成分分析進(jìn)一步證實(shí)了離體血液樣本轉(zhuǎn)錄組變化的時(shí)間相關(guān)性,并應(yīng)用隨機(jī)森林模型,在血液樣本中較好的實(shí)現(xiàn)以離體時(shí)間為要素的樣本分類(AUC>0.75),同時(shí)發(fā)現(xiàn)、、、、、、、、、、等11個(gè)基因在隨機(jī)森林分類中貢獻(xiàn)度高,可能成為血液樣本離體時(shí)間分析的潛在基因標(biāo)志。同時(shí),本研究針對(duì)這些貢獻(xiàn)度高的轉(zhuǎn)錄本進(jìn)行功能聚類分析,并未獲得具有統(tǒng)計(jì)學(xué)意義(<0.05)的功能通路,因此,這些轉(zhuǎn)錄本隨離體時(shí)間延長(zhǎng)豐度下降且在模型分類中表現(xiàn)出更高的貢獻(xiàn)度,可能與已知的基因自身功能關(guān)聯(lián)較小,是否由mRNA降解方式[50]或組織降解相關(guān)功能導(dǎo)致,還需開展深入研究。
表7 樣本離體時(shí)間和供體特征分析交叉驗(yàn)證結(jié)果
在證實(shí)了血液樣本轉(zhuǎn)錄組變化具有時(shí)間相關(guān)性的同時(shí),本研究考察了相同離體時(shí)間段內(nèi)供體性別特征、吸煙習(xí)慣相關(guān)的轉(zhuǎn)錄組水平差異。結(jié)果表明,NRY轉(zhuǎn)錄本和在不同離體時(shí)間男性樣本中FPKM平均值均≥1,在女性樣本中FPKM平均值均<1,十折交叉驗(yàn)證正確率均為100%,可以作為血液樣本供體性別特征的判別標(biāo)志。、和在吸煙組及其對(duì)照組中表達(dá)差異顯著(|log2foldchange| > 0.5,-adjusted < 0.05),其與管家基因和的相對(duì)表達(dá)比在吸煙組及其對(duì)照組中具有不同分布。十折交叉驗(yàn)證中,RER/ACTB、RER/GAPDH和RER/ACTB的平均正確率高于70%、正確率最高為92.31%,可以作為供體特征吸煙習(xí)慣的判別標(biāo)志。、和,同屬于編碼人類主要組織相容性復(fù)合體(major histocom-pati-bility complex,MHC)的基因簇,定位于第6染色體,參與編碼MHC-II類分子,通過抗原加工提呈在機(jī)體免疫應(yīng)答中發(fā)揮重要作用[51~53]。本研究對(duì)25個(gè)吸煙相關(guān)轉(zhuǎn)錄本進(jìn)行功能聚類分析,獲得21個(gè)具有統(tǒng)計(jì)學(xué)意義(<0.05)的功能通路,其中包括類風(fēng)濕性關(guān)節(jié)炎(rheumatoid arthritis)、哮喘(asthma)功能通路。這與文獻(xiàn)報(bào)道中吸煙是類風(fēng)濕性關(guān)節(jié)炎、哮喘發(fā)生的危險(xiǎn)因素一致[53,54],提示、和的表達(dá)改變,可能與吸煙影響機(jī)體免疫繼而誘發(fā)機(jī)體免疫功能障礙和相關(guān)疾病有關(guān)。而吸煙特征判別標(biāo)志基因表達(dá)改變與吸煙相關(guān)的功能機(jī)制、煙草中哪些成分是基因表達(dá)改變的誘發(fā)因素仍需要深入研究,進(jìn)而為供體吸煙特征判別方法的建立和刑事案件偵辦提供科學(xué)可靠的技術(shù)支撐。同時(shí)我們也注意到,與相比,和在吸煙特征判斷中的正確率較高,這可能與二者較高的FPKM值和在吸煙組中上調(diào)的表達(dá)方式有關(guān),當(dāng)然,不同差異轉(zhuǎn)錄本的吸煙特征判別效能還需要進(jìn)一步研究評(píng)判。
本研究選取4℃恒溫密閉保存的EDTA抗凝血為研究對(duì)象,有效避免了環(huán)境溫度、濕度、微生物改變等導(dǎo)致的血液樣本轉(zhuǎn)錄組變化,客觀證實(shí)離體血液樣本轉(zhuǎn)錄組變化的時(shí)間相關(guān)性以及相同離體時(shí)間段內(nèi)來(lái)源于不同吸煙習(xí)慣、性別特征供體的血液樣本在轉(zhuǎn)錄組水平的差異,為血液樣本時(shí)間分析和供體吸煙習(xí)慣、性別特征刻畫提供方法。同時(shí),EDTA抗凝后4℃恒溫密閉保存,是酒精檢測(cè)、毒品檢測(cè)、毒物檢測(cè)、興奮劑檢測(cè)等血液樣本的標(biāo)準(zhǔn)保存方式,本研究建立的時(shí)間和供體特征分析方法可以為上述檢測(cè)中樣本采集時(shí)間和樣本來(lái)源爭(zhēng)議解決提供有效途徑。需要指出的是,環(huán)境溫度、濕度、光照、微生物等對(duì)于離體血液樣本核酸降解變化具有不可忽視的重要影響[55~57],本研究?jī)H考察了4℃恒溫密閉保存的EDTA抗凝血液樣本轉(zhuǎn)錄組與物證特征關(guān)聯(lián)關(guān)系,還需進(jìn)一步研究不同溫度、濕度、光照條件下的血液樣本轉(zhuǎn)錄組變化,以適應(yīng)不同環(huán)境案件現(xiàn)場(chǎng)物證刻畫需要。同時(shí),在明確標(biāo)志轉(zhuǎn)錄本與血液樣本時(shí)間和供體特征關(guān)聯(lián)關(guān)系的基礎(chǔ)上,研究建立樣本需求量小、實(shí)驗(yàn)方法簡(jiǎn)單、實(shí)驗(yàn)周期短、與當(dāng)前法醫(yī)DNA實(shí)驗(yàn)室發(fā)展相匹配的標(biāo)志轉(zhuǎn)錄本檢驗(yàn)分析方法,實(shí)現(xiàn)更為廣泛、更具實(shí)踐應(yīng)用價(jià)值的案件現(xiàn)場(chǎng)血液斑跡時(shí)間和供體特征刻畫,可以為案件偵辦和涉案人員的主動(dòng)查找提供更為直接、可靠、全面的偵查線索和技術(shù)手段。
[1] 侯一平. 法醫(yī)物證學(xué): 第4版. 北京: 人民衛(wèi)生出版社, 2016, 1–5.
[2] 布爾特爾, 侯一平(譯). 法醫(yī)DNA分型專論: 方法學(xué)(第3版). 科學(xué)出版社, 2013, 83–90.
[3] Li M, Li Y, Yang YF, Yan YW, Liu F, Li CX, Zeng FM, Zhao WT. Human facial shape related SNP analysis in Han Chinese populations., 2020, 42(7): 680–690.
劉明, 李祎, 楊亞芳, 晏于文, 劉凡, 李彩霞, 曾發(fā)明, 趙雯婷. 中國(guó)漢族人群臉部特征相關(guān)SNP位點(diǎn)研究. 遺傳, 2020, 42(7): 680–690.
[4] Zhang T, Yang RQ. Review of the application of spectral imaging and mass spectrometry imaging infingerprint analysis., 2015, (1): 71–75.
張婷, 楊瑞琴. 指印中化學(xué)物質(zhì)光譜質(zhì)譜成像分析技術(shù)研究進(jìn)展. 中國(guó)司法鑒定, 2015, (1): 71–75.
[5] Mei HC, Zhu J, Quan YK, Wang GQ. Inferring the donor’s living spatial-temporal information by stable isotope analysis of the biological evidence., 2016, 41(2): 87–92.
梅宏成, 朱軍, 權(quán)養(yǎng)科, 王桂強(qiáng). 穩(wěn)定同位素檢驗(yàn)推斷生物物證供體的生活時(shí)空信息. 刑事技術(shù), 2016, 41(2): 87–92.
[6] Zhang J, Gao S, Chang JJ, Zhang Y, Yang XY, Liu KH. Advances in the research of predicting the time since deposition of evidentiary stains., 2018, 33(1): 39–42.
張瑾, 高珊, 暢晶晶, 張穎, 楊雪瑩, 劉開會(huì). 現(xiàn)場(chǎng)生物斑跡遺留時(shí)間推斷研究進(jìn)展. 中國(guó)法醫(yī)學(xué)雜志, 2018, 33(1): 39–42.
[7] Rajamannar K. Determination of the age of bloodstains using immunoelectrophoresis., 1977, 22(1): 159–164.
[8] Li B, Beveridge P, O'Hare WT, Islam M. The estimation of the age of a blood stain using reflectance spectroscopy with a microspectrophotometer, spectral pre-processing and linear discriminant analysis., 2011, 212(1–3): 198–204.
[9] Bremmer RH, Nadort A, van Leeuwen TG, van Gemert MJC, Aalders MCG. Age estimation of blood stains by hemoglobin derivative determination using reflectance spectroscopy., 2011, 206(1–3): 166–171.
[10] Hanson EK, Ballantyne J. A blue spectral shift of the hemoglobin soret band correlates with the age (time since deposition) of dried bloodstains., 2010, 5(9): e12830.
[11] Gao QY, Gao SM. Authentication of age of blooding using UV visible reflection spectrum., 2015, 35(8): 2221–2224.
高茜鈺, 高士明. 利用紫外可見反射光譜鑒定血跡陳舊度. 光譜學(xué)與光譜分析, 2015, 35(8): 2221–2224.
[12] Edelman G, van Leeuwen TG, Aalders MCG. Hypers-pectral imaging for the age estimation of blood stains at the crime scene., 2012, 223(1–3): 72–77.
[13] Edelman G, Manti V, van Ruth SM, van Leeuwen T, Aalders M. Identification and age estimation of blood stains on colored backgrounds by near infrared spectro-scopy., 2012, 220(1–3): 239–244.
[14] Doty KC, McLaughlin G, Lednev IK. A Raman “spectroscopic clock” for bloodstain age determination: the first week after deposition., 2016, 408(15): 3993–4001.
[15] Thanakiatkrai P, Yaodam A, Kitpipit T. Age estimation of bloodstains using smartphones and digital image analysis., 2013, 233(1–3): 288–297.
[16] Alshehhi S, McCallum NA, Haddrill PR. Quantification of RNA degradation of blood-specific markers to indicate the age of bloodstains., 2017, 6: e453–e455.
[17] Anderson S, Howard B, Hobbs GR, Bishop CP. A method for determining the age of a bloodstain., 2005, 148(1): 37–45.
[18] Bauer M, Polzin S, Patzelt D. Quantification of RNA degradation by semi-quantitative duplex and competitive RT-PCR: a possible indicator of the age of bloodstains?, 2003, 138(1–3): 94–103.
[19] Anderson SE, Hobbs GR, Bishop CP. Multivariate analysis for estimating the age of a bloodstain., 2011, 56(1): 186–193.
[20] Mohammed AT, Khalil SR, Ali HA, Awad A. Validation of mRNA and microRNA profiling as tools in qPCR for estimation of the age of bloodstains., 2018, 15(6): 1–7.
[21] Glynn CL. Potential applications of microRNA profiling to forensic investigations., 2020, 26(1): 1–9.
[22] Hampson C, Louhelainen J, McColl S. An RNA expression method for aging forensic hair samples., 2011, 56(2): 359–365.
[23] Alshehhi S, Haddrill PR. Estimating time since deposition using quantification of RNA degradation in body fluid specific markers., 2019, 298: 58–63.
[24] Fu J, Allen RW. A method to estimate the age of bloodstains using quantitative PCR., 2019, 39: 103–108.
[25] Wang Y. Measurement of DNA degradation kinetics in serum, urine and saliva based on automatic STR analysis system [Dissertation]. Dalian Medical University, 2014.
王瑤. 基于STR自動(dòng)檢測(cè)系統(tǒng)對(duì)DNA在血清、尿液和唾液中降解動(dòng)力學(xué)的測(cè)定[學(xué)位論文]. 大連醫(yī)科大學(xué), 2014.
[26] Johnson LA, Ferris JAJ. Analysis of postmortem DNA degradation by single-cell gel electrophoresis., 2002, 126(1): 43–47.
[27] Cossette ML, Stotesbury T, Shafer ABA. Quantifying visible absorbance changes and DNA degradation in aging bloodstains under extreme temperatures., 2021, 318: 110627.
[28] Díez López C, Kayser M, Vidaki A. Estimating the time since deposition of saliva stains with a targeted bacterial DNA approach: a proof-of-principle study., 2021, 12: 647933.
[29] Weinbrecht KD, Fu J, Payton ME, Allen RW. Time- dependent loss of mRNA transcripts from forensic stains., 2017, 7: 1–12.
[30] Ramaprasad A, Subudhi AK, Culleton R, Pain A. A fast and cost-effective microsampling protocol incorporating reduced animal usage for time-series transcriptomics in rodent malaria parasites., 2019, 18(1): 26.
[31] Jang JS, Berg B, Holicky E, Eckloff B, Mutawe M, Carrasquillo MM, Ertekin-Taner N, Cuninngham JM. Comparative evaluation for the globin gene depletion methods for mRNA sequencing using the whole blood- derived total RNAs., 2020, 21(1): 890.
[32] Lopez JP, Diallo A, Cruceanu C, Fiori LM, Laboissiere S, Guillet I, Fontaine J, Ragoussis J, Benes V, Turecki G, Ernst C. Biomarker discovery: quantification of microRNAs and other small non-coding RNAs using next generation sequencing., 2015, 8: 35.
[33] Kim D, Langmead B, Salzberg SL. HISAT: a fast spliced aligner with low memory requirements., 2015, 12(4): 357–360.
[34] Raplee ID, Evsikov AV, de Evsikova CM. Aligning the aligners: comparison of RNA sequencing data alignment and gene expression quantification tools for clinical breast cancer research., 2019, 9(2): 18.
[35] Anders S, Pyl PT, Huber W. HTSeq—a Python framework to work with high-throughput sequencing data., 2015, 31(2): 166–169.
[36] Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L. Trans-cript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation., 2010, 28(5): 511–515.
[37] Tiedt S, Prestel M, Malik R, Schieferdecker N, Duering M, Kautzky V, Stoycheva I, B?ck J, Northoff BH, Klein M, Dorn F, Krohn K, Teupser D, Liesz A, Plesnila N, Holdt LM, Dichgans M. RNA-seq identifies circulating miR-125a-5p, miR-125b-5p, and miR-143-3p as potential biomarkers for acute ischemic stroke., 2017, 121(8): 970–980.
[38] Li J, Zhao FQ, Wang YD, Chen JR, Tao J, Tian G, Wu SL, Liu WB, Cui QH, Geng B, Zhang WL, Weldon R, Auguste K, Yang L, Liu XY, Chen L, Yang XC, Zhu BL, Cai J. Gut microbiota dysbiosis contributes to the development of hypertension., 2017, 5(1): 14.
[39] Kong YQ, Liu JK, Gu JQ, Xu JY, Zheng YN, Wei YL, Wu SY. Optimization scheme of machine learning model for genetic division between northern Han, southern Han, Korean and Japanese., 2022, 44(11): 1028–1043.
孔永強(qiáng), 劉金凱, 顧佳琪, 徐景怡, 鄭雨諾, 魏以梁, 伍少遠(yuǎn). 南–北方漢族人、韓國(guó)人和日本人遺傳劃分機(jī)器學(xué)習(xí)模型優(yōu)化方案. 遺傳, 2022, 44(11): 1028–1043.
[40] Lin HJ. The prediction and functional analysis of IncRNA in embryonic development process [Dissertation]. Nan-chang University, 2016.
林海軍. 胚胎中l(wèi)ncRNA的預(yù)測(cè)及其在胚胎發(fā)育過程中的功能分析[學(xué)位論文]. 南昌大學(xué), 2016.
[41] Ming TY, Jiang LR, Liu J, Chang JJ, Hou YP, Zhang GF, Wang Z. Y-Chromosomal genetic markers: forensic appli-cation and prospect., 2022, 47(4): 411–418.
[42] 明天悅, 蔣禮蓉, 劉京, 暢晶晶, 侯一平, 張廣峰, 王正. Y染色體遺傳標(biāo)記的法醫(yī)學(xué)應(yīng)用及展望. 刑事技術(shù), 2022, 47(4): 411–418.
Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome., 2012, 486(7402): 207–214.
[43] Zhao YX, Hu S, Ye J, Sun QF, Ji AQ. Researches of mRNA profiling for forensic body fluid identification., 2019, 44(5): 388–394.
趙一霞, 胡勝, 葉健, 孫啟凡, 季安全. mRNA分析在體液斑跡組織來(lái)源推斷中的應(yīng)用研究進(jìn)展. 刑事技術(shù), 2019, 44(5): 388–394.
[44] Zhang Q, Zhao HM, Li YJ, Chen J, Chang JJ, Yang RQ, Wang C. Application of non-coding RNA in body fluid stain identification., 2020, 35(5): 514–517. 張琦, 趙禾苗, 李永久, 陳靜, 暢晶晶, 楊瑞琴, 王沖. 非編碼RNA在體液斑跡鑒定中的應(yīng)用. 中國(guó)法醫(yī)學(xué)雜志, 2020, 35(5): 514–517.
[45] Lehman DC. Forensic microbiology., 2012, 25(2): 114–119.
[46] García MG, Pérez-Cárceles MD, Osuna E, Legaz I. Impact of the human microbiome in forensic sciences: a sys-tematic review., 2020, 86(22): e01451–20.
[47] Ventura Spagnolo E, Stassi C, Mondello C, Zerbo S, Milone L, Argo A. Forensic microbiology applications: a systematic review., 2019, 36: 73–80.
[48] Jia F, Sun XK, Yu SB, Yu J, Lin CM, Kan XS, ShaoW. An age estimation method based on DNA methylation dete-ction in the field of forensic science., 2021, 3(4): 373–378.
賈菲, 孫學(xué)科, 喻少波, 于蛟, 林春美, 闞旭升, 邵武. DNA甲基化水平的法醫(yī)學(xué)個(gè)體年齡推斷. 中國(guó)法醫(yī)學(xué)雜志, 2021, 36(4): 373–378.
[49] Mameli A, Scudiero CM, Delogu G, Ghiani ME. Successful analysis of a 100 years old semen stain generating a complete DNA STR profile., 2019, 61: 78–81.
[50] Xu TS, Li XG, Jiao DJ, Xie ZH, Dai ZM. Mechanism of 5′-to-3′ degradation of eukaryotic and prokaryotic mRNA., 2015, 37(3): 250–258.
許禔森, 李學(xué)貴, 焦德杰, 謝兆輝, 戴忠民. 真核生物和原核生物mRNA 5′至3′方向的降解機(jī)制. 遺傳, 2015, 37(3): 250–258.
[51] Althaf MM, El Kossi M, Jin JK, Sharma A, Halawa AM. Human leukocyte antigen typing and crossmatch: a comprehensive review., 2017, 7(6): 339–348.
[52] Gao H, Han Y, Zhai XX, Gao FS. The research progress of antigen presentation by MHC molecules., 2017, 29(5): 450–461.
高花, 韓勇, 翟曉鑫, 高鳳山. MHC分子抗原遞呈機(jī)制的研究進(jìn)展. 生命科學(xué), 2017, 29(5): 450–461.
[53] Lu BH. Effects of smoking on autoantibodies and disease activity in patients with rheumatoid arthritis [Dissertation]. Hubei Minzu University, 2020.
魯邦華. 吸煙對(duì)類風(fēng)濕關(guān)節(jié)炎自身抗體及疾病活動(dòng)的影響[學(xué)位論文]. 湖北民族大學(xué), 2020.
[54] Jiang WQ, Chen ZY, Zhou LL, Lian SY, Zhang XM. Investigation on disease cognition status and influencing factors of control level in patients with bronchial asthma., 2022, 22(2): 342–346.
蔣文青, 陳宗喻, 周壘壘, 練思雨, 張先明. 支氣管哮喘患者疾病認(rèn)知狀況調(diào)查及控制水平的影響因素分析. 現(xiàn)代生物醫(yī)學(xué)進(jìn)展, 2022, 22(2): 342–346.
[55] Heneghan N, Fu J, Pritchard J, Payton M, Allen RW. The effect of environmental conditions on the rate of RNA degradation in dried blood stains., 2021, 51: 102456.
[56] Zhao CC, Zhao MZ, Zhu Y, Zhang L, Zheng Z, Wang Q, Li YG, Zhang P, Zhu SS, Ding SJ, Li JB. The persistence and stability of miRNA in bloodstained samples under different environmental conditions., 2021, 318: 110594.
[57] Salzmann AP, Arora N, Russo G, Kreutzer S, Snipen L, Haas C. Assessing time dependent changes in micro-bial composition of biological crime scene traces using micro-bial RNA markers., 2021, 53: 102537.
Application of transcriptome in time analysis and donor characterization in blood samples
Jin Zhang1,2, Kaihui Liu2, Ying Zhang2, Jinping Hao2, Guangfeng Zhang2, Xiaoyu Xu2, Jingjing Chang2, Xingpeng Liu3, Xueying Yang2, Jian Ye1,2
Asan effective supplement to the current forensic DNA typing and one of the research hotpots in forensic science, the in-depth mining and characterization of biological evidence can provide rich and reliable clues for case investigation. In this study, the time-dependent variations of transcriptome were confirmed inblood samples within 0-168 days and a random forest model was established to realize the classification of blood samples with different TSD (time since deposition). Meanwhile, significant differences were observed in the transcripts of blood samples with different smoking habits and genders within a certain time period.,andwere identified as markers for smoking habit identification, while the transcripts forandfrom the non-recombining region of the Y chromosome (NRY) were identified as markers for male sex identification. Thus, this study provides a theoretical foundation and experimental strategy for establishing a transcriptome-based method for characterizing blood sample retention time and donor characteristics in the field of forensic investigation.
forensic science;blood; time since deposition; smoking habit; gender
2022-10-31;
2022-11-29;
2022-12-09
公安部技術(shù)研究計(jì)劃項(xiàng)目(編號(hào):2017JSYJC22),公安科技成果推廣引導(dǎo)計(jì)劃項(xiàng)目(編號(hào):2020TGYDBGAES25)和中央級(jí)公益類科研院所基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目(編號(hào):2020JB008)資助[Supported by the Science and Technology Development Programs of Ministry of Public Security P.R.C (No. 2017JSYJC22), the Public Security Scientific and Technological Achievements Promotion and Guidance Programs of Ministry of Public Security P.R.C (No. 2020TGYDBGAES25), and the Basic research Funds for Public Welfare Research Institutes of the Central Government (No. 2020JB008)]
張瑾,在讀博士研究生,副高級(jí)警務(wù)技術(shù)任職資格,研究方向:法醫(yī)物證學(xué)。E-mail: zhangjin1101@126.com
楊雪瑩,博士,正高級(jí)警務(wù)技術(shù)任職資格,研究方向:法醫(yī)物證學(xué)。E-mail: yxystyhhp@163.com
葉健,博士,主任法醫(yī)師,研究方向:法醫(yī)物證學(xué)。E-mail: yejian77@126.com
10.16288/j.yczz.22-293
(責(zé)任編委: 朱波峰)