王寧 鄭璐瑤 孟秀娟 劉海婷 丁楊明 姚蓉 郭少晨 陸宇
【Fundprogram】 Beijing Municipal Science and Technology Commission (Z191100006619090); Special Program for Clinical Medicine Development of Beijing Hospital Management Center (ZYLX202123)
N-乙?;D(zhuǎn)移酶2(N-acetyltransferase-2,NAT2)是人體內(nèi)一種重要的Ⅱ相代謝酶,主要在肝臟及腸道上皮中表達(dá),參與體內(nèi)多種物質(zhì)的代謝過(guò)程[1]。由于基因多態(tài)性的存在,個(gè)體NAT2代謝能力存在明顯差異,可分為NAT2快、中間及慢代謝型[2]。研究證實(shí),人群中不同NAT2代謝型與腫瘤、帕金森病等多種疾病及藥物不良反應(yīng)的發(fā)生和發(fā)展相關(guān),發(fā)病機(jī)制考慮與NAT2慢乙酰化導(dǎo)致的機(jī)體毒性物質(zhì)蓄積有關(guān)[3-7]。2021年11月發(fā)布的《結(jié)核病患者N-乙?;D(zhuǎn)移酶2編碼基因多態(tài)性檢測(cè)與異煙肼合理用藥專(zhuān)家共識(shí)》明確指出NAT2代謝型與抗結(jié)核藥物異煙肼的療效與不良反應(yīng)有關(guān),在患者接受異煙肼抗結(jié)核治療時(shí)確定其N(xiāo)AT2基因型對(duì)患者的精準(zhǔn)化治療至關(guān)重要[8]。
不同種族、地區(qū)人群NAT2基因型、單體型分布存在明顯差異[2,9]。例如,在歐洲人群中NAT2*5等位基因攜帶率約為50%左右,但該等位基因在東亞人群中攜帶率僅為5%;在東亞人群中攜帶率約為20%的NAT2*7等位基因,在歐洲人群中攜帶率卻不足5%;NAT2*14等位基因在非洲及美洲人群中攜帶率約為10%,但在歐洲及亞洲人群中基本不攜帶此等位基因。因此,明確中國(guó)人群NAT2基因型及等位基因分布至關(guān)重要。
目前國(guó)內(nèi)外結(jié)核病研究領(lǐng)域NAT2基因多態(tài)性研究中大多以檢測(cè)NAT2中特定單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)位點(diǎn)作為確定NAT2基因型的依據(jù),常見(jiàn)的檢測(cè)位點(diǎn)為341T→C(或481C→T)、590G/A、857G/A,分別對(duì)應(yīng)*5、*6、*7等位基因,上述3種等位基因可解釋中國(guó)人群中大部分的慢乙?;x類(lèi)型[10]。3SNP法采用341T→C、590G→A、857G→A等3個(gè)SNP位點(diǎn)對(duì)NAT2基因型進(jìn)行推斷,2SNP法利用2個(gè)SNP位點(diǎn)(282C→T、341T→C)推斷NAT2基因型。Hein和Doll[11]報(bào)道4SNP法(191G→A、341T→C、590G→A、857G→A)推斷NAT2基因型的準(zhǔn)確性與7SNP法相當(dāng),優(yōu)于tagSNP(rs1495741)、2SNP(282C→T和341T→C)及3SNP法(341T→C、590G→A、857G→A)。由于rs180127919(191G→A)位點(diǎn)突變僅存在于非洲人群中,因此,其研究中4SNP法在中國(guó)人群NAT2基因型推斷時(shí)實(shí)質(zhì)上等同于3SNP法。Selinski等[12]發(fā)現(xiàn)2SNP法推斷NAT2基因型的效能與經(jīng)典的7SNP法相當(dāng),優(yōu)于tagSNP法。在中國(guó)人群中NAT2不同推斷方法效能的比較研究尚未見(jiàn)報(bào)道,筆者對(duì)已發(fā)表的包含中國(guó)人群NAT2基因型信息的文獻(xiàn)進(jìn)行了檢索,構(gòu)建了中國(guó)人群NAT2基因型數(shù)據(jù)庫(kù),并對(duì)不同NAT2基因型推斷方法的效能進(jìn)行評(píng)價(jià)。
1.文獻(xiàn)檢索:對(duì)包含中國(guó)人群NAT2基因多態(tài)性數(shù)據(jù)的文獻(xiàn)進(jìn)行檢索,檢索范圍包括Medline、PubMed、Embase、維普中文科技期刊數(shù)據(jù)庫(kù)、中國(guó)知網(wǎng)和萬(wàn)方醫(yī)學(xué)網(wǎng)等數(shù)據(jù)庫(kù),檢索時(shí)限為數(shù)據(jù)庫(kù)建庫(kù)至2021年12月1日,同時(shí)對(duì)納入文獻(xiàn)的參考文獻(xiàn)進(jìn)一步手工檢索。英文檢索詞:NAT2、N-acetyltransferase、polymorphism、China或Chinese,以及這些詞的同義詞或擴(kuò)展詞;中文檢索詞:NAT2、基因多態(tài)性、中國(guó),以及這些詞的同義詞或擴(kuò)展詞。
2.文獻(xiàn)納入及排除標(biāo)準(zhǔn):(1)納入標(biāo)準(zhǔn):①NAT2 基因多態(tài)性檢測(cè)方法為PCR直接測(cè)序法或至少檢測(cè)NAT2基因第2外顯子6個(gè)SNP位點(diǎn)(rs1041983、rs1801280、rs1799929、rs1799930、rs1208、rs1799931);②研究結(jié)果NAT2基因多態(tài)性數(shù)據(jù)中包含亞型(如*6A、*7B等)信息及對(duì)應(yīng)頻數(shù)信息;③如遇同一項(xiàng)研究階段結(jié)果發(fā)表在不同期刊的情況,則對(duì)數(shù)據(jù)進(jìn)行合并、整理,選擇包含內(nèi)容詳細(xì)、數(shù)據(jù)廣泛的研究。(2)排除標(biāo)準(zhǔn):①文獻(xiàn)結(jié)果只報(bào)道NAT2快、慢代謝基因型而未報(bào)道具體NAT2基因型(雙體型)及亞型數(shù)據(jù);②研究人群不在中國(guó)境內(nèi)。
3.文獻(xiàn)數(shù)據(jù)評(píng)價(jià)及處理:使用Newcastle-Ottawa Scale(NOS)評(píng)分表對(duì)納入的文獻(xiàn)進(jìn)行質(zhì)量評(píng)價(jià)和風(fēng)險(xiǎn)評(píng)估。提取文獻(xiàn)中NAT2基因型及等位基因信息,重建單項(xiàng)研究NAT2基因型數(shù)據(jù)庫(kù)并利用Phase 2.1軟件[13-15]進(jìn)行單體型和雙體型重建及驗(yàn)證,對(duì)于文獻(xiàn)中與軟件基因型推測(cè)不符的數(shù)據(jù)進(jìn)行分析和修正。NAT2等位基因和基因型分型標(biāo)準(zhǔn)參考人類(lèi)NAT2等位基因庫(kù)(http://nat.mbg.duth.gr/Human%20NAT2%20alleles_2013.htm)。提取文獻(xiàn)中對(duì)照組人群NAT2基因型數(shù)據(jù)構(gòu)建中國(guó)人群NAT2基因型分布數(shù)據(jù)庫(kù),比較和分析不同地區(qū)NAT2等位基因和基因型分布特點(diǎn)。SNP位點(diǎn)信息及人群分布數(shù)據(jù)通過(guò)美國(guó)國(guó)家生物信息中心SNP數(shù)據(jù)(https://www.ncbi.nlm.nih.gov/)及中國(guó)漢族基因組數(shù)據(jù)庫(kù)(https://www.biosino.org/pgghan2/index)查詢(xún)?;跇?gòu)建的NAT2基因型數(shù)據(jù)庫(kù),評(píng)估不同NAT2基因型分型方法的準(zhǔn)確性。
4.統(tǒng)計(jì)學(xué)處理:不同研究的NAT2基因型及等位基因分布以“頻數(shù)和頻率(%)”描述,通過(guò)WPS電子表格整理數(shù)據(jù)。不同NAT2基因型推斷方法(3SNP法及2SNP法[11])性能評(píng)價(jià)指標(biāo)包括敏感度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值、準(zhǔn)確度,推斷方法效能的比較采用McNemar檢驗(yàn)和Kappa一致性檢驗(yàn),以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.文獻(xiàn)篩選結(jié)果:經(jīng)過(guò)文獻(xiàn)檢索及篩選,最終納入10項(xiàng)研究[4-5,16-23]。具體文獻(xiàn)篩選過(guò)程及文獻(xiàn)基本信息見(jiàn)圖1及表1。
表1 納入研究文獻(xiàn)信息匯總
圖1 文獻(xiàn)篩選流程圖
2.納入文獻(xiàn)風(fēng)險(xiǎn)偏倚評(píng)價(jià):使用NOS評(píng)分表對(duì)納入的文獻(xiàn)進(jìn)行質(zhì)量評(píng)價(jià)和風(fēng)險(xiǎn)評(píng)估。量表共分為3個(gè)主要評(píng)價(jià)指標(biāo),分別為研究對(duì)象選擇、組間可比性、暴露因素測(cè)量。每項(xiàng)下分別有4、2、3個(gè)小項(xiàng),根據(jù)文獻(xiàn)內(nèi)容是否符合分別賦值,最高為9★,得分越高,文獻(xiàn)質(zhì)量越高,納入文獻(xiàn)評(píng)價(jià)情況見(jiàn)表2。
表2 納入文獻(xiàn)的偏差風(fēng)險(xiǎn)和質(zhì)量評(píng)估
3.文獻(xiàn)中NAT2基因型及等位基因信息提取及整理:10篇文獻(xiàn)中3篇文獻(xiàn)NAT2基因型分型采用直接測(cè)序法,7篇采用間接方法檢測(cè)至少6個(gè)SNP位點(diǎn)的多態(tài)性并對(duì)個(gè)體的NAT2基因型進(jìn)行推斷。利用7篇文獻(xiàn)中個(gè)體的NAT2基因型(雙體型)信息重建各自單項(xiàng)研究NAT2基因型數(shù)據(jù),并使用Phase 2.1軟件驗(yàn)證原文獻(xiàn)的推測(cè)結(jié)果。
在上海-2012研究[20]中檢測(cè)到*14A等位基因,查詢(xún)美國(guó)國(guó)家生物技術(shù)信息中心SNP數(shù)據(jù)庫(kù)及中國(guó)漢族人群基因組數(shù)據(jù)庫(kù),*14A等位基因?qū)?yīng)的rs1801279位點(diǎn)僅在非洲裔人群具有多態(tài)性,中國(guó)人群此位點(diǎn)全部為GG型,在整理數(shù)據(jù)時(shí)將該研究中的這2例刪除。
在上海-2016研究[5]中,共有477例中間代謝型,根據(jù)Phase 2.1基因型推斷結(jié)果,分別將477例推斷為*4/*5B(31例)、*4/*6A(261例)及*4/*7B(185例)。該研究中有12例未能明確基因亞型,僅能判斷為快代謝及慢代謝等位基因雜合個(gè)體,在計(jì)算人群NAT2基因型分布時(shí)納入這12例,由于不能確定SNP位點(diǎn)多態(tài)性信息,評(píng)估不同NAT2分型方法及統(tǒng)計(jì)不同等位基因頻率時(shí)未納入這12例中間代謝型個(gè)體。
在長(zhǎng)沙-2006研究[4]中,NAT2分型結(jié)果匯總表中,共有3種基因型無(wú)法確定基因亞型,分別是NAT2*6A/282.481、NAT2*6B/282.481及NAT2*6E/282.481,通過(guò)查詢(xún)?nèi)祟?lèi)NAT2基因數(shù)據(jù)庫(kù)(最后更新2016年4月18日),未查詢(xún)到同時(shí)攜帶282C→T與481C→T的NAT2等位基因,且即使理論上存在282C→T與481C→T共同突變的等位基因,由于此2個(gè)位點(diǎn)都是同義突變,帶有282C→T與481C→T的等位基因也應(yīng)該是NAT2快代謝等位基因。利用Phase 2.1軟件對(duì)該研究NAT2基因型數(shù)據(jù)進(jìn)行單體型及雙體型重建,上述3種基因型重新推斷為*13/*6N、*4/*6N、*11/*6N。由于3種基因型都是快代謝及慢代謝等位基因雜合子,3種基因型均推斷為NAT2中間代謝基因型。
剩余4項(xiàng)研究中,經(jīng)Phase 2.1軟件推斷結(jié)果與研究匯報(bào)推斷結(jié)果一致。
4.納入文獻(xiàn)中對(duì)照組NAT2基因型及等位基因信息匯總:對(duì)上述整理后的數(shù)據(jù)進(jìn)行匯總,提取單個(gè)研究中對(duì)照組NAT2基因型及等位基因數(shù)據(jù)(廣州-2011研究為結(jié)核病患者,該研究所有數(shù)據(jù)納入?yún)R總)構(gòu)建中國(guó)人群NAT2基因型數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)包含4010例個(gè)體的基因型數(shù)據(jù)匯總信息。(1)匯總數(shù)據(jù)中NAT2快代謝基因型、中間代謝基因型、慢代謝基因型總體頻率分別為25.79%(1034/4010)、50.87%(2040/4010)、23.34%(936/4010),NAT2非慢代謝基因型總體頻率為76.66%(3074/4010),具體見(jiàn)表3。(2)匯總數(shù)據(jù)中NAT2快代謝等位基因包括*4、*13、*11A、*12A、*12B、*12C,NAT2快代謝等位基因總體攜帶頻率為51.19%(4096/8002)。其中,*4等位基因占全部快代謝等位基因的96.92%(3970/4096);匯總數(shù)據(jù)中慢代謝等位基因包括*5、*6、*7、*10、*19,NAT2慢代謝等位基因總體攜帶頻率為48.81%(3906/8002),其中*5、*6、*7等位基因占所有慢代謝等位基因的99.90%(3902/3906),具體見(jiàn)表4。北京-2012研究[16]在北方人群中檢測(cè)到*10及*19等位基因,在該研究人群中的攜帶率均為0.93%(2/214)。
表3 納入研究文獻(xiàn)中NAT2基因型分布情況
表4 納入研究文獻(xiàn)中NAT2等位基因分布情況
5.不同方法推斷NAT2基因型效能:基于10篇文獻(xiàn)的所有能夠獲得精確基因型(雙體型)的NAT2多態(tài)性數(shù)據(jù),重建包含5448例NAT2基因型信息數(shù)據(jù)庫(kù)(表5),基于此數(shù)據(jù)庫(kù),對(duì)3SNP及2SNP法推斷NAT2代謝基因型的效能進(jìn)行評(píng)價(jià)。
表5 3SNP法及2SNP法推斷NAT2基因型結(jié)果
續(xù)表5
3SNP法采用341T→C、590G→A、857G→A等3個(gè)SNP位點(diǎn)對(duì)NAT2基因型進(jìn)行推斷。借鑒文獻(xiàn)報(bào)道中采用的積分法,每個(gè)位點(diǎn)如果為野生型純合子,則積0分,如果為雜合子則積1分,突變純合子則積2分,將上述3個(gè)位點(diǎn)所得積分相加,如果總分為0分,則推斷為NAT2快代謝型,如果總分為1分,則推斷為NAT2中間代謝型,積分≥2分,則推斷為NAT2慢代謝型。3SNP法推斷NAT2基因型共有4種基因型出現(xiàn)錯(cuò)誤,分別是*4/*6J、*4/*10、*4/*19、*6A/*19,總體推斷錯(cuò)誤率為0.22%(12/5448)。3SNP法推斷NAT2慢代謝基因型的敏感度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值、準(zhǔn)確度分別為99.92%、99.81%、99.36%、99.98%、99.83%;推斷NAT2快代謝基因型的敏感度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值、準(zhǔn)確度分別為100.00%、99.92%、99.80%、100.00%、99.94%(表6,7)。
表6 3SNP法推斷NAT2慢代謝基因型效能分析
表7 3SNP法推斷NAT2快代謝基因型效能分析
2SNP法利用2個(gè)SNP位點(diǎn)(282C→T、341T→C)推斷NAT2基因型。每個(gè)位點(diǎn)如果為野生型純合子,則積0分,如果為雜合子則積1分,突變純合子則積2分,將上述3個(gè)位點(diǎn)所得積分相加,總分為0分推斷為NAT2快代謝基因型,總分為1分推斷為NAT2中間代謝基因型,積分≥2分推斷為NAT2慢代謝基因型。2SNP法推斷NAT2基因型共有19種基因型出現(xiàn)推斷錯(cuò)誤,總體推斷錯(cuò)誤率為6.74%(367/5448)。2SNP法推斷NAT2慢代謝基因型的敏感度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值、準(zhǔn)確度分別為99.52%、98.36%、94.54%、98.66%、97.71%;推斷NAT2快代謝基因型的敏感度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值、準(zhǔn)確度分別為93.19%、96.01%、89.75%、97.41%、95.25%(表8,9)。
表8 2SNP法推斷NAT2慢代謝基因型效能分析
表9 2SNP法推斷NAT2快代謝基因型效能分析
將3SNP法及2SNP法推斷NAT2快、慢代謝基因型的效能進(jìn)行對(duì)比。經(jīng)McNemer檢驗(yàn),兩種方法推斷NAT2慢代謝基因型敏感度的差異無(wú)統(tǒng)計(jì)學(xué)意義(χ2=0.189,P=0.664),具有較高的一致性(Kappa=0.932,P<0.01)。兩種方法推斷NAT2快代謝基因型敏感度的差異有統(tǒng)計(jì)學(xué)意義(χ2=10.973,P=0.001),3SNP法推斷NAT2快代謝基因型時(shí)優(yōu)于2SNP法。
本研究納入10項(xiàng)研究,重建的NAT2數(shù)據(jù)庫(kù)在一定程度上可以反映中國(guó)人群NAT2基因型構(gòu)成情況。10項(xiàng)研究中對(duì)照組共4010例,非慢代謝基因型占到了所有人群的76.7%,快、慢等位基因分別占51.19%及48.81%。在中國(guó)人群中,NAT2基因型分布以非慢代謝型為主。
除了常見(jiàn)的NAT2慢代謝等位基因*5、*6、*7外,在北京-2012[16]研究中檢測(cè)到*10及*19等位基因。*19等位基因最早由日本學(xué)者發(fā)現(xiàn)[24],190C→T(rs1805158)突變使NAT2基因第64位的精氨酸變成了色氨酸,導(dǎo)致NAT2酶活性的下降。通過(guò)在中國(guó)漢族基因組數(shù)據(jù)庫(kù)查詢(xún),rs1805158位點(diǎn)在我國(guó)漢族人群中堿基T總體攜帶率為0.146%,在北京、河南、江蘇、貴州、陜西5個(gè)地市均檢測(cè)到堿基T攜帶者,攜帶率分別為0.12%、0.089%、0.209%、2.08%、0.059%。*10等位基因?qū)?yīng)的是rs72554617(499G→A),該突變使NAT2基因第167位的谷氨酸變成了賴(lài)氨酸,導(dǎo)致NAT2酶活性的下降。rs72554617位點(diǎn)在我國(guó)漢族人群中堿基A總體攜帶率為0.049%,在北京、上海、陜西、陜西、河南等9個(gè)地市均檢測(cè)到堿基A攜帶者,以安徽省攜帶率最高(0.45%),其余地市攜帶率均低于0.15%。
采用既往文獻(xiàn)中報(bào)道的3SNP積分法對(duì)重建數(shù)據(jù)庫(kù)中的樣本進(jìn)行推斷,所有46種NAT2基因型中,共有4種基因型推斷錯(cuò)誤,分別是*4/*6J、*4/*10、*4/*19、*6A/*19,總體推斷錯(cuò)誤率為0.22%。錯(cuò)誤原因分為2類(lèi),其中,*10、*19等位基因存在499G→A和190C→T突變,這使得在使用3SNP方法對(duì)*4/*10、*4/*19基因型推斷時(shí),將中間代謝型錯(cuò)誤地推斷為快代謝型,而*6A/*19慢代謝型推斷為中間代謝型。另一類(lèi)推斷錯(cuò)誤是由于*6J等位基因的存在,基因型為*4/*6J的個(gè)體3SNP推斷法積分為2分,3SNP法將該種基因型推斷為慢代謝型。針對(duì)此種情況,如果受檢者通過(guò)3SNP法檢測(cè)結(jié)果為T(mén)T、AG、AG,則該個(gè)體可能的基因型為*4/*6J或者*6/*7,其抗結(jié)核治療異煙肼用量可根據(jù)異煙肼血藥濃度檢測(cè)結(jié)果進(jìn)行調(diào)整。
當(dāng)SNP檢測(cè)對(duì)341T→C、590G→A、857G→A等3個(gè)位點(diǎn)檢測(cè)結(jié)果為CT、AG、GG或CT、GG、AG或TT、AG、AG或CT、AG、AG等4種情況時(shí),理論上可能NAT2基因型為中間代謝型或者慢代謝型。但在本研究構(gòu)建的數(shù)據(jù)庫(kù)中僅出現(xiàn)*4/*6J這一種基因型,其他理論上存在的3種檢測(cè)結(jié)果在納入的3項(xiàng)研究中并未檢測(cè)到。另外,筆者進(jìn)一步查詢(xún)了人類(lèi)NAT2等位基因庫(kù),并未發(fā)現(xiàn)341T→C、590G→A、857G→A等3個(gè)位點(diǎn)同時(shí)為突變位點(diǎn)的NAT2等位基因。因此,如果樣本檢測(cè)為CT、AG、AG,3SNP法計(jì)算得分為3分,則按照目前人類(lèi)NAT2等位基因庫(kù)的數(shù)據(jù)推斷該個(gè)體可確定為NAT2慢代謝型。
采用既往文獻(xiàn)中報(bào)道的2SNP積分法對(duì)數(shù)據(jù)庫(kù)中的樣本進(jìn)行推斷,所有46種NAT2基因型中,共有19種基因型出現(xiàn)錯(cuò)誤,總體推斷錯(cuò)誤率為6.74%,遠(yuǎn)高于3SNP法的推斷錯(cuò)誤率(0.22%)。2SNP法推斷NAT2基因型的基礎(chǔ)是SNP位點(diǎn)590G→A和857G→A與282C→T存在連鎖不平衡,人群中282C→T一般伴隨590G→A或857G→A中的一種出現(xiàn)。因此,當(dāng)個(gè)體中檢測(cè)到282C→T時(shí),可以認(rèn)為該個(gè)體攜帶590G→A或857G→A,此2種突變與*6及*7相對(duì)應(yīng)。但在中國(guó)人群中,根據(jù)本研究結(jié)果看,282C→T與590G→A或857G→A之間的關(guān)聯(lián)強(qiáng)度并不高,282C→T也與*12或*13 相關(guān)聯(lián)。因此,2SNP法會(huì)將攜帶*13或*12等位基因的個(gè)體錯(cuò)誤推斷為攜帶*6或*7等位基因,導(dǎo)致了較高的推斷錯(cuò)誤率。2SNP法推斷性能在不同人群中存在較大差異,考慮與不同人群*13或*12等位基因攜帶比例有關(guān),在*12及*13等位基因攜帶比例較高的人群中,2SNP法推斷NAT2基因型效能較差。
筆者對(duì)3SNP及2SNP法推斷NAT2基因型的效能進(jìn)行了比較。在中國(guó)人群中推斷NAT慢代謝基因型時(shí),3SNP法與2SNP法推斷結(jié)果一致性較好;但推斷NAT2快代謝基因型時(shí),3SNP法推斷NAT2基因型總體效能優(yōu)于2SNP法。
本次納入研究中有3項(xiàng)研究的NAT2基因多態(tài)性檢測(cè)采用PCR直接測(cè)序法,7項(xiàng)研究基于有限SNP檢測(cè)的結(jié)果進(jìn)行NAT2基因型推斷。為了確保數(shù)據(jù)的準(zhǔn)確性,本文在7項(xiàng)研究結(jié)果NAT2基因型數(shù)據(jù)的基礎(chǔ)上采用Phase 2.1軟件進(jìn)行了驗(yàn)證,最大限度保證了NAT2基因型推斷結(jié)果的正確性。個(gè)別研究中部分樣本未能明確匯報(bào)NAT2基因亞型信息,因此,在對(duì)NAT2推斷方法進(jìn)行評(píng)價(jià)時(shí),刪除了這部分?jǐn)?shù)據(jù)。盡管本研究納入了5448例樣本構(gòu)建數(shù)據(jù)庫(kù),研究群體涉及北京、上海、廣州等多個(gè)地區(qū),但相對(duì)于我國(guó)龐大的人口數(shù)量,納入的樣本數(shù)據(jù)仍不能完全反映中國(guó)人群NAT2基因多態(tài)性特點(diǎn)。因此,本研究的結(jié)論需更大樣本的研究驗(yàn)證。另外,納入研究中研究人群大部分以漢族為主,故尚需明確少數(shù)民族人群的NAT2基因型分布情況。
綜上所述,本研究中NAT2基因型數(shù)據(jù)庫(kù)的建立能夠?yàn)榕R床工作中NAT2基因分型工作提供參考。由于不同人群NAT2基因型分布和構(gòu)成具有地域性差異,在*10、*19等罕見(jiàn)等位基因攜帶率較高地區(qū),增加對(duì)190C→T和499G→A位點(diǎn)的檢測(cè)可以提高NAT2基因型推斷的準(zhǔn)確性。綜合考慮3SNP法與2SNP法推斷NAT2基因分型效能的差異,建議在中國(guó)人群中采用3SNP法推斷NAT2基因型。
利益沖突所有作者均聲明不存在利益沖突
作者貢獻(xiàn)王寧:醞釀和設(shè)計(jì)實(shí)驗(yàn)、實(shí)施研究、采集數(shù)據(jù)、分析/解釋數(shù)據(jù)、起草文章、統(tǒng)計(jì)分析;鄭璐瑤:實(shí)施研究、采集數(shù)據(jù)、分析/解釋數(shù)據(jù)、起草文章、統(tǒng)計(jì)分析;孟秀娟:分析/解釋數(shù)據(jù)、對(duì)文章的知識(shí)性?xún)?nèi)容作批評(píng)性審閱、統(tǒng)計(jì)分析、指導(dǎo);劉海婷:實(shí)施研究、采集數(shù)據(jù)、支持性貢獻(xiàn);丁楊明:采集數(shù)據(jù)、分析/解釋數(shù)據(jù)、對(duì)文章的知識(shí)性?xún)?nèi)容作批評(píng)性審閱、統(tǒng)計(jì)分析;姚蓉:實(shí)施研究、采集數(shù)據(jù);郭少晨:實(shí)施研究、分析/解釋數(shù)據(jù)、對(duì)文章的知識(shí)性?xún)?nèi)容作批評(píng)性審閱;陸宇:醞釀和設(shè)計(jì)實(shí)驗(yàn)、實(shí)施研究、對(duì)文章的知識(shí)性?xún)?nèi)容作批評(píng)性審閱、獲取研究經(jīng)費(fèi)、行政和技術(shù)及材料支持、指導(dǎo)