劉鳳姣,郭麗文
(知識產(chǎn)權(quán)出版社有限責(zé)任公司,北京 100081)
精準(zhǔn)醫(yī)療是以個體化醫(yī)療為基礎(chǔ)并伴隨基因組測序技術(shù)以及生物信息與大數(shù)據(jù)科學(xué)的交叉應(yīng)用而發(fā)展起來的一種新型醫(yī)療模式?;驕y序是精準(zhǔn)醫(yī)療的基礎(chǔ),它為遺傳性疾病的診斷和治療帶來了新的機遇,為保障全民健康,降低出生缺陷和遺傳咨詢提供了良好依據(jù),同時也能產(chǎn)生一定的經(jīng)濟(jì)和社會效益。
從冗雜的測序數(shù)據(jù)中建立基因變異、疾病與臨床表型的聯(lián)系,是當(dāng)今的研究熱點。圍繞美國醫(yī)學(xué)遺傳學(xué)與基因組學(xué)學(xué)會制定的《遺傳變異分類標(biāo)準(zhǔn)與指南》(ACMG指南)[1]、遺傳相關(guān)數(shù)據(jù)庫、生物信息學(xué)軟件和具體案例探討判斷一個基因變異位點致病風(fēng)險的方法,為疾病尤其是遺傳疾病的診療提供參考依據(jù)。
ACMG指南將基因變異利用28條證據(jù)進(jìn)行5級分類,即致病的、可能致病的、意義不明確的、可能良性的和良性的。其中可能致病的和可能良性的是具有大于90%可能致病或者良性的變異,盡管90%是人為界定的,但是它給實驗室提供了一種共同的定義。致病性變異證據(jù)分為非常強(PVS1)、強(PS1~PS4)、中等(PM1~PM6)和輔助證據(jù)(PP1~PP5);良性變異證據(jù)分為獨立(BA1)、強(BS1~BS4)和輔助證據(jù)(BP1~BP7)。其中數(shù)字只作為分類標(biāo)注,不具有任何意義。根據(jù)5級分類規(guī)則可判斷基因變異導(dǎo)致疾病發(fā)生的可能性。例如,一個變異基因存在(1個PVS1+≥1個PS)證據(jù),或(1個PVS1+≥2個PM)證據(jù),則該變異屬于致病性變異,具體的規(guī)則可參照ACMG指南。
目前,人類基因組中發(fā)現(xiàn)了大量的變異和新的基因,并且被收錄到各大數(shù)據(jù)庫中,為基因測序與疾病分析提供了重要參考信息。常用的人群數(shù)據(jù)庫有 ExAC、dbSNP、1000 Genomes、ESP6500、dbVar和COSMIC等;疾病數(shù)據(jù)庫有OMIM、HGMD、ClinVar和DECIPHER等;序列數(shù)據(jù)庫有NCBI、RefSeqGene、LRG等[2-4]。人群數(shù)據(jù)庫可以用于分析某個變異在大規(guī)模人群中發(fā)生的頻率,如果某一等位基因頻率>5%,則其存在良性變異的獨立證據(jù)(BA1)。疾病數(shù)據(jù)庫主要包括人類疾病相關(guān)基因的突變信息,其中可能包括一些分類錯誤的變異,在用于臨床時,需要謹(jǐn)慎并追溯突變來源,確認(rèn)數(shù)據(jù)中的基因變異是否為患病原因。序列數(shù)據(jù)庫用于生物信息注釋,如基因位置、核苷酸、參考序列,使用參考序列時,應(yīng)該參照同一基因組版本,目前較常使用的基因組版本為GRCh37/hg19。
生物信息學(xué)以基因組DNA序列為分析源頭,利用信息學(xué)、應(yīng)用數(shù)學(xué)、統(tǒng)計學(xué)和計算機科學(xué)等從大量的數(shù)據(jù)中提取有用的生物學(xué)信息,進(jìn)行序列比對、基因識別與表達(dá)、蛋白質(zhì)結(jié)構(gòu)預(yù)測和表達(dá)以及建立進(jìn)化模型等?;谏镄畔W(xué)開發(fā)的各類預(yù)測軟件從核苷酸或氨基酸水平判斷一個變異可能產(chǎn)生的有害或無害影響,其主要預(yù)測錯義突變對蛋白功能或結(jié)構(gòu)產(chǎn)生的影響,剪接突變對內(nèi)含子和外顯子剪接產(chǎn)生的影響。常用的錯義突變預(yù)測軟件有 SIFT、PolyPhen-2、REVEL和 MutationTaster;剪接突變預(yù)測軟件有HSF、MaxEntScan、NetGene2和GeneSplicer[2,4-5]。各類預(yù)測軟件采用的算法不一樣,所以在基因變異數(shù)據(jù)分析過程中,應(yīng)該采用多種軟件組合分析,并且慎重應(yīng)用到臨床上。
結(jié)合具體基因變異位點分析如何得到一個有參考價值的基因檢測結(jié)果。以SCN1A基因錯義突變?yōu)槔琧hr2_166903480、NM_001165963、exon12、c.1177C>T(編碼區(qū)第1 177位核酸的胞嘧啶變異為胸腺嘧啶,會導(dǎo)致第393號氨基酸由精氨酸變異為半胱氨酸),父母均沒有檢測到此變異,屬于自發(fā)突變。
運用數(shù)據(jù)庫資源和生物信息預(yù)測軟件結(jié)合ACMG指南分析該SCN1A變異的致病性。根據(jù)表1得到PS1、PM2、PP3和PP5證據(jù),且該SCN1A變異屬于自發(fā)突變,存在PS2證據(jù),所以PS1+PS2+PM2+PP3+PP5≥2個PS證據(jù),此SCN1A變異為致病性變異,會產(chǎn)生癲癇相關(guān)的病癥。如果該變異位點沒有進(jìn)行家系驗證或者不是自發(fā)突變,即不存在PS2證據(jù),則該SCN1A變異為可能致病的變異。
臨床基因測序一般是為了確認(rèn)疾病原因,進(jìn)行腫瘤和遺傳性疾病的風(fēng)險評估、指導(dǎo)科學(xué)用藥以及輔助制定個性化治療方案等。鑒于一些遺傳疾病的復(fù)雜性,如果根據(jù)ACMG指南得到的結(jié)論是致病性的,但是當(dāng)基因變異產(chǎn)生的表型與患者的真實臨床表型不相符,此時就需重新分析,是否遺漏患者臨床信息或者患者對自身病癥有錯誤描述、測序數(shù)據(jù)是否可信、是否存在其他基因的共同作用等,不能只根據(jù)ACMG指南的致病性判斷而產(chǎn)生基因變異與疾病/臨床表型不匹配的結(jié)果。
基因檢測報告可以輔助臨床診斷,但其不能作為一個診斷報告,僅僅是一個參考數(shù)據(jù)。基因檢測報告中一般涵蓋主要的基因變異信息,繁多的變異位點容易給患者帶來恐慌,建議將臨床意義未明的變異進(jìn)行備注,清楚寫明這些變異可能造成的影響,那些與臨床不相關(guān)的重要基因,可以不放入被檢者報告中而作為原始數(shù)據(jù)發(fā)送給醫(yī)生或患者作為參考。對于健康體檢人群則要提前告知被檢者,檢測可能會發(fā)現(xiàn)與疾病相關(guān)的一些變異,但不代表一定會患病,其只僅僅反映了罹患某疾病的風(fēng)險,以便于早采取干預(yù)措施,預(yù)防疾病的發(fā)生。
表1 SCN1A基因變異分析結(jié)果
現(xiàn)階段基因檢測行業(yè)普遍采用的是第二代測序技術(shù),靶點多、通量高、數(shù)據(jù)量大、質(zhì)控參數(shù)多,所以送檢樣本的測序深度和數(shù)據(jù)質(zhì)量是把控重點。質(zhì)量合格的樣本、熟練的技術(shù)操作人員和每個操作流程規(guī)范化顯得尤為重要。隨著檢測樣本的增多,可以建立行業(yè)內(nèi)的我國人口的基因變異與疾病共享數(shù)據(jù)庫,積累基因變異信息,為后續(xù)的數(shù)據(jù)分析和疾病預(yù)防、診斷、用藥指導(dǎo)、康復(fù)等提供便利。