王 強(qiáng),李衛(wèi)真 ,張永云
(1.云南農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院,云南 昆明 650201;2.云南農(nóng)業(yè)大學(xué)農(nóng)科專(zhuān)業(yè)基礎(chǔ)實(shí)驗(yàn)教學(xué)中心,云南 昆明 650201)
由于單核苷酸多型性在醫(yī)藥上的重要性,美國(guó)國(guó)家衛(wèi)生研究院(NIH)提供約三千萬(wàn)美元的經(jīng)費(fèi)給序列定序中心,進(jìn)行搜尋并定位人類(lèi)單核苷酸多型性(SNPs)的計(jì)劃,定位一百萬(wàn)個(gè)人類(lèi)的SNPs。由各大藥廠等組成的單核苷酸多型性協(xié)會(huì)(TSC)也出資尋找定位出約三十萬(wàn)個(gè)人類(lèi)的SNPs。現(xiàn)有的人類(lèi)SNPs總數(shù)約為2421261個(gè),這個(gè)數(shù)字還會(huì)繼續(xù)增加。至于其他物種的SNPs就不是那么熱門(mén),目前還不超過(guò)700筆。這是因?yàn)槠渌锓N的基因體相關(guān)定序計(jì)劃(如基因體解序、EST解序、SNP尋找及定位)本來(lái)就比人類(lèi)基因體相關(guān)的定序計(jì)劃少和慢,畢竟人類(lèi)基因體相關(guān)的定序計(jì)劃對(duì)我們來(lái)說(shuō)才是最重要最有用的。在臺(tái)灣地區(qū),以基因體研發(fā)為主軸的賽亞基因科技公司,已于2002年7月完成了亞洲人種的單一核苷酸多型性(SNP)數(shù)據(jù)庫(kù)初稿,接下來(lái)的目標(biāo)將針對(duì)肝炎、哮喘、乳癌、Ⅱ型糖尿病等亞洲地區(qū)的多發(fā)性疾病,積極進(jìn)行相關(guān)的基因體研究,包括臨床基因體學(xué)、微衛(wèi)星基因定型分析、SNP定型分析、高效能定序、基因微數(shù)組及生物信息多項(xiàng)中心等。
化學(xué)家Lieber和遺傳學(xué)家Housman的夢(mèng)幻組合創(chuàng)造了一項(xiàng)簡(jiǎn)單的新技術(shù),即應(yīng)用原子壓力顯微鏡(AFM)觀察SNP。首先設(shè)計(jì)一個(gè)寡核苷酸探針能與你要找的基因組區(qū)域嚴(yán)格匹配,將此探針與一大分子如鏈霉抗生物素偶聯(lián),讓此探針與DNA片段進(jìn)行雜交。如果探針雜交成功,那么用AFM進(jìn)行觀察就能發(fā)現(xiàn)雜交陽(yáng)性位點(diǎn)。此方法相比傳統(tǒng)方法的一個(gè)明顯優(yōu)點(diǎn)就是能夠?qū)伪扼w基因組進(jìn)行檢測(cè)。當(dāng)數(shù)個(gè)探針同時(shí)在數(shù)百Kb的距離上進(jìn)行搜索,再加上自動(dòng)分析,那么SNP的相關(guān)性研究恐怕就能大大地向前邁進(jìn)一步了。
SNPs即單核苷酸多態(tài)性(SNPs)是指基因組水平上由單個(gè)核苷酸的變異所引起的DNA序列多態(tài)性,包括單個(gè)堿基的轉(zhuǎn)換、顛換、插入和缺失等。從理論上來(lái)看每一個(gè)SNPs位點(diǎn)都可以有4種不同的變異形式,但實(shí)際上發(fā)生的只有兩種,即轉(zhuǎn)換和顛換,二者之比為2∶1。一般而言,SNP是指變異頻率大于1%的單核苷酸變異。
在遺傳學(xué)分析中,SNPs作為一類(lèi)遺傳標(biāo)記得以廣泛應(yīng)用,主要源于這幾個(gè)特點(diǎn)∶
2.1 密度高 SNPs在人類(lèi)基因組的平均密度估計(jì)為10000bp,在整個(gè)基因組的分布達(dá)3×106個(gè),遺傳距離為2~3cm,密度比微衛(wèi)星標(biāo)記更高,可以在任何一個(gè)待研究基因的內(nèi)部或附近提供一系列標(biāo)記。
2.2 富有代表性 某些位于基因內(nèi)部的SNPs有可能直接影響蛋白質(zhì)結(jié)構(gòu)或表達(dá)水平,因此,它們可能代表疾病遺傳機(jī)理中的某些作用因素。
2.3 遺傳穩(wěn)定性 與微衛(wèi)星等重復(fù)序列多態(tài)性標(biāo)記相比,SNPs具有更高的遺傳穩(wěn)定性。
2.4 易實(shí)現(xiàn)分析的自動(dòng)化 SNPs標(biāo)記在人群中只有兩種等位型,故也稱(chēng)為雙等位標(biāo)記。這樣在檢測(cè)時(shí)只需一個(gè)“+/-”或“全/無(wú)”的方式,而無(wú)需像檢測(cè)限制性片段長(zhǎng)度多態(tài)性、微衛(wèi)星那樣對(duì)片段的長(zhǎng)度作出測(cè)量,這使得基于SNP的檢測(cè)分析方法易實(shí)現(xiàn)自動(dòng)化。
用目前的方法每年可以檢測(cè)出上千個(gè)基因中的SNP,而其成本會(huì)隨著技術(shù)和手段的不斷成熟而大大降低,同時(shí)檢出率也不斷提高。由于具有以上特點(diǎn),SNPs已成為繼RFLP(限制性片段長(zhǎng)度多態(tài)性)、微衛(wèi)星多態(tài)標(biāo)記后的第三代分子遺傳標(biāo)記。
人們對(duì)SNPs的研究方法進(jìn)行了許多探索和改進(jìn)。SNPs分析技術(shù)按其研究對(duì)象主要分為兩大類(lèi):(1)對(duì)未知SNPs進(jìn)行分析,即尋找未知的SNP或確定某一未知SNPs與某種遺傳病的關(guān)系。檢測(cè)未知SNPs有許多種方法可以使用,如溫度梯度凝膠電泳(TGGE)、變性梯度凝膠電泳(DGGE)、單鏈構(gòu)象多態(tài)性(SSCP)、變性的高效液相色譜檢測(cè)(DHPLC)、限制性片段長(zhǎng)度多態(tài)性(RFLP)、隨機(jī)擴(kuò)增多態(tài)性DNA(RAPD)等,但這些方法只能發(fā)現(xiàn)含有SNPs的DNA鏈,不能確知突變的位置和堿基類(lèi)別,要想做到這一點(diǎn),必須對(duì)那些含有SNPs的DNA鏈進(jìn)行測(cè)序。(2)對(duì)已知SNPs進(jìn)行分析,即對(duì)不同群體的SNPs遺傳多樣性進(jìn)行檢測(cè)或在臨床上對(duì)已知致病基因的遺傳病進(jìn)行基因診斷。篩查已知SNPs的方法有等位基因特異寡核苷酸片段分析(ASO)、突變錯(cuò)配擴(kuò)增檢驗(yàn)(MAMA)、基因芯片技術(shù)(gene chips)等。各種SNPs的檢測(cè)方法區(qū)別很大,但迄今為止還沒(méi)有任何一種方法是萬(wàn)能的,在實(shí)際應(yīng)用時(shí)要根據(jù)研究目的、實(shí)驗(yàn)室設(shè)備與技術(shù)條件等進(jìn)行選擇。每種SNPs的檢測(cè)方法都由兩部分組成,即區(qū)分SNPs特異位點(diǎn)的原理和數(shù)據(jù)的檢測(cè)分析手段。
傳統(tǒng)SNP檢測(cè)方法包括DNA測(cè)序、限制性片段長(zhǎng)度多態(tài)性(RFLP)、單鏈構(gòu)象多態(tài)性、變性梯度凝膠電泳、陣列雜交分析、同源雜交、直接測(cè)序法等。新興的方法包括TaqMan探針技術(shù)、基因芯片技術(shù)等。其中基因芯片技術(shù)具有高通量、簡(jiǎn)便快捷、平行化和成本低廉等優(yōu)點(diǎn),且芯片技術(shù)的高密度探針矩陣可為大規(guī)模SNP分型提供一個(gè)高效檢測(cè)途徑。芯片技術(shù)平臺(tái)包括微球微點(diǎn)陣,纖維薄膜微點(diǎn)、玻璃片基微點(diǎn)陣芯片等,其探針密度跨越范圍從幾百至上百萬(wàn)不等,其中GoldenGateTM所使用的微球芯片密度可達(dá)100萬(wàn),Affymetrix SNP芯片密度近200萬(wàn),可見(jiàn)芯片技術(shù)的探針密度可無(wú)限擴(kuò)增。而高通量的大規(guī)模SNPs篩選,其瓶頸之處在于DNA的制備方法與制備技術(shù),而非雜交平臺(tái)的選擇。
SNP標(biāo)記已應(yīng)用于牛、豬、羊等家畜的遺傳學(xué)研究中。在牛的遺傳研究中,SNP標(biāo)記主要應(yīng)用于數(shù)量性狀座位的定位。在牛的生長(zhǎng)、肉質(zhì)、產(chǎn)奶等數(shù)量性狀的研究中,SNP技術(shù)取得了一些明顯的成就。SNP在制作高密度的遺傳圖譜上也有著極大的應(yīng)用價(jià)值。QTL信息在育種上的高效應(yīng)用則要求圖譜間距精確到幾厘米,這樣才能識(shí)別出QTL變異的堿基,高密度SNPs遺傳圖譜的出現(xiàn)使育種工作者能夠更精確地進(jìn)行標(biāo)記輔助選擇和品種資源、品種純度的鑒定。目前,在牛的生長(zhǎng)發(fā)育、瘦肉率、肉質(zhì)、產(chǎn)仔率等性狀方面,SNP研究取得了較為明顯的進(jìn)步。
SNP作為第三代遺傳標(biāo)記,在復(fù)雜疾病的基因定位、關(guān)聯(lián)分析、個(gè)體疾病易感性分析與藥物基因組學(xué)等的研究中發(fā)揮著越來(lái)越重要的作用。
4.1 致病基因定位 SNP是一種可以早期檢測(cè)的突變,可用于疾病的連鎖分析。人大約有300萬(wàn)個(gè)SNP,且分布于全基因組,已知或未知致病基因附近都可能找到眾多的SNP位點(diǎn)。因此,SNP可以作為致病基因的遺傳標(biāo)記。
4.2 易感基因的檢出 不同個(gè)體或群體對(duì)疾病的易感性有著很大的不同。在全基因組范圍內(nèi)比較易感和非易感人群之間的SNP圖譜,有可能獲得易感人群基因組的結(jié)果特點(diǎn),并通過(guò)關(guān)聯(lián)分析或連鎖不平衡分析指導(dǎo)尋找易感基因。
4.3 在藥物基因組學(xué)中的應(yīng)用 通過(guò)檢測(cè)SNP的遺傳多態(tài)性標(biāo)記,揭示人群中不同個(gè)體對(duì)不同藥物的敏感性差異的根本原因,從而對(duì)醫(yī)生針對(duì)性的用藥和藥物的開(kāi)發(fā)提供指導(dǎo)依據(jù)。
SNP雖然列于基因體學(xué)的范疇內(nèi),但若能結(jié)合多重學(xué)科,將可發(fā)展個(gè)體化醫(yī)學(xué),也就是針對(duì)個(gè)人基因特質(zhì)的醫(yī)藥方式。除了人類(lèi)基因組的DNA序列數(shù)據(jù)以外,尚需藥物遺傳學(xué)、臨床藥理學(xué)、毒理學(xué)、生物信息學(xué)、蛋白質(zhì)體學(xué)等的參與。蛋白質(zhì)體學(xué)的研究目標(biāo)是確定所有的機(jī)體內(nèi)蛋白質(zhì)與蛋白質(zhì)間的相互關(guān)系,可望對(duì)個(gè)體化醫(yī)學(xué)的發(fā)展作出重大貢獻(xiàn);而決定個(gè)體間蛋白質(zhì)差異的基因就在于SNP。大規(guī)模的SNP分型需要準(zhǔn)確可靠的檢測(cè)方法作為技術(shù)支持,所以在未來(lái)的SNP發(fā)展中,建立一種快速、準(zhǔn)確、可靠且成本低廉的方法是SNP分型的發(fā)展方向,例如一些商用的檢測(cè)試劑盒已經(jīng)出現(xiàn)。隨著SNP技術(shù)的不斷成熟,將會(huì)對(duì)疾病診斷、治療和預(yù)防帶來(lái)革命性的進(jìn)步。
[1]Yoshiura K,Kinoshita A,Ishida T,et al.A SNP in the ABCC11 gene is the determinantofhuman earwax type[J].Nature Genet,2006,(38):324-330.
[2]Brookes A J.The essence of SNPs[J].Gene,1999,234(2):177-186.
[3]Olivier M,Chuang L M,Chang M S,et al.High throughput genotyping of single nucleotide polymorphisms using new biplex invader technology[J].Nucleic Acids Res.,2002:30-33.
[4]Woolley A T,Guillemette C,Cheung C L,et al.Direct haplotyping of kilobase-size DNA using carbon nanotube probes[J].Nature Biotechnol,2000,(18):760-763.
[5]Marsh S,Kwok P,McLeod H L.SNP databases and pharmacogenetics:great start,but a long way to go[J].Hum.Mutat,2002,(20):174-179.