王晨陽,王 璐,張銳虎,余婧婧,宋國華,陳朝陽*
(1.山西醫(yī)科大學實驗動物中心,太原 030001;2.山西省實驗動物與人類疾病動物模型重點實驗室,太原 030001)
單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)是指由單個核苷酸在基因組水平發(fā)生變異造成DNA序列多態(tài)性,這種變異包括單個堿基的轉(zhuǎn)換、顛換、缺失、插入共四種情況,但主要以轉(zhuǎn)換和顛換為主,二者出現(xiàn)的比例為2∶1[1]。轉(zhuǎn)換指嘌呤堿基A與G、嘧啶堿基T與C之間相互替代,顛換則是嘌呤和嘧啶堿基之間(C A,G T,C G,A T)的替換,當這種變異在群體中所占比例大于等于1%時即為SNP[2]。常見的SNP基本上屬于二等位多態(tài)性,即DNA序列中的4類堿基中某2類堿基之間的變異,其既可以出現(xiàn)在基因編碼區(qū),也可以出現(xiàn)在非編碼區(qū),雖然發(fā)生在編碼區(qū)的概率相對較小,但會影響基因的功能,導致生物性狀改變,在遺傳性疾病的研究中具有非常重要的意義。全基因組關聯(lián)分析(GWAS)以整個基因組的SNP為分子標記,在全基因組水平上進行相關性分析,從中找到影響某一性狀的變異基因或SNP關鍵位點[3]。SNP作為第三代遺傳標記,其分布密度高,遍布于整個動物和人類基因組中;與功能基因具有高度關聯(lián)性;突變率低,遺傳穩(wěn)定性強;檢測通量高便于自動化分析[4]。因此廣泛應用于生物學、農(nóng)學、醫(yī)學、生物進化等眾多領域,同時在分子遺傳學、藥物遺傳學、法醫(yī)學以及疾病的預測、診斷和治療等方面也發(fā)揮著重要作用。某些SNP位點并不直接與疾病基因的表達相關聯(lián),但因為它與某些致病基因相鄰,所以成為重要的遺傳標記。本文旨在介紹SNP標記位點在動物遺傳育種以及人類疾病動物模型中的應用。
在分子層面研究物種遺傳多樣性主要基于物種基因組之間結(jié)構(gòu)變異的檢測,基因組之間的結(jié)構(gòu)變異主要在遺傳變異上體現(xiàn),其中最重要的遺傳變異是SNP。李銀銀等[5]采用基質(zhì)輔助激光解吸電離飛行時間質(zhì)譜(MALDI-TOF-MS) 技術對來自國家嚙齒類實驗動物種子中心的2個ICR群體(北京、上海)和1個KM封閉群(上海)小鼠樣本的45個SNPs進行群體遺傳結(jié)構(gòu)分析,這3個群體的遺傳多樣性雜合度結(jié)果為SKM>BICR>SICR,可以認為KM小鼠的遺傳多樣性高于北京和上海的ICR小鼠群體。趙紫霞等[6]利用57 K SNP芯片檢測了來自不同地域的6個虹鱒養(yǎng)殖群體(黑龍江虹鱒、黑龍江金鱒、四川虹鱒、四川金鱒、北京虹鱒和北京金鱒),共獲得有效SNP位點50201個,分析得出這6個養(yǎng)殖群體中有顯著離群個體存在,即這些群體的遺傳背景不均一,為我國虹鱒的種質(zhì)資源評估、本土化良種培育、制種和引種工作提供了基因組水平的參考信息。Nicoloso等[7]用Goat SNP50 BeadChip對14個意大利山羊群體(VAL、 CAM、SAA、ORO、BIO、VPS、 CGI、TER、ASP、NIC、ARG、GIR、MAL、SAR、SAM)共354個樣本進行基因分型,最終得到51136個有效SNP位點,結(jié)果顯示,F(xiàn)st值的變化范圍為0.013~0.164,其中NIC群體的近交系數(shù)(FIS)值有顯著性差異,即該群體中有較多的純合子。 應用SNP標記對不同種群進行群體結(jié)構(gòu)分析,評估群體的遺傳多樣性,可以為特殊種群的資源培育提供依據(jù),同時也為推測群體的進化關系提供參考。
遺傳圖譜即遺傳連鎖圖譜,是通過遺傳重組交換結(jié)果進行連鎖分析所得到的基因在染色體上相對位置的排列圖,遺傳圖譜上SNP位點越多,分布越均勻,性狀基因定位就越精確。Du等[8]構(gòu)建了首張凡納濱對蝦SNPs連鎖圖譜,該圖譜共包含1344個SNPs標記位點,其中45個與性別相關的平均連鎖群中含有418個SNPs,同一連鎖群平均連鎖不平衡程度為0.15,且不平衡水平隨著標記間距的減少而增加,有一個數(shù)量性狀定位(QTL)與性別相關,該遺傳圖譜為以后蝦基因組學的研究奠定了基礎。鄭先虎等[9]用簡單重復序列標記(SSR)和SNP標記構(gòu)建了鯉魚的連鎖圖譜并對體長(SL)、體高(H)、體厚(BT)和體長/體高(SLH)進行了QTL定位分析,發(fā)現(xiàn)有14個QTL分布在7個連鎖群上,其中3個與體高相關(P<0.01),2個與體厚相關(P<0.05),2個與體長/體高相關(P<0.05)。Xie等[10]首次利用LEP MAP構(gòu)建了南方鲇(Silurusmeridionalis)RAD-SNP遺傳圖譜,該圖譜包括29個連鎖群,26714個SNPs,其中有效位點有6715個,圖譜全長5918.31cM,平均標記間隔為0.89 cm,遺傳圖譜的構(gòu)建為南方鲇在比較基因組學、QTL、選擇性育種等方面的研究提供了重要的依據(jù)。SNP遺傳穩(wěn)定性較高,遺傳連鎖圖譜的構(gòu)建可以將物種中與某一特定性狀相關的基因準確定位在染色體上。
遺傳標記是指用于區(qū)分不同個體和群體并且可以穩(wěn)定遺傳的物質(zhì)或性狀,分子遺傳標記穩(wěn)定性高,信息含量大,受環(huán)境因素影響小,其變異只與DNA序列的差異有關,可以監(jiān)測到形態(tài)學上無法發(fā)現(xiàn)的差異。
1.3.1 生長性狀相關功能標記
SNP標記穩(wěn)定性好,易于進行基因分型,且不受環(huán)境、性別、生長發(fā)育等的限制,可以縮短世代間隔、提高選擇強度,在一定程度上促進了分子標記輔助育種的發(fā)展。梁國明等[11]對3個母豬品種共計328個個體采用直接測序法克隆ZP4基因中的SNP位點,共檢測到27個SNPs,其中A268T位點在3個母豬群體中均與總產(chǎn)仔數(shù)顯著關聯(lián)(P<0.05),A268T在長白豬和大白豬群體中與產(chǎn)活仔數(shù)顯著關聯(lián)(P<0.05),T2950C與A268T緊密連鎖但該位點突變與產(chǎn)仔數(shù)關聯(lián)不明顯,ZP4基因可以作為豬產(chǎn)仔數(shù)的候選標記。陳小明等[12]利用Illumina HiSeqTM2500測序平臺對40個大黃魚樣本(20尾耐高溫和20尾不耐高溫)進行簡化基因組測序,共篩選到38個與大黃魚耐高溫性狀顯著相關的SNPs位點,定位每個SNP位點在大黃魚基因組中的位置發(fā)現(xiàn)38個SNPs附近有26個已知的功能基因,這些基因主要與細胞轉(zhuǎn)錄、代謝、免疫等功能相關,該定位可為大黃魚耐高溫分子機制研究及耐高溫品種的選育提供標記。齊傳翔等[13]從136頭大白母豬和47頭長白母豬耳組織中提取基因組DNA,通過PCR-測序檢測CBR1基因不同拷貝形式的多態(tài)位點,分析發(fā)現(xiàn)長白豬中的SNPs位點與繁殖性能無相關性,但大白豬中有5個SNPs位點與產(chǎn)仔數(shù)呈顯著性相關,CBR1基因可以作為大白豬繁殖性能選育的候選基因。胡培麗等[14]在研究SNP與小鼠(615、DBA/2 J、C3H /HeJ、C57BL /6 J、BALB /cJ5和F1(615 ×C3H)共6個品系)生化標記基因Car2、Gpi1多態(tài)性關聯(lián)分析中發(fā)現(xiàn),6個不同品系小鼠中Car2基因DNA、cDNA中有3個SNP可以作為Car2a/b多態(tài)相關性標記;Gpil基因cDNA水平有2個SNP可以作為Gpila/b多態(tài)性標記。
1.3.2 抗病性相關功能標記
分子遺傳標記與動物抗病性育種的結(jié)合極大程度地推進了動物疾病的研究,為進一步分離鑒定抗性單基因以及轉(zhuǎn)基因動物的發(fā)展奠定了基礎。Tan等[15]通過對3個鯰魚家系進行GWAS,發(fā)現(xiàn)了6個與鯰魚腸道敗血癥抗病性相關的基因組區(qū)域分布在4個連鎖群上,在其中3個基因組區(qū)域發(fā)現(xiàn)了顯著的QTL,位于1號和26號連鎖群上,此外,Tan S等人在1號連鎖群上確定了10個相關基因(asb10,scnn1a,mylk,ccr7,crhr1,nlrc3,adcy2,ptprj,nlrp12和tmeff1)。柴欣等[16]在團頭魴的MHCIIα基因上篩選獲得21個抗原結(jié)合位點,其中有4個位點發(fā)生變異,變異率為19.05%,經(jīng)分析發(fā)現(xiàn)團頭魴MHCIIα基因的多態(tài)性和抗細菌性敗血癥呈顯著性關聯(lián)。王文浩等[17]在京海黃雞4號和10號染色體上檢測到與禽流感抗體滴度相關的SNPs位點,其中10號染色體上的SNPs位點在Nsun7(RNA甲基轉(zhuǎn)移酶家族基因)內(nèi)部,與細胞增殖分化、蛋白質(zhì)合成等有關,可作為該雞禽流感抗病性狀的候選基因。Naderi等[18]將6744個荷斯坦—弗里生牛個體分成不同的數(shù)據(jù)集來研究隨機森林(RF)和基因輔助BLUP法對基因組預測的準確性,用50 K SNP對樣本基因組分型,通過RF對SNPs進行顯著性關聯(lián)分析發(fā)現(xiàn)GPAT3和CYP2R1可作為臨床乳房炎的潛在候選基因;SpIK5和SLC26A2是爪病的潛在候選基因,F(xiàn)GF12是子宮內(nèi)膜炎候選基因。酮癥是高產(chǎn)奶牛中常見的代謝疾病,Kroezen等[19]對653頭加拿大荷斯坦奶牛進行單SNP關聯(lián)分析,發(fā)現(xiàn)15個SNPs可作為酮癥遺傳標記,6個易感基因發(fā)生突變造成該牛酮癥易感性。
SNP標記輔助選擇是從分子遺傳層面發(fā)現(xiàn)性狀的遺傳差異或與QTL連鎖的遺傳標記,從核酸水平研究遺傳物質(zhì),鑒定基因功能并進行相關通路機制的分析。生長性狀和抗病性相關功能標記是目前動物研究中應用最廣的遺傳標記,可以精確定位到單個堿基的變異與表型性狀的關聯(lián)性分析。
準確判定個體間的親緣關系在育種實踐中具有重要作用。余國春[20]用Illumina Porcine SNP60芯片對杜洛克豬、長白豬和約克夏豬三個家豬品種和一個野豬品種(藏豬)及其雜種后代長大二雜豬、杜長大三雜豬、杜藏二雜豬共24個個體進行SNP分型及全基因組掃描,用SNP標記對全部24個樣本進行親緣鑒定,得到2個三代的血緣關系和1個兩代的血緣關系系譜,置信度可達99.99%。郭立平[21]篩選了50個SNPs位點對西門塔爾牛群體進行親子鑒定,該標記組合的MAF為0.4818、預期雜合度(He)為0.4998、多態(tài)信息含量(PIC)的平均值為0.3748,當母本基因型不確定時其累計排除概率為0.9989,該結(jié)果可以糾正系譜圖,提高遺傳評定的準確性。Edea等[22]采用綿羊Infinium HD SNP (600 K)芯片對埃塞爾比亞五種不同表型(Arsi-Bale,Horro,Adilo,Menz和Blackhead Somali)的綿羊群體進行基因分型,最小等位基因頻率分別為(0.19±0.16),(0.21±0.16),(0.20±0.16),(0.21±0.16),(0.20±0.16);觀測雜合度(Ho)分比為0.30,0.30,0.30,0.33,0.31; He分別為0.29,0.31,0.30,0.31,0.30;篩選40770個SNP位點構(gòu)建系統(tǒng)發(fā)育樹,結(jié)果表明Arsi-Bale和Horro這兩個群體的親緣關系最近。對于動物而言,親緣關系代表演化關系,通過SNP分型技術可以較直觀地分析同一物種中不同品種的進化程度以及品種間的演化關系。在物種的育種實踐中親緣關系的鑒定對于系譜劃分意義重大。
雜種優(yōu)勢指不同種群的個體間雜交所培育的后代在生長、繁殖、環(huán)境適應等方面在一定程度上優(yōu)于其親本純繁殖群體的現(xiàn)象,優(yōu)勢效應作為雜種優(yōu)勢的遺傳機制之一,是由同一位點的等位基因相互作用后產(chǎn)生,其廣泛應用于動物雜交育種中。Akanno等[23]結(jié)合Illumina Bovine SNP50芯片基因分型數(shù)據(jù),采用兩種不同的方法對6794個加拿大雜交肉牛樣本的生長性狀和胴體性狀進行雜種優(yōu)勢預測,這兩種方法與雜種優(yōu)勢成線性關系,結(jié)果顯示,肉牛生長性狀遺傳力范圍為0.30~0.64,胴體性狀遺傳力范圍為0.26~0.45(遺傳力值在0.1左右時表示低遺傳力,0.2~0.3表示中等遺傳力,0.4以上則稱為高遺傳力),生長性狀表現(xiàn)出明顯的雜交優(yōu)勢,而胴體性狀雜交優(yōu)勢不明顯。Amuzu-Aweh等[24]利用白來航雞全基因組SNP數(shù)據(jù),同時結(jié)合表型數(shù)據(jù)(統(tǒng)計產(chǎn)蛋數(shù)和蛋重)預測該雞雜交后代產(chǎn)蛋性狀的雜種優(yōu)勢理論期望,雜種優(yōu)勢的預測在個體水平取得了突破。通過分子標記來估計群體之間的遺傳距離,然后根據(jù)遺傳距離預測兩個群體雜交后F1代雜種優(yōu)勢程度,在預測結(jié)果的基礎上改進育種手段后可以使農(nóng)畜產(chǎn)品獲得顯著增長。
常見的遺傳性大都由多個致病基因共同作用引起,同時受環(huán)境因素影響。對這類疾病用簡單的家系研究的方法無法在家族中精確定位患病個體和正常個體,而利用生物信息學對正常個體和患病個體的相關數(shù)據(jù)進行SNP特征分類才可以確定各個基因?qū)膊〉挠绊懗潭萚25]。近年來雖然發(fā)現(xiàn)了許多與疾病相關聯(lián)的變異基因,但基因多態(tài)性與疾病發(fā)生的關系及基因間相互作用機制尚未明確,因此,在動物模型中進行相關研究已成為當前的熱點。
糖尿病屬于慢性非感染性疾病,該疾病的發(fā)生與機體內(nèi)分泌代謝紊亂有關,可嚴重影響心腦血管系統(tǒng)、泌尿系統(tǒng)以及神經(jīng)系統(tǒng)的正常功能[26]。柳明玉等[27]以37個人類2型糖尿病易感位點為基礎,采用GWAS在食蟹猴基因組相應的同源區(qū)域篩查出食蟹猴2型糖尿病遺傳標記,以提高動物模型構(gòu)建的成功率,最后共鑒定出13個在對照組和模型組中存在顯著性差異的SNPs位點。LEW.1AR1-iddm大鼠是自發(fā)性1型糖尿病動物模型,該鼠1號染色體上存在易感位點iddm,Arndt等[28]對iddm位點進行SNP分析,發(fā)現(xiàn)該位點第一個區(qū)域的Dock8基因44號位發(fā)生外顯子突變,導致谷氨酰胺突變成谷氨酸;第二個區(qū)域Vwa2基因11號位發(fā)生外顯子突變導致該位點翻譯的蛋白質(zhì)由精氨酸突變?yōu)樯彼?。Dock8基因突變與人類1型糖尿病發(fā)病機制極其相似,從基因角度為1型糖尿病的臨床研究提供了基礎。SNP遺傳標記可以直接監(jiān)測到與糖尿病相關的致病基因的某些位點的變異情況,對糖尿病發(fā)病機制的進一步深入研究提供了有力的支撐。
目前營養(yǎng)過剩和肥胖已經(jīng)成為全球性健康問題,5~12歲是兒童和青少年肥胖發(fā)病率最高的階段,幼時肥胖可增加成年后患慢性疾病的風險,國際癌癥機構(gòu)研究報告顯示:在成年人群體中肥胖可誘導食管腺癌、胃賁門癌、結(jié)腸癌、直腸癌,肝癌、膽囊癌、胰腺癌等癌癥的發(fā)生[29-30]。Stachowiak等[31]報道了在不同品種的豬肥胖模型中,眾多肥胖相關標記基因中只有FTO和MC4R基因與人類肥胖顯著性相關。FTO基因負責編碼核蛋白α-酮戊二酸依賴的雙加氧酶,該基因中的一些連鎖不平衡SNPs位點與人類BMI指數(shù)升高密切相關;MC4R基因編碼G蛋白偶聯(lián)的跨膜蛋白,負責機體食欲控制、能量穩(wěn)態(tài)和體重調(diào)節(jié)。Mankowska等[32]首次在拉布拉多犬肥胖模型中對TNF、RITN和IL6基因的多態(tài)性進行研究,發(fā)現(xiàn)在TNF基因中有12個SNPs,RITN基因中有8個SNPs,IL6基因中有4個SNPs,TNF基因中的其中兩個SNPs與人類肥胖易感性關聯(lián)性極高。肥胖相關基因SNP位點關聯(lián)性標記從基因本質(zhì)出發(fā),可將突變精確到點,以射線的方式對肥胖疾病進行探索研究。
Smyth line (SL)雞是自身免疫性白癜風唯一的疾病動物模型,這種動物模型可以表現(xiàn)出人類自身免疫性白癜風所有的臨床表現(xiàn)和生物學特征。Jang等[33]應用Illumina測序技術結(jié)合Red Jungle Fowl基因組序列組裝對SL雞進行重測序,在SL雞中發(fā)現(xiàn)ADAMTS13、ASPM、ATP6V0A2、BRCA2、COL12A1、GRM5、LRP2、OBSCN、PLAU、RNF168、STAB2和XIRP1等156個與白癜風易感性相關的SNPs標記,這些位點主要在蛋白激酶、磷酸酶、泛素化等介導的通路機制中發(fā)揮作用,揭示了氨基酸突變與白癜風發(fā)生發(fā)展的潛在聯(lián)系。原發(fā)性開角型青光眼(POAG)是造成人類失明的主要原因,眼壓升高是該病發(fā)生的主要因素, Gelatt等[34]發(fā)現(xiàn)比格犬患POAG的概率很高,Kuchtey等[35]將比格犬作為疾病動物模型,通過全基因組SNPs分型后在比格犬20號染色體長4 Mb的單基因座上定位了疾病基因,該定位與之前報道的人類19號染色體上眼內(nèi)壓基因的QTL同源,在發(fā)現(xiàn)的與疾病關聯(lián)的54個SNPs中有8個位點發(fā)生突變,最終鑒定金屬蛋白酶ADAMTS10中的Gly661Arg突變體(甘氨酸突變成精氨酸)是POAG的重要候選基因。低鉀血癥會造成人肌無力、胃腸道平滑肌張力下降、心臟功能異常、代謝性堿中毒等,臨床上最常見的是人低鉀性周期性麻痹, Lantinga[36]在一只24月齡大的緬甸貓身上發(fā)現(xiàn)了低鉀血癥,是一種純合隱性遺傳病。Gandolfi等[37]使用貓Illumina 63 K ISEVITY DNA芯片在緬甸貓E1染色體上發(fā)現(xiàn)了低鉀血癥候選基因KCNH4和WNK4,并且揭示由于蛋白質(zhì)翻譯過程中的無義突變使WNK4中終止密碼子提前出現(xiàn),導致所編碼蛋白質(zhì)C末端缺乏卷曲螺旋結(jié)構(gòu)和Akt1/SGK磷酸化位點,影響K+的調(diào)節(jié)。
在動物模型中利用SNP標記發(fā)現(xiàn)疾病候選基因,然后經(jīng)過驗證分析和功能分析,可以準確的認識疾病的發(fā)生發(fā)展規(guī)律。
SNP篩選標記的應用將動物遺傳育種推向一個新的層次和高度,其克服了傳統(tǒng)育種的局限性,極大程度的提高了動物定向育種的效率。此外,SNP常與復雜性遺傳病致病基因相關聯(lián),對臨床疾病的預測、診斷以及治療有重大意義。首先建立人類疾病動物模型,然后對群體基礎上的大量DNA樣本進行基因分型,應用SNP分型技術找出致病基因,在動物模型中進行基因驗證,最后將結(jié)果應用于臨床研究中。目前SNP分型技術有測序法、酶學檢測法、雜交檢測法、液相質(zhì)譜法以及MALDI-TOF-MS,其中雜交檢測法中基因芯片技術的應用最廣泛,徐偉等[38]結(jié)合全基因組擴增技術和RCR-LDR分型技術,建立了小鼠冷凍物SNP遺傳鑒定方法,可更加快速準確的鑒定SNP位點的基因型。SNP分子標記多態(tài)性高、密度大、遺傳穩(wěn)定性高、易于實現(xiàn)自動化高通量基因分型,在表型與基因型關聯(lián)性研究中起重要作用。但現(xiàn)階段仍存在一些不足,現(xiàn)有的SNP分型技術不能同時滿足高程度自動化分析、反應靈敏精確、費用適度等要求,不過隨著SNP分型技術的不斷改進,各種疾病數(shù)據(jù)庫的逐步完善,SNP在動物資源遺傳育種和人類疾病動物模型中研究應用的廣度和深度將不斷推進。