童筱君,李辰璐,王國芬,朱小春,王曉冰
1.臺(tái)州市中心醫(yī)院(臺(tái)州學(xué)院附屬醫(yī)院) 風(fēng)濕免疫科,浙江 臺(tái)州 318000;2.溫州醫(yī)科大學(xué)附屬第一醫(yī)院 風(fēng)濕免疫科,浙江 溫州 325015
強(qiáng)直性脊柱炎(ankylosing spondylitis,AS)是一種慢性炎癥性自身免疫性疾病,常導(dǎo)致脊柱疼痛、僵硬及終末期關(guān)節(jié)融合。AS的發(fā)病率依種族而異,在中國約為0.3%[1]。AS病因未明,被認(rèn)為與遺傳和環(huán)境相關(guān)[2-3],尤其是遺傳因素在AS發(fā)病中起著重要作用,其遺傳度超過90%[4-5]。
人類白細(xì)胞抗原(human leukocyte antigen B27,HLA-B27)是迄今為止所知的復(fù)雜疾病中相關(guān)性最強(qiáng)的一個(gè)等位基因[6]。國際AS遺傳學(xué)聯(lián)盟發(fā)現(xiàn)除了HLA-B27外,還有31個(gè)不同的基因位點(diǎn)被確定與AS相關(guān),大部分位于主要組織相容性復(fù)合體(major histocompatibility complex,MHC)區(qū)域。四種編碼位點(diǎn)的氨基肽酶在MHC I-肽復(fù)合物抗原遞呈通路中發(fā)揮作用[7],可能在AS的發(fā)病機(jī)制中起重要作用。國內(nèi)外已有大量關(guān)于ERAP1 和ERAP2 兩個(gè)氨基肽酶編碼位點(diǎn)的研究,以及將相關(guān)研究結(jié)果轉(zhuǎn)化為臨床治療的應(yīng)用[7-8]。而另一個(gè)與疾病相關(guān)的氨基肽酶編碼位點(diǎn)NPEPPS 在AS中的后續(xù)研究尚不足。本項(xiàng)目利用免疫芯片的數(shù)據(jù)和二代RNA-Seq技術(shù)對疾病相關(guān)NPEPPS基因的遺傳變異進(jìn)行eQTL分析,探討NPEPPS在AS發(fā)病和進(jìn)展中的作用。
1.1 對象 選取溫州醫(yī)科大學(xué)附屬第一醫(yī)院風(fēng)濕免疫科收治的54例AS患者作為AS組,78例健康對照者為對照組。AS組所有患者均符合1984年紐約分類標(biāo)準(zhǔn)[9]。本研究經(jīng)溫州醫(yī)科大學(xué)附屬第一醫(yī)院倫理委員會(huì)批準(zhǔn),所有患者簽署了知情同意書。
1.2 免疫芯片基因定型 從入選者5 mL全血中分離出外周血單個(gè)核細(xì)胞(peripheral blood mononuclear cells,PBMCs),提取DNA,用Illumina平臺(tái)進(jìn)行單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)微陣列的基因定型檢測,基因型被定位到人類基因組NCBI Build 37(hg 19)。用已知的基因型預(yù)測未知的基因型并對缺失的數(shù)據(jù)進(jìn)行補(bǔ)缺(imputation)和SNP的選擇。樣本的基因型用PLINK格式(ped和map),提供患者ID和基因組每個(gè)SNP的堿基。用PLINK提取包含NPEPPS的染色體區(qū)域的SNPs(Chr17,hg 19)。產(chǎn)生每個(gè)SNP的次要等位基因頻率(minor allele frequencies,MAF),并用MAF>0.3來進(jìn)行SNP的剔除。Map文件上的SNP位點(diǎn)被轉(zhuǎn)換到hg 19,去除標(biāo)志SNPs。利用參考基因組的SNP數(shù)據(jù),根據(jù)鄰近的變異位點(diǎn)間的連鎖不平衡(linkage disequilibrium,LD)來推斷未定型的SNPs。在補(bǔ)缺之前用SHAPEIT和IMPUTE2進(jìn)行缺失基因型的補(bǔ)缺,用info<0.5 來去除補(bǔ)缺較差的SNPs。用PLINK計(jì)算免疫芯片的基因型,并設(shè)定窗包括所有與疾病相關(guān)SNPs(rs9901869)相關(guān)性R2>0.1,以便進(jìn)行后續(xù)的分析。用PLINK抽取這些SNPs,將基因型從等位基因?qū)D(zhuǎn)換為最小等位基因計(jì)數(shù)(0、1或2,分別代表主要基因型、雜合基因型和次要基因型)。剩余的MAF>0.01的SNPs被分成不同的組,每組都與補(bǔ)缺的SNPs密切相關(guān)(即組內(nèi)R2=1),這若干組不同的SNPs將進(jìn)入后面的分析。
1.3 RNA測序方法 將RNA從PBMCs樣本中提取出來,反轉(zhuǎn)錄成cDNA,用Illumina TruSeq標(biāo)準(zhǔn)的全RNA樣本試劑盒預(yù)處理,在Illumina平臺(tái)進(jìn)行測定。用TopHat version 2.0.6獲得的短read定位到人類基因組NCBI Build 37(hg 19)。對齊的read應(yīng)用于HTSeq,產(chǎn)生每個(gè)基因的read計(jì)數(shù),這可以作為經(jīng)過read多樣性校正后的基因表達(dá)的測定。來源一個(gè)基因的不同轉(zhuǎn)錄產(chǎn)物,差異來源于轉(zhuǎn)錄起始/終止位點(diǎn),外顯子、內(nèi)含子及非翻譯區(qū)的包含與否。用Cufflinks suit來匯編read到融合的個(gè)體轉(zhuǎn)錄文件中,獲得參考轉(zhuǎn)錄組。用RSEM來將read排列到參考轉(zhuǎn)錄序列中去,來計(jì)算同種型的表達(dá)豐度。
1.4 eQTL分析方法 計(jì)算正態(tài)化和模型驗(yàn)證:DESeq2是R語言中一種差異基因表達(dá)分析的程序包,用于RNA-Seq計(jì)數(shù)數(shù)據(jù)的應(yīng)用。用內(nèi)部的函數(shù)將計(jì)數(shù)數(shù)據(jù)正態(tài)化,并觀察其大小和水平層次,判斷序列的多樣性。轉(zhuǎn)錄本的計(jì)數(shù)用DESeq2正態(tài)化,并提取轉(zhuǎn)錄產(chǎn)物。每個(gè)同種型的FASTA序列用Cufflinks的gffread程序獲得。用NCBI網(wǎng)站(Madden,2002)的基礎(chǔ)局部比對工具(BLAST)來跟人類基因組比對,提供外顯子不同或者3’或者5’UTR異常的特征信息。GLME模型用于檢驗(yàn)基因型對轉(zhuǎn)錄表達(dá)的效應(yīng)。用Wilcoxon符號(hào)秩和檢驗(yàn)來檢測轉(zhuǎn)錄表達(dá)在AS組和對照組間的差別?;蛐秃娃D(zhuǎn)錄產(chǎn)物比率用線性模型進(jìn)行驗(yàn)證,并對疾病狀態(tài)進(jìn)行校正。
1.5 統(tǒng)計(jì)學(xué)處理方法 采用R v3.6.1 for Linux軟件包進(jìn)行統(tǒng)計(jì)學(xué)分析。2 組間比較用秩和檢驗(yàn),用Wald test計(jì)算DESeq2的P值。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 SNP rs9901869 不同基因型對應(yīng)的NPEPPS中TCONS_00206150轉(zhuǎn)錄本和NPEPPS的表達(dá)比較 對2組進(jìn)行免疫芯片基因分型和RNA測序的NPEPPS表達(dá)水平分析,純合等位基因頻率和雜合等位基因頻率,2組間NPEPPS及其TCONS_00206150轉(zhuǎn)錄本表達(dá)的差異無統(tǒng)計(jì)學(xué)意義(P>0.05),見圖1。
圖1 SNP rs9901869不同基因型對應(yīng)的NPEPPS中TCONS_00206150轉(zhuǎn)錄本和NPEPPS的表達(dá)水平
2.2 2組NPEPPS 不同的轉(zhuǎn)錄本的表達(dá)情況 12種NPEPPS 不同的轉(zhuǎn)錄本的表達(dá)密度見圖2;2組不同的轉(zhuǎn)錄本的表達(dá)水平各不相同,其中2組在TCONS_00206150、TCONS_00206153和TCONS_00206137的表達(dá)水平間差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖3。
2.3 SNP rs9901869不同基因型下NPEPSS基因及其轉(zhuǎn)錄本表達(dá)水平比較 SNP rs9901869 不同基因型所對應(yīng)的NPEPSS基因及其轉(zhuǎn)錄本的表達(dá)水平各不相同;其中部分轉(zhuǎn)錄本,如EFCAB13、TCONS_00206150、TCONS_00206157、TCONS_00206153、TCONS_00206137和TCONS_00206130 2組的NPEPSS基因及其轉(zhuǎn)錄本表達(dá)差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖4。
2.4 SNP rs180677251 基因型的NPEPPS 基因及其轉(zhuǎn)錄本的表達(dá)比較 對主導(dǎo)SNP rs9901869 和附近1 MB范圍內(nèi)的基因的eQTL分析,發(fā)現(xiàn)SNP rs180677251不同的基因型所對應(yīng)的NPEPPS基因及其轉(zhuǎn)錄本TCONS_00206137的表達(dá)水平差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖5。
圖2 12種NPEPPS 不同轉(zhuǎn)錄本的表達(dá)密度圖
圖3 2組NPEPPS 不同轉(zhuǎn)錄本的表達(dá)水平比較
到目前為止,尚未發(fā)現(xiàn)與健康對照組相比,AS患者疾病相關(guān)的氨基肽酶表達(dá)有顯著變化的證據(jù)[10-11]。而NPEPPS 是編碼嘌呤霉素敏感性氨基肽酶的基因。NPEPPS 在大多數(shù)組織中以胞質(zhì)氨基肽酶的形式表達(dá),但在大腦中也發(fā)現(xiàn)了一種與膜相關(guān)的形式[12-13],是目前已知的唯一能剪切polyQ序列的胞漿氨基肽酶[14]。鼠模型研究發(fā)現(xiàn)神經(jīng)退行性疾病中該基因的過表達(dá)能使蛋白聚集減少,增強(qiáng)自噬作用[15]。而在AS患者的回腸活檢中發(fā)現(xiàn)自噬的證據(jù),并被證實(shí)是IL-23 在腸道表達(dá)的驅(qū)使者[16]。NPEPPS是否通過自噬作用或者其他機(jī)制作用于細(xì)胞內(nèi)肽的處理,仍需要深入探討。至今為止,AS基因表達(dá)研究尚未發(fā)現(xiàn)NPEPPS存在基因與基因之間的相互作用[17]。雖然已經(jīng)發(fā)現(xiàn)一個(gè)與AS疾病相關(guān)的位于NPEPPS基因的關(guān)鍵SNP rs9901869[18],但是這個(gè)SNP對NPEPPS的基因表達(dá)是否具有調(diào)控作用,以及是否存在其他與AS疾病相關(guān)的SNP能影響NPEPPS基因表達(dá),尚不明確。故本項(xiàng)目通過免疫芯片基因分型技術(shù)和RNA測序技術(shù),探討AS患者和健康對照者NPEPPS基因上的SNP rs9901869的基因型與NPEPPS基因表達(dá)水平之間的關(guān)系,發(fā)現(xiàn)AS疾病風(fēng)險(xiǎn)等位基因的基因型與NPEPPS基因及其不同轉(zhuǎn)錄本的表達(dá)水平相關(guān)。進(jìn)一步揭示了NPEPPS的基因位點(diǎn)多態(tài)性影響了NPEPPS的表達(dá)水平。鑒于NPEPPS在疾病發(fā)病中的潛在作用,推測NPEPPS的eQTL調(diào)控可能與AS的發(fā)病相關(guān)。
圖4 不同SNP rs9901869 的基因型下NPEPSS 基因及其轉(zhuǎn)錄本的表達(dá)比較
圖5 SNP rs180677251 基因型的NPEPPS 基因及其轉(zhuǎn)錄本的表達(dá)比較
將基因型信息和基因表達(dá)數(shù)據(jù)進(jìn)行配對分析,有助于闡明遺傳變異對一個(gè)基因轉(zhuǎn)錄模式的影響,即表達(dá)數(shù)量性狀基因座。當(dāng)這些變異也能顯示出疾病相關(guān)性時(shí),它們將有助于證明單個(gè)SNP在疾病發(fā)病中的作用。如果這些SNPs干擾了那些被細(xì)胞器識(shí)別并參與mRNA的產(chǎn)生和DNA基序的加工過程,將會(huì)影響附近基因的表達(dá)(cis-eQTLs),或其他相互關(guān)聯(lián)通路上的基因表達(dá)(trans-eQTLs)[19-20]。隨著二代測序技術(shù)的進(jìn)展,RNA測序(RNA-Seq)為eQTL分析提供了一個(gè)絕好的平臺(tái),使高通量的基因組至轉(zhuǎn)錄檢測都得以實(shí)現(xiàn)。跟傳統(tǒng)的基因芯片不同,RNAseq可以提供更多單基因源轉(zhuǎn)錄產(chǎn)物的編碼序列,而這個(gè)差異可能是由于剪接位點(diǎn)不同、外顯子的包含與否或3’和5’非翻譯區(qū)的交替所引起[21]。這些信息可以檢測到影響mRNA剪接前的那些變異(sQTLs),而這些變異可能造成同一基因在細(xì)胞中表達(dá)出完全不同功能的異構(gòu)體。本研究發(fā)現(xiàn)在AS和健康對照者中NPEPSS不同的轉(zhuǎn)錄本的表達(dá)水平各不相同,其中TCONS_00206150、TCONS_00206153和TCONS_00206137的表達(dá)水平差異顯著。SNP rs9901869 及其附近的SNP rs180677251的不同基因型所對應(yīng)的NPEPSS基因及其轉(zhuǎn)錄本的表達(dá)水平各不相同,進(jìn)一步證實(shí)AS中基因型可能影響基因表達(dá)的推論。
本研究的缺陷是進(jìn)行基因研究的樣本數(shù)相對較少,雖然這些樣本能夠檢測出大量SNPs,但是仍需要大量樣本的研究證實(shí)本研究結(jié)果。本研究中發(fā)現(xiàn)AS和健康對照者中AS相關(guān)SNP rs9901869與NPEPPS表達(dá)的直接關(guān)系仍無法確定,仍需要進(jìn)一步通過細(xì)胞和(或)動(dòng)物模型進(jìn)一步驗(yàn)證。
通過對AS和正常人免疫基因的研究,發(fā)現(xiàn)除了HLA-B27以外可能還有其他更復(fù)雜的遺傳學(xué)背景和環(huán)境因素參與疾病的發(fā)生和進(jìn)展,比如說與免疫炎癥性疾病相關(guān)的SNP有關(guān),以及還有一些與MHC I-肽復(fù)合物抗原遞呈通路相關(guān)的基因位點(diǎn)變異有關(guān),進(jìn)一步揭示了AS發(fā)病中參與的重要基因位點(diǎn)和關(guān)鍵信號(hào)通路,有助于探討AS發(fā)病的潛在機(jī)制,為今后的靶向治療提供了依據(jù)。