王璐茜 陳志博 鄭曉露
[摘要] 目的 通過分析帕金森病患者與健康人基因芯片數據,尋找差異基因及其關鍵通路。 方法 利用GEO數據庫中高通量基因芯片數據庫篩選出帕金森病患者與健康對照的芯片。采用GO基因功能注釋和KEGG通路富集分析,篩選出帕金森病的特征基因簇和通路,并進行蛋白質相互作用網絡可視化分析。 結果 篩選出15個差異基因及7個關鍵節(jié)點蛋白。經差異基因分析后,發(fā)現神經絲、網格蛋白包被組裝及多巴胺受體信號通路富集程度最高。 結論 本研究利用生物信息學方法,從不同的角度研究帕金森病的遺傳學背景,在基因層面為帕金森病的診斷學標志與精準治療提供新的思路。
[關鍵詞] 帕金森病;差異基因;通路富集分析;生物信息學分析
[中圖分類號] R742.5 ? ? ? ? ?[文獻標識碼] A ? ? ? ? ?[文章編號] 1673-9701(2020)12-0001-04
[Abstract] Objective To find out the differential genes and their key pathways by analyzing the gene microarray data of Parkinson's patients and healthy people. Methods The high-throughput gene chip database in the GEO database was used to screen the chips of Parkinson's patients and healthy controls. Go gene function annotation and KEGG pathway enrichment analysis were used, the characteristic gene clusters and pathways of Parkinson's disease were screened, and the network visualization analysis of protein interaction was performed. Results 15 differential genes and 7 key node proteins were screened. After differential gene analysis, it was found that neurofilament, clathrin-coated assembly, and the degree of dopamine receptor signaling pathway enrichment were the highest. Conclusion This study uses bioinformatic methods to study the genetic background of Parkinson's disease from different perspectives, and provides new ideas for the diagnostic markers and precise treatment of Parkinson's disease at the genetic level.
[Key words] Parkinson's disease; Differential genes; Pathway enrichment analysis; Bioinformatic analysis
帕金森?。≒arkinsons disease,PD)是最常見的神經退行性疾病之一,亦是最為常見的運動障礙疾病。該病在65歲以上人群中患病率約為1%,在80歲以上人群中患病率高達約4%[1,2]。帕金森病的臨床特征以運動障礙最為顯著,包括運動遲緩、肌強直、姿勢反射消失以及靜止性震顫[3]。其典型病理特征是中腦黑質多巴胺能神經元的丟失,和殘存神經元內異常蛋白包涵體即路易小體(Lewy body,LB)和路易突起(Lewy neurite,LN)的形成。其中,路易小體的主要成分是α-突觸核蛋白(α-synuclein,α-syn)[1,4]。PD的病理機制尚未明確,目前最主流的假說認為:在不利因素的誘導下,神經元內的α-syn首先從單體或四聚體聚集為異常寡聚體,而后逐步形成多聚體、淀粉樣纖維,最終聚集形成路易小體[5,6]。于此同時,有越來越多的基因被發(fā)現與PD尤其是家族性PD的發(fā)病有關,包括SNCA、LRRK2、VPS35、EIF4G1、DNAJC13和CHCHD2[7,8]。然而,目前已有的帕金森病相關基因的研究仍未幫助我們找到PD的確切發(fā)病機制及有效的病因治療方法,以左旋多巴為首的藥物對癥治療仍是PD的主要治療手段[7]。因此,本研究旨在通過生物信息學的方法,對不同數據庫中的PD基因信息進行整合、分析,從而找到PD中的差異表達基因(differentially-expressed gene,DEG)及其相關通路,為探索PD的遺傳學病因和發(fā)病機制提供新的證據,現報道如下。
1 資料與方法
1.1 差異表達基因篩選
利用NCBI(National center for biotechnology information)平臺下的GEO數據庫進行DEG篩選。在GEO數據庫中以“Parkinsons disease”、“Homo sapiens”、“tissue”為關鍵詞搜索基因序列,排除微小RNA、線粒體DNA、非體內腦組織取材標本等相關數據,最終有3個數據集入選:GSE8397、GSE28894和GSE 20164。其中,GSE8397的數據出自GPL96平臺,來源于24例PD患者和13例健康對照的紋狀體樣本;GSE28894的數據來源于15例PD患者和 15例健康對照的紋狀體樣本;GSE20164的數據來源于6例PD患者和5例健康對照的紋狀體黑質樣本。利用在線工具GEO2R(https://www.ncbi.nlm. nih.gov/geo/geo2r/)分析各個數據集,選取P<0.05,|logFC|>1的基因為候選差異基因。三個數據集中選取出的差異基因取交集,篩選出DEG?;蚩s寫列表見表1。
1.2 基因功能注釋與通路富集分析
利用DAVID生物信息資源數據庫(https://david.ncifcrf. gov/,版本6.8)中在線分析工具,以人源基因為背景進行GO(Gene ontology)和KEGG(Kyoto encyclopedia of genes and genomes)通路富集,設定P<0.05。
1.3 蛋白相互作用網絡分析
利用Cytoscape 3.5.1(版本6.8)的蛋白相互作用網絡分析插件MCODE(Version 1.4.2,Bader Lab,University of Toronto)對構建的生物學網絡中的區(qū)域進行關聯度分析。通過分析網絡結構,根據關聯積分值,可獲得整個網絡中可能形成的蛋白質簇和關鍵節(jié)點蛋白,并在Cytoscape中進行可視化顯示。
2 結果
2.1 帕金森病中差異表達基因的篩選
經過對GEO數據庫的檢索,以下三個數據集的數據被納入本研究:GSE8397、GSE28894和GSE20164。通過對該三個數據集中對照組與PD組之間的比較分析,分別確定了362、884和573個DEG,隨后從中綜合篩選出15個共同差異表達的基因,分別是RALYL、SYNGR3、NEFH、RGS4、HMP19、NEFL、CALY、CHGB、SYT1、INA、SLC18A2、FGF13、NSG1、GABBR2、STMN2。見圖1。
2.2 DEG的基因功能注釋與通路富集分析
選取“2.1”中所篩選出的DEG,利用DAVID生物信息資源數據庫中在線分析工具,以人源基因為背景進行GO(Gene ontology)和KEGG(Kyoto Encyclopedia of genes and genomes)通路富集,得出顯著富集的基因功能24項及通路1條(P<0.05)。見表2。其中有3項基因功能富集因子較高、差異最為顯著,分別是神經絲、網格蛋白包被組裝及多巴胺受體信號通路,見封三圖1;其涉及到的基因包括:INA、NEFH、NEFL、CALY、NSG1、HMP19。
2.3 蛋白相互作用網絡可視化分析
通過對蛋白-蛋白相互作用進行評分,作出可視化網絡,基于前述基因富集通路的蛋白相互作用構建網絡。見圖 2。從該網絡中找出蛋白質簇及其中的關鍵節(jié)點蛋白,分別為NEFL、CALY、RALYL、CHGB、STMN2、SYNGR3、SYT1。見圖3。
3 討論
作為最常見的運動障礙疾病,帕金森病對患者(尤其是疾病晚期患者)的運動功能及生活質量造成了廣泛而巨大的負面影響。然而,近幾十年對帕金森病的大量研究仍未完全明確該病的發(fā)病機制,亦無法提供有效的病因治療。
本研究通過GEO數據庫檢索獲得了3個數據集中帕金森病患者基因芯片共45例,將其與健康患者進行比較,通過對基因芯片進行表達譜差異分析,基因功能注釋和通路富集,最終篩選出帕金森病發(fā)病機制中的重要信號通路,并對其蛋白相互作用進行可視化作圖。
本研究發(fā)現,PD的差異基因在神經絲、網格蛋白包被組裝及多巴胺受體信號通路這三項基因功能中富集程度最高、差異最為顯著。CALY、NSG1、HMP19這三個差異基因,則同時與多巴胺受體信號通路和網格蛋白包被組裝有關。其中,NSG1與CALY(又名NSG3)同屬神經元富含核內體蛋白(neuron-enriched endosomal protein)系,參與淀粉樣蛋白前體的水解、軸突轉運等多種功能[9]。值得關注的是,神經元內的α-突觸核蛋白(α-synuclein,α-syn)聚集為異常寡聚體后逐步形成多聚體、淀粉樣纖維,最終聚集形成Lewy小體,是目前主流公認的PD發(fā)病機制[5]。NSG1與CALY作為PD的差異基因,同時與淀粉樣蛋白前體的水解作用有關,提示二者在PD發(fā)病過程中可能具有重要作用。另外,CALY亦是本研究中蛋白相互作用網絡中的關鍵節(jié)點蛋白。CALY主要位于前額皮質及背側紋狀體區(qū)多巴胺D1受體表達的椎體細胞中,參與多巴胺相關通路并與D1受體上的多巴胺活性有關,同時與D1受體存在著直接的相互作用[10,11]。而黑質致密部中多巴胺能神經元的丟失正是帕金森病的基本病理特點之一[1,12]。經查閱,目前PD領域中尚無關于CALY、NSG1基因及其編碼蛋白的研究,其在PD發(fā)病機制中究竟有何作用,在PD治療領域有何價值,仍亟待更多的研究證實。
除CALY外,NEFL是本文在基因功能注釋與蛋白相互作用網絡可視化分析同時找出的另一個PD差異基因。近3年,外周血及腦脊液中NEFL蛋白濃度與帕金森綜合征之間的聯系逐漸引起了學界的重視。有研究曾對腦脊液NEFL濃度在PD診斷中的作用進行系統分析并發(fā)現,PD、帕金森病癡呆(Parkinsons disease dementia,PDD)、路易體癡呆(Dementia with lewy bodies,DLB)這三類病患者的腦脊液NEFL水平與健康人相仿,而多發(fā)性硬化(Multiple system atrophy,MSA)、進行性核上性麻痹(Multiple system atrophy,PSP)與皮質基底節(jié)變性(Corticobasal syndrome of suspected tau underlying pathology,CBS)這三類疾病患者的腦脊液NEFL水平則有明顯升高,因此腦脊液NEFL濃度將有希望用以鑒別PD及其他非典型的帕金森病綜合征[13]。另有研究表明,外周血中的NEFL水平具有相似的鑒別診斷作用[14]。與此同時卻有研究發(fā)現PD患者的外周血NEFL水平與其癡呆水平呈正相關[15-17]。一篇于2019年最新發(fā)表的論文更是進一步提出,PD患者的外周血及腦脊液中的NEFL水平均遠高于正常人[17]。結合本文結果,盡管NEFL在PD發(fā)病過程中的作用并不明確,該蛋白在幫助我們更加精準診斷與治療帕金森病方面可能存在著巨大的價值。
SYNGR3是本研究篩選出的關鍵節(jié)點蛋白之一,位于神經元中的多巴胺相關轉運體,表達于紋狀體、海馬體、小腦及中腦多巴胺能神經元等部位[18]。在PC12和MN9D細胞中,SYNGR3的表達不僅與多巴胺轉運體(dopamine transporter,DAT)活性呈相關性,且可以被囊泡單胺轉運體2(vesicular monoamine transporter type2,VMAT2)抑制劑利血平所阻斷[19]。有研究發(fā)現PD患者和PD小鼠的黑質中SYNGR3都存在著顯著的降低[20,21]。
以上2個差異基因與1個關鍵節(jié)點蛋白與PD發(fā)病之間的聯系已經得到了體內及體外實驗數據的支持,而其余差異基因與關鍵節(jié)點蛋白在PD尚無類似的研究,亟待RT-PCR和Western blot實驗在臨床樣本中進一步驗證。受數據庫數據所限,本研究也存在一定的局限性。本文采用的GEO數據庫僅提供mRNA水平的數據,其蛋白表達與mRNA轉錄一致性仍有待明確。因此,帕金森病的特征基因仍需更深入的數據支持。
綜上所述,本研究利用多種生物信息學方法從不同的角度研究帕金森病的遺傳學背景,在基因層面為帕金森病患者的診斷學標志與精準治療提供新的思路。
[參考文獻]
[1] Lees AJ,Hardy J,Revesz T. Parkinson's disease[J]. Lancet (London, England),2009,373(9680):2055.
[2] Lau LMD,Breteler MM. Epidemiology of Parkinson's disease[J]. Proceedings of the Royal Society of Medicine,2006,5(6):525-535.
[3] Thomas B,Beal MF. Parkinson's disease[J]. Human Molecular Genetics,2007,16(R2):R183-R194.
[4] Dehay B,Bourdenx M,Gorry P,et al. Targeting α-synuclein for treatment of Parkinson's disease:Mechanistic and therapeutic considerations[J]. Lancet Neurology,2015, 14(8):855-866.
[5] Shahmoradian SH,Genoud C,Graff-Meyer A,et al. Lewy pathology in Parkinson's disease consists of a crowded organellar membranous medley[J]. bioRxiv,2017.
[6] Lashuel HA,Overk CR,Oueslati A,et al. The many faces of alpha-synuclein:From structure and toxicity to therapeutic target[J]. Nature Reviews Neuroscience,2013, 14(1):38-48.
[7] Kalia LV,Lang AE. Parkinson's disease[J]. Lancet(London,England),2015,386(9996):896-912.
[8] Bras J,Guerreiro R,Hardy J. SnapShot:Genetics of Parkinson's disease[J]. Cell,2015,160(3):570-571.
[9] Muthusamy N,Chen YJ,Yin DM,et al. Complementary roles of the neuron-enriched endosomal proteins NEEP21 and calcyon in neuronal vesicle trafficking[J]. J Neurochem,2015,132(1):20-31.
[10] Lezcano N,Mrzljak L,Eubanks S,et al. Dual signaling regulated by calcyon,a D1 dopamine receptor interacting protein [J]. Science,2000,287(5458):1660-1664.
[11] Bensmann W,Zink N,Arning L,et al. Dopamine D1,but not D2,signaling protects mental representations from distracting bottom-up influences[J]. Neuroimage,2020, 204:116243.
[12] Goedert M,Neurodegeneration. Alzheimer's and Parkinson's diseases:The prion concept in relation to assembled Abeta,tau,and alpha-synuclein[J]. Science(New York,NY),2015,349(6248):1255555.
[13] Andersen AD,Binzer M,Stenager E,et al. Cerebrospinal fluid biomarkers for Parkinson's disease—A systematic review[J]. Acta Neurol Scand,2017,135(1):34-56.
[14] Hansson O,Janelidze S,Hall S,et al. Blood-based NfL:A biomarker for differential diagnosis of parkinsonian disorder[J]. Neurology,2017,88(10):930-937.
[15] Lin YS,Lee WJ,Wang SJ,et al. Levels of plasma neurofilament light chain and cognitive function in patients with Alzheimer or Parkinson disease[J]. Sci Rep,2018,8(1):17368.
[16] Zerr I,Schmitz M,Karch A,et al. Cerebrospinal fluid neurofilament light levels in neurodegenerative dementia:Evaluation of diagnostic accuracy in the differential diagnosis of prion diseases[J]. Alzheimers Dement,2018, 14(6):751-763.
[17] Oosterveld LP,Verberk IMW,Majbour NK,et al. CSF or serum neurofilament light added to α-Synuclein panel discriminates Parkinson's from controls[J]. Mov Disord,2020,35(2):288-295.
[18] Belizaire R,Komanduri C,Wooten K,et al. Characterization of synaptogyrin 3 as a new synaptic vesicle protein[J].J Comp Neurol,2004,470(3):266-281.
[19] Ega?觡a LA,Cuevas RA,Baust TB,et al. Physical and functional interaction between the dopamine transporter and the synaptic vesicle protein synaptogyrin-3[J]. J Neurosci,2009,29(14):4592-4604.
[20] Simunovic F,Yi M,Wang Y,et al. Gene expression profiling of substantia nigra dopamine neurons:Further insights into Parkinson's disease pathology[J]. Brain,2009, 132(Pt 7):1795-1809.
[21] Miller RM,Callahan LM,Casaceli C,et al. Dysregulation of gene expression in the 1-methyl-4-phenyl-1,2,3,6-tetrahydropyridine-lesioned mouse substantia nigra[J]. J Neurosci,2004,24(34):7445-7454.
(收稿日期:2020-01-20)