摘 要 Alzheimers disease是生活中最為常見的老年癡呆癥狀,尤其是近些年來,患者人數(shù)在不斷的攀升,給社會造成了巨大的負擔,然而目前的醫(yī)學研究人員并不清楚其發(fā)病機制。本文所使用的數(shù)據(jù)來自于NCBIgene數(shù)據(jù)庫、北京大學生物醫(yī)學信息學院開發(fā)的TransmiR(http://cmbi.bjmu.edu.cn/transmir)數(shù)據(jù)庫等數(shù)據(jù)平臺。本文采用文本挖掘的方法首先從相關已知數(shù)據(jù)庫中搜集了與病癥有關的異常表達數(shù)據(jù)和相關表達數(shù)據(jù),并進行了數(shù)據(jù)整理,通過試驗證實構建調(diào)控網(wǎng)絡,最后構建了阿爾默海茨病的異常表達網(wǎng)絡以及相關表達網(wǎng)絡。
【關鍵詞】阿爾默海茨病 文本挖掘 老年癡呆 miRNA 轉(zhuǎn)錄因子
阿爾茨海默?。ˋD)是一種起病隱匿的進行性發(fā)展的神經(jīng)系統(tǒng)退行性疾病。臨床上以記憶障礙、失語、失用、失認、視空間技能損害、執(zhí)行功能障礙以及人格和行為改變等全面性癡呆表現(xiàn)為特征,病因迄今未明。65歲以前發(fā)病者,稱早老性癡呆;65歲以后發(fā)病者稱老年性癡呆。如今,阿爾茨海默病已經(jīng)成為一個世界性的公共衛(wèi)生問題,由于人口老齡化情況嚴重,使得阿爾茨海默病的發(fā)病率和患者人數(shù)成倍增加。據(jù)當前數(shù)據(jù)統(tǒng)計,世界范圍內(nèi)阿爾茨海默病患者大概有三千多萬,預計到2050年,阿爾茨海默病患者是現(xiàn)在人數(shù)的三倍還要多。這些都給我國社會的發(fā)展帶來了沉重的負擔。因此,如何有效的對其預防和治療,成為我國面臨重要的健康問題。由于近年來,科學技術的快速發(fā)展,使得網(wǎng)絡大數(shù)據(jù)在醫(yī)學上也得到了廣泛的應用,因此本文就利用計算方法構建阿爾茨海默病差異表達網(wǎng)絡以及相關表達網(wǎng)絡,并從中挖掘隱藏的miRNA與阿爾茨海默病的關聯(lián)信息。
1 數(shù)據(jù)搜集
文中的基因數(shù)據(jù)來自DisGeNET (v4.0) ,MalaCards,Phenopeda和PubMed (http://www.ncbi.nlm.nih.gov/pubmed) 數(shù)據(jù)庫。miRNA數(shù)據(jù)來自HMDD (v2.0) ,miR2Disease,PhenomiR和PubMed數(shù)據(jù)庫。轉(zhuǎn)錄因子-miRNA數(shù)據(jù)來自TransmiR(version 1.2)數(shù)據(jù)庫。轉(zhuǎn)錄因子-基因數(shù)據(jù)來自TRANSFAC (v 11.4)和ORegAnno數(shù)據(jù)庫。miRNA宿主基因來自National Center for Biotechnology Information (NCBI) (http://www.ncbi.nlm.nih.gov/gene/)數(shù)據(jù)庫。miRNA-基因數(shù)據(jù)來自Tarbase(v 7.0) ,miRTarBase (v 6)和miRecords (v 4)數(shù)據(jù)庫。
2 網(wǎng)絡的構建
試驗調(diào)控網(wǎng)絡的數(shù)據(jù)包括以下幾種:轉(zhuǎn)錄因子miRNA(TFs→miRNAs),轉(zhuǎn)錄因子基因(TFs→genes),miRNA基因(miRNAs→genes),miRNA(miRNA)以及宿主基因(host gene)。本文就是通過這些試驗數(shù)據(jù)來構造的轉(zhuǎn)錄因子和miRNA的聯(lián)合調(diào)控網(wǎng)絡,這個網(wǎng)絡稱為試驗認證調(diào)控網(wǎng)絡。
文章在轉(zhuǎn)錄因子、miRNA和基因的關聯(lián)數(shù)據(jù)以及試驗認證調(diào)控網(wǎng)絡基礎上構造了阿爾茨海默病的相關網(wǎng)絡。首先將節(jié)點映射到認證網(wǎng)絡中,其次提取出相關聯(lián)的認證數(shù)據(jù)來構造一個相關調(diào)控網(wǎng)絡,最后結合網(wǎng)絡和其他沒有出現(xiàn)在上述網(wǎng)絡中的轉(zhuǎn)錄因子、基因和miRNA一起構成一個網(wǎng)絡。
繼續(xù)使用相似的方法構造了阿爾茨海默病的異常表達網(wǎng)絡。把異常數(shù)據(jù)(阿爾茨海默病的轉(zhuǎn)錄因子、miRNA和基因)映射到認證網(wǎng)絡中,從而提取出試驗數(shù)據(jù)來構建異常表達的網(wǎng)絡,最后也是結合網(wǎng)絡以及其他沒有出現(xiàn)在此網(wǎng)絡中的轉(zhuǎn)錄因子、miRNA和基因再構成網(wǎng)絡。本文中使用cytoscape軟件把網(wǎng)絡可視化。
3 相關表達網(wǎng)絡的構建
如圖1所示為阿爾茨海默病的相關表達網(wǎng)絡。其中包括了異常調(diào)節(jié)和非異常調(diào)節(jié)元素,顯然,相關表達網(wǎng)絡包括了異常網(wǎng)絡。試驗結果顯示14個宿主基因沒有差異表達,它們有可能參與了阿爾茨海默病的相關過程。異常網(wǎng)絡在一定程度上揭示了阿爾茨海默病的發(fā)病機制。相關網(wǎng)絡不僅可以在一定程度上顯示出阿爾茨海默病出現(xiàn)的調(diào)控機制,還可以說明該病癥的預防和治療策略。
圖1為阿爾茨海默病相關表達網(wǎng)絡。紅色節(jié)點代表差異表達的轉(zhuǎn)錄因子、miRNA和靶基因;藍色節(jié)點代表非差異表達以相關的轉(zhuǎn)錄因子、miRNA和靶基因;白色代表miRNA的宿主基因;圓型代表靶基因;三角形代表轉(zhuǎn)錄因子;園矩形代表宿主基因;菱形代表miRNA。
本文手動從阿爾茨海默病的相關網(wǎng)絡中提取關鍵網(wǎng)絡基序。其中由阿爾茨海默病的相關表達網(wǎng)絡中的宿主基因、miRNA和靶基因組成的共有10種關鍵網(wǎng)絡基序。其中包括反饋環(huán)基序,此基序是癌癥關鍵調(diào)控基序。異常表達網(wǎng)絡中包含了45個3節(jié)點關鍵網(wǎng)絡基序,15個4節(jié)點基序以及26個反饋環(huán)基序。而相關表達網(wǎng)絡中包含75個3節(jié)點關鍵網(wǎng)絡基序,75個4節(jié)點基序,31個反饋環(huán)基序。
4 調(diào)控網(wǎng)絡的構建
最后獲得了38個預測轉(zhuǎn)錄因子。其中轉(zhuǎn)錄因子E2F1,NFKB1 和E2F4是異常表達基因,TCF3 和非異常表達基因有關。圖二顯示出4種轉(zhuǎn)錄因子在阿爾茨海默病的相關網(wǎng)絡中的調(diào)控關系。E2F1 在57個靶基因之間調(diào)節(jié),其中13個基因是異常表達的,其他的都是非異常表達。E2F1 在10個miRNA之間調(diào)節(jié),其中9個miRNA為異常表達,1個miRNA非異常表達。與此同時,5個轉(zhuǎn)錄因子調(diào)節(jié)E2F1 ,6個miRNA也指向了E2F1 。E2F1 的靶基因和這些miRNA構成了38個反饋環(huán)和6個前饋環(huán)。E2F4在79個靶基因之間調(diào)節(jié),其中21個基因是差異表達,其他的基因都是非差異表達,與此同時SMARCA4 調(diào)節(jié)了E2F4。NFKB1調(diào)節(jié)了8個miRNA,它們都是差異表達,5個轉(zhuǎn)錄因子(E2F1, E2F4, GATA2,RBL2 and SMARCA4)調(diào)節(jié)NFKB1,9個miRNA調(diào)節(jié)NFKB1,NFKB1的靶基因和6個miRNA構成了6個反饋環(huán)。TCF3調(diào)節(jié)3個靶基因(GLI1, VPREB1 and NR0B2),它們都是非差異表達,4個轉(zhuǎn)錄因子(E2F1, E2F4, RBL2 and SMARCA4)調(diào)節(jié)TCF3,2個miRNA(miR-145 and miR-17)調(diào)節(jié)TCF3。endprint
圖2為阿爾茨海默病調(diào)控網(wǎng)絡中E2F1,NFKB1, E2F4 and TCF3的調(diào)節(jié)關系圖。紅色節(jié)點代表差異表達的轉(zhuǎn)錄因子、miRNA和靶基因,藍色節(jié)點代表非差異表達以及相關的轉(zhuǎn)錄因子、miRNA和靶基因,圓形代表靶基因,三角形代表轉(zhuǎn)錄因子,菱形代表miRNA。
5 結論
醫(yī)學工作者通過多次的重復實驗,發(fā)現(xiàn)一些與阿爾茨默病有關的基因和miRNA,根據(jù)大量的研究發(fā)現(xiàn),阿爾茨默病的發(fā)生不是由單一的或者幾個基因和miRNA造成的。我們可以知道,基因和miRNA可以相互調(diào)控,建立調(diào)控網(wǎng)絡,可以將它們之間的控制關系清晰的展現(xiàn)出來。轉(zhuǎn)錄因子,miRNA還有宿主基因都在疾病中占據(jù)重要的作用它們可以共同合作調(diào)控基因表達。
參考文獻
[1]Xiao F1,Zuo Z,Cai G,et al. miRecords: an integrated resource for microRNA-target interactions [J]. Nucleic Acids Res,2009,37(Database issue):D105-D110.
[2]Havelange V,Stauffer N,Heaphy CC, et al.Functional implications of microRNAs in acute myeloid leukemia by integrating microRNA and messenger RNA expression profiling [J].Cancer,2011,117(20):4696-4706.
[3]劉靜,抑癌基因p14ARF對慢性粒細胞白血病細胞增殖、細胞周期及凋亡的影響機制研究[J].中國醫(yī)藥導報,2012,9(35).
[4]蘇乃芳,轉(zhuǎn)錄因子和microRNA組成的基因調(diào)控網(wǎng)絡的生物信息學分析[D].北京:北京大學數(shù)學科學學院,2013.
[5]Dohi O1,Yasui K,Gen Y,et al. Epigenetic silencing of miR-335 and its host gene MEST in hepatocellular carcinoma [J].Int J Oncol,2013,42(02):411-418.
[6]Shannon P,Markiel A,Ozier O,Baliga NS,Wang JT,Ramage D,Amin N, Schwikowski B,IdekerT.Cytoscape:a software environment for integrated models of biomolecular interaction networks.Genome Research 2003 Nov;13(11):2498-504.
作者簡介
邢翀(1980-),女,吉林省長春市人。吉林大學計算機科學與技術學院博士畢業(yè),副教授。研究方向為智能計算。
作者單位
長春金融高等??茖W校信息技術學院 吉林省長春市 130028endprint