• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      急性高血糖對(duì)小鼠主動(dòng)脈基因表達(dá)譜擾動(dòng)的可視化研究

      2017-09-22 03:46:36張心月俞夢(mèng)越
      中國(guó)循環(huán)雜志 2017年9期
      關(guān)鍵詞:高血糖聚類(lèi)基因

      張心月,俞夢(mèng)越

      基礎(chǔ)與實(shí)驗(yàn)研究

      急性高血糖對(duì)小鼠主動(dòng)脈基因表達(dá)譜擾動(dòng)的可視化研究

      張心月,俞夢(mèng)越

      目的:采用數(shù)據(jù)挖掘方法,基于Matlab平臺(tái)對(duì)基因網(wǎng)絡(luò)擾動(dòng)可視化,以直觀顯示短時(shí)高血糖狀態(tài)下動(dòng)脈血管轉(zhuǎn)錄組改變。

      方法:在美國(guó)國(guó)立衛(wèi)生研究中心(NCBI)GEO數(shù)據(jù)庫(kù)下載數(shù)據(jù)集。利用Matlab將數(shù)據(jù)轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別的結(jié)構(gòu)體,經(jīng)過(guò)數(shù)據(jù)篩選,獲得短時(shí)高血糖后表達(dá)模式擾動(dòng)最明顯的基因譜。利用三種聚類(lèi)算法分析,基于DAVID進(jìn)行基因本體學(xué)(GO)注釋及富集分析,把相關(guān)通路標(biāo)定在KEGG通路中,形成基因—表達(dá)譜系統(tǒng)分析。

      結(jié)果:經(jīng)過(guò)對(duì)數(shù)據(jù)集的篩選、聚類(lèi)將基因的變化模式歸為9類(lèi),在該模型中有效地反應(yīng)出短時(shí)高血糖對(duì)動(dòng)脈血管的急性早期效應(yīng)。GO富集分析顯示,在急性炎癥反應(yīng)、心肌重構(gòu)、維持細(xì)胞內(nèi)鈣離子穩(wěn)態(tài)、細(xì)胞周期調(diào)控、細(xì)胞趨化作用等方面的基因顯著富集;其中以與粘多糖、糖蛋白結(jié)構(gòu)相關(guān)基因、脂肪分解代謝、肌原纖維組裝相關(guān)基因顯著富集。這些發(fā)現(xiàn)與以往研究的結(jié)論相吻合。K-均值聚類(lèi)方法顯示,在高血糖環(huán)境下基因表達(dá)上調(diào),且不隨血糖恢復(fù)正常表達(dá)的基因,主要有參與細(xì)胞周期調(diào)控、心肌重構(gòu)、維持細(xì)胞內(nèi)鈣離子穩(wěn)態(tài)的基因。

      結(jié)論:利用數(shù)據(jù)挖掘方法,實(shí)現(xiàn)急性高血糖對(duì)小鼠動(dòng)脈基因表達(dá)譜波動(dòng)模式的可視化描述,并為糖尿病的“代謝記憶”機(jī)制提供新的解釋,即早期的高糖效應(yīng)帶來(lái)的動(dòng)脈血管的不可逆的損傷,是導(dǎo)致冠心病患者降糖治療無(wú)效的原因。即短暫的高糖水平的暴露可在分子水平上起到長(zhǎng)久的影響。

      高血糖癥;內(nèi)皮細(xì)胞;基因表達(dá)譜

      (Chinese Circulation Journal, 2017,32:924.)

      糖尿病是冠狀動(dòng)脈疾?。–AD)的獨(dú)立危險(xiǎn)因素,其中動(dòng)脈粥樣硬化在糖尿病患者死亡原因中約占80%[1,2]。糖尿病可通過(guò)多種途徑促進(jìn)動(dòng)脈粥樣硬化的發(fā)生,如高血糖、肥胖、血脂紊亂、高血壓、胰島素抵抗等;其中機(jī)體處于長(zhǎng)期慢性高糖環(huán)境,是糖尿病患者發(fā)生動(dòng)脈粥樣硬化的主要因素[3,4]。高血糖可通過(guò)多條途徑啟動(dòng)動(dòng)脈粥樣硬化的發(fā)生、并加速其進(jìn)展,其中內(nèi)皮細(xì)胞功能受損是動(dòng)脈粥樣硬化和糖尿病大血管病變的早期病理生理變化。

      DNA微陣列(基因芯片)是高通量研究中重要的方法之一,能對(duì)大量的基因表達(dá)譜進(jìn)行同步、快速檢測(cè),提供上萬(wàn)條基因的表達(dá)譜。目前公共數(shù)據(jù)庫(kù)(如GEO)中基因芯片表達(dá)譜數(shù)據(jù)與日俱增,但海量的數(shù)據(jù)卻未得到充分的提取與深入的挖掘。以往的研究更多的局限于傳統(tǒng)的研究、統(tǒng)計(jì)手段,但芯片數(shù)據(jù)的特點(diǎn)是維數(shù)高、具有異質(zhì)性、網(wǎng)絡(luò)性,傳統(tǒng)的統(tǒng)計(jì)分析方法不再適用。數(shù)據(jù)挖掘是在大數(shù)據(jù)背景下應(yīng)運(yùn)而生的一種將數(shù)據(jù)轉(zhuǎn)換為有用信息的方法[5]。本文結(jié)合計(jì)算生物學(xué)技術(shù),采集公共數(shù)據(jù)庫(kù)中已發(fā)表的Affymetrix寡核苷酸微陣列原始數(shù)據(jù)GDS4016,對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)篩選、差異表達(dá)基因篩選、聚類(lèi)分析、基因本體學(xué)注釋、通路富集分析,從而更加直觀地顯示短時(shí)高血糖對(duì)血管內(nèi)皮細(xì)胞的基因擾動(dòng),以利于復(fù)雜信息進(jìn)一步整合、挖掘。

      1 材料與方法

      數(shù)據(jù)集來(lái)自美國(guó)國(guó)立衛(wèi)生研究中心(NCBI)的GEO數(shù)據(jù)庫(kù),編號(hào)為GDS4016,平臺(tái)號(hào)為GPL1261(Affymetrix公司),下載地址為:http://www.ncbi.nlm. nih.gov/geo/query/acc.cgi?acc=GSE15401。該芯片主要研究?jī)?nèi)容為瞬時(shí)高血糖過(guò)程中及之后,小鼠主動(dòng)脈組織細(xì)胞基因表達(dá)譜改變。實(shí)驗(yàn)檢測(cè)時(shí)間點(diǎn)為第0天(血糖5 mmol/L)、第2、4、7天(血糖>25 mmol/L)、第11、26天(血糖5 mmol/L)。

      數(shù)據(jù)預(yù)處理:①弱信號(hào)處理:芯片上存在很多弱信號(hào)點(diǎn),這些點(diǎn)的信號(hào)強(qiáng)度雖然很弱,但不一定是噪聲點(diǎn),有可能是一些十分重要的基因,因此不能武斷地把它們?nèi)縿h去。目前對(duì)于如何把弱信號(hào)點(diǎn)從背景或噪聲中分離出來(lái)仍無(wú)全面有效的方法。我們通過(guò)背景、空白點(diǎn)、陰性對(duì)照點(diǎn)確定弱信號(hào)的閾值。低于該值的信號(hào)點(diǎn)被濾除,高于該值的信號(hào)點(diǎn)進(jìn)入后續(xù)的數(shù)據(jù)分析。②數(shù)據(jù)的對(duì)數(shù)轉(zhuǎn)換:對(duì)數(shù)轉(zhuǎn)換能夠提供從生物學(xué)角度易于解釋的數(shù)據(jù),使數(shù)據(jù)的分布滿足近似正態(tài)分布,以便后續(xù)的數(shù)據(jù)挖掘方法的使用。為確保聚類(lèi)的有效性,使芯片數(shù)據(jù)偏向于正態(tài)分布,對(duì)數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)對(duì)數(shù)轉(zhuǎn)換。③數(shù)據(jù)篩選:基因表達(dá)譜數(shù)據(jù)集很大,大部分組織只有大約10000~15000個(gè)基因會(huì)產(chǎn)生表達(dá)[6],并且很多基因在實(shí)驗(yàn)中沒(méi)有表現(xiàn)出我們感興趣的變化。為了簡(jiǎn)化搜尋興趣基因的過(guò)程,需要縮減數(shù)據(jù)集的數(shù)量到一個(gè)亞集中,去掉不感興趣的基因。因而我們采用低熵篩選,過(guò)濾掉表達(dá)量波動(dòng)熵值過(guò)低(基本熵值屬于10%以下)的基因。

      描述表達(dá)譜擾動(dòng)的算法:無(wú)監(jiān)督學(xué)習(xí)(unsupervised analysis)即沒(méi)有事先定義的向量集或類(lèi)別集,使用遞歸的分割方法來(lái)劃分類(lèi),把擁有相似特征的數(shù)據(jù)歸入相同的類(lèi)。包括層級(jí)聚類(lèi)、K-均值聚類(lèi)、自組織映射、主成份分析等。①K-均值聚類(lèi)(K-means Clustering):K均值聚類(lèi)是無(wú)監(jiān)督分類(lèi)的一種基本方法[7]。在K-means算法運(yùn)行前須指定聚類(lèi)的數(shù)目K和迭代次數(shù),并指定K個(gè)初始質(zhì)心。初始質(zhì)心數(shù)目的選取,一種是隨機(jī)選擇,另一種是使用其他聚類(lèi)方法得到的類(lèi)平均向量[8]。②主成分分析(principle component analysis, PCA):是一種數(shù)學(xué)降維方法,找出幾個(gè)綜合變量來(lái)代替原來(lái)眾多的變量,使這些綜合變量能盡可能地代表原來(lái)變量的信息量,并且彼此之間相互獨(dú)立。這些新變量能夠代表原始數(shù)據(jù)的能力由它們所能解釋的變異的比例衡量。那些遠(yuǎn)離遠(yuǎn)點(diǎn)的基因,是表達(dá)量變化最明顯的基因,在得分圖中選取離原點(diǎn)較遠(yuǎn)的點(diǎn),對(duì)對(duì)應(yīng)的基因進(jìn)行標(biāo)記[9]。③自組織映射(Self-organizing Maps, SOMs):是一種無(wú)監(jiān)督神經(jīng)網(wǎng)絡(luò),主要用于對(duì)輸入向量的區(qū)域分類(lèi)。它克服了K-means聚類(lèi)的一些缺點(diǎn),如對(duì)噪聲穩(wěn)定,不依賴與數(shù)據(jù)分布的形狀,提供大數(shù)據(jù)集內(nèi)相似性關(guān)系的綜合分析。聯(lián)合PCA和SOM用于基因數(shù)據(jù)的聚類(lèi)分析,比單一使用SOM的聚類(lèi)分析有更高的分類(lèi)正確率及較為清晰的分類(lèi)邊界[10]。

      研究分析平臺(tái):基于Windows7(Microsoft,美國(guó))的Matlab 2013a(MathWorks,美國(guó))的生物信息工具包。

      2 結(jié)果

      2.1 數(shù)據(jù)預(yù)處理

      數(shù)據(jù)轉(zhuǎn)換(圖1):GDS4016數(shù)據(jù)集中每個(gè)時(shí)間點(diǎn)包含三個(gè)生物學(xué)重復(fù)的樣本,對(duì)其求平均值,并進(jìn)行對(duì)數(shù)轉(zhuǎn)換后的數(shù)據(jù)在各個(gè)時(shí)間點(diǎn)的散點(diǎn)圖。

      圖1 數(shù)據(jù)轉(zhuǎn)換后45 101個(gè)芯片數(shù)據(jù)的折線圖

      基因篩選:首先根據(jù)數(shù)據(jù)挖掘思路,對(duì)數(shù)據(jù)進(jìn)行去空值清洗,然后篩選掉復(fù)制次數(shù)波動(dòng)小于2.5次的基因,及變化水平2倍以下的基因;利用MATLAB中的低熵篩選,濾除表達(dá)量波動(dòng)熵值過(guò)低(基本熵值屬于10%以下)的基因,獲得瞬時(shí)高血糖后表達(dá)模式擾動(dòng)最明顯的基因表達(dá)譜。

      這樣從45 101條序列中挑選出686條有意義波動(dòng)的基因,作為感興趣基因。

      2.2 K均值聚類(lèi)算法

      對(duì)篩選后的數(shù)據(jù)集,通過(guò)分層聚類(lèi)結(jié)果構(gòu)建熱點(diǎn)圖、系統(tǒng)樹(shù)圖(圖2),以直觀的了解其表達(dá)情況。

      利用層級(jí)聚類(lèi)發(fā)現(xiàn)結(jié)果簇的數(shù)目可大致分為9種情況,設(shè)定K均值聚類(lèi)的分類(lèi)數(shù)K為9,初始質(zhì)心的選擇依靠計(jì)算隨機(jī)生成,使用歐氏距離,并設(shè)置最大迭代次數(shù)為100次。K-means聚類(lèi)算法聚類(lèi)圖如圖3所示??煽闯龌虻谋磉_(dá)模式被歸入9簇,隨時(shí)間序列的變化,基因的表達(dá)具有明顯的上調(diào)或下調(diào)。其聚類(lèi)的質(zhì)心(圖4) 繪出這686條基因的表達(dá)輪廓。

      圖2 雙向分層聚類(lèi)結(jié)果

      2.3 主成份分析

      PCA是對(duì)大數(shù)據(jù)集降維的重要工具,亦可在噪聲數(shù)據(jù)中發(fā)現(xiàn)信號(hào)。首先對(duì)686條基因進(jìn)行主成份分析,圖5顯示出第一二個(gè)主成份的散點(diǎn)圖,表示出有兩個(gè)不同的區(qū)域,因?yàn)楹Y選功能已經(jīng)把低變化及低信息量的數(shù)據(jù)去除掉了,而這些點(diǎn)應(yīng)該出現(xiàn)在散點(diǎn)的中心。6個(gè)主成分的特征值及它們的貢獻(xiàn)率見(jiàn)表1。從表中可以發(fā)現(xiàn),前2個(gè)特征值的貢獻(xiàn)率達(dá)到近90%,包含了原始數(shù)據(jù)集的主要信息。

      主成份分析中,發(fā)現(xiàn)異常的離群點(diǎn),說(shuō)明這些基因的表達(dá)模式與其他大多數(shù)的基因并不相同。利用DAVID分析,發(fā)現(xiàn)這些基因在細(xì)胞組成上,主要在肌原纖維組成富集。其生物學(xué)作用主要與肌肉組織發(fā)育分化相關(guān),如心肌肌動(dòng)蛋白α1(Actin,Alpha,Cardiac Muscle 1, ACTC1)、錨蛋白重復(fù)域1(Ankyrin Repeat Domain 1, ANKRD1)和心肌肌鈣蛋白T(Troponin T2, Cardiac Type, TNNT2);另外,與細(xì)胞骨架重塑的基因也有顯著富集,如肌球蛋白重鏈6(Myosin Heavy Chain 6,MYH6)、肌聯(lián)蛋白(Titin, TTN)等。

      圖3 K-means聚類(lèi)算法將686個(gè)數(shù)據(jù)歸為9簇

      圖4 K-means算法基因隨時(shí)間序列的表達(dá)輪廓

      表1 主成分的特征值與貢獻(xiàn)率

      圖5 主成份分析

      2.4 自組織映射(圖6)

      把PCA過(guò)程中得到的前兩個(gè)特征輸入SOM作為其輸入變量,用前兩個(gè)主成份構(gòu)建SOM,用系統(tǒng)設(shè)定的參數(shù)訓(xùn)練網(wǎng)絡(luò),這種方法減少了在訓(xùn)練過(guò)程中關(guān)聯(lián)度不大的基因的影響,能夠有效地提高網(wǎng)絡(luò)訓(xùn)練速度及聚類(lèi)準(zhǔn)確率??偣簿垲?lèi)為16類(lèi),不同的顏色標(biāo)識(shí)出不同的類(lèi)別,16個(gè)紅色的點(diǎn)代表聚類(lèi)的中心。

      圖6 針對(duì)主成分分析結(jié)果的自組織映射聚類(lèi)

      2.5 基因本體學(xué)與通路分析

      根據(jù)三種聚類(lèi)算法得到有相似表達(dá)譜的基因,這意味著有相同表達(dá)模式的基因(在同一個(gè)聚類(lèi)簇中)在同一的處理?xiàng)l件下表現(xiàn)為共同上調(diào)或者下調(diào),這樣我們給出一種假設(shè),即這些基因異同執(zhí)行一個(gè)特定的生物學(xué)功能。對(duì)不同的GO 術(shù)語(yǔ)和KEGG通路進(jìn)行的富集分析,把功能相似的基因聚在一類(lèi),并分析它們?cè)谡麄€(gè)基因組表達(dá)背景下的富集情況,以便更加直接地了解基因所代表的生物學(xué)功能。

      運(yùn)行DAVID,利用統(tǒng)計(jì)學(xué)分析(Fisher精確概率檢驗(yàn)),計(jì)算出P值,P值小于設(shè)置(0.05),表明基因有顯著富集。對(duì)Fisher精確概率檢驗(yàn)進(jìn)行修飾的EASE得分,得分越高,富集效果越好。對(duì)篩選出的基因做富集分析,利用DAVID中的功能注釋富集,對(duì)686個(gè)基因進(jìn)行分析,可以看出這些篩選后的基因主要分布在肌原纖維,并在瘢痕修復(fù)、免疫反應(yīng)有顯著富集,這與之前的研究相一致[11]。通路富集分析顯示這些基因在肥厚型心肌病通路上顯著富集。下面具體分析K-means分類(lèi)下9類(lèi)基因中我們感興趣的變化趨勢(shì)的基因的生物學(xué)功能。

      第一類(lèi),基因表達(dá)變化基本分布在0以下,表明相較第0天(高糖作用前小鼠主動(dòng)脈組織)基因表達(dá)下調(diào);第2天低血糖的窗口期,基因表達(dá)出現(xiàn)明顯下調(diào);第4天隨著血糖水平恢復(fù),基因表達(dá)水平隨之恢復(fù);第7天,高血糖的峰值時(shí),基因再次下調(diào),且與第2天下調(diào)幅度接近。但第7天之后,血糖逐漸恢復(fù)正常,并在正常水平持續(xù)了近兩周,下調(diào)的基因未與之相應(yīng)地調(diào)回原來(lái)的水平?;虮倔w學(xué)分析結(jié)果顯示,該類(lèi)基因主要與急性期免疫應(yīng)答相關(guān),如血清淀粉樣蛋白(Serum Amyloid A1, SAA1)、絲氨酸蛋白酶抑制因子1(Serpin Family A Member 1, SERPINA1)。第九類(lèi)的表達(dá)趨勢(shì)與第一類(lèi)相類(lèi)似,生物學(xué)作用方面主要與細(xì)胞遷移相關(guān),如整合素α4(Integrin Subunit Alpha 4,ITGA4)、整合素β2(Integrin Subunit Beta 2, ITGB2)、FC段γ受體3(Fc Fragment Of IgG Receptor III, FCGR3)以及S100鈣結(jié)合蛋白A9(S100 Calcium Binding Protein A9, S100A9);并與膽固醇代謝相關(guān),如載脂蛋白A1(Apolipoprotein A1, APOA1)、瘦素(Leptin, LEP)和SAA1。

      第二類(lèi)中,基因轉(zhuǎn)錄的大致趨勢(shì)呈現(xiàn)先增高后降低,第7天(血糖最高值)基因明顯上調(diào)達(dá)到峰值,隨后隨著血糖水平逐漸恢復(fù)至正常(第11天),基因的轉(zhuǎn)錄水平也逐漸下降至第0天的水平,并在其后15天維持該表達(dá)水平。富集分析結(jié)果顯示,該類(lèi)基因主要表達(dá)糖蛋白,并主要聚集在細(xì)胞外區(qū)域,如CD99L2、FRAS1、組織蛋白酶H(Cathepsin H, CTSH)等。鈣化相關(guān)基因顯著富集,如骨成型蛋白受體2(Bone Morphogenetic Protein Receptor Type 2, BMPR2)、WNT抑制因子1(WNT Inhibitory Factor 1, WIF1)、骨調(diào)蛋白(Osteomodulin,OMD);以及血管細(xì)胞粘附分子1(Vascular Cell Adhesion Molecule 1,VCAM1)、基質(zhì)金屬蛋白酶 3(Matrix Metalloproteinases 3,MMP3)、血管性血友病因子(Von Willebrand Factor, VWF)、載脂蛋白D(Apolipoprotein D, APOD)、JUN和肌球蛋白重鏈6(Myosin Heavy Chain 6, MYH6);并與急性免疫反應(yīng)密切相關(guān)。這與原始研究結(jié)果相一致[12]。除此之外,研究還發(fā)現(xiàn)對(duì)氧磷酶 1(Paraoxonase 1,PON1)、TNN1、肌原調(diào)節(jié)蛋白2(Myozenin 2,MYOZ2)也包括在該類(lèi)基因當(dāng)中。

      第三類(lèi)與第六類(lèi)的表達(dá)情況相類(lèi)似,呈現(xiàn)先增高后降低的趨勢(shì),第7天達(dá)到峰值。與第二類(lèi)的區(qū)別在于,第11天以后表達(dá)水平仍然高于第0天的表達(dá)水平,表明基因的轉(zhuǎn)錄水平未得到逆轉(zhuǎn)。第四類(lèi)與這兩類(lèi)的區(qū)別在于,基因上調(diào)的最高值落在第四天。富集分析的結(jié)果顯示,除了原始研究中發(fā)現(xiàn)的表達(dá)未逆轉(zhuǎn)的基因,如血管生成素(Angiogenin, ANG)、花生四烯酸-15-脂加氧酶(Arachidonate 15-Lipoxygenase, ALOX15)、載脂蛋白B-mRNA編輯酶復(fù)合物1(Apolipoprotein BmRNA Editing Enzyme Catalytic Subunit 1, APOBEC1)、FOS、肌酸激酶(Creatine Kinase, M-Type, CKM)、早期生長(zhǎng)應(yīng)答蛋白3(Early Growth Response 3, EGR3)之外,我們發(fā)現(xiàn)這類(lèi)基因還包括與肌原纖維組裝、細(xì)胞周期調(diào)控、維持細(xì)胞內(nèi)鈣離子穩(wěn)態(tài)和蛋白錨定相關(guān)的基因。

      第八類(lèi)中,基因轉(zhuǎn)錄水平形成先升后降、再升再降的趨勢(shì),并在第4、11天,血糖分別從低糖、高糖恢復(fù)至正常的時(shí)間達(dá)到峰值,第26天恢復(fù)至第0天的水平。說(shuō)明該類(lèi)基因的表達(dá)滯后于血糖的變化。對(duì)這一類(lèi)基因做富集分析,發(fā)現(xiàn)在細(xì)胞功能上,與趨化作用相關(guān)的基因顯著富集,包括FC段γ受體2(Fc Fragment Of IgG Receptor II, FCGR2)、S100鈣結(jié)合蛋白A8(S100 Calcium Binding Protein A8, S100A8)等。

      第五類(lèi)和第七類(lèi)的基因數(shù)較少,不做富集分析,單獨(dú)分析每一個(gè)基因,未從中發(fā)現(xiàn)有意義的點(diǎn)。

      綜上所述,該研究發(fā)現(xiàn)了除原始分析結(jié)果外其他受調(diào)控基因,如PON1、FRAS1、CTSH、TNN1、MYOZ2等。其中表達(dá)未能逆轉(zhuǎn)的基因還包括與肌原纖維組裝、細(xì)胞周期調(diào)控、離子轉(zhuǎn)運(yùn)、維持細(xì)胞內(nèi)鈣離子穩(wěn)態(tài)和蛋白錨定相關(guān)的基因。對(duì)受調(diào)控基因的變化趨勢(shì)進(jìn)行進(jìn)一步細(xì)分,有利于深入理解疾病變化過(guò)程的具體機(jī)制,促進(jìn)進(jìn)一步深入研究。

      3 討論

      目前公共數(shù)據(jù)庫(kù)中基因芯片表達(dá)譜數(shù)據(jù)與日俱增,但海量的數(shù)據(jù)卻未得到充分的提取與深入的挖掘。采集公共數(shù)據(jù)庫(kù)中已發(fā)表的Affymetrix寡核苷酸微陣列原始數(shù)據(jù)GDS4016,利用數(shù)據(jù)挖掘的方法,從新的角度對(duì)已有的芯片進(jìn)行嶄新的研究?;贛atlab中Mathwork 生物信息工具包將數(shù)據(jù)轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別的結(jié)構(gòu)體,經(jīng)過(guò)數(shù)據(jù)轉(zhuǎn)化使數(shù)據(jù)在同一水平上可比較,之后運(yùn)用模式識(shí)別算法剔除表達(dá)背景噪聲,獲得短時(shí)高血糖后表達(dá)模式擾動(dòng)最明顯的基因譜。利用K-means算法、主成份分析及自組織圖對(duì)篩選后的基因進(jìn)行聚類(lèi)。實(shí)現(xiàn)急性高血糖對(duì)小鼠動(dòng)脈基因表達(dá)譜波動(dòng)模式的可視化描述。進(jìn)而基于DAVID進(jìn)行GO注釋及富集分析,把相關(guān)通路標(biāo)定在KEGG通路中,形成基因——表達(dá)譜系統(tǒng)分析。解釋了為什么降糖處理不能降低CAD的發(fā)生風(fēng)險(xiǎn),即短暫的高糖水平的暴露可在分子水平上起到長(zhǎng)久的影響。目前對(duì)高血糖癥的治療指南,沒(méi)有對(duì)及時(shí)降糖給予足夠的強(qiáng)調(diào),但是實(shí)驗(yàn)與臨床研究均表明,持續(xù)的動(dòng)脈損傷會(huì)加速動(dòng)脈粥樣硬化及心臟病的進(jìn)程,早期的低糖或高糖效應(yīng)帶來(lái)的動(dòng)脈血管的不可逆的損傷,是導(dǎo)致冠心病患者降糖治療無(wú)效的原因。

      本研究雖從研究方法上為高血糖相關(guān)的冠心病研究提供了新的途徑,但僅從轉(zhuǎn)錄組水平進(jìn)行數(shù)據(jù)分析就得出肯定結(jié)論尚欠缺說(shuō)服力,最終還需得到細(xì)胞或動(dòng)物模型的進(jìn)一步驗(yàn)證。其次,本研究數(shù)據(jù)來(lái)自美國(guó)數(shù)據(jù)庫(kù),基于遺傳異質(zhì)性和人種差異,未來(lái)基于中國(guó)人的數(shù)據(jù)庫(kù)分析更有指導(dǎo)意義。

      隨著大規(guī)模測(cè)序的發(fā)展,云存儲(chǔ)技術(shù)的運(yùn)用,在未來(lái),數(shù)據(jù)每日的更新量會(huì)令人瞠目結(jié)舌。如何有效的利用這些資源,把它們轉(zhuǎn)化為我們能夠利用的信息,必須借助新的算法的開(kāi)發(fā)。數(shù)據(jù)挖掘的方法能夠幫助我們?cè)诤A康男畔?dāng)中發(fā)現(xiàn)關(guān)聯(lián),形成能夠被利用的知識(shí)。

      [1] Martín-Timón I, Sevillano-Collantes C, Segura-Galindo A, et al. Type 2 diabetes and cardiovascular disease: Have all risk factors the same strength? World J Diabetes, 2014, 5: 444-470.

      [2] Milicevic Z, Raz I, Beattie SD, et al. Natural history of cardiovascular disease in patients with diabetes: role of hyperglycemia. Diabetes Care, 2008, 31 Suppl 2(Supplement 2): S155-S160.

      [3] Aronson D, Rayfield EJ. How hyperglycemia promotes atherosclerosis: molecular mechanisms. Cardiovasc Diabetol, 2002, 1: 1.

      [4] Nagareddy PR, Murphy AJ, Stirzaker RA, et al. Hyperglycemia promotes myelopoiesis and impairs the resolution of atherosclerosis. Cell Metab, 2013, 17: 695-708.

      [5] Wu F-X, Li M, Ruan J, et al. Systems biology approaches to mining high throughput biological data. Bio Med Research International, 2015, 2015: 504362-504362.

      [6] Su AI, Cooke MP, Ching KA, et al. Large-scale analysis of the human and mouse transcriptomes. Proc Natl Acad Sci USA, 2002, 99: 4465-4470.

      [7] Dubey AK, Gupta U, Jain S. Analysis of k-means clustering approach on the breast cancer Wisconsin dataset. Int J Comput Assist Radiol Surg, 2016, 11: 2033-2047.

      [8] Fernandez EA, Balzarini M. Improving cluster visualization in selforganizing maps: application in gene expression data analysis. Comput Biol Med, 2007, 37: 1677-1689.

      [9] 蔡斌, 江華. 急性心肌梗死早期基因表達(dá)和代謝調(diào)控網(wǎng)絡(luò)擾動(dòng)的可視化研究. 中華急診醫(yī)學(xué)雜志, 2013. 22 : 591-596.

      [10] 程國(guó)建, 安瑤. 基于PCA的SOM網(wǎng)絡(luò)在基因數(shù)據(jù)聚類(lèi)分析中的應(yīng)用. 軟件導(dǎo)刊, 2013, 12: 127-130.

      [11] 馮新星, 陳燕燕. 糖尿病心肌病的研究進(jìn)展. 中國(guó)循環(huán)雜志, 2015. 30: 87-89.

      [12] 陳麗莉, 范國(guó)洽, 韓蕊, 等. 二甲雙胍降低2型糖尿病大鼠主動(dòng)脈磷酸化絲裂原活化蛋白激酶的蛋白表達(dá). 中國(guó)循環(huán)雜志, 2015. 30: 487-491.

      Visualization Study on the Disturbance of Aorta Gene Expression Profile in Acute Hyperglycemia Mice Model

      ZHANG Xin-yue, YU Meng-yue.
      Department of Cardiology, Cardiovascular Institute and Fu Wai Hospital, CAMS and PUMC, Beijing (100037), China

      Objective: Based on the visualization function for gene network disturbance of Matlab platform, data mining method was used to directly observe transcriptional changes in aorta vessel at short-time hyperglycemia condition.

      Methods: The information was down loaded from GEO database of NCBI. Using Matlab system to transfer the data set to a computer-readable structure, using data fi lter to obtain apparent gene expression disturbance pro fi le after short-time hyperglycemia condition. Applying three clustering algorithms, based on DAVID platform to conduct gene ontology (GO) annotation and enrichment analysis in order to calibrate KEGG pathway and to form gene expression pro fi le analysis.

      Results: Via data set screening, the pattern of gene expression was divided into 9 clusters by special algorithms. GO analysis indicated that obvious gene enrichments were found in acute inflammation reaction gene, myocardium remodeling gene, stabilizing intracellular calcium gene, cell cycle regulation gene, chemotactic effect gene; especially in mucopolysaccharide gene, glycoprotein structure related gene, fat catabolism gene and myo fi bril related gene. The above fi ndings were identical to previous study. K-means clustering method presented that in hyperglycemia condition, up-regulated genes didn’t return to normal level when blood glucose back to normal which mainly including cell cycle regulation gene, myocardium remodeling gene and stabilizing intracellular calcium gene.

      Conclusion: Our work provided a new explanation of diabetes metabolic memory; short-term hyperglycemia caused arterial damage was irreversible which incurred inef fi cient hypoglycemic therapy in coronary artery disease patients.

      Hyperglycemia; Endothelial cells; Gene expression pro fi le

      YU Meng-yue, Email: yumy73@163.com

      2016-11-26)

      (編輯:汪碧蓉)

      國(guó)家自然科學(xué)基金委員會(huì)面上項(xiàng)目(81670415)

      100037 北京市,北京協(xié)和醫(yī)學(xué)院 中國(guó)醫(yī)學(xué)科學(xué)院 國(guó)家心血管病中心 阜外醫(yī)院 冠心病診治中心

      張心月 碩士研究生 主要從事冠心病基礎(chǔ)研究 Email:18800161600@163.com 通訊作者:俞夢(mèng)越 Email:yumy73@163.com

      R541

      A

      1000-3614(2017)09-0924-06

      10.3969/j.issn.1000-3614.2017.09.023

      猜你喜歡
      高血糖聚類(lèi)基因
      Frog whisperer
      血糖超標(biāo)這些都不能吃了嗎
      自我保健(2021年4期)2021-06-16 07:36:46
      修改基因吉兇未卜
      奧秘(2019年8期)2019-08-28 01:47:05
      基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
      創(chuàng)新基因讓招行贏在未來(lái)
      商周刊(2017年7期)2017-08-22 03:36:21
      基因
      UCP2基因敲除小鼠在高血糖加重腦缺血損傷模型中的應(yīng)用
      高血糖相關(guān)偏身投擲和舞蹈癥的CT及MRI表現(xiàn)
      基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
      不同水平控制應(yīng)激性高血糖對(duì)重型顱腦損傷患者預(yù)后的影響
      威信县| 德庆县| 凉山| 白银市| 中山市| 清新县| 永修县| 缙云县| 新乡县| 剑川县| 江西省| 周宁县| 巫溪县| 祥云县| 上饶县| 哈尔滨市| 双峰县| 涟源市| 保定市| 溆浦县| 湾仔区| 南陵县| 古蔺县| 乌恰县| 津南区| 惠安县| 壶关县| 成武县| 承德市| 麻城市| 富锦市| 高要市| 南川市| 南丰县| 乐业县| 黑山县| 沙田区| 盐津县| 武乡县| 北碚区| 玉田县|