• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      GlyCosmos門(mén)戶(hù)網(wǎng)站在聚糖科學(xué)研究中的功能概述*

      2022-12-22 13:58:46吉騰榿
      關(guān)鍵詞:表示法凝集素單糖

      吉騰榿 張 繼

      (1)西北師范大學(xué)生命科學(xué)學(xué)院,蘭州 730070;2)西北師范大學(xué)新農(nóng)村發(fā)展研究院,蘭州 730070)

      隨著生物學(xué)研究的不斷深入,糖逐漸地體現(xiàn)出其在生命過(guò)程中的重要性,越來(lái)越多的生物學(xué)家開(kāi)始進(jìn)行糖生物學(xué)研究。在各種生物學(xué)研究方法中,計(jì)算機(jī)技術(shù)因其便捷性、低成本、可預(yù)測(cè)性等優(yōu)點(diǎn),有助于快速而動(dòng)態(tài)地分析并預(yù)測(cè)生物大分子的結(jié)構(gòu)與功能,已廣泛應(yīng)用于生物學(xué)領(lǐng)域的各項(xiàng)研究[1]。隨著人工智能和數(shù)據(jù)庫(kù)技術(shù)的不斷進(jìn)步和完善,日本創(chuàng)價(jià)大學(xué)的Kiyoko 教授等[2]開(kāi)發(fā)并于2019年4月1日創(chuàng)立了GlyCosmos門(mén)戶(hù)網(wǎng)站(https://glycosmos.org/)[3],通過(guò)人工智能與數(shù)據(jù)庫(kù)相結(jié)合,將各種聚糖的數(shù)據(jù)進(jìn)行整合分析。該網(wǎng)站分為存儲(chǔ)庫(kù)、數(shù)據(jù)庫(kù)和國(guó)際標(biāo)準(zhǔn)3個(gè)模塊,不僅能夠上傳自己的糖數(shù)據(jù)進(jìn)行注冊(cè)分享、查詢(xún)各種糖數(shù)據(jù)(包括糖組、糖原、糖蛋白和凝集素等),還能查詢(xún)最新的糖表示法[4-7]。該數(shù)據(jù)庫(kù)已經(jīng)被學(xué)術(shù)界廣泛認(rèn)可和熟知,對(duì)于新近加入到糖生物學(xué)研究領(lǐng)域的相關(guān)研究人員,該數(shù)據(jù)庫(kù)可以提供大量的幫助,使相關(guān)研究工作更加便捷。

      1 存儲(chǔ)庫(kù)

      GlyCosmos 提供對(duì)3個(gè)存儲(chǔ)庫(kù)的訪問(wèn):GlyTouCan[8]、 GlyComb 和 GlycoPOST[9]。GlyTouCan是為糖生物學(xué)開(kāi)發(fā)的第一個(gè)國(guó)際聚糖結(jié)構(gòu)存儲(chǔ)庫(kù)。GlyCom 目前仍在開(kāi)發(fā)中,但它是糖綴合物存儲(chǔ)庫(kù),而GlycoPOST 是聚糖和糖蛋白質(zhì)譜(MS)的存儲(chǔ)庫(kù)。存儲(chǔ)庫(kù)的建立是為數(shù)據(jù)庫(kù)建立基礎(chǔ),存儲(chǔ)庫(kù)對(duì)于所有用戶(hù)都是完全開(kāi)放的,研究者可以將自己所研究的聚糖或者寡糖的相關(guān)數(shù)據(jù)保活結(jié)構(gòu)數(shù)據(jù)和活性數(shù)據(jù)上傳至存儲(chǔ)庫(kù),實(shí)現(xiàn)數(shù)據(jù)的分享與互聯(lián),每一個(gè)研究者都是存儲(chǔ)庫(kù)的建立者,隨著多糖的研究越來(lái)越深入,存儲(chǔ)庫(kù)也會(huì)日益完善和全面。

      1.1 GlyTouCan

      GlyTouCa為聚糖提供登錄號(hào)(ⅠD),無(wú)論其是否用所有已知的糖苷鍵完全表征,或者是片段,或者只是一組單糖,都可以使用圖形工具注冊(cè)聚糖,以GlycoCT 或WURCS 格式指定聚糖結(jié)構(gòu)的文本,或包含此類(lèi)文本的文件[10]。但是,GlyTouCan 僅接受帶有單糖及其修飾的結(jié)構(gòu);在注冊(cè)前必須去除苷元或非單糖殘基,例如氨基酸。GlyTouCan是目前最為全面的聚糖存儲(chǔ)庫(kù)。

      1.2 GlyComb

      GlyComb 目前正被開(kāi)發(fā)為糖綴合物存儲(chǔ)庫(kù)。因?yàn)槟壳吧胁淮嬖谶@樣的存儲(chǔ)庫(kù),但是需要為糖綴合物和糖脂分配登錄號(hào)[11]。因此,GlyComb 將主要用于解決這個(gè)問(wèn)題,用戶(hù)可以通過(guò)該系統(tǒng)指定聚糖及其糖基化的蛋白質(zhì)或脂質(zhì)。該存儲(chǔ)庫(kù)旨在使糖蛋白和糖脂也能注冊(cè),從而存進(jìn)數(shù)據(jù)庫(kù)中實(shí)現(xiàn)數(shù)據(jù)的共享,為相關(guān)領(lǐng)域的研究人員提供便利。

      1.3 GlycoPOST

      GlycoPOS 用于糖組學(xué)實(shí)驗(yàn)的質(zhì)譜數(shù)據(jù)檢索??梢詣?chuàng)建包含有關(guān)科研人員實(shí)驗(yàn)原數(shù)據(jù)的“預(yù)設(shè)”。然后可以將預(yù)設(shè)與包含實(shí)際原始數(shù)據(jù)的項(xiàng)目鏈接起來(lái)。該存儲(chǔ)庫(kù)是將糖組學(xué)的相關(guān)實(shí)驗(yàn)數(shù)據(jù)存儲(chǔ)進(jìn)數(shù)據(jù)庫(kù)從而實(shí)現(xiàn)數(shù)據(jù)的分享,為建立起一個(gè)更加立體和全面的聚糖數(shù)據(jù)庫(kù)打下基礎(chǔ),目前該存儲(chǔ)庫(kù)同樣正在進(jìn)行開(kāi)發(fā)。

      2 數(shù)據(jù)庫(kù)

      在GlyCosmos的數(shù)據(jù)庫(kù)中,給出了各種糖相關(guān)的數(shù)據(jù)類(lèi)型及意義(表1)。

      Table1 Sugar data types and meanings included in GlyCosmos表1 GlyCosmos中包含的糖數(shù)據(jù)類(lèi)型及意義

      2.1 糖組

      雖然完全表征糖組的高通量技術(shù)仍處于早期階段,但世界各地的科學(xué)家已經(jīng)為此做出了許多努力。GlyCosmos 中的GlycomeAtlas[12]模塊最初是在RⅠNGS[4](http://www.rings.t.soka.ac.jp)中開(kāi)發(fā)的,現(xiàn)在提供了人類(lèi)、小鼠、斑馬魚(yú)糖組的可視化工具[13],該資源也可以在GlyCosmos 中獲得。另外GlyCosmos還提供了多種可視化工具,讓科研人員可以比較已經(jīng)積累的各種數(shù)據(jù)。關(guān)于糖組的數(shù)據(jù)庫(kù)是最多的,同時(shí)功能也是最為全面的,甚至包括可視化的數(shù)據(jù)庫(kù),因此是使用最多的數(shù)據(jù)庫(kù)。

      2.2 糖原及糖蛋白

      GlyCosmos數(shù)據(jù)庫(kù)通過(guò)語(yǔ)義Web技術(shù)將蛋白質(zhì)數(shù)據(jù)和糖數(shù)據(jù)進(jìn)行融合[14],這使得能夠整合來(lái)自蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB)[15]和Uniprot[16]數(shù)據(jù)庫(kù)的數(shù)據(jù),形成糖原以及糖蛋白的相關(guān)數(shù)據(jù)。因此該數(shù)據(jù)庫(kù)主要用于糖蛋白和糖原相關(guān)數(shù)據(jù)的檢索。

      2.3 凝集素

      GlyCosmos 中凝集素是PDB 中的蛋白質(zhì)條目列表,在UniProt 中注釋為凝集素。如果凝集素是糖基化的,它的糖基化位點(diǎn)信息也會(huì)顯示出來(lái)[17]。例 如,多 囊 蛋 白1 (polycystin-1,UniProt ⅠD P98161)是一種高度糖基化的凝集素,只需按糖基化位點(diǎn)的數(shù)量對(duì)列表進(jìn)行排序即可輕松找到。因此該數(shù)據(jù)庫(kù)主要用于凝集素相關(guān)數(shù)據(jù)的檢索。

      2.4 通路和疾病

      GlyCosmos 提供了對(duì)GlyCosmos Pathways[10]、Glyco-Disease Genes Database[18]和 PacDB(Pathogen Adherence to Carbohydrate Database)[19]的訪問(wèn)。GlyCosmos Pathways表示涉及糖蛋白的通路。這些通路數(shù)據(jù)是從Reactome 數(shù)據(jù)庫(kù)[20]中積累,并且提供信號(hào)通路可視化工具進(jìn)行可視化[10]。

      PacDB 由ACGG-DB 提供[21]。它提供了有關(guān)疾病發(fā)病機(jī)制的信息,其中微生物聚糖結(jié)合蛋白與宿主上的聚糖之間的相互作用尤為重要。目前,已記錄了446種微生物,并列出了有關(guān)它們結(jié)合或不結(jié)合聚糖的信息。對(duì)于與多糖相關(guān)信號(hào)通路的相關(guān)數(shù)據(jù),可以從這個(gè)數(shù)據(jù)庫(kù)中獲得。

      3 國(guó)際標(biāo)準(zhǔn)

      國(guó)際標(biāo)準(zhǔn)由本體和符號(hào)兩個(gè)子部分組成。這一部分中包含了多種國(guó)際上最新的統(tǒng)一標(biāo)準(zhǔn)化的多糖表示方法,既美觀又能使信息交流更加便捷,越來(lái)越多的期刊上所發(fā)表的相關(guān)多糖研究均開(kāi)始使用這些新的方法來(lái)表示作者所研究的多糖。學(xué)習(xí)并掌握這些新的多糖表示方法,對(duì)于擬從事多糖研究的相關(guān)研究人員能夠提供很大的幫助和便捷。

      3.1 本體

      本體是指用于以系統(tǒng)化的方式描述數(shù)據(jù)的詞匯表。最著名的本體是基因本體論,它根據(jù)基因的分子功能、細(xì)胞位置和生物過(guò)程來(lái)表述基因。在糖生物學(xué)中,GlycoRDF 首先被定義為描述聚糖結(jié)構(gòu)的本體[22]。盡管名稱(chēng)中包含術(shù)語(yǔ)“RDF”,但它實(shí)際上并不是資源描述框架(RDF),而是一種被開(kāi)發(fā)用來(lái)描述RDF 中的聚糖或語(yǔ)義Web 術(shù)語(yǔ)的本體。GlycoRDF允許用GlyTouCan ⅠD指定的聚糖注釋出版信息,用于表征聚糖的實(shí)驗(yàn),是否是生物來(lái)源或化學(xué)合成等[23]。GlyTouCan 使用的本體基于GlycoRDF,并且由于許多其他聚糖數(shù)據(jù)庫(kù)也在使用GlycoRDF,因此可以直接的方式跨這些數(shù)據(jù)集進(jìn)行語(yǔ)義Web查詢(xún)[24]。

      在GlyCosmos 中,本體子部分提供了對(duì)GlycoRDF 以及PacOnto(為描述PacDB 中的數(shù)據(jù)而開(kāi)發(fā)的本體)和GGDonto(為描述GDGDB中的數(shù)據(jù)而開(kāi)發(fā)的本體)的信息訪問(wèn)[20]。目前均已開(kāi)發(fā)用于標(biāo)準(zhǔn)化聚糖及糖綴合物的表示。

      3.2 符號(hào)

      GlyCosmos的符號(hào)子部分提供了對(duì)國(guó)際理論與應(yīng)用化學(xué)聯(lián)合會(huì)(international union of pure and applied chemistry,ⅠUPAC)推薦的每個(gè)聚糖表示方法的詳細(xì)信息的訪問(wèn)。這包括ⅠUPAC 法[25]、WURCS (Web3 unique representation of carbohydrate structures) 法[26]、 GlycoCT[27]和SNFG (symbol nomenclature for glycans) 法[28]。具體的表示格式都可以在GlyCosmos中查閱。

      3.2.1 ⅠUPAC法

      ⅠUPAC 法是國(guó)際理論與應(yīng)用化學(xué)聯(lián)合會(huì)提出的一種表示復(fù)合碳水化合物的表示法。使用符號(hào)代表寡糖結(jié)構(gòu),描述了如何通過(guò)兩個(gè)基本原則來(lái)表示寡糖結(jié)構(gòu):a.使用3個(gè)字母的符號(hào)表示單糖殘基;b.還原基團(tuán),也即具有游離半縮醛基團(tuán)的殘基或其修飾(例如糖醇、醛糖酸、糖苷),應(yīng)在右側(cè),當(dāng)與非碳水化合物部分(例如蛋白質(zhì)、肽或脂質(zhì))有糖基連接時(shí),所涉及的糖基殘基應(yīng)出現(xiàn)在正確的位置[29]。例如:棉子糖α-D-Galp-(1→6)-α-L-Glcp-(1→2)-β-D-Frufα-D-Galp-(1→6)-α-L-Glcp-(1→2)-β-D-Fruf,可 以 用 精 簡(jiǎn) 形 式 表 示 為Gal(α1-6)Glc(α1-2β)Fruf,還可以進(jìn)一步縮寫(xiě)為Galα-6GlcαβFruf或Galα6GlcαβFruf。ⅠUPAC 是最基礎(chǔ)的一種表示法也是相對(duì)簡(jiǎn)單的一種表示法,掌握其規(guī)則后,就能很容易做出來(lái),之后根據(jù)ⅠUPAC表示法,才能得到如下的其他表示方法。

      3.2.2 WURCS法

      據(jù)得到的ⅠUPAC 表示法,通過(guò)GlycanFormatConverte 網(wǎng)絡(luò)頁(yè)面的轉(zhuǎn)換工具,將ⅠUPAC表示輸入進(jìn)去,很容易得到WURCS的表示形式。該表示法是一種計(jì)算機(jī)軟件和網(wǎng)頁(yè)可以識(shí)別的多糖代碼串,是為了后續(xù)研究中研究對(duì)象可以被輸入進(jìn)計(jì)算機(jī)軟件和網(wǎng)頁(yè)中被讀取識(shí)別所形成的一種多糖表示方法。復(fù)雜碳水化合物或聚糖的計(jì)算分析產(chǎn)生了許多線(xiàn)性和非線(xiàn)性符號(hào)來(lái)表示這些復(fù)雜結(jié)構(gòu)。

      因?yàn)镚lyCosmos 是使用語(yǔ)義Web 技術(shù)開(kāi)發(fā)的,所以對(duì)聚糖進(jìn)行表示的首要要求之一是它是一個(gè)線(xiàn)性字符串。其次,它需要能夠在不使用庫(kù)的情況下表示不明確的結(jié)構(gòu)[26]。例如,無(wú)論替換是否已知,都應(yīng)該能夠表示單糖上的新替換。因此,修改需要通過(guò)它們的化學(xué)(原子)結(jié)構(gòu)而不是名稱(chēng)來(lái)指定。由于之前沒(méi)有現(xiàn)有的這些聚糖表示法滿(mǎn)足這些要求,因此開(kāi)發(fā)了WURCS。WURCS 制定了一系列規(guī)則以確保所有聚糖表示都是唯一的,從而允許使用唯一標(biāo)識(shí)符表示每個(gè)聚糖,形成一一對(duì)應(yīng)的關(guān)系[30]。

      3.2.3 GlycoCT

      同樣的, 根據(jù)ⅠUPAC 表示法, 通過(guò)GlycanFormatConverter網(wǎng)絡(luò)頁(yè)面的轉(zhuǎn)換工具,得到其GlycoCT 的表示形式。和WURCS 表示法一樣,該表示法同樣是一種為了讓計(jì)算機(jī)軟件和網(wǎng)頁(yè)能夠識(shí)別的代碼串,同樣可以被輸入進(jìn)計(jì)算機(jī)軟件和網(wǎng)頁(yè)中被讀取和識(shí)別。但是,可以很明顯地看出,pap-1 的GlycoCT 表示法明顯比WURCS 表示法要復(fù)雜且冗長(zhǎng)的多,所以更多的是使用WURCS表示法,個(gè)別無(wú)法識(shí)別WURCS 表示法的軟件和網(wǎng)頁(yè),可以通過(guò)GlycoCT表示法進(jìn)行輸入識(shí)別。

      GlycoCT 最初由德國(guó)癌癥研究中心的Claus 博士[31]領(lǐng)導(dǎo)。這種表示格式目前最常被生物信息學(xué)家使用,因?yàn)樗荊lycomeDB 中使用的格式,GlycomeDB 是最早的整合聚糖結(jié)構(gòu)數(shù)據(jù)庫(kù)之一,現(xiàn)在已被集成到GlyCosmos中。

      3.2.4 SNFG

      在繪制多糖和交流溝通時(shí),由于沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),大部分研究還是再用chemoffice相關(guān)軟件來(lái)繪制聚糖,過(guò)程很繁瑣,而且別人閱讀起來(lái)也會(huì)很困難,由此產(chǎn)生了一套新的統(tǒng)一的SNFG表示法,按照該表示法的規(guī)則,通過(guò)DrawGlycan-SNFG 軟件可以繪制出SNFG表示法。該方法應(yīng)用簡(jiǎn)單的不同顏色的符號(hào)和各種單糖相對(duì)應(yīng),一種符號(hào)專(zhuān)門(mén)表示一種單糖,并在橫線(xiàn)上注明糖苷鍵類(lèi)型,主鏈在上,支鏈在下,很容易就能繪制出多糖,并且別人閱讀起來(lái)時(shí)也更加的方便,一個(gè)寡糖分子的單糖組成和糖苷鍵一目了然。繪制聚糖結(jié)構(gòu)的標(biāo)準(zhǔn)化對(duì)于有效溝通至關(guān)重要。這里展示的工具和方法已被科學(xué)界廣泛接受。建議提交給主要期刊和其他出版物的手稿都使用這些符號(hào)來(lái)表示單糖。關(guān)于命名的問(wèn)題比科學(xué)問(wèn)題更具爭(zhēng)議性,因?yàn)閺膩?lái)沒(méi)有一個(gè)正確的答案。

      SNFG的符號(hào)集是根據(jù)由國(guó)際公認(rèn)的糖生物學(xué)家、化學(xué)家和信息學(xué)家組成的工作組討論而設(shè)計(jì)的。當(dāng)前推薦的符號(hào)列表可在https://www.ncbi.nlm.nih.gov/glycans/snfg.html獲得[32]。聚糖的符號(hào)表示法已被科學(xué)界廣泛接受,強(qiáng)烈建議相關(guān)研究人員在提交給主要期刊和其他出版物的所有手稿中使用這些符號(hào)來(lái)表示單糖,因?yàn)镾NFG法看起來(lái)更加美觀也更加便利。在聚糖的符號(hào)表示法中,每個(gè)符號(hào)代表一種特定的單糖或自然界中發(fā)現(xiàn)的一類(lèi)單糖[33]。例如:通過(guò)ⅠUPAC 表示法可以表示一個(gè)寡糖Rha(a1-6)[Man(a1-6)Glc(b1-3)]Gal(b1-6)Glc(b1-6)[Glc(b1-3)]Gal,其SNFG表示法如圖1所示。

      Fig.1 SNFG representation format of one oligosaccharide圖1 某寡糖的SNFG表示格式

      4 問(wèn)題與展望

      GlyCosmos門(mén)戶(hù)網(wǎng)站是一個(gè)全新全面的聚糖研究門(mén)戶(hù)網(wǎng)站,完全免費(fèi)面向大眾,實(shí)現(xiàn)聚糖研究相關(guān)信息的共享與查詢(xún),為從事相關(guān)領(lǐng)域研究的科研人員提供便捷,多樣的功能在聚糖研究方面具有巨大的應(yīng)用潛力。目前,該網(wǎng)站已經(jīng)成為糖生物學(xué)研究領(lǐng)域的主要工具和手段,已被大多數(shù)相關(guān)學(xué)者接受和認(rèn)可,因此,對(duì)于新加入到糖生物學(xué)領(lǐng)域進(jìn)行研究的新人和相關(guān)研究人員來(lái)說(shuō),該網(wǎng)站可以提供大量幫助,使研究更加便捷。但由于2019年4月1日才成立,GlyCosmos門(mén)戶(hù)網(wǎng)站還有很多問(wèn)題需要解決和完善。首先,作為一個(gè)全面的綜合的聚糖門(mén)戶(hù)網(wǎng)站,由于剛成立不久,用戶(hù)數(shù)量需要擴(kuò)大,以提高聚糖的數(shù)據(jù)量;其次,網(wǎng)站的頁(yè)面及各模塊通道需要美化簡(jiǎn)化,以方便進(jìn)行相關(guān)數(shù)據(jù)的查詢(xún)、上傳及下載;最后,還要不斷優(yōu)化網(wǎng)站,以成為主流的專(zhuān)業(yè)的聚糖研究門(mén)戶(hù)網(wǎng)站。相信隨著計(jì)算機(jī)技術(shù)的進(jìn)步,GlyCosmos門(mén)戶(hù)網(wǎng)站有望在聚糖研究中發(fā)揮出越來(lái)重要的作用。

      猜你喜歡
      表示法凝集素單糖
      有趣的數(shù)字表示法
      海藻多糖的單糖組成對(duì)體外抗氧化活性的影響
      否定意義的四種特殊表示法
      從一道小題聯(lián)想到的整數(shù)表示法
      考試周刊(2016年88期)2016-11-24 21:47:37
      蹄葉槖吾葉多糖提取工藝優(yōu)化及單糖組成研究
      半乳糖凝集素-3與心力衰竭相關(guān)性
      HPLC-ELSD法測(cè)定煙草中單糖含量
      半乳糖凝集素-3在心力衰竭中的研究進(jìn)展
      半乳糖凝集素3與急性缺血性腦卒中的相關(guān)性研究
      藠頭凝集素的分離純化和凝集活性分析
      揭阳市| 呈贡县| 九江县| 松潘县| 东阳市| 墨竹工卡县| 鄂州市| 海原县| 习水县| 万全县| 大厂| 定兴县| 汤原县| 弋阳县| 古浪县| 建湖县| 凭祥市| 红河县| 乌什县| 三都| 于田县| 南靖县| 新田县| 同德县| 镇巴县| 铜川市| 高要市| 竹溪县| 寿光市| 延津县| 滁州市| 汪清县| 鸡东县| 冀州市| 永寿县| 青神县| 衡山县| 长海县| 金昌市| 宁德市| 基隆市|