• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      生物信息學(xué)與計(jì)算機(jī)科學(xué)

      2006-04-19 02:48:00
      計(jì)算機(jī)教育 2006年4期
      關(guān)鍵詞:信息學(xué)計(jì)算機(jī)科學(xué)生物學(xué)

      許 東

      生物信息學(xué)(Bioinformatics)是在20世紀(jì)90年代才出現(xiàn)的一個(gè)新名詞,雖然作為一門新興學(xué)科,但是對(duì)許多計(jì)算機(jī)工作者來(lái)說(shuō)并不陌生。事實(shí)上,生物信息學(xué)已經(jīng)成為計(jì)算機(jī)科學(xué)的一個(gè)重要分支,或者說(shuō)計(jì)算機(jī)科學(xué)是生物信息學(xué)的主要支柱之一。另外兩個(gè)重要支柱則是生物學(xué)和統(tǒng)計(jì)學(xué),數(shù)學(xué)、物理學(xué)、化學(xué)、醫(yī)學(xué),以及工程都與之有密切的關(guān)系。這里筆者主要就生物信息學(xué)與計(jì)算機(jī)科學(xué)的關(guān)系作一點(diǎn)介紹,本文主要是針對(duì)計(jì)算機(jī)科學(xué)的研究者及學(xué)生,特別是對(duì)生物信息學(xué)研究有興趣的人士。

      生物信息學(xué)的定義及興起

      對(duì)于生物信息學(xué)的定義,一直以來(lái)都有不同的看法。目前援引最多的定義是美國(guó)衛(wèi)生部給出的(http://www.bisti.nih.gov/):生物信息學(xué)是一門針對(duì)生物、醫(yī)學(xué)、行為和健康方面數(shù)據(jù)的發(fā)掘,而為相關(guān)的計(jì)算工具及方法進(jìn)行研究、開(kāi)發(fā)及應(yīng)用的學(xué)科,其研究范疇包括對(duì)這些數(shù)據(jù)的采集、表達(dá)、描述、儲(chǔ)存、分析和圖形顯示(“research, development, or application of computational tools and approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, represent, describe, store, analyze, or visualize such data”)。這一定義很具有概括性,并能長(zhǎng)期使用。目前生物信息學(xué)主要研究的對(duì)象還是在生物和醫(yī)學(xué)的數(shù)據(jù)方面,特別是在分子水平上,包括蛋白質(zhì)和核酸的分析。

      生物信息學(xué)的興起是與人類基因組的測(cè)序計(jì)劃分不開(kāi)的,人類基因組又被稱為是我們生命的藍(lán)圖,因?yàn)樗鳛檫z傳的載體,標(biāo)志著人類與其他物種的不同,另外,我們每個(gè)人的基因組的差異在很大程度上決定了個(gè)體的容貌和健康狀況(例如容易得什么?。挠?jì)算機(jī)科學(xué)的角度,我們可以把人類基因組想象成由三十億個(gè)字符串(序列)組成,代表了人體所有約三萬(wàn)個(gè)基因??梢韵胍?jiàn),分析這樣復(fù)雜的序列沒(méi)有計(jì)算機(jī)是不可能的,再加上世界上萬(wàn)千變化的無(wú)數(shù)動(dòng)物、植物、微生物,其中數(shù)以百計(jì)的物種人們已經(jīng)完成了它們的測(cè)序工作,數(shù)萬(wàn)物種的測(cè)序任務(wù)將在今后十年內(nèi)完成。不過(guò)序列只是一個(gè)開(kāi)端,基因組給出的只不過(guò)是一個(gè)類似“元素周期表”的基本單元,正如少數(shù)幾十種化學(xué)元素可以組成豐富多彩的化學(xué)世界, 基因的表達(dá)、修飾及其相互作用, 成為生命現(xiàn)象多彩多姿,奇妙深?yuàn)W的一個(gè)基礎(chǔ)。由于有了基因組這樣一個(gè)“周期表”,人們可以用系統(tǒng)的方法, 例如基因芯片(Microarray)、蛋白組學(xué)(Proteomics)、代謝組學(xué)(Metabolomics)等手段來(lái)跟蹤一個(gè)物種內(nèi)所有基因與其產(chǎn)物的活動(dòng)及作用,這些數(shù)據(jù)比序列來(lái)說(shuō)又不知要大多少。正是這一“數(shù)據(jù)爆炸”使得生物學(xué)成為一門高度量化的科學(xué),并帶來(lái)了生物信息學(xué)的繁榮。

      計(jì)算機(jī)科學(xué)與生命科學(xué)的相互作用

      生物學(xué)的“數(shù)據(jù)爆炸”為計(jì)算機(jī)科學(xué)帶來(lái)了巨大的挑戰(zhàn)和機(jī)遇,傳統(tǒng)的計(jì)算機(jī)科學(xué)一般處理的數(shù)據(jù)要遠(yuǎn)遠(yuǎn)小于這一規(guī)模,如何處理、儲(chǔ)存、檢索、查詢這些龐大的數(shù)據(jù)并非易事。另外,許多生物數(shù)據(jù)中的誤差較大,信噪比甚低,為分析數(shù)據(jù)帶來(lái)了很大的困難。更為主要的是,生物系統(tǒng)比一般的物理,工程系統(tǒng)要復(fù)雜得多,如何從各類數(shù)據(jù)中發(fā)現(xiàn)復(fù)雜的生物規(guī)律和機(jī)制,建立有效的計(jì)算模型,并以這些模型來(lái)進(jìn)行快速的模擬和預(yù)測(cè),指導(dǎo)生物學(xué)的實(shí)驗(yàn),輔助藥物設(shè)計(jì),改良物種用于造福人類可以說(shuō)是計(jì)算生物學(xué)中最賦有挑戰(zhàn)性并最具有影響力的任務(wù)。正是這些挑戰(zhàn)給計(jì)算機(jī)科學(xué)帶來(lái)了新的機(jī)遇,帶動(dòng)了計(jì)算機(jī)科學(xué)大部分領(lǐng)域在生物信息學(xué)中的研究,包括數(shù)據(jù)庫(kù)、數(shù)據(jù)發(fā)掘、人工智能、算法、圖形計(jì)算、軟件工程、平行計(jì)算、網(wǎng)絡(luò)技術(shù)等都被用于生物計(jì)算的研究。特別是對(duì)一些發(fā)展趨于瓶頸的領(lǐng)域,例如模式識(shí)別和機(jī)器學(xué)習(xí),帶來(lái)了全新的生命和生長(zhǎng)點(diǎn),使得這些領(lǐng)域更有用武之地。因此,美國(guó)大多數(shù)研究型的計(jì)算機(jī)系都招聘了以生物信息學(xué)為主的師資,并且開(kāi)設(shè)這方面的課程及專業(yè)。

      計(jì)算機(jī)科學(xué)通過(guò)生物信息學(xué)對(duì)生命科學(xué)的影響日益受到重視,特別值得一提的是生物信息學(xué)在人類基因組測(cè)序中所起的作用。Gene Myers等計(jì)算機(jī)科學(xué)家運(yùn)用巧妙的算法,使得對(duì)人類基因組進(jìn)行全基因鳥(niǎo)槍測(cè)序(Whole genome shotgun sequencing)成為可能,并使之成為各種基因組測(cè)序的通用方法,大大降低了基因組測(cè)序的成本。Gene Myers本人也因此成為美國(guó)科學(xué)院院士,他的貢獻(xiàn)得到科學(xué)界的公認(rèn)。今天,大量生物信息學(xué)的軟件,數(shù)據(jù)庫(kù)已在生物學(xué)中得到廣泛應(yīng)用,例如BLAST, 一個(gè)序列比較的軟件,已經(jīng)成為在生物學(xué)中常識(shí)性的名詞。生物信息學(xué)已經(jīng)是生物學(xué)中不可或缺的一個(gè)重要組成,在許多情況下,生物數(shù)據(jù)的產(chǎn)生變得相對(duì)容易,而對(duì)這些數(shù)據(jù)的分析變得日趨重要和復(fù)雜。當(dāng)然,數(shù)據(jù)的分析在很多的情況下并不是僅靠計(jì)算工作就可以完成的,往往需要進(jìn)行多學(xué)科的合作,比如有時(shí)需要由計(jì)算工作者來(lái)發(fā)現(xiàn)數(shù)據(jù)中一些特征和規(guī)律,由統(tǒng)計(jì)工作者來(lái)分析這些特征規(guī)律的可靠性,并由生物學(xué)工作者來(lái)判斷并作實(shí)驗(yàn)來(lái)驗(yàn)證這些發(fā)現(xiàn)。

      生物信息學(xué)前沿中與計(jì)算機(jī)科學(xué)緊密相關(guān)的研究方向很廣,筆者在此僅舉兩個(gè)例子。第一個(gè)例子是計(jì)算系統(tǒng)生物學(xué)(Computational systems biology),計(jì)算系統(tǒng)生物學(xué)綜合分析各種數(shù)據(jù),把生物體當(dāng)成一個(gè)系統(tǒng)來(lái)進(jìn)行研究,這其中一個(gè)重要的課題是如何從已有的廣泛數(shù)據(jù)里面,特別是基因表達(dá)、蛋白相互作用、基因組序列等數(shù)據(jù)中,建立信息傳導(dǎo)路徑及基因調(diào)控網(wǎng)絡(luò)的模型。另外,如何模擬生物化學(xué)分子的代謝過(guò)程,預(yù)測(cè)在一個(gè)物種中基因改變對(duì)其代謝過(guò)程的影響也是計(jì)算系統(tǒng)生物學(xué)的研究課題。計(jì)算系統(tǒng)生物學(xué)界和實(shí)驗(yàn)科學(xué)結(jié)合可以直接幫助預(yù)測(cè)一個(gè)人得某種病的可能性,根據(jù)病人分子水平的數(shù)據(jù)進(jìn)行對(duì)癥下藥,設(shè)計(jì)基因工程以改造植物提高其產(chǎn)量,增強(qiáng)其抗旱抗病的能力,改造微生物來(lái)生產(chǎn)有益人類的藥物和能源物質(zhì)(如氫氣或乙醇)。第二個(gè)例子是信息的開(kāi)發(fā),現(xiàn)在科研人員越來(lái)越難以掌握層出不窮的文獻(xiàn)資料,經(jīng)常無(wú)法了解到一些對(duì)自己研究課題有價(jià)值的信息,而生物信息學(xué)可以在分子水平上對(duì)數(shù)百萬(wàn)的論文進(jìn)行快速的檢索和查詢,比如兩個(gè)基因的名稱經(jīng)常出現(xiàn)在同一個(gè)論文中,就可以推測(cè)這兩個(gè)基因可能有某種相關(guān)性或相互作用。信息開(kāi)發(fā)的另一途徑是語(yǔ)義網(wǎng)(Semantic Web),它使計(jì)算機(jī)可解釋在網(wǎng)絡(luò)上的文件及數(shù)據(jù)中的內(nèi)容,并提供一種網(wǎng)站之間信息傳遞的共同機(jī)制,這一任務(wù)在生物信息學(xué)中可以通過(guò)基因本體論(Gene ontology)(一套可控的基因功能詞匯)等手段來(lái)實(shí)現(xiàn)。語(yǔ)義網(wǎng)可以使廣大的生物信息學(xué)數(shù)據(jù)庫(kù)和服務(wù)器為單一用戶共同提供資源。

      事實(shí)上,計(jì)算機(jī)科學(xué)對(duì)生物學(xué)的影響并不是單向的,計(jì)算機(jī)領(lǐng)域中廣泛使用的很多方法,如人工智能、神經(jīng)網(wǎng)絡(luò)、遺傳算法等都是起源于生命科學(xué)的概念。隨著對(duì)生命科學(xué)的不斷深入發(fā)展,這類方法還將不斷涌現(xiàn)。比如蟻群算法(Ant colony algorithm)利用螞蟻群覓食的規(guī)律來(lái)解優(yōu)化問(wèn)題就是一個(gè)新的發(fā)展。更為有趣的是人們正在研究螞蟻通過(guò)身體接觸及氣味來(lái)傳遞信息的機(jī)制,并試圖運(yùn)用這些機(jī)制來(lái)有效地管理互聯(lián)網(wǎng)的運(yùn)作(見(jiàn)《自然》雜志,2003年5月1日刊)。還值得一提的是DNA計(jì)算(DNA computing),運(yùn)用DNA及酶的生物化學(xué)反應(yīng)來(lái)解決計(jì)算問(wèn)題,能極大地提高計(jì)算的速度和信息儲(chǔ)存量。

      生物信息學(xué)的入門及深造

      生物信息學(xué),由于其巨大的潛力,無(wú)論是作為基礎(chǔ)研究還是技術(shù)應(yīng)用,對(duì)于有志攻關(guān)的青年學(xué)子,特別是在校的學(xué)生,都不失為一個(gè)好的事業(yè)選擇。生物信息學(xué)中等待攻克的難題要比已解決的問(wèn)題多得多,例如雖然人類基因組的序列已經(jīng)得到,但這三十億個(gè)字符串在很大程度上對(duì)科學(xué)家來(lái)說(shuō)還是一部“天書”,其中絕大部分的奧秘還有待包括生物信息學(xué)工作者在內(nèi)的多學(xué)科科研人員的共同努力來(lái)發(fā)現(xiàn)。另外,生物信息學(xué)的研究當(dāng)前還主要集中在蛋白質(zhì)和核酸的分析,在亞細(xì)胞、細(xì)胞、生物組織、生物體和生態(tài),以及分子水平的數(shù)據(jù)與生物表型、行為的關(guān)系等方面的研究還剛剛起步,未來(lái)生物信息學(xué)將發(fā)展出的新技術(shù),其應(yīng)用潛力也是巨大的。同時(shí),由于生物信息學(xué)課題的多樣性和復(fù)雜性,常常使研究和開(kāi)發(fā)工作者樂(lè)得其中。但另一方面也應(yīng)看到,并不是所有計(jì)算機(jī)專業(yè)的學(xué)生都適合選擇生物信息學(xué)作為自己今后發(fā)展的方向。曾幾何時(shí),略懂些生物信息學(xué)皮毛的人就可以受到重金聘請(qǐng),但生物信息學(xué)通過(guò)這十幾年的發(fā)展,門檻也隨之越來(lái)越高,像其他成熟的學(xué)科一樣,要是沒(méi)有扎實(shí)的功底,在生物信息學(xué)領(lǐng)域發(fā)展今后也會(huì)越來(lái)越難。如果沒(méi)有對(duì)生命科學(xué)有很大的興趣,或者對(duì)多學(xué)科廣泛學(xué)習(xí)的動(dòng)力,生物信息學(xué)未必是一個(gè)合適的事業(yè)取向。

      至于如何培養(yǎng)生物信息學(xué)的專業(yè)人才,目前尚存在著諸多爭(zhēng)議。在美國(guó),設(shè)置生物信息學(xué)專業(yè)的方式有若干種, 有些學(xué)校,例如匹茲堡大學(xué)(University of Pittsburg),成立專門生物信息學(xué)方向的系,而多數(shù)學(xué)校,包括筆者所在的密蘇里大學(xué)哥倫比亞分校(University of Missouri-Columbia),則成立跨系的中心或?qū)W院,其中的師資由各系的教授來(lái)兼任。另外也有不少學(xué)校則由單一系科派生出生物信息學(xué)專業(yè),這些系包括計(jì)算機(jī)系、生物系、醫(yī)學(xué)院、物理系、生物工程系、統(tǒng)計(jì)系、數(shù)學(xué)系等。這些設(shè)置生物信息學(xué)專業(yè)的模式在實(shí)際運(yùn)作中各有長(zhǎng)短,選擇哪一種往往由一個(gè)學(xué)校的具體情況來(lái)定,這些模式會(huì)在今后很長(zhǎng)一段時(shí)期共存。另一方面我們看到,生物信息學(xué)自身也在日趨成熟,已逐漸形成一整套的理論基礎(chǔ)及方法論,在保持著交叉學(xué)科特色的同時(shí),生物信息學(xué)也被廣泛認(rèn)識(shí)到是一門獨(dú)立的學(xué)科,在這一點(diǎn)上,其發(fā)展的軌跡很類似生物物理學(xué)。

      作為在生物信息學(xué)上發(fā)展的學(xué)生,無(wú)論是出于什么樣的專業(yè)設(shè)置,除了生物信息學(xué)的專業(yè)課程,也應(yīng)打下廣泛的相關(guān)基礎(chǔ)。多數(shù)學(xué)者認(rèn)為,一個(gè)能夠獨(dú)立工作的生物信息學(xué)研究開(kāi)發(fā)人員,應(yīng)該具備計(jì)算機(jī)、生物和統(tǒng)計(jì)三方面的良好基礎(chǔ)。也許有些讀者覺(jué)得這樣要學(xué)的內(nèi)容太多,當(dāng)然一個(gè)對(duì)生物信息學(xué)很支持的專業(yè)設(shè)置在一定程度上可以減輕一些課業(yè),比如計(jì)算機(jī)系里并非所有傳統(tǒng)課程都與生物信息學(xué)有很大關(guān)系,編譯器、操作系統(tǒng)等課程或許生物信息學(xué)方向的學(xué)生可以免修。即使這樣,生物信息學(xué)方向的學(xué)生還是要比其他一般專業(yè)的學(xué)生要多學(xué)不少知識(shí),這些知識(shí)一部分可以通過(guò)系統(tǒng)的選課來(lái)獲取,但更多的則需要由自學(xué),讀文獻(xiàn),聽(tīng)報(bào)告,實(shí)際做項(xiàng)目來(lái)實(shí)現(xiàn)。就拿筆者為例,我是物理科班出身,計(jì)算機(jī)、生物和統(tǒng)計(jì)的知識(shí)主要都是在長(zhǎng)期從事生物信息學(xué)研究中積累的。經(jīng)過(guò)這十幾年,我不但從事生物信息學(xué)方法的研究,還可以做生物上的具體應(yīng)用問(wèn)題,也在一個(gè)計(jì)算機(jī)系里承擔(dān)算法、編程、軟件工程等計(jì)算機(jī)基礎(chǔ)課程的教學(xué)任務(wù)。這并不是說(shuō)課程學(xué)習(xí)不重要,課程學(xué)習(xí)的確可以讓人少走彎路,但由于生物信息學(xué)及其相關(guān)領(lǐng)域日新月異的突飛猛進(jìn),再全面的課程設(shè)置也不能涵蓋生物信息學(xué)科研所需的所有知識(shí),保持一個(gè)“活到老,學(xué)到老”的精神是非常重要的。

      展望

      計(jì)算機(jī)科學(xué)和生命科學(xué)可以說(shuō)是本世紀(jì)對(duì)人類影響最大的領(lǐng)域,生物信息學(xué)發(fā)展于兩者之間能起的作用是潛力巨大的。生命科學(xué)的發(fā)展目前是如火如荼,新的技術(shù)層出不窮,生物信息學(xué)也隨之迅猛發(fā)展,不過(guò)這僅是一個(gè)開(kāi)始,更為廣泛的應(yīng)用還在后面。對(duì)應(yīng)計(jì)算機(jī)領(lǐng)域的發(fā)展,直到20世紀(jì)80年代第一臺(tái)個(gè)人電腦的出現(xiàn),才使許多成熟的理論和技術(shù)得以廣泛的使用。在生命科學(xué)中,這樣的“第一臺(tái)個(gè)人電腦”還沒(méi)有來(lái)臨,不過(guò)這也許不會(huì)太遠(yuǎn)了。目前科學(xué)界正在積極研究所謂的“一千美金基因組”的測(cè)序機(jī),也就是說(shuō),只需花一千美金就可以將任何一個(gè)人,任何一個(gè)物種的基因組全部測(cè)出,這樣的測(cè)序機(jī)預(yù)計(jì)在今后十年就可能開(kāi)發(fā)出來(lái)。到那時(shí),基因組序列這樣的高科技就可以像個(gè)人電腦一樣走入尋常百姓家,普通人就可以在自己家中的個(gè)人電腦上看基因組的序列,并用生物信息學(xué)的工具去分析基因組的序列來(lái)了解自己和家人, 這樣的發(fā)展對(duì)社會(huì)各方面的影響之大是無(wú)法想象的。

      國(guó)內(nèi)這幾年在生物信息學(xué)方面有了長(zhǎng)足的發(fā)展,許多大學(xué)紛紛建立生物信息學(xué)專業(yè),很多大學(xué)和科研機(jī)構(gòu)積極開(kāi)展了廣泛的生物信息學(xué)的研究。更為可喜的是,近幾年在國(guó)際生物信息學(xué)主流雜志上不斷有來(lái)自國(guó)內(nèi)的論文發(fā)表,生物信息學(xué)的研究正在對(duì)國(guó)內(nèi)醫(yī)學(xué)及農(nóng)業(yè)的發(fā)展產(chǎn)生重大的影響,也為信息產(chǎn)業(yè)帶來(lái)了機(jī)遇。目前印度的一些公司已開(kāi)始為歐美提供生物信息學(xué)的軟件及服務(wù),我國(guó)在這方面起步較晚,但應(yīng)當(dāng)能夠后起直追來(lái)擴(kuò)大這方面的市場(chǎng)份額。據(jù)估計(jì),生物信息學(xué)科占到生物技術(shù)市場(chǎng)的8%~10%,而目前全球生物技術(shù)的市場(chǎng)已達(dá)到300~400億美元,并以每年約25%的增長(zhǎng)速度在發(fā)展,可見(jiàn)生物信息學(xué)作為高科技其商業(yè)價(jià)值也是不可低估的。

      許東,博士,密蘇里大學(xué)哥倫比亞分校計(jì)算機(jī)系“James Dowell”副教授,“Christopher S. Bond”生命科學(xué)中心研究員。研究方向:生物信息學(xué)。

      猜你喜歡
      信息學(xué)計(jì)算機(jī)科學(xué)生物學(xué)
      谷稗的生物學(xué)特性和栽培技術(shù)
      雞NRF1基因啟動(dòng)子區(qū)生物信息學(xué)分析
      初中生物學(xué)糾錯(cuò)本的建立與使用
      探討計(jì)算機(jī)科學(xué)與技術(shù)跨越式發(fā)展
      初中生物學(xué)糾錯(cuò)本的建立與使用
      初論博物館信息學(xué)的形成
      淺談?dòng)?jì)算機(jī)科學(xué)與技術(shù)的現(xiàn)代化運(yùn)用
      電子制作(2017年2期)2017-05-17 03:55:01
      重慶第二師范學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)簡(jiǎn)介
      PEDF抗腫瘤的生物學(xué)作用
      miRNA-148a在膀胱癌組織中的表達(dá)及生物信息學(xué)分析
      大悟县| 叙永县| 曲沃县| 白银市| 全椒县| 楚雄市| 新化县| 永春县| 兰坪| 富民县| 大石桥市| 南充市| 汾西县| 兴仁县| 乾安县| 澄江县| 大荔县| 凌海市| 邵阳市| 盐山县| 弋阳县| 施秉县| 云龙县| 武鸣县| 新密市| 布尔津县| 固阳县| 庐江县| 仙游县| 柘城县| 浪卡子县| 丁青县| 辉县市| 望都县| 页游| 祁连县| 吐鲁番市| 湾仔区| 大荔县| 宿迁市| 教育|