李興
2000年6月26日,人類(lèi)有史以來(lái)的第一個(gè)基因組草圖完成。2001年2月12日,中、美、日、德、法、英等6國(guó)科學(xué)家和美國(guó)塞萊拉公司聯(lián)合公布人類(lèi)基因組圖譜及初步分析結(jié)果,發(fā)現(xiàn)人類(lèi)的功能基因只有2~3萬(wàn)個(gè),數(shù)量只有人類(lèi)基因組的1.5%,其余98.5%的大量基因目前還不知道其遺傳信息的角色和功能。所以過(guò)去曾一度稱(chēng)那些98.5%的功能尚不明確的基因?yàn)椤袄颉薄?/p>
但是,新的研究發(fā)現(xiàn),所謂的垃圾基因并非垃圾,而是有著重要的功能。
DNA元件百科全書(shū)
伊薩克·牛頓早就說(shuō)過(guò),自然不行徒勞之舉,少已夠用,多則何益。既然人類(lèi)約有30萬(wàn)個(gè)基因,它們肯定是“天生我才必有用”,否則就不會(huì)在進(jìn)化中占據(jù)人類(lèi)遺傳信息如此大的空間。
于是,在2003年人類(lèi)基因組計(jì)劃全部完成之際,研究人員也啟動(dòng)了另一項(xiàng)為DNA撰寫(xiě)百科全書(shū)的艱巨任務(wù),探索那些大量的沒(méi)有功能的基因到底有什么作用。這個(gè)計(jì)劃稱(chēng)為ENCODE,意為DNA元件百科全書(shū),也就是探明人類(lèi)基因組中的DNA每個(gè)元件的功能。正如參與ENCODE項(xiàng)目的英國(guó)桑格研究所研究人員珍妮弗·哈羅所說(shuō),如果說(shuō)人類(lèi)基因組計(jì)劃提供了一張地圖,那么ENCODE計(jì)劃就是在這張地圖上標(biāo)出了各個(gè)基因的功能信息。
這個(gè)計(jì)劃的參與者包括美國(guó)、英國(guó)、西班牙等5個(gè)國(guó)家的32個(gè)實(shí)驗(yàn)室的442位科學(xué)家,他們獲得并分析了超過(guò)15兆兆字節(jié)(15萬(wàn)億字節(jié))的原始數(shù)據(jù),目前研究人員已經(jīng)在《自然》雜志發(fā)表6篇文章,在《科學(xué)》雜志發(fā)表2篇文章,在《基因組研究》雜志發(fā)表18篇文章和在《基因組生物學(xué)》雜志發(fā)表6篇文章,全面公開(kāi)了ENCODE計(jì)劃的內(nèi)容??茖W(xué)家對(duì)147個(gè)組織類(lèi)型進(jìn)行了分析,以確定哪些特定的基因能開(kāi)啟和關(guān)閉,以及不同類(lèi)型細(xì)胞之間的基因“開(kāi)關(guān)”存在什么差異。
研究人員認(rèn)為,過(guò)去所稱(chēng)的垃圾DNA(基因)實(shí)際上是一個(gè)龐大的控制面板,這個(gè)控制面板至少包含有400萬(wàn)個(gè)基因的開(kāi)關(guān),在這個(gè)控制面板上可以調(diào)控?cái)?shù)以百萬(wàn)計(jì)基因的活性。如果沒(méi)有這些開(kāi)關(guān)調(diào)控,基因?qū)⒉荒苷9ぷ?,這些區(qū)域的基因也許就會(huì)導(dǎo)致人類(lèi)患病。因此,人類(lèi)基因組的基因至少80%以上都是有功能的。
“垃圾”DNA是如何起作用的?
研究人員早就發(fā)現(xiàn),具有共同的基因未必會(huì)產(chǎn)生相同的蛋白質(zhì)產(chǎn)物,關(guān)鍵在于基因能否被激活或激活的程度是強(qiáng)還是弱。例如,同卵雙生的孿生子具有完全相同的基因組,但是他們即使在同樣的生活環(huán)境下也會(huì)表現(xiàn)出不同的性格,這是因?yàn)樗麄兊幕蚧钚圆⒉幌嗤?,同樣的基因,有些基因活性大,有些活性小。而基因活性的大小則由另外一些基因開(kāi)關(guān)來(lái)控制,這些基因開(kāi)關(guān)在過(guò)去就被視為是“垃圾”基因。
那么,“垃圾”基因是如何發(fā)揮作用的呢?研究發(fā)現(xiàn),人類(lèi)基因組中大約一半的DNA由重復(fù)性基因片段構(gòu)成,其中包括轉(zhuǎn)座子,它能換位到基因組內(nèi)的不同位置,同時(shí)還有反轉(zhuǎn)錄轉(zhuǎn)座子,可被轉(zhuǎn)錄進(jìn)核糖核酸(RNA),之后被重整入基因組DNA。
人類(lèi)基因組中最常見(jiàn)的重復(fù)序列是Alu,由于這種DNA序列中有限制性?xún)?nèi)切核酸酶AluⅠ的識(shí)別序列AGCT,所以稱(chēng)為Alu重復(fù)序列。Alu重復(fù)序列也是反轉(zhuǎn)錄轉(zhuǎn)座子,它擁有超過(guò)100萬(wàn)個(gè)拷貝,占據(jù)了人類(lèi)基因組的大約10%。
美國(guó)愛(ài)荷華大學(xué)醫(yī)學(xué)院的研究人員通過(guò)研究發(fā)現(xiàn),過(guò)去認(rèn)為無(wú)用的重復(fù)性Alu序列其實(shí)是新的外顯子的主要來(lái)源。外顯子是真核生物基因的一部分,它在剪接后仍會(huì)被保存下來(lái),并可在蛋白質(zhì)生物合成過(guò)程中表達(dá)為蛋白質(zhì),而且外顯子是最后出現(xiàn)在成熟RNA中的基因序列,又稱(chēng)表達(dá)序列。所以,外顯子也就是功能基因或者能調(diào)控基因表達(dá)的特殊基因。
Alu是靈長(zhǎng)類(lèi)動(dòng)物特異性的反轉(zhuǎn)錄轉(zhuǎn)座子,它可以制造外顯子,這些外顯子可能有助于形成靈長(zhǎng)類(lèi)動(dòng)物的獨(dú)特特性。研究人員使用擁有將近600萬(wàn)個(gè)探針的高密度外顯子微矩陣技術(shù),用以監(jiān)測(cè)人類(lèi)所有外顯子的表達(dá)模式。對(duì)所得數(shù)據(jù)分析后,研究人員發(fā)現(xiàn),11個(gè)人類(lèi)組織中330個(gè)外顯子是來(lái)源于A(yíng)lu序列。
例如,人類(lèi)的一種基因SEPN1與肌肉營(yíng)養(yǎng)失調(diào)有關(guān)。對(duì)比來(lái)自黑猩猩和短尾猿組織的數(shù)據(jù)發(fā)現(xiàn),一個(gè)來(lái)源于A(yíng)lu的肌肉特異性外顯子是在人類(lèi)和黑猩猩進(jìn)化分離后產(chǎn)生的,這個(gè)外顯子只在人類(lèi)肌肉中高水平表達(dá),但在任何其他人類(lèi)組織或非人類(lèi)靈長(zhǎng)類(lèi)動(dòng)物組織中均不表達(dá),因而才使人類(lèi)患肌營(yíng)養(yǎng)不良疾病。
讓功能基因沉默或表達(dá)
有時(shí)候,“垃圾”基因的功能更重要,因?yàn)樗鼈兪钦{(diào)控功能基因的基因,它們可以讓一些功能基因沉默,也可以讓一些功能基因具有很高的活性,進(jìn)行充分表達(dá),從而產(chǎn)生功能蛋白質(zhì)。基因的調(diào)控手段有一種比較特殊的方式,即對(duì)功能基因進(jìn)行甲基化,如此可以讓一些功能基因沉默。相反,如果不對(duì)功能基因進(jìn)行甲基化,就有可能讓功能基因獲得表達(dá),產(chǎn)生不同的蛋白質(zhì)。
有一種叫柳穿魚(yú)的花卉,大多是對(duì)稱(chēng)的白色花瓣,還有小部分呈現(xiàn)為黃色五角星。一般人面對(duì)白色花瓣和黃色五角星的花時(shí),會(huì)以為這是兩種不同的花卉,但實(shí)際上它們是同一種花卉,它們的基因是一模一樣的。之所以表現(xiàn)為不同顏色和形狀的花卉,不是因?yàn)樗鼈兊幕虿煌?,而是因?yàn)樵诨蛘{(diào)控中有一些基因被甲基化,這些甲基化的基因就會(huì)沉默,不再表達(dá),花朵就變成對(duì)稱(chēng)的白色花瓣。而基因沒(méi)有甲基化時(shí),這種基因就有活性,它所編碼的花的顏色和形狀也不同,成為黃色五角星花卉。
同時(shí),研究人員發(fā)現(xiàn)了大量的由垃圾基因?qū)δ芑蜻M(jìn)行甲基化的調(diào)控?;虻募谆址Q(chēng)DNA甲基化,是一種對(duì)基因的修飾途徑。大量研究表明,DNA甲基化能引起染色質(zhì)結(jié)構(gòu)、DNA構(gòu)象、DNA穩(wěn)定性及DNA與蛋白質(zhì)相互作用方式的改變,從而控制基因表達(dá)。
DNA甲基化主要形成5—甲基胞嘧啶(5—mC)和少量的7—甲基鳥(niǎo)嘌呤(7—mG),而DNA的甲基化可引起基因的失活,即沉默。
RNA也像DNA一樣攜帶著遺傳信息,研究人員最近發(fā)現(xiàn),信使RNA(mRNA)并非像過(guò)去那樣被生物學(xué)家認(rèn)為是DNA和蛋白質(zhì)之間的簡(jiǎn)單中介,它也會(huì)通過(guò)腺嘌呤加甲基的方式而被化學(xué)性修飾。過(guò)去認(rèn)為,mRNA只含4種核苷堿基。但是,新的發(fā)現(xiàn)表明,N6—甲基腺苷(m6A)是mRNA的第五種堿基,它遍布轉(zhuǎn)錄子中。20%的人類(lèi)mRNA可被常規(guī)地甲基化,5000多個(gè)不同的mRNA分子均含有N6—甲基腺苷,這意味著這種修飾可能廣泛地影響著基因如何表達(dá)。
例如,mRNA被甲基化就與肥胖有關(guān)。有一種與肥胖相關(guān)的基因稱(chēng)為FTO,它能編碼一種酶,此酶能將mRNA中N6—甲基腺苷逆轉(zhuǎn)到常規(guī)腺苷。具有FTO基因突變的人有過(guò)度活化的FTO酶,引起N6—甲基腺苷水平低下,食物攝入和代謝異常,從而導(dǎo)致肥胖。全球約10億人具有FTO突變,此突變是肥胖癥及2型糖尿病的主要病因。
現(xiàn)在,研究人員正在研究mRNA的N6—甲基腺苷水平,即甲基化調(diào)控是如何與肥胖和糖尿病相聯(lián)系的,從而可以研制一些藥物以抑制FTO的活性,預(yù)防和治療肥胖和糖尿病。
所以,無(wú)用的基因并不存在,垃圾基因也并非垃圾,而是另有功能,只是過(guò)去人們不知道這些基因的作用而已。當(dāng)所有DNA元件的功能被探索清楚時(shí),就可以撰寫(xiě)出所有DNA的百科全書(shū)。
【責(zé)任編輯】張?zhí)锟?/p>