在過去的20年里,基因組測序技術(shù)的快速進步加速了探索人類基因組各個區(qū)域的遺傳結(jié)構(gòu)的研究。人類基因組的較大區(qū)域由重復的DNA序列組成,專家們將其稱為遺傳“暗物質(zhì)”。長讀測序技術(shù)的發(fā)展使科學家能夠研究這些長的“暗物質(zhì)”序列,并表征它們在遺傳多樣性和進化中的作用。
美國西北大學研究人員發(fā)現(xiàn)了一種新的重復基因簇序列,該序列僅在人類和非人靈長類動物中表達。這是第一個在人類基因組中重復出現(xiàn)的、具有靈長類獨有特性的延長因子。該發(fā)現(xiàn)是人類基因組生物學的一項突破,對未來在轉(zhuǎn)錄調(diào)控、人類進化和重復DNA序列方面的研究具有廣泛意義。這一發(fā)現(xiàn)發(fā)表在2023年的一期《科學進展》上。
當前研究中,在對人類細胞系中的一種抗癌化合物進行表征時,研究團隊偶然發(fā)現(xiàn)了一組以前未被表征的編碼ELOA3蛋白的基因。該蛋白與延伸蛋白A (ELOA)蛋白關(guān)系密切,此前人們已經(jīng)研究了ELOA蛋白在調(diào)節(jié)RNA聚合酶Ⅱ(RNAP Ⅱ)轉(zhuǎn)錄中的作用,RNAPⅡ是基因表達的必需過程。
研究人員表示,一般來說,單個人類蛋白質(zhì)由單一基因編碼,密切相關(guān)的蛋白質(zhì)可能由位于不同染色體位置的不同基因編碼。然而,就ELOA3而言,位于同一基因位點的多個基因編碼相同的蛋白質(zhì)這一特征,使其成為一個有趣的研究對象。
進一步研究發(fā)現(xiàn),ELOA3基因簇是人類和非人靈長類動物獨有的,ELOA3基因重復數(shù)因個體和靈長類物種而異。這些觀察結(jié)果表明,ELOA3基因簇在研究的靈長類物種中經(jīng)歷了協(xié)同進化和基因同質(zhì)化。
利用蛋白質(zhì)生物化學技術(shù),研究團隊發(fā)現(xiàn)ELOA3與ELOA蛋白形成了一種不同的蛋白質(zhì)復合體,通過獨特的生化機制調(diào)節(jié)RNAPⅡ轉(zhuǎn)錄。
研究人員表示,ELOA3作為一種新型靈長類動物特有的RNAPⅡ延長因子,其發(fā)現(xiàn)不僅增強了人們對人類基因組生物學的理解,也為癌癥靶向藥物設(shè)計打開了一扇窗。ELOA3重復簇的動態(tài)性質(zhì)可能反映了它在調(diào)節(jié)個體之間基因表達可變性方面的獨特作用。
人類基因組計劃被譽為生命科學的“登月計劃”。1990年,人類基因組計劃由美國能源部和美國國家衛(wèi)生研究院投資,預(yù)期在15年內(nèi)完成。2001年2月12日,由6國科學家共同參與的國際人類基因組計劃首次公布人類基因組圖譜及初步分析結(jié)果。2003年,研究人員公布了當時被稱為完整的人類基因組序列,但其中有大約8%尚未完全破譯,主要是因為它包含的高度重復的DNA片段難以與其他部分嚙合。
2022年3月31日,《科學》雜志連續(xù)發(fā)6篇論文報告,公布了由國際科學團隊“端粒到端?!保═2T)聯(lián)盟研究出的首個完整無間隙人類基因組序列,填補了近20年來缺失的“拼圖”碎片。
此次發(fā)表的新研究成果則是填補了這部分的空白。研究人員通過新的納米機器設(shè)備與核心技術(shù),得到了被稱為T2T-CHM13的無間隙版本參考序列,這基因組由30.55億個堿基對和1.9969萬個蛋白質(zhì)編碼基因組成。
這是史上第一個完整的、無間隙的人類基因組序列,它首次揭示了高度相同的節(jié)段重復基因組區(qū)域及其在人類基因組中的變異。
美國國家人類基因組研究所的高級研究員亞當·菲利普博士表示,“獲得完整的人類基因組序列就像換上了一副新眼鏡,當我們對某人的基因組進行測序時,我們將能識別所有的DNA變體,并利用這些信息更好地指導醫(yī)療保健工作?!保ňC合整理報道)(策劃/黃李玲)