關(guān) 凡 吳曉敏 黃 河 曾朝陽 熊 煒 范春梅*
(1)中南大學(xué)基礎(chǔ)醫(yī)學(xué)院,長沙 410013;2)中南大學(xué)腫瘤研究所,國家衛(wèi)健委癌變原理重點實驗室和教育部癌變與侵襲原理重點實驗室,長沙 410078)
在過去的幾十年里,隨著DNA 測序技術(shù)的發(fā)展,越來越多的證據(jù)已經(jīng)表明“走出非洲學(xué)說”比“多地區(qū)起源學(xué)說”更加經(jīng)得起推敲。1987年,在科學(xué)家們的追蹤下,發(fā)現(xiàn)20 萬年前生活在非洲的一位婦女是全世界人的祖先。在這里,科學(xué)家們追蹤的是嬰兒的線粒體DNA(mtDNA),眾所周知線粒體DNA 只能通過母親傳給下一代,所以科學(xué)家們最先發(fā)現(xiàn)的便是生活在遠古時代的一位婦女,據(jù)此,便推測人類起源于非洲。為了排除亞洲獨立起源假說,復(fù)旦大學(xué)校長金力及其團隊[1]對來自中國各地的9 988 例男性隨機樣本進行了3個Y 染色體單倍型的基因分型,結(jié)果顯示這些樣本全部都攜帶有來自非洲的“基因痕跡”。這一證據(jù)直接否定了中國獨立起源的假說。除此之外,金力也表示并不是所有走出非洲的原始人類都和現(xiàn)代人的起源有關(guān)系。美國華盛頓大學(xué)的生物學(xué)家Alan R.Templeton 通過研究單倍型樹對人類基因流模式和歷史事件進行了重建,發(fā)現(xiàn)在190萬年前人類祖先發(fā)生了第一次從非洲出走,大約70 萬年前發(fā)生了第二次,第三次出走發(fā)生在大約10 萬年前[2](圖1)。第二次出走的是尼安德特人,第三次出走的一批才是現(xiàn)代人的祖先,這兩批人并不是毫無交集。隨著技術(shù)的發(fā)展,科學(xué)家們通過基因組研究發(fā)現(xiàn),尼安德特人與現(xiàn)代人的祖先在地球上相遇了,并且有了基因的交流。
2022年10 月3 日,瑞典卡羅琳斯卡醫(yī)學(xué)院宣布,將2022年諾貝爾生理學(xué)或醫(yī)學(xué)獎授予瑞典生物學(xué)家斯萬特·帕博,以表彰他在已滅絕人類基因組和人類進化方面所做出的重要貢獻。斯萬特·帕博開創(chuàng)了一門新的學(xué)科——古人類基因組學(xué),該學(xué)科的發(fā)展壯大不斷完善“走出非洲學(xué)說”,同時在研究過程中也開發(fā)了許多新的技術(shù),為更好地研究人類進化提供了技術(shù)支持。他從人口遷徙和種群雜交兩個方面解釋了現(xiàn)代人基因多樣性的來源,從自然選擇的角度詮釋了尼安德特人遺留給現(xiàn)代人基因的生理意義,同時也為研究疾病指引了新的方向。
Fig.1 The ancients left Africa three times圖1 古人類三次走出非洲
作為第二批大規(guī)模走出非洲的人——尼安德特人,一直到1856年才正式被命名。1829年尼安德特人的頭骨化石首次在比利時被發(fā)現(xiàn),直到1856年人們在德國杜塞爾多夫附近尼安德特山谷的一個山洞里又發(fā)現(xiàn)了尼安德特人的頭骨和其他骨骼,這些骨頭的主人才獲得了“尼安德特人”的名稱。相比起來,丹尼索瓦人發(fā)現(xiàn)的時間則遠遠晚于尼安德特人。2008年科研人員在西伯利亞南部阿爾泰山脈的丹尼索瓦洞穴中挖掘出了一具來自少年古人類的遠端手指骨。斯萬特·帕博及其團隊[3]利用這具被發(fā)現(xiàn)的遠端手指骨提取殘留在里面的DNA,并對該古人類的基因組進行測序,覆蓋率大約為1.9倍。結(jié)果表明,這個手指骨主人的DNA是獨一無二的,這顯然是一個既不同于尼安德特人,也不同于現(xiàn)代人的群體,于是將其命名為丹尼索瓦人,他們同樣屬于一個古人類群體,與尼安德特人有著共同的祖先,但卻有著不同的種群(population)歷史。當然,丹尼索瓦人與尼安德特人并不是兩個完全獨立的群體,事實上這兩個群體之間也存在著基因交流。在斯萬特·帕博2018年的研究中,他和他的團隊獲得了丹尼索瓦洞穴中的骨頭碎片“丹尼索瓦11號”,并對其進行了基因組的測序。他們不僅比較了骨頭碎片中的基因組與來自尼安德特人基因組或丹尼索瓦人基因組的衍生等位基因相匹配的DNA 片段的比例,還繪制了基因組中位點的分布圖,發(fā)現(xiàn)丹尼索瓦11 號攜帶一個與阿爾泰尼安德特人基因組相匹配的等位基因,以及一個與丹尼索瓦3號基因組相匹配的不同等位基因[4]。這種結(jié)果就是由尼安德特人與丹尼索瓦人發(fā)生基因交流后產(chǎn)生的,更確切地說,她是尼安德特人母親和丹尼索瓦人父親的后代,也是目前為止發(fā)現(xiàn)的第一代尼安德特人-丹尼索瓦人后代。多方研究共同表明,無論是尼安德特人還是丹尼索瓦人,他們都不是一直處于孤立的狀態(tài),他們也與現(xiàn)代人的祖先存在著基因交流,現(xiàn)代人也依然延續(xù)著他們的基因。
在開展整個研究的過程中,存在各種各樣的問題,有技術(shù)方面的,當然也有因為年代久遠,導(dǎo)致提取到的DNA 存在人為或環(huán)境的污染、含量低等問題,為了讓研究持續(xù)進行,斯萬特·帕博不斷革新技術(shù),讓研究得以從mtDNA 到核DNA 實現(xiàn)飛躍。
1.2.1 硅基質(zhì)純化法
聚合酶鏈式反應(yīng)(PCR)的發(fā)展讓研究已滅絕的物種和過去的種群成為可能,但它面臨著兩方面問題的考驗。一方面是提取物往往含有抑制Taq DNA 聚合酶的成分,導(dǎo)致考古遺跡不能產(chǎn)生可擴增的DNA。另一方面則是聚合酶和微量當代DNA的污染可能產(chǎn)生誤導(dǎo)的結(jié)果。為了更好地提取DNA,基于Boom 等[5]提出的核酸純化方法,斯萬特·帕博及其團隊對該純化方法進行修訂,構(gòu)建了硅基質(zhì)純化法。主要做了兩方面的改進:a.減少處理過程中存在的包括DNA 的污染;b.克服二氧化硅對DNA 雙倍化造成的雙倍污染。改善之后的方法能夠高效提取殘存在骨頭中的DNA,并且考古提取物成分對PCR 的抑制作用也能夠很好地被消除[6]。
1.2.2 利用氨基酸消旋確定內(nèi)源性DNA
依靠PCR 和硅基質(zhì)純化法能夠提取并擴增DNA[7],但是,僅有少數(shù)古代標本含有可擴增的古代DNA,而微量DNA污染造成的假陽性對古人類基因組學(xué)的研究構(gòu)成了嚴重的威脅。為了解決這個問題,斯萬特·帕博及其團隊成功證明了天冬氨酸、丙氨酸和亮氨酸外消旋化的程度可以為評估古代組織樣品是否含有內(nèi)源性DNA提供參考。
除甘氨酸外,蛋白質(zhì)中的所有氨基酸都能以兩種光學(xué)異構(gòu)體的形式存在,即D-和L-對映體,其中L-對映體專門用于蛋白質(zhì)生物合成。氨基酸的外消旋化是指已有特定旋光性的氨基酸轉(zhuǎn)變成另一種旋光性氨基酸的過程。一旦氨基酸從活性代謝過程中分離出來,L-氨基酸就會經(jīng)歷消旋化產(chǎn)生D-氨基酸,直到氨基酸的L-和D-對映體等量存在。斯萬特·帕博及其團隊將分析限定在符合許多真實性標準的9個案例中,并排除了人類遺?。ㄒ驗樽R別來自當代人的污染存在固有的困難)。他們還分析了17個樣本,其中包括無法擴增出古代DNA序列的人類樣本。結(jié)果發(fā)現(xiàn),在D/LAsp 比值高于0.08 的樣品中無法檢索到古代DNA 序列,而所有比值低于0.08 的樣品都產(chǎn)生了古代DNA 序列。這表明天冬氨酸的外消旋化程度可以評估古代組織樣品是否含有內(nèi)源性DNA。以前通過氨基酸的消旋作用,判斷化石的年代和海岸線的變遷[8],現(xiàn)在,在斯萬特·帕博開創(chuàng)性的引領(lǐng)下,可以通過某些氨基酸的外消旋化程度來確定待測樣品中是否含有內(nèi)源性DNA。
1.2.3 選擇mtDNA作為研究切入
人體內(nèi)的mtDNA,有以下幾個特點:一是具有高拷貝數(shù)并且明顯缺乏重組[9],二是具有高替代率[10],三是母系遺傳[11]。鑒于這幾種特點,帕博及其團隊認為mtDNA 是一種對于研究和理解人類進化的有力工具。而且由于進化速度很快,可以用它來對進化過程進行高分辨率分析[10]。然而,幾乎所有基于mtDNA 測序的人類進化研究都局限于控制區(qū),而這個控制區(qū)占線粒體總DNA 不到7%[12]。這個控制區(qū)在生物學(xué)上也被稱作D 環(huán)區(qū),包含在非編碼區(qū)的范疇內(nèi)。為了研究進化譜系,科學(xué)家們又開創(chuàng)了“分子鐘假說”,并且他們認為讓這個分子鐘假說成立的先決條件是對于任意給定的大分子蛋白質(zhì)或DNA 序列在所有演化譜系中的演化速率近似恒定[13]。帕博及其團隊在研究人類進化過程中無法避免地要以該假說為工具。而前面提到的控制區(qū)并沒有在所有人類血統(tǒng)中以恒定的速率進化,但是人類的mtDNA 序列(不包括D 環(huán))的進化速率大致相同,并且和黑猩猩mtDNA 的進化速率也沒有顯著差異[12],表明控制區(qū)對于研究人類進化并沒有太大的意義。因此,為了不讓分析局限于控制區(qū),帕博及其團隊決定對53 名不同來源的人類完整mtDNA 序列進行分析,進而描述人類的全球mtDNA多樣性[12]。2004年,帕博及其團隊對來自德國、俄羅斯和克羅地亞的4個尼安德特人化石的mtDNA 進行檢索,發(fā)現(xiàn)這些個體攜帶了目前人類中尚未發(fā)現(xiàn)的mtDNA。通過與5個早期現(xiàn)代人進行比較發(fā)現(xiàn),這5個早期現(xiàn)代人中沒有一個含有這種mtDNA 序列。結(jié)合已有的mtDNA 數(shù)據(jù),他們認為可以排除尼安德特人對早期現(xiàn)代人類的任何重大遺傳貢獻,但不排除較小貢獻的可能性[14]。2008年,他們還采取高通量測序技術(shù)從38 000 歲的尼安德特人個體中重建完整的線粒體基因組序列,從中得出尼安德特人有效種群規(guī)模很小的結(jié)論[15]。2009年,帕博及其團隊提出了一種古代DNA 序列檢索方法,這個方法不僅有針對性,而且大大減少了樣本破壞和測序需求,他們使用這種方法重建了5個尼安德特人的完整mtDNA基因組,除此之外,他們還做了對mtDNA 蛋白質(zhì)進化的分析,結(jié)合這些數(shù)據(jù)他們最后發(fā)現(xiàn)尼安德特人長期有效種群規(guī)模小于現(xiàn)代人類和現(xiàn)存的類人猿[16]。
由于mtDNA 僅是研究古人類基因組學(xué)的冰山一角,為了更加全面地研究人類進化與起源,在技術(shù)發(fā)展的幫助下,帕博及其團隊逐漸把研究轉(zhuǎn)向了尼安德特人的核基因組。454生命科學(xué)公司提供了一個全新的高通量基因檢測系統(tǒng)。這個系統(tǒng)的優(yōu)勢在于可以在體外分離擴增并檢測DNA,且一次性可以檢測數(shù)百萬堿基中所含的信息?;谶@項技術(shù),斯萬特·帕博團隊將研究重點放在了核基因組的檢測中。由于這項系統(tǒng)每次能產(chǎn)生幾十萬個DNA 拷貝,還可以直接測序。避免了在PCR 中定向選擇時引物錯誤造成的一些影響。最重要的是,其規(guī)避了細菌克隆的需要,因為細菌克隆會損失大量的模板分子。它進一步排除了PCR 中的模板競爭,因為每個分子都是單獨擴增的[17]。這些新技術(shù)使核基因組分析的效率大大提高。
斯萬特·帕博成功測出了尼安德特人的1 000 000個基因,并較為精確推算出尼安德特人與原始智人的分離時間,這使斯萬特·帕博及他的團隊信心大增。于是他提出了新的目標與計劃,要得到尼安德特人基因序列草圖。他在潔凈的實驗室添加了一種新的接頭,這種接頭包含尼安德特人特有的密鑰序列,可以準確識別被確定為尼安德特人骨頭提取液當中的基因序列[18]。這個裝置可以被用來估計尼安德特人化石提取液中內(nèi)源mtDNA 和污染人類mtDNA 的相對數(shù)量[19]以及由堿基對之間的氧化或者錯配導(dǎo)致的基因序列錯誤,從而可以避免很多后續(xù)實驗當中所產(chǎn)生的測序誤差[20],同時,他改進了測序的文庫技術(shù),通過把最后一步實驗用NaOH 處理改為用90°C 孵育處理,讓最后一步的回收率與前面的步驟保持相近。
斯萬特·帕博及他的團隊使用了更新的測序方法,他們使用Ⅰllumina 基因組分析儀來分析DNA序列,這種分析儀是基于并行以及熒光的讀取方法,來對數(shù)百萬序列進行分析,同時可以使用可逆終止子進行迭代測序[21]。這種方法的優(yōu)勢在于解決了測序結(jié)束時總是會出現(xiàn)的堿基對錯配情況(C-T的轉(zhuǎn)變),從而使測序結(jié)果進一步精確。
1.4.1 高覆蓋率的丹尼索瓦基因使種群分離時間被重新估算
斯萬特·帕博團隊在2008年的一塊原始骨頭上發(fā)現(xiàn)了高覆蓋率的(>30 倍)丹尼索瓦人基因[22],不久后又在這個丹尼索瓦人居住過的洞中發(fā)現(xiàn)了一塊人近端腳趾指骨,通過高通量DNA 測序發(fā)現(xiàn),這塊指骨上有高覆蓋率的尼安德特人基因。這項研究成果不僅表明了尼安德特人的活動范圍一直延伸到了西伯利亞的阿爾泰山,還說明了丹尼索瓦人和尼安德特人之間應(yīng)該有基因交流。他們將該基因組與現(xiàn)有的低覆蓋率尼安德特人基因組(包括來自高加索地區(qū)Mezmaiskaya 洞的一個基因組)以及25個高覆蓋率的現(xiàn)今人類基因組進行了比較分析,斯萬特·帕博團隊估計尼安德特人和丹尼索瓦人之間的種群之間的分離(population segregation)是在38 萬~47 萬年前,現(xiàn)代人和尼安德特人/丹尼索瓦人之間的分離時間是在55 萬~76萬年前。
1.4.2 尼安德特人的遺傳多樣性較低
高通量測序在古人類基因組的逐漸推廣使核基因組測序信息逐漸完善。許多尼安德特人的族群信息被斯萬特·帕博團隊分析出來。2014年,斯萬特·帕博小組使用雜交方法從西班牙和克羅地亞的兩個尼安德特人基因組的蛋白質(zhì)編碼部分富集DNA,并將這些序列與高覆蓋率的西伯利亞尼安德特人的基因組一起進行分析。結(jié)果顯示,尼安德特人的遺傳多樣性較低,不同族群之間相互隔離、封閉,發(fā)生較少的基因交流。斯萬特·帕博小組隨后發(fā)表了第三個高覆蓋率的尼安德特人基因組[23],她是來自阿爾泰山Chagyrskaya洞的個體。據(jù)分析,她與來自歐亞大陸西部的尼安德特人的親緣比來自西伯利亞南部的丹尼索瓦洞的尼安德特人親緣更近。這與較為早期的尼安德特人滅絕和尼安德特人從歐亞大陸西部向東部遷徙的事實較為符合。上述研究結(jié)果表明,位于西伯利亞的尼安德特人族群較小,較分散,而居于歐洲的尼安德特人、阿爾泰山的丹尼索瓦人和古代現(xiàn)代人都居住于較大的部落當中。
2.1.1 STAT2對于抗感染的作用
STAT 家族由7個轉(zhuǎn)錄因子組成,每個轉(zhuǎn)錄因子包含7個結(jié)構(gòu)和功能上保守的結(jié)構(gòu)域:N端結(jié)構(gòu)域(NTD)、卷曲螺旋結(jié)構(gòu)域(CCD)、DNA 結(jié)合結(jié)構(gòu)域(DBD)、接頭結(jié)構(gòu)域(LD)、Src同源2結(jié)構(gòu)域(SH2D)、酪氨酸磷酸化位點(pY)和轉(zhuǎn)錄激活結(jié)構(gòu)域(TAD)[24]。STAT2在其核心功能上基因具有高度保守性。
ⅠFNs 由3個主要的亞家族組成,分別為Ⅰ型、ⅠⅠ型和ⅠⅠⅠ型。Ⅰ型干擾素(ⅠFN-Ⅰ)由ⅠFN-β、ⅠFN-κ、ⅠFN-ω、ⅠFN-ε和ⅠFN-α等13種亞型組成;ⅠⅠ型干擾素(ⅠFN-ⅠⅠ)由 單一的ⅠFNγ 組成;ⅠⅠⅠ型干擾素(ⅠFN-ⅠⅠⅠ)由ⅠFN-λ1、ⅠFN-λ2、ⅠFN-λ3[25]和ⅠFN-λ4[26]組成。ⅠFNs 主要由漿細胞、樹突狀細胞產(chǎn)生,以回應(yīng)特異性受體的刺激信號,這些受體位于細胞表面、細胞膜或細胞內(nèi)[27],接受微生物產(chǎn)物或外來核酸的刺激[28]。
酪氨酸的磷酸化會導(dǎo)致兩個相同或者不同的STAT 分子形成同源或異源二聚體(ⅠFN-Ⅰ誘導(dǎo)STAT蛋白酪氨酸殘基磷酸化,通過SH2-pTyr相互作用介導(dǎo)STAT 發(fā)生平行二聚體構(gòu)象的二聚化[29])。在ⅠFN-Ⅰ誘導(dǎo)信號的典型途徑中,STAT1在Tyr701 處的磷酸化和STAT2 在Tyr690 處的磷酸化會誘導(dǎo)平行構(gòu)象中的異質(zhì)二聚體,并與ⅠRF9 相互作用最終形成ⅠSGF3復(fù)合物(圖2)。ⅠSGF3復(fù)合物被轉(zhuǎn)運到細胞核中,在那里含ⅠSGF3 的STAT 二聚體與基因啟動子結(jié)合,特別是ⅠFN-Ⅰ刺激反應(yīng)元件(ⅠSRE),它含有共識序列AGTTTCN2TTTCN,可以激活300 多個干擾素刺激基因(ⅠSG)[30]的轉(zhuǎn)錄,最終提高機體的抗感染能力。
Fig.2 The influence of ancient human gene infiltration on the anti-infection ability of different contemporary races圖2 古人類基因滲入對當代不同人種抗感染力的影響
2.1.2 尼安德特人引入的STAT2單倍型
研究者對6個舊世界人群(比亞卡人(Biaka)、曼登卡人(Mandenka)、桑人(San)、漢人(Han Chinese)、法屬巴斯克人(French Basque)、巴布亞新幾內(nèi)亞人(Papua New Guineans))的STAT2(包括所有的編碼外顯子)進行了重新測序,觀察到存在一種僅限于非非洲人群的單倍型(N),并且它有相對較深的分支。該單倍型與尼安德特人共享衍生的SNP,在非非洲人中產(chǎn)生擴展的連鎖不平衡(LD),并顯示出與尼安德特人序列較高的同源性[31]。并且單倍型N 在巴布亞新幾內(nèi)亞以10 倍的頻率被發(fā)現(xiàn),表明STAT2成為美拉尼西亞人正向選擇的基因之一。N單倍型在西亞人中延伸約130 kb,在一些東亞人和美拉尼西亞人中延伸至約260 kb,產(chǎn)生的LD 比在撒哈拉以南非洲人中觀察到的強得多。從這些數(shù)據(jù)可以得出,現(xiàn)代人在歐亞大陸的祖先與尼安德特人進行基因交流時,引入了這一種在環(huán)境中十分有選擇優(yōu)勢的免疫基因STAT2,并且這種基因的單倍型N在巴布亞新幾內(nèi)亞有著較高的頻率。
2020年,在遺傳關(guān)聯(lián)研究以及來自重癥監(jiān)護中易感性和死亡率的遺傳學(xué)(genomics of mortality in critical care,GenOMⅠCC)聯(lián)盟的數(shù)據(jù)支持下,斯萬特·帕博團隊研究發(fā)現(xiàn),與感染嚴重急性呼吸綜合征冠狀病毒2(SARS-CoV-2)時需要重癥監(jiān)護有關(guān)的來自12 號染色體上某個區(qū)域的單倍型是從尼安德特人遺傳而來的[32]。而該基因組區(qū)域包含3個基因,分別是OAS1、OAS2 和OAS3。這3個基因均位于12q24.1,并且都來自O(shè)AS家族。OAS家族蛋白由OAS1、OAS2、OAS3和OAS 樣蛋白(OASL)組成。OAS1~3 蛋白具有明顯的同源性,它們僅在OAS 單元的數(shù)量上存在差異[33]。作為抗病毒過程中的重要物質(zhì),它們會在干擾素的配合下,一起將病毒消滅。
干擾素是最強大的抗病毒細胞因子,可以誘導(dǎo)像OAS1、OAS2和OAS3這些能夠介導(dǎo)抗病毒效應(yīng)的基因產(chǎn)生相應(yīng)的反應(yīng)。前面提到的3種蛋白質(zhì)均可以通過核糖核酸酶L(RNase L)依賴途徑對入侵的病毒產(chǎn)生抵抗作用。當病毒感染宿主細胞后,病毒的雙鏈RNA(dsRNA)會刺激OAS1、OAS2和OAS3,在干擾素的誘導(dǎo)激活下這些基因會表達,產(chǎn)生寡腺苷酸合成酶,但是此時產(chǎn)生的酶仍以酶原的形式存在[34],所以還需要dsRNA 的激活。寡腺苷酸合成酶在被激活以后會催化2'-5'寡核苷酸的合成,然后激活核糖核酸酶RNase L。激活的RNase L會降解細胞內(nèi)的dsRNA(圖2),同時它也會激活細胞內(nèi)其他抗病毒機制。例如,MDA5 和RⅠG-Ⅰ識別裂解的病毒RNA后,會促進ⅠRF3 和ⅠRF7 的激活,進而引起一系列其他反應(yīng)[33]。除了RNase L 依賴途徑,OAS3 還可以通過另一種途徑發(fā)揮作用,即非RNase L依賴途徑。許多研究都已經(jīng)表明OAS 家族蛋白在對抗RSV、流感病毒、登革熱病毒、HⅠV 等病毒的過程中發(fā)揮了重要的作用[34],當然這其中也包括冠狀病毒。OAS1~3所對抗的病毒范圍相對來說比較廣泛,可以更多地挖掘它們在抗感染方面的潛能。
根據(jù)研究表明,在10 種人類Toll 樣受體中,有3 種在4 號染色體上:TLR10、TLR6、TLR1。這3 種能表現(xiàn)出尼安德特人的高滲透率,并且這3個TLR 基因發(fā)揮著先天免疫的關(guān)鍵作用[35-36]。先天免疫系統(tǒng)提供抵御病原體的第一道防線,參與微生物的早期檢測以及適應(yīng)性免疫反應(yīng)的激活。大多數(shù)TLR 的刺激導(dǎo)致Th1 而不是Th2 分化,Th1 細胞產(chǎn)生干擾素-g(ⅠFN-g)并介導(dǎo)細菌和病毒感染的消除,而產(chǎn)生ⅠL-4 和ⅠL-13 的Th2 細胞參與對抗蠕蟲感染的反應(yīng)。細菌一些獨特的細胞壁成分(如LPS)會刺激免疫細胞并作為病原相關(guān)分子模式(PAMP),被單個TLR 識別。LPS,也被稱為內(nèi)毒素,通常是細胞壁成分中最有效的免疫刺激劑[37]。在革蘭氏陽性和革蘭氏陰性細菌中都存在的脂蛋白和肽聚糖(PG)也是有效的免疫刺激劑。TLR2在檢測革蘭氏陽性菌中起主要作用,并參與識別各種微生物成分,包括LTA、脂蛋白和PG。TLR2 與TLR1、TLR6在物理和功能上相互作用,它們似乎參與識別脂蛋白脂部分的細微變化[36]。白細胞中TLR6、TLR1和TLR10的表達顯著增加。而在現(xiàn)代人中,幽門螺桿菌的血清陽性率降低和對過敏的易感性增加[38]也能說明TLR基因在免疫當中的重要作用。綜上所述,滲入的等位基因可能增強先天免疫監(jiān)視和對某些病原體的反應(yīng)性,但這也可能會增加對非病原體過敏原的超敏性,從而導(dǎo)致當今人類出現(xiàn)過敏性疾病。
在最近的10 萬年當中,尼安德特人和古現(xiàn)代人至少雜交過兩次,在雜交的過程中不可避免地會發(fā)生核基因組的交流,兩類人種當中都會存在對方相應(yīng)的等位基因,在自然的正向選擇當中優(yōu)勢基因會發(fā)生保留,并以相對較高的基因頻率存在于人群當中。然而這些基因交流,其實也就相當于每個物種暴露于對方物種提供的新病毒的環(huán)境下,并且彼此提供對這些病毒抗性的適應(yīng)性等位基因。其中的一類就是病毒互作蛋白(VⅠP)。STAR 分析表明,相比于和DNA 病毒相互作用的VⅠP,和RNA 病毒特異性相互作用的VⅠP在現(xiàn)代歐洲基因組中特別豐富[39]。現(xiàn)在已經(jīng)發(fā)現(xiàn)了20 種已知能與至少10個VⅠP相互作用的人類病毒。相關(guān)病毒傾向使用類似的宿主VⅠP[40],比如與HⅠV相互作用的VⅠP也可能與其他慢病毒相互作用。4 534個人類VⅠPs 與非VⅠPs 相比,VⅠPs 表現(xiàn)出:a.非同義多態(tài)性與同義多態(tài)性的平均比例較低;b.罕見的、可能有害的多態(tài)性比例較高;c. 可能有害的分離變體的密度較高[41]。VⅠP 還在保守基因組片段密度較高的區(qū)域被發(fā)現(xiàn)[42],同時它在人類蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)當中比非VⅠP 有更多相互作用的蛋白質(zhì)伙伴[43]。并且研究表明,因為自然正向選擇使尼安德特人具有高度VⅠPs 富集,并且在VⅠPs 處重疊的片段比與非VⅠPs重疊的片段更長,頻率更高[39]。
總的來說,關(guān)于病毒適應(yīng)性的引入情況,不同地區(qū)的引入率不同或許與不同地區(qū)自然環(huán)境下病毒的正向選擇有關(guān)。原始現(xiàn)代人和尼安德特人之間的基因交流允許特定的病毒VⅠPs 進行跨物種傳播,使雙方物種都具有對特定病毒的抵抗性。在歐洲而不是在東亞的RNA VⅠPs 上的強烈富集表明,這種差異是由亞洲人和歐洲人分離后的脈沖式雜交產(chǎn)生的[44]。
2020年,重度新型冠狀病毒肺炎(COVⅠD-19)全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)組在意大利和西班牙征集志愿者,對符合標準的志愿者進行基因分型和分析。通過做薈萃分析,他們發(fā)現(xiàn)有2個位點與COVⅠD-19 誘導(dǎo)的呼吸衰竭相關(guān)。這兩個位點是3p21.31 和9q34.2。其中3p21.31 位點里包含6個與COVⅠD-19 有關(guān)的基因。這6個 基 因 是SLC6A20、 LZTFL1、 CCR9、FYCO1、CXCR6 和XCR1[45],這6個基因相關(guān)的基本信息和發(fā)揮作用的機制見表1。同年,基于這項研究[45],斯萬特·帕博發(fā)現(xiàn),能加重COVⅠD-19的最相關(guān)遺傳變異均處于高連鎖不平衡狀態(tài),他開始調(diào)查這個位點與古人類有無關(guān)系。他還參考了由COVⅠD-19 宿主遺傳學(xué)倡議(The COVⅠD-19 Host Genetics Ⅰnitiative)發(fā)起的研究[46],分析了1 000個基因組項目中該基因組區(qū)域的所有5 008個單倍型,最后發(fā)現(xiàn)遺留在現(xiàn)代人體內(nèi)的這個位點其實來源于尼安德特人。因此尼安德特人單倍型可能是一些人群中患重癥COVⅠD-19的重要因素。被留下基因印跡的人里,南亞攜帶者頻率最高,歐洲和美國次之,東亞最低。這個發(fā)現(xiàn)或許可以解釋為什么中國人患COVⅠD-19 以后發(fā)展為重癥的比例很低[47]。
Table 1 Basic information of ancient introgressive genes and their mechanism表1 古代滲入的基本信息及發(fā)揮作用的機制
與重癥COVⅠD-19 有關(guān)的這6個基因中有3個基因編碼的蛋白質(zhì)都是趨化因子的受體,分別是CXCR6、XCR1 和CCR9。這3個受體和它們相應(yīng)的配體作為免疫方面信號通路的一部分,介導(dǎo)細胞的趨化性,在機體對抗病原體的過程中發(fā)揮著重要作用[48-50]。其中CCR9 作為β 趨化因子受體家族的一員,目前被證明可以調(diào)節(jié)肺嗜酸性粒細胞的聚集[51],這可能也與COVⅠD-19 有一定相關(guān)性。另外3個基因雖然不與趨化因子直接相關(guān),但也同樣在免疫過程中發(fā)揮作用。作為一種轉(zhuǎn)運體,SLC6A20 主要定位于質(zhì)膜上,主要轉(zhuǎn)運的是脯氨酸[52]。SLC6家族中的轉(zhuǎn)運體需要Collectrin(一種ACE2的同源物,在腎臟氨基酸及Na+轉(zhuǎn)運以及胰島素的分泌等方面具有重要作用)或者血管緊張素轉(zhuǎn)換酶2(ACE2,SARS-CoV-2 細胞表面受體)才能到達細胞表面[53]。SLC6A20 在功能上與ACE2 相互作用,因此研究人員將它視為與COVⅠD-19重癥有關(guān)的候選基因[45]。同時也有研究表明,SLC6A20表達增加可能導(dǎo)致ACE2蛋白水平增加和病毒攝取增加[51]。LZTFL1 在纖毛細胞內(nèi)高度表達,它能夠調(diào)節(jié)氣道纖毛的發(fā)生和功能,這對氣道清除病毒起著重要作用。以COVⅠD-19為例,如果該基因表達減弱,那么纖毛發(fā)揮的作用可能就會受到影響,氣道清除病毒的效率會下降,進而刺激更多SARS-CoV-2在肺部積累,加重病情[54]。除此之外,在病毒感染的過程中,上皮-間充質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT) 會導(dǎo)致SARS-CoV-2 的兩種細胞受體減少:ACE2 和跨膜蛋白酶絲氨酸2(TMPRSS2)。研究表明,LZTFL1水平升高抑制EMT,而LZTFL1 水平降低促進EMT[55]。所以當LZTFL1 表達升高時,EMT 會被抑制,那么前面提到的兩種受體就無法明顯減少,抑制SARS-CoV-2 感染的效率也會大大降低。FYCO1 編碼Rab7 銜接蛋白,它能夠與LC3、PtdⅠns(3)P和Rab7結(jié)合,也能與自噬體外膜結(jié)合,所以研究人員又將它稱為自噬膜和微管以及末端定向分子馬達之間的適配器[56]。同時,F(xiàn)YCO1是連接ER衍生的雙膜囊泡(冠狀病毒的主要復(fù)制位點)與微管網(wǎng)絡(luò)的關(guān)鍵介體[57]。
以上提到的6個基因在不同程度上都與免疫建立了一定的聯(lián)系,抗擊SARS-CoV-2的過程也與免疫密切相關(guān)。目前有許多的研究都在探究它們與COVⅠD-19 的關(guān)系,目前尚未闡明這6個基因具體是如何導(dǎo)致重癥COVⅠD-19的,但可以明確的是該基因簇是COVⅠD-19 患者的遺傳易感位點[45],它們可以成為COVⅠD-19藥物研發(fā)的切入點。
截至2017年,2型糖尿病患者超過4.15億,是全球發(fā)病率和死亡率的主要原因[58]。目前研究人員們已發(fā)現(xiàn)117 種可能導(dǎo)致2 型糖尿病的基因,而SLC16A11基因就屬于其中一個。近年來越來越多的研究表明,SLC16A11 基因與2 型糖尿病密切相關(guān),與前面提到的3號和12號染色體上的兩個基因簇一樣,這個位于17 號染色體的基因同樣來自于尼安德特人[59]。SLC16A11 基因隸屬于SLC16 基因家族,這個家族也被稱作單羧酸轉(zhuǎn)運體家族。SLC16A11 基因作為其中一員,編碼蛋白質(zhì)MCT11,它在肝臟、皮膚、肺、卵巢、乳腺、胰腺等部位中表達[60]??茖W(xué)家們對SLC16 家族做了分類,其中第一類成員的功能是通過質(zhì)子耦合機制運輸簡單的單羧酸,如乳酸、丙酮酸和酮體。SLC16A1、SLC16A3、SLC116A7 和SLC16A8 都歸為第一類成員,在最近的研究中,也發(fā)現(xiàn)SLC16A11是一種質(zhì)子耦合單羧酸轉(zhuǎn)運體,所以它可以發(fā)揮與其他4位成員相似的作用。人體細胞內(nèi)存在著兩種伴侶蛋白,分別是basigin 和embigin,它們都由一個包含保守谷氨酸殘基的單個跨膜結(jié)構(gòu)域、一個短的細胞內(nèi)C端和一個大的糖基化細胞外結(jié)構(gòu)域構(gòu)成,它們需要在SLC16家族第一類成員的幫助下才能到達質(zhì)膜,才能在高爾基體中積累。如果它們的活性降低,可能會導(dǎo)致乳酸流出,進而影響糖酵解速率[58]。在小鼠體內(nèi)被敲除SLC16A11基因,再將變異的SLC16A11基因編碼的異常蛋白轉(zhuǎn)入基因敲除小鼠體內(nèi)后,研究人員發(fā)現(xiàn),小鼠體內(nèi)發(fā)生了脂蛋白的上調(diào),這導(dǎo)致了更多的甘油三酯積累和胰島素抵抗,這說明SLC16A11突變會影響脂質(zhì)代謝的異常功能。在ⅠⅠ型糖尿病患者中開展的研究也同樣發(fā)現(xiàn)甘油三酯在肝組織中堆積,而這種堆積與人類的胰島素抵抗有關(guān),所以研究人員推測SLC16A11變異體可能通過調(diào)節(jié)脂質(zhì)代謝來增加糖尿病風(fēng)險,但如何直接導(dǎo)致代謝紊亂尚不清楚[61]。關(guān)于SLC16A11基因與2型糖尿病的研究還在繼續(xù),無論具體的機制如何,目前的研究都能為科研人員深入研究指明方向,對藥物開發(fā)也提供了一定的指導(dǎo),比如彌補因為SLC16A11 突變導(dǎo)致的功能缺陷。
隨著現(xiàn)代人類遷出非洲,他們遇到了許多新的環(huán)境條件,包括更高的極端溫度、不同的病原體和更高的海拔。這些不同的環(huán)境很可能充當了自然選擇的有效途徑,并促使人們適應(yīng)當?shù)氐沫h(huán)境。最著名的例子之一是西藏人適應(yīng)青藏高原的缺氧環(huán)境[62]。在高原缺氧環(huán)境下選擇的最強信號來自EPAS1,一種參與缺氧反應(yīng)的轉(zhuǎn)錄因子[63]。EPAS1也稱為缺氧誘導(dǎo)因子2α(HⅠF-2α)。HⅠF 轉(zhuǎn)錄因子家族由兩個亞基組成,其中3個交替的α 亞基(HⅠF-1α、HⅠF2α/EPAS1、HⅠF-3α)與由ARNT 或ARNT2 編碼的β 亞基二聚化。HⅠF-1α 和EPAS1 各自作用于一組獨特的調(diào)節(jié)靶點,EPAS1的表達譜包括成人和胎兒肺、胎盤和血管內(nèi)皮細胞。EPAS1中的蛋白質(zhì)穩(wěn)定突變與紅細胞增多癥有關(guān)[64],表明EPAS1與紅細胞生成的調(diào)節(jié)之間存在聯(lián)系。但是在青藏高原EPAS1 基因高表達的個體卻與低紅細胞數(shù)量相關(guān)。紅細胞產(chǎn)生是對缺氧應(yīng)激的常見反應(yīng),可能是EPAS1“西藏等位基因”的攜帶者能夠在高海拔地區(qū)維持足夠的組織氧合,而無需增加紅細胞水平。關(guān)于EPAS1 基因具體在缺氧呼吸時發(fā)揮作用的分子機制還有待考究。
斯萬特·帕博團隊對尼安德特人和丹尼索瓦人的不斷探索與發(fā)現(xiàn),不僅開創(chuàng)了一個古人類基因組學(xué)的新學(xué)科,而且從生物、地理、歷史角度完善了“走出非洲”這一人類進化學(xué)說。他的發(fā)現(xiàn)也給予古生物學(xué)很好的發(fā)展思路和前進方向,不僅加深了研究人員對古生物種群特征的了解,而且為他們的進一步溯源工作提供了良好的基礎(chǔ)。同時該項研究緊緊跟隨時代最新的分子生物學(xué)技術(shù),比如優(yōu)化回收DNA 的手段、高通量測序的普及、完善構(gòu)建基因文庫等技術(shù)。這些新的方法、新的技術(shù)無疑為進一步開展人類基因組溯源提供了更好的途徑。斯萬特·帕博的工作為當代遺傳學(xué)疾病研究、流行病學(xué)調(diào)查、免疫學(xué)等提供了一個新的切入點。面對全球性的疾病爆發(fā),通過人類基因追溯工作,更能洞悉不同地區(qū)人種的基因差異性,有利于合理分配不同地區(qū)的醫(yī)療資源,以及公共衛(wèi)生工作的進一步開展。相信在不久的將來,人們能通過對古人類基因組的研究,更好地理解現(xiàn)代人基因的來源與去向,攻克更多的疑難雜癥,真正讀懂老祖宗留下的信息,更好地去造福后代。