袁越
DNA是寫在生命體內(nèi)的一本歷史書,記錄了生命進(jìn)化史上發(fā)生的所有大事。如果科學(xué)家們能夠?qū)W會解讀這本生命之書,就有可能穿越到遙遠(yuǎn)的過去,弄清楚每一個生命都是怎么來的。
歷史學(xué)家喜歡以百年為單位,似乎每一個世紀(jì)都有自己的獨到之處。剛剛過去的20世紀(jì)毫無疑問是人類歷史上最重要的100年,而且從第一年開始就精彩紛呈,令人目不暇接。
1900年,一個名叫卡爾·蘭德斯坦納(Karl Landsteiner)的奧地利醫(yī)生發(fā)現(xiàn)了血型的秘密。這項發(fā)現(xiàn)不光是讓輸血變得更加安全,而且從根本上改變了人的分類方式。事實上,這是人類所發(fā)現(xiàn)的第一個屬于生物化學(xué)領(lǐng)域的身體特征,具有嚴(yán)格的科學(xué)定義,和高矮胖瘦這些概念模糊的形容詞很不一樣,更是和種族這個常用標(biāo)簽完全不同。任何人都只能有一種血型,沒有中間狀態(tài),而且一輩子無法更改。
發(fā)現(xiàn)了血型秘密的奧地利醫(yī)生卡爾·蘭德斯坦納
第一個嘗試用血型來分類的人是一個名叫路德維克·赫茲菲爾德(Ludwik Hirszfeld)的波蘭軍醫(yī),他在第一次世界大戰(zhàn)的時候奉命為馬其頓戰(zhàn)場上的士兵測血型,結(jié)果發(fā)現(xiàn)歐洲士兵大部分是A型血,印度雇傭軍則多為B型血。于是他猜測A和B代表兩個原始部落,分別來自北歐和南亞這兩個地區(qū),然后雙方雜交,形成了AB型和O型。他把測量結(jié)果寫成論文,發(fā)表在1919年出版的《柳葉刀》(Lancet)雜志上,但他卻沒有解釋血型到底意味著什么。
無論赫茲菲爾德怎樣解釋肯定都不對,因為隨著血型數(shù)據(jù)的增加,人們很快就發(fā)現(xiàn)他的這個理論是不成立的。人類的基本血型只有4種,分布模式又太復(fù)雜了,根本不適合作為辨別不同人群之間遺傳關(guān)系的依據(jù)。不過,這個思路卻啟發(fā)了新一代人類學(xué)家去尋找更合適的生化指標(biāo),幫助他們?nèi)パ芯咳祟惖钠鹪础?p>
巴黎人類博物館里展出的(左起)長臂猿、猩猩、黑猩猩和人的骨架
上世紀(jì)60年代,出生于新西蘭的美國加州大學(xué)伯克利分校生物學(xué)教授艾倫·威爾遜(Allan Wilson)找到了一個合適的指標(biāo),并在1967年12月出版的《科學(xué)》(Science)雜志上公布了他的發(fā)現(xiàn)。當(dāng)時科學(xué)家們已經(jīng)初步搞清了抗原和抗體的概念,知道如果把一種哺乳動物體內(nèi)的抗原(比如血清球蛋白)打入另一種哺乳動物的身體里,就會刺激后者產(chǎn)生專門針對它的抗體。如果用這種抗體來試驗其他哺乳動物體內(nèi)的類似抗原的話,那么抗原抗體之間的免疫反應(yīng)強度取決于兩種哺乳動物遺傳距離的遠(yuǎn)近,兩者關(guān)系越近,免疫反應(yīng)就越強烈。威爾遜試驗了各種靈長類哺乳動物的免疫反應(yīng),測出了任意兩兩組合之間的反應(yīng)強度,然后依照這個結(jié)果畫出了靈長類動物的進(jìn)化樹。
后來人們知道,抗原和抗體都是由20種氨基酸依照不同的排列方式組成的蛋白質(zhì)分子,免疫反應(yīng)的強度和氨基酸的排列順序有關(guān)。上述實驗測量的其實就是這個排列順序的差異,兩種動物分開的時間越長,差異就越大。
之后,威爾遜又做出了一個大膽而又絕妙的假設(shè),他認(rèn)為氨基酸排列順序的差異度和時間成正比,兩者是一個近乎線性的關(guān)系。于是,每一個蛋白質(zhì)分子都可以被看成是一臺分子鐘,只要測出兩種動物體內(nèi)的同源蛋白質(zhì)分子的差異,就可以推斷出兩者分開的確切時間。
有了這個假設(shè),剩下的事情就簡單了。當(dāng)時考古學(xué)家們已經(jīng)通過化石研究知道了幾種靈長類動物分家的大致時間,威爾士將這幾種靈長類動物的分子差異和分家時間分別作為X軸和Y軸,做成一張曲線圖,然后他把人和黑猩猩的分子差異帶入這張圖,得出結(jié)論說兩者大約是在300萬~500萬年前分家的。
這個結(jié)論立刻引起了廣泛爭議,因為當(dāng)時的考古學(xué)家們大都認(rèn)為人和猩猩是在2000萬~3000萬年前就分開了,500萬年太短了,很難解釋雙方之間看似巨大的差異。于是大家一致認(rèn)為威爾遜的實驗方法出了問題,分子鐘不可靠。要知道,60年代的考古學(xué)界還處于化石和石器研究占主流的階段,這個領(lǐng)域的絕大部分專家都屬于比較傳統(tǒng)的學(xué)者,只相信自己的眼睛,蛋白質(zhì)看不見摸不著,很難讓人信服。
后來我們知道,威爾遜的估算結(jié)果基本準(zhǔn)確,人和猩猩應(yīng)該是在600萬~700萬年前分家的。兩者之間的遺傳距離也遠(yuǎn)沒有大家想象的那么大,基因?qū)用嬷挥?%的差別。不過,考古學(xué)家們的質(zhì)疑也是有道理的,蛋白質(zhì)并不是一個好的分子鐘,尤其和放射性同位素時鐘相比缺點非常明顯。一來免疫反應(yīng)強度是個相對模糊的概念,并不能準(zhǔn)確地反映出氨基酸順序的差異。二來氨基酸順序的變異并不完全是中性的,很可能會受到環(huán)境因素的影響而變得不準(zhǔn)確。
左圖:有了DNA工具后,就可以很清楚地知道黑猩猩才是距離人類最近的靈長類動物
饒是如此,用蛋白質(zhì)分子鐘來測年的技術(shù)仍然可以稱得上是一項絕妙的發(fā)現(xiàn),因為古老的蛋白質(zhì)很難獲得,只能用活動物的蛋白質(zhì)去倒推祖先的生活軌跡,其難度可想而知。相比之下,同位素測年法用的是古老的樣本,無論是測量原理還是實驗方法都要比分子鐘更容易理解。
面對考古學(xué)家們的質(zhì)疑,威爾遜并沒有放棄,他堅信分子鐘測年法的邏輯是正確的,只是蛋白質(zhì)分子不太適合干這個罷了。他需要找到一種分子,既要有相對恒定的變化速率,還要有很高的分辨率。天底下哪有這么好的事情?答案是真的有,這就是大家耳熟能詳?shù)腄NA。
1953年,DNA雙螺旋結(jié)構(gòu)被發(fā)現(xiàn),遺傳的秘密從此大白于天下。簡單來說,DNA是一種線性的生物大分子,由ATCG這四種核苷酸首尾相連而成。幾乎每一個人體細(xì)胞內(nèi)都含有46個這樣的DNA分子,它們被稱為染色體。這46條染色體兩兩對應(yīng),一共有23對,每對染色體中有一條來自父親,另一條來自母親。
如果我們把每一個生物體看作一幢由蛋白質(zhì)組成的大廈,那么DNA分子就好比是攜帶著建筑信息的圖紙,其中負(fù)責(zé)編碼蛋白質(zhì)結(jié)構(gòu)的那部分DNA被稱為基因。人體內(nèi)一共有大約2萬個基因,它們合起來被稱為基因組,總長度只占染色體總長度的1.5%。每一代生物體都會把建筑圖紙的內(nèi)容通過DNA復(fù)制的形式傳遞給下一代,生物性狀就是這樣一代一代地遺傳下去的。DNA拷貝的準(zhǔn)確性非常高,但偶爾也會出差錯,如果某個錯誤錯得恰到好處,那么它就會被大自然挑中,將錯就錯地繼續(xù)遺傳下去,這就是達(dá)爾文進(jìn)化論的本質(zhì)。
正是因為DNA復(fù)制差錯無處不在,所以地球上除了極少數(shù)微生物和病毒之外,沒有兩個生命體是完全相同的,大自然用這種方式為每個生命貼上了獨有的DNA標(biāo)簽,遠(yuǎn)比膚色或者血型之類的標(biāo)簽要精準(zhǔn)得多。人類學(xué)家們只要掌握了DNA標(biāo)簽的解讀方式,就可以精確地比較人和人之間的遺傳關(guān)系,從而更好地推斷出人類這個物種的進(jìn)化史。
比如,以前的人們不敢肯定到底是黑猩猩距離人類近還是紅毛猩猩距離人類近。有了DNA工具后,這個問題就變得很容易解決了。只要比較一下三者的DNA序列,就可以很清楚地知道黑猩猩才是距離人類最近的靈長類動物。
對于我們要講的這個人類起源故事來說,DNA分子還有一個特性更重要,那就是有些DNA段落是搭基因的順風(fēng)車而來的,它本身不編碼任何蛋白質(zhì),也不具有任何調(diào)控能力,不會對生物的性狀或者適應(yīng)環(huán)境的能力帶來任何影響,這樣的DNA段落被稱為“垃圾DNA”。雖然名字很糟糕,但其實垃圾DNA片段的復(fù)制方式和非垃圾片段是一樣的,出錯的概率也是一樣的。
更妙的是,DNA復(fù)制的差錯率是一個相對恒定的生物學(xué)特性,和生物的年齡、健康狀況及生存環(huán)境等等因素關(guān)系不大。于是,只要我們能測出祖先DNA的順序,再和當(dāng)代DNA加以對照,就可以計算出兩者之間經(jīng)過了多長的時間了。舉例來說,如果我們測出了某種生物的DNA順序,又想辦法得到了它的祖先的DNA順序,發(fā)現(xiàn)兩者有100萬個差別。已知這種生物的DNA突變率大約為每代100個,我們就可以計算出兩者之間相差了1萬代。如果我們再假定每代之間相隔25年,就可以推斷出這種生物從祖先發(fā)展到今天一共用時25萬年。
右圖:紅毛猩猩曾經(jīng)被認(rèn)為是距離人類最近的靈長類動物
上述算法和碳-14測年法的原理是類似的,不難理解。兩者的差別在于,碳-14所測的古代樣本是可以得到的,祖先的DNA順序可就沒那么容易測出來了。不過,這點困難可難不倒科學(xué)家們,他們改進(jìn)了算法,只需要測出當(dāng)代生物的DNA序列,就可以通過數(shù)學(xué)推理的方式推測出物種進(jìn)化的大致路徑和年代。
為了更好地解釋這個方法的妙處,讓我們舉一個現(xiàn)實生活中的例子。改革開放前的大陸不允許進(jìn)口港臺書籍,于是金庸小說只能以盜版的方式在大陸擴散,請問如何才能通過分析這些盜版書籍搞清它們的擴散路徑和時間呢?
首先我們必須假定所有盜印設(shè)備都會出錯,而且這種錯誤的出現(xiàn)概率很低,同一個錯誤很難出現(xiàn)兩次。其次,我們還要假定盜版商審稿不嚴(yán),錯字不會被發(fā)現(xiàn),而是繼續(xù)將錯就錯地傳播了下去。有了這兩個假設(shè),緝私局的偵探們就可以開始工作了。
假設(shè)他們發(fā)現(xiàn)廣東省收繳上來的盜版書錯誤種類最多,其他各省的錯誤種類不但要少得多,而且大都可以在廣東省盜版書中找到,于是偵探們有理由相信,盜版書首先是從廣東省開始出現(xiàn)的,而且一定是先在廣東省內(nèi)流傳了很長的時間,積累了大量錯誤,然后才流到其他省份去的。
其次,如果福建、浙江、江蘇和山東省境內(nèi)收繳的所有盜版書都有同一個錯字,其他省份沒有這個錯字。在此基礎(chǔ)上,浙江、江蘇和山東省境內(nèi)的盜版書里全都有另一個錯字,其他省份沒有……以此類推,那么偵探們有理由相信這幾個省份的盜版書是按照福建、浙江、江蘇、山東這樣的順序流傳開來的。
第三,假定我們事先知道盜版設(shè)備的錯誤率,又知道了山東省和甘肅省境內(nèi)的盜版書相互之間一共有多少不一樣的錯誤,偵探們就可以大致算出山東盜版書和甘肅盜版書距離它們共同的源頭到底經(jīng)過了多少輪復(fù)制。具體的算法比較復(fù)雜,這里就不詳細(xì)寫了。另外,偵探們不必去統(tǒng)計所有的金庸小說,只要能統(tǒng)計出某一本小說,甚至某一個章節(jié)的錯誤率就可以大致估算出來了。當(dāng)然了,統(tǒng)計的書目越多,這個估算就越精確。
具體到DNA分子鐘這件事上,上述假定都是成立的。首先,DNA復(fù)制會出錯,大約每復(fù)制10億個核苷酸會出一次差錯。這樣算下來,每個人一生中會出現(xiàn)70個全新的基因變異。不過大家不用害怕,要知道每個人的基因組里都有大約60億個核苷酸,如果把這60億個字母印成一本書的話,按照每頁印3000個字母的標(biāo)準(zhǔn)來計算,這將是一本200萬頁的巨著,所以說這70個錯誤對于每個人來說幾乎可以忽略不計。
目前全世界所有人的單個核苷酸復(fù)制錯誤加在一起一共有600萬個左右,相當(dāng)于每1000個核苷酸就會出現(xiàn)一個不一樣的字母,科學(xué)術(shù)語稱為“單核苷酸多態(tài)性”(簡稱SNP)。SNP是人類DNA序列差別的最主要的表現(xiàn)形式,世界上之所以不存在兩個一模一樣的人,主要原因也在于此。
不過,所有這些SNP當(dāng)中,絕大部分都是所謂的“中性突變”,既不好也不壞。這類中性SNP在人群中的擴散機制主要是以遺傳漂變(Genetic Drift)的形式(而不是自然選擇)進(jìn)行的,我們可以簡單地理解為“全憑運氣”。這個想法最早是由日本遺傳學(xué)家木村資生提出來的,他也因此而被公認(rèn)為是群體遺傳學(xué)的奠基人之一。這套理論解釋起來需要用到大量的數(shù)學(xué)知識,一般人不必理會。我們只需知道DNA分子之所以能夠被當(dāng)成分子鐘來使用,原因之一就是木村資生的這套“中性理論”。
其次,人類染色體DNA的突變率是非常低的,通常情況下一個字母發(fā)生突變之后,再在同樣的地方發(fā)生第二次突變的概率低到可以忽略不計。所以我們可以不必考慮這種情況,以最簡單的方式來解釋任意兩人之間的遺傳關(guān)系。這個方法的理論基礎(chǔ)就是著名的“奧卡姆剃刀”原理,即“如無必要勿增實體”。這是群體遺傳學(xué)家們進(jìn)行數(shù)學(xué)計算之前的重要前提,一般人也不必深究,只需知道這個奧卡姆剃刀是DNA分子鐘的另一個理論基礎(chǔ)就行了。
有了這兩個理論做基礎(chǔ),剩下的事情就相對簡單了。威爾遜再次成為第一個吃螃蟹的人,正是他在1987年發(fā)表的一篇論文,打開了基因?qū)ぷ娴拇箝T,從而徹底改變了人類進(jìn)化史研究的進(jìn)程。
上世紀(jì)50年代,有“中國遺傳學(xué)泰斗”之稱的談家楨(左)教授指導(dǎo)學(xué)生觀察細(xì)胞結(jié)構(gòu)
1987年1月出版的《自然》雜志刊登了一篇重磅論文,作者是威爾遜以及在他手下工作的博士生麗貝卡·卡恩(Rebecca Cann)和馬克·斯通金(Mark Stoneking)。這篇論文通過對人類線粒體DNA多態(tài)性的研究,得出結(jié)論說全世界所有現(xiàn)代人的母系祖先都可以追溯到15萬年前的非洲,我們都是同一位非洲女性的后代。
這篇論文好似一枚炸彈,把全世界都炸醒了。各國媒體不約而同地把這條消息放在了頭條的顯著位置,有人借用《圣經(jīng)》里的概念,稱這位非洲女性為“線粒體夏娃”。威爾遜雖然不喜歡這個帶有宗教意味的說法,但無法阻止它迅速流傳開來。不用說,以英國人類學(xué)家斯特林格為代表的“取代派”高聲歡呼,認(rèn)為自己的理論得到了最權(quán)威的DNA數(shù)據(jù)的支持。與之對立的“連續(xù)進(jìn)化派”也迅速做出反應(yīng),對這篇論文的科學(xué)原理和計算方法提出了質(zhì)疑。威爾遜認(rèn)真聽取了各方的反對意見,增加了新的數(shù)據(jù),改進(jìn)了計算方法,重新又算了一遍,但結(jié)果依然維持原樣,我們所有人的母親仍然是一位“幸運的非洲媽媽”。
這個結(jié)論是怎么得出來的呢?讓我們先從線粒體開始說起。這是一種體積比細(xì)胞還小的細(xì)胞器,專門負(fù)責(zé)為細(xì)胞提供能量。有證據(jù)表明線粒體是遠(yuǎn)古時代的細(xì)胞捕獲的一種微生物,這就是為什么它會自帶DNA的原因。
線粒體之所以能成為基因?qū)ぷ娴耐黄瓶?,和線粒體DNA的兩個特性有關(guān)。第一,線粒體DNA嚴(yán)格遵循母系遺傳的規(guī)則,只從母親傳給子女,父親幾乎沒有做出任何貢獻(xiàn)。這樣一來科學(xué)家就不用考慮基因重組的問題了,大大簡化了計算和推理的過程。如果再用金庸盜版書舉例的話,這就好比說盜版商把每一章的影印工作分包了出去,然后再統(tǒng)一收集起來裝訂成一本盜版書,警察分不清哪一章來自哪里,這就給偵緝工作增加了很多困難。而線粒體就好比是金庸寫的那本最短的小說《越女劍》,從來沒有被分拆過,歷史很清白,分析起來要容易得多。
第二,線粒體DNA的復(fù)制精確度比常染色體DNA低,糾錯系統(tǒng)的工作效率也較染色體DNA為低,其結(jié)果就是線粒體DNA的突變率大約是常染色體DNA的10倍,直接導(dǎo)致線粒體的遺傳多樣性要比常染色體高出很多。人類常染色體每1000個核苷酸才有一個突變,線粒體DNA的高變區(qū)每100個核苷酸就有一個突變。從群體遺傳學(xué)家的角度看,這就意味著線粒體分子鐘走得比常染色體分子鐘要快,如果研究對象的年代不那么遙遠(yuǎn),可供分析的數(shù)據(jù)就變多了,分析結(jié)果的準(zhǔn)確性就會大大提高。如果拿放射性同位素測年法來做個對比的話,線粒體DNA就相當(dāng)于半衰期較短的同位素,更適合用來研究近代發(fā)生的事件。
以上分析都屬于紙上談兵,具體做起來難度相當(dāng)大。上世紀(jì)80年代的時候,DNA測序還是一件非常困難的事情,不但實驗程序復(fù)雜,而且價格昂貴,一般人是測不起的。幸虧加州大學(xué)伯克利分校有眼光,給了威爾遜足夠多的研究經(jīng)費,支持他測量了134個人的線粒體DNA序列。為了方便起見,這134個志愿者都是從美國國內(nèi)找的,好在美國是個移民國家,可以找到來自世界各地的“純種”的少數(shù)民族,足以代表世界上幾個比較大的族群了。
線粒體DNA雖然很小,但也有1.67萬個核苷酸,全測一遍是不可能的。威爾遜選擇了其中的一個總長度為500個字母的控制區(qū),這個區(qū)對于線粒體的功能沒有影響,區(qū)內(nèi)的所有突變都是木村資生所說的中性突變,最適合用來進(jìn)行分類和尋祖。
分析結(jié)果顯示,非洲人在控制區(qū)內(nèi)的基因突變種類最多,其他族群的基因多態(tài)性不但少了很多,而且所有非非洲人(指除了撒哈拉沙漠以南非洲之外的所有地方的人)的突變類型都可以在非洲人群中找到,說明所有非非洲人的母系祖先都來自非洲。非洲的那幾個基因類型也都可以追溯到同一個母系祖先那里去,這說明所有的現(xiàn)代人的母系祖先都來自同一個非洲部落。
所有非非洲人的基因突變類型還可以一級一級地細(xì)分下去,從而畫出人類走出非洲的路線圖。有了這個路線圖之后,威爾遜就可以判斷出哪些位點是從非洲帶來的野生型,哪些是后來突變產(chǎn)生的。然后他又通過其他辦法估算出了線粒體DNA的突變率,將其帶入一套算法,算出所有人類共同的母系祖先生活在距今14萬~20萬年的非洲。
這個年代估算是線粒體夏娃理論當(dāng)中最關(guān)鍵的數(shù)據(jù),因為前文說過,人類祖先源自非洲這件事是沒有爭議的,大家爭議的是現(xiàn)代人到底是從哪里來的。如果所有現(xiàn)代人共同的祖母只有不到20萬年歷史的話,“多地起源”理論就不成立了。事實上,這就是線粒體夏娃理論被多地起源學(xué)派攻擊得最厲害的地方,很多人都在想辦法找出分子鐘的漏洞來。但是,這么多年爭論下來,大家只是對分子鐘的準(zhǔn)確性做了一些必要的修正,這個理論整體上依然是沒有問題的。
隨著DNA測序技術(shù)的進(jìn)步,科學(xué)家所能研究的線粒體DNA越來越長,采樣的范圍越來越廣,數(shù)據(jù)量也成倍上升,但主要結(jié)論依然沒變。那篇論文剛發(fā)表時,在埃塞俄比亞挖到的現(xiàn)代智人奧莫化石的測年結(jié)果還是13.5萬年,論文發(fā)表若干年后這個結(jié)果被修正為19.5萬年,為線粒體夏娃理論提供了重要的化石證據(jù)。目前國際學(xué)術(shù)界普遍認(rèn)為人類共同的母系祖先最晚可以追溯到距今20萬年前的非洲,也就是說,如果地球上的每個人都能坐上時光機一代一代地往回穿越,最終大家會發(fā)現(xiàn)所有人的曾曾……曾祖母都是同一個人。
到底有多少個“曾”字呢?如果拿20萬年來計算的話,假定每25年更新一代,那么答案是8000代。這是個超出一般人想象的數(shù)字,這就是為什么歷史學(xué)家們通常用“深邃”這個詞來形容漫長的史前時代。
必須指出的是,這個結(jié)論并不意味著當(dāng)時這個非洲部落里只有一名女性。事實上,群體遺傳學(xué)研究認(rèn)為這個部落很可能有上千人之多,其中肯定有幾百名育齡女性。但是她們要么沒有生下女兒,要么生下的女兒沒有接著生下女兒,導(dǎo)致她們的線粒體都沒有傳下來,這就是為什么威爾遜一直把這位女性稱為“幸運的非洲媽媽”,而不是夏娃。
威爾遜完成的這個線粒體尋祖實驗是群體遺傳學(xué)歷史上最經(jīng)典的研究之一,具有劃時代的意義。如今,利用DNA分子多態(tài)性來構(gòu)建某種生物的遺傳史已經(jīng)成為群體遺傳學(xué)領(lǐng)域最重要的工具,計算流程已經(jīng)高度標(biāo)準(zhǔn)化了。這套工具需要用到復(fù)雜的數(shù)學(xué)知識,但其理論基礎(chǔ)就是前文提到的“中性理論”和“奧卡姆剃刀”原理。反對者也大都會從這兩個理論著手,質(zhì)疑這套工具的正確性。比如中國就有一位大學(xué)教授宣稱自己找到了這套理論的錯誤,而且一直在四處辦講座宣傳自己的那套理論,可惜他關(guān)于此事所寫的論文并沒有被任何一家采用同行評議制度來審稿的主流科學(xué)期刊所采納,只能說是自說自話而已。事實上,目前尚未出現(xiàn)任何一種質(zhì)疑能夠被大多數(shù)群體遺傳學(xué)家所接受,所以我們?nèi)匀徽J(rèn)為這兩個理論是正確的,這套計算工具仍然是可信的。
值得深思的是,線粒體夏娃理論提出之后的頭10年里,中國學(xué)術(shù)界一直沒什么反應(yīng)。一方面是因為當(dāng)年大部分中國考古學(xué)家都是支持“連續(xù)進(jìn)化附帶雜交”理論的,大家不約而同地選擇對這個不利于自己的證據(jù)保持沉默。從另一方面講,上世紀(jì)80年代的中國正處于百廢待興的時期,有很多遠(yuǎn)比人類起源更加迫切的問題需要解決,沒多少人有閑心去關(guān)心自己祖先的事情。最終還是一位在美國留學(xué)的中國學(xué)者意外地闖入了這個新興領(lǐng)域,沒想到卻掀起了一場更大的波瀾。
在講述亞當(dāng)?shù)墓适轮?,必須先來談?wù)勥z傳學(xué)在中國的遭遇。上世紀(jì)50年代,遺傳學(xué)也曾經(jīng)像今天的人類進(jìn)化領(lǐng)域一樣,分成了互相抵觸的兩大學(xué)派。一派的代表人物是蘇聯(lián)的植物育種專家米丘林,另一派則是果蠅遺傳學(xué)的奠基人摩爾根。中國因為政治的原因選擇站在了米丘林一邊,當(dāng)年中國大學(xué)生物系的遺傳學(xué)教材都是從蘇聯(lián)照搬過來的。摩爾根學(xué)派在中國遭到了殘酷的打壓,唯一的原因就是摩爾根是美國人。
摩爾根有個學(xué)生名叫杜布贊斯基,前文曾經(jīng)提到過他。杜布贊斯基招過一位來自中國的研究生,名叫談家楨。新中國成立后談家楨博士回國任教,擔(dān)任了復(fù)旦大學(xué)生物系的系主任。正是因為談家楨的緣故,復(fù)旦大學(xué)決定繼續(xù)講授摩爾根遺傳學(xué),為中國的遺傳學(xué)研究保留了唯一的火種。
改革開放之后,或者更準(zhǔn)確地說,是“冷戰(zhàn)”結(jié)束之后,中國學(xué)術(shù)界終于承認(rèn)摩爾根遺傳學(xué)是正確的。因為談家楨留下的班底還在,所以復(fù)旦大學(xué)生物系遺傳專業(yè)迅速成為全國最佳,培養(yǎng)了一大批優(yōu)秀的人才,現(xiàn)任復(fù)旦大學(xué)副校長的金力博士就是其中之一。他在1985年和1987年分別在復(fù)旦大學(xué)生物系拿到了遺傳學(xué)學(xué)士和碩士學(xué)位,然后赴美留學(xué),于1994年在得克薩斯大學(xué)拿到了博士學(xué)位。畢業(yè)后他立即前往斯坦福大學(xué),在著名的意大利裔人類遺傳學(xué)家路易吉·盧卡·卡瓦利-斯福扎(Luigi Luca Cavalli-Sforza)實驗室做博士后,主攻群體遺傳學(xué)。
“我那時候的主要興趣是疾病的群體遺傳學(xué),非常希望研究對象盡可能地‘純,這樣研究起來會更方便。但實際人群都是‘雜的,所以我想對實際人群到底有多雜做一個分析評價,于是便開始關(guān)注Y染色體?!苯鹆Σ┦吭谒霓k公室接受了我的采訪,“當(dāng)時線粒體的遺傳多樣性已經(jīng)做了好幾年了,但線粒體畢竟太小,而且獨立于細(xì)胞核之外,應(yīng)用范圍有限。Y染色體也是單線遺傳的,不必考慮重組問題,所以我覺得Y染色體也許是一個機會,可以幫助我解決問題?!?/p>
前文說過,人體一共有46條染色體,它們分成23對,除了X和Y這兩條性染色體之外,其余的22對常染色體是一一配對的。性細(xì)胞在減數(shù)分裂的過程中會發(fā)生基因重組,也就是一對染色體中相對應(yīng)的段落彼此互換位置,以此來增加遺傳多樣性。據(jù)統(tǒng)計,人類的每一代平均會發(fā)生36次基因重組,每條染色體發(fā)生一次多一點,如此累計下來,只需幾代之后,染色體就混雜得分不清哪塊來自父親,哪塊來自母親了,導(dǎo)致基因分析的工作量大大增加。X和Y染色體只有極少部分是對應(yīng)的,基本上不會發(fā)生基因重組,所以Y染色體的遺傳方式和線粒體類似,都是單線遺傳的,只不過這次是從父親傳給兒子,和母親無關(guān)。所以,沿著Y染色體這條線,最終找到的是人類共同的父系祖先,西方媒體習(xí)慣性地稱為亞當(dāng)。
對于科學(xué)研究這件事,普通人往往只看原理和結(jié)果,不關(guān)心過程。科學(xué)家則正相反,因為他們才是真正做實驗的那個人。尋找Y染色體亞當(dāng)?shù)睦碚摶A(chǔ)雖然和線粒體夏娃差不多,但Y染色體和線粒體很不一樣,實驗過程要困難很多倍。首先,一條Y染色體上含有將近6000萬個核苷酸,比線粒體大了3600多倍,對于當(dāng)年的DNA測序技術(shù)來說,這是個龐然大物,極難對付。其次,Y染色體是位于細(xì)胞核內(nèi)的“正規(guī)”染色體,其DNA復(fù)制的精確度比線粒體高很多倍,導(dǎo)致Y染色體上的SNP突變頻率要低很多,找起來非常困難。當(dāng)時全世界只發(fā)現(xiàn)了一個Y染色體SNP,遠(yuǎn)遠(yuǎn)不夠。
雖然明知山有虎,但金力偏向虎山行。但他冥思苦想了很長時間,始終找不到解決辦法,最終是一位分析化學(xué)專業(yè)的博士后幫了金力的大忙?!拔蚁矚g喝咖啡,和另外一間實驗室的一個同樣喜歡喝咖啡的奧地利人交上了朋友。”金力回憶道,“他叫皮特·歐芬納(Peter Oefner),專業(yè)是高壓液相色譜(HPLC)。當(dāng)時他正在嘗試用‘變性高壓液相色譜(DHPLC)技術(shù)來分離DNA短片段,這項技術(shù)速度快、效率高,可以不必通過測序就辨別出不同序列的DNA小分子。我倆一起嘗試用這項技術(shù)來辨別DNA長片段,結(jié)果大獲成功,在很短的時間里就篩選出了好幾個Y染色體標(biāo)記物?!?
這里所說的標(biāo)記物指的是Y染色體上和別人不一樣的點,類似于金庸盜版小說里的印刷錯誤。不同版本的盜版小說可以通過這些具有特異性的印刷錯誤一眼認(rèn)出來,不同來源DNA也一樣。SNP是遺傳學(xué)家最常用的標(biāo)記物,Y染色體上還有“短串聯(lián)重復(fù)”(STR)和“拷貝數(shù)差異”(CNV)這兩大類標(biāo)記物,也可以用來給Y染色體做標(biāo)記。
“其實我的興趣并不是人類起源,而是人類的遷徙路徑。研究人類遷徙最關(guān)鍵的一點就是找到特定人群的標(biāo)記物,然后利用它去追蹤源頭。”金力博士解釋道,“這就好比說你要搞清楚東海里的水到底是哪里來的,最好的辦法就是在黃河源頭倒一瓶紅墨水,在長江源頭倒一瓶藍(lán)墨水,然后去東海里取一瓢水,看看里面到底有多少紅墨水分子,又有多少藍(lán)墨水分子。在這個例子中,墨水就是標(biāo)記物,用來追蹤水的遷徙路徑?!?/p>
初戰(zhàn)告捷之后,金力和同事們在1995年召開的美國人類遺傳學(xué)年會上向與會者報告了這項技術(shù),引來了無數(shù)關(guān)注。此后來自世界各地的科學(xué)家運用這項技術(shù)找到了好幾百個Y染色體標(biāo)記物,為人類尋找亞當(dāng)?shù)嫩欅E鋪平了道路。
2000年11月,來自卡瓦利-斯福扎實驗室的19位作者在《自然遺傳學(xué)》(Nature Genetics)雜志上發(fā)表了分子進(jìn)化領(lǐng)域的第二篇重磅論文,通過對不同人群Y染色體遺傳標(biāo)記物的分析,找到了人類共同的父系祖先。這位亞當(dāng)同樣生活在非洲,時間大約是距今5.9萬年,遠(yuǎn)比夏娃要近得多。后來科學(xué)家們又獲得了更多的數(shù)據(jù),把這個數(shù)字修正為距今12萬~16萬年,和夏娃大致處于同一個時間段內(nèi)。
這篇論文發(fā)表后,“多地區(qū)進(jìn)化”理論便又挨了重重的一拳,雖然這個理論的支持者仍然還想掙扎著再爬起來,但難度越來越大了。
“其實我想問的問題很簡單,那就是各個人群之間的遺傳距離到底有多大?如果這個距離大于100萬年,那么多地區(qū)起源理論就有可能是正確的。但如果像現(xiàn)在這樣只相差十幾萬年,那么這個理論就不太好解釋了?!苯鹆ξ艺f,“我當(dāng)然知道分子鐘有問題,計算出的年代可能有誤差,但頂多差個1~2倍而已,無論如何差不到100萬年以外去,沒法支持多地起源理論。”
2000年那篇論文只分析了1000多例Y染色體,雖然已經(jīng)足以得出結(jié)論說世界上大部分人的父系祖先都來自非洲,但金力還是不滿足?!拔医酉聛硐朐賳栆粋€問題:這個‘大部分人到底是多少?非洲智人是不是把世界各地的古老人種完全替代了?有沒有漏網(wǎng)之魚?對這幾個問題我想了很久,一直想不出解決辦法?!苯鹆貞浀?,“我除了喜歡喝咖啡之外,有一個愛好就是吃烤肉,就是在一次烤肉時我突然想到,既然直立人曾經(jīng)走到了亞洲,那么只有大規(guī)模調(diào)查現(xiàn)代亞洲人的Y染色體,看看能否找到亞洲直立人的貢獻(xiàn),才能回答這個問題?!?/p>
于是,大家關(guān)注的目光再一次轉(zhuǎn)到了亞洲,轉(zhuǎn)到了中國。
1994年冬天,正當(dāng)金力在斯坦福大學(xué)嘗試用DHPLC技術(shù)尋找Y染色體標(biāo)記物的時候,當(dāng)年已是86歲高齡的談家楨專程去斯坦福拜訪了他,希望他學(xué)成之后回到復(fù)旦大學(xué)遺傳所工作。后來金力果然聽從了談先生的建議,于1997年回到復(fù)旦大學(xué)做了兼職教授,2005年他干脆放棄美國居留權(quán),回到復(fù)旦大學(xué)生命科學(xué)學(xué)院擔(dān)任了全職教授。
幾乎與此同時,由IBM公司提供技術(shù)支持,美國《國家地理》雜志負(fù)責(zé)實施的“人類遷徙遺傳地理圖譜計劃”于2005年4月在世界各地同時啟動。該計劃打算在全球范圍內(nèi)收集10萬份人類DNA標(biāo)本,用5年時間描繪出史前人類的遷移路線。復(fù)旦大學(xué)生命科學(xué)院承擔(dān)了東亞和東南亞地區(qū)的DNA取樣和研究工作,金力是東亞和東南亞中心的總負(fù)責(zé)人。在他的領(lǐng)導(dǎo)下,中國科學(xué)家們分析了2萬多個Y染色體樣本,繪出了東亞男性成員的遷徙路線圖。
寫到這里必須要提一下Y染色體上最著名的SNP M168,這是3.5萬~8.9萬年前起源于非洲大陸的一個SNP,最早是在金力參與的那篇2000年發(fā)表的論文里被發(fā)現(xiàn)的。當(dāng)時金力他們只測了1000多個個體,發(fā)現(xiàn)所有非非洲大陸男性的Y染色體上都有這個M168,為人類進(jìn)化的“取代學(xué)說”提供了一個強有力的證據(jù)。
這一次,金力打算更進(jìn)一步,分析一下M168旗下的3個子單倍型YAP+、M89T和M130T。所謂“單倍型”指的就是一組相距很近的SNP的集合體。因為距離近,這些突變總是連在一起傳遞給下一代。用單倍型來作為遺傳標(biāo)記物,操作起來要比用單個SNP更加方便,準(zhǔn)確性也更高。
實驗結(jié)果顯示,來自于163個亞洲及附近人群中的所有1.2127萬個采樣個體均帶有上述這3個單倍型中的一個,無一例外。這個結(jié)果再次說明幾乎所有東亞人的父系祖先全部來自M168群體,也就是說他們均來自非洲,沒有任何一個古老型人種對當(dāng)今東亞人的Y染色體做出過貢獻(xiàn)。
金力把研究結(jié)果寫成論文,刊登在2001年5月11日出版的《科學(xué)》(Science)雜志上?!岸嗟貐^(qū)進(jìn)化”理論挨了第三記重拳,很難再爬起來了。
曾經(jīng)在加州大學(xué)伯克利分校任教的美國人類學(xué)家文森特·薩里奇(Vincent Sarich)一直是“多地區(qū)進(jìn)化”理論的堅定支持者,多年來一直不遺余力地宣揚該理論。但當(dāng)他看到了這篇論文后,也不得不在公開場合承認(rèn)自己錯了。“我好像經(jīng)歷了一次信仰轉(zhuǎn)換,簡直就像是耶穌基督對我顯靈了一樣。”薩里奇寫道,“我終于確信當(dāng)今人類中確實找不到任何一條古老的Y染色體,也找不到任何一個古老的線粒體,這是一次完全的替代?!?/p>
也許有讀者會問,既然是這樣,為什么現(xiàn)在生活在歐亞大陸上的各個民族彼此之間會有如此大的不同呢?針對這個常見問題,群體遺傳學(xué)家有自己的解釋。他們通過對現(xiàn)代人基因多樣性的分析發(fā)現(xiàn),現(xiàn)代智人在走出非洲后經(jīng)歷過好幾次瓶頸效應(yīng),即人群數(shù)量因為自然環(huán)境惡化等原因而突然大量減少,就好像一群人一起通過一個狹窄的瓶口一樣。最終大部分人都被瓶口堵住了,只有極少數(shù)幸運兒擠了過去,其結(jié)果就是原有人群的遺傳多樣性大幅減少,在此基礎(chǔ)上重新擴增起來的人群就有可能和原來的很不一樣了。
從遺傳多樣性的角度講,能通過瓶頸的人純屬運氣好而已,這就是前文提到的“遺傳漂變”。但是,對于一些和生存能力有關(guān)的基因來說,這是個優(yōu)勝劣汰的過程,屬于自然選擇的范疇,人類膚色的差異就是如此。膚色是由兩個因素決定的,一個是維生素D的合成,一個是葉酸的破壞。人的皮膚會在陽光的催化作用下合成維生素D,陽光越強烈,維生素D的合成就越充分。但是,過于強烈的陽光會破壞葉酸,這同樣是一種非常重要的維生素,所以低緯度地區(qū)生活的人傾向于進(jìn)化出深色皮膚,以此來保護(hù)葉酸不被陽光破壞。生活在高緯度的人則傾向于進(jìn)化出淺色膚色,以便更好地利用陽光補充飲食中缺乏的維生素D。
當(dāng)然了,這是在人類退掉毛發(fā)后才出現(xiàn)的一種進(jìn)化選擇。我們的祖先因為毛發(fā)濃密,擋住了絕大部分陽光,皮膚幾乎可以肯定是淺色的。
有趣的是,真正到了最北端,也就是生活在北極圈內(nèi)的人,情況又有所不同。比如生活在阿拉斯加和加拿大北部的因紐特人皮膚反而非常黝黑,這是因為他們主要靠打獵為生,動物脂肪富含維生素D,所以他們并不需要從陽光中獲得維生素D,這時候防曬就是一件更重要的事情了。
另一個很常見的問題是,原本生活在歐亞大陸上的古老型人類都去了哪里?化石證據(jù)顯示他們當(dāng)中的一些人已經(jīng)開始向現(xiàn)代智人的方向進(jìn)化了,前言中提到的許昌人就是一例,難道他們不是我們的祖先嗎?對此問題金力給出了一個很好的解釋:“一個古人類學(xué)家找到一個古人化石,他只能希望它是有后代的,但是它究竟有沒有留下后代呢?古人類學(xué)家是沒有辦法知道的。DNA就不同了,現(xiàn)代人身體里的DNA肯定都是有祖先的,我們可以通過對DNA多樣性的分析,推測出每一個DNA祖先都是從哪里來的。”
換句話說,在人類起源的問題上,群體遺傳學(xué)家和古人類學(xué)家探究的是兩個完全不同的問題。前者想要知道現(xiàn)代人的祖先究竟是誰,他們是從哪里來的,后者研究的則是人類這個物種的進(jìn)化過程,其中有些支系群體不一定留下過后代,屬于進(jìn)化的死胡同,類似案例在其他生物中非常常見,人類一點也不特殊。
但是,這并不等于說這些支系就沒有研究的必要,因為他們很可能在某些方面影響了現(xiàn)代人的進(jìn)化過程。這就好比說你出生在一個小村子,村里有多戶人家,你的律師肯定只關(guān)心你的父母,只有他們才是你的直系祖先,其他人和你沒有法律關(guān)系。但你的傳記作家除了關(guān)心你父母之外,也會去關(guān)心村里其他那些成年人,因為他們都或多或少地影響過你的人生。
在媒體的渲染下,很多旁觀者都誤以為人類進(jìn)化的兩派之爭是遺傳學(xué)家和古人類學(xué)家在打嘴仗,但實際上很可能雙方研究的根本就不是同一個問題。不過,確實有少數(shù)科學(xué)家自己也沒有弄明白兩者的區(qū)別,分不清每一種研究方法的邊界在哪里,一直熱衷于關(guān)公戰(zhàn)秦瓊。
金力對兩者的區(qū)別非常清楚。他在復(fù)旦大學(xué)創(chuàng)立了人類學(xué)與人類遺傳學(xué)系,從名字就可以看出這個系分成了兩個不完全一樣的部門,分別研究人類的進(jìn)化史和依靠DNA尋祖這兩件事。后者目前主要是由李輝教授在負(fù)責(zé),他帶領(lǐng)一群研究生花費了大量時間和精力去祖國各地收集DNA樣本,分析Y染色體和線粒體的遺傳多樣性,畫出了一張現(xiàn)代中國人遷徙草圖。
上一篇文章提到,中國的人類考古學(xué)家大都屬于傳統(tǒng)的“化石派”,他們通過對化石的研究認(rèn)定現(xiàn)代中國人是從原本生活在中國大陸上的原始人類單獨進(jìn)化而來的。金力和李輝屬于這個領(lǐng)域的闖入者,他們拿到的DNA證據(jù)又得出了怎樣的結(jié)論呢?為了尋找答案,我專程去復(fù)旦大學(xué)采訪了李輝教授,發(fā)現(xiàn)他最愛說的一句口頭禪就是:“這是很清楚的一件事情?!?/p>
他之所以如此自信是有原因的:一來DNA分析本身就遠(yuǎn)比化石分析來得更精確,二來他曾經(jīng)找到了一個已經(jīng)延續(xù)了70代的大家族,對DNA分析法做過驗證。前文說過,Y染色體代表父系遺傳,而中國的大家族一般都是父系家族,兩者有很強的對應(yīng)關(guān)系。李輝把Y染色體研究結(jié)果和這個大家族的家譜進(jìn)行了對比,發(fā)現(xiàn)兩者是高度一致的,說明這套算法經(jīng)得起考驗。
如果把研究對象從一個大家族擴展到更大范圍的人群,光是研究單倍型就不夠了,需要引入單倍群(Haplogroup)的概念。國際Y染色體命名委員會把全世界所有的Y染色體單倍型分為代號A-T的十幾個大的類群,稱為單倍群。每個單倍群出現(xiàn)的時間都不一樣,這是可以估算出來的。如果再把每個單倍群出現(xiàn)的地點找到,就可以推斷出人類的遷徙路線和過程了。比如大洋洲原住民大都屬于C單倍群,出現(xiàn)的時間非常古老,暗示人類走出非洲之后很快就沿著海岸線到達(dá)了東南亞諸島。
每個單倍群內(nèi)部還可以逐級分層,這個過程很像是一個大家族的兒子們離家出走另開門戶。如果再用金庸盜版書做比喻的話,這就相當(dāng)于廣東省外所有的盜版書(以及一部分廣東省內(nèi)的盜版書)都印錯了“甲”字(比如M168),所有收自福建、浙江和江蘇省的盜版書都印錯了“乙”字(比如YAP+),所有收于廣西、云南和西藏的盜版書都印錯了“丙”字(比如M89T),所有收于湖南、湖北和陜西省的盜版書都印錯了“丁”字(比如M130T),于是緝私人員就可以得出結(jié)論說,“甲”這個錯別字來自廣東省境內(nèi),這是廣東省外所有盜版書的母版,然后盜版書沿著東線、西線和中線這三條線路在中國大陸擴散,這三條線分別擁有乙、丙和丁這三個錯字。
這三條傳播路線中的每一條都可以按照新出現(xiàn)的錯字繼續(xù)分層,代表盜版書傳播路徑中的每一個細(xì)小分支。在人類遺傳學(xué)研究中,這種分層最多可以分出好幾十層,最終可以一直分到每個人自己的直系親屬為止。舉例來說,Y染色體單倍型分層的最末端就是你和你兄弟,你們倆在所有其他層面上都是一樣的,只有最后一層才能看到差別。
按照這個方法,李輝推算出了早期人類從非洲遷往東亞地區(qū)的大致路線。在他看來,這次遷徙是分兩次才完成的,第一次大約發(fā)生在6萬年前,這群人從中東地區(qū)出發(fā),沿著海岸線一路向東進(jìn)入了亞洲地區(qū),這是比較符合常理的一條路線,因為沿著海邊走永遠(yuǎn)不愁找不到吃的。李輝稱這些人為“早亞洲人”,他們的后代至今仍然居住在澳大利亞、新幾內(nèi)亞和美拉尼西亞諸島上,在遺傳上屬于C單倍群,過去曾經(jīng)被稱為“棕色人種”。進(jìn)一步研究顯示,一部分“早亞洲人”曾經(jīng)沿著海岸線一直走到了亞洲的東北部,然后其中的一部分人轉(zhuǎn)而向西進(jìn)入西伯利亞大草原,成為蒙古人,另一部分人穿越白令海峽,成為美洲大陸的原住民。
“早亞洲人”當(dāng)中還有一個神秘的D單倍群,他們大都是住在小島或者山林里的“小黑人”,學(xué)名稱為尼格利陀人(Negrito)。如今還能在安達(dá)曼群島、馬來西亞諸島、菲律賓呂宋島、日本本州島和北海道,以及俄羅斯庫頁島等地看到他們的蹤跡,說明這群人曾經(jīng)一直沿著海岸線遷徙到了東亞和東北亞。事實上,李輝認(rèn)為C型和D型“早亞洲人”都曾經(jīng)到達(dá)過中國東部的沿海地區(qū),他們多半靠打魚為生,中國東南沿海出土的貝丘遺址就是這些人留下來的。但這些人沒能長期在中國生存下來,今天的大多數(shù)中國人不是這群人的后代,只有青藏高原的羌族和藏族,以及四川和甘肅交界處的白馬氏人有一部分人屬于D型單倍群,科學(xué)家們尚不清楚這個單倍群是如何傳過去的。
這些“早亞洲人”的祖先很可能早在10萬年前就走出了非洲,進(jìn)入了中東地區(qū)。他們之所以沒有迅速向歐亞大陸的腹地擴散,很有可能是受到了當(dāng)時居住在歐亞大陸上的尼安德特人等古人類的阻擋。后來不知因為什么原因,雙方的實力對比發(fā)生逆轉(zhuǎn),現(xiàn)代智人打敗了尼安德特人,這才得以向北擴散,進(jìn)入了歐洲和中亞地區(qū),這也是為什么現(xiàn)代人直到4萬年前才到達(dá)歐洲的原因,比到達(dá)亞洲的時間晚了2萬年。
正是在打敗了尼安德特人等古人類之后,第二批亞洲移民這才得以從陸路進(jìn)入了東南亞。他們很可能是追逐著獵物一路向東,大約在3萬~4萬年前到達(dá)了亞洲地區(qū)。李輝稱這些人為“晚亞洲人”,他們的Y染色體單倍群主要為O型,也有少量的N、P、Q和R型。這些人構(gòu)成了現(xiàn)代東亞和太平洋地區(qū)人群的主體,而那些“早亞洲人”則很可能是上古傳說中被我們的祖先消滅掉的那些相貌古怪的“魔鬼”。
金力和他的學(xué)生宿兵等曾經(jīng)分析過當(dāng)今中國人的Y染色體多樣性,發(fā)現(xiàn)南方人比北方人要多,因此金力等人認(rèn)為“晚亞洲人”最早是從南方進(jìn)入中國大陸的,時間是在2萬~3萬年前。因為這批人是采集狩獵者,很可能是一路追逐著獵物前行,哪里有路就往哪里走。根據(jù)中國西南地區(qū)的地形地貌特點,以及DNA證據(jù),他們猜測最有可能的一條線路位于滇西,即從緬甸經(jīng)瑞麗進(jìn)入中國,然后途經(jīng)大理到達(dá)昆明,這是最容易走的一條路線,而黃種人的皮膚很可能就是從緬甸到云南的過程中突變出來的,
古人沒有交通工具,古代中國也沒有道路,所以沿江而走是最合理的選擇。李輝認(rèn)為當(dāng)年那批人進(jìn)入滇西后兵分兩路,一群人沿著珠江走,最終進(jìn)入了兩廣地區(qū),時間大約是1.6萬~1.8萬年前。另一群人沿著長江走,之后又分成兩路,一路進(jìn)入四川,一路進(jìn)入湖廣地區(qū),時間也差不多。
大約在1.1萬年前,最近的一次冰期結(jié)束,全球氣候逐漸變暖,萬物復(fù)蘇,全世界掀起了一股發(fā)明農(nóng)業(yè)的浪潮。中國最早的農(nóng)業(yè)應(yīng)該出現(xiàn)在洞庭湖西岸的澧陽平原,湖南澧縣的彭頭山文化就是早期農(nóng)業(yè)文明的代表,彭頭山出土的陶器內(nèi)發(fā)現(xiàn)了稻谷和稻殼的痕跡,時間為距今8300~9000年,證明水稻很可能就是從這里走向世界的。江南地區(qū)則馴化了菱角,但這種農(nóng)作物產(chǎn)量低,不能做主糧,不是很成功的馴化,所以江南地區(qū)的文明發(fā)展一直落后于湖南,直到水稻傳過去后這塊地方才迅速發(fā)展起來。這些以水稻為主糧的民族構(gòu)成了中國的南方人群,中國的北方人群則以小米為主糧,發(fā)源地很可能位于現(xiàn)在的河北和內(nèi)蒙古一帶。
有了農(nóng)業(yè)才會出現(xiàn)大的部落,才會有很多人聚在一起生活,語系的概念就是在這一階段出現(xiàn)的。語言學(xué)也是研究人類起源和遷徙的一個重要工具,比如漢藏同源這個概念就是先從語言學(xué)研究領(lǐng)域開始叫出來的,后來被基因?qū)W研究所證實。從某種意義上說,語言和基因很相似,都是遵循一定的規(guī)律一代代拷貝下去的,也都可以通過倒推的方法追根溯源。但語言傳承的規(guī)律性和精確性均不如基因,只能作為輔助手段來使用。
有了大部落,才會出現(xiàn)等級制度,才有可能出現(xiàn)強人統(tǒng)治。金力的學(xué)生嚴(yán)實等通過對Y染色體的研究發(fā)現(xiàn),當(dāng)今中國男性當(dāng)中有將近一半的人屬于三個超級男性的后代,他們很可能是三個古代部落的首領(lǐng),各自代表著三個原始族群。但在人類遺傳學(xué)體系里,這三個族群是用Y染色體上的三個標(biāo)記物的名字命名的,李輝正在嘗試把他們和具體的歷史事件聯(lián)系起來。
按照李輝的說法,第一個超級男性出現(xiàn)在6800年前,對應(yīng)于7800年前在湖南開始的高廟文化。這就是前文所說的水稻文明,彭頭山文化是其草創(chuàng)期,已經(jīng)出現(xiàn)了很多大聚落,但那時只有護(hù)城河,沒有城墻。前者擋野獸足夠了,后者是高廟時期才出現(xiàn)的,主要是為了擋人,這說明從高廟時期開始,原本那些因為地理阻隔而單獨發(fā)展了數(shù)千年的不同部落開始了相互爭斗,中國的民族大融合從此拉開了序幕。
第二個超級男性出現(xiàn)在6500年前,很可能和仰韶文化有關(guān)。這個文化大致位于黃河中游地區(qū),從今天的甘肅省到河南省之間,傳說中的夏商周就位于這一區(qū)域,華夏民族的主體很可能就來自這里。
第三個超級男性出現(xiàn)在5300年前,可能和紅山文化有關(guān)。該文化大致位于今天的燕山以北的大凌河與西遼河上游地區(qū),以小米為主要農(nóng)作物。位于內(nèi)蒙古赤峰市的紅山后遺址挖掘出了大批造型生動的玉器,說明中國人用玉的傳統(tǒng)很可能來自這里。
高廟文化、仰韶文化和紅山文化都是考古學(xué)家們喜歡使用的名詞,李輝認(rèn)為這是一個很不好的習(xí)慣。“仰韶就是個小村子啊,怎么就變成一個文化了?考古界的專家們當(dāng)然明白這是怎么一回事,但如果不借助歷史文本的框架來解釋的話,這些名詞對于民眾來說是沒有意義的?!崩钶x對我說,“如果我們用神農(nóng)時代、黃帝時代或者炎帝時代來解釋的話,老百姓就能聽懂了??脊胚z傳學(xué)也是如此,O1O2這些Y染色體標(biāo)記物對于老百姓來說沒有任何意義,只有把它們和歷史事件嚴(yán)絲合縫地拼接起來才有意義,這就是人類學(xué)要做的事情?!?/p>
李輝非常討厭文理分科,他認(rèn)為人類考古界不能各自為戰(zhàn),應(yīng)該統(tǒng)一起來,所有材料不分文理都可以拿來用。理科生可以借助遺傳學(xué)為人類歷史整理出一個骨架,但是光有骨架太難看了,必須有考古學(xué)提供內(nèi)臟,語言學(xué)和文化學(xué)提供肌肉,歷史學(xué)提供皮毛,只有這樣拼接起來才能構(gòu)建出人類歷史這頭大象。
比如,李輝認(rèn)為第一個超級男性對應(yīng)的是苗瑤語系,很可能和蚩尤有關(guān)。第二和第三個超級男性則代表漢藏語系,很可能分別對應(yīng)了炎帝和黃帝。他甚至認(rèn)為傳說中的逐鹿之戰(zhàn)就發(fā)生在北京和張家口一代,當(dāng)時生活在中原地區(qū)的炎帝先是和蚩尤打了一仗,戰(zhàn)敗后跑到北方向黃帝求援,然后炎黃二帝合力將蚩尤戰(zhàn)敗,獲勝者就是華夏民族的祖先。今天的苗族人認(rèn)為他們就是蚩尤的后代,戰(zhàn)敗后被逐出中原,流落他鄉(xiāng)。
上述說法聽上去很讓人興奮,李輝也堅信這是DNA給出的結(jié)果,是“很清楚的一件事情”。不過,李輝也明白他這個說法目前尚無考古學(xué)證據(jù)的支持,需要各方努力才能還原真相。
用Y染色體來追尋祖先的蹤跡,功能雖然很強大,但畢竟是用現(xiàn)代人的遺傳密碼倒推古人,中間有很多邏輯鏈條都是建立在假說之上的,難以服眾。因為人群不斷遷徙的緣故,現(xiàn)代人的居住地很可能和他們的祖先不一樣,這也是考古遺傳學(xué)的缺陷之一。如果能直接測出古人的DNA,解讀出古人的生命之書,再來和現(xiàn)代人做比較,就能更準(zhǔn)確地搞清真相了。
不知有多少人還記得老山漢墓的故事。這是位于北京市石景山區(qū)東部老山地區(qū)的一座西漢時期的王室貴族墓葬,北京市文物研究所于2000年8月在墓中發(fā)現(xiàn)了一具尸骨。那次挖掘在中央電視臺做了直播,是央視有史以來所做的第一個考古直播,引起了海內(nèi)外歷史學(xué)愛好者的廣泛關(guān)注。
經(jīng)我國著名人類學(xué)家潘其風(fēng)研究員鑒定,這具骸骨屬于一個30歲左右的女性,其身份應(yīng)該是西漢時期某諸侯王的王后。北京市文物研究所將頭骨送至公安部物證中心,后者依照法醫(yī)學(xué)原理做出了一個面部復(fù)原石膏像,看上去像是個西域人。于是那段時間媒體紛紛報道說這位王后是一名西域胡女、中國在西漢時期就經(jīng)常和西域通婚,等等。但是,潘其風(fēng)研究員通過體質(zhì)人類學(xué)的方法對遺骨做了研究,認(rèn)為她是中原人。
雙方在遺骨的身份認(rèn)定上產(chǎn)生了分歧,誰也說服不了誰。北京市文物研究所決定向吉林大學(xué)邊疆考古研究中心求援,請該中心考古DNA實驗室主任周慧老師出山,設(shè)法提取出骸骨中的DNA,還她一個清白。
從此,一扇緊閉了很久的大門被打開,中國考古進(jìn)入了一個全新的時代。