勞倫斯·R.道爾
譯/裴淑娟
尋找來自外星球文明的信號,為什么不從地球上一些已知的非人類通信系統(tǒng)著手呢?鯨數(shù)百萬年前就已經(jīng)有了全球通信系統(tǒng)——這比智人的出現(xiàn)都要早。蜜蜂在某種程度上通過舞蹈交流,很久之前就通過民主辯論的方式?jīng)Q定筑巢的最佳地點。這個時間比人類民主政治體系的產(chǎn)生還要早數(shù)百萬年呢。類似的例子還有很多。據(jù)我所知,研究動物交流體系的人都會得出一致結(jié)論:這些物種比人類預(yù)想的“更善言辭”。
標題
通過研究動物通信,我和同事研發(fā)出一種新的探測器,一種“通信情報”過濾器,來判斷某個太空信號是否來自先進文明。SETI(搜尋地外文明學(xué)會)已經(jīng)開始尋找窄頻帶頻率的無線電傳輸及快速閃爍的光學(xué)信號。根據(jù)已有的天體物理學(xué)知識,此類信號傳輸顯然是人為的。他們的發(fā)現(xiàn)證明了星際間信號傳輸技術(shù)存在的可能性。SETI的研究一般會拋開寬頻帶通信信號及較慢的光學(xué)脈沖,因為還不太清楚它們的來源。這些信號有可能來自外星人,也有可能來自自然界的無線電波,我們目前還不能很好地區(qū)分它們。
簡單地說,我們可能收到過來自外星人的信息,但因未能識別它們的信號,就將其忽略了。這或許能解釋為什么我們在過去50年一直未能探測到星際間的通信信號。
通過15年的努力,我和同事找到了一種更好的方法。我們嘗試把信息理論應(yīng)用到人類和動物的通信系統(tǒng)上,結(jié)果發(fā)現(xiàn)某些物種能夠傳達復(fù)雜的思想,雖然目前還不知道它們具體在說些什么。使用“通信系統(tǒng)”這個術(shù)語,目的在于不去預(yù)設(shè)其他物種是否具有人類意義上的語言。復(fù)雜的通信遵循類似于語法且能辨別智能內(nèi)容的通用規(guī)則。如果有足夠大的信息樣本,我們可以量化其復(fù)雜度或語法結(jié)構(gòu)。在信息理論的數(shù)學(xué)中,該結(jié)構(gòu)被稱為“條件信息熵”,是由通信基本單元(例如字母和音素) 之間的數(shù)學(xué)關(guān)系構(gòu)成的。日常話語中,這種結(jié)構(gòu)被識別為語法,從更基本的層面上講,可被視為聲音轉(zhuǎn)化成詞和句子的包裝。在加利福尼亞州山景城的SETI研究所,我們已經(jīng)開始從SETI數(shù)據(jù)庫中尋找這種結(jié)構(gòu)。
我和我的同事布倫達·麥科恩及加利福尼亞大學(xué)戴維斯分校的肖恩·F.漢澤決定使用易于分類的聲音信號研究既具有社會復(fù)雜性又高度依賴聲學(xué)通信的物種。我們的前三個主題物種分別為瓶鼻海豚、松鼠猴和座頭鯨。
齊普夫定律是從字母、單詞和音素的早期統(tǒng)計研究中發(fā)現(xiàn)的人類語言學(xué)的一個特征。它以哈佛大學(xué)語言學(xué)家喬治·齊普命名。在英語文本中,“e”出現(xiàn)的頻次要高于“t”,而“t”出現(xiàn)的頻次又高于“a”,最不常出現(xiàn)的字母是“q”。如果以頻率的降序列出從“e”到“q”的字母,并在雙對數(shù)圖上繪制它們的頻率,則可以用4 5°線(一條斜率為-1的線)擬合這些值。日語、德語、印地語和其他幾十種語言對話中的字母、單詞或音素亦是如此。嬰兒的咿呀學(xué)語并不遵循齊普夫定律,它的斜率小于-1,因為他們的聲音幾乎是隨機溢出的。但是隨著孩子們的語言學(xué)習,斜度逐漸傾斜,并在大約24個月的時候達到-1。
數(shù)學(xué)語言學(xué)家認為,這個-1斜率表明給定系列的聲音或書寫符號包含足夠的復(fù)雜性來構(gòu)成語言。這是個必要但不充分條件。齊普夫稱,形成這個-1斜率的原因是“最小努力原則”。它在發(fā)射器(想要以最少能量發(fā)送信號)與接收器(想要最多冗余以確保接收到完整信息)之間取得平衡。
座頭鯨交流的復(fù)雜性可與人類語言相匹敵,這表明存在甚至連外星人都要遵循的交流通用原則
信息理論應(yīng)用的關(guān)鍵是隔離信令單元。例如,只要在摩爾斯電碼中繪制所有的點和破折號,即可得到約為-0.2的齊普夫斜率。但是,如果一個基本單位有多個點和短畫線,斜率會向-1傾斜,這反映了字母表中的字母在該系統(tǒng)中是如何被編碼的。由此,人們可以逆向設(shè)計原始單位的意義。
大多數(shù)語言學(xué)家曾認為,齊普夫定律只是人類語言的特征。但是我們在繪制成年海豚哨音的發(fā)生頻率時,發(fā)現(xiàn)它們也遵循了齊普夫定律!這讓我們異常興奮。后來,兩只小寬吻海豚在加利福尼亞的海洋世界出生,我們記錄了它們的嬰兒哨音,發(fā)現(xiàn)它們和咿呀學(xué)語的人類嬰兒有著相同的齊普夫斜率。嬰兒海豚學(xué)習它們的哨音,并以跟人類寶寶學(xué)習語言相同的方式學(xué)習它們的通信系統(tǒng)。當海豚長到12個月的時候,它們哨音的發(fā)生頻率分布也達到了-1斜率。
我們還在探究寬吻海豚是否和鯨一樣,擁有內(nèi)部復(fù)雜性接近人類語言的通信系統(tǒng)。這種復(fù)雜性使通信具有復(fù)原能力。在環(huán)境噪聲、干擾障礙物和其他影響信號傳播的效應(yīng)下,任何交換信息的生物都必須具備這種能力。人類語言的構(gòu)造為冗余提供了條件。在最基本的層次上,這種結(jié)構(gòu)決定了給定字母出現(xiàn)的概率。如果我告訴你我在想一個單詞,你可能會猜到第一個字母是“t”,因為這是英語中最常見的單詞首字母。你的猜測是安全的,但沒什么信息含量。相反,如果你猜到的字母是“q”,并且是正確的,你會得到一些真正的信息,假如我正在想的這個詞確實是
以字母“q”開頭的話。
現(xiàn)在進一步來講。如果我告訴你,我正在想的字母是首字母為“q”的單詞的第二個字母,你會立刻猜到字母“u”。為什么?因為你知道在英語中這兩個字母一起出現(xiàn)的概率幾乎是100%。為了猜測空缺內(nèi)容,你不僅使用了字母出現(xiàn)的概率,還運用了這兩個字母之間的條件概率——在字母“q”給定的情況下,“u”出現(xiàn)的概率。每當我們的大腦需要修復(fù)信息傳輸中的錯誤,如低墨副本文件上的褪色文本或嘈雜電話呼叫中的混亂話語時,就會使用條件概率。
對于英語單詞,條件概率在一行中可以連續(xù)指定多達9個單詞。如果缺少一個單詞,你可以根據(jù)上下文猜測出來;缺少兩個單詞,你仍然可以根據(jù)上下文將其恢復(fù)。舉個簡單的例子,一句話中缺少一個單詞:“How are___doing today?”我們可以很容易地根據(jù)已知的英語規(guī)則填寫出缺少的單詞“you”?,F(xiàn)在再來看一個句子中缺少兩個詞的例子:“How___ ___ doing today?”這句話可以是:“How is Joe doing today ?” 但也不乏其他可能性。顯然,缺失的單詞越多,根據(jù)上下文填充它們的難度就越大,它們之間的條件概率就越低。對于人類的大多數(shù)書面語言, 在一行中缺失約9個單詞時,條件依賴性就會消失。當有10個單詞缺失時,就真的沒有線索來推測缺失的內(nèi)容可能是什么了。
我們在動物通信系統(tǒng)中發(fā)現(xiàn)了同樣的條件概率,例如我們和阿拉斯加鯨基金會的弗雷德·夏普在阿拉斯加?xùn)|南部記錄座頭鯨聲音時的發(fā)現(xiàn)。座頭鯨因其歌聲而出名,通常會在夏威夷交配時歌唱,這與它們在阿拉斯加的叫聲(驅(qū)趕魚群進入氣泡網(wǎng)的呼叫和社交呼叫)極為不同。我們分別記錄了有無船舶噪聲兩種情況下的座頭鯨叫聲,并計算了海洋信道的靜態(tài)作用,然后用信息理論量化鯨魚在何種程度下會減慢其發(fā)聲,以確保信息的無誤接收。
正如預(yù)期的那樣,當有船的噪音時,鯨魚減慢了它們的發(fā)聲速度,正如人們打電話時背景中帶有噪音時所做的那樣。但是它們的傳輸速度只是減慢了理論上要求的3/5,以確保對方收到的整個信息無誤。它們是如何做到不按照噪音水平要求來減慢聲音的?我們思考了一段時間,意識到它們的通信系統(tǒng)一定有足夠的規(guī)則結(jié)構(gòu)來恢復(fù)最后2/5的信號。座頭鯨是利用了它們聲音等價詞之間的條件概率。如此一來,不必接收全部信息,就能夠填補空缺。
我們還發(fā)現(xiàn)了海豚交流的內(nèi)部結(jié)構(gòu)。它們與座頭鯨最大的區(qū)別是,海豚有大約50種核心的信號類型,而座頭鯨有幾百種。我們目前正在收集數(shù)據(jù),以確定座頭鯨通信系統(tǒng)的最高階熵。
海豚不必接收全部信息來填補缺失
有天文學(xué)家用我們的方法區(qū)分來自天體的自然信號與來自智慧生命的信號。天文學(xué)家喬瑟琳·貝爾·伯勒爾和安東尼·休伊什最初在1967年發(fā)現(xiàn)恒星脈沖星的信號時,媒體將它們稱為“LGMs”(小綠人)。因為這些無線電源發(fā)出的脈沖非常規(guī)律,一些科學(xué)家猜測它們可能來自非常先進的外星人。我們在澳大利亞國家望遠鏡中心西蒙·約翰斯頓的幫助下重新分析了帆船座脈沖星的脈沖,發(fā)現(xiàn)脈沖星信號的齊普夫斜率約為-0.3。這不同于我們所知的任何一種語言。此外,我們還發(fā)現(xiàn)這些脈沖信號內(nèi)很少存在或根本沒有條件概率結(jié)構(gòu)?,F(xiàn)在,我們已經(jīng)知道脈沖星
是超新星的天然殘余物。因此,信息理論可以輕易地將推定的智能信號和自然信號區(qū)分開。
我們目前正在分析從SETI研究所的艾倫望遠鏡陣列獲得的微波數(shù)據(jù),該陣列由在1千兆赫至1 0千兆赫的頻帶中觀測的42個單獨的望遠鏡組成。除了尋找窄頻帶無線電載波的常規(guī)技術(shù)之外,我們現(xiàn)在開始應(yīng)用信息理論測量。這項工作是與SETI研究所的格里·哈普、喬恩·理查茲和吉爾·塔特合作進行的。假如我們能夠找到遵循齊普夫定律的信號,就會繼續(xù)前進,并在信號內(nèi)尋找語法結(jié)構(gòu),以量化候選消息實際上的復(fù)雜性。
為了傳播信息,即便是非常先進的地外文明,也必須遵守信息理論的規(guī)則。由于缺乏共同的符號(與座頭鯨相同的問題),我們可能無法解讀這樣的信息,但是能夠從中了解到它們的通信系統(tǒng)以及它們思維過程的復(fù)雜性。如果SETI信號的條件概率是20階,則不僅信號源是人為的,而且它反映的是比地球上任何語言都復(fù)雜得多的語言。我們后續(xù)將會對外星物種思維過程的復(fù)雜性進行定量測量。