傾聽地球以外的聲音

2017-03-10 14:39:59勞倫斯·R.道爾

飛碟探索 2017年3期

勞倫斯·R.道爾

譯/裴淑娟

尋找來自外星球文明的信號，為什么不從地球上一些已知的非人類通信系統(tǒng)著手呢？鯨數(shù)百萬年前就已經(jīng)有了全球通信系統(tǒng)——這比智人的出現(xiàn)都要早。蜜蜂在某種程度上通過舞蹈交流，很久之前就通過民主辯論的方式?jīng)Q定筑巢的最佳地點。這個時間比人類民主政治體系的產(chǎn)生還要早數(shù)百萬年呢。類似的例子還有很多。據(jù)我所知，研究動物交流體系的人都會得出一致結(jié)論：這些物種比人類預(yù)想的“更善言辭”。

標題

通過研究動物通信，我和同事研發(fā)出一種新的探測器，一種“通信情報”過濾器，來判斷某個太空信號是否來自先進文明。SETI（搜尋地外文明學(xué)會）已經(jīng)開始尋找窄頻帶頻率的無線電傳輸及快速閃爍的光學(xué)信號。根據(jù)已有的天體物理學(xué)知識，此類信號傳輸顯然是人為的。他們的發(fā)現(xiàn)證明了星際間信號傳輸技術(shù)存在的可能性。SETI的研究一般會拋開寬頻帶通信信號及較慢的光學(xué)脈沖，因為還不太清楚它們的來源。這些信號有可能來自外星人，也有可能來自自然界的無線電波，我們目前還不能很好地區(qū)分它們。

簡單地說，我們可能收到過來自外星人的信息，但因未能識別它們的信號，就將其忽略了。這或許能解釋為什么我們在過去50年一直未能探測到星際間的通信信號。

通過15年的努力，我和同事找到了一種更好的方法。我們嘗試把信息理論應(yīng)用到人類和動物的通信系統(tǒng)上，結(jié)果發(fā)現(xiàn)某些物種能夠傳達復(fù)雜的思想，雖然目前還不知道它們具體在說些什么。使用“通信系統(tǒng)”這個術(shù)語，目的在于不去預(yù)設(shè)其他物種是否具有人類意義上的語言。復(fù)雜的通信遵循類似于語法且能辨別智能內(nèi)容的通用規(guī)則。如果有足夠大的信息樣本，我們可以量化其復(fù)雜度或語法結(jié)構(gòu)。在信息理論的數(shù)學(xué)中，該結(jié)構(gòu)被稱為“條件信息熵”，是由通信基本單元（例如字母和音素）之間的數(shù)學(xué)關(guān)系構(gòu)成的。日常話語中，這種結(jié)構(gòu)被識別為語法，從更基本的層面上講，可被視為聲音轉(zhuǎn)化成詞和句子的包裝。在加利福尼亞州山景城的SETI研究所，我們已經(jīng)開始從SETI數(shù)據(jù)庫中尋找這種結(jié)構(gòu)。

我和我的同事布倫達·麥科恩及加利福尼亞大學(xué)戴維斯分校的肖恩·F.漢澤決定使用易于分類的聲音信號研究既具有社會復(fù)雜性又高度依賴聲學(xué)通信的物種。我們的前三個主題物種分別為瓶鼻海豚、松鼠猴和座頭鯨。

齊普夫定律是從字母、單詞和音素的早期統(tǒng)計研究中發(fā)現(xiàn)的人類語言學(xué)的一個特征。它以哈佛大學(xué)語言學(xué)家喬治·齊普命名。在英語文本中，“e”出現(xiàn)的頻次要高于“t”，而“t”出現(xiàn)的頻次又高于“a”，最不常出現(xiàn)的字母是“q”。如果以頻率的降序列出從“e”到“q”的字母，并在雙對數(shù)圖上繪制它們的頻率，則可以用4 5°線（一條斜率為-1的線）擬合這些值。日語、德語、印地語和其他幾十種語言對話中的字母、單詞或音素亦是如此。嬰兒的咿呀學(xué)語并不遵循齊普夫定律，它的斜率小于-1，因為他們的聲音幾乎是隨機溢出的。但是隨著孩子們的語言學(xué)習，斜度逐漸傾斜，并在大約24個月的時候達到-1。

數(shù)學(xué)語言學(xué)家認為，這個-1斜率表明給定系列的聲音或書寫符號包含足夠的復(fù)雜性來構(gòu)成語言。這是個必要但不充分條件。齊普夫稱，形成這個-1斜率的原因是“最小努力原則”。它在發(fā)射器（想要以最少能量發(fā)送信號）與接收器（想要最多冗余以確保接收到完整信息）之間取得平衡。

座頭鯨交流的復(fù)雜性可與人類語言相匹敵，這表明存在甚至連外星人都要遵循的交流通用原則

信息理論應(yīng)用的關(guān)鍵是隔離信令單元。例如，只要在摩爾斯電碼中繪制所有的點和破折號，即可得到約為-0.2的齊普夫斜率。但是，如果一個基本單位有多個點和短畫線，斜率會向-1傾斜，這反映了字母表中的字母在該系統(tǒng)中是如何被編碼的。由此，人們可以逆向設(shè)計原始單位的意義。

大多數(shù)語言學(xué)家曾認為，齊普夫定律只是人類語言的特征。但是我們在繪制成年海豚哨音的發(fā)生頻率時，發(fā)現(xiàn)它們也遵循了齊普夫定律！這讓我們異常興奮。后來，兩只小寬吻海豚在加利福尼亞的海洋世界出生，我們記錄了它們的嬰兒哨音，發(fā)現(xiàn)它們和咿呀學(xué)語的人類嬰兒有著相同的齊普夫斜率。嬰兒海豚學(xué)習它們的哨音，并以跟人類寶寶學(xué)習語言相同的方式學(xué)習它們的通信系統(tǒng)。當海豚長到12個月的時候，它們哨音的發(fā)生頻率分布也達到了-1斜率。

我們還在探究寬吻海豚是否和鯨一樣，擁有內(nèi)部復(fù)雜性接近人類語言的通信系統(tǒng)。這種復(fù)雜性使通信具有復(fù)原能力。在環(huán)境噪聲、干擾障礙物和其他影響信號傳播的效應(yīng)下，任何交換信息的生物都必須具備這種能力。人類語言的構(gòu)造為冗余提供了條件。在最基本的層次上，這種結(jié)構(gòu)決定了給定字母出現(xiàn)的概率。如果我告訴你我在想一個單詞，你可能會猜到第一個字母是“t”，因為這是英語中最常見的單詞首字母。你的猜測是安全的，但沒什么信息含量。相反，如果你猜到的字母是“q”，并且是正確的，你會得到一些真正的信息，假如我正在想的這個詞確實是

以字母“q”開頭的話。

現(xiàn)在進一步來講。如果我告訴你，我正在想的字母是首字母為“q”的單詞的第二個字母，你會立刻猜到字母“u”。為什么？因為你知道在英語中這兩個字母一起出現(xiàn)的概率幾乎是100%。為了猜測空缺內(nèi)容，你不僅使用了字母出現(xiàn)的概率，還運用了這兩個字母之間的條件概率——在字母“q”給定的情況下，“u”出現(xiàn)的概率。每當我們的大腦需要修復(fù)信息傳輸中的錯誤，如低墨副本文件上的褪色文本或嘈雜電話呼叫中的混亂話語時，就會使用條件概率。

對于英語單詞，條件概率在一行中可以連續(xù)指定多達9個單詞。如果缺少一個單詞，你可以根據(jù)上下文猜測出來;缺少兩個單詞，你仍然可以根據(jù)上下文將其恢復(fù)。舉個簡單的例子，一句話中缺少一個單詞：“How are___doing today？”我們可以很容易地根據(jù)已知的英語規(guī)則填寫出缺少的單詞“you”?，F(xiàn)在再來看一個句子中缺少兩個詞的例子：“How___ ___ doing today？”這句話可以是：“How is Joe doing today ？” 但也不乏其他可能性。顯然，缺失的單詞越多，根據(jù)上下文填充它們的難度就越大，它們之間的條件概率就越低。對于人類的大多數(shù)書面語言，在一行中缺失約9個單詞時，條件依賴性就會消失。當有10個單詞缺失時，就真的沒有線索來推測缺失的內(nèi)容可能是什么了。

我們在動物通信系統(tǒng)中發(fā)現(xiàn)了同樣的條件概率，例如我們和阿拉斯加鯨基金會的弗雷德·夏普在阿拉斯加?xùn)|南部記錄座頭鯨聲音時的發(fā)現(xiàn)。座頭鯨因其歌聲而出名，通常會在夏威夷交配時歌唱，這與它們在阿拉斯加的叫聲（驅(qū)趕魚群進入氣泡網(wǎng)的呼叫和社交呼叫）極為不同。我們分別記錄了有無船舶噪聲兩種情況下的座頭鯨叫聲，并計算了海洋信道的靜態(tài)作用，然后用信息理論量化鯨魚在何種程度下會減慢其發(fā)聲，以確保信息的無誤接收。

正如預(yù)期的那樣，當有船的噪音時，鯨魚減慢了它們的發(fā)聲速度，正如人們打電話時背景中帶有噪音時所做的那樣。但是它們的傳輸速度只是減慢了理論上要求的3/5，以確保對方收到的整個信息無誤。它們是如何做到不按照噪音水平要求來減慢聲音的？我們思考了一段時間，意識到它們的通信系統(tǒng)一定有足夠的規(guī)則結(jié)構(gòu)來恢復(fù)最后2/5的信號。座頭鯨是利用了它們聲音等價詞之間的條件概率。如此一來，不必接收全部信息，就能夠填補空缺。

我們還發(fā)現(xiàn)了海豚交流的內(nèi)部結(jié)構(gòu)。它們與座頭鯨最大的區(qū)別是，海豚有大約50種核心的信號類型，而座頭鯨有幾百種。我們目前正在收集數(shù)據(jù)，以確定座頭鯨通信系統(tǒng)的最高階熵。

海豚不必接收全部信息來填補缺失

有天文學(xué)家用我們的方法區(qū)分來自天體的自然信號與來自智慧生命的信號。天文學(xué)家喬瑟琳·貝爾·伯勒爾和安東尼·休伊什最初在1967年發(fā)現(xiàn)恒星脈沖星的信號時，媒體將它們稱為“LGMs”（小綠人）。因為這些無線電源發(fā)出的脈沖非常規(guī)律，一些科學(xué)家猜測它們可能來自非常先進的外星人。我們在澳大利亞國家望遠鏡中心西蒙·約翰斯頓的幫助下重新分析了帆船座脈沖星的脈沖，發(fā)現(xiàn)脈沖星信號的齊普夫斜率約為-0.3。這不同于我們所知的任何一種語言。此外，我們還發(fā)現(xiàn)這些脈沖信號內(nèi)很少存在或根本沒有條件概率結(jié)構(gòu)?，F(xiàn)在，我們已經(jīng)知道脈沖星

是超新星的天然殘余物。因此，信息理論可以輕易地將推定的智能信號和自然信號區(qū)分開。

我們目前正在分析從SETI研究所的艾倫望遠鏡陣列獲得的微波數(shù)據(jù)，該陣列由在1千兆赫至1 0千兆赫的頻帶中觀測的42個單獨的望遠鏡組成。除了尋找窄頻帶無線電載波的常規(guī)技術(shù)之外，我們現(xiàn)在開始應(yīng)用信息理論測量。這項工作是與SETI研究所的格里·哈普、喬恩·理查茲和吉爾·塔特合作進行的。假如我們能夠找到遵循齊普夫定律的信號，就會繼續(xù)前進，并在信號內(nèi)尋找語法結(jié)構(gòu)，以量化候選消息實際上的復(fù)雜性。

為了傳播信息，即便是非常先進的地外文明，也必須遵守信息理論的規(guī)則。由于缺乏共同的符號（與座頭鯨相同的問題），我們可能無法解讀這樣的信息，但是能夠從中了解到它們的通信系統(tǒng)以及它們思維過程的復(fù)雜性。如果SETI信號的條件概率是20階，則不僅信號源是人為的，而且它反映的是比地球上任何語言都復(fù)雜得多的語言。我們后續(xù)將會對外星物種思維過程的復(fù)雜性進行定量測量。