邏輯的引擎：人工智能的動力

2020-01-16 07:53:58陳曉華杜國平

河南社會科學 2020年5期

陳曉華，杜國平

（1.湘潭大學哲學系，湖南湘潭 411105；2.中國社會科學院哲學研究所，北京 100732）

2016年3月15日，圍棋世界冠軍韓國棋手李世石與谷歌人工智能阿爾法圍棋AlphaGo 進行較量，這場人機大戰(zhàn)的總比分最終定格在4∶1。AlphaGo贏了，人工智能借此迎來了新的春天。2017 年7 月8日，國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》（以下簡稱《規(guī)劃》）的通知，重點對我國人工智能發(fā)展的總體思路、戰(zhàn)略目標、主要任務(wù)和保障措施進行系統(tǒng)的規(guī)劃和部署，為推動我國人工智能的長期發(fā)展指明了方向?！兑?guī)劃》指出，人工智能目前的任務(wù)之一就是建立新一代人工智能關(guān)鍵共性技術(shù)體系，共包括八項共性技術(shù)，其中一項就是自然語言處理技術(shù)：重點突破自然語言的語法邏輯、字符概念表征和深度語義分析的核心技術(shù)，推進人類與機器的有效溝通和自由交互，實現(xiàn)多風格、多語言、多領(lǐng)域的自然語言智能理解和自動生成。為了進一步細化和落實《規(guī)劃》的相關(guān)任務(wù)，2017年12月14日，中華人民共和國工業(yè)和信息化部印發(fā)了《促進新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃（2018—2020 年）》，其中特別寫道：培育智能理解產(chǎn)品，加快模式識別、智能語義理解、智能分析決策等核心技術(shù)研發(fā)和產(chǎn)業(yè)化。筆者將回顧邏輯學與人工智能的悲歡離合，分析人工智能的困境，探尋擺脫困境的邏輯學路徑和方法。

一、人工智能70年：夢想與現(xiàn)實的交互

（一）人工智能的邏輯學淵源

“人工智能”一詞正式出現(xiàn)于1956 年麥卡錫召集的“人工智能夏季研討會”。而對于該名稱的使用，與會者當時并未形成共識，紐厄爾和西蒙更贊同“復(fù)雜信息處理”的概念。1958年，英國國家物理實驗室召開“思維過程機器化”會議，會上有人再次提出“人工思維”。人工智能作為一門學科其起源應(yīng)該有一段較長的路徑。“人工”一詞在日常使用中意思比較確定，就是人造的、人為的，如人工湖、人工降雨等。但是“智能”（intelligence）一詞，人們對于它就有不同的理解。斯滕伯格就人類意識這個主題給出了以下定義：智能是個人從經(jīng)驗中學習、理性思考、記憶重要信息以及應(yīng)付日常生活需要的認知能力[1]。

對認知能力或思維的形式化、機械化研究至少可以追溯到亞里士多德的形式邏輯。形式邏輯把思維內(nèi)容和思維形式區(qū)分開來，這是推理活動的出發(fā)點。邏輯的形式化是人工智能最強大最根本的基礎(chǔ)。西班牙的盧爾（Raymond Llull）可能是第一個嘗試機械化人類思維過程的人，他建立了一套基于邏輯的系統(tǒng)，用幾何圖形和原始邏輯來實現(xiàn)思維機械化。萊布尼茨又把這個想法往前推進一步，他認為所有的推理只是字符的結(jié)合或替代，可以建立一種“邏輯演算”，解決所有的邏輯論證問題，即思維是可計算的。這個思想為邏輯的數(shù)學形式化奠定了基礎(chǔ)，也為圖靈機及其物理實現(xiàn)奠定了強有力的思想基礎(chǔ)。英國數(shù)學家布爾在《思維規(guī)律研究》一書中給出了符號推理的一般方法，他使用三個邏輯運算符號“或、與和非”，變元基于真或假建立關(guān)系，其代數(shù)語言和邏輯運算規(guī)則的組合能夠計算思維。19世紀末，德國數(shù)學家和邏輯學家弗雷格建立了第一個邏輯公理化系統(tǒng)，即給定幾個初始公理和推理規(guī)則，就可以推出所有的真命題。同時，他提出算術(shù)邏輯形式化，用邏輯形式來表達算術(shù)，開創(chuàng)了數(shù)學證明論中的邏輯主義學派。這一切都朝著思維是可計算的方向發(fā)展，所有的推理都是可以證明或計算的。但是這一偉大目標并非能夠在所有系統(tǒng)中實現(xiàn)，1931年哥德爾證明了一致的初等算術(shù)系統(tǒng)，存在無法證明的真語句。這就表明思維形式化和機械化存在一些局限。1936 年，圖靈在其《論可計算數(shù)及其在判定性問題上的應(yīng)用》一文中提出一種理想的計算數(shù)學模型，后人稱之為圖靈機。所有可計算函數(shù)都可以用圖靈機計算，圖靈機為電子計算機的出現(xiàn)奠定了理論基礎(chǔ)。1946年，第一臺電子數(shù)字計算機ENIAC（世界上第一臺電子計算機是1942 年的阿塔納索夫- 貝瑞計算機，Atanasoff-Berry Computer，通常簡稱ABC計算機）的誕生也是多代人堅持不懈努力的結(jié)果。電子計算機的誕生為人工智能提供了物理實現(xiàn)的基礎(chǔ)。

至此，形式計算理論、依據(jù)形式計算理論而設(shè)計的電子計算機以及生物學上神經(jīng)元的發(fā)現(xiàn)奠定了整個人工智能的基礎(chǔ)。1943年，麥卡洛可和皮茨合作發(fā)表了一篇開創(chuàng)性的文章——《神經(jīng)活動內(nèi)在概念的邏輯演算》，建立了第一個神經(jīng)網(wǎng)絡(luò)的數(shù)學模型，神經(jīng)元的狀態(tài)和神經(jīng)元之間的關(guān)系采用興奮-抑制（0-1）方式，這個模型可以執(zhí)行高級神經(jīng)活動功能。神經(jīng)網(wǎng)絡(luò)模型具有計算能力，而這一切以前只能由人腦來完成。該文開創(chuàng)了邏輯符號主義學派人工智能和聯(lián)結(jié)主義人工智能研究的范式。

（二）困境與突破

1956 年達特茅斯會議的一個成果就是紐厄爾和西蒙公布了一個程序“邏輯理論家”，它可以證明《數(shù)學原理》中的命題邏輯部分。1958年夏天，王浩在一臺INM-704機上只用了九分鐘就證明了《數(shù)學原理》中的一階邏輯的全部定理，他被認為是定理證明的開山鼻祖。定理證明是極端的符號主義學派。所有符號主義學派的人工智能技術(shù)的基礎(chǔ)都是定理證明，如專家系統(tǒng)、知識表示和知識庫。在20世紀70年代初，人工智能發(fā)展遭遇瓶頸。莫拉維克這樣總結(jié)20世紀70年代人工智能領(lǐng)域遇到的障礙：首先，最難進行自動化，且計算機難以完成那些在人們看來最自然不過的事情，比如看、聽和利用常識進行推理。這表明當時的困境首先來自計算機本身的局限性，由于計算能力不足，無法解決指數(shù)型爆炸的復(fù)雜計算問題。其次，常識推理，需要大量對世界的認識信息，而計算機沒有相關(guān)的知識儲備。

眾所周知，計算機技術(shù)的發(fā)展日新月異，因而硬件的局限性只是暫時的。而對于世界的信息獲取問題，也因?qū)＜蚁到y(tǒng)的發(fā)展而得以解決。專家系統(tǒng)的知識表示、自然語言理解都可以用符號結(jié)構(gòu)來表示，常見的數(shù)理邏輯不夠用，需要新的邏輯系統(tǒng)，如知識圖譜中的描述邏輯。顯然這是邏輯符號主義學派的做法，他們堅信利用數(shù)學邏輯方式可以模擬人類大腦思維的運行方式。而聯(lián)結(jié)主義學派則認為通過對大腦結(jié)構(gòu)的仿真設(shè)計來模擬大腦的工作原理，即智能是源自大腦神經(jīng)元之間的鏈接，而非單個的神經(jīng)元。1982年，霍普菲爾德提出一種新的神經(jīng)網(wǎng)絡(luò)，可以解決一大類模式識別問題，并給出了一類組合優(yōu)化問題的近似解。

1987年，由于美國蘋果公司和IBM公司生產(chǎn)的臺式機性能不斷提升，個人電腦的理念不斷蔓延，AI硬件的市場需求突然下跌。并且，由于互聯(lián)網(wǎng)的出現(xiàn)，人類專家可以隨時隨地在網(wǎng)上解答問題，專家系統(tǒng)從而失去了存在的意義。

挑戰(zhàn)與機遇并存，神經(jīng)網(wǎng)絡(luò)在20 世紀80 年代由于互聯(lián)網(wǎng)的到來而被遮掩。隨后，互聯(lián)網(wǎng)產(chǎn)生的巨大的信息數(shù)據(jù)為神經(jīng)網(wǎng)絡(luò)的發(fā)展提供了更好的契機。深度學習之父辛頓站在神經(jīng)網(wǎng)絡(luò)大神霍普菲爾德的肩膀上，于1983 年發(fā)明了玻兒茲曼機；到2006 年，他又開發(fā)出深度信念網(wǎng)絡(luò)，一種用于受限玻兒茲曼機的快速學習算法，深度學習技術(shù)開始騰飛。神經(jīng)網(wǎng)絡(luò)由一層層神經(jīng)元構(gòu)成，深度學習就是利用具有多層神經(jīng)元的神經(jīng)網(wǎng)絡(luò)來進行機器學習。從形式理論來看，一層網(wǎng)絡(luò)就是一個函數(shù)，多層網(wǎng)絡(luò)就是多個函數(shù)的嵌套。層數(shù)越多，網(wǎng)絡(luò)越深，表達能力越強，當然伴隨而來的復(fù)雜度就呈指數(shù)級增長。深度學習技術(shù)，催生了“智能就是大數(shù)據(jù)加深度學習”的觀念。神經(jīng)網(wǎng)絡(luò)是我們的終極算法嗎？深度學習是通向通用人工智能的正確路徑嗎？讓我們拭目以待。

二、人工智能的困境

機器能夠思考嗎？圖靈在1950年的《計算機與智能》一文中試圖回答這個問題。他提出了圖靈測試，詳細定義并解釋了人工智能及其研究目的、發(fā)展方向，并駁斥了當時科學界及社會上普遍存在的反對觀點。這在今天看來依然具有深刻意義。圖靈測試表明，如果測試者無法區(qū)分人與機器在語言行為方面的差別，那么我們就可以認為機器具有“智能”。圖靈在文末指明了兩條研究范式：符號派和聯(lián)結(jié)派。通過這兩種范式，計算機程序可以實現(xiàn)我們今天所說的通用人工智能或強人工智能。他這樣寫道：“我們或許期待著，有一天，機器能夠在所有純智能的領(lǐng)域中同人類競爭。但是從哪里起步最好呢？甚至這也是一個困難的抉擇。許多人認為，非常抽象的活動，比如下棋，可能是最好的。也有人認為，最好是給機器配備能買得到的最好的感覺器官，然后教它懂英語，并講英語。這個過程可以像通常教孩子那樣，指著東西，說出它們的名字，等等。我還是不知道正確答案是什么，但是我認為兩種方法都應(yīng)該試一試。”[2]90

《計算機與智能》一文引發(fā)了機器智能的技術(shù)探索，同時也引發(fā)了機器智能技術(shù)背后的哲學反思。德雷福斯是對機器智能進行哲學反思最有影響力的哲學家之一，他認為機器智能是不可能的。美國蘭德公司1965 年12 月出版了德雷福斯的P-2344 報告，題為《煉金術(shù)與人工智能》，尖銳唱衰人工智能，對人工智能早期發(fā)展提出了重大的挑戰(zhàn)。德雷福斯在該報告的基礎(chǔ)上進行擴充，于1972年出版了《計算機不能做什么：人工智能的極限》。該書專門對明斯基1968 年出版的人工智能論文集《語義信息加工》進行了研究，并且把聯(lián)想主義心理學假設(shè)擴充為生物學、心理學、認識論和本體論四個方面的假設(shè)，從而涵蓋了當時人工智能研究方法的全部基礎(chǔ)。德雷福斯對人工智能在四個層面的理論一一進行了駁斥。在生物學層面，麥克洛克-皮茨的神經(jīng)元是二元的；德雷福斯認為人腦是模擬的。在心理學層面，人工智能學家表征為信息處理和規(guī)則；德雷福斯認為信息和常識是無法用規(guī)則表示的。在認識論層面，麥卡錫認為所有的知識都是可以形式化的；德雷福斯認為人的知識不是形式化的，人們可以用微分來描述物體運動，但并不是物體在求微分。在本體層面，人工智能學者認為世界由事實構(gòu)成，是可以還原的；德雷福斯認為人和物是有區(qū)分的，物可以還原，但人需要現(xiàn)象學。正如德雷福斯所指出的，由于智能必須處在某一局勢之中，因此它不能同人類生活的其他方面分隔開來[3]。而人工智能學者認為，日常生活中智能所需的一切都可以客體化并表達為一種信念系統(tǒng)，智能的理解力可以形式化為事實和規(guī)則的復(fù)雜系統(tǒng)，這在德雷福斯看來是毫無道理的。

德雷福斯并不孤獨，批評人工智能的哲學家還有一位——塞爾，他在1980 年的《心靈、大腦和程序》一文中提出一個思想實驗“中文屋”，這個思想實驗就是要反駁即使是機器通過了圖靈測試，該機器依然不具有智能。塞爾認為，計算程序至多是理解語法，但并沒有理解語義，信息必須內(nèi)化才是理解，即知識成為人身的一部分。也就是說，單純的形式化符號操控是沒有理解能力的，計算機硬件也不同于神經(jīng)蛋白，不具有意向性，缺乏生成心理過程所需的恰當?shù)囊蚬芰?。塞爾認為，只有一種機器能夠思維，實際上只有一些類型非常特殊的機器，即大腦和那些與大腦具有相同因果能力的機器才能夠思維[2]118。

機器智能技術(shù)的探索一直在發(fā)展，從當初的邏輯符號學派到現(xiàn)如今如日中天的深度學習，總是不斷地向機器智能方向逼近。2018年的圖靈獎獲得者深度學習三巨頭之一的Yann LeCun指出，深度學習存在一些局限性，具體表現(xiàn)在以下幾點：缺乏理論支持、推理能力欠缺、短時記憶能力需要加強以及無監(jiān)督學習能力弱[4]。首先，神經(jīng)網(wǎng)絡(luò)依然由經(jīng)驗來搭建。網(wǎng)絡(luò)參數(shù)有可能只是一個局部最優(yōu)，而不是全局最優(yōu)，因而算法還有很大的優(yōu)化空間。深度學習目前不是一個發(fā)展完善的理論，還有很多地方需要加強研究。其次，深度學習最受詬病的是缺乏邏輯推理能力，在面對需要復(fù)雜推理的任務(wù)時受到一定限制。圖靈獎得主、貝葉斯網(wǎng)絡(luò)之父珀爾在ArXiv上發(fā)布了他的論文《機器學習理論障礙與因果革命七大火花》，其中指出，當前的機器學習系統(tǒng)幾乎都是以概率統(tǒng)計的方式運行，不能作為通用智能的基礎(chǔ)。他認為，突破口在于“因果革命”，借鑒結(jié)構(gòu)性的因果推理模型，能對自動化推理做出獨特貢獻。

一句話，以目前的技術(shù)，機器智能還需要走很長一段路。

三、自然語言理解和邏輯語義學

人工智能領(lǐng)域最經(jīng)典的兩個思想實驗——圖靈測試和“中文屋”（塞爾），說的是機器的自然語言理解問題。圖靈說，檢驗機器智能的高低最好的辦法就是讓機器會自然語言并且理解自然語言；而塞爾說，機器會把英文翻譯成中文，還不是真正的理解，只有真正理解，機器才有智能。自然語言顯然是指人類日常使用的語言。機器理解人類的日常語言，就是用計算機科學中的算法和數(shù)據(jù)結(jié)構(gòu)的概念來建立一個語言的計算理論。相對于“自然語言”來說，這個計算理論就是“機器語言”。這兩者之間的差異是顯而易見的。機器語言是一套規(guī)則系統(tǒng)，系統(tǒng)中的表達式都是遞歸生成的，語形和語義之間存在一一對應(yīng)關(guān)系，每一個語形符號的含義都是確定的。而自然語言并不完全是遞歸生成的，語形和語義之間并不存在一一對應(yīng)的關(guān)系，其相關(guān)性是在社會實踐活動中逐步固定下來或逐步發(fā)生改變。也就是說，自然語言是靈活多樣的。兩者的形成機制并不一樣，因而自然語言帶來了一些有趣的計算性挑戰(zhàn)，包括分詞、標注、分類、信息提取、建立句法和語義表示等。但是從技術(shù)層面來看，語言計算模型和人類處理自然語言的方式的不一樣并不重要，重要的是計算機是否真的理解人類語言。

語言的計算模型就是自然語言的形式化。1956 年喬姆斯基在《句法結(jié)構(gòu)》一書中創(chuàng)建了轉(zhuǎn)換生成語法。他寫道：“這篇論文是從廣義（跟語義學相對）和狹義（跟音位學及詞法相對）兩個方面來討論句法結(jié)構(gòu)的。我們打算建立一種公式化的一般語言結(jié)構(gòu)理論，并且打算探討這種理論的基礎(chǔ)。”[5]喬姆斯基的句法分析和自動機有著密切的關(guān)聯(lián)。喬姆斯基把句法分成四種類型，即0型、1型、2型、3型。0 型文法等價于圖靈機，1 型文法（上下文有關(guān)文法）等價于線性有界非確定圖靈機，2 型文法（上下文無關(guān)文法）等價于下推自動機，3 型文法（正則表達式）等價于有限自動機。顯然，形式語言理論成為一種可以計算的理論，可以直接應(yīng)用到自然語言的機器處理中，成為自然語言理解的有力工具。

形式語言理論的發(fā)展和人工智能的抱負分不開，自然在技術(shù)路線上也和人工智能的兩條路徑相吻合。以生成語言學為基礎(chǔ)的研究路徑，稱為理性主義，和邏輯符號主義學派相對應(yīng)；以大規(guī)模語料庫分析為基礎(chǔ)的研究路徑，稱為經(jīng)驗主義，和聯(lián)結(jié)主義相對應(yīng)。大規(guī)模語料庫的出現(xiàn)其實就是對基于規(guī)則分析方法的一個重要補充，也是研究目標的轉(zhuǎn)向，機器通過自動學習來獲取語言知識。

理解自然語言的核心是理解語言的意義。而在形式語言理論中對于語義的表示方法采用語言學的直觀表征還是數(shù)學或邏輯的形式表征，學界一直沒有取得共識。顯然語言學的直觀表征在語料庫中居多，通過對語言運用實例的大量搜集、整理和分析，歸納出自然語言的典型特征，并用形式的方法表述出來。而數(shù)學或邏輯的形式表征更方便計算機的操控。邏輯的形式表征是將自然語言表達式的成分轉(zhuǎn)換成高階邏輯的表達式，數(shù)學的形式表征通過類型化特征結(jié)構(gòu)圖中的屬性—值來表示語法和語義信息。數(shù)學或邏輯的形式表征有一個潛在的原則——組合原則，即一個復(fù)雜表達式的語義由它的各個成分的語義及其組合模式得到。這一原則保證語句語義的遞歸生成，即一個復(fù)雜的表達式的語義可以遞歸計算。

生成語法理論之后衍生出眾多的語法理論，其中組合范疇語法在生成力和解釋力方面更加貼近自然語言。組合范疇語法CCG 是在古典范疇語法基礎(chǔ)上發(fā)展起來的，其優(yōu)點在于：它的句法和語義之間有一個透明的接口，每個詞條的語義表達式和句法范疇都被存放在詞庫的詞項上，句法范疇和語義類型、語義最后的表達式都可以基于詞庫中的范疇指派生成[6]。組合范疇語法CCG不僅滿足了自然語言處理所需要的句法分析，而且滿足了詞與詞之間的語義關(guān)系?，F(xiàn)階段的自然語言處理僅僅利用CCG的句法范疇進行標注和推演，忽視語義類型的標注和推演，這使得CCG的句法分析器難以達到完美的效果。尤其對于意合型的漢語，這類語言句法上缺少嚴格的形態(tài)標記，語序靈活，上下文依賴程度高。CCG 處理的效果更是不盡如人意。對于該問題的處理，鄒崇理的研究團隊做了一系列的工作，特別是構(gòu)建了漢語CCG語料庫。該語料庫把基于短語結(jié)構(gòu)語法的賓州漢語樹庫轉(zhuǎn)換成基于組合范疇語法的漢語CCG 樹庫。漢語CCG 樹庫目前的一些句法分析在語義上是不合適的，還需要額外的手工標注來獲得正確的分析。同時CCG 樹庫用相同的方式給相同類型的所有范疇提供共指標記，顯然不夠嚴謹，無法在語義上反映相應(yīng)的共指關(guān)系。造成這種現(xiàn)象的原因是范疇的標注只是句法的，不含有語義信息。這表明CCG 漢語樹庫尚需進一步完善，這就需要邏輯語義學研究的介入。

四、因果形式學習

朱松純認為，人工智能是小數(shù)據(jù)、大任務(wù)，而不是相反[7]。環(huán)境中的智能體通過觀察操控環(huán)境中的有限信息（小數(shù)據(jù)），建立信息或行為之間的因果關(guān)聯(lián)，從而做出復(fù)雜的行為（大任務(wù)），即具有因果推斷能力就可以在小數(shù)據(jù)的基礎(chǔ)上完成大任務(wù)。小數(shù)據(jù)、大任務(wù)的典范就是“烏鴉范式”：烏鴉進城覓食，找到一枚堅果，現(xiàn)在的任務(wù)是把堅果砸碎。烏鴉發(fā)現(xiàn)路過的車輛會把堅果軋碎，但是車流密集，自己也有可能被軋死。那么，覓食的任務(wù)就分解成兩個任務(wù)：車軋碎堅果，避免車輛軋到自己。它發(fā)現(xiàn)有紅綠燈的十字路口可以達成這個任務(wù)。它發(fā)現(xiàn)了車輛、人行道和紅綠燈之間的因果關(guān)系。也就是說，在這個過程中烏鴉并不需要大量的數(shù)據(jù)，只需要少量的數(shù)據(jù)，但是最重要的是在這少量的數(shù)據(jù)中有效地獲得因果關(guān)系，并根據(jù)這個因果關(guān)系制定相應(yīng)的行動方案。也就是說，只有給機器配備了因果推理模型，機器才可以說是具有了智能。而因果推理模型則是結(jié)合了演繹推理和歸納推理等推理模式。早期的人工智能理論主流是基于邏輯符號的演繹推理，而現(xiàn)在如日中天的深度學習卻是基于大數(shù)據(jù)的概率統(tǒng)計推理，均不可能發(fā)明出真正的人工智能。

問題是怎么從數(shù)據(jù)中提煉出因果關(guān)系。這就需要一個因果模型。如果找到了這樣一個好的因果模型，那么我們就可以做實驗，從大數(shù)據(jù)中找到真正的因果關(guān)系。對于因果發(fā)現(xiàn)的方法，我們最熟悉的莫過于密爾五法，但是該方法存在很多的問題，可操控性弱。研究因果模型推理的杰出學者珀爾把因果分為三個層面，并稱之為“因果關(guān)系之梯”：關(guān)聯(lián)、干預(yù)和反事實推理。這三個層面其實對應(yīng)于三個不同層次的認知能力：觀察力（發(fā)現(xiàn)環(huán)境中的規(guī)律的能力）、行動力和想象力。因果關(guān)系之梯的第一層級要求我們基于被動觀察做出預(yù)測。其典型問題是：“如果我觀測到……會怎樣？”這個可用條件概率來表征：P（y | x）= p。就是說，假設(shè)我們觀察到事件x 時，事件y 出現(xiàn)的概率等于p，即把x 和y 關(guān)聯(lián)起來。處于第二層級的“干預(yù)”則是主動行動起來，即怎么做?？梢杂眯稳鏟[y | do（x）]的句子來表征，表述的是假設(shè)我們干預(yù)x，然后觀察事件y 的概率。第三層級的反事實就是思想實驗，如果我做出了不同的行動結(jié)果會怎樣？這一層級需要用到回溯推理?？梢杂眯稳鏟（yx | x′，y′）的表達式來刻畫，意思是：我們觀察到x 時事件y 的概率是基于我們實際上觀察到x′時y′的概率。珀爾指出：“因果關(guān)系之梯的每一層級都有一種代表性生物。大多數(shù)動物和當前的學習機器都處于第一層級，它們通過關(guān)聯(lián)進行學習。像早期人類這樣的工具使用者則處于第二層級，前提是他們是有計劃地采取行動而非僅靠模仿行事。我們也可以通過實驗來習得干預(yù)的效果，這大概也是嬰兒獲取大多數(shù)因果知識的方式。反事實的學習者處于階梯的頂級，他們可以想象并不存在的世界，并推測觀察到的現(xiàn)象的原因為何?！盵8]珀爾從因果關(guān)系之梯及其形式表達出發(fā)，得出目前的深度學習還處于第一層面。僅僅停留在第一層面達不到真正的因果關(guān)系，還需要額外的條件，才能進行因果推理。

珀爾指出，因果關(guān)系之梯用因果圖就可以很好地說明。用因果圖來構(gòu)建因果模型不僅僅是畫箭頭，箭頭背后還隱藏著概率。當我們繪制一個從X指向Y的箭頭時，其實是在說，某些概率規(guī)則或函數(shù)具體說明了“如果X 發(fā)生改變，Y 將如何變化”。通常情況下，因果圖自身的結(jié)構(gòu)就足夠讓我們推測出各種因果關(guān)系和反事實關(guān)系：簡單的或復(fù)雜的、確定的或概率的、線性的或非線性的。正是在這個基礎(chǔ)上，珀爾稱之為“結(jié)構(gòu)因果模型”[9]，該模型由三個部分構(gòu)成：圖模型、結(jié)構(gòu)化方程以及反事實和干預(yù)邏輯。其中，圖模型作為表征知識的語言，反事實邏輯表達問題，結(jié)構(gòu)化方程以清晰的語義將前兩者關(guān)聯(lián)起來。由此建立的因果關(guān)系演算系統(tǒng)能夠執(zhí)行一些當前機器學習系統(tǒng)無法實現(xiàn)的任務(wù)，并且是使用因果建模工具完成的。

五、展望

愛因斯坦認為，西方科學的發(fā)展是以兩個偉大的成就為基礎(chǔ)的，那就是希臘哲學家發(fā)明的形式邏輯體系，以及通過系統(tǒng)的實驗發(fā)現(xiàn)有可能找出因果關(guān)系。我們現(xiàn)在依然在做這兩件事，用形式系統(tǒng)來刻畫智能，用形式系統(tǒng)找出數(shù)據(jù)或信息之間的因果關(guān)聯(lián)。什么是智能？從圖靈測試到“中文屋”，從大數(shù)據(jù)到因果推斷，到小數(shù)據(jù)、大任務(wù)，其背后隱藏著理性主義和經(jīng)驗主義、符號主義學派和聯(lián)結(jié)主義學派的哲學和方法之爭。

鄒崇理認為，在自然語言理解中，理性主義走向極致，規(guī)則模式只能解析實際運用的少量表達式；經(jīng)驗主義走向極致，個案個例的羅列無章可循，不便從中識別不合法的表達式。怎樣進行理性主義和經(jīng)驗主義關(guān)于語義的深度融合？目前的研究重心是結(jié)合多種邏輯工具作為自然語言的語義表征，采用統(tǒng)一的機器算法和人工標注相結(jié)合的方式，給漢語CCG句法分析樹庫匹配語義表征。

為了解決深度學習中的關(guān)系推理問題，深智團隊（DeepMind）聯(lián)合谷歌大腦、MIT等機構(gòu)27位作者發(fā)表了一篇探究性的文章《關(guān)系歸納偏置、深度學習和圖網(wǎng)絡(luò)》，將圖的一階邏輯和概率推理結(jié)合到一起，試圖解決深度學習中的因果推理問題。深智團隊也提供另外一種方案：傳統(tǒng)的貝葉斯因果網(wǎng)絡(luò)、知識圖譜與深度強化學習融合。這種方案也是困難重重。同時值得一提的是，馬爾科夫邏輯網(wǎng)是將馬爾科夫網(wǎng)絡(luò)與一階謂詞邏輯相結(jié)合的統(tǒng)計關(guān)系學習模型，具有強大的描述能力、邏輯推理能力和處理不確定性的能力。這些方案，暫時無法分出優(yōu)劣，也許是條條道路通羅馬，只有等到達人工智能的奇點之后才知道哪條路是可行的。

未來已來，正如圖靈所說：初見前路近可至，細思百事競待忙。（We can only see a short distance ahead，but we can see plenty there that needs to be done.）[10]

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

邏輯的引擎：人工智能的動力

一、人工智能70年：夢想與現(xiàn)實的交互

（一）人工智能的邏輯學淵源

（二）困境與突破

二、人工智能的困境

三、自然語言理解和邏輯語義學

四、因果形式學習

五、展望

一、人工智能70年：夢想與現(xiàn)實的交互

二、人工智能的困境

三、自然語言理解和邏輯語義學

四、因果形式學習

五、展望