關(guān)鍵詞:人工智能;知識(shí)表示;知識(shí)工程;智能傳播;ChatCJPT
一、前言
根據(jù)彼得·帕克(Peter Burke)對(duì)知識(shí)社會(huì)的斷代劃分和對(duì)知識(shí)系統(tǒng)大轉(zhuǎn)型的時(shí)期描述,自20世紀(jì)90年代以來(lái),知識(shí)社會(huì)進(jìn)入了“自反性時(shí)代”①。知識(shí)的“自反性”體現(xiàn)為知識(shí)的自我修正、自我更新、自我懷疑不斷涌現(xiàn),在不斷懷疑、修正和更新過(guò)程中知識(shí)對(duì)變動(dòng)中的社會(huì)的反映能力也在逐漸增強(qiáng),曾經(jīng)的不斷修改補(bǔ)充的維基百科如此,今日不斷吸收新的訓(xùn)練數(shù)據(jù)以生成更新的、更準(zhǔn)確的知識(shí)的ChatGPT也是如此?!白苑葱浴边€體現(xiàn)為今天圍繞知識(shí)的人類行為不僅是對(duì)“知識(shí)”的創(chuàng)建,更是對(duì)“知識(shí)的知識(shí)”的創(chuàng)建,這體現(xiàn)為大量的知識(shí)史類研究成為這一時(shí)期各個(gè)學(xué)科的新興領(lǐng)域,對(duì)知識(shí)體系和知識(shí)建構(gòu)過(guò)程的索驥和解剖構(gòu)成了一種建立“元知識(shí)”的努力。而在這一系列建立“元知識(shí)”的壯志圖景中,人工智能自誕生之日起就表明了其決心和勇氣,并在起起伏伏的發(fā)展周期中不斷地被寄予厚望。
人工智能的知識(shí)自反性和創(chuàng)建元知識(shí)的愿景似乎走得更遠(yuǎn),因?yàn)槿斯ぶ悄艿闹R(shí)工作不僅包含對(duì)知識(shí)的存儲(chǔ)、管理、理解、分析和調(diào)動(dòng),更包括一種關(guān)于知識(shí)的基底性工作,那就是知識(shí)表示(knowledge representation)。以羅杰·香客(Roger Schank)為首的人工智能理論家們?cè)暶鳎?/p>
“組織世界的知識(shí)問(wèn)題是人工智能的最大難題”②,而知識(shí)表示就是用來(lái)解決這一“最大難題”的必經(jīng)之路。知識(shí)表示是人工智能的一項(xiàng)本體論工程,它需要回答世界是什么的問(wèn)題,但更重要的是,它需要將關(guān)于世界的知識(shí)轉(zhuǎn)化為計(jì)算機(jī)可以處理的形式。因此知識(shí)表示不僅是人工智能儲(chǔ)存機(jī)器獲知信息的必備能力,更是一種創(chuàng)造“知識(shí)的知識(shí)”的不懈努力。知識(shí)表示是人工智能推理和行動(dòng)的載體,可以說(shuō),如果沒(méi)有恰切的知識(shí)表示方法,任何構(gòu)建智能機(jī)器的愿景都無(wú)法得到實(shí)現(xiàn)。知識(shí)表示作為一種技術(shù)哲學(xué)意義的結(jié)構(gòu)性力量建構(gòu)著智能傳播時(shí)代的知識(shí)樣貌,也反映著人工智能存續(xù)以來(lái)的知識(shí)困境和智識(shí)極限。
二、人工智能的形式化知識(shí)表示
對(duì)知識(shí)表示的重視和人工智能專家系統(tǒng)的發(fā)展密不可分。專家系統(tǒng)也被稱為基于知識(shí)的系統(tǒng)。人工智能專家系統(tǒng)是一個(gè)高度依賴知識(shí)表示的系統(tǒng),如果給定合適的領(lǐng)域知識(shí),在狹窄定義的問(wèn)題上,人工智能足以匹敵甚至超過(guò)人類專家的表現(xiàn)。例如,第一個(gè)人工智能專家系統(tǒng)DENDRAL就能夠像化學(xué)專家一樣精確地解釋質(zhì)譜儀的輸出,DENDRAL的發(fā)明者愛(ài)德華·菲根鮑姆(EdwardFeigenbaum)更是將在該程序和此后用于推導(dǎo)質(zhì)量微量測(cè)定規(guī)則的程序METADENDRAL等所做的工作稱為“知識(shí)工程”③。雖然DENDRAL的成功有助于使人工智能研究團(tuán)體相信知識(shí)表示的重要性,但需要注意的是,在DENDRAL中使用的表示形式是高度特定于某一知識(shí)領(lǐng)域的。
隨著專家系統(tǒng)取得鼓舞人心的進(jìn)展,研究者更加對(duì)標(biāo)準(zhǔn)化和形式化的知識(shí)表示方法和知識(shí)本體論感興趣,形式化知識(shí)表示能夠使創(chuàng)建新的專家系統(tǒng)的過(guò)程簡(jiǎn)化且更有效率。于是,人工智能在知識(shí)層面進(jìn)入先前由語(yǔ)言學(xué)家、哲學(xué)家們探索的領(lǐng)域。形式化知識(shí)表示并非是計(jì)算機(jī)和人工智能領(lǐng)域特有的行動(dòng)過(guò)程,實(shí)際上任何領(lǐng)域的技術(shù)術(shù)語(yǔ)的發(fā)展都可以被視作一種形式化知識(shí)表示。從這一更大范圍的定義來(lái)看,古希臘對(duì)數(shù)學(xué)術(shù)語(yǔ)定義的使用可以被看作西方形式化知識(shí)表示的最早樣例,而在東方,形式化知識(shí)表示開(kāi)始于公元前第一個(gè)千年時(shí)古印度對(duì)梵語(yǔ)語(yǔ)法的理論化。當(dāng)人工智能加入往日在科學(xué)領(lǐng)域、語(yǔ)言領(lǐng)域等早已被思考過(guò)的形式化知識(shí)表示問(wèn)題時(shí),或者說(shuō),當(dāng)形式化的知識(shí)表示位移至人工智能領(lǐng)域后,知識(shí)表示這一問(wèn)題就變成了“如何在有關(guān)的情景中建立規(guī)則并用以描述特殊事物”的問(wèn)題變種,其重要性正如麻省理工學(xué)院人工智能實(shí)驗(yàn)室主任帕特里克·溫斯頓(Patrick Winston)在其人工智能集大成之作中所說(shuō):“知識(shí)表示是用來(lái)描述一類事物的一套成規(guī)慣例,好的知識(shí)表示是問(wèn)題求解的關(guān)鍵,挖掘合適的知識(shí)表示是解決問(wèn)題的主要步驟?!?/p>
知識(shí)表示一直是人工智能研究的關(guān)鍵問(wèn)題,但在人工智能的知識(shí)工程時(shí)期,對(duì)于知識(shí)表示的探究更多聚焦于用盡可能少的知識(shí)取得盡可能多的成績(jī)。然而沿著這一研究思路,問(wèn)題也逐漸浮現(xiàn),知識(shí)工程時(shí)期的瓶頸正如香客等人所說(shuō):“研究人員開(kāi)始懂得,程序編制中的特技是有趣的,但卻無(wú)法推廣……人工智能研究者認(rèn)識(shí)到,人們?nèi)绾问褂煤捅硎局R(shí)是這一領(lǐng)域中的關(guān)鍵問(wèn)題?!盌ENDRAL程序非常典型地代表了20世紀(jì)70年代人工智能發(fā)展的成就和特點(diǎn)。這一時(shí)期,人工智能研究者們的確在語(yǔ)言理解、場(chǎng)景分析、概念學(xué)習(xí)、機(jī)器人制造等方面取得了某種程度的成功,而這些工作的基礎(chǔ)都是依據(jù)對(duì)某一任務(wù)領(lǐng)域的特定知識(shí)特性的利用,這導(dǎo)致這些程序雖具有專業(yè)性但缺乏推廣性。面臨專家系統(tǒng)的知識(shí)限制特點(diǎn),人工智能最終不得不面對(duì)一個(gè)關(guān)鍵性的同時(shí)在哲學(xué)層面非常具有吸引力的問(wèn)題——人工智能如何表示日常知識(shí)?
對(duì)日常知識(shí)進(jìn)行形式化知識(shí)表示之所以成為人工智能向“智慧體”進(jìn)發(fā)途中的一大困境,是因?yàn)橐环矫嫒粘VR(shí)構(gòu)成人工智能進(jìn)行認(rèn)知和行動(dòng)的重要背景常識(shí)和上下文語(yǔ)境,它直接關(guān)乎人工智能對(duì)信息處理和輸出的準(zhǔn)確性與有效性;另一方面,人類對(duì)日常知識(shí)的獲得高度依賴于人類在日常生活中的具體實(shí)踐活動(dòng)和相伴生的思維過(guò)程,日常知識(shí)是個(gè)人依靠自己的身體,借由同物質(zhì)世界的相互作用,并在日復(fù)一日的訓(xùn)練和對(duì)訓(xùn)練的熟練化過(guò)程中領(lǐng)悟得來(lái)。需要注意的是,此“訓(xùn)練”遠(yuǎn)非今日如火如荼的生成式人工智能的“訓(xùn)練”,生成式人工智能的訓(xùn)練并不是基于其和物質(zhì)世界的交互,而是基于被多次中介化的訓(xùn)練數(shù)據(jù)、語(yǔ)料。被譽(yù)為卷積神經(jīng)網(wǎng)絡(luò)之父的楊立昆(Yann LeCun)曾表明:深度學(xué)習(xí)的能力十分強(qiáng)大卻又十分有限。只受過(guò)國(guó)際象棋訓(xùn)練的機(jī)器根本無(wú)法下圍棋,反之亦然,而且它完全不理解自己所做的事情,它只不過(guò)是機(jī)械化地執(zhí)行指令,它所掌握的常識(shí)甚至還不如一只野貓。
一壁是人類日常知識(shí)獲取途徑的不可機(jī)械性復(fù)制與重現(xiàn),一壁是信息加工模型對(duì)人工智能知識(shí)認(rèn)識(shí)論的影響,在二者共同作用下,人工智能對(duì)日常知識(shí)、背景知識(shí)、常識(shí)性知識(shí)的需要就轉(zhuǎn)化為對(duì)人類一般性全部知識(shí)和信念進(jìn)行明晰表現(xiàn)和有序組織的需要。而由于在人工智能兩個(gè)派別并行發(fā)展的過(guò)程中,樹(shù)搜索和專家系統(tǒng)先于神經(jīng)網(wǎng)絡(luò)和學(xué)習(xí)機(jī)器成為人工智能底層邏輯的代言人,因此在通向人工智能的常識(shí)化、一般化和通用化目標(biāo)之時(shí),早期人們借助的也是從專家系統(tǒng)中衍生而來(lái)的概念——微世界。
所謂微世界,是一個(gè)個(gè)可以孤立地進(jìn)行分析的領(lǐng)域,20世紀(jì)的專家系統(tǒng)就誕生了大量的人工智能微世界,比如用于處理符號(hào)代數(shù)式的MATHLAB,可以激發(fā)積木運(yùn)動(dòng)的自然語(yǔ)言理解程序SHEDLU,以及上文提到的用于從質(zhì)譜數(shù)據(jù)中推導(dǎo)化學(xué)結(jié)構(gòu)的DENDRAL?!拔⑹澜纭备拍钏闹R(shí)觀念在于:雖然某種知識(shí)的各個(gè)方面都可以引申到人類活動(dòng)的其他方面,但是這一知識(shí)及其無(wú)窮無(wú)盡的衍生物也可以成為一個(gè)由事實(shí)和關(guān)系組成的自足的集合。用人工智能科學(xué)家、SHEDLU的開(kāi)發(fā)者特里·威諾格拉德(Terry Winograd)的描述來(lái)說(shuō):我們希望研究出一種形式化系統(tǒng),或者說(shuō),形式化表示,用來(lái)描寫知識(shí),我們探索組成知識(shí)的“原子”“粒子”,以及用于各種知識(shí)的各種“力”。
棋盤世界、積木世界都屬于典型的微世界,它包含著非常明確和特定的背景知識(shí)、行動(dòng)對(duì)象和方法路徑,機(jī)器的理解和行動(dòng)是在一個(gè)有限度、有范圍、有邊界、有指向的語(yǔ)境中做出的。雖然今天人工智能的代表物和言說(shuō)者已經(jīng)由專家系統(tǒng)輪轉(zhuǎn)為依賴神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的認(rèn)知機(jī)器,但是微世界的知識(shí)觀念并未消失在技術(shù)的地表之下,人們依然可以從今天的人工智能知識(shí)表示中窺見(jiàn)一二。
以ChatGPT為例,雖然ChatGPT是一個(gè)通用式的生成式人工智能,其大語(yǔ)言模型之“大”、訓(xùn)練數(shù)據(jù)之“廣”似乎與“微世界”相去甚遠(yuǎn)。但是仔細(xì)觀察ChatGPT的人機(jī)交互界面會(huì)發(fā)現(xiàn),ChatGPT采取的是“多對(duì)話界面”的形式,用戶可以隨時(shí)點(diǎn)擊左側(cè)任務(wù)欄的書寫按鈕來(lái)創(chuàng)建一個(gè)新的對(duì)話界面。ChatGPT的“多對(duì)話界面”“創(chuàng)建新對(duì)話框”的設(shè)計(jì)本質(zhì)是在建立和隔離不同的孤立且自足的“微世界”。當(dāng)用戶打開(kāi)一個(gè)新的對(duì)話界面發(fā)出第一個(gè)提問(wèn)的同時(shí),一個(gè)微世界的模型也正在搭建,而在用戶和聊天機(jī)器人不停地就這一問(wèn)題和該問(wèn)題的衍生問(wèn)題、相關(guān)問(wèn)題進(jìn)行循環(huán)往復(fù)的問(wèn)答、補(bǔ)充和確認(rèn)的時(shí)候,關(guān)于這個(gè)微世界的背景知識(shí)、話語(yǔ)規(guī)則、常識(shí)系統(tǒng)、思維指南也隨之完善。因此,在借助ChatGPT進(jìn)行知識(shí)獲取的操作過(guò)程中經(jīng)常會(huì)出現(xiàn)的現(xiàn)象是,當(dāng)用戶完成了上一輪的知識(shí)交互并打算對(duì)新的問(wèn)題展開(kāi)提問(wèn)時(shí),在既有的對(duì)話框里繼續(xù)提問(wèn)和創(chuàng)建一個(gè)新的對(duì)話框重啟提問(wèn),兩種操作方式所得到的結(jié)果并不相同,而后者往往能得到比前者更準(zhǔn)確和有效的回答。
誠(chéng)然,大規(guī)模知識(shí)表示需要通用本體論來(lái)組織和結(jié)合各種特定論域的知識(shí)。通用本體論需要包含全面化、多樣化的各種知識(shí),且原則上應(yīng)當(dāng)能夠處理所有論域。但是構(gòu)建大型通用本體論是一項(xiàng)尚未被完全了解的重大挑戰(zhàn)。因此,由不同的微世界和特定有限的常識(shí)框架構(gòu)建的知識(shí)集合依然是今天知識(shí)表示的一種有效的但也是簡(jiǎn)化的手段。換言之,將自己區(qū)別于專家系統(tǒng)的今日通用式人工智能依然無(wú)法依靠“訓(xùn)練”和“學(xué)習(xí)”完全突破人工智能的形式化知識(shí)表示的難題,人工智能的智識(shí)極限依然尚未突破。
三、人工智能的非形式化批判
對(duì)人工智能展開(kāi)非形式化批判起源于圖靈在《計(jì)算機(jī)機(jī)器和智能》中提到的人類行為的非形式化論據(jù)。圖靈認(rèn)為不可能制定一套規(guī)則來(lái)描述一個(gè)人在每一種可以想象的情況下應(yīng)該做什么。他以交通行為為例:人們可能有一條規(guī)則,即看到紅色交通燈就停車,看到綠色交通燈就走,但如果由于某種錯(cuò)誤兩者同時(shí)出現(xiàn)怎么辦?人們也許會(huì)認(rèn)為停止是最安全的。但此決定稍后可能會(huì)帶來(lái)一些進(jìn)一步的困難。試圖以行為規(guī)則來(lái)涵蓋所有可能發(fā)生的情況,包括交通信號(hào)燈引起的情況,似乎是不可能的。圖靈緊接著區(qū)分了兩個(gè)容易使問(wèn)題變得含糊不清的概念——“行為規(guī)則”和“行為法則”。“行為規(guī)則”是指諸如“看到紅燈就停下來(lái)”這樣的規(guī)則,人們可以GS9Gm2NmAGkE3Q9d66KdkihJdKCW07vGy5E3XDLePH0=根據(jù)這些規(guī)則采取行動(dòng),也可以意識(shí)到這些規(guī)則。而“行為法則”是指應(yīng)用于人類身體的自然法則,例如“如果你捏一個(gè)人,他就會(huì)發(fā)出聲音”。
按照?qǐng)D靈對(duì)這兩個(gè)概念的區(qū)分和闡釋可以進(jìn)一步總結(jié),“規(guī)則”是一種機(jī)器屬性,而“法則”更體現(xiàn)為人類屬性,對(duì)人類行為的預(yù)測(cè)和模擬不能局限于對(duì)人類社會(huì)一系列規(guī)則的熟知,因?yàn)槿祟愋袨椴⒉煌耆窃谝惶字T如交通信號(hào)燈之類的語(yǔ)境中誕生的,“交通信號(hào)燈”不起作用甚至是人類與世界交互時(shí)的常態(tài)。因此對(duì)人類行為,以及進(jìn)一步地,對(duì)人類思想的理解,需要建立在對(duì)人類法則的完整獲知基礎(chǔ)之上,因此對(duì)“機(jī)器是否能夠思考”或者說(shuō)“機(jī)器是否能夠擁有人類智識(shí)”等問(wèn)題的探討就更細(xì)致地導(dǎo)向了另一個(gè)問(wèn)題——是否存在一套完整的關(guān)于人類的行為法則?這一點(diǎn)尚不能確定,但是唯一可以確定的是,即使存在一套可以稱之為完整體的人類法則,那么唯一能從客觀層面獲得這一整套知識(shí)的手段就是科學(xué)觀察,而圖靈斷言:“如果每個(gè)人都有一套明確的行為規(guī)則,那么他/她跟一臺(tái)機(jī)器沒(méi)什么兩樣。但沒(méi)有這樣的規(guī)則,所以人不能成為機(jī)器?!睋Q言之,機(jī)器也不能通過(guò)“規(guī)則化的行為”這條路徑來(lái)模擬人、成為人、替代人。
對(duì)人類行為的非形式化論證,旨在說(shuō)明智能機(jī)器所做的不過(guò)是規(guī)則的集合,而人類行為太過(guò)復(fù)雜且無(wú)法通過(guò)任何簡(jiǎn)單的規(guī)則集合進(jìn)行捕捉,所以,機(jī)器無(wú)法產(chǎn)生同人類一樣的智能行為。這種從行為的非形式化人手論證機(jī)器不智能的思路被哲學(xué)家休伯特·德萊弗斯(Hubert Dreyfus)發(fā)揚(yáng)光大。德萊弗斯是人工智能知識(shí)表示的形式化/非形式化論爭(zhēng)的重要旗手,且德萊弗斯比圖靈的非形式化觀點(diǎn)更進(jìn)了一步——圖靈的非形式化主要針對(duì)的是人類行為的不可形式化,而德萊弗斯則將非形式化批判更廣泛地指向人工智能所試圖完成的知識(shí)形式化、語(yǔ)言形式化和行為形式化。
德萊弗斯將人工智能企圖把一切知識(shí)形式化的意圖溯源到古希臘的哲學(xué)偏向,古希臘的邏輯和幾何將一切推理歸結(jié)為計(jì)算,同時(shí)也將一些行為化約為程序。似乎借由這種形式化的努力,幾乎所有論證都可以得到一勞永逸的解決。蘇格拉底是指明這一形式化路徑極具可能性的開(kāi)創(chuàng)者——蘇格拉底說(shuō)道:“我想知道使所有行為變得溫良的虔誠(chéng)之心有什么特點(diǎn)……這樣我便可以當(dāng)作判斷你的行為和其他人行為的標(biāo)準(zhǔn)來(lái)使用?!碧K格拉底這里想獲得的也即人工智能工程師們致力研發(fā)的“程序”,或用人工智能的重要先驅(qū)馬文·明斯基(MarvinMinsky)的話說(shuō),它是可以不斷地告訴人們?nèi)绾涡袆?dòng)的“規(guī)則”。在這一邏輯主義哲學(xué)傾向上,德萊弗斯戲稱:人工智能可能早在公元前450年就已經(jīng)開(kāi)始。德萊弗斯以古希臘為起點(diǎn),列舉了人工智能的形式化知識(shí)觀的思想來(lái)源。比如,霍布斯被視為第一個(gè)清晰地把思維句法概念表達(dá)為計(jì)算的人——“推理不過(guò)是在計(jì)算”.二元制的發(fā)明者萊布尼茲也自認(rèn)為找到了一種通用的符號(hào)系統(tǒng),它具有“可以用來(lái)把確定的特征數(shù)賦予每種事物的通用特點(diǎn)”。
將全部知識(shí)形式化的信念構(gòu)成了西方傳統(tǒng)哲學(xué)的底色,西方傳統(tǒng)哲學(xué)認(rèn)為凡是有序的事物都可以經(jīng)由形式化成為一套“規(guī)則”或“程序”。人工智能中的邏輯主義流派就在這樣的哲學(xué)基礎(chǔ)上建立起來(lái)。然而,這種以“理性主義”為基點(diǎn),認(rèn)為存在一種合理化的“思維法則”并依循它而構(gòu)建的人工智能路徑存在兩個(gè)主要的障礙。首先,一個(gè)問(wèn)題原則上的可解性并不意味著這個(gè)問(wèn)題事實(shí)上的可解性。將解決問(wèn)題的知識(shí)程序化和問(wèn)題求解過(guò)程結(jié)構(gòu)化與實(shí)際解決該問(wèn)題之間存在巨大的縫隙。求解有限事實(shí)的問(wèn)題就可耗散智能機(jī)器的龐大計(jì)算資源,更不要說(shuō)人類的智識(shí)成果是一個(gè)沒(méi)有邊際的、無(wú)法窮盡事實(shí)的知識(shí)曠野,雖然人工智能理論家和實(shí)踐家更多地使用“知識(shí)庫(kù)”一詞來(lái)指稱人工智能的訓(xùn)練材料,但這一稱謂的迷惑性在于它設(shè)定了一個(gè)邊界將可以被形式化、可以被框架化的知識(shí)納入一個(gè)有限性的“庫(kù)”中(即使知識(shí)庫(kù)總是在不斷更新,但它始終包含疆界和范圍),而閉口不言那些無(wú)法被框定、難以被分類的非形式化知識(shí)其蹤何處。其次,人類知識(shí)并非都是形式化的(比如依靠轉(zhuǎn)瞬間的靈感創(chuàng)作的詩(shī)歌和依靠數(shù)十年的經(jīng)驗(yàn)直覺(jué)制作的佳肴),而獲取非形式的知識(shí)并用邏輯表示法要求的形式術(shù)語(yǔ)來(lái)對(duì)其展開(kāi)陳述幾乎是不可能的,更何況這些非形式化知識(shí)的生產(chǎn)者也只停留在“知其所以然”而不“知其然”的難以言喻的“非理性”狀況之下??偨Y(jié)來(lái)說(shuō),將人類的智慧理念化和將人類的知識(shí)程式化既面臨著形式化知識(shí)的障礙,也面臨著非形式化知識(shí)的障礙。
雖然這兩個(gè)障礙最先出現(xiàn)在邏輯主義流派中,但是建造計(jì)算推理系統(tǒng)的任何人工智能都需要直面這一機(jī)器智識(shí)極限。今天的生成式人工智能浪潮并不是以合理性為尺度追求思維法則的最高價(jià)值,而是以人腦為尺度尋求認(rèn)知建模的路徑軌跡。當(dāng)基于邏輯主義的傳統(tǒng)人工智能觸及其發(fā)展極限之時(shí),機(jī)器學(xué)習(xí)的擁護(hù)者們便找到了創(chuàng)造知識(shí)的更高階的方法——?jiǎng)?chuàng)造人腦。對(duì)人工智能的神經(jīng)學(xué)派而言,與其重現(xiàn)人類推理的完整邏輯序列,不如探索邏輯的載體,也就是大腦這個(gè)強(qiáng)大的生物處理器。這種機(jī)器學(xué)習(xí)的方式類似于一種原創(chuàng)體系架構(gòu),它類似人類的神經(jīng)網(wǎng)絡(luò),當(dāng)網(wǎng)絡(luò)接收了輸入信號(hào),神經(jīng)元以原創(chuàng)體系架構(gòu)對(duì)信號(hào)進(jìn)行處理以使輸出端能夠識(shí)別該信號(hào),如是,通過(guò)大腦的基本功能單位——神經(jīng)元之間的相互作用,思想得以產(chǎn)生。
然而,如果將“思想的產(chǎn)生“和“知識(shí)的創(chuàng)造”進(jìn)行順滑的聯(lián)結(jié),則會(huì)陷入形而上學(xué)的哲學(xué)陷阱之中。柏拉圖將思維、智力、理性、心靈與技能、感情、身體、欲望相區(qū)分,這種身心二元論將知識(shí)與思維緊密聯(lián)結(jié)在一起,將知識(shí)視為思維的結(jié)果和思維的獨(dú)有創(chuàng)造。因此,當(dāng)人工智能以為通過(guò)復(fù)制人類的思維過(guò)程就能重現(xiàn)知識(shí)的創(chuàng)造時(shí),就會(huì)出現(xiàn)繞過(guò)軀體追求理性所必然遭遇的失落結(jié)果。因?yàn)榛谒季S推理的理性主義并不能解決人碰到熱鍋就立刻退縮的問(wèn)題,基于感知覺(jué)的反射行為往往比審慎推理仔細(xì)思考后的結(jié)果更加迅速有效。知識(shí)并不僅僅產(chǎn)生于思維過(guò)程,它更產(chǎn)生于身體的需要、欲望、情緒和感知,更重要的是,它產(chǎn)生于身體和物質(zhì)世界相互作用的實(shí)在過(guò)程之中。
人工智能的智識(shí)局限也是理性主義的哲學(xué)局限。人工智能試圖通過(guò)對(duì)頭腦的模擬解決“知識(shí)的載體”問(wèn)題,寄希望于通過(guò)制定周密的邏輯規(guī)則來(lái)解決“知識(shí)的生產(chǎn)”問(wèn)題,后又將目光鎖定在一個(gè)包含所有“宇宙之書”的龐大知識(shí)庫(kù),試圖通過(guò)該知識(shí)庫(kù)來(lái)解決“知識(shí)的來(lái)源”問(wèn)題。人工智能的以上訴求和路徑本質(zhì)上是在將大腦形式化、思維形式化和知識(shí)形式化。然而,這種形式化終究是與知識(shí)的生產(chǎn)背道而馳的,因?yàn)槿祟惖闹R(shí)起源于“無(wú)知”以及由這種“無(wú)知”帶來(lái)的不安、好奇與探索的欲望。換言之,知識(shí)來(lái)源于“不確定”,而人工智能所搭建的知識(shí)工程也好,認(rèn)知模擬也罷,都在無(wú)限追求一種“確定性”,智能機(jī)器有著明確的目標(biāo)、詳細(xì)的指令、完備的數(shù)據(jù)、周密的規(guī)則,但最終所得到的也只能是對(duì)知識(shí)的逆退性理解和自反性重復(fù)。今天以ChatGPT為代表的聊天機(jī)器人更是在實(shí)踐一種“知識(shí)的悖論”——你想獲知某知識(shí)的前提,是你已經(jīng)基本掌握了這項(xiàng)知識(shí)。生成式人工智能對(duì)提示詞(prompt)精準(zhǔn)度的要求極高。與使用搜索引擎的體驗(yàn)不同,用戶無(wú)法再通過(guò)輸入模糊的檢索詞然后在所有可能的答案中進(jìn)行篩選,相反,用戶只有在輸入精準(zhǔn)、完備的提示詞之后才能得到想要的答案。至此,借由對(duì)人工智能形式化/非形式化論爭(zhēng)的討論,今日隱藏在生成式人工智能的知識(shí)大眾化、知識(shí)民主化、知識(shí)通用化之下的知識(shí)表示限度也得以揭開(kāi)。
四、“標(biāo)簽”“學(xué)習(xí)”“局勢(shì)”——生成式人工智能知識(shí)表示的本體、隱喻和限度
自生成式人工智能投入應(yīng)用以來(lái),圍繞生成式人工智能和知識(shí)生產(chǎn)、知識(shí)獲取、知識(shí)使用等一系列與知識(shí)相關(guān)問(wèn)題的討論層出不窮。今天的生成式人工智能究竟是一個(gè)知識(shí)新神的誕生,還是披著通用式外衣的另一種“知識(shí)工程”?今天的生成式人工智能在知識(shí)表示上采取了哪些新的手段,它或沿用或產(chǎn)生了關(guān)于知識(shí)表示的哪些關(guān)鍵詞?這些手段是否回應(yīng)了曾經(jīng)由人工智能理論家們發(fā)出的對(duì)形式化的批判?這些關(guān)鍵詞是切實(shí)有效的創(chuàng)新還是另一種技術(shù)話語(yǔ)的障眼法?在生成式人工智能知識(shí)表示的法則和觀念確立的過(guò)程中,需要對(duì)其與它試圖區(qū)別并超越的對(duì)象展開(kāi)反復(fù)的對(duì)比性研究。生成式人工智能和曾經(jīng)的知識(shí)存儲(chǔ)載體、知識(shí)行為代理之間是否依然共享某一種承繼性的知識(shí)觀?在承繼與變動(dòng)之下生成式人工智能的知識(shí)表示在未來(lái)又需解決怎樣的問(wèn)題?這些是本節(jié)試圖從本體、隱喻和限度三個(gè)層面回答的問(wèn)題。
(一)“標(biāo)簽”作為一種本體論:知識(shí)表示的分類哲學(xué)
正如前文所述,知識(shí)表示雖然今天已經(jīng)成為人工智能領(lǐng)域的核心工程和關(guān)鍵領(lǐng)域,但是關(guān)于知識(shí)表示的理想和實(shí)踐卻古已有之。自書寫文化替代口語(yǔ)文化以來(lái),相較于人類對(duì)知識(shí)的處理能力,人類對(duì)知識(shí)的存儲(chǔ)能力毫無(wú)疑問(wèn)是過(guò)載的,表現(xiàn)這種過(guò)載關(guān)系的經(jīng)典具象就是圖書館和互聯(lián)網(wǎng)。面對(duì)浩如煙海的世界之書,如何緩解有限的記憶面對(duì)無(wú)限的知識(shí)時(shí)的焦慮感與不安感?如何滿足人類主體對(duì)知識(shí)客體的掌控和征服的欲望?在這一傾斜的杠桿兩端,輔助平衡的砝碼之于圖書館,是檢索系統(tǒng);之于互聯(lián)網(wǎng),是搜索引擎;之于人工智能,是知識(shí)表示。而圖書館的檢索系統(tǒng)和互聯(lián)網(wǎng)的搜索引擎其實(shí)也是一種知識(shí)表示的愿望和實(shí)踐。
在喪失了口頭文化時(shí)代面對(duì)知識(shí)的“結(jié)構(gòu)性遺忘”的權(quán)力之后,面對(duì)無(wú)限增長(zhǎng)的書寫痕跡和相應(yīng)的知識(shí)累計(jì),圖書館和互聯(lián)網(wǎng)都面臨知識(shí)表示的問(wèn)題,這些存儲(chǔ)載體需要借助一個(gè)工具,使圖書館和互聯(lián)網(wǎng)以及它們的使用者完成信息的輸入、存儲(chǔ)、輸出。這一點(diǎn)和人工智能試圖借助知識(shí)表示方法所想要達(dá)成的目標(biāo)別無(wú)二致。而對(duì)于知識(shí)表示而言,“分類”是其中的重要環(huán)節(jié),把知識(shí)對(duì)象組織成“類別”是知識(shí)表示的不可或缺的步驟。雖然具體的知識(shí)往往產(chǎn)生于世界和個(gè)別對(duì)象的互動(dòng)過(guò)程中,但是人工智能的推理和預(yù)測(cè)是在“類別”這一層次上發(fā)生的。而知識(shí)載體也通常是在“類別”這一層次上完成對(duì)知識(shí)的存儲(chǔ)和獲取。比如,19世紀(jì)70年代圖書館管理學(xué)發(fā)展出知識(shí)領(lǐng)域的第一個(gè)分類系統(tǒng)——杜威十進(jìn)制系統(tǒng);谷歌等搜索引擎也通過(guò)給網(wǎng)頁(yè)附上分類標(biāo)簽來(lái)實(shí)現(xiàn)對(duì)信息的檢索。
圖書分類系統(tǒng)、搜索引擎的標(biāo)簽和人工智能的類別化知識(shí)表示都在昭示著一個(gè)事實(shí)——“分類”已經(jīng)成為今日知識(shí)的本體論。書籍因被編碼而被找到,網(wǎng)頁(yè)因被附上標(biāo)簽而被搜索到,通用常識(shí)性知識(shí)因被分類而得以被推理出來(lái)。知識(shí)的“存在”以及這種存在的“被感知”完全取決于知識(shí)是否被分類。如果說(shuō)書寫文化創(chuàng)造的本體論是“被記錄下來(lái)的知識(shí)只是易于記錄的知識(shí)”,那么在知識(shí)庫(kù)時(shí)代,知識(shí)的本體論是“被查找到的知識(shí)只是易于被分類的知識(shí)”。我們可以據(jù)此推斷,生成式人工智能雖聲稱其“知識(shí)庫(kù)”無(wú)所不包——f63qsnvzVrIWuwRcQLz9qGomyuA9AE97I5Q/VEZl6D4=幾乎包含互聯(lián)網(wǎng)上的全部信息內(nèi)容,但是訓(xùn)練模型依賴的是“有標(biāo)記”的數(shù)據(jù),⑩“標(biāo)記知識(shí)”的背后是對(duì)“未標(biāo)記知識(shí)”的舍棄和掩埋,在分類與標(biāo)簽的本體論籠罩下,生成式人工智能實(shí)際是一種以“剔除知識(shí)”而非“保存知識(shí)”為實(shí)質(zhì)的知識(shí)工程。
(二)“學(xué)習(xí)”作為一種隱喻法:知識(shí)表示的謊言效果
今日的生成式人工智能以機(jī)器的自主學(xué)習(xí)為方法論?!皺C(jī)器學(xué)習(xí)”偏向于表達(dá)這樣一種隱喻:機(jī)器可以在預(yù)編程好的、常規(guī)的、自動(dòng)化的任務(wù)中得到改進(jìn)和完善,它隱含著機(jī)器的“自主權(quán)”。畢竟“學(xué)習(xí)”一詞更多地是與有感知能力的、有智慧的生命體相掛鉤,“知識(shí)”也多緊跟在“學(xué)習(xí)”后面充當(dāng)對(duì)象。于是“機(jī)器學(xué)習(xí)”從能指系統(tǒng)上造成一種混淆——機(jī)器能產(chǎn)生知識(shí)。
如果我們查找機(jī)器學(xué)習(xí)的官方定義,會(huì)發(fā)現(xiàn)今天人工智能所謂的深度學(xué)習(xí)與知識(shí)并不掛鉤。Python機(jī)器學(xué)習(xí)庫(kù)Scikit-Iearn對(duì)機(jī)器學(xué)習(xí)的定義為:“機(jī)器學(xué)習(xí)是學(xué)習(xí)一個(gè)數(shù)據(jù)集的一些屬性,并將它們應(yīng)用到新數(shù)據(jù)上。因此,在機(jī)器學(xué)習(xí)中,評(píng)估一個(gè)算法的常見(jiàn)做法是將數(shù)據(jù)分成兩組,一組為訓(xùn)練集,用以學(xué)習(xí)數(shù)據(jù)屬性;另一組為測(cè)試集,用以監(jiān)測(cè)數(shù)據(jù)屬性?!庇?jì)算機(jī)學(xué)家湯姆,米歇爾(Tom Mitchell)也給機(jī)器學(xué)習(xí)下了一個(gè)定義:“對(duì)于某類指定任務(wù)T、性能指標(biāo)P和經(jīng)驗(yàn)E,如果一臺(tái)機(jī)器在T上以P衡量的性能隨著經(jīng)驗(yàn)E而不斷自我完善,那么我們稱這臺(tái)機(jī)器在向經(jīng)驗(yàn)E學(xué)習(xí)。根據(jù)我們對(duì)T、P、E的具體設(shè)定,學(xué)習(xí)任務(wù)也可以這樣命名:數(shù)據(jù)挖掘、自主發(fā)現(xiàn)、數(shù)據(jù)庫(kù)更新、示例編程等?!笨梢?jiàn),人工智能語(yǔ)境下的“學(xué)習(xí)”并不意味著機(jī)器擁有了智識(shí),而是指機(jī)器根據(jù)預(yù)先定義的衡量指標(biāo),在執(zhí)行某個(gè)特定任務(wù)時(shí)更加準(zhǔn)確。這種學(xué)習(xí)的結(jié)果更導(dǎo)向一種“任務(wù)的完成”而非“知識(shí)的習(xí)得”。
“任務(wù)是否完成”曾是知識(shí)工程的首要指標(biāo)。曾經(jīng),適用于狹窄有限領(lǐng)域的專家系統(tǒng)秉持這樣一種評(píng)價(jià)標(biāo)準(zhǔn):無(wú)論人們是否采納這一方法,只要達(dá)到目的,該程序就被證明為有效程序。這一評(píng)價(jià)標(biāo)準(zhǔn)背后的潛臺(tái)詞是:通往目的的路徑不是重要的,目的的達(dá)成才是重要的;達(dá)成目的的過(guò)程中是否真的獲得了知識(shí)和技能不是重要的,一個(gè)符合評(píng)判標(biāo)準(zhǔn)的結(jié)果才是重要的。這是機(jī)器學(xué)習(xí)時(shí)代的“智能應(yīng)試主義”和“智能優(yōu)績(jī)主義”。
然而,當(dāng)人工智能理論家們逐漸放棄這一評(píng)價(jià)標(biāo)準(zhǔn)后,通用式人工智能又將其承襲下來(lái),其具體體現(xiàn)為今日的生成式人工智能只要通過(guò)概率計(jì)算出一個(gè)最為通順的語(yǔ)句并能夠通順地回答出用戶的問(wèn)題,或者畫出一幅看似符合主題的圖畫,就被認(rèn)為是完成了任務(wù)。大語(yǔ)言模型究其根本是一種概率模型,它用來(lái)計(jì)算一個(gè)句子出現(xiàn)的概率,比如,“我喜歡知識(shí)”和“我知識(shí)喜歡”,前者計(jì)算的概率值較大,因此更容易被判定為一個(gè)“正確的”文本生成。因此,在“學(xué)習(xí)知識(shí)”的隱喻謊言效果之下,概率才是生成式人工智能生產(chǎn)知識(shí)的機(jī)理,組成智能文本的、被編譯為語(yǔ)義處理單元的詞元(token)才是生成式人工智能所生產(chǎn)的知識(shí)的基本單位。
(三)“局勢(shì)”作為一種限度:知識(shí)表示的終極目標(biāo)
人工智能對(duì)知識(shí)進(jìn)行形式化表示的執(zhí)念來(lái)源于從古希臘開(kāi)啟的一條西方傳統(tǒng)哲學(xué)脈絡(luò),這條以邏輯和推理為軸心的思想體系發(fā)現(xiàn)了世界的有序性并將其形式化為規(guī)則。人工智能先驅(qū)之一明斯基就曾立論說(shuō):“每當(dāng)其在我們的行動(dòng)中觀察到一種定律時(shí),便轉(zhuǎn)交給確定性規(guī)則來(lái)表達(dá)。”然而,將知識(shí)形式化、將事實(shí)定律化、將行為規(guī)則化的做法往往在“微世界”的語(yǔ)境下才有成功的可能,因?yàn)槲⑹澜缡且粋€(gè)閉合的世界,它擁有確定的對(duì)象、明確的標(biāo)準(zhǔn)和可控的變量。然而,還存在大量“知識(shí)”,其解決的問(wèn)題是一些結(jié)構(gòu)性開(kāi)放問(wèn)題,在這類問(wèn)題中,“規(guī)則”不再起作用,“局勢(shì)”(situation)成為更大的求解語(yǔ)境和限制性他律。
局勢(shì)與規(guī)則不同。我們繼續(xù)以圖靈的交通信號(hào)燈為例,規(guī)則是在信號(hào)燈正常運(yùn)轉(zhuǎn)之下所產(chǎn)生的行為指令,而局勢(shì)是在信號(hào)燈失效或者根本不存在信號(hào)燈的情況下對(duì)認(rèn)知和行為的指引。簡(jiǎn)單來(lái)說(shuō),局勢(shì)要求對(duì)當(dāng)下情形的全面理解,有時(shí)還需要對(duì)過(guò)往經(jīng)驗(yàn)和未來(lái)預(yù)期的縱向考量。以下棋為例,人類棋手并不能做到如同人工智能一樣窮盡所有可能,但人類棋手依然能和人工智能在棋局上展開(kāi)較量的原因在于,對(duì)人類棋手而言,對(duì)局勢(shì)的理解要先于對(duì)局面的理解。局面指向當(dāng)前的棋子位置和其背后的特征信息,而局勢(shì)指向比賽的整體狀況和長(zhǎng)遠(yuǎn)判斷。
局勢(shì)來(lái)自經(jīng)驗(yàn)和認(rèn)知,而知識(shí)表示并不足以表達(dá)經(jīng)驗(yàn)和認(rèn)知。只有當(dāng)上下文環(huán)境和其所包含的所有可能性事實(shí)可以用人工智能的語(yǔ)義網(wǎng)絡(luò)和模型識(shí)別到、捕捉到的時(shí)候,這種局勢(shì)才有被表達(dá)的可能。而當(dāng)上下文環(huán)境是通過(guò)人的技藝、直覺(jué)、經(jīng)驗(yàn)、情緒、情感來(lái)確立的時(shí)候,那么對(duì)一切知識(shí)表示的符號(hào)系統(tǒng)來(lái)說(shuō),其理解能力根本不能解釋任何關(guān)于該局勢(shì)的認(rèn)知。正因如此,即使崇尚“確定性規(guī)則”的明斯基也承認(rèn)大模型在邏輯定律上效果欠佳:“一個(gè)人思考問(wèn)題過(guò)程中的每一時(shí)刻,都要接觸大量的陳述、定義、聯(lián)想以及一個(gè)目的網(wǎng)絡(luò)。他不僅要處理有關(guān)事物的事實(shí)及事物之間關(guān)系的事實(shí)等,還要處理有關(guān)事實(shí)的事實(shí)及事實(shí)之間關(guān)系的事實(shí),以及關(guān)于這些類之間關(guān)系的事實(shí)等。我們將會(huì)看到,啟發(fā)程序在運(yùn)用到小模型上時(shí)能順利地證明一些原則,一旦用到大模型上就不好使了?!?/p>
對(duì)局勢(shì)的把握和編碼,不管是在人工智能發(fā)展的歷史中還是在其流行的當(dāng)下,都成為機(jī)器智能表示知識(shí)、獲得智力的途中無(wú)法繞越的門檻,也因此成為人工智能的智慧限度。人類社會(huì)中的大量知識(shí)因其簡(jiǎn)單性、通俗性和難以言喻等特點(diǎn)而注定是隱晦的,但同時(shí)也代表著社會(huì)共識(shí)意義上的默契,這部分知識(shí)恰恰是人工智能無(wú)法進(jìn)行符號(hào)化理解、結(jié)構(gòu)化儲(chǔ)存和邏輯性表達(dá)的“自然事實(shí)”。于是,人工智能的知識(shí)局限就荒誕地體現(xiàn)為:它可以幫助人類草擬文書、撰寫編碼,但它卻無(wú)法解決人類如何使用雙手、如何避免傷害等基本的自我生存法和自我維持問(wèn)題。那么,當(dāng)一個(gè)智慧體知道如何博弈和解答卻不知如何存在和生活時(shí),它在什么意義上是擁有知識(shí)的呢?
五、結(jié)語(yǔ):人有人的用途
知識(shí)表示可以讓人工智能機(jī)器從現(xiàn)有信息、經(jīng)驗(yàn)或?qū)<抑袑W(xué)習(xí),從而使機(jī)器的行為與人類無(wú)異。人工智能研究者爭(zhēng)辯說(shuō)(就像人工智能創(chuàng)始人約翰·麥卡錫那樣),符號(hào)處理機(jī)有可能表示所有知識(shí),而不管人類是否以同樣的方式表示知識(shí)。德雷福斯認(rèn)為,這種假設(shè)是沒(méi)有道理的,因?yàn)槿祟惖脑S多知識(shí)都不是符號(hào)性的。愛(ài)因斯坦說(shuō)過(guò):
“純粹的邏輯思維無(wú)法讓我們獲得任何關(guān)于經(jīng)驗(yàn)世界的知識(shí);所有關(guān)于現(xiàn)實(shí)的知識(shí)都始于經(jīng)驗(yàn),止于經(jīng)驗(yàn)?!?/p>
這涉及認(rèn)識(shí)論方面的哲學(xué)問(wèn)題。威諾格拉德曾有言:“發(fā)展人工智能的收獲首先不在于我們創(chuàng)造的程序,而在于我們研究出的這套概念,在于我們把它們用于理解人類智能的方式?!比绻麑⑷祟惐茸髦悄荏w的話,其知識(shí)系統(tǒng)是由形式化的準(zhǔn)則、規(guī)范、公理和非形式化的技藝、靈感、直覺(jué)組成的復(fù)合系統(tǒng),那些無(wú)法結(jié)構(gòu)化的情緒、難以復(fù)制的感知覺(jué)神經(jīng)活動(dòng)、基于長(zhǎng)遠(yuǎn)考量的目的及其解釋都與人類所創(chuàng)造的知識(shí)緊密地聯(lián)系在一起,日常生活的實(shí)踐和分秒之間的靈光乍現(xiàn)永遠(yuǎn)無(wú)法用一套可抽象化的、精確明晰的信念網(wǎng)來(lái)代替。正如存在主義哲學(xué)家們所堅(jiān)信的:那些關(guān)乎人類日常實(shí)踐和興趣的知識(shí)無(wú)須表達(dá)。因此,今日人工智能時(shí)代的知識(shí)哲學(xué)就不僅是機(jī)器無(wú)法用知識(shí)表示形式化所有知識(shí)的“不能”,更是機(jī)器無(wú)須用知識(shí)表示形式化所有知識(shí)的“不必”。
畢加索對(duì)計(jì)算機(jī)的看法是討論人工智能局限性的一個(gè)很好的開(kāi)端:“它們毫無(wú)用處。它們只能給你答案?!笔聦?shí)上,計(jì)算機(jī)和人工智能遠(yuǎn)非一無(wú)是處,正如機(jī)器學(xué)習(xí)最近取得的成功所顯示的那樣,但畢加索的觀點(diǎn)仍然具有深刻的洞察力。人工智能是回答問(wèn)題的工具,而不是提出問(wèn)題的工具。這就意味著,企業(yè)家、創(chuàng)新者、科學(xué)家、創(chuàng)造者以及其他能夠找出下一個(gè)要解決的問(wèn)題或敢于探索新領(lǐng)域的人,將繼續(xù)發(fā)揮至關(guān)重要的作用。