編譯 高斯寒
對于論證的研究在學術界中源遠流長,能追溯至古希臘時期,并且橫跨從理論哲學直至計算工程的多個學科。在人工智能研究領域,開發(fā)能夠在人類自然語言中識別論證的計算機系統(tǒng)是最耗時費神的挑戰(zhàn)之一。以色列學者諾姆·斯洛寧(Noam Slonim)等人在《自然》雜志撰文,報告了該研究領域一項讓人驚艷的進展。他們開發(fā)的“辯手項目”是一個人工智能系統(tǒng),能夠在辯論競賽中與人類交手。他們的研究報告展現(xiàn)了該領域研究進展的程度,并且強調:研發(fā)能在辯論中識別、生成和評論論證的技術時,穩(wěn)健工程非常重要。穩(wěn)健工程就是將不同組件結合在一起,每個組件負責處理某個特定任務。
對人類論述作分析,從而識別出引用證據(jù)、支持結論的具體方式,這個過程現(xiàn)在被稱為論證挖掘(Argument Mining)。10年前,當時的尖端人工智能的性能還不足以完成論證挖掘的工作。從那時起,人工智能技術取得不少進步,論證技術的工程化也日益成熟,再加上強烈的商業(yè)需求推動,這三個因素促使論證挖掘的研究版圖迅速擴張。放眼全球,目前共有50多家實驗室從事這方面的研究(包括所有大型軟件公司的研究團隊)。
這個研究領域出現(xiàn)爆炸式發(fā)展的原因之一是,能在大量文本中識別出語言使用的統(tǒng)計規(guī)律的人工智能系統(tǒng)直接應用在人工智能的許多方面具有變革性;但就其本身而言,并未在論證挖掘上取得同等的成功。這是因為論證結構過于變化、過于復雜、過于微妙、過于隱含,以至于無法像句子結構一樣容易識別。因此,斯洛寧等研究者決定發(fā)起一項巨大挑戰(zhàn):開發(fā)一套完全自主的系統(tǒng),能夠參與和人類的實時辯論。“辯手項目”就是這個研究工作的亮點。
辯手項目首先是一個巨大的工程壯舉。它匯集了從文本中收集和解釋與爭論相關的材料的新方法,以及修復句子語法的方法(使系統(tǒng)能夠在提出其論點時重新部署提取的句子片段;語法修復技術的作用被作者適度低估)。辯手系統(tǒng)的這些組件由人類圍繞關鍵主題而預先準備的信息結合在一起,從而為廣泛的主題提供知識、論證和反證。這個知識庫有預備好的文本(人類事先寫好的句子片段)作為補充,用來在辯論時引入和組織陳詞。
辯手項目野心勃勃,它既是人工智能系統(tǒng),也是對人工智能研究的巨大挑戰(zhàn)。對于將視野定得太高的幾乎所有人工智能研究而言,其主要瓶頸便是獲取足夠多的數(shù)據(jù),以便能針對挑戰(zhàn),計算出有效的解決方案。辯手項目已經用雙手策略處理了這個障礙:一方面,它縮小范圍,聚焦于100個左右的辯論主題;另一方面,它從大型數(shù)據(jù)集(即便以現(xiàn)代語言處理系統(tǒng)的標準來衡量)中采集原材料。
在2018和2019年進行的一系列競賽中,辯手項目和多位有才華、著名的人類辯手進行了辯論,觀眾以非正式的方式評估了它的表現(xiàn)。該系統(tǒng)依靠論證技術,受到它所處理的數(shù)據(jù)集的推動,生成4分鐘的發(fā)言,開啟辯論;辯論主題來自系統(tǒng)存儲的主題資料,接著由人類辯手進行回應;系統(tǒng)再對其對手的論點做出反應,生成第二段4分鐘的發(fā)言;人類辯手發(fā)表4分鐘的辯駁作為回應;最后雙方分別給予2分鐘的總結陳詞,辯論結束。
系統(tǒng)最薄弱的方面大概是它要竭盡所能來模仿人類辯手的連貫思維和流暢語言——這個問題與它的處理流程能夠選擇、摘要和編制論證的最高水平有關。然而,這一局限并非辯手項目所獨有。盡管有兩千年的研究,人類對論證結構的了解仍然很差。辯論研究的重心(語言使用、認識論、認知過程或邏輯驗證)不同,關于論證和推理的連貫模型至關重要的特征也千差萬別。
“辯手項目”與人類辯手唇槍舌戰(zhàn):斯洛寧等研究者研發(fā)出人工智能系統(tǒng)“辯手項目”,它能參與和人類的辯論比賽
因此,構成良好論據(jù)的模型極其多樣化,而構成良好辯論的模型只不過是形式化的直覺。所以,并不奇怪,辯手項目的表現(xiàn)評價僅僅是詢問人類觀眾,問他們是否認為人工智能系統(tǒng)可作為“表現(xiàn)出色的榜樣”。在幾乎三分之二的主題辯論中,觀眾認為人工智能系統(tǒng)足以充當榜樣。
所有論證技術體系都會面臨的最后挑戰(zhàn)是:將論證當作受到一組孤立考量影響的局部論述片段,還是將論證置于社會層級辯論的更大范圍?在很大程度上,這是設計要去解決的問題,而不是工程化解決方案。給論證限定“先驗”的范圍,理論上的簡化就成為可能,并能提供較多計算優(yōu)勢。譬如說,識別出“主要主張”是定義明確的任務,用機器來完成和靠人來完成幾乎一樣可靠。問題是人類根本不擅長這項任務,正是因為它是人為設計的。在開放討論中,特定的論述在某種語境中也許是主張,而在另一種語境中就可能是前提。
不僅如此,在現(xiàn)實世界中,并不存在論證的明晰界限:在辯論室之外發(fā)生的話語不是孤立的,而是與交叉引用、類比、例證和概括的網(wǎng)絡有關。人工智能要如何才可以攻克這樣的論證網(wǎng)?相關想法已經在理論中出現(xiàn),并用軟件予以實施。譬如說,有個名叫“辯論圖表”(Debate Graph)的系統(tǒng)屬于互聯(lián)網(wǎng)平臺,向使用者提供計算工具,將復雜和關聯(lián)的思維網(wǎng)絡進行視覺化和分享。然而,理論挑戰(zhàn)以及與實施相關的社會技術問題難以克服:設計引人注目的方法,吸引大量受眾到此類系統(tǒng)與設計能夠與這些復雜的爭論網(wǎng)進行交互的簡單機制一樣困難。
辯手項目是論證技術發(fā)展的關鍵步驟,也是將論證當作局部現(xiàn)象進行工作的關鍵步驟。它的成功展示了人工智能系統(tǒng)如何與爭論網(wǎng)交互的動人一幕,人類可以輕松解讀爭論網(wǎng)。鑒于假新聞的泛濫、民意的兩極化、懶惰推理的普遍性,這很容易掩蓋人類在創(chuàng)造、處理、瀏覽和分享復雜論證方面迫切需要得到支持,而AI或許能夠提供這種支持。因此,盡管辯手項目響應研究的需要去推進并解決了一個重大挑戰(zhàn),但它更代表了人工智能的進步,有助于人類推理。正如斯洛寧等人所說,這遠遠超出了當前人工智能技術的舒適區(qū)。
資料來源 Nature