麥柯
看過(guò)《奇葩說(shuō)》的朋友,都對(duì)馬東、高曉松、蔡康永以及前五季最佳辯手的伶牙俐齒印象頗深。然而,誰(shuí)知道下一季的最佳辯手會(huì)不會(huì)就是個(gè)AI機(jī)器人呢?
1997年,深藍(lán)就曾經(jīng)讓人類世界冠軍卡斯帕羅夫投子認(rèn)負(fù)。2011年,沃森又在著名智力問(wèn)答競(jìng)賽節(jié)目《危險(xiǎn)邊緣》中淘汰人類奪冠。2019年,AI再次與人類展開(kāi)對(duì)決……
這一次,AI輸了
2月11日,人機(jī)辯論大戰(zhàn)在舊金山IBM Think會(huì)議上正式開(kāi)打。對(duì)戰(zhàn)雙方,分別是首戰(zhàn)擊敗以色列辯論高手的IBM Project Debater,以及2016年世界辯論決賽選手、畢業(yè)于牛津大學(xué)的Harish Natarajan。辯題為“政府是否應(yīng)該資助學(xué)前教育”。
因?yàn)橛蠥lphaGo橫掃圍棋圈、AlphaStar稱雄《星際爭(zhēng)霸2》的先例,因此人們對(duì)于AI的辯論表現(xiàn)普遍看好。不過(guò),這一次,AI輸了。
據(jù)悉,這次的比賽規(guī)則是:雙方開(kāi)場(chǎng)獲得辯題,各有15分鐘準(zhǔn)備。然后辯論,共三回合。前兩回合,每人4分鐘陳述,第三回合各2分鐘結(jié)辯陳詞。最后,由現(xiàn)場(chǎng)800位觀眾投票決定冠軍歸屬。跑票數(shù)多者勝。
本輪辯論,Project Debater為正方,Natarajan站反方。辯論前,觀眾投票,79%選擇正方,13%選擇了反方,另有8%棄權(quán)。
Harish Natarajan是全球辯論優(yōu)勝紀(jì)錄的保持者,三次征戰(zhàn)世錦賽,并在2012年奪得歐洲冠軍。但他從沒(méi)有面對(duì)機(jī)器人辯論的經(jīng)驗(yàn)。比賽中,他不能上網(wǎng),只能依靠一支鋼筆、一個(gè)筆記本和他的大腦。辯題公布后,他迅速開(kāi)始在紙上寫著、思考著。與此同時(shí),Project Debater開(kāi)始動(dòng)用數(shù)以億計(jì)的文檔和100多億條語(yǔ)句進(jìn)行準(zhǔn)備。
辯論開(kāi)始,Project Debater用了4分鐘邏輯嚴(yán)密的案例來(lái)證明自己的觀點(diǎn),主要聚焦在:資助學(xué)前教育對(duì)社會(huì)有益,可以讓窮人受益,幫學(xué)生成功,推動(dòng)全民教育,維護(hù)社會(huì)公平,以及降低犯罪等。它旁征博引,令人稱奇。不過(guò),在駁辯環(huán)節(jié),Project Debater既沒(méi)有突破立論,也喪失了有力反擊。
相反,Natarajan卻展現(xiàn)了精湛的辯論技巧。他提出,“補(bǔ)貼可在很多方面幫助窮人”、“補(bǔ)貼實(shí)際上會(huì)消耗中產(chǎn)家庭的財(cái)源”、“資助并不能讓所有孩子都上學(xué)”等重要觀點(diǎn),令人信服。
最終投票結(jié)果是,62%的觀眾支持正方,30% 的觀眾支持反方,反方因成功說(shuō)服正方跑票17%,所以Natarajan拿下了人機(jī)大戰(zhàn)第二戰(zhàn)的冠軍。賽后,Nataraji表示,“Project Debater的辯論比起大多數(shù)人類,更具文采和邏輯性。它將來(lái)會(huì)成為人類的幫手?!?/p>
其實(shí),早在2018年6月18日,Project Debater在舊金山IBM沃森西部廠已經(jīng)完成首秀。當(dāng)時(shí)的對(duì)手是2016年以色列國(guó)家辯論冠軍Noa Ovadia、以色列國(guó)際辯論協(xié)會(huì)主席Dan Zafrir,辯題分別是“政府是否應(yīng)該資助太空探索”,以及“是否應(yīng)該增加對(duì)遠(yuǎn)程醫(yī)療的使用”。Project Debater輸?shù)袅说谝粓?chǎng),卻在第二場(chǎng)成功說(shuō)服了20%觀眾跑票,戰(zhàn)勝了人類辯手。Project Debater由此成為人類辯論史上的第一個(gè)機(jī)器冠軍。
AI辯手的誕生
從2012年開(kāi)始,IBM 以色列海法實(shí)驗(yàn)室研究員 Noam Slonim博士就帶領(lǐng)團(tuán)隊(duì)開(kāi)始設(shè)計(jì)與人類辯論的AI系統(tǒng),取名Project Debater。所謂辯論,不是沖突和競(jìng)爭(zhēng),而是民主和討論。它需要從正反多個(gè)方面分析問(wèn)題作出決策,幫助人們理解和學(xué)習(xí)他人的觀點(diǎn)。為此,Project Debater需要掌握數(shù)據(jù)驅(qū)動(dòng)的語(yǔ)音編寫和交付功能;能夠靠聽(tīng)力理解人類冗長(zhǎng)自然語(yǔ)音中的重要觀點(diǎn)并構(gòu)建有力反駁;通過(guò)特有的知識(shí)圖譜模擬人類爭(zhēng)議和困境,從而根據(jù)實(shí)際需要提出有理有據(jù)的論點(diǎn)。
其中,強(qiáng)大的語(yǔ)料庫(kù)是Project Debater展開(kāi)辯論的基礎(chǔ)。據(jù)悉,訓(xùn)練Project Debater的語(yǔ)料庫(kù)擁有3 億多個(gè)可靠信源,包含 2011 年以來(lái)涉及全球商業(yè)、法律、學(xué)術(shù)和政府等領(lǐng)域,主流報(bào)紙雜志、學(xué)術(shù)論文等內(nèi)容。過(guò)去的6年里,Noam Slonim團(tuán)隊(duì)對(duì)Project Debater進(jìn)行了反復(fù)訓(xùn)練,使之在與人類的對(duì)抗中可以形成自己論點(diǎn),提出論據(jù),甚至還能開(kāi)玩笑,據(jù)悉,它可以分析數(shù)億個(gè)文檔、論文和記錄,從而給出明確主題并形成邏輯通順的演講。同樣這件事,換成人類做,即使每天24小時(shí)不眠不休,也需要2000年的時(shí)間。而Project Debater只需要10分鐘。最近兩年P(guān)roject Debater成長(zhǎng)很快,具備了參與辯論的能力。
Project Debater在諸多方面體現(xiàn)了自然語(yǔ)言程序的進(jìn)步,譬如通過(guò)對(duì)話和文章形成了更自然的結(jié)構(gòu)化語(yǔ)言。算法的原理就是將辯論分割為一個(gè)個(gè)小部分的文本,然后通過(guò)對(duì)于辯題的多角度理解尋找相應(yīng)的事實(shí)予以支撐。Project Debater還能通過(guò)對(duì)手的辯論因地制宜地采用事實(shí)予以反駁。這也意味著敘述信息向辯論的大幅度進(jìn)步。
據(jù)悉,在CES 2019上,IBM又升級(jí)了Project Debater的辯論技術(shù),Project Debater——Speech by Crowd(公眾演講),它在展會(huì)的每一天,都會(huì)切換辯題進(jìn)行辯論,甚至還能寫下短句輔助說(shuō)明。第一天的主題是“賭博應(yīng)該被禁止”。它列舉了各種觀點(diǎn)并加以分析,然后生成了兩篇演講——一篇支持,另一篇反駁。觀點(diǎn)鮮明,論證精煉。正方332個(gè)字的論辯提供了三個(gè)主要依據(jù),包括“賭博容易上癮”、“誘導(dǎo)犯罪活動(dòng)”以及“傷害自己和家人”。反方的論辯同樣給出了三條駁斥,雙手互博,令人耳目一新。
Aya Soffer博士認(rèn)為,辯論模式是一種方法,而不是終點(diǎn),它推動(dòng)技術(shù)革新,并最終向著掌握人類語(yǔ)言的戰(zhàn)略前進(jìn)。
未來(lái)Project Debater可以幫助人們消除情緒、偏見(jiàn)等模糊影響,作出有理有據(jù)的理智判斷與決策。而對(duì)于今后的發(fā)展前景,IBM已經(jīng)有了清晰的規(guī)劃。IBM 負(fù)責(zé)AI的副總裁 Dario Gil認(rèn)為,未來(lái)Project Debater的基礎(chǔ)技術(shù)將在 IBM Cloud 和 IBM Watson 中商業(yè)化,該技術(shù)可應(yīng)用于從教育到法律、從政府到企業(yè)等多種領(lǐng)域。
由此,Project Debater最典型的應(yīng)用就是利用人工智能技術(shù)整合相關(guān)信息解決相應(yīng)問(wèn)題。辯論僅僅是第一步,該團(tuán)隊(duì)還需要繼續(xù)在實(shí)踐中探索商用可能性。
第一是有研究、分析、收集信息需要的人士。如金融分析師、律師、記者、科學(xué)家等。譬如筆者為了寫這篇文章,搜索了Google的相關(guān)內(nèi)容,而以后這項(xiàng)工作就可以交給AI去完成。
第二是需要做決策的領(lǐng)域,比如政府高層、企業(yè)高管等。很多時(shí)候,頂層設(shè)計(jì)都因?yàn)樾畔⒉粚?duì)稱面臨很多不確定性,因此他們的決策就需要考慮問(wèn)題的正反面,并了解相應(yīng)證據(jù),而AI正是不錯(cuò)的幫手。
IBM研究院院長(zhǎng)Arvind Krishna在計(jì)劃中寫道,Project Debater將是下一個(gè)IBM Cloud或IBM Watson。
重新規(guī)劃的AI之路
伴隨著傳統(tǒng)硬件日漸式微,羅睿蘭治下的IBM正在重新規(guī)劃未來(lái),比如從銷售傳統(tǒng)的IT工具,轉(zhuǎn)向新興市場(chǎng)和數(shù)字領(lǐng)域,如云、AI、量子計(jì)算和區(qū)塊鏈。而以AI為例,其實(shí)IBM儲(chǔ)備還是相當(dāng)雄厚的。特別是近期,Project Debater二度挑戰(zhàn)人類辯手,AI機(jī)器人“西蒙”被發(fā)射到空間站,獨(dú)立書寫十四行詩(shī)的AI韻律評(píng)分超越人類。甚至,IBM還用AI幫德國(guó)香水公司Symrise創(chuàng)造新品種。
以上種種,可以看到希望。但是IBM也必須承認(rèn),不可重蹈覆轍。比如2011年,沃森成名后,開(kāi)始與醫(yī)療中心合作。2014年,IBM斥資10億美元建立沃森集團(tuán)。2015年4月,開(kāi)設(shè)新業(yè)務(wù)部沃森健康。IBM夸下???,要讓沃森惠及10億人,解決、診斷和治療80%的癌癥種類中80%的病患。結(jié)果2018年,沃森接連爆雷。多位醫(yī)學(xué)專家表示,沃森宣稱使用真實(shí)病例訓(xùn)練,其實(shí)公開(kāi)數(shù)據(jù)只是理論值,很多結(jié)果是錯(cuò)誤的,非常不負(fù)責(zé)任。這直接導(dǎo)致沃森在醫(yī)療領(lǐng)域聲譽(yù)掃地。2018年5月,沃森健康裁員50%-70%,負(fù)責(zé)人Deborah DiSanzo也宣布離職。
本來(lái)是順勢(shì)而為,但沃森的滑鐵盧,對(duì)于今天Project Debater不啻為前車之鑒。IBM要發(fā)展AI,積淀超過(guò)半個(gè)世紀(jì),但如何從窄到寬,精心布局,其實(shí)很考驗(yàn)IBM。IBM如何能把AI相關(guān)的基礎(chǔ)設(shè)施、平臺(tái)、應(yīng)用、算法統(tǒng)合在一起,并與區(qū)塊鏈、物聯(lián)網(wǎng)等發(fā)生化學(xué)反應(yīng),或許才能真正解決困境,創(chuàng)造更大的商業(yè)空間。