李蕓蕓
尤金·古特曼是一臺機器人或超級計算機,它在2014年6月8日成為歷史上首次通過圖靈試驗的機器人。在此之前和同時,世界上最大的網絡和信息技術公司,如谷歌、百度和國際商業(yè)機器公司(IBM,全球最大的信息技術和服務公司)也在打造所謂的“谷哥大腦”或“百度大腦”。這也意味著人工智能已經進入一個新的時代。
尤金——13歲的烏克蘭男孩
2014年6月8日是人工智能之父——阿蘭·圖靈去世60周年紀念日,英國雷丁大學在著名的倫敦皇家學會舉辦了一場圖靈試驗,共有5個機器人參加,但是只有俄羅斯團隊開發(fā)的一款名為尤金·古特曼的計算機通過了測試。在試驗中,尤金模仿一名來自烏克蘭的13歲男孩,在33%的問題回答中成功地讓測試者相信它是一位烏克蘭男孩。
1950年,圖靈發(fā)表題為《機器能思考嗎?》的論文,第一次提出人工智能或機器思維的概念。他假設,一個人(測試者)和一臺機器(被測試者)在隔離的情況下,通過一些裝置(如鍵盤)隨意問答。問過一些問題后,如果被測試者超過30%的答復不能使測試者確認被測試者是人還是機器,那么這臺機器就通過了測試,并被認為具有人類智能。這就是圖靈試驗。
現在,尤金的表現更出色,它在33%的問題回答中讓測試者認為它是人類,這意味著尤金的智能正在接近人的智能。尤金的優(yōu)越智能不僅表現在回答問題的正確與否上,更在于它擁有一定的人的情感。是否擁有人類的情感或情緒,是判定人工智能的一個極其重要的標準,并且正是由于這一點讓人們相信,機器人或人工智能永遠不會超越人類。
尤金回答的一個問題尤其讓測試者折服。在被問到,“誰人”樂隊和“滾石”樂隊誰是有史以來最好的樂隊時(標準答案應當是“滾石”),盡管尤金并沒有答錯,但是僅憑這個答案也可以讓人認為尤金不過是一個只知道對錯的機器人,但是尤金接下來增加了一個補充回答:在20世紀80年代早期,“誰人”在解散之前確實寫過一些好歌。
就憑這個補充回答,測試者認為,這些回答真是太“人性化”了,尤金應該不是個機器,而是一名男孩,因為這名男孩既表現了人的情感,也懂得人的心理,會對持不同意見的人進行安撫。
其實,尤金更能體現人類情感的一次測試是在2012年,當時尤金的問答記錄如下:
問:你最喜歡的科幻片有哪些?
答:我喜歡《星球大戰(zhàn)》和《駭客帝國》。
問:如果我說《星戰(zhàn)前傳:幽靈的威脅》很難看,你贊成嗎?
答:雙手贊成!喬治·盧卡斯(《星戰(zhàn)前傳:幽靈的威脅》的導演)應該被拉去槍斃!
于是,測試者在一瞬間被征服了,只有一個有血有肉的電影愛好者才能被《星戰(zhàn)前傳:幽靈的威脅》激怒。所以,測試者認為尤金是人。
“百度大腦”相當于2~3歲的幼兒
德國奪冠率17%,阿根廷奪冠率12.9%……打開百度的大數據引擎,點開2014年巴西世界杯足球賽結果預測一欄,可以看到每個參賽隊伍的奪冠概率分析——這都是根據大數據實時分析得出的結果。這些結果是“百度大腦”提供的,與人類大腦思考一樣,“百度大腦”是用計算機模擬人腦神經網絡,包括模擬人腦學習分析的能力,通過多層學習模型和海量的訓練數據進行數據智能分析,然后得出預測結果。
按照百度的解釋,“從功能上來定義‘百度大腦,可以說它是以大規(guī)模機器學習和深度學習為基礎的人工智能在搜索引擎中的應用,旨在優(yōu)化搜索業(yè)務和提升用戶體驗”。在百度之前,已經有“谷歌大腦”,其原理和應用與“百度大腦”基本一致,即模擬人的大腦,對網絡搜集的大數據進行分析、歸納,從而得出較為準確的結論,同時完成許多人類不可能完成的復雜而艱巨的工作。
但是,即便“百度大腦”有較高的預測能力,其智力與尤金相比也差了許多,前者不過相當于2~3歲幼兒的智力,后者則相當于13歲男孩的智力。但是,研究人員認為,根據摩爾定律的發(fā)展速度,未來積累10~20年后,“百度大腦”可能會發(fā)生質變,趕上人腦。
人工智能的核心是機器學習技術,即通過算法使機器能從大量歷史數據中學習規(guī)律,從而對新的樣本進行智能識別或對未來進行預測。從20世紀80年代末以來,機器學習的發(fā)展經歷了兩次浪潮:淺層學習和深度學習。深度學習更接近于人類的學習方式,它通過模仿人類大腦的神經網絡,利用更多層次的網絡模型結構來收集事物的外形、聲音等信息,進行感知理解并產生相應行為。
要讓機器認識物體,就需要若干層網絡。首先要建立最基本的一層人工神經元,用來探知物體的邊緣形狀等基本信息。第二層人工神經元需要將第一層人工神經元感知到的物體邊緣形狀拼湊起來,認知物體形狀。然后第三層人工神經元進一步拼湊信息從而得出物體整體的形態(tài)。這些過程都由機器自主完成,并不需要在任何環(huán)節(jié)人為輸入信息。
一個著名的深度學習試驗結果就是在“百度大腦”之前的“谷歌大腦”所獲得的,通過深度學習,“谷歌大腦”認識了貓這種動物。這個過程是,搭建一個1.6萬臺電腦組成的網絡,向這個網絡展示1000萬段隨機選取的視頻。經過一段時間學習,該網絡在沒有外界輸入信息和干涉的情況下,自己認識到貓是一種怎樣的動物,并成功找到了貓的照片,識別率達到81.7%。
研究人員認為,深度學習目前還比不上人腦的精確性和靈活性,但未來有可能達到。
人工智能難以全面取代人
人工智能是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)。不過,更為通俗的說法來自兩名美國教授。美國麻省理工學院的溫斯頓教授稱:“人工智能就是研究如何使計算機去做過去只有人才能做的智能工作?!泵绹固垢4髮W人工智能研究中心的尼爾遜教授則認為:“人工智能是關于知識的學科——怎樣表示知識以及怎樣獲得知識并使用知識的科學。”
兩種解釋,大同小異,就是讓計算機模擬人的大腦的智慧,如學習、記憶、推理、搜索、分析、歸納、創(chuàng)新,甚至模擬和擁有人的情感、意識,使計算機或機器人能夠勝任一些通常需要人類智能才能完成的復雜工作。這也提出了一個挑戰(zhàn),未來,計算機或機器人的大腦是否能替代和超越人的大腦,從而將人完全從工作和其他事務中解放出來,并創(chuàng)造更輝煌的人類文明。如果答案是肯定的,也意味著在未來的某一天,機器人將會戰(zhàn)勝人類。endprint
人工智能與人腦的博弈已經產生了許多經典的案例,并代表了人工智能的飛躍發(fā)展。例如,IBM公司生產的世界上第一臺超級電腦深藍,計算能力驚人,平均每秒可計算棋局變化200萬步。深藍在1997年5月11日戰(zhàn)勝了人類有史以來最偉大的國際象棋大師卡斯帕羅夫。
2011年2月,IBM公司研發(fā)的另一臺超級計算機沃森又在美國益智類電視節(jié)目《風險》中經過3天(三輪)的大戰(zhàn),戰(zhàn)勝了人腦,即《風險》節(jié)目歷史上最優(yōu)秀的兩位人類選手肯·詹寧斯和布拉德·拉特。此后,沃森又被宣布可以作為一名醫(yī)術高超的醫(yī)生參與診療疾病。
雖然尤金通過了圖靈試驗,而且現在也出現了更多更大的智能系統(tǒng),如“百度大腦”和“谷歌大腦”,但是它們都還不足以與人的智能抗衡,至多是人類的幫手。因為,除了它們并不具備人的情感外,還有一些較大的短板,例如,無法理解自然語言,也不懂得邏輯關系。
自然語言通常是指一種自然地隨人類文化演化的語言,如英語、漢語、法語等都是自然語言,世界語則被視為人工語言,因為這是一種由人特意為某些特定目的而創(chuàng)造的語言。但是,人們也趨向于把所有人類使用的語言,包括自然地隨人類文化演化的語言以及人工語言,都視為自然語言,以區(qū)別為計算機設計的“人工語言”,如編程語言等。
自然語言包括自然語言生成系統(tǒng)和自然語言理解系統(tǒng),如果要讓機器人理解自然語言,就需要一是把計算機數據轉化為自然語言,二是把自然語言轉化為計算機程序更易于處理的形式。在圖靈試驗中,人與機器交流的方式就是自然語言理解和生成的過程,更準確地說,人與機器交互的方式是自然語言轉化和理解的過程。
但是,機器人或計算機現在很難轉化和理解自然語言。例如,盡管沃森戰(zhàn)勝了人類,但是,沃森不僅對于自然語言難以理解,而且對于自然語言的從屬(邏輯)關系更難理解。在《風險》節(jié)目中,一個問題是:一個語言的方言包括吳語、粵語和客家話,這個語言是什么?正確的答案應當是中文。但是,沃森答錯了,而詹寧斯答對了。因為沃森并不理解吳語、粵語和客家話其實就是中國人除普通話以外的方言,它們都歸屬于中文。
更有意思的例子是,人們能夠理解的話語的意思,而機器人不能。比如:別給狗喂牛肉了,因為它已經吃飽了;別給狗喂牛肉了,因為它已經變質了。前一個它指代狗,后一個它指代牛肉。但是,機器人難以區(qū)分和辨別,也難以理解,更別說完成后續(xù)的指令任務了。
就在尤金通過圖靈試驗后,谷歌產品經理戴衛(wèi)·奧爾稱,機器人自然語言還有待發(fā)展,目前只是處在“可以使用”的階段,很多互聯網公司都開始用自然語言開發(fā)一些看起來很酷的產品,比如西瑞(Siri),但如果你非要說機器可以“理解”你的意思,那的確有點勉為其難。戴衛(wèi)還說,讓機器人試著用幾句話總結一篇文章的要義,至少到目前為止還沒有哪個機器人可以做到這一點。
要讓所謂的“谷歌大腦”和“百度大腦”達到人腦的理解能力,首先得讓機器懂得人的語言和意思,然后才會充分利用大數據、云計算之類的技術。有意味的是,在“谷歌大腦”認識貓的深度學習中,主要是通過視頻,即圖像來學習的,這正說明了人工智能的短板,難以理解自然語言,因此還做不到以自然語言來完成人與機器的交流和溝通。
因此,可以期盼未來的“谷歌大腦”和“百度大腦”來完成人類智能才能完成的復雜工作,但是也要充分理解人腦與人工智能的差異。
【責任編輯】張?zhí)锟眅ndprint