楊揚(yáng)
通用人工智能系統(tǒng)與以往技術(shù)最大區(qū)別在于自學(xué)能力,它可以從零學(xué)起,掌握任何技能。
3月15日,在全世界媒體的聚光燈下,機(jī)器人阿爾法狗(即AlphaGo)的創(chuàng)造者戴密斯·哈薩比斯,與韓國圍棋九段李世石微笑握手,留下人類歷史上頗具意義的一個(gè)瞬間。
過去20年間,計(jì)算機(jī)已戰(zhàn)勝過中國象棋和國際象棋的頂尖高手,圍棋被視為人類最后的智力自留地。從計(jì)算量上來說,圍棋的難度平均是國際象棋的1億倍。
當(dāng)阿爾法狗以4:1贏得這場(chǎng)“事關(guān)人類命運(yùn)”的一戰(zhàn),全世界的情緒都被攪動(dòng)了起來:有人為人工智能的飛速進(jìn)步歡欣鼓舞,也有人擔(dān)憂未來地球?qū)⒈粰C(jī)器人控制。而這一切背后的那個(gè)人——哈薩比斯,仍然低調(diào)地沉溺于他自己的世界。他說: “看到人工智能這個(gè)深?yuàn)W難懂的事情成為人人都關(guān)注的話題,這很有趣?!?/p>
阿爾法狗如何做到像人一樣“聰明”
對(duì)這場(chǎng)比賽,哈薩比斯超級(jí)期待,他甚至在正式比賽開始前,和谷歌前CEO埃里克·施密特分別坐在阿爾法狗和李世石的座位上下了一局。
3月9日,在首爾四季酒店,大戰(zhàn)終于開幕。第一局中,阿爾法狗一度不斷吃虧,直到150手深入李世石的領(lǐng)地,宣告了棋局的勝利。對(duì)此,李世石十分意外。哈薩比斯也為阿爾法狗的侵略性和大膽感到意外。“李世石以好戰(zhàn)聞名,比賽一開始,他就在整個(gè)棋盤上求戰(zhàn),但是沒有一處是真的;而阿爾法狗也戲耍了李世石。傳統(tǒng)的圍棋程序在局域計(jì)算中并不差,但是在需要通盤視野的時(shí)候會(huì)很無力。”
每天賽況一出,哈薩比斯都會(huì)在推特上發(fā)表感想。他一邊為自己的團(tuán)隊(duì)感到驕傲,一邊為頑強(qiáng)的李世石喝彩。當(dāng)李世石在第四局中贏了阿爾法狗之后,他發(fā)文說:“祝賀!今天他的表現(xiàn)太精彩了,把阿爾法狗逼入死地。”當(dāng)?shù)谖寰纸Y(jié)束之后,哈薩比斯評(píng)論說:“世界上最不可置信的游戲結(jié)束了,這必將進(jìn)入歷史!”
阿爾法狗是如何做到像人一樣“聰明”的?首先,它的核心系統(tǒng)是,機(jī)器學(xué)習(xí)與神經(jīng)系統(tǒng)科學(xué)這兩個(gè)領(lǐng)域結(jié)合起來開發(fā)的學(xué)習(xí)算法;其次,它在谷歌強(qiáng)大的云計(jì)算系統(tǒng)中,通過大量數(shù)據(jù)分析學(xué)習(xí)了3000多萬步的職業(yè)棋手棋譜,再通過增強(qiáng)學(xué)習(xí)的方法自我博弈,尋找比基礎(chǔ)棋譜更好的棋路。這讓它有了類似人腦的功能:龐大數(shù)據(jù)庫;自我學(xué)習(xí),找到更好的解決方法;局面判斷準(zhǔn)確率接近80%。
從資深游戲迷到遠(yuǎn)離游戲
走出聚光燈的哈薩比斯,是個(gè)再普通不過的上班族。每晚他從倫敦國王十字車站搭地鐵回家,那是位于海格特、背靠山頂公園的一處房子。小小的玻璃門廊、粗糙質(zhì)感的白墻,門前的街道很幽靜。無論多忙,他都會(huì)與家人共進(jìn)晚餐,他的妻子是一名來自意大利的分子生物學(xué)家,兩個(gè)兒子一個(gè)7歲,一個(gè)9歲。晚飯后,他陪著兒子玩耍、讀書,哄他們上床睡覺。
這里離哈薩比斯兒時(shí)的住處也不遠(yuǎn),在那里有很多美好的回憶。他從小就天賦異稟:4歲迷上國際象棋,兩周后就贏了爸爸;6歲獲得倫敦8歲以下錦標(biāo)賽冠軍;9歲成為英國11歲以下國家象棋隊(duì)隊(duì)長;13歲取得了“國際象棋大師”頭銜。
1984年,8歲的哈薩比斯用自己贏得的獎(jiǎng)金買了臺(tái)計(jì)算機(jī),“這種機(jī)器是我們腦力的延伸。通過它們,我可以創(chuàng)造出比按部就班的日常生活更令人興奮的東西?!惫_比斯開始自學(xué)編程,因?yàn)闆]什么零用錢,有一個(gè)夏天,他一直流連在報(bào)刊亭,翻閱買不起的計(jì)算機(jī)類雜志。
哈薩比斯的父親是希臘裔塞浦路斯人,母親則是華裔新加坡人,兩人都是教師,而且都是“現(xiàn)代技術(shù)恐懼者”。但對(duì)于這個(gè)整日沉迷于游戲的孩子,他們一點(diǎn)也不擔(dān)心,還興致勃勃地聽他分享心得。
高中畢業(yè)后,哈薩比斯就被視頻游戲公司“牛蛙”的老板看中,去做游戲開發(fā)。1994年,他開發(fā)的《主題公園》——最早包含人工智能元素的游戲之一,一發(fā)布就銷售了數(shù)百萬份。但到了1997年,他開發(fā)的《共和:革命》《邪惡天才》市場(chǎng)表現(xiàn)卻很一般。這讓哈薩比斯開始反思,“90年代,游戲很有趣,也有創(chuàng)新性。但到了新世紀(jì),游戲注重圖像和內(nèi)容,想通過游戲這扇‘后門去展開人工智能研究已經(jīng)非常困難,這違背了我做游戲的初衷?!?/p>
從此,哈薩比斯這個(gè)資深游戲迷遠(yuǎn)離了游戲,甚至對(duì)現(xiàn)在大型多人游戲感覺失望?!拔覐膩矶紵o法真正融入游戲,因?yàn)樘摂M人物看起來傻傻的。他們沒有記憶,不會(huì)改變,也與環(huán)境無關(guān)。如果有學(xué)習(xí)型人工智能,游戲質(zhì)量就能提升到新水平?!?/p>
21世紀(jì)的“阿波羅工程”
雄心勃勃的哈薩比斯想創(chuàng)造一個(gè)通用人工智能系統(tǒng)。在他看來,從智能語音助手Siri到人臉識(shí)別系統(tǒng),這些預(yù)設(shè)好程序的軟件只能掌握某項(xiàng)特定技能,屬于弱人工智能。而通用人工智能系統(tǒng)與以往技術(shù)最大區(qū)別在于自學(xué)能力,它可以從零學(xué)起,掌握任何技能,“就好像和人類做得一樣”,他稱之為21世紀(jì)的“阿波羅工程”。
2005年,哈薩比斯重返校園,到倫敦大學(xué)攻讀認(rèn)知神經(jīng)科學(xué)博士學(xué)位?!霸谟螒蛐袠I(yè),我做了能做的所有一切,在成立‘深度思維之前我需要收集好必要的信息,這就是神經(jīng)科學(xué)——我希望從大腦解決問題的方式中獲得靈感?!彼x擇研究海馬體,海馬體是人腦中主要負(fù)責(zé)記憶和學(xué)習(xí)的部位,短期記憶都儲(chǔ)存其中。
哈薩比斯說,當(dāng)時(shí)自己“對(duì)大腦的唯一了解就是它是個(gè)殼”。僅僅兩年后,他就開創(chuàng)性地發(fā)現(xiàn)海馬體和情景記憶間的聯(lián)系。他證明了因?yàn)楹qR體受傷而患上健忘癥的人,在暢想未來的時(shí)候也有障礙,因此提出:大腦中與過去的記憶有關(guān)的部分,在規(guī)劃未來的時(shí)候也同樣至關(guān)重要。這項(xiàng)研究結(jié)果被《科學(xué)》雜志列入“年度十大突破”。
2010年,哈薩比斯與發(fā)小穆斯塔法·蘇萊曼、人工智能專家謝恩· 萊格一起創(chuàng)辦了“深度思維”公司。公司一創(chuàng)立就引起了許多大佬注意,包括特斯拉創(chuàng)始人伊隆·馬斯克,2012年他投資了650萬美元。除了通用人工智能這個(gè)大方向,“深度思維”到底在干什么,大家都不清楚。
2013年12月,“深度思維”的第一次公開亮相震驚了眾人。在美國加州和內(nèi)華達(dá)州交界的太浩湖畔,“深度思維”向公眾展示了一款軟件。這款軟件并沒有被編入“如何玩游戲”的指令,但通過控制鍵盤,觀察顯示器分?jǐn)?shù),經(jīng)過反復(fù)試錯(cuò)之后,成為了一個(gè)專業(yè)級(jí)游戲高手。這證明軟件可以通過神經(jīng)模擬網(wǎng)絡(luò)處理數(shù)據(jù),像人腦一樣“本能地”學(xué)習(xí)。加州大學(xué)伯克利分校人工智能專家斯圖爾特·羅素感嘆道:“人們根本沒有想到當(dāng)今的技術(shù)能達(dá)到這種水平?!惫雀鐲EO拉里·佩奇也不吝贊美,這是“我多年以來見過的最驚人技術(shù)之一”。
谷歌花4億英鎊買下“深度思維”
一向?qū)τ谌斯ぶ悄苄嵊X靈敏的谷歌,看到“深度思維”這匹黑馬如何能不動(dòng)心?2014年1月,谷歌完成了在歐洲最大的一筆收購,以4億英鎊(1英鎊約合9.3元人民幣)將“深度思維”納入麾下,盡管當(dāng)時(shí)后者尚未實(shí)現(xiàn)商業(yè)盈利。之后,谷歌應(yīng)哈薩比斯的要求設(shè)立了道德監(jiān)察委員會(huì),制定一系列限制條款,以確保人工智能技術(shù)不會(huì)被濫用。被收購后,哈薩比斯說:“這是20年精心計(jì)劃的結(jié)果。我教育經(jīng)歷中的每一步,我為團(tuán)隊(duì)雇傭的每一個(gè)人,都是為了這一天的到來?!边@聽起來有點(diǎn)像一場(chǎng)漫長對(duì)弈中走出的一招妙棋。
在哈薩比斯的堅(jiān)持下,“深度思維”依舊留在了倫敦,而不是搬到加州山景城的谷歌總部或者其他地方。“我在北倫敦出生并長大,我非常喜歡這座城市。”他依舊是個(gè)超級(jí)工作狂。每天,他都要工作到夜里11點(diǎn)多;當(dāng)午夜時(shí)分到來時(shí),他開始了所謂的“第二天”,與美國的同事進(jìn)行電話會(huì)議,一直到1點(diǎn)多;這之后才是他自己的思考時(shí)間,通常會(huì)持續(xù)到凌晨三四點(diǎn)。
“深度思維”原來有50名員工,現(xiàn)在有來自全球45個(gè)國家的近200人,占據(jù)了倫敦國王十字車站附近一棟6層大樓。每間辦公室都以天才來命名:特斯拉、拉馬努詹、柏拉圖、費(fèi)曼、亞里士多德、居里夫人。一樓有咖啡廳和會(huì)客室,桌上足球游戲機(jī)、懶人沙發(fā)等更是一應(yīng)俱全。樓頂還有露臺(tái),可以觀賞倫敦風(fēng)景,每周五晚的樓頂聚會(huì)已成慣例。公司還有跑步協(xié)會(huì)、足球隊(duì)、棋類協(xié)會(huì)。雖然互聯(lián)網(wǎng)行業(yè)人員流動(dòng)很大,對(duì)手公司也試圖來挖墻腳,但“深度思維”從創(chuàng)建起離職率一直為零。看來,哈薩比斯把自己對(duì)人腦的理解,不但用到了開發(fā)人工智能上,也完美地用到了企業(yè)管理上。
繼人工智能開發(fā)、企業(yè)發(fā)展之后,哈薩比斯還要回答第三個(gè)問題:人工智能的安全性。在阿爾法狗戰(zhàn)勝李世石后,人們尤為關(guān)注這個(gè)問題。“人工智能距離人腦的水平仍有幾十年的差距,我們才爬上了梯子的第一級(jí)。技術(shù)本身是中立的,但會(huì)受到設(shè)計(jì)者價(jià)值觀的影響,因此我們要非常謹(jǐn)慎地思考價(jià)值觀問題?!痹诠_比斯看來,說到底,這還是人類自身的問題。
摘自《環(huán)球人物》