陳賽
這場(chǎng)人機(jī)大戰(zhàn)真正的懸念也許在于AlphaGo的未來(lái)。它還可以走多遠(yuǎn)?它還可以變得多強(qiáng)大?如果一個(gè)科技公司能在兩三年的時(shí)間內(nèi)把一個(gè)機(jī)器訓(xùn)練成圍棋大師,是否也可以把更多的機(jī)器訓(xùn)練成一個(gè)律師、一個(gè)醫(yī)生、一個(gè)程序員,甚至一個(gè)作家、一個(gè)藝術(shù)家?對(duì)于人類而言,這到底是福是禍?
這是一場(chǎng)沒(méi)有懸念的比賽。至少,誰(shuí)輸誰(shuí)贏,根本沒(méi)有任何懸念。全世界都知道柯潔會(huì)輸。畢竟,我們都領(lǐng)教過(guò)AlphaGo的進(jìn)化速度:
2015年10月,第一代AlphaGo以5∶0第一次擊敗歐洲冠軍樊麾;
2016年3月,第二代AlphaGo以4∶1擊敗李世石,過(guò)去10年里最偉大的人類圍棋手。
從樊麾到李世石,對(duì)人類可能是一輩子都無(wú)法跨越的鴻溝,而AlphaGo只花了5個(gè)月時(shí)間。
AlphaGo進(jìn)化史
第一代,是擊敗樊麾的AlphaGo Fan。與Zen/Crazy Stone等之前的圍棋軟件相比,棋力要高出4子。
第二代,是擊敗李世石的AlphaGo Lee。與上一代相比,棋力高出3子。
第三代,是柯潔如今的對(duì)手,也是年初60連勝的:AlphaGo Master。相比于擊敗李世石的版本,棋力又再次提升3子。
在李世石之后,AlphaGo又經(jīng)歷了一輪新的進(jìn)化:
DeepMind修補(bǔ)了當(dāng)時(shí)與李世石決戰(zhàn)時(shí)系統(tǒng)暴露的漏洞。整個(gè)系統(tǒng)架構(gòu)經(jīng)過(guò)了重新設(shè)計(jì),神經(jīng)網(wǎng)絡(luò)從原來(lái)的12層增加到40層,而且,不再借助人類棋譜,而是完全通過(guò)機(jī)器的自我對(duì)弈來(lái)訓(xùn)練——通過(guò)這種自我對(duì)弈產(chǎn)生高質(zhì)量的數(shù)據(jù),這意味著它正在按照它的創(chuàng)造者德米斯·哈薩比斯最初制定的目標(biāo)演化——一個(gè)能夠自主學(xué)習(xí)、自我適應(yīng)的智能體。
經(jīng)過(guò)一年的算法結(jié)構(gòu)優(yōu)化,從李世石版的50個(gè)TPU(谷歌專門(mén)為機(jī)器學(xué)習(xí)而設(shè)計(jì)的處理器)并行式運(yùn)算,變成由4個(gè)TPU組成“單機(jī)版”,運(yùn)算量降低了90%。AlphaGo的訓(xùn)練時(shí)間不再以月計(jì)算,而是以周計(jì)算。
AlphaGo Lee
運(yùn)行于谷歌云,耗用50個(gè)TPU進(jìn)行計(jì)算
每次搜索計(jì)算后續(xù)50步,計(jì)算速度為10000個(gè)位置/秒
2016年在首爾擊敗李世石
AlphaGo Master
運(yùn)行于谷歌云,但只用一個(gè)TPU機(jī)器
自學(xué)成才,AlphaGo自我對(duì)弈提高棋力
擁有更強(qiáng)大的策略/價(jià)值網(wǎng)絡(luò)
5月23日,中國(guó)棋手柯潔(左)對(duì)戰(zhàn)AlphaGo首局比賽在浙江烏鎮(zhèn)舉行 ,AlphaGo執(zhí)白1/4子獲勝
從某種角度來(lái)說(shuō),我們已經(jīng)見(jiàn)識(shí)了新版的AlphaGo有多強(qiáng)大——2017新年,AlphaGo再次以“Master”的網(wǎng)名在各大圍棋對(duì)弈網(wǎng)站連勝60場(chǎng),擊敗了當(dāng)世幾乎所有的頂尖高手。
柯潔與AlphaGo的第一局賽后,DeepMind的首席科學(xué)家大衛(wèi)·席爾瓦(David Silver)透露AlphaGo Master可以讓李世石版本的AlphaGo 3個(gè)子,立刻引來(lái)全場(chǎng)嘩然。午餐的時(shí)候,我剛好坐在一桌棋手邊上,所有人都在談?wù)?子,全是一副下巴掉下來(lái)的表情。
這個(gè)差距有多大呢?
用柯潔的話說(shuō),“簡(jiǎn)單地解釋一下就是,一人一手輪流下的圍棋,對(duì)手連續(xù)讓你下三步……又像武林高手對(duì)決讓你先捅三刀一樣……”
后來(lái),大衛(wèi)·席爾瓦特意向所有媒體寫(xiě)信做了更正:“新版本的AlphaGo,已經(jīng)過(guò)幾百萬(wàn)次的自我訓(xùn)練,并在檢測(cè)舊版本弱點(diǎn)方面表現(xiàn)出色。也因此,新版本的AlphaGo可以讓舊的版本3子。但當(dāng)AlphaGo與從未對(duì)弈過(guò)的人類棋手對(duì)局時(shí),這樣的優(yōu)勢(shì)就不復(fù)存在了,尤其是柯潔這樣的圍棋大師,他可能幫助我們發(fā)現(xiàn)AlphagGo未曾展露的新弱點(diǎn)。這樣的衡量標(biāo)準(zhǔn)是無(wú)法比較的。”
盡管如此,我們還是疑惑,為什么還有必要再進(jìn)行一次人機(jī)大戰(zhàn)?
是谷歌重回中國(guó)市場(chǎng)的一次外交嘗試,還是相信DeepMind的官方解釋,“這是因?yàn)楸M管已經(jīng)連戰(zhàn)連捷,AlphaGo仍然有繼續(xù)探索的空間。我們?nèi)匀幌朐趪孱I(lǐng)域繼續(xù)追問(wèn):我們離最優(yōu)解還有多遠(yuǎn)?怎樣才是完美棋局?人類3000年的對(duì)弈沒(méi)有找到最佳下法,AlphaGo可以與人類棋手共同探尋這些奧秘”。
去年的那場(chǎng)人機(jī)大戰(zhàn),AlphaGo對(duì)戰(zhàn)李世石,用李世石自己的話說(shuō),第一局震驚,第二局無(wú)語(yǔ),第三局深感無(wú)力,第四局力挽狂瀾、贏回一局,到第五局再度落敗時(shí),深深嘆息人類創(chuàng)造力的局限性。
這次柯潔與AlphaGo Master的比賽,到本文發(fā)稿之前為止,已經(jīng)輸了兩場(chǎng)。但去年那種悲情的氣氛已經(jīng)消失了,取而代之的,是對(duì)于一種異類智能的好奇、敬畏,甚至拜服。
在比賽現(xiàn)場(chǎng),不少九段棋手追著DeepMind的工程師,想要觀摩AlphaGo的后臺(tái)數(shù)據(jù)——AlphaGo每走一步對(duì)雙方的勝負(fù)概率都有預(yù)估。他們急于知道,機(jī)器到底是怎么評(píng)價(jià)人類的表現(xiàn)的。
不止一位九段棋手表示,很愿意被讓2子,甚至3子,與AlphaGo Master對(duì)弈,以了解對(duì)方的真實(shí)水平。
每一個(gè)頂尖棋手都在苦心鉆研年初AlphaGo Master掃蕩棋壇后留下的60張棋譜。作為棋手,他們不得不承認(rèn),AlphaGo對(duì)圍棋是有它自己的“理解”的,而且這種理解的強(qiáng)大與精妙之處,遠(yuǎn)遠(yuǎn)超出了人類的想象。
“很多棋,我們理解不了,我們理解不了的時(shí)候就說(shuō)我喜歡這樣,我個(gè)性如此……”在第一局賽事后的間歇,著名的九段棋手江鑄久這樣告訴我,“比如,如果不是AlphaGo,我們不會(huì)理解吳清源有多好。AlphaGo的招式是從16萬(wàn)張人類棋譜里選出來(lái)的,選出來(lái)很多是吳清源的招式?!?
他再次談起AlphaGo與李世石的第二局比賽中的第37手。“有人認(rèn)為不夠好,有人表示看不懂,當(dāng)時(shí)我一看,就覺(jué)得熱淚盈眶,我想,莫非是吳老師回來(lái)了?”
“只有吳清源才會(huì)這么下棋?!?h3>AlphaGo可以走多遠(yuǎn)?
從某種角度來(lái)說(shuō),是歷史選定了這些圍棋手,作為第一批與“機(jī)器智能”正面交鋒的人類,領(lǐng)悟這種智能的強(qiáng)大與奇妙,詭譎與怪異,并被迫重新評(píng)估自身的角色、信仰、目標(biāo)、身份。
作為一名觀戰(zhàn)者,這次人機(jī)大戰(zhàn)對(duì)我最大的觸動(dòng)之一,就是這些頂級(jí)的棋手對(duì)于AlphaGo沒(méi)有絲毫輕慢之心。連曾經(jīng)那么年少輕狂的柯潔,也在第二局戰(zhàn)敗之后這樣感慨:“在AlphaGo沒(méi)出現(xiàn)之前,我可能對(duì)棋的了解有50%。AlphaGo出現(xiàn)之后,我對(duì)人生看法都有巨大改變,未來(lái)不是我等凡夫俗子可以預(yù)測(cè)的。如果對(duì)圍棋規(guī)則了解就算知道1%,我可能只能算是知道2%?!?/p>
是的,未來(lái)不是我們這些凡夫俗子所能預(yù)測(cè)。這場(chǎng)人機(jī)大戰(zhàn)真正的懸念也許在于AlphaGo的未來(lái)。它還可以走多遠(yuǎn)?它還可以變得多強(qiáng)大?如果一個(gè)科技公司能在兩三年的時(shí)間內(nèi)把一個(gè)機(jī)器訓(xùn)練成圍棋大師,是否也可以把更多的機(jī)器訓(xùn)練成一個(gè)律師、一個(gè)醫(yī)生、一個(gè)程序員,甚至一個(gè)作家、一個(gè)藝術(shù)家?對(duì)于人類而言,這到底是福是禍?
事實(shí)上,AlphaGo的腳步并不止于圍棋。哈薩比斯曾經(jīng)說(shuō)過(guò),他創(chuàng)辦DeepMind真正的目的是攻克人類的“智力”難題。他認(rèn)為,學(xué)習(xí)和通用(general)是人類智力最根本的特征。他想發(fā)明一種“通用人工智能”(General AI)——不是自上而下,一點(diǎn)點(diǎn)教機(jī)器規(guī)則,讓它從規(guī)則中理解語(yǔ)言、識(shí)別人臉;而是自下而上,讓機(jī)器像人類一樣,從觀察、經(jīng)驗(yàn)中學(xué)習(xí),像人類一樣根據(jù)環(huán)境的變化做出靈活的決策,像人類一樣舉一反三,執(zhí)行各種不同的任務(wù)。
機(jī)器學(xué)習(xí)真的能實(shí)現(xiàn)這樣的智能嗎?
2015年,美國(guó)麻省理工學(xué)院一次關(guān)于人工智能的研討會(huì)上,有人問(wèn)喬姆斯基怎么看機(jī)器學(xué)習(xí),他的反應(yīng)是嗤之以鼻,認(rèn)為不過(guò)是數(shù)據(jù)預(yù)測(cè),一場(chǎng)華麗的天氣預(yù)報(bào)而已。即使神經(jīng)網(wǎng)絡(luò)的翻譯獲得了某種完美的功能性,它仍然無(wú)法揭示語(yǔ)言的本質(zhì)。機(jī)器也許能比人類醫(yī)生更好地檢測(cè)腫瘤,但機(jī)器永遠(yuǎn)不會(huì)告訴你是什么引發(fā)了腫瘤。
但谷歌一向是典型的工程師思維。對(duì)他們來(lái)說(shuō),人工智能更重要的不是關(guān)于理解心智的本質(zhì),而是關(guān)于制造工具、解決現(xiàn)實(shí)的問(wèn)題。
事實(shí)上,根據(jù)谷歌在“人工智能的未來(lái)”論壇上(與此次人機(jī)大戰(zhàn)同期舉行)發(fā)布的數(shù)據(jù),他們的機(jī)器學(xué)習(xí)模型診斷眼疾的準(zhǔn)確率,甚至高于一些通過(guò)美國(guó)認(rèn)證委員會(huì)認(rèn)證的眼科醫(yī)生。這些模型還能比放射科醫(yī)生更快地在醫(yī)學(xué)影像中找到腫瘤,甚至根據(jù)病理報(bào)告的文本做出診斷。
在這次論壇上,哈薩比斯還透露,AlphaGo的算法已經(jīng)被應(yīng)用于谷歌數(shù)據(jù)中心的節(jié)電項(xiàng)目,并成功節(jié)能40%。至于它的未來(lái),可以在材料、醫(yī)療、智能手機(jī)和教育等各種領(lǐng)域。
“癌癥、氣候變遷、能源、基因組學(xué)、宏觀經(jīng)濟(jì)學(xué)、金融系統(tǒng)、物理學(xué)等,太多我們想掌握的系統(tǒng)知識(shí)正變得極其復(fù)雜。如此巨大的信息量讓最聰明的人窮其一生也無(wú)法完全掌握。那么,我們?nèi)绾尾拍軓娜绱她嫶蟮臄?shù)據(jù)量中篩選出正確的見(jiàn)解呢?而一種通用人工智能思維的方式則是自動(dòng)將非結(jié)構(gòu)化信息轉(zhuǎn)換為可使用知識(shí)的過(guò)程。我們所研究的東西可能是針對(duì)任何問(wèn)題的元解決方法(meta-solution)?!?/p>
“神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的爆發(fā)是我此生所經(jīng)歷過(guò)的最大變革?!鼻皝?lái)參加人機(jī)大戰(zhàn)的谷歌董事長(zhǎng)埃里克·施密特(Eric Schmidt)在賽后的一次對(duì)談中這樣表示。
“在谷歌內(nèi)部,人工智能不只是研發(fā)人員的事情,而是貫穿整個(gè)公司的戰(zhàn)略和技術(shù)。無(wú)論硬件領(lǐng)域、產(chǎn)品組、服務(wù)組等,都在AI的連接下交叉配合,比如谷歌翻譯、谷歌照片、谷歌醫(yī)療、無(wú)人車等產(chǎn)品和項(xiàng)目,背后都有人工智能貫穿其間?!?/p>
與去年一樣,在激烈的比賽間隙,杰夫·迪恩(Jeff Dean),谷歌工程師的精神領(lǐng)袖,也是谷歌大腦的負(fù)責(zé)人于百忙之中介紹了谷歌大腦在過(guò)去一年的技術(shù)進(jìn)展。從項(xiàng)目上看與去年韓國(guó)首爾所見(jiàn)似乎沒(méi)有什么大的區(qū)別,但技術(shù)進(jìn)展的加速度卻令人震驚。以圖片識(shí)別為例,2011年,機(jī)器的圖像識(shí)別錯(cuò)誤率為26%,到2016年已經(jīng)降低到了3%,比人類的識(shí)別錯(cuò)誤率(5%)還要低。
在媒體上引發(fā)最大轟動(dòng)的,是在過(guò)去9個(gè)月的時(shí)間里,谷歌徹底拆除了原先的翻譯系統(tǒng),引入神經(jīng)網(wǎng)絡(luò),大幅提高了翻譯的準(zhǔn)確率,其中一些語(yǔ)言的準(zhǔn)確率甚至提高了85%。隨之發(fā)布的多語(yǔ)言互譯系統(tǒng),將兩種語(yǔ)言的翻譯學(xué)習(xí)“遷移”到更多的語(yǔ)種,比如通過(guò)中英互譯的學(xué)習(xí),就能直接把模型算法遷移到中日、日英等多語(yǔ)種互譯方面。如杰夫·迪恩所說(shuō),機(jī)器“學(xué)習(xí)如何學(xué)習(xí)”,將是谷歌未來(lái)最重要的研究方向。
舊翻譯系統(tǒng):基于短語(yǔ)的翻譯,先把句子分成一個(gè)個(gè)短語(yǔ)和單詞,然后獨(dú)立翻譯,最后對(duì)翻譯出來(lái)的獨(dú)立短語(yǔ)解釋進(jìn)行邏輯整理,變成句子
新翻譯系統(tǒng):神經(jīng)機(jī)器翻譯,將整個(gè)句子視作翻譯單元,對(duì)句子中的每一部分進(jìn)行帶有邏輯的關(guān)聯(lián)翻譯,翻譯每一個(gè)字或單詞時(shí)都包含著整句話的邏輯
當(dāng)我們想象人工智能未來(lái)的時(shí)候,總是想著庫(kù)茲韋爾那些關(guān)于“奇點(diǎn)”的古怪預(yù)言,比如不久的將來(lái),我們會(huì)制造出比我們更聰明的機(jī)器,它們?cè)僭斐霰人鼈冏约焊斆鞯臋C(jī)器,如此這般,整個(gè)世界朝著我們無(wú)法預(yù)計(jì)的巨型超智能的方向狂奔;再比如,我們很快就能將人的思維載入計(jì)算機(jī)中,在計(jì)算機(jī)的電路里獲得超強(qiáng)的智力,甚至永生。2014年的反烏托邦電影《超驗(yàn)駭客》中就有一個(gè)情節(jié)受此啟發(fā),其中有個(gè)類似庫(kù)茲韋爾的科學(xué)家,他的思維被人載入網(wǎng)絡(luò),給人類帶來(lái)了毀滅性的后果。
去年,尤瓦爾·赫拉利來(lái)中國(guó)宣傳他的《人類簡(jiǎn)史》時(shí),我有機(jī)會(huì)采訪到他。他談到當(dāng)今世界最重要的變化,就在于“權(quán)力和權(quán)威正在從人類轉(zhuǎn)移到人工智能、到算法等,而人類卻毫無(wú)知覺(jué)”。
是的,今天的人工智能與人類智能還有著本質(zhì)的差異——它不具備情感、不具備欲望,所以,它不會(huì)有統(tǒng)治世界、奴役人類的興趣與野心。但無(wú)人駕駛汽車不需要任何欲望或情感就能代替司機(jī),因?yàn)榘凑宅F(xiàn)實(shí)世界經(jīng)濟(jì)系統(tǒng)的設(shè)定,司機(jī)的工作就是把人/物從a送到b,廉價(jià)、迅速即可。如果在這方面機(jī)器做得更出色,經(jīng)濟(jì)系統(tǒng)就會(huì)更傾向于機(jī)器,而不是有欲望、有情感的人,于是人就變成了多余。
關(guān)于人工智能,我們應(yīng)該警惕的危機(jī),不是“奇點(diǎn)”,不是超級(jí)智能,不是人機(jī)大戰(zhàn),而是當(dāng)下這些因?yàn)榫邆淞嗽絹?lái)越強(qiáng)的學(xué)習(xí)能力而變得越來(lái)越聰明的平凡機(jī)器。
當(dāng)然,從機(jī)器學(xué)習(xí)到機(jī)器理解,人工智能還有很遠(yuǎn)的路要走,就像一位人類學(xué)家告訴我的,“相信奇點(diǎn),就像重新相信上帝一樣”。但是,作為人類,我們對(duì)于這些“聰明”的機(jī)器的信任已經(jīng)超過(guò)了自己,而近乎相信上帝了。
本來(lái),上帝死后,人是一切世界意義和權(quán)威的來(lái)源,而人的感情、人的感覺(jué)、人的自由選擇是所有問(wèn)題最終的答案。但現(xiàn)在,我們正不假思索地將控制權(quán)讓渡到那些距離真正的“思考”“理解”還很遙遠(yuǎn)的機(jī)器手中,甚至將整個(gè)文明置入自動(dòng)化的快車道。最吊詭的是,在整個(gè)權(quán)力/權(quán)威的交接過(guò)程中,每一步都顯得如此的理所當(dāng)然,令人無(wú)可拒絕。
今天,再?zèng)]有人用自己的頭腦來(lái)做加減運(yùn)算,因?yàn)橛?jì)算器要快速準(zhǔn)確得多。我們信任百度地圖,遠(yuǎn)遠(yuǎn)勝過(guò)自己的方向感。學(xué)習(xí)一門(mén)新的語(yǔ)言聽(tīng)起來(lái)是一件性價(jià)比越來(lái)越低的事情,因?yàn)楣雀璧姆g越來(lái)越強(qiáng)大了。
我們依賴機(jī)器告訴我們,哪些信息更重要、更有用、更值得關(guān)注;我們依賴機(jī)器告訴我們,應(yīng)該看什么電影、讀什么書(shū)、聽(tīng)什么歌,甚至選擇什么樣的伴侶;更深入一點(diǎn),當(dāng)面對(duì)一個(gè)生死攸關(guān)的醫(yī)療選擇時(shí),你覺(jué)得你會(huì)相信自己、相信醫(yī)生,還是相信機(jī)器?當(dāng)年安吉麗娜·朱莉切除兩側(cè)乳房,不是因?yàn)樗约旱纳眢w出現(xiàn)問(wèn)題,也不是出于醫(yī)生的診斷,而是機(jī)器告訴她,她所攜帶的一種突變基因,意味著她有7%的可能性將來(lái)會(huì)患上乳腺癌。所以,很有可能,在我們此后一生當(dāng)中,關(guān)于我們的身體,那些性命攸關(guān)的醫(yī)學(xué)決定,都將不再取決于你自己的感覺(jué),甚至醫(yī)生的意見(jiàn),而是會(huì)由計(jì)算機(jī)、電子算法和巨大的數(shù)據(jù)庫(kù)來(lái)決定。
“工作,本來(lái)應(yīng)該由人來(lái)完成的,現(xiàn)在越來(lái)越多地由機(jī)器來(lái)完成。決定,本來(lái)應(yīng)該由人憑借感覺(jué)與理性做出的,現(xiàn)在越來(lái)越多地由算法來(lái)做出。而且,每一步都讓你覺(jué)得無(wú)法拒絕?!焙绽f(shuō),“在此過(guò)程中,人漸漸變得無(wú)用、多余。這是為什么你知道世界正在發(fā)生非常嚴(yán)重的變化?!?