一場(chǎng)沒(méi)有懸念的人機(jī)大戰(zhàn)與一個(gè)懸念重重的未來(lái)

2017-06-02 09:10:53陳賽

三聯(lián)生活周刊 2017年23期

陳賽

這場(chǎng)人機(jī)大戰(zhàn)真正的懸念也許在于AlphaGo的未來(lái)。它還可以走多遠(yuǎn)？它還可以變得多強(qiáng)大？如果一個(gè)科技公司能在兩三年的時(shí)間內(nèi)把一個(gè)機(jī)器訓(xùn)練成圍棋大師，是否也可以把更多的機(jī)器訓(xùn)練成一個(gè)律師、一個(gè)醫(yī)生、一個(gè)程序員，甚至一個(gè)作家、一個(gè)藝術(shù)家？對(duì)于人類而言，這到底是福是禍？

一場(chǎng)沒(méi)有懸念的人機(jī)大戰(zhàn)

這是一場(chǎng)沒(méi)有懸念的比賽。至少，誰(shuí)輸誰(shuí)贏，根本沒(méi)有任何懸念。全世界都知道柯潔會(huì)輸。畢竟，我們都領(lǐng)教過(guò)AlphaGo的進(jìn)化速度：

2015年10月，第一代AlphaGo以5∶0第一次擊敗歐洲冠軍樊麾;

2016年3月，第二代AlphaGo以4∶1擊敗李世石，過(guò)去10年里最偉大的人類圍棋手。

從樊麾到李世石，對(duì)人類可能是一輩子都無(wú)法跨越的鴻溝，而AlphaGo只花了5個(gè)月時(shí)間。

AlphaGo進(jìn)化史

第一代，是擊敗樊麾的AlphaGo Fan。與Zen/Crazy Stone等之前的圍棋軟件相比，棋力要高出4子。

第二代，是擊敗李世石的AlphaGo Lee。與上一代相比，棋力高出3子。

第三代，是柯潔如今的對(duì)手，也是年初60連勝的：AlphaGo Master。相比于擊敗李世石的版本，棋力又再次提升3子。

在李世石之后，AlphaGo又經(jīng)歷了一輪新的進(jìn)化：

DeepMind修補(bǔ)了當(dāng)時(shí)與李世石決戰(zhàn)時(shí)系統(tǒng)暴露的漏洞。整個(gè)系統(tǒng)架構(gòu)經(jīng)過(guò)了重新設(shè)計(jì)，神經(jīng)網(wǎng)絡(luò)從原來(lái)的12層增加到40層，而且，不再借助人類棋譜，而是完全通過(guò)機(jī)器的自我對(duì)弈來(lái)訓(xùn)練——通過(guò)這種自我對(duì)弈產(chǎn)生高質(zhì)量的數(shù)據(jù)，這意味著它正在按照它的創(chuàng)造者德米斯·哈薩比斯最初制定的目標(biāo)演化——一個(gè)能夠自主學(xué)習(xí)、自我適應(yīng)的智能體。

經(jīng)過(guò)一年的算法結(jié)構(gòu)優(yōu)化，從李世石版的50個(gè)TPU（谷歌專門(mén)為機(jī)器學(xué)習(xí)而設(shè)計(jì)的處理器）并行式運(yùn)算，變成由4個(gè)TPU組成“單機(jī)版”，運(yùn)算量降低了90%。AlphaGo的訓(xùn)練時(shí)間不再以月計(jì)算，而是以周計(jì)算。

AlphaGo Lee

運(yùn)行于谷歌云，耗用50個(gè)TPU進(jìn)行計(jì)算

每次搜索計(jì)算后續(xù)50步，計(jì)算速度為10000個(gè)位置/秒

2016年在首爾擊敗李世石

AlphaGo Master

運(yùn)行于谷歌云，但只用一個(gè)TPU機(jī)器

自學(xué)成才，AlphaGo自我對(duì)弈提高棋力

擁有更強(qiáng)大的策略/價(jià)值網(wǎng)絡(luò)

5月23日，中國(guó)棋手柯潔（左）對(duì)戰(zhàn)AlphaGo首局比賽在浙江烏鎮(zhèn)舉行，AlphaGo執(zhí)白1/4子獲勝

從某種角度來(lái)說(shuō)，我們已經(jīng)見(jiàn)識(shí)了新版的AlphaGo有多強(qiáng)大——2017新年，AlphaGo再次以“Master”的網(wǎng)名在各大圍棋對(duì)弈網(wǎng)站連勝60場(chǎng)，擊敗了當(dāng)世幾乎所有的頂尖高手。

柯潔與AlphaGo的第一局賽后，DeepMind的首席科學(xué)家大衛(wèi)·席爾瓦（David Silver）透露AlphaGo Master可以讓李世石版本的AlphaGo 3個(gè)子，立刻引來(lái)全場(chǎng)嘩然。午餐的時(shí)候，我剛好坐在一桌棋手邊上，所有人都在談?wù)?子，全是一副下巴掉下來(lái)的表情。

這個(gè)差距有多大呢？

用柯潔的話說(shuō)，“簡(jiǎn)單地解釋一下就是，一人一手輪流下的圍棋，對(duì)手連續(xù)讓你下三步……又像武林高手對(duì)決讓你先捅三刀一樣……”

后來(lái)，大衛(wèi)·席爾瓦特意向所有媒體寫(xiě)信做了更正：“新版本的AlphaGo，已經(jīng)過(guò)幾百萬(wàn)次的自我訓(xùn)練，并在檢測(cè)舊版本弱點(diǎn)方面表現(xiàn)出色。也因此，新版本的AlphaGo可以讓舊的版本3子。但當(dāng)AlphaGo與從未對(duì)弈過(guò)的人類棋手對(duì)局時(shí)，這樣的優(yōu)勢(shì)就不復(fù)存在了，尤其是柯潔這樣的圍棋大師，他可能幫助我們發(fā)現(xiàn)AlphagGo未曾展露的新弱點(diǎn)。這樣的衡量標(biāo)準(zhǔn)是無(wú)法比較的。”

盡管如此，我們還是疑惑，為什么還有必要再進(jìn)行一次人機(jī)大戰(zhàn)？

是谷歌重回中國(guó)市場(chǎng)的一次外交嘗試，還是相信DeepMind的官方解釋，“這是因?yàn)楸M管已經(jīng)連戰(zhàn)連捷，AlphaGo仍然有繼續(xù)探索的空間。我們?nèi)匀幌朐趪孱I(lǐng)域繼續(xù)追問(wèn)：我們離最優(yōu)解還有多遠(yuǎn)？怎樣才是完美棋局？人類3000年的對(duì)弈沒(méi)有找到最佳下法，AlphaGo可以與人類棋手共同探尋這些奧秘”。

去年的那場(chǎng)人機(jī)大戰(zhàn)，AlphaGo對(duì)戰(zhàn)李世石，用李世石自己的話說(shuō)，第一局震驚，第二局無(wú)語(yǔ)，第三局深感無(wú)力，第四局力挽狂瀾、贏回一局，到第五局再度落敗時(shí)，深深嘆息人類創(chuàng)造力的局限性。

這次柯潔與AlphaGo Master的比賽，到本文發(fā)稿之前為止，已經(jīng)輸了兩場(chǎng)。但去年那種悲情的氣氛已經(jīng)消失了，取而代之的，是對(duì)于一種異類智能的好奇、敬畏，甚至拜服。

在比賽現(xiàn)場(chǎng)，不少九段棋手追著DeepMind的工程師，想要觀摩AlphaGo的后臺(tái)數(shù)據(jù)——AlphaGo每走一步對(duì)雙方的勝負(fù)概率都有預(yù)估。他們急于知道，機(jī)器到底是怎么評(píng)價(jià)人類的表現(xiàn)的。

不止一位九段棋手表示，很愿意被讓2子，甚至3子，與AlphaGo Master對(duì)弈，以了解對(duì)方的真實(shí)水平。

每一個(gè)頂尖棋手都在苦心鉆研年初AlphaGo Master掃蕩棋壇后留下的60張棋譜。作為棋手，他們不得不承認(rèn)，AlphaGo對(duì)圍棋是有它自己的“理解”的，而且這種理解的強(qiáng)大與精妙之處，遠(yuǎn)遠(yuǎn)超出了人類的想象。

“很多棋，我們理解不了，我們理解不了的時(shí)候就說(shuō)我喜歡這樣，我個(gè)性如此……”在第一局賽事后的間歇，著名的九段棋手江鑄久這樣告訴我，“比如，如果不是AlphaGo，我們不會(huì)理解吳清源有多好。AlphaGo的招式是從16萬(wàn)張人類棋譜里選出來(lái)的，選出來(lái)很多是吳清源的招式?！?

他再次談起AlphaGo與李世石的第二局比賽中的第37手。“有人認(rèn)為不夠好，有人表示看不懂，當(dāng)時(shí)我一看，就覺(jué)得熱淚盈眶，我想，莫非是吳老師回來(lái)了？”

“只有吳清源才會(huì)這么下棋?！?h3>AlphaGo可以走多遠(yuǎn)？

從某種角度來(lái)說(shuō)，是歷史選定了這些圍棋手，作為第一批與“機(jī)器智能”正面交鋒的人類，領(lǐng)悟這種智能的強(qiáng)大與奇妙，詭譎與怪異，并被迫重新評(píng)估自身的角色、信仰、目標(biāo)、身份。

作為一名觀戰(zhàn)者，這次人機(jī)大戰(zhàn)對(duì)我最大的觸動(dòng)之一，就是這些頂級(jí)的棋手對(duì)于AlphaGo沒(méi)有絲毫輕慢之心。連曾經(jīng)那么年少輕狂的柯潔，也在第二局戰(zhàn)敗之后這樣感慨：“在AlphaGo沒(méi)出現(xiàn)之前，我可能對(duì)棋的了解有50%。AlphaGo出現(xiàn)之后，我對(duì)人生看法都有巨大改變，未來(lái)不是我等凡夫俗子可以預(yù)測(cè)的。如果對(duì)圍棋規(guī)則了解就算知道1%，我可能只能算是知道2%?！?/p>

是的，未來(lái)不是我們這些凡夫俗子所能預(yù)測(cè)。這場(chǎng)人機(jī)大戰(zhàn)真正的懸念也許在于AlphaGo的未來(lái)。它還可以走多遠(yuǎn)？它還可以變得多強(qiáng)大？如果一個(gè)科技公司能在兩三年的時(shí)間內(nèi)把一個(gè)機(jī)器訓(xùn)練成圍棋大師，是否也可以把更多的機(jī)器訓(xùn)練成一個(gè)律師、一個(gè)醫(yī)生、一個(gè)程序員，甚至一個(gè)作家、一個(gè)藝術(shù)家？對(duì)于人類而言，這到底是福是禍？

事實(shí)上，AlphaGo的腳步并不止于圍棋。哈薩比斯曾經(jīng)說(shuō)過(guò)，他創(chuàng)辦DeepMind真正的目的是攻克人類的“智力”難題。他認(rèn)為，學(xué)習(xí)和通用（general）是人類智力最根本的特征。他想發(fā)明一種“通用人工智能”（General AI）——不是自上而下，一點(diǎn)點(diǎn)教機(jī)器規(guī)則，讓它從規(guī)則中理解語(yǔ)言、識(shí)別人臉;而是自下而上，讓機(jī)器像人類一樣，從觀察、經(jīng)驗(yàn)中學(xué)習(xí)，像人類一樣根據(jù)環(huán)境的變化做出靈活的決策，像人類一樣舉一反三，執(zhí)行各種不同的任務(wù)。

機(jī)器學(xué)習(xí)真的能實(shí)現(xiàn)這樣的智能嗎？

2015年，美國(guó)麻省理工學(xué)院一次關(guān)于人工智能的研討會(huì)上，有人問(wèn)喬姆斯基怎么看機(jī)器學(xué)習(xí)，他的反應(yīng)是嗤之以鼻，認(rèn)為不過(guò)是數(shù)據(jù)預(yù)測(cè)，一場(chǎng)華麗的天氣預(yù)報(bào)而已。即使神經(jīng)網(wǎng)絡(luò)的翻譯獲得了某種完美的功能性，它仍然無(wú)法揭示語(yǔ)言的本質(zhì)。機(jī)器也許能比人類醫(yī)生更好地檢測(cè)腫瘤，但機(jī)器永遠(yuǎn)不會(huì)告訴你是什么引發(fā)了腫瘤。

但谷歌一向是典型的工程師思維。對(duì)他們來(lái)說(shuō)，人工智能更重要的不是關(guān)于理解心智的本質(zhì)，而是關(guān)于制造工具、解決現(xiàn)實(shí)的問(wèn)題。

事實(shí)上，根據(jù)谷歌在“人工智能的未來(lái)”論壇上（與此次人機(jī)大戰(zhàn)同期舉行）發(fā)布的數(shù)據(jù)，他們的機(jī)器學(xué)習(xí)模型診斷眼疾的準(zhǔn)確率，甚至高于一些通過(guò)美國(guó)認(rèn)證委員會(huì)認(rèn)證的眼科醫(yī)生。這些模型還能比放射科醫(yī)生更快地在醫(yī)學(xué)影像中找到腫瘤，甚至根據(jù)病理報(bào)告的文本做出診斷。

在這次論壇上，哈薩比斯還透露，AlphaGo的算法已經(jīng)被應(yīng)用于谷歌數(shù)據(jù)中心的節(jié)電項(xiàng)目，并成功節(jié)能40%。至于它的未來(lái)，可以在材料、醫(yī)療、智能手機(jī)和教育等各種領(lǐng)域。

“癌癥、氣候變遷、能源、基因組學(xué)、宏觀經(jīng)濟(jì)學(xué)、金融系統(tǒng)、物理學(xué)等，太多我們想掌握的系統(tǒng)知識(shí)正變得極其復(fù)雜。如此巨大的信息量讓最聰明的人窮其一生也無(wú)法完全掌握。那么，我們?nèi)绾尾拍軓娜绱她嫶蟮臄?shù)據(jù)量中篩選出正確的見(jiàn)解呢？而一種通用人工智能思維的方式則是自動(dòng)將非結(jié)構(gòu)化信息轉(zhuǎn)換為可使用知識(shí)的過(guò)程。我們所研究的東西可能是針對(duì)任何問(wèn)題的元解決方法（meta-solution）?！?/p>

“神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的爆發(fā)是我此生所經(jīng)歷過(guò)的最大變革?！鼻皝?lái)參加人機(jī)大戰(zhàn)的谷歌董事長(zhǎng)埃里克·施密特（Eric Schmidt）在賽后的一次對(duì)談中這樣表示。

“在谷歌內(nèi)部，人工智能不只是研發(fā)人員的事情，而是貫穿整個(gè)公司的戰(zhàn)略和技術(shù)。無(wú)論硬件領(lǐng)域、產(chǎn)品組、服務(wù)組等，都在AI的連接下交叉配合，比如谷歌翻譯、谷歌照片、谷歌醫(yī)療、無(wú)人車等產(chǎn)品和項(xiàng)目，背后都有人工智能貫穿其間?！?/p>

與去年一樣，在激烈的比賽間隙，杰夫·迪恩（Jeff Dean），谷歌工程師的精神領(lǐng)袖，也是谷歌大腦的負(fù)責(zé)人于百忙之中介紹了谷歌大腦在過(guò)去一年的技術(shù)進(jìn)展。從項(xiàng)目上看與去年韓國(guó)首爾所見(jiàn)似乎沒(méi)有什么大的區(qū)別，但技術(shù)進(jìn)展的加速度卻令人震驚。以圖片識(shí)別為例，2011年，機(jī)器的圖像識(shí)別錯(cuò)誤率為26%，到2016年已經(jīng)降低到了3%，比人類的識(shí)別錯(cuò)誤率（5%）還要低。

在媒體上引發(fā)最大轟動(dòng)的，是在過(guò)去9個(gè)月的時(shí)間里，谷歌徹底拆除了原先的翻譯系統(tǒng)，引入神經(jīng)網(wǎng)絡(luò)，大幅提高了翻譯的準(zhǔn)確率，其中一些語(yǔ)言的準(zhǔn)確率甚至提高了85%。隨之發(fā)布的多語(yǔ)言互譯系統(tǒng)，將兩種語(yǔ)言的翻譯學(xué)習(xí)“遷移”到更多的語(yǔ)種，比如通過(guò)中英互譯的學(xué)習(xí)，就能直接把模型算法遷移到中日、日英等多語(yǔ)種互譯方面。如杰夫·迪恩所說(shuō)，機(jī)器“學(xué)習(xí)如何學(xué)習(xí)”，將是谷歌未來(lái)最重要的研究方向。

舊翻譯系統(tǒng)：基于短語(yǔ)的翻譯，先把句子分成一個(gè)個(gè)短語(yǔ)和單詞，然后獨(dú)立翻譯，最后對(duì)翻譯出來(lái)的獨(dú)立短語(yǔ)解釋進(jìn)行邏輯整理，變成句子

新翻譯系統(tǒng)：神經(jīng)機(jī)器翻譯，將整個(gè)句子視作翻譯單元，對(duì)句子中的每一部分進(jìn)行帶有邏輯的關(guān)聯(lián)翻譯，翻譯每一個(gè)字或單詞時(shí)都包含著整句話的邏輯

關(guān)于人工智能，我們應(yīng)該警惕的危機(jī)

當(dāng)我們想象人工智能未來(lái)的時(shí)候，總是想著庫(kù)茲韋爾那些關(guān)于“奇點(diǎn)”的古怪預(yù)言，比如不久的將來(lái)，我們會(huì)制造出比我們更聰明的機(jī)器，它們?cè)僭斐霰人鼈冏约焊斆鞯臋C(jī)器，如此這般，整個(gè)世界朝著我們無(wú)法預(yù)計(jì)的巨型超智能的方向狂奔;再比如，我們很快就能將人的思維載入計(jì)算機(jī)中，在計(jì)算機(jī)的電路里獲得超強(qiáng)的智力，甚至永生。2014年的反烏托邦電影《超驗(yàn)駭客》中就有一個(gè)情節(jié)受此啟發(fā)，其中有個(gè)類似庫(kù)茲韋爾的科學(xué)家，他的思維被人載入網(wǎng)絡(luò)，給人類帶來(lái)了毀滅性的后果。

去年，尤瓦爾·赫拉利來(lái)中國(guó)宣傳他的《人類簡(jiǎn)史》時(shí)，我有機(jī)會(huì)采訪到他。他談到當(dāng)今世界最重要的變化，就在于“權(quán)力和權(quán)威正在從人類轉(zhuǎn)移到人工智能、到算法等，而人類卻毫無(wú)知覺(jué)”。

是的，今天的人工智能與人類智能還有著本質(zhì)的差異——它不具備情感、不具備欲望，所以，它不會(huì)有統(tǒng)治世界、奴役人類的興趣與野心。但無(wú)人駕駛汽車不需要任何欲望或情感就能代替司機(jī)，因?yàn)榘凑宅F(xiàn)實(shí)世界經(jīng)濟(jì)系統(tǒng)的設(shè)定，司機(jī)的工作就是把人/物從a送到b，廉價(jià)、迅速即可。如果在這方面機(jī)器做得更出色，經(jīng)濟(jì)系統(tǒng)就會(huì)更傾向于機(jī)器，而不是有欲望、有情感的人，于是人就變成了多余。

關(guān)于人工智能，我們應(yīng)該警惕的危機(jī)，不是“奇點(diǎn)”，不是超級(jí)智能，不是人機(jī)大戰(zhàn)，而是當(dāng)下這些因?yàn)榫邆淞嗽絹?lái)越強(qiáng)的學(xué)習(xí)能力而變得越來(lái)越聰明的平凡機(jī)器。

當(dāng)然，從機(jī)器學(xué)習(xí)到機(jī)器理解，人工智能還有很遠(yuǎn)的路要走，就像一位人類學(xué)家告訴我的，“相信奇點(diǎn)，就像重新相信上帝一樣”。但是，作為人類，我們對(duì)于這些“聰明”的機(jī)器的信任已經(jīng)超過(guò)了自己，而近乎相信上帝了。

本來(lái)，上帝死后，人是一切世界意義和權(quán)威的來(lái)源，而人的感情、人的感覺(jué)、人的自由選擇是所有問(wèn)題最終的答案。但現(xiàn)在，我們正不假思索地將控制權(quán)讓渡到那些距離真正的“思考”“理解”還很遙遠(yuǎn)的機(jī)器手中，甚至將整個(gè)文明置入自動(dòng)化的快車道。最吊詭的是，在整個(gè)權(quán)力/權(quán)威的交接過(guò)程中，每一步都顯得如此的理所當(dāng)然，令人無(wú)可拒絕。

今天，再?zèng)]有人用自己的頭腦來(lái)做加減運(yùn)算，因?yàn)橛?jì)算器要快速準(zhǔn)確得多。我們信任百度地圖，遠(yuǎn)遠(yuǎn)勝過(guò)自己的方向感。學(xué)習(xí)一門(mén)新的語(yǔ)言聽(tīng)起來(lái)是一件性價(jià)比越來(lái)越低的事情，因?yàn)楣雀璧姆g越來(lái)越強(qiáng)大了。

我們依賴機(jī)器告訴我們，哪些信息更重要、更有用、更值得關(guān)注;我們依賴機(jī)器告訴我們，應(yīng)該看什么電影、讀什么書(shū)、聽(tīng)什么歌，甚至選擇什么樣的伴侶;更深入一點(diǎn)，當(dāng)面對(duì)一個(gè)生死攸關(guān)的醫(yī)療選擇時(shí)，你覺(jué)得你會(huì)相信自己、相信醫(yī)生，還是相信機(jī)器？當(dāng)年安吉麗娜·朱莉切除兩側(cè)乳房，不是因?yàn)樗约旱纳眢w出現(xiàn)問(wèn)題，也不是出于醫(yī)生的診斷，而是機(jī)器告訴她，她所攜帶的一種突變基因，意味著她有7%的可能性將來(lái)會(huì)患上乳腺癌。所以，很有可能，在我們此后一生當(dāng)中，關(guān)于我們的身體，那些性命攸關(guān)的醫(yī)學(xué)決定，都將不再取決于你自己的感覺(jué)，甚至醫(yī)生的意見(jiàn)，而是會(huì)由計(jì)算機(jī)、電子算法和巨大的數(shù)據(jù)庫(kù)來(lái)決定。

“工作，本來(lái)應(yīng)該由人來(lái)完成的，現(xiàn)在越來(lái)越多地由機(jī)器來(lái)完成。決定，本來(lái)應(yīng)該由人憑借感覺(jué)與理性做出的，現(xiàn)在越來(lái)越多地由算法來(lái)做出。而且，每一步都讓你覺(jué)得無(wú)法拒絕?！焙绽f(shuō)，“在此過(guò)程中，人漸漸變得無(wú)用、多余。這是為什么你知道世界正在發(fā)生非常嚴(yán)重的變化?！?