99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

?

AlphaGO 背后的人工智能，能教會(huì)我們?nèi)祟愂裁?/h1>
2016-09-02 13:48:24凱德梅茨CadeMetz王賽錦

國外社會(huì)科學(xué)前沿 2016年8期
關(guān)鍵詞：哈薩席爾瓦李世石

凱德·梅茨（Cade Metz）王賽錦/譯
AlphaGO 背后的人工智能，能教會(huì)我們?nèi)祟愂裁?/p>
凱德·梅茨（Cade Metz）
王賽錦/譯
選自美國《連線》雜志2016年6月號(hào)
日裔美國人黃士杰（Aja Huang）把手伸到一個(gè)木碗里，碗里滿是圓滑的黑色棋子，他瞧也沒瞧一眼，就用中指和食指夾出一個(gè)。目光透過金屬絲眼鏡死死地盯著棋盤，他把手里的棋子放在棋盤上一個(gè)幾乎空白的區(qū)域，在一枚孤零零的白色棋子左下方。在圍棋里，這被稱為“肩沖”（shoulder hit），即從遠(yuǎn)離大部分對(duì)弈區(qū)域的側(cè)邊進(jìn)行攻擊。
桌子對(duì)面的李世石（Lee Sedol），這個(gè)圍棋界過去十年里最優(yōu)秀的選手，僵住了。他看了看棋盤上鋪開的37枚棋子，起身默默離開。
在離對(duì)弈場(chǎng)50英尺的評(píng)論室里，邁克爾·雷德蒙（Michael Redmond）通過閉路電視注視著比賽。雷蒙德是西方世界里圍棋唯一達(dá)到九段的選手，九段是圍棋的最高級(jí)別。他和李世石一樣震驚?！拔也恢肋@一步走得好還是不好。”雷蒙德對(duì)近200萬的在線觀眾說道。
“我覺得那是步錯(cuò)棋?！绷硗庖粋€(gè)英語評(píng)論員克里斯·加洛克（Chris Garlock）說道，他是美國圍棋協(xié)會(huì)聯(lián)絡(luò)副主席。
幾分鐘以后，李世石重又走回對(duì)弈室。他坐下了，但是并沒碰碗里的白色棋子。一分鐘過去了，兩分鐘過去了……15分鐘過去了，而棋手對(duì)弈一局的基本時(shí)限是兩個(gè)小時(shí)，這就占去了不少時(shí)間。最后，李世石拿出一枚棋子，就放在黃士杰剛落的那枚黑棋的正上方。
黃士杰的那一步是整局棋的第37步，李世石始終未能挽回局面。4小時(shí)20分過去了，李世石選擇認(rèn)輸。
但是黃士杰并非這場(chǎng)圍棋游戲的真正贏家。他只是遵照指令行事，位于他左側(cè)的一臺(tái)平板顯示器與控制室相連，控制室位于附近的首爾四季酒店，同時(shí)還與分布在世界各地的谷歌數(shù)據(jù)中心的成百上千臺(tái)電腦相連。在這個(gè)或許是人類有史以來設(shè)計(jì)的最復(fù)雜的游戲里，它擊敗了世界上最厲害的選手之一。
在同一個(gè)房間，另外一位圍棋專家也在觀戰(zhàn)，他就是三屆歐洲圍棋冠軍樊麾（Fan Hui）。一開始，第37步棋也令他迷惑。但他與AlphaGo對(duì)弈過。與其他人相比，他還兼具AlphaGo的陪練身份。5個(gè)月中，樊麾與機(jī)器下了數(shù)百局，目的是為了讓它的創(chuàng)造者知道問題所在。樊麾經(jīng)常輸給機(jī)器，但是他也漸漸了解了AlphaGo，比其他任何人都了解得多。樊麾認(rèn)為，那個(gè)“肩沖”不像是人類會(huì)走的一步棋。但是想了10秒鐘之后，他明白了?！捌粒彼f道，“太漂亮了！”
在這種五局三勝制里，現(xiàn)在AlphaGo以二比零的優(yōu)勢(shì)領(lǐng)先李世石，甚至是整個(gè)人類。第37步說明，AlphaGo并不只是重復(fù)多年來的編程，或者是通過暴力預(yù)測(cè)算法來機(jī)械地落子。在那一刻，AlphaGo證實(shí)了，它有理解的能力，或至少是有別于真實(shí)事物的模仿理解力。在李世石眼中，AlphaGo展示了圍棋選手所言的“直覺”，也就是它能以類人的方式，甚至是超越人類的方式進(jìn)行一場(chǎng)漂亮的對(duì)弈。
但是不要為李世石的失敗，或人類的失敗掩面哭泣。李世石并非殉道者，第37步棋也不是機(jī)器超越人類的標(biāo)志。恰恰相反：第37步標(biāo)志著機(jī)器與人類共同進(jìn)步的開始。
大衛(wèi)·席爾瓦（David Silver）領(lǐng)導(dǎo)的團(tuán)隊(duì)創(chuàng)造了AlphaGo
當(dāng)大衛(wèi)·席爾瓦還是一名來自英格蘭東海岸城市薩?？耍⊿uffolk）的15歲國際象棋錦標(biāo)賽選手時(shí)，戴密斯·哈薩比斯（Demis Hassabis）已經(jīng)是一名戰(zhàn)無不勝的國際象棋神童了。哈薩比斯是個(gè)不折不扣的神童，他媽媽是中國和新加坡混血，爸爸是希臘和塞浦路斯混血，他們一家人都住在倫敦。他曾是世界上14歲以下棋手中段位排名第二的選手。他常常通過參加一些地方賽事來保持自己思維的靈活性，也順道掙些外快。“我知道戴密斯時(shí)他還不知道我，”AlphaGo團(tuán)隊(duì)的領(lǐng)導(dǎo)者席爾瓦說道，“我曾經(jīng)見到他出現(xiàn)在我們鎮(zhèn)子上，贏了比賽，然后離開了。”
到劍橋讀本科時(shí)，他們才正式見了面，二人都學(xué)習(xí)計(jì)算神經(jīng)科學(xué)，為的是理解人類思維，以便有一天也賦予機(jī)器一點(diǎn)兒智力，像人一樣。但是兩人真正深入交往卻是出于游戲，包括棋牌游戲和計(jì)算機(jī)游戲。
1998年，二人畢業(yè)之后很自然地開創(chuàng)了一家電子游戲公司。哈薩比斯經(jīng)常和一名同事下圍棋。席爾瓦被哈薩比斯的游戲興趣所鼓動(dòng)，也開始自己學(xué)習(xí)?！叭绻隳茉谌魏畏矫鎽?zhàn)勝戴密斯的話，這幾乎就像是一種榮譽(yù)，”席爾瓦說道，“而且我知道，戴密斯對(duì)這個(gè)游戲的興趣才剛剛興起?！?/p>
他們加入到了一個(gè)當(dāng)?shù)氐膰寰銟凡?，和二段三段選手對(duì)弈（相當(dāng)于空手道黑帶）。他們的野心還不止于此：他們?nèi)滩蛔〉厮伎?，為何機(jī)器從未破解這種智力游戲呢？1995年，一個(gè)名為“奇努克”（Chinook）的跳棋計(jì)算機(jī)程序打敗了世界上最優(yōu)秀的跳棋選手。兩年以后，國際商用機(jī)器公司（IBM）的“深藍(lán)”（Deep Blue）超級(jí)計(jì)算機(jī)打敗了世界象棋冠軍加利·卡斯帕羅夫（Garry Kasparov）。次年，機(jī)器還在Scrabble（一種拼字游戲——譯注）、Othello，甚至電視問答游戲節(jié)目《危險(xiǎn)邊緣》（Jeeopardy）中獲勝！用博弈論的術(shù)語來說，圍棋與國際象棋和西洋跳棋一樣，是一種完全信息博弈游戲——毫無運(yùn)氣可言，信息完全公開。通常來說，電腦應(yīng)該能輕松掌握，但是就是攻克不下圍棋。
圍棋看上去很簡單。源起于3000年前的中國，兩名棋手在19×19的棋盤上對(duì)弈。棋手交替將黑白棋子放置于棋盤直線的交叉點(diǎn)上，努力包圍對(duì)方的棋子，或者將對(duì)方的棋子隔開，避免被包圍。人們把象棋喻為戰(zhàn)場(chǎng)，但是把它比作單個(gè)的戰(zhàn)場(chǎng)更形象。圍棋則是整體作戰(zhàn)，或地緣作戰(zhàn)。棋盤上一個(gè)角落里的變動(dòng)會(huì)影響全局。局勢(shì)變幻莫測(cè)，勢(shì)力此消彼長。在象棋游戲中，棋手在一輪中一般有35種下法可選，但在圍棋中，卻可達(dá)200種。正常對(duì)弈下來，復(fù)雜程度不可同日而語。正如哈薩比斯和席爾瓦所言，圍棋棋盤上可能出現(xiàn)的情況比整個(gè)宇宙中的原子數(shù)量還要多。
所以，與國際象棋不同，圍棋棋手——不論是人類還是機(jī)器——都看不透每一步落子會(huì)帶來的最終結(jié)果。頂級(jí)騎手靠的是直覺，而非單純的計(jì)算?！傲己玫牟季挚雌饋砭秃苊?，”哈薩比斯說道，“它遵循一定的美學(xué)。這就是幾千年來圍棋一直令人著迷的原因?！?/p>
2005年，哈薩比斯和席爾瓦的游戲公司倒閉了，兩人也分道揚(yáng)鑣。在阿爾伯塔大學(xué)（University of Alberta），席瓦爾學(xué)習(xí)了人工智能的初級(jí)形式，也就是增強(qiáng)學(xué)習(xí)，機(jī)器通過不斷地執(zhí)行任務(wù)、追蹤帶來最大利益的決策，從而達(dá)到自我學(xué)習(xí)。哈薩比斯進(jìn)了英國倫敦大學(xué)學(xué)院（Unviversity College London），獲得了認(rèn)知神經(jīng)科學(xué)的博士學(xué)位。
2010年，他們重新找到對(duì)方。哈薩比斯成立了倫敦DeepMind人工智能公司；席爾瓦加入了他。他們雄心勃勃，想要?jiǎng)?chuàng)造真正能夠思考的通用人工智能。但他們必須找到一個(gè)出發(fā)點(diǎn)。
他們理所當(dāng)然地把游戲作為出發(fā)點(diǎn)。這的確是對(duì)人工智能的一個(gè)很好的測(cè)試。從定義上說，游戲是有限制的。這和實(shí)際生活不同，而更像是裝在瓶子里的小型宇宙，你能客觀地批判成敗輸贏。DeepMind將增強(qiáng)學(xué)習(xí)和深度學(xué)習(xí)結(jié)合起來，從龐大的數(shù)據(jù)集中尋找規(guī)律。為了驗(yàn)證這種方式的可行性，研究者們教授他們剛剛成形的人工智能玩“太空侵略者”（Space Invaders）和“打磚塊”（Breakout）。
它在“打磚塊”上成績斐然。這個(gè)游戲基本上和“乒乓”（Pong）差不多，不過不是和對(duì)手來回?fù)舸蛞粋€(gè)像素小球，而是用像素小球擊打彩色磚塊。打中一個(gè)塊磚，磚塊便會(huì)消失；沒接中球或者把球打到了屏幕外就算輸。玩了500局游戲之后，DeepMind的系統(tǒng)學(xué)會(huì)了將球以一定的角度打到磚塊后面去，從而保證小球一直在墻后擊打磚塊。這是一個(gè)經(jīng)典的“打磚塊”打法，但是DeepMind的電腦每次都能精準(zhǔn)地使用這一方法，其速度更是無人能及。
為了尋找投資人，哈薩比斯在一次晚宴上瞄準(zhǔn)了著名的貝寶（PayPal）共同創(chuàng)建人和臉譜網(wǎng)（Facebook）投資者彼得·蒂爾（Peter Thiel）。哈薩比斯只有幾分鐘的時(shí)間，他知道蒂爾熱衷于國際象棋，就壯著膽子說國際象棋之所以流傳這么久，是因?yàn)橄蠛婉R的優(yōu)劣勢(shì)之間充滿了創(chuàng)意的博弈。蒂爾提出要哈薩比斯第二天和他正式比一場(chǎng)。
一旦一位硅谷（Silicon Valley）億萬富翁聽說了你，其他富翁就也知道了。通過蒂爾，哈薩比斯結(jié)識(shí)了伊隆·馬斯克（Elon Musk），馬斯克又向谷歌首席執(zhí)行官拉里·佩奇（Larry Page）介紹了DeepMind。谷歌很快就以6.5億美元（據(jù)報(bào)道）的價(jià)格購買了這個(gè)公司。
加入谷歌這個(gè)搜索引擎巨頭之后，哈薩比斯在一次會(huì)議上用雅達(dá)利游戲機(jī)（Atari）做了展示，谷歌聯(lián)合創(chuàng)始人謝爾蓋·布林（Sergey Brin）也參加了此次會(huì)議。二人發(fā)現(xiàn)他們有著相同的愛好。在斯坦福攻讀碩士學(xué)位時(shí)，布林便沉迷于圍棋，佩奇甚至因此擔(dān)心谷歌能不能建立。
所以，當(dāng)布林見到哈薩比斯之時(shí)，他們就聊了游戲?！澳阒绬?，DeepMind或許幾年之后能打敗世界圍棋冠軍，”哈薩比斯告訴布林，“如果我們真的認(rèn)真去做的話。”
“我覺得不可能。”布林答道。
哈薩比斯就等這句話。如他們所言，游戲已經(jīng)開始。
第二局棋結(jié)束之后，席爾瓦進(jìn)入AlphaGo的控制室，就位于走廊盡頭。AlphaGo的大腦不在此處，也不在其他地方，而是存在于全球成百上千臺(tái)電腦之中。面對(duì)這些顯示器，席爾瓦能窺探AlphaGo的思想，監(jiān)控其運(yùn)行，跟蹤它對(duì)每場(chǎng)對(duì)弈解決的預(yù)測(cè)有何變化。
輕敲幾下鍵盤，席爾瓦輕松地調(diào)出了AlphaGo在游戲中的決策記錄。他主要關(guān)注第37步之前到底發(fā)生了什么。
在DeepMind和AlphaGo出現(xiàn)之前，人工智能的研究者就嘗試著用機(jī)器破解圍棋，在游戲進(jìn)行過程中，他們令機(jī)器用一種系統(tǒng)方式預(yù)測(cè)每一步可能產(chǎn)生的結(jié)果，試圖以野蠻的計(jì)算機(jī)力量解決問題。1997年IBM的“深藍(lán)”擊敗卡斯帕羅夫時(shí)就差不多是這樣的。我當(dāng)時(shí)是PC Magazine（美國著名的IT雜志——譯注）的見習(xí)記者，報(bào)道了那次事件。和李世石對(duì)戰(zhàn)AlphaGo一樣，人們都認(rèn)為這是人工智能發(fā)展的標(biāo)志性事件。奇怪的是，正如李世石和AlphaGo的第二局比賽，“深藍(lán)”在和卡斯帕羅夫?qū)?zhàn)的第二局中也走了一步人類不可能走的棋。兩人都同樣困惑，但是卡斯帕羅夫迫于壓力立刻就認(rèn)輸了，而李世石則堅(jiān)持戰(zhàn)斗。
暴力計(jì)算從未攻克圍棋。圍棋的可能性太多，即使是電腦也難以處理。席爾瓦的團(tuán)隊(duì)另辟蹊徑，建造了一個(gè)能學(xué)會(huì)很好地下棋的機(jī)器，然后再讓它比賽。
在倫敦國王十字車站附近的DeepMind辦公室中，這支團(tuán)隊(duì)將3000萬步人類的圍棋步法輸入到一個(gè)深度神經(jīng)網(wǎng)絡(luò)中，這個(gè)網(wǎng)絡(luò)中的硬件和軟件松散地模仿人類大腦中的神經(jīng)元。神經(jīng)網(wǎng)絡(luò)其實(shí)很普通，臉譜網(wǎng)用它們進(jìn)行照片中的人臉識(shí)別，谷歌用它們識(shí)別安卓智能手機(jī)中的語音指令。如果你把足夠多你媽媽的照片放到神經(jīng)網(wǎng)絡(luò)里，那么它們便能學(xué)會(huì)識(shí)別她。輸入足夠多的言語，他們也能學(xué)會(huì)如何識(shí)別你的話語。將3000萬步圍棋步法整合其中，它們也能學(xué)會(huì)怎么下圍棋。
但是了解規(guī)則和成為棋王并不是一回事兒。第37步并不在這3000萬步之中。那么，AlphaGo是怎么學(xué)會(huì)這一步的呢？
AlphaGo知道——就它所“知道”的東西——那一步是個(gè)險(xiǎn)招?！八缹I(yè)人士不會(huì)走那一步，但是，在它逐漸加深的搜索中，能推翻最初的指導(dǎo)?！毕癄柾哒f。AlphaGo從某種程度上說，已經(jīng)能自己思考了。它并非根據(jù)其創(chuàng)造者編碼的一系列規(guī)則，而是它自學(xué)的算法。“這真的是它在不斷反思和分析的過程中自己發(fā)現(xiàn)的?！?/p>
實(shí)際上，這臺(tái)機(jī)器已經(jīng)算出來專業(yè)人類選手走同樣一步的概率為1/10000。不管怎樣，AlphaGo那么做了。
它從人類的招數(shù)中學(xué)會(huì)這個(gè)游戲之后，席爾瓦就讓這臺(tái)機(jī)器和它自己對(duì)弈。讓它和一個(gè)與自己神經(jīng)網(wǎng)絡(luò)（稍）有不同的版本一局一局地下。在對(duì)弈的過程中，它會(huì)追蹤每一步所能產(chǎn)生的最大效益，也就是在棋盤上占領(lǐng)地盤——這正是席爾瓦在研究生期間學(xué)習(xí)到的增強(qiáng)學(xué)習(xí)技巧。AlphaGo開始開發(fā)出一套屬于它自己的非人類指令系統(tǒng)。
但是這還只是一部分。緊接著，席爾瓦團(tuán)隊(duì)把數(shù)百萬非人的步法輸入到它的第二個(gè)神經(jīng)網(wǎng)絡(luò)中，教它像卡斯帕羅夫（或“深藍(lán)”）預(yù)測(cè)國際象棋棋局一樣預(yù)測(cè)圍棋的棋局。它無法像國際象棋那樣預(yù)測(cè)所有可能的步法，目前這還無法實(shí)現(xiàn)。但是將其與自己對(duì)弈多場(chǎng)后收集到的所有信息輸入進(jìn)去之后，AlphaGo開始能預(yù)測(cè)一場(chǎng)圍棋對(duì)弈可能展開的方式。
戴密斯·哈薩比斯于2010年創(chuàng)立人工智能公司——DeepMind
從最初那些你沒見過的情況中預(yù)見可能的結(jié)果？這叫直覺。AlphaGo第二局中的第37步便是直覺，但是這種直覺連世界頂級(jí)的圍棋選手也難以預(yù)料。甚至它的創(chuàng)造者也想不到?！拔矣^賽的時(shí)候，說不出心里有多緊張，”席爾瓦在回控制室的途中告訴我，“我也真的不知道接下來會(huì)發(fā)生什么?！?/p>
你不可能給一個(gè)公司投資6.5億美元就僅僅是建造一臺(tái)只會(huì)玩棋盤游戲的計(jì)算機(jī)。深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)支撐了谷歌的十多項(xiàng)服務(wù)，包括其全能搜索引擎在內(nèi)。AlphaGo的另一項(xiàng)武器是增強(qiáng)學(xué)習(xí)，現(xiàn)在已經(jīng)正在訓(xùn)練公司實(shí)驗(yàn)室里的機(jī)器人了，教它們學(xué)習(xí)如何拿起和移動(dòng)各種不同類型的物體。由此你便可看出這項(xiàng)比賽對(duì)谷歌來說有多重要了。谷歌前首席執(zhí)行官埃里克·施密特（Eric Schmidt）在第一局游戲開始之前專程趕來。谷歌最有名的工程師杰夫·迪恩（Jeff Dean）也趕到現(xiàn)場(chǎng)等待游戲開始。塞吉·布林（Sergey Brin）乘飛機(jī)來觀戰(zhàn)第三局和第四局，還在他的木制棋盤上跟著下。
還不僅如此。在比賽期間，我和哈薩比斯一起去鐘路區(qū)（Jongno-gu）散步，這個(gè)地方是首爾的文化和政治中心，有著600年的歷史。韓國電視和新聞上到處都是哈薩比斯的面孔。我們?cè)诮徽劦倪^程中，一位年輕女性認(rèn)出了哈薩比斯，她眼睛瞪得大大的，愣了一會(huì)兒，就好像看到了泰勒·斯威夫特（Taylor Swift）或賈斯汀·比伯（Justin Bieber）一樣。
“你看到了嗎？”我說。
“看到了，”哈薩比斯面無表情地答道，“這是常事?！?/p>
他可能并非開玩笑。計(jì)算機(jī)工程師一般沒什么粉絲，但是韓國有800萬人下圍棋，而李世石簡直又是這個(gè)國家的民族英雄。中國有超過2.8億人在線觀看此次比賽。
所以，當(dāng)李世石連輸兩局之后，粉絲們狂喜激動(dòng)的熱情開始被削減了。第二局結(jié)束之后，一位叫周峰（Fred Zhou）的中國記者在評(píng)論室攔住我，很高興地和我談?wù)揂lphaGo是科技的勝利，而非僅僅是圍棋殺手。
然后我問他對(duì)李世石失敗作何感想，周峰指指自己的心，說道：“我很難過?！?/p>
我也感到難過。曾經(jīng)專屬于人類的智慧已經(jīng)喪失了人類的專屬地位。觀看比賽的很多人都開始意識(shí)到，機(jī)器已經(jīng)越線了。它們能比人類做得好。雖然它們還不能真正地進(jìn)行對(duì)話，還不能編造一個(gè)好玩的笑話，還不能表演猜字游戲，還不能復(fù)制古老的常識(shí)，但是，AlphaGo無情地向我們展示了，機(jī)器能夠模仿——實(shí)際上是超越——人類的直覺，而正是這種直覺才造就了世界上最優(yōu)秀的圍棋選手。
李世石第三局又輸了，在五局三勝的賽制下，AlphaGo已經(jīng)穩(wěn)拿冠軍了。隨后的新聞發(fā)布會(huì)上，哈薩比斯坐在他旁邊，李世石表示歉意，他讓人類失望了?！拔冶究梢阅贸龈玫某煽?，帶來更好的結(jié)局。”他這樣說道。
李世石發(fā)言的過程中，一種難以預(yù)料的感覺向哈薩比斯襲來。作為AlphaGo的創(chuàng)造者之一，他自豪、甚至得意，人們以為機(jī)器不可能做到的，他讓機(jī)器做到了。但是，他作為人的另一面也在躁動(dòng)不安，他開始希望李世石贏一局了。
第四局下了兩個(gè)小時(shí)之后，李世石又陷入了另一個(gè)麻煩之中。這局他下得咄咄逼人，對(duì)棋盤上的特定區(qū)域猛烈進(jìn)攻。但是AlphaGo也采取了更加豪邁的風(fēng)格，以著眼整體的方式對(duì)整局棋進(jìn)行衡量。在下第37步時(shí)，AlphaGo將一枚黑子置于一個(gè)旁邊只有一枚白棋的地方，遠(yuǎn)離主戰(zhàn)場(chǎng)。又一次，在第四局中，機(jī)器使用了一種神秘的方法控制了這場(chǎng)比賽。
AlphaGo已經(jīng)贏得了比賽。李世石繼續(xù)下棋并非為了輸贏，而是為人類而戰(zhàn)。77步走完之后，他看起來猶豫不決了。他把右手支在下巴上，前后搖晃，坐立不安，另一只手來回得搔著脖頸后方。兩分鐘過去了，四分鐘過去了，六分鐘了。
然后，他依舊左手撓著脖頸后方，開始出擊。右手兩根手指夾起一枚棋子，放在緊挨棋盤中心的地方。這是這局棋的第78步，一步“挖”步，即在兩片大范圍密集的地區(qū)中間插入一棋。然后機(jī)器眨了眨眼，當(dāng)然，并非真的眨眼，但是它的下一步令人心驚肉跳。李世石向黃士杰投以尖銳的目光，似乎黃士杰才是他的對(duì)手，而不是那十億個(gè)電路。
在AlphaGo的控制室里，人們暫時(shí)停下手中的活計(jì)，盯著顯示屏看。李世石走出第78步之前，AlphaGo贏得此局的概率為70%。八步之后，雙方勢(shì)均力敵。AlphaGo忽然不是“深藍(lán)”的后繼者了——它是卡斯帕羅夫。它想不到人類會(huì)走那一步，概率僅僅為1/10000。
和人類一樣，AlphaGo也會(huì)因突然襲擊而亂了陣腳。游戲進(jìn)行到4小時(shí)45分，AlphaGo投降了，和我們?nèi)祟愐粯?，它也?huì)輸。
“AlphaGo之前思考的所有東西在那個(gè)點(diǎn)上都成了無用功，”哈薩比斯說道，“它必須得重新開始?！?/p>
最后一局比賽開始了，我本該全程關(guān)注報(bào)道哈薩比斯和他的團(tuán)隊(duì)的。但是就在我要去見他們的時(shí)候，一名谷歌工作人員到記者招待室找到了我，說：“我們很抱歉，但是團(tuán)隊(duì)改變主意了。最后一局，他們不想有任何記者出現(xiàn)在那個(gè)房間。”
她走之后，我轉(zhuǎn)向《連線》（WIRED）雜志的攝影師喬迪·伍德（Geordie Wood），說：“你知道這意味著什么嗎？AlphaGo覺得它要輸了?！?/p>
事實(shí)確實(shí)如此。游戲一開始，AlphaGo就犯了一個(gè)初級(jí)錯(cuò)誤。在棋盤下半部分的擁擠區(qū)域，它將一枚白子放得太過接近李世石的一些黑子，丟掉了整片區(qū)域。AlphaGo的直覺錯(cuò)了；和人類一樣，這個(gè)機(jī)器也有盲區(qū)。
但是，游戲進(jìn)入第三個(gè)小時(shí)時(shí)，AlphaGo重新振作，開始挽回頹勢(shì)。在第三小時(shí)30分時(shí)，李世石的時(shí)限到了。根據(jù)比賽規(guī)則，從此刻開始，他每一步至多能用一分鐘，否則就算犯規(guī)。但是在他右手上方的棋盤上，還有一大片空白區(qū)域。一次又一次，他直到最后一秒才落子。
隨后，AlphaGo的時(shí)限也用完了。雙方都開始以看似不可能的速度下著棋。棋盤上滿布棋子。整場(chǎng)比賽中，這是第一次棋局似乎會(huì)下到最后才進(jìn)行最終計(jì)分，雙方都不認(rèn)輸。但是到了第五個(gè)小時(shí)，李世石和Alphago之間的差距太大，李世石選擇認(rèn)輸。AlphaGo也會(huì)失敗，但依然贏得了最終勝利。
歐洲圍棋冠軍樊麾，AlphaGo的陪練，他也在不斷提升自我
全世界只有一個(gè)人能確切地體驗(yàn)李世石的感受，那就是樊麾。樊麾是三次歐洲圍棋賽冠軍，也是AlphaGo的真正陪練。去年十月，為了給這場(chǎng)在首爾舉行的更大型比賽進(jìn)行訓(xùn)練，他與AlphaGo進(jìn)行了一場(chǎng)非公開對(duì)弈，以五比零的結(jié)局輸給了這個(gè)機(jī)器。此后，樊麾以雇傭棋手的身份加入了DeepMind，在和這臺(tái)機(jī)器的較量中，屢戰(zhàn)屢敗。
雖然樊麾不斷輸給AlphaGo，但是另一個(gè)有趣的現(xiàn)象卻在悄然上演。樊麾開始以全新的視角全面地看待圍棋。在與其他人的對(duì)弈中，樊麾勝利的次數(shù)增加了——包括四次直接與頂尖圍棋選手的對(duì)決。他的排名上升了，AlphaGo也訓(xùn)練了他。
所以，在比賽期間，我問樊麾，我們應(yīng)如何看對(duì)李世石與AlphaGo的對(duì)決？
“善待李世石，”樊麾說，“善待?！?/p>
這些日子，世界上最大、最富有的科技公司正在加緊利用AlphaGo所擁有的科技尋求競(jìng)爭(zhēng)優(yōu)勢(shì)。哪個(gè)應(yīng)用能更好地識(shí)別照片？哪個(gè)能更好地響應(yīng)語音指令？不久以后，同樣的系統(tǒng)就可能用來幫助機(jī)器人以更加接近人類的方式與現(xiàn)實(shí)環(huán)境交互。
但是，相對(duì)于AlphaGo的非人類的類人之處，這些現(xiàn)實(shí)的應(yīng)用似乎平庸了不少。一種亞文化已經(jīng)圍繞著AlphaGo，以前所未有的方式展現(xiàn)了出來，例如Google Photo應(yīng)用。在德國的杜塞爾多夫，J.馬?。↗. Martin）——游戲設(shè)計(jì)、媒體和通訊教授——現(xiàn)在運(yùn)營著一個(gè)名為“第37步”的推特賬號(hào)。一名來自弗羅里達(dá)，名為喬迪·恩賽（Jordi Ensign）的45歲程序員在網(wǎng)上讀過我寫的一篇關(guān)于首爾比賽的文章之后，給我發(fā)來郵件，說她的右臂內(nèi)側(cè)紋有AlphaGo第37步的紋身，而她的左臂內(nèi)側(cè)則紋有李世石的第78步——圍棋界已將這一步稱之為“神之一手”了。
第四局結(jié)束之后，李世石和哈薩比斯坐了一會(huì)兒。哈薩比斯這個(gè)曾經(jīng)的游戲天才告訴李世石，他理解他的壓力，理解他的創(chuàng)造力及動(dòng)力?！拔以?jīng)也是一名游戲選手，”哈薩比斯說道，“如果我的生命軌跡有點(diǎn)變化的話……我明白達(dá)到你那樣的高度要做出多少努力，多少犧牲?！?/p>
李世石回答，和機(jī)器對(duì)弈重新燃起了他對(duì)圍棋的熱情。和樊麾一樣，AlphaGo開拓了他的眼界，讓他看到了圍棋的嶄新一面?！拔乙呀?jīng)得到提高了，”李世石說，“它給了我新的思路。”從那之后，他從未輸過。
這場(chǎng)比賽之前，哈薩比斯向世界宣布，AlphaGo所使用的人工智能技術(shù)能推動(dòng)一項(xiàng)全新的科學(xué)研究，機(jī)器將指點(diǎn)人類取得巨大突破。那個(gè)時(shí)候，還沒有證據(jù)，這些言辭顯得空洞乏力，就是典型的科技噱頭而已。但是現(xiàn)在不同了。這個(gè)機(jī)器做了一件人做的事，而且比人做得更好。但同時(shí)，它也讓人類有所進(jìn)步。是的，你可以將第37步視為機(jī)器超越人類創(chuàng)造的預(yù)兆，但你也可以將其視為一粒種子：沒有第37步，怎會(huì)有第78步？
原文標(biāo)題：What the AI behind AlphaGO can Teach Us about Being Human

猜你喜歡

哈薩席爾瓦李世石

烏干達(dá)男子：12 個(gè)妻子、102 個(gè)孩子、568 個(gè)孫輩
新傳奇(2023年3期)2023-02-18 02:04:56
堅(jiān)韌自信的李世石
中學(xué)生數(shù)理化·八年級(jí)物理人教版(2016年6期)2016-08-27 21:54:56
戴密斯·哈薩比斯：AlphaGo背后的超強(qiáng)大腦
新東方英語·中學(xué)版(2016年6期)2016-06-12 21:15:06
人機(jī)大戰(zhàn)
高中生學(xué)習(xí)·高一版(2016年5期)2016-05-14 14:02:34
杰米斯·哈薩比斯：“阿爾法狗”背后的男人
看世界(2016年8期)2016-04-29 20:57:42
AlphaGo創(chuàng)始人：8歲編程，14歲AI，哈佛&麻省雙博士后……
中國經(jīng)貿(mào)聚焦(2016年4期)2016-04-22 18:08:40
李世石不代表人類
汽車觀察(2016年3期)2016-02-28 13:16:18
瑪麗娜·席爾瓦：巴西“環(huán)保女將”竟選總統(tǒng)
祝你幸福·知心(2014年10期)2014-11-18 10:33:21
雨中的朋友
故事會(huì)(2012年10期)2012-05-16 02:40:10
查韋斯罵哥倫比亞防長“弱智”
環(huán)球時(shí)報(bào)(2009-10-27)2009-10-27 09:56:23

國外社會(huì)科學(xué)前沿2016年8期

國外社會(huì)科學(xué)前沿的其它文章
航空百年（下）
通過非物質(zhì)手段強(qiáng)化太空“彈性”
兵力、射程和武器上占優(yōu)勢(shì)：俄羅斯如何擊敗北約
為什么自我憐憫比自尊作用更好
埃隆·馬斯克：與世界分享人工智能的宏偉大業(yè)
歐盟委員會(huì)又盯上谷歌了

广德县| 读书| 呼玛县| 古浪县| 万宁市| 灵寿县| 广西| 鸡泽县| 西畴县| 通许县| 泉州市| 贵阳市| 黑河市| 荥经县| 阜宁县| 平阴县| 平阳县| 水城县| 宁波市| 肃南| 洪泽县| 永丰县| 邳州市| 保靖县| 吴堡县| 中卫市| 泾川县| 明星| 云霄县| 花莲市| 呈贡县| 九江县| 临清市| 盐边县| 中方县| 上蔡县| 团风县| 四会市| 苏尼特左旗| 交口县| 拉萨市|