• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      AlphaGO 背后的人工智能,能教會(huì)我們?nèi)祟愂裁?/h1>
      2016-09-02 13:48:24凱德梅茨CadeMetz王賽錦
      國外社會(huì)科學(xué)前沿 2016年8期
      關(guān)鍵詞:哈薩席爾瓦李世石

      凱德·梅茨(Cade Metz)王賽錦/譯

      AlphaGO 背后的人工智能,能教會(huì)我們?nèi)祟愂裁?/p>

      凱德·梅茨(Cade Metz)
      王賽錦/譯

      選自美國《連線》雜志2016年6月號(hào)

      日裔美國人黃士杰(Aja Huang)把手伸到一個(gè)木碗里,碗里滿是圓滑的黑色棋子,他瞧也沒瞧一眼,就用中指和食指夾出一個(gè)。目光透過金屬絲眼鏡死死地盯著棋盤,他把手里的棋子放在棋盤上一個(gè)幾乎空白的區(qū)域,在一枚孤零零的白色棋子左下方。在圍棋里,這被稱為“肩沖”(shoulder hit),即從遠(yuǎn)離大部分對(duì)弈區(qū)域的側(cè)邊進(jìn)行攻擊。

      桌子對(duì)面的李世石(Lee Sedol),這個(gè)圍棋界過去十年里最優(yōu)秀的選手,僵住了。他看了看棋盤上鋪開的37枚棋子,起身默默離開。

      在離對(duì)弈場(chǎng)50英尺的評(píng)論室里,邁克爾·雷德蒙(Michael Redmond)通過閉路電視注視著比賽。雷蒙德是西方世界里圍棋唯一達(dá)到九段的選手,九段是圍棋的最高級(jí)別。他和李世石一樣震驚?!拔也恢肋@一步走得好還是不好。”雷蒙德對(duì)近200萬的在線觀眾說道。

      “我覺得那是步錯(cuò)棋?!绷硗庖粋€(gè)英語評(píng)論員克里斯·加洛克(Chris Garlock)說道,他是美國圍棋協(xié)會(huì)聯(lián)絡(luò)副主席。

      幾分鐘以后,李世石重又走回對(duì)弈室。他坐下了,但是并沒碰碗里的白色棋子。一分鐘過去了,兩分鐘過去了……15分鐘過去了,而棋手對(duì)弈一局的基本時(shí)限是兩個(gè)小時(shí),這就占去了不少時(shí)間。最后,李世石拿出一枚棋子,就放在黃士杰剛落的那枚黑棋的正上方。

      黃士杰的那一步是整局棋的第37步,李世石始終未能挽回局面。4小時(shí)20分過去了,李世石選擇認(rèn)輸。

      但是黃士杰并非這場(chǎng)圍棋游戲的真正贏家。他只是遵照指令行事,位于他左側(cè)的一臺(tái)平板顯示器與控制室相連,控制室位于附近的首爾四季酒店,同時(shí)還與分布在世界各地的谷歌數(shù)據(jù)中心的成百上千臺(tái)電腦相連。在這個(gè)或許是人類有史以來設(shè)計(jì)的最復(fù)雜的游戲里,它擊敗了世界上最厲害的選手之一。

      在同一個(gè)房間,另外一位圍棋專家也在觀戰(zhàn),他就是三屆歐洲圍棋冠軍樊麾(Fan Hui)。一開始,第37步棋也令他迷惑。但他與AlphaGo對(duì)弈過。與其他人相比,他還兼具AlphaGo的陪練身份。5個(gè)月中,樊麾與機(jī)器下了數(shù)百局,目的是為了讓它的創(chuàng)造者知道問題所在。樊麾經(jīng)常輸給機(jī)器,但是他也漸漸了解了AlphaGo,比其他任何人都了解得多。樊麾認(rèn)為,那個(gè)“肩沖”不像是人類會(huì)走的一步棋。但是想了10秒鐘之后,他明白了?!捌粒彼f道,“太漂亮了!”

      在這種五局三勝制里,現(xiàn)在AlphaGo以二比零的優(yōu)勢(shì)領(lǐng)先李世石,甚至是整個(gè)人類。第37步說明,AlphaGo并不只是重復(fù)多年來的編程,或者是通過暴力預(yù)測(cè)算法來機(jī)械地落子。在那一刻,AlphaGo證實(shí)了,它有理解的能力,或至少是有別于真實(shí)事物的模仿理解力。在李世石眼中,AlphaGo展示了圍棋選手所言的“直覺”,也就是它能以類人的方式,甚至是超越人類的方式進(jìn)行一場(chǎng)漂亮的對(duì)弈。

      但是不要為李世石的失敗,或人類的失敗掩面哭泣。李世石并非殉道者,第37步棋也不是機(jī)器超越人類的標(biāo)志。恰恰相反:第37步標(biāo)志著機(jī)器與人類共同進(jìn)步的開始。

      大衛(wèi)·席爾瓦(David Silver)領(lǐng)導(dǎo)的團(tuán)隊(duì)創(chuàng)造了AlphaGo

      當(dāng)大衛(wèi)·席爾瓦還是一名來自英格蘭東海岸城市薩??耍⊿uffolk) 的15歲國際象棋錦標(biāo)賽選手時(shí),戴密斯·哈薩比斯(Demis Hassabis)已經(jīng)是一名戰(zhàn)無不勝的國際象棋神童了。哈薩比斯是個(gè)不折不扣的神童,他媽媽是中國和新加坡混血,爸爸是希臘和塞浦路斯混血,他們一家人都住在倫敦。他曾是世界上14歲以下棋手中段位排名第二的選手。他常常通過參加一些地方賽事來保持自己思維的靈活性,也順道掙些外快。“我知道戴密斯時(shí)他還不知道我,”AlphaGo團(tuán)隊(duì)的領(lǐng)導(dǎo)者席爾瓦說道,“我曾經(jīng)見到他出現(xiàn)在我們鎮(zhèn)子上,贏了比賽,然后離開了。”

      到劍橋讀本科時(shí),他們才正式見了面,二人都學(xué)習(xí)計(jì)算神經(jīng)科學(xué),為的是理解人類思維,以便有一天也賦予機(jī)器一點(diǎn)兒智力,像人一樣。但是兩人真正深入交往卻是出于游戲,包括棋牌游戲和計(jì)算機(jī)游戲。

      1998年,二人畢業(yè)之后很自然地開創(chuàng)了一家電子游戲公司。哈薩比斯經(jīng)常和一名同事下圍棋。席爾瓦被哈薩比斯的游戲興趣所鼓動(dòng),也開始自己學(xué)習(xí)?!叭绻隳茉谌魏畏矫鎽?zhàn)勝戴密斯的話,這幾乎就像是一種榮譽(yù),”席爾瓦說道,“而且我知道,戴密斯對(duì)這個(gè)游戲的興趣才剛剛興起?!?/p>

      他們加入到了一個(gè)當(dāng)?shù)氐膰寰銟凡?,和二段三段選手對(duì)弈(相當(dāng)于空手道黑帶)。他們的野心還不止于此:他們?nèi)滩蛔〉厮伎?,為何機(jī)器從未破解這種智力游戲呢?1995年,一個(gè)名為“奇努克”(Chinook)的跳棋計(jì)算機(jī)程序打敗了世界上最優(yōu)秀的跳棋選手。兩年以后,國際商用機(jī)器公司(IBM)的“深藍(lán)”(Deep Blue)超級(jí)計(jì)算機(jī)打敗了世界象棋冠軍加利·卡斯帕羅夫(Garry Kasparov)。次年,機(jī)器還在Scrabble(一種拼字游戲——譯注)、Othello,甚至電視問答游戲節(jié)目《危險(xiǎn)邊緣》(Jeeopardy)中獲勝!用博弈論的術(shù)語來說,圍棋與國際象棋和西洋跳棋一樣,是一種完全信息博弈游戲——毫無運(yùn)氣可言,信息完全公開。通常來說,電腦應(yīng)該能輕松掌握,但是就是攻克不下圍棋。

      圍棋看上去很簡單。源起于3000年前的中國,兩名棋手在19×19的棋盤上對(duì)弈。棋手交替將黑白棋子放置于棋盤直線的交叉點(diǎn)上,努力包圍對(duì)方的棋子,或者將對(duì)方的棋子隔開,避免被包圍。人們把象棋喻為戰(zhàn)場(chǎng),但是把它比作單個(gè)的戰(zhàn)場(chǎng)更形象。圍棋則是整體作戰(zhàn),或地緣作戰(zhàn)。棋盤上一個(gè)角落里的變動(dòng)會(huì)影響全局。局勢(shì)變幻莫測(cè),勢(shì)力此消彼長。在象棋游戲中,棋手在一輪中一般有35種下法可選,但在圍棋中,卻可達(dá)200種。正常對(duì)弈下來,復(fù)雜程度不可同日而語。正如哈薩比斯和席爾瓦所言,圍棋棋盤上可能出現(xiàn)的情況比整個(gè)宇宙中的原子數(shù)量還要多。

      所以,與國際象棋不同,圍棋棋手——不論是人類還是機(jī)器——都看不透每一步落子會(huì)帶來的最終結(jié)果。頂級(jí)騎手靠的是直覺,而非單純的計(jì)算?!傲己玫牟季挚雌饋砭秃苊?,”哈薩比斯說道,“它遵循一定的美學(xué)。這就是幾千年來圍棋一直令人著迷的原因?!?/p>

      2005年,哈薩比斯和席爾瓦的游戲公司倒閉了,兩人也分道揚(yáng)鑣。在阿爾伯塔大學(xué)(University of Alberta),席瓦爾學(xué)習(xí)了人工智能的初級(jí)形式,也就是增強(qiáng)學(xué)習(xí),機(jī)器通過不斷地執(zhí)行任務(wù)、追蹤帶來最大利益的決策,從而達(dá)到自我學(xué)習(xí)。哈薩比斯進(jìn)了英國倫敦大學(xué)學(xué)院(Unviversity College London),獲得了認(rèn)知神經(jīng)科學(xué)的博士學(xué)位。

      2010年,他們重新找到對(duì)方。哈薩比斯成立了倫敦DeepMind人工智能公司;席爾瓦加入了他。他們雄心勃勃,想要?jiǎng)?chuàng)造真正能夠思考的通用人工智能。但他們必須找到一個(gè)出發(fā)點(diǎn)。

      他們理所當(dāng)然地把游戲作為出發(fā)點(diǎn)。這的確是對(duì)人工智能的一個(gè)很好的測(cè)試。從定義上說,游戲是有限制的。這和實(shí)際生活不同,而更像是裝在瓶子里的小型宇宙,你能客觀地批判成敗輸贏。DeepMind將增強(qiáng)學(xué)習(xí)和深度學(xué)習(xí)結(jié)合起來,從龐大的數(shù)據(jù)集中尋找規(guī)律。為了驗(yàn)證這種方式的可行性,研究者們教授他們剛剛成形的人工智能玩“太空侵略者”(Space Invaders)和“打磚塊”(Breakout)。

      它在“打磚塊”上成績斐然。這個(gè)游戲基本上和“乒乓”(Pong)差不多,不過不是和對(duì)手來回?fù)舸蛞粋€(gè)像素小球,而是用像素小球擊打彩色磚塊。打中一個(gè)塊磚,磚塊便會(huì)消失;沒接中球或者把球打到了屏幕外就算輸。玩了500局游戲之后,DeepMind的系統(tǒng)學(xué)會(huì)了將球以一定的角度打到磚塊后面去,從而保證小球一直在墻后擊打磚塊。這是一個(gè)經(jīng)典的“打磚塊”打法,但是DeepMind的電腦每次都能精準(zhǔn)地使用這一方法,其速度更是無人能及。

      為了尋找投資人,哈薩比斯在一次晚宴上瞄準(zhǔn)了著名的貝寶(PayPal)共同創(chuàng)建人和臉譜網(wǎng)(Facebook)投資者彼得·蒂爾(Peter Thiel)。哈薩比斯只有幾分鐘的時(shí)間,他知道蒂爾熱衷于國際象棋,就壯著膽子說國際象棋之所以流傳這么久,是因?yàn)橄蠛婉R的優(yōu)劣勢(shì)之間充滿了創(chuàng)意的博弈。蒂爾提出要哈薩比斯第二天和他正式比一場(chǎng)。

      一旦一位硅谷(Silicon Valley)億萬富翁聽說了你,其他富翁就也知道了。通過蒂爾,哈薩比斯結(jié)識(shí)了伊隆·馬斯克(Elon Musk),馬斯克又向谷歌首席執(zhí)行官拉里·佩奇(Larry Page)介紹了DeepMind。谷歌很快就以6.5億美元(據(jù)報(bào)道)的價(jià)格購買了這個(gè)公司。

      加入谷歌這個(gè)搜索引擎巨頭之后,哈薩比斯在一次會(huì)議上用雅達(dá)利游戲機(jī)(Atari)做了展示,谷歌聯(lián)合創(chuàng)始人謝爾蓋·布林(Sergey Brin)也參加了此次會(huì)議。二人發(fā)現(xiàn)他們有著相同的愛好。在斯坦福攻讀碩士學(xué)位時(shí),布林便沉迷于圍棋,佩奇甚至因此擔(dān)心谷歌能不能建立。

      所以,當(dāng)布林見到哈薩比斯之時(shí),他們就聊了游戲?!澳阒绬?,DeepMind或許幾年之后能打敗世界圍棋冠軍,”哈薩比斯告訴布林,“如果我們真的認(rèn)真去做的話。”

      “我覺得不可能。”布林答道。

      哈薩比斯就等這句話。如他們所言,游戲已經(jīng)開始。

      第二局棋結(jié)束之后,席爾瓦進(jìn)入AlphaGo的控制室,就位于走廊盡頭。AlphaGo的大腦不在此處,也不在其他地方,而是存在于全球成百上千臺(tái)電腦之中。面對(duì)這些顯示器,席爾瓦能窺探AlphaGo的思想,監(jiān)控其運(yùn)行,跟蹤它對(duì)每場(chǎng)對(duì)弈解決的預(yù)測(cè)有何變化。

      輕敲幾下鍵盤,席爾瓦輕松地調(diào)出了AlphaGo在游戲中的決策記錄。他主要關(guān)注第37步之前到底發(fā)生了什么。

      在DeepMind和AlphaGo出現(xiàn)之前,人工智能的研究者就嘗試著用機(jī)器破解圍棋,在游戲進(jìn)行過程中,他們令機(jī)器用一種系統(tǒng)方式預(yù)測(cè)每一步可能產(chǎn)生的結(jié)果,試圖以野蠻的計(jì)算機(jī)力量解決問題。1997年IBM的“深藍(lán)”擊敗卡斯帕羅夫時(shí)就差不多是這樣的。我當(dāng)時(shí)是PC Magazine(美國著名的IT雜志——譯注)的見習(xí)記者,報(bào)道了那次事件。和李世石對(duì)戰(zhàn)AlphaGo一樣,人們都認(rèn)為這是人工智能發(fā)展的標(biāo)志性事件。奇怪的是,正如李世石和AlphaGo的第二局比賽,“深藍(lán)”在和卡斯帕羅夫?qū)?zhàn)的第二局中也走了一步人類不可能走的棋。兩人都同樣困惑,但是卡斯帕羅夫迫于壓力立刻就認(rèn)輸了,而李世石則堅(jiān)持戰(zhàn)斗。

      暴力計(jì)算從未攻克圍棋。圍棋的可能性太多,即使是電腦也難以處理。席爾瓦的團(tuán)隊(duì)另辟蹊徑,建造了一個(gè)能學(xué)會(huì)很好地下棋的機(jī)器,然后再讓它比賽。

      在倫敦國王十字車站附近的DeepMind辦公室中,這支團(tuán)隊(duì)將3000萬步人類的圍棋步法輸入到一個(gè)深度神經(jīng)網(wǎng)絡(luò)中,這個(gè)網(wǎng)絡(luò)中的硬件和軟件松散地模仿人類大腦中的神經(jīng)元。神經(jīng)網(wǎng)絡(luò)其實(shí)很普通,臉譜網(wǎng)用它們進(jìn)行照片中的人臉識(shí)別,谷歌用它們識(shí)別安卓智能手機(jī)中的語音指令。如果你把足夠多你媽媽的照片放到神經(jīng)網(wǎng)絡(luò)里,那么它們便能學(xué)會(huì)識(shí)別她。輸入足夠多的言語,他們也能學(xué)會(huì)如何識(shí)別你的話語。將3000萬步圍棋步法整合其中,它們也能學(xué)會(huì)怎么下圍棋。

      但是了解規(guī)則和成為棋王并不是一回事兒。第37步并不在這3000萬步之中。那么,AlphaGo是怎么學(xué)會(huì)這一步的呢?

      AlphaGo知道——就它所“知道”的東西——那一步是個(gè)險(xiǎn)招?!八缹I(yè)人士不會(huì)走那一步,但是,在它逐漸加深的搜索中,能推翻最初的指導(dǎo)?!毕癄柾哒f。AlphaGo從某種程度上說,已經(jīng)能自己思考了。它并非根據(jù)其創(chuàng)造者編碼的一系列規(guī)則,而是它自學(xué)的算法。“這真的是它在不斷反思和分析的過程中自己發(fā)現(xiàn)的?!?/p>

      實(shí)際上,這臺(tái)機(jī)器已經(jīng)算出來專業(yè)人類選手走同樣一步的概率為1/10000。不管怎樣,AlphaGo那么做了。

      它從人類的招數(shù)中學(xué)會(huì)這個(gè)游戲之后,席爾瓦就讓這臺(tái)機(jī)器和它自己對(duì)弈。讓它和一個(gè)與自己神經(jīng)網(wǎng)絡(luò)(稍)有不同的版本一局一局地下。在對(duì)弈的過程中,它會(huì)追蹤每一步所能產(chǎn)生的最大效益,也就是在棋盤上占領(lǐng)地盤——這正是席爾瓦在研究生期間學(xué)習(xí)到的增強(qiáng)學(xué)習(xí)技巧。AlphaGo開始開發(fā)出一套屬于它自己的非人類指令系統(tǒng)。

      但是這還只是一部分。緊接著,席爾瓦團(tuán)隊(duì)把數(shù)百萬非人的步法輸入到它的第二個(gè)神經(jīng)網(wǎng)絡(luò)中,教它像卡斯帕羅夫(或“深藍(lán)”)預(yù)測(cè)國際象棋棋局一樣預(yù)測(cè)圍棋的棋局。它無法像國際象棋那樣預(yù)測(cè)所有可能的步法,目前這還無法實(shí)現(xiàn)。但是將其與自己對(duì)弈多場(chǎng)后收集到的所有信息輸入進(jìn)去之后,AlphaGo開始能預(yù)測(cè)一場(chǎng)圍棋對(duì)弈可能展開的方式。

      戴密斯·哈薩比斯于2010年創(chuàng)立人工智能公司——DeepMind

      從最初那些你沒見過的情況中預(yù)見可能的結(jié)果?這叫直覺。AlphaGo第二局中的第37步便是直覺,但是這種直覺連世界頂級(jí)的圍棋選手也難以預(yù)料。甚至它的創(chuàng)造者也想不到?!拔矣^賽的時(shí)候,說不出心里有多緊張,”席爾瓦在回控制室的途中告訴我,“我也真的不知道接下來會(huì)發(fā)生什么?!?/p>

      你不可能給一個(gè)公司投資6.5億美元就僅僅是建造一臺(tái)只會(huì)玩棋盤游戲的計(jì)算機(jī)。深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)支撐了谷歌的十多項(xiàng)服務(wù),包括其全能搜索引擎在內(nèi)。AlphaGo的另一項(xiàng)武器是增強(qiáng)學(xué)習(xí),現(xiàn)在已經(jīng)正在訓(xùn)練公司實(shí)驗(yàn)室里的機(jī)器人了,教它們學(xué)習(xí)如何拿起和移動(dòng)各種不同類型的物體。由此你便可看出這項(xiàng)比賽對(duì)谷歌來說有多重要了。谷歌前首席執(zhí)行官埃里克·施密特(Eric Schmidt)在第一局游戲開始之前專程趕來。谷歌最有名的工程師杰夫·迪恩(Jeff Dean)也趕到現(xiàn)場(chǎng)等待游戲開始。塞吉·布林(Sergey Brin)乘飛機(jī)來觀戰(zhàn)第三局和第四局,還在他的木制棋盤上跟著下。

      還不僅如此。在比賽期間,我和哈薩比斯一起去鐘路區(qū)(Jongno-gu)散步,這個(gè)地方是首爾的文化和政治中心,有著600年的歷史。韓國電視和新聞上到處都是哈薩比斯的面孔。我們?cè)诮徽劦倪^程中,一位年輕女性認(rèn)出了哈薩比斯,她眼睛瞪得大大的,愣了一會(huì)兒,就好像看到了泰勒·斯威夫特(Taylor Swift)或賈斯汀·比伯(Justin Bieber)一樣。

      “你看到了嗎?”我說。

      “看到了,”哈薩比斯面無表情地答道,“這是常事?!?/p>

      他可能并非開玩笑。計(jì)算機(jī)工程師一般沒什么粉絲,但是韓國有800萬人下圍棋,而李世石簡直又是這個(gè)國家的民族英雄。中國有超過2.8億人在線觀看此次比賽。

      所以,當(dāng)李世石連輸兩局之后,粉絲們狂喜激動(dòng)的熱情開始被削減了。第二局結(jié)束之后,一位叫周峰(Fred Zhou)的中國記者在評(píng)論室攔住我,很高興地和我談?wù)揂lphaGo是科技的勝利,而非僅僅是圍棋殺手。

      然后我問他對(duì)李世石失敗作何感想,周峰指指自己的心,說道:“我很難過?!?/p>

      我也感到難過。曾經(jīng)專屬于人類的智慧已經(jīng)喪失了人類的專屬地位。觀看比賽的很多人都開始意識(shí)到,機(jī)器已經(jīng)越線了。它們能比人類做得好。雖然它們還不能真正地進(jìn)行對(duì)話,還不能編造一個(gè)好玩的笑話,還不能表演猜字游戲,還不能復(fù)制古老的常識(shí),但是,AlphaGo無情地向我們展示了,機(jī)器能夠模仿——實(shí)際上是超越——人類的直覺,而正是這種直覺才造就了世界上最優(yōu)秀的圍棋選手。

      李世石第三局又輸了,在五局三勝的賽制下,AlphaGo已經(jīng)穩(wěn)拿冠軍了。隨后的新聞發(fā)布會(huì)上,哈薩比斯坐在他旁邊,李世石表示歉意,他讓人類失望了?!拔冶究梢阅贸龈玫某煽?,帶來更好的結(jié)局。”他這樣說道。

      李世石發(fā)言的過程中,一種難以預(yù)料的感覺向哈薩比斯襲來。作為AlphaGo的創(chuàng)造者之一,他自豪、甚至得意,人們以為機(jī)器不可能做到的,他讓機(jī)器做到了。但是,他作為人的另一面也在躁動(dòng)不安,他開始希望李世石贏一局了。

      第四局下了兩個(gè)小時(shí)之后,李世石又陷入了另一個(gè)麻煩之中。這局他下得咄咄逼人,對(duì)棋盤上的特定區(qū)域猛烈進(jìn)攻。但是AlphaGo也采取了更加豪邁的風(fēng)格,以著眼整體的方式對(duì)整局棋進(jìn)行衡量。在下第37步時(shí),AlphaGo將一枚黑子置于一個(gè)旁邊只有一枚白棋的地方,遠(yuǎn)離主戰(zhàn)場(chǎng)。又一次,在第四局中,機(jī)器使用了一種神秘的方法控制了這場(chǎng)比賽。

      AlphaGo已經(jīng)贏得了比賽。李世石繼續(xù)下棋并非為了輸贏,而是為人類而戰(zhàn)。77步走完之后,他看起來猶豫不決了。他把右手支在下巴上,前后搖晃,坐立不安,另一只手來回得搔著脖頸后方。兩分鐘過去了,四分鐘過去了,六分鐘了。

      然后,他依舊左手撓著脖頸后方,開始出擊。右手兩根手指夾起一枚棋子,放在緊挨棋盤中心的地方。這是這局棋的第78步,一步“挖”步,即在兩片大范圍密集的地區(qū)中間插入一棋。然后機(jī)器眨了眨眼,當(dāng)然,并非真的眨眼,但是它的下一步令人心驚肉跳。李世石向黃士杰投以尖銳的目光,似乎黃士杰才是他的對(duì)手,而不是那十億個(gè)電路。

      在AlphaGo的控制室里,人們暫時(shí)停下手中的活計(jì),盯著顯示屏看。李世石走出第78步之前,AlphaGo贏得此局的概率為70%。八步之后,雙方勢(shì)均力敵。AlphaGo忽然不是“深藍(lán)”的后繼者了——它是卡斯帕羅夫。它想不到人類會(huì)走那一步,概率僅僅為1/10000。

      和人類一樣,AlphaGo也會(huì)因突然襲擊而亂了陣腳。游戲進(jìn)行到4小時(shí)45分,AlphaGo投降了,和我們?nèi)祟愐粯?,它也?huì)輸。

      “AlphaGo之前思考的所有東西在那個(gè)點(diǎn)上都成了無用功,”哈薩比斯說道,“它必須得重新開始?!?/p>

      最后一局比賽開始了,我本該全程關(guān)注報(bào)道哈薩比斯和他的團(tuán)隊(duì)的。但是就在我要去見他們的時(shí)候,一名谷歌工作人員到記者招待室找到了我,說:“我們很抱歉,但是團(tuán)隊(duì)改變主意了。最后一局,他們不想有任何記者出現(xiàn)在那個(gè)房間。”

      她走之后,我轉(zhuǎn)向《連線》(WIRED)雜志的攝影師喬迪·伍德(Geordie Wood),說:“你知道這意味著什么嗎?AlphaGo覺得它要輸了?!?/p>

      事實(shí)確實(shí)如此。游戲一開始,AlphaGo就犯了一個(gè)初級(jí)錯(cuò)誤。在棋盤下半部分的擁擠區(qū)域,它將一枚白子放得太過接近李世石的一些黑子,丟掉了整片區(qū)域。AlphaGo的直覺錯(cuò)了;和人類一樣,這個(gè)機(jī)器也有盲區(qū)。

      但是,游戲進(jìn)入第三個(gè)小時(shí)時(shí),AlphaGo重新振作,開始挽回頹勢(shì)。在第三小時(shí)30分時(shí),李世石的時(shí)限到了。根據(jù)比賽規(guī)則,從此刻開始,他每一步至多能用一分鐘,否則就算犯規(guī)。但是在他右手上方的棋盤上,還有一大片空白區(qū)域。一次又一次,他直到最后一秒才落子。

      隨后,AlphaGo的時(shí)限也用完了。雙方都開始以看似不可能的速度下著棋。棋盤上滿布棋子。整場(chǎng)比賽中,這是第一次棋局似乎會(huì)下到最后才進(jìn)行最終計(jì)分,雙方都不認(rèn)輸。但是到了第五個(gè)小時(shí),李世石和Alphago之間的差距太大,李世石選擇認(rèn)輸。AlphaGo也會(huì)失敗,但依然贏得了最終勝利。

      歐洲圍棋冠軍樊麾,AlphaGo的陪練,他也在不斷提升自我

      全世界只有一個(gè)人能確切地體驗(yàn)李世石的感受,那就是樊麾。樊麾是三次歐洲圍棋賽冠軍,也是AlphaGo的真正陪練。去年十月,為了給這場(chǎng)在首爾舉行的更大型比賽進(jìn)行訓(xùn)練,他與AlphaGo進(jìn)行了一場(chǎng)非公開對(duì)弈,以五比零的結(jié)局輸給了這個(gè)機(jī)器。此后,樊麾以雇傭棋手的身份加入了DeepMind,在和這臺(tái)機(jī)器的較量中,屢戰(zhàn)屢敗。

      雖然樊麾不斷輸給AlphaGo,但是另一個(gè)有趣的現(xiàn)象卻在悄然上演。樊麾開始以全新的視角全面地看待圍棋。在與其他人的對(duì)弈中,樊麾勝利的次數(shù)增加了——包括四次直接與頂尖圍棋選手的對(duì)決。他的排名上升了,AlphaGo也訓(xùn)練了他。

      所以,在比賽期間,我問樊麾,我們應(yīng)如何看對(duì)李世石與AlphaGo的對(duì)決?

      “善待李世石,”樊麾說,“善待?!?/p>

      這些日子,世界上最大、最富有的科技公司正在加緊利用AlphaGo所擁有的科技尋求競(jìng)爭(zhēng)優(yōu)勢(shì)。哪個(gè)應(yīng)用能更好地識(shí)別照片?哪個(gè)能更好地響應(yīng)語音指令?不久以后,同樣的系統(tǒng)就可能用來幫助機(jī)器人以更加接近人類的方式與現(xiàn)實(shí)環(huán)境交互。

      但是,相對(duì)于AlphaGo的非人類的類人之處,這些現(xiàn)實(shí)的應(yīng)用似乎平庸了不少。一種亞文化已經(jīng)圍繞著AlphaGo,以前所未有的方式展現(xiàn)了出來,例如Google Photo應(yīng)用。在德國的杜塞爾多夫,J.馬?。↗. Martin)——游戲設(shè)計(jì)、媒體和通訊教授——現(xiàn)在運(yùn)營著一個(gè)名為“第37步”的推特賬號(hào)。一名來自弗羅里達(dá),名為喬迪·恩賽(Jordi Ensign)的45歲程序員在網(wǎng)上讀過我寫的一篇關(guān)于首爾比賽的文章之后,給我發(fā)來郵件,說她的右臂內(nèi)側(cè)紋有AlphaGo第37步的紋身,而她的左臂內(nèi)側(cè)則紋有李世石的第78步——圍棋界已將這一步稱之為“神之一手”了。

      第四局結(jié)束之后,李世石和哈薩比斯坐了一會(huì)兒。哈薩比斯這個(gè)曾經(jīng)的游戲天才告訴李世石,他理解他的壓力,理解他的創(chuàng)造力及動(dòng)力?!拔以?jīng)也是一名游戲選手,”哈薩比斯說道,“如果我的生命軌跡有點(diǎn)變化的話……我明白達(dá)到你那樣的高度要做出多少努力,多少犧牲?!?/p>

      李世石回答,和機(jī)器對(duì)弈重新燃起了他對(duì)圍棋的熱情。和樊麾一樣,AlphaGo開拓了他的眼界,讓他看到了圍棋的嶄新一面?!拔乙呀?jīng)得到提高了,”李世石說,“它給了我新的思路。”從那之后,他從未輸過。

      這場(chǎng)比賽之前,哈薩比斯向世界宣布,AlphaGo所使用的人工智能技術(shù)能推動(dòng)一項(xiàng)全新的科學(xué)研究,機(jī)器將指點(diǎn)人類取得巨大突破。那個(gè)時(shí)候,還沒有證據(jù),這些言辭顯得空洞乏力,就是典型的科技噱頭而已。但是現(xiàn)在不同了。這個(gè)機(jī)器做了一件人做的事,而且比人做得更好。但同時(shí),它也讓人類有所進(jìn)步。是的,你可以將第37步視為機(jī)器超越人類創(chuàng)造的預(yù)兆,但你也可以將其視為一粒種子:沒有第37步,怎會(huì)有第78步?

      原文標(biāo)題:What the AI behind AlphaGO can Teach Us about Being Human

      猜你喜歡
      哈薩席爾瓦李世石
      烏干達(dá)男子:12 個(gè)妻子、102 個(gè)孩子、568 個(gè)孫輩
      新傳奇(2023年3期)2023-02-18 02:04:56
      堅(jiān)韌自信的李世石
      戴密斯·哈薩比斯:AlphaGo背后的超強(qiáng)大腦
      人機(jī)大戰(zhàn)
      杰米斯·哈薩比斯:“阿爾法狗”背后的男人
      看世界(2016年8期)2016-04-29 20:57:42
      AlphaGo創(chuàng)始人:8歲編程,14歲AI,哈佛&麻省雙博士后……
      李世石不代表人類
      汽車觀察(2016年3期)2016-02-28 13:16:18
      瑪麗娜·席爾瓦:巴西“環(huán)保女將”竟選總統(tǒng)
      雨中的朋友
      查韋斯罵哥倫比亞防長“弱智”

      广德县| 读书| 呼玛县| 古浪县| 万宁市| 灵寿县| 广西| 鸡泽县| 西畴县| 通许县| 泉州市| 贵阳市| 黑河市| 荥经县| 阜宁县| 平阴县| 平阳县| 水城县| 宁波市| 肃南| 洪泽县| 永丰县| 邳州市| 保靖县| 吴堡县| 中卫市| 泾川县| 明星| 云霄县| 花莲市| 呈贡县| 九江县| 临清市| 盐边县| 中方县| 上蔡县| 团风县| 四会市| 苏尼特左旗| 交口县| 拉萨市|