劉嘟嘟
人工智能的領(lǐng)跑者
著名的人工智能圍棋程序AlphaGo在2016年3月與韓國頂尖圍棋高手李世乭進(jìn)行人機(jī)大戰(zhàn),并以4:1的總比分獲勝。與李世乭的對決讓世界看到了人工智能的無限潛力,而到了2016年歲末,AlphaGo的進(jìn)擊版更是通過名為Master(“大師”)的賬號(hào),在網(wǎng)絡(luò)上與中韓高手連番過招,以連贏60場的成績令人驚嘆。
在創(chuàng)造這一前所未有圍棋奇跡的背后,是一支充滿了智慧和活力、用數(shù)字構(gòu)建未來的團(tuán)隊(duì)——DeepMind。
在倫敦國王十字火車站旁邊一座不起眼的建筑里,藏著這樣一家潛力無限的公司DeepMind(深度思維),該公司努力將機(jī)器學(xué)習(xí)和人類系統(tǒng)神經(jīng)科學(xué)的先進(jìn)技術(shù)結(jié)合,發(fā)展人工智能深度學(xué)習(xí),建立強(qiáng)大的通用算法,將這種技術(shù)與游戲、醫(yī)療等多項(xiàng)實(shí)用產(chǎn)業(yè)結(jié)合。誰也不曾想到,一家成立于2010年的年輕初創(chuàng)公司會(huì)是世界兩大科技巨頭——谷歌和臉書競相爭奪的寶物。最終谷歌獲勝,2014年,谷歌公司以4億英鎊的高價(jià)將DeepMind收歸麾下,該公司正式成為谷歌旗下人工智能領(lǐng)域探索的排頭兵。
谷歌和臉書已經(jīng)在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域走在世界最前沿了,那么,這家公司到底存在著怎樣的價(jià)值,吸引了這些行業(yè)巨頭的注意呢?
谷歌招攬的超強(qiáng)大腦
DeepMind可以說是一個(gè)智庫集合,集結(jié)了400余名優(yōu)秀的計(jì)算機(jī)科學(xué)家和神經(jīng)學(xué)專家。下面這些人物可謂是DeepMind 團(tuán)隊(duì)精英中的精英。
德米斯·哈薩比斯
身為DeepMind創(chuàng)始人之一,德米斯·哈薩比斯可以說是整個(gè)公司的核心人物。哈薩比斯1976年出生于英國倫敦,4歲開始下國際象棋,13歲時(shí)就已經(jīng)獲得國際象棋大師頭銜,15歲時(shí),他連跳兩級,提前從高中畢業(yè)。1993年,17歲的哈薩比斯進(jìn)入劍橋大學(xué)學(xué)習(xí)計(jì)算機(jī)專業(yè),同年,他依靠自己開發(fā)的游戲獲得了某游戲設(shè)計(jì)比賽的亞軍,進(jìn)入頂尖游戲公司“牛蛙”實(shí)習(xí),并參與開發(fā)了在全球風(fēng)靡一時(shí)的虛擬游戲《主題公園》。
自1999年至2003年,哈薩比斯連續(xù)5年參加“國際智力奧運(yùn)會(huì)”,連奪5次冠軍,可謂是“地球上最聰明的男人”。2005年,29歲的哈薩比斯重新走進(jìn)學(xué)校,在英國倫敦大學(xué)攻讀神經(jīng)科學(xué)博士學(xué)位,潛心研究負(fù)責(zé)記憶、學(xué)習(xí)、空間導(dǎo)向的大腦海馬體。2011年,35歲的哈薩比斯結(jié)合自己游戲設(shè)計(jì)、計(jì)算機(jī)編程和神經(jīng)科學(xué)研究經(jīng)驗(yàn),成立DeepMind科技公司,專注研究模仿大腦的人工智能系統(tǒng)。
黃士杰
AlphaGo設(shè)計(jì)團(tuán)隊(duì)的另一位杰出人才是來自臺(tái)灣的黃士杰博士。黃士杰本科就讀于臺(tái)灣交通大學(xué),研究生和博士在臺(tái)灣師范大學(xué)研習(xí)。他從小熱愛圍棋,是個(gè)業(yè)余六段圍棋選手,在臺(tái)灣師范大學(xué)讀書時(shí)就曾經(jīng)在學(xué)校創(chuàng)辦圍棋社。大學(xué)期間,黃士杰醉心研究圍棋軟件開發(fā),他設(shè)計(jì)的軟件參加國際電腦奧林匹克競賽,獲得19路電腦圍棋金牌,這個(gè)程序甚至擊敗了當(dāng)時(shí)圍棋人工智能領(lǐng)域公認(rèn)最強(qiáng)的程序“Zen”,在業(yè)內(nèi)引起極大的轟動(dòng)。隨后,他進(jìn)入加拿大阿爾伯塔大學(xué)繼續(xù)圍棋程序研究。在博士和博士后階段,他深入研究蒙特卡洛樹搜索技術(shù),后來將其運(yùn)用在AlphaGo的走棋程序當(dāng)中。
大衛(wèi)·西爾弗
大衛(wèi)·西爾弗是哈薩比斯在劍橋大學(xué)讀書期間認(rèn)識(shí)的朋友,計(jì)算機(jī)專業(yè)的他常年霸占著專業(yè)第一的寶座。在校期間,他還教會(huì)了哈薩比斯多種棋類游戲的玩法,包括圍棋。1998年,哈薩比斯創(chuàng)立游戲公司Elixir Studios,西爾弗作為聯(lián)合創(chuàng)始人之一,在這間公司擔(dān)任首席技術(shù)官和主程序設(shè)計(jì)師。2004年,他進(jìn)入加拿大阿爾伯塔大學(xué)攻讀博士學(xué)位,研究人工智能增強(qiáng)學(xué)習(xí)。2013年,西爾弗重新與哈薩比斯會(huì)合,加入DeepMind團(tuán)隊(duì),以增強(qiáng)學(xué)習(xí)技術(shù)助力AlphaGo的設(shè)計(jì)和程序優(yōu)化。
除了上面這些人,DeepMind中還有諸多學(xué)界執(zhí)牛耳者,在神經(jīng)科學(xué)、計(jì)算機(jī)科學(xué)、卷積神經(jīng)網(wǎng)絡(luò)研究等方面人才濟(jì)濟(jì)。DeepMind簡直就是一群超級極客組合而成的深度學(xué)習(xí)全明星戰(zhàn)隊(duì)。
“大師”是怎樣煉成的
DeepMind發(fā)布的AlphaGo在圍棋棋局上出盡風(fēng)頭,讓世界級的圍棋大師們?yōu)橹@嘆。圍棋規(guī)則看似簡單,但棋局變化卻相當(dāng)多,在很長的時(shí)間里,圍棋都被視為人工智能開發(fā)領(lǐng)域的一座難以攻克的圣杯。圍棋第一步361個(gè)點(diǎn),下第二步有360點(diǎn),如果要下到底,大概有10360種下法,即便運(yùn)算量驚人的計(jì)算機(jī)也很難找到最佳解法。
AlphaGo和傳統(tǒng)的計(jì)算機(jī)圍棋游戲完全不同,可以進(jìn)行深度學(xué)習(xí)。它并非只是按照棋局庫的固定章法來照本宣科,而是能夠進(jìn)行自我學(xué)習(xí)和提升,以現(xiàn)有數(shù)據(jù)庫為基礎(chǔ)主動(dòng)創(chuàng)造新棋路,甚至能夠走出讓專業(yè)棋手摸不著頭腦的步法。
DeepMind主攻人工智能的意識(shí),讓機(jī)器理解自己的任務(wù)的同時(shí),也能夠理解環(huán)境或別人在做什么,并據(jù)此作出反應(yīng),完成決定。首先,需要讓計(jì)算機(jī)“懂得”棋局的規(guī)則,程序員將圍棋以計(jì)算機(jī)語言描述出來。比如在19×19的棋盤上的361個(gè)交叉點(diǎn)進(jìn)行定義。
人類在下圍棋時(shí),除了謀篇布局,精妙計(jì)算之外,更重要的是基于棋手經(jīng)驗(yàn)的“直覺”在幫助棋手思考,為棋手指路。AlphaGo也運(yùn)用了這種方法,與深度學(xué)習(xí)結(jié)合,利用“策略網(wǎng)絡(luò)”與“價(jià)值網(wǎng)絡(luò)”優(yōu)化人工智能的走棋。策略網(wǎng)絡(luò)可以判斷出最佳棋路,就好像人類用直覺來下出好棋一樣。當(dāng)然,開發(fā)團(tuán)隊(duì)也會(huì)事先給AlphaGo閱讀各種不同的參考棋譜。至于“價(jià)值網(wǎng)絡(luò)”則能幫助計(jì)算機(jī)在搜尋一個(gè)點(diǎn)之后,判斷盤面局勢、優(yōu)勢大小。
所以,當(dāng)計(jì)算機(jī)懂得走棋的任務(wù)后,它可以再隨機(jī)選擇落點(diǎn)進(jìn)行走棋訓(xùn)練,對取勝率較高的落點(diǎn)展開深入研究,并通過觀察上百萬局棋譜來豐富計(jì)算機(jī)的走棋數(shù)據(jù)庫。綜合這些信息后,計(jì)算機(jī)能夠反復(fù)進(jìn)行左右互搏的對弈訓(xùn)練,強(qiáng)化學(xué)習(xí),自我精進(jìn)。而且,通過結(jié)合神經(jīng)科學(xué)的計(jì)算機(jī)深度學(xué)習(xí),利用蒙特卡洛樹搜索和卷積神經(jīng)網(wǎng)絡(luò)等技術(shù)手段,計(jì)算機(jī)可以改進(jìn)現(xiàn)有的經(jīng)驗(yàn),創(chuàng)造獨(dú)特的新經(jīng)驗(yàn),并將這些智慧結(jié)晶內(nèi)化,成為幾乎可以獨(dú)立“思考”的超級圍棋大師。
人工智能的“下半場”
日本著名圍棋棋士藤澤秀行曾說過:“棋道一百,我只知七”。即使是棋藝最高的棋手在圍棋對弈方面所參悟的也十分有限,以七搏百,量力難行。AlphaGo的出現(xiàn)既是人工智能技術(shù)向人類發(fā)出的挑戰(zhàn),同時(shí)也是這一技術(shù)在向人類伸出援手。
人工智能在圍棋領(lǐng)域帶來的沖擊預(yù)示了它將在互聯(lián)網(wǎng)的“下半場”中大放異彩。未來,DeepMind可能將會(huì)成為谷歌公司的算法工廠,他們所深入研究的人工智能深度學(xué)習(xí)所涉及的范圍不會(huì)僅僅局限在棋盤之上,而是會(huì)運(yùn)用在更多領(lǐng)域,用于解決更多更復(fù)雜的問題,從醫(yī)療到交通,我們生活的方方面面都會(huì)逐漸與其相聯(lián)結(jié)。谷歌將其收入麾下是一個(gè)非常明智的選擇,DeepMind未來將會(huì)創(chuàng)造更多價(jià)值。