摘 要隨著科學(xué)技術(shù)的不斷發(fā)展創(chuàng)新,人工智能技術(shù)的發(fā)展已經(jīng)日趨成熟,并廣泛融入到各個領(lǐng)域行業(yè)和人們?nèi)粘9ぷ魃钪?。日前,人工智能技術(shù)已經(jīng)應(yīng)用在了跳棋、國際象棋等棋類競技當(dāng)中,由于圍棋戰(zhàn)術(shù)的復(fù)雜性,一致未被攻破。2016年3月,Google研發(fā)的Alpha Go和圍棋世界冠軍、職業(yè)九段圍棋選手李世石展開的圍棋人機(jī)對決,Alpha Go最終以4:1的總分獲勝,這一次圍棋人機(jī)對決賽事重新掀起了人們對人工智能技術(shù)的研發(fā)浪潮。本文就人工智能技術(shù)攻破圍棋高地進(jìn)行淺析,并展望未來人工智能技術(shù)在圍棋領(lǐng)域的應(yīng)用和發(fā)展。
【關(guān)鍵詞】人工智能 圍棋 應(yīng)用發(fā)展
1 Alpha Go 核心算法淺析
Alpha Go出現(xiàn)以前,人工智能技術(shù)已經(jīng)逐步應(yīng)用于跳棋、國際象棋等棋藝競技中,美國IBM公司研發(fā)的國際象棋電子計算機(jī)“深藍(lán)”具備32個微型處理器,每秒能夠計算2億步,主要利用暴力窮舉法則在有限的棋盤上計算得出全部的走法路數(shù),并加以分析評估,從而選出最佳的走法。但就圍棋而言,棋盤交叉網(wǎng)格點(diǎn)有361個,整體掌控較為困難,因此Deep Mind 公司主要將神經(jīng)網(wǎng)絡(luò)與蒙特卡洛搜索進(jìn)行結(jié)合,通過神經(jīng)網(wǎng)絡(luò)決斷走法之后,再由蒙特卡洛樹搜索確定走法過程。
1.1 神經(jīng)網(wǎng)絡(luò)系統(tǒng)
由于圍棋整體棋盤較大,Deep Mind 公司在研發(fā)Alpha Go時將迅速走子網(wǎng)絡(luò)、監(jiān)督學(xué)習(xí)戰(zhàn)略網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)戰(zhàn)略網(wǎng)絡(luò)以及值網(wǎng)絡(luò)有效結(jié)合,構(gòu)建了一個完整的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。迅速走子網(wǎng)絡(luò)較為簡易,精準(zhǔn)率較低,但整體計算速度非常迅速,可以迅速地模仿圍棋對決,大大提升了對棋局的分析評價效率;監(jiān)督學(xué)習(xí)戰(zhàn)略網(wǎng)絡(luò)較為復(fù)雜,擁有著13層深層卷積網(wǎng)絡(luò)神經(jīng),能夠依據(jù)現(xiàn)下棋盤布局提出接下來的路數(shù);強(qiáng)化學(xué)習(xí)戰(zhàn)略網(wǎng)絡(luò)的操練數(shù)據(jù)主要借助監(jiān)督學(xué)習(xí)戰(zhàn)略網(wǎng)絡(luò)獲取,不僅能夠優(yōu)化升級神經(jīng)網(wǎng)絡(luò),還能夠確保結(jié)果最大程度上接近最佳戰(zhàn)略;值網(wǎng)絡(luò)傳送值主要呈現(xiàn)的是在全部玩家均運(yùn)用了最佳戰(zhàn)略的情形下,最終獲勝的概率。
1.2 蒙特卡洛樹搜索
蒙特卡洛樹搜索主要依據(jù)先隨機(jī)下子,再對整盤棋局最終勝負(fù)來更新事先的走子路數(shù),同時設(shè)置隨機(jī)下子的概率和事先運(yùn)算得出走子路數(shù)的最終價值比,通過多次反復(fù)的隨機(jī)模仿,再得出最佳走子路數(shù)設(shè)計。蒙特卡洛樹搜索對分析評價函數(shù)的操作原則極其簡易,只要能夠判定棋局最終勝負(fù)即可。Alpha Go 基本上延用了國際象棋深藍(lán)的算法架構(gòu),形態(tài)空間所運(yùn)用的數(shù)據(jù)匯總戰(zhàn)略也基本和蒙特卡洛樹搜索方式保持一致。不同的是,Alpha Go 計算水平顯著提升的關(guān)鍵因素在于成功地改良并應(yīng)用了形態(tài)空間搜索戰(zhàn)略和科學(xué)合理的棋局分析評價函數(shù),也就是將迅速走子網(wǎng)絡(luò)、監(jiān)督學(xué)習(xí)戰(zhàn)略網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)戰(zhàn)略網(wǎng)絡(luò)以及值網(wǎng)絡(luò)有效結(jié)合,構(gòu)建了一個完整的神經(jīng)網(wǎng)絡(luò)系統(tǒng)。Alpha Go 將以往的蒙特卡洛樹搜索戰(zhàn)略網(wǎng)絡(luò)與價值網(wǎng)絡(luò)有效融合,讓 Alpha Go 具備近似于人類邏輯思維方式。
2 人工智能技術(shù)研發(fā)的思考和發(fā)展
圍棋是一種戰(zhàn)略型對弈競技,是人類智慧的集中體現(xiàn)。隨著Alpha Go先后戰(zhàn)勝了李世石、柯潔等世界圍棋冠軍,很多受眾認(rèn)為人工智能技術(shù)已經(jīng)達(dá)到了和人類智慧相毗鄰,甚至更高的程度,在欣喜為當(dāng)今科學(xué)技術(shù)創(chuàng)新帶來新的發(fā)展方向的同時,也不禁產(chǎn)生危機(jī)意識。
2.1 智能危機(jī)
“智能危機(jī)”最早出現(xiàn)于《守望先鋒》的游戲研發(fā)故事中,暴雪娛樂公司將未來地球作為游戲背景,描述虛擬了人類、守望先鋒隊員和智能機(jī)器之間的搏斗,隨著對智能機(jī)器人制造技藝的不斷創(chuàng)新,世界整體經(jīng)濟(jì)水平得以提升,科學(xué)技術(shù)的不斷發(fā)展,一類能夠自行適應(yīng)海洋型的智能機(jī)器人失去了智能中樞系統(tǒng),覺醒后殺戮了大量的印度人民,讓人類驕傲的人工智能技術(shù)成為了當(dāng)下威脅生命的敵人,繼而出現(xiàn)了守望先鋒和智能機(jī)器人進(jìn)行對抗,這一游戲背景闡述的危機(jī)主要原因在于人類對人工智能技術(shù)的研發(fā)和應(yīng)用。人工智能技術(shù)是科學(xué)技術(shù)發(fā)展新階段的標(biāo)志性技術(shù),是對人類邏輯思維方式的模擬,最為貼近人類的日常工作和生活。現(xiàn)如今,人工智能技術(shù)已經(jīng)廣泛應(yīng)用于人們的日常工作和生活,智能手機(jī)、智能手表、網(wǎng)絡(luò)搜索等等智能電子產(chǎn)品的出現(xiàn),很大程度上改變了人們的工作生活方式,人們越發(fā)依賴科學(xué)技術(shù)所帶來的物質(zhì)文化生活水平的提升,就會越發(fā)思考科技所帶來的危害??陀^理性的將,世界上計算速度最快的人也無法超過電子計算器,田徑速度再快的運(yùn)動員也追趕不上火車的速度,但這并不能夠證明電子計算器和火車就比人類更加高等,此外現(xiàn)階段人工智能技術(shù)的研發(fā),還無法向人類大腦一樣就某些問題進(jìn)行獨(dú)立的思考,還需要通過人類對相關(guān)數(shù)據(jù)信息進(jìn)行輸入,因此科幻作品所提到的智能危機(jī)并不會在現(xiàn)實生活中發(fā)生。
2.2 人工智能的發(fā)展
現(xiàn)階段,隨著科學(xué)技術(shù)的不斷發(fā)展創(chuàng)新,人工智能技術(shù)已經(jīng)融入了人們的日常工作和生活,例如電子郵箱中垃圾信息的過濾系統(tǒng)、蘋果手機(jī)中的Siri以及Google研發(fā)的無人駕駛系統(tǒng)等等,由此可見,人工智能技術(shù)的應(yīng)用很大程度上便利了人們的工作生活,因此人工智能技術(shù)的研發(fā)已經(jīng)成為當(dāng)前科學(xué)界的研發(fā)重點(diǎn)之一。Google、百度、騰訊等移動互聯(lián)網(wǎng)公司全部都構(gòu)建了人工智能科學(xué)實驗室,把人工智能技術(shù)榮升為當(dāng)前科技研發(fā)工作的重點(diǎn)項目,在歐美等發(fā)達(dá)國家,對人工智能技術(shù)的研發(fā)更為重視,例如,歐盟組織研究的人腦工程項目、美國開展的大腦研究計劃等等,人工智能技術(shù)在未來的發(fā)展過程中會逐漸取替?zhèn)鹘y(tǒng)行業(yè)領(lǐng)域,餐飲服務(wù)員、清潔工等等很有可能被人工智能機(jī)器人所取替,只要為其提供電源和網(wǎng)絡(luò)就能夠進(jìn)行工作,既節(jié)約了人工成本投入,也能夠提升整體工作效率,有利于推進(jìn)人類社會的發(fā)展與前行。
3 結(jié)束語
Alpha Go 在擊敗世界圍棋冠軍的同時,不僅讓圍棋領(lǐng)域備受社會受眾的關(guān)注,也再次掀起人工智能技術(shù)的研發(fā)熱潮。而智能危機(jī)只會出現(xiàn)在科幻作品中,在未來,人工智能技術(shù)的不斷發(fā)展創(chuàng)新,不僅能夠提升人類的物質(zhì)文化生活水平,還能夠幫助人類進(jìn)行生產(chǎn)和工作,為人類制造更大的財富,有利于推動社會的發(fā)展與前行。
參考文獻(xiàn)
[1]陳君.人工智能助力圍棋發(fā)展[N].中國體育報,2017-05-31(002).
[2]王明光.圍棋人機(jī)大戰(zhàn)揭開人工智能新篇章[J].智慧中國,2016(04):27-29.
[3]荊超.人工智能攻破圍棋高地[J].方圓,2016(06):7.
作者簡介
劉欣雨(2000-),女,山東省淄博市人。高中在讀。
作者單位
山東省淄博第七中學(xué) 山東省淄博市 255400