• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      人工智能的巨大突破

      2016-04-25 13:15
      新潮電子 2016年4期
      關(guān)鍵詞:落子大腦神經(jīng)網(wǎng)絡(luò)

      在一場關(guān)乎人與機器、人工智能乃至人類未來命運的“人機大戰(zhàn)”中,代表人類出戰(zhàn)的韓國著名棋手、最近十年世界冠軍頭銜最多者李世石不敵谷歌人工智能系統(tǒng)AlphaGo(阿爾法狗),當勝敗塵埃落定時,更多注意力被放到了“AlphaGo靠什么擊敗李世石”這個問題上,相比用窮舉法暴力破解而戰(zhàn)勝卡斯帕羅夫的深藍,擁有自主深度學(xué)習(xí)進化的AlphaGo顯然更讓世人震驚。

      全球關(guān)注的人機世紀之戰(zhàn)

      人們總是對未知領(lǐng)域充滿了好奇與敬畏,從計算機誕生之日起,各種有關(guān)人工智能的猜想便從終止過。人們一方面希望人工智能能夠超越人類智慧,一方面又害怕被科技超越,矛盾的心態(tài)下,每一次以智慧為焦點的人機對戰(zhàn)都會成為市場關(guān)注的焦點。

      2016年3月9日至15日,被稱為“世紀人機大戰(zhàn)”的韓國棋手李世石VS谷歌圍棋機器人AlphaGo的比賽最終以AlphaGo贏得四局落下帷幕,雖然本身關(guān)注和懂得圍棋的人并不多,但這場人機世紀大戰(zhàn)卻通過各種渠道讓全球億萬計的人們知道了—人類智慧被人工智能打敗了!回顧以往的人機大戰(zhàn),人類并非永恒的勝者,美國IBM公司的“深藍”超級計算機以2勝1負3平戰(zhàn)勝了當時世界排名第一的國際象棋大師卡斯帕羅夫,但絕大多數(shù)人卻不以為意,除十分接近的勝敗結(jié)果外,深藍主要是依靠運算能力窮舉所有路數(shù)來選擇最佳策略,它當時可以實現(xiàn)每秒兩億步的運算。很多人覺得卡斯帕羅夫的落敗與體力有關(guān),深藍的策略多少有些“無賴”。

      但AlphaGo卻在“深藍”獲勝十九年后的今天,擁有自主深度學(xué)習(xí)進化的AlphaGo以難以讓人爭議的過程和結(jié)果,在圍棋這一人類智慧競技的高地上戰(zhàn)勝了韓國棋手李世石。

      能夠深層學(xué)習(xí)的AlphaGo

      “深藍”之所以能夠有超人的絕佳表現(xiàn),幾乎純粹是靠運算能力。依靠存儲的數(shù)百萬個國際象棋案例,能在眾多可能性中進行篩選,從而確定下一步棋的最佳位置。這給人感覺在用體力玩智慧游戲了,但AlphaGo卻給人們展示了一個幾乎完全靠自學(xué),并通過觀察成功與失敗案例來掌握得勝技巧的系統(tǒng)。谷歌利用大數(shù)據(jù)與深度學(xué)習(xí)的技術(shù)優(yōu)勢為AlphaGo構(gòu)建了一套策略網(wǎng)絡(luò),機器通過深度學(xué)習(xí)能力,模擬人腦的機制來學(xué)習(xí)、判斷、決策。即AlphaGo可以從大量的棋譜和對局中學(xué)習(xí)策略,形成一套落子決策判斷與數(shù)據(jù)解讀的能力體系,讓其在沖殺狀態(tài)下懂得一套試探與引導(dǎo)的能力,最終成功擊敗人類棋手李世石。

      人類是惟一能夠?qū)⒅庇X(隱式的)和符號(顯式的)知識結(jié)合起來的物種,人類具有這樣的雙重能力,將前者轉(zhuǎn)換成后者,然后通過后者的反饋反過來改善前者,這在以往是人類擁有的特殊性和唯一性。但今天,AlphaGo無縫使用了分層的網(wǎng)絡(luò)(即深度卷積神經(jīng)網(wǎng)絡(luò))進行直覺學(xué)習(xí),強化,評估和策略,配以強悍的計算能力,它完全不需要解決任何語義復(fù)雜性并且可從容地從現(xiàn)實考慮中分離,人的思維模式加上科技的理性結(jié)合,這讓AlphaGo能夠在對局結(jié)束前30分鐘就向Google技術(shù)分析團隊報告自己確信必勝。

      下一步是理解

      沒有人性弱點的AlphaGo讓我們看到了人工智能神經(jīng)網(wǎng)絡(luò)的前景在于它在不斷縮小機器和人類之間的差距,而且隨著技術(shù)開發(fā)者的跟進,人工智能將會對理解人類語言,揣摩人類情感。

      理解人類,這對于巨頭們的想象空間在于,基于用戶需求的商業(yè)決策會因此更加精準。人機對戰(zhàn)讓我們看到,推理、判斷、分析問題等功能處理之外,識別人的情感與情緒與對人的語言理解力將是未來發(fā)展的高地。

      圍棋大戰(zhàn),只能體現(xiàn)出,在封閉規(guī)則的計算領(lǐng)域,機器比人類聰明得多,因為我們的心算能力本身與計算器相差甚遠;但是思維、對話、情感等都是不確定的。而前面說到,機器沒有情緒,只有它懂得了人類的語言,逐漸了解人類表達的意思甚至是情緒,才意味著人工智能達到了更高的領(lǐng)地。AlphaGo及其背后的AI領(lǐng)域真的能實現(xiàn),而這一切都是建立在搜索的原理與算法的未來改進上。

      小知識:它不是一條狗

      阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由位于英國倫敦的谷歌(Google)旗下DeepMind公司的戴維 西爾弗、艾佳 黃和戴密斯 哈薩比斯與他們的團隊開發(fā),這個程序利用“價值網(wǎng)絡(luò)”去計算局面,用“策略網(wǎng)絡(luò)”去選擇下子。2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾;2016年3月對戰(zhàn)世界圍棋冠軍、職業(yè)九段選手李世石,并以4:1的總比分獲勝。

      四位一體的AlphaGo系統(tǒng)

      歸根到底,AlphaGo系統(tǒng)目前還是一件科技產(chǎn)物,其本身由走棋網(wǎng)絡(luò)、快速走子、估值網(wǎng)絡(luò)和蒙特卡羅樹搜索四個部分組成,正是這四個部分的協(xié)同與融合,讓AlphaGo擁有能夠?qū)W習(xí)的智慧,最終戰(zhàn)勝李世石。走棋網(wǎng)絡(luò)(Policy Network),給定當前局面,預(yù)測/采樣下一步的走棋??焖僮咦樱‵ast rollout),目標和1一樣,但在適當犧牲走棋質(zhì)量的條件下,速度要比1快1000倍。 估值網(wǎng)絡(luò)(Value Network),給定當前局面,估計是白勝還是黑勝。蒙特卡羅樹搜索(Monte Carlo Tree Search,MCTS),把以上這三個部分連起來,形成一個完整的系統(tǒng)。

      讓電腦擁有棋感的走棋網(wǎng)絡(luò)

      走棋網(wǎng)絡(luò)把當前局面作為輸入,預(yù)測/采樣下一步的走棋。它的預(yù)測不只給出最強的一手,而是對棋盤上所有可能的下一著給一個分數(shù)。棋盤上有361個點,它就給出361個數(shù),好招的分數(shù)比壞招要高。以往的科技只是單純基于規(guī)則或者基于局部形狀,利用簡單的線性分類器訓(xùn)練完成走子,整個過程是不可能形成類似人類圍棋選手的棋感。

      AlphaGo去利用更高效的、寬度為192的網(wǎng)絡(luò)(正常棋盤上有361個點,電腦給出361個數(shù),好招的分數(shù)比壞招要高。),下出有最高置信度的落子。這樣的做法一點也沒有做搜索,但是大局觀非常強,不會陷入局部戰(zhàn)斗中,說它建模了“棋感”一點也沒有錯。但是走棋網(wǎng)絡(luò)會不顧大小無謂爭劫,會無謂脫先,不顧局部死活,對殺出錯等等,更多像是高手憑借“自覺”在下棋,因而需要加入搜索功能,讓電腦做出有價值的判斷。

      追求效率的快速走子

      作為人類智慧競技的高地,圍棋用用天文數(shù)字般的局面數(shù),走棋網(wǎng)絡(luò)能讓AlphaGo達到3毫秒的下子速度,但想要進一步提高AlphaGo的“反應(yīng)”及“思考”能力,就需要快速走子系統(tǒng)的幫助了。

      利用傳統(tǒng)的局部特征匹配(local pattern matching)加線性回歸(logisticregression)的方法,AlphaGo在吸納了眾多高手對局之后就具備了用梯度下降法自動調(diào)參的能力,從而實現(xiàn)了2微秒的走子速度和24.2%的走子準確率。24.2%的意思是說它的最好預(yù)測和圍棋高手的下子有0.242的概率是重合的,相比之下,走棋網(wǎng)絡(luò)在GPU上用2毫秒能達到57%的準確率。在AlphaGo有了快速走子之后,不需要走棋網(wǎng)絡(luò)和估值網(wǎng)絡(luò),不借助任何深度學(xué)習(xí)和GPU的幫助,不使用增強學(xué)習(xí),在單機上就已經(jīng)達到非常高的水平了。

      錦上添花的估值網(wǎng)絡(luò)

      估值網(wǎng)絡(luò)對盤面的評估應(yīng)用上同快速走子有些重疊,都是通過模擬落子得分評估當前及后面布局的優(yōu)劣,但通過估值網(wǎng)絡(luò)和快速走子的互補,在復(fù)雜的死活或?qū)r,也就是進行到中盤階段的時候,估值網(wǎng)絡(luò)的重要性就會得到提升。前面提到AlphaGo能夠提前30分鐘知道自己必勝,估值網(wǎng)絡(luò)就起到了很大的作用。

      盡量選擇更好的蒙特卡羅樹搜索

      “蒙特卡洛樹搜索”是一種啟發(fā)式的搜索策略,能夠基于對搜索空間的隨機抽樣來擴大搜索樹,從而分析圍棋這類游戲中每一步棋應(yīng)該怎么走才能夠創(chuàng)造最好機會。

      一位名叫蘇椰的知乎用戶舉了這樣一個例子,以通俗的語言進行了解釋:假如筐里有100個蘋果,讓我每次閉眼拿1個,挑出最大的。于是我隨機拿1個,再隨機拿1個跟它比,留下大的,再隨機拿1個……我每拿一次,留下的蘋果都至少不比上次的小。拿的次數(shù)越多,挑出的蘋果就越大,但我除非拿100次,否則無法肯定挑出了最大的。這個挑蘋果的算法,就屬于蒙特卡羅算法:盡量找好的,但不保證是最好的。

      擁有兩個大腦的AlphaGo

      AlphaGo是通過兩個不同神經(jīng)網(wǎng)絡(luò)“大腦”合作來改進下棋。這些大腦是多層神經(jīng)網(wǎng)絡(luò)跟那些Google圖片搜索引擎識別圖片在結(jié)構(gòu)上是相似的。它們從多層啟發(fā)式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網(wǎng)絡(luò)處理圖片一樣。經(jīng)過過濾,13個完全連接的神經(jīng)網(wǎng)絡(luò)層產(chǎn)生對它們看到的局面判斷。這些層能夠做分類和邏輯推理。

      AlphaGo的第一個神經(jīng)網(wǎng)絡(luò)大腦科學(xué)全稱應(yīng)該是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)(Policy Network)”,觀察棋盤布局企圖找到最佳的下一步。團隊通過在KGS(網(wǎng)絡(luò)圍棋對戰(zhàn)平臺)上最強人類對手,百萬級的對弈落子去訓(xùn)練大腦。這就是AlphaGo最像人的地方,目標是去學(xué)習(xí)那些頂尖高手的妙手。這個不是為了去下贏,而是去找一個跟人類高手同樣的下一步落子。AlphaGo這個大腦的出色之處在于不單要模仿學(xué)習(xí),更要追求速度,不斷模擬計算圍棋局面變化,最終選擇正確率最高的落子。

      價值評估則可看做AlphaGo的第二個大腦,通過整體局面判斷來輔助落子選擇器。AlphaGo能夠決定是否通過特殊變種去深入閱局面和落子,如果局面評估器說這個特殊變種不行,那么AI就跳過閱讀在這一條線上的任何更多落子。

      深度神經(jīng)網(wǎng)絡(luò)的運用

      人類在下圍棋時,通常會經(jīng)歷常識-棋感-計算-判斷四個過程,AlphaGo的常識源于其“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)(Policy Network)”帶來的深層學(xué)習(xí)能力,而棋感和計算則需要深度神經(jīng)網(wǎng)絡(luò)同蒙特卡洛算法的融合,兩者的融合讓AlphaGo整個運作方式更接近人類。通過對比使用蠻力計算的“深藍”眼中的國際象棋落子思路和AlphaGo眼中的圍棋落子思路會發(fā)現(xiàn),圍棋的復(fù)雜度需要更“聰明”的AI才能完成了。

      兩個大腦加上深度神經(jīng)網(wǎng)絡(luò),AlphaGo以Value networks來評估大量的選點,而以Policy networks來選擇落子,并且開發(fā)了一種新式算法來結(jié)合蒙特卡洛算法和以上兩個神經(jīng)網(wǎng)絡(luò)。在這種結(jié)合下,研究者們結(jié)合參考人類職業(yè)對局的監(jiān)督式學(xué)習(xí),和AI大量積累自對弈實現(xiàn)的深度學(xué)習(xí),來訓(xùn)練和提高AI的圍棋實力。

      AI的進步與期望

      圍棋代表了很多人工智能所面臨的困難:具有挑戰(zhàn)性的決策制定任務(wù)、難以破解的查找空間問題和優(yōu)化解決方案如此復(fù)雜以至于用一個策略或價值函數(shù)幾乎無法直接得出。通過將策略和價值網(wǎng)絡(luò)與樹搜索結(jié)合起來,AlphaGo終于達到了專業(yè)圍棋水準,讓我們看到了希望:在其他看起來無法完成的領(lǐng)域中,AI也可以達到人類級別的表現(xiàn)。

      當然,這一切都是建立在人類千年來在圍棋領(lǐng)域積累上的,沒有積累就不會圍棋AI的今天。AlphaGo讓世人看到了AI領(lǐng)域的巨大進步,但想要真正理解人類和語言,其還有一段很長的路要走。相比圍棋,人類在生活上的行為習(xí)慣,需要AlphaGo們擁有更出色的學(xué)習(xí)能力以及判斷能力,無論是存儲容量還是搜索算法,都需要幾何倍數(shù)的遞增,從這個角度看,現(xiàn)在擔(dān)心AlphaGo們擁有自己的意識或情感,都太早了一些。

      滲透進入人們生后的AI

      AlphaGo不是DeepMind惟一項目,也不是最大的項目。DeepMind的最終目標是智能助手、醫(yī)療和機器人。另外,盡管AlphaGo只是針對圍棋開發(fā)的系統(tǒng),但其原理可以被應(yīng)用到現(xiàn)實問題中。以醫(yī)療為例,IBM已經(jīng)依靠認知學(xué)習(xí)平臺“Watson”進入了醫(yī)療領(lǐng)域,Watson在泰國和印度的兩家醫(yī)院協(xié)助醫(yī)生診斷乳腺癌、肺癌和結(jié)腸直腸癌。盡管Watson自身不會診斷疾病,但它能夠找到醫(yī)生應(yīng)該進一步認真檢查的地方,并提出治療方案。

      而無人駕駛汽車其實也可以看做具備了身軀的AI,家喻戶曉的特斯拉汽車便使用了基于深度學(xué)習(xí)的現(xiàn)有計算機視覺技術(shù)。當然,工業(yè)或者服務(wù)用機器人都是AI滲透進入人們生活的表現(xiàn)。AI公司們正在努力晚上其產(chǎn)品,爭取能夠無縫進入人們生活的各個領(lǐng)域,當AI設(shè)備在可靠性、適應(yīng)性和靈活性等方面都有長足進步時,人們未來的生活也將變得更美好。

      谷歌改變?nèi)祟惖囊靶?/p>

      AlphaGo很強大很厲害,但對于近年來谷歌的謀劃而言,AlphaGo無非是其在人工智能領(lǐng)域的小玩具而已。改組Alphabet的谷歌,瘋狂地在全球收購各個尖端前沿領(lǐng)域的頂尖公司,把觸角伸到了生命科學(xué)、人工智能、無人駕駛、虛擬現(xiàn)實等等許多的領(lǐng)域。AlphaGo背后的英國Deepmind公司,只是他們收購的許許多多家公司中的一個而已。

      除了傳統(tǒng)Youtube、Gmail和地圖等等互聯(lián)網(wǎng)業(yè)務(wù),生命科學(xué)、人工智能、無人駕駛、虛擬現(xiàn)實等新領(lǐng)域其實谷歌并沒有賺到什么錢,更多是對未來的投資和布局,但今天,AlphaGo的表現(xiàn)已經(jīng)讓我們看到了谷歌的投入回報,再加上眾多具有顛覆性或者劃時代意義的谷歌黑科技,讓我們清楚看到了谷歌改變?nèi)祟愇磥淼囊靶摹O啾戎?,國?nèi)BAT三大巨頭在技術(shù)積淀和領(lǐng)域格局方面,就顯得有些小氣了。

      人工智能的競賽

      在2010年到2015年期間,企業(yè)對人工智能創(chuàng)業(yè)公司的投資增長了15倍。BBC預(yù)測,人工智能市場將繼續(xù)保持高速增長,2020年全球市場規(guī)模將達到183億美元,約合人民幣1190億元。龐大的數(shù)據(jù)和潛力,足以讓企業(yè)們瘋狂。

      在硅谷,截至2015年初就有超過1700家創(chuàng)業(yè)公司加入人工智能浪潮—這一數(shù)字過去1年還在不斷增加之中。谷歌、Facebook、亞馬遜等科技巨頭們的巨大投入都推動AI整個領(lǐng)域取得巨大進步。圖像識別、語音識別已經(jīng)成為蘋果、微軟、Google、IBM等科技大公司激烈競爭的焦點,而在醫(yī)療識別、模擬大腦圖像等細分領(lǐng)域中,也涌現(xiàn)出不少初創(chuàng)的科技企業(yè)??梢哉f,一場席卷全球的AI競賽正在展開,誰能讓科技變得更聰明,誰就有望在未來的競爭中占據(jù)有利位置。

      寫在最后:絕非取代

      如同第一個工業(yè)革命中蒸汽機的出現(xiàn)取代藍領(lǐng)工作一樣,人類多個工種被人工智能最終取代也無法讓人避免。但人工智能能夠更精準、高效地幫助人們完成工作是肯定的,而人類那具有惟一性的大腦,未來的定位應(yīng)該在創(chuàng)造!人類大腦和人工智能的合作,一定能共同推動整個人類社會的進步。

      猜你喜歡
      落子大腦神經(jīng)網(wǎng)絡(luò)
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      琴(外一首)
      銀行理財子公司“落子”布局
      落子山東,意在全局
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
      90后唐丹:人生如棋,落子不悔
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
      荔浦县| 磴口县| 政和县| 自贡市| 永宁县| 财经| 营山县| 郁南县| 青阳县| 山丹县| 闽清县| 托克逊县| 曲水县| 大渡口区| 普兰店市| 上饶市| 高密市| 茌平县| 富民县| 道真| 广西| 贵港市| 铁力市| 醴陵市| 满洲里市| 宾阳县| 富裕县| 若尔盖县| 运城市| 玉屏| 平度市| 克拉玛依市| 惠水县| 锡林郭勒盟| 张家界市| 肃南| 巍山| 甘洛县| 蒲城县| 容城县| 巫溪县|