• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      AI上臺,人類棄牌

      2019-08-12 05:36:48Sora
      看世界 2019年16期
      關(guān)鍵詞:霍爾姆桑德撲克

      Sora

      卡內(nèi)基-梅隆大學的計算機科學教授桑德霍爾姆

      2017年的賭場錦標賽期間,一個名為Libratus的撲克游戲程序,在1.2萬手雙人撲克比賽中,巧妙地擊敗了4名職業(yè)選手。但該程序的聯(lián)合創(chuàng)作者托馬斯·桑德霍爾姆,并不認為人工智能可以在與更多的選手對陣時達到類似的表現(xiàn)。

      兩年后,來自卡內(nèi)基-梅隆大學的計算機科學教授桑德霍爾姆,證明了他自己是錯的。桑德霍爾姆和他的合作伙伴,共同開發(fā)了一個名為Pluribus的人工智能程序,它可以在六人無限制撲克比賽中一直擊敗人類職業(yè)牌手。桑德霍爾姆說:“我一生中從未想過可以達成這個目標?!?h3>多人決策

      過去,人工智能對人類的勝利,僅涉及兩人或兩隊的對戰(zhàn)比賽,如跳棋、國際象棋、圍棋和雙人無限制撲克。這些游戲都是零和游戲—游戲只有一個勝利方和一個失敗方。但是,六人撲克則更接近現(xiàn)實生活,在這種情況下,一方必須在不了解多個對手的決策過程和資源的情況下,做出決定。

      臉書的人工智能研究科學家、Pluribus的聯(lián)合創(chuàng)始人諾姆·布朗說:“這是我們第一次超越零和游戲這種常規(guī)模式。即使在通常情況下,人工智能也能做得很好?!?/p>

      Pluribus程序在與5名人類玩家對抗的比賽中,贏得了獎金。人類玩家來自15名撲克職業(yè)玩家組成的輪換陣容,他們中的每個人都在撲克錦標賽中贏得過至少100萬美元的獎金。比賽歷時12天,進行了超過1萬手出牌。

      《科學》雜志上發(fā)表的一篇論文,詳細介紹了這個成功案例。盡管Pluribus并未達到與Libratus以及另一個名為DeepStack的雙人撲克程序一樣高的勝率,但它的勝率仍然非常可觀。“當機器人與人類坐在一起時,它賺了很多錢,”布朗說,“我當然會將其描述為‘超人的表現(xiàn)?!?h3>低耗模擬

      Pluribus首先要在許多模擬的撲克對局中與自己對抗,制定戰(zhàn)略藍圖。

      Pluribus解決六人撲克游戲的重大突破,來自其“深度限制搜索功能”。該組件允許人工智能向前看幾步,并根據(jù)對手可能的決定,為游戲的剩余部分找出更好的策略。

      許多其他的撲克游戲程序,也使用了類似的搜索功能,但為了六人撲克游戲這么做,需要動用極大的計算內(nèi)存量:每個玩家持有的牌數(shù),每個人認為其他玩家所擁有的手牌,以及隨后的所有投注決定……這其中有太多場景需要模擬。

      Libratus只在最后四輪中的兩輪投注里,使用搜索來克服運算瓶頸。該解決方案在僅有兩個玩家的對局中,就需要使用100個CPU來處理數(shù)據(jù)。

      職業(yè)撲克選手通常認為進行“反主動下注”是一個錯誤,但是Pluribus卻會頻繁地使用這種手段。

      具體來說,在一場現(xiàn)場撲克游戲中,Pluribus是在一臺只有2個中央CPU和128GB內(nèi)存的機器上運行的?!八梢栽跊]有圖形處理單元和其他高端硬件的情況下運行?!鄙5禄魻柲氛f。相比之下,DeepMind著名的AlphaGo程序,在2016年與頂級職業(yè)棋手李世石九段對決的圍棋比賽中,使用了1920個CPU和280個GPU。

      Pluribus采用的深度限制搜索功能,考慮對手在基本投注策略中如何選擇:有人偏向棄牌,有人偏向于叫牌,還有人偏向于加注。這個經(jīng)過調(diào)整的搜索功能,有助于解釋為什么Pluribus在六人撲克比賽中獲得成功—需要的計算資源和內(nèi)存相對最小。

      用途多樣

      卡內(nèi)基-梅隆大學和臉書,計劃制作Pluribus的偽代碼(一種算法描述語言),詳細解釋該程序中的每個必要步驟,并與已發(fā)表的論文一起提供,以便其他人工智能研究人員可以重現(xiàn)這些效果。

      不過,該團隊最后決定不發(fā)布該代碼,因為它可能會促進人工智能撲克程序的傳播,對在線撲克社區(qū)和撲克行業(yè)造成極大的破壞。

      而且,即使沒有代碼,人類也可以從人工智能的策略中學習。例如,職業(yè)撲克選手通常認為進行“反主動下注”是一個錯誤—上一輪進行了非積極投注之后,對新開始的一輪進行積極投注。但是Pluribus卻會頻繁地使用這種手段。

      除了撲克之外,該人工智能可以應用在人類沒有充分了解或思考的任何場景中。這些領(lǐng)域可能包括網(wǎng)絡安全、金融交易、商業(yè)談判和競價。桑德霍爾姆表示,這個人工智能甚至可以在2020年美國總統(tǒng)大選的黨內(nèi)初選中起作用:理論上來說,參與競爭的候選人可以從人工智能的建議中獲益,這些建議包括只需花費恰好足夠的廣告資金在關(guān)鍵州獲勝,充分利用有限的競選資金。

      桑德霍爾姆創(chuàng)立了三家初創(chuàng)公司,包括戰(zhàn)略機器和戰(zhàn)略機器人公司,很可能會將這種人工智能融入為商業(yè)和軍事客戶提供的服務中。

      諾姆·布朗計劃進一步探索人工智能如何適應更復雜的多人游戲場景?!岸嗳藫淇艘呀?jīng)是最后一個里程碑了,”布朗說,“現(xiàn)在我們正在尋求將其應用擴展到撲克之外?!?/p>

      猜你喜歡
      霍爾姆桑德撲克
      小撲克打出大品牌
      華人時刊(2022年15期)2022-10-27 09:06:08
      Elizabeth Holmes:醫(yī)療界的喬布斯
      究竟誰在說謊
      最環(huán)保的撲克版空氣加濕器
      河北桑德再生塑料園區(qū)綠色發(fā)展研討會舉辦
      30歲女富豪,醫(yī)療界的喬布斯
      撲克英雄傳
      探索歷史(2013年9期)2013-12-12 03:59:38
      美“影院殺手”全A成績畢業(yè) 包括生命倫理課程
      蝴蝶翅膀上的26個字母
      知識窗(2011年2期)2011-05-14 09:07:53
      巧擺撲克等
      古田县| 揭西县| 锡林郭勒盟| 大连市| 茶陵县| 京山县| 略阳县| 三明市| 万盛区| 舟曲县| 枣庄市| 临武县| 通江县| 延长县| 桐梓县| 遂溪县| 苍山县| 全南县| 大城县| 军事| 合川市| 襄城县| 永康市| 文水县| 漾濞| 汉源县| 宿州市| 曲沃县| 红河县| 醴陵市| 宜川县| 定兴县| 沙坪坝区| 贵德县| 沈丘县| 顺平县| 东港市| 屯昌县| 清河县| 五指山市| 金堂县|