2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
人工智能已經(jīng)超越了掌握撲克的最后一個重要里程碑:六人無限制德州撲克。
比起每個玩家都能看到整個局面的游戲,像撲克這樣的具有隱藏卡和虛張聲勢的玩家的游戲,對AI的挑戰(zhàn)更大。在過去的幾年中,計算機(jī)已經(jīng)成為越來越復(fù)雜的一對一撲克形式的王牌,但是多人游戲?qū)⑦@種復(fù)雜性提升到了一個新水平(SN在線:5/13/15)。
研究人員在7月11日的《科學(xué)》網(wǎng)上報道說,如今,一個被稱為Pluribus的紙牌鯊AI在六人制德州撲克比賽中勝過了十幾位精英專業(yè)人士??梢允褂么祟悈⒉畈积R的信息針對多個對手進(jìn)行密謀的算法可能會使精明的業(yè)務(wù)談判人員,政治策略師或網(wǎng)絡(luò)安全監(jiān)督者成為現(xiàn)實(shí)。
Pluribus通過與自己的副本進(jìn)行對抗來磨練其初始策略,從頭開始,逐步了解哪些行動有助于贏得勝利。然后,AI在每個手對五位人類玩家的第一輪下注中使用該直覺來確定何時握住和何時折疊。
在隨后的下注回合中,Pluribus想象了如果采取不同的動作游戲會如何進(jìn)行,從而對其策略進(jìn)行了微調(diào)。與為兩人撲克訓(xùn)練的人工智能不同,Pluribus并沒有完全推測到游戲結(jié)束–與如此多的玩家打交道時,這將需要太多的計算(SN:4/1/17,第12頁) 。取而代之的是,AI設(shè)想了一些前進(jìn)的步伐,并根據(jù)那些假設(shè)的未來和玩家可以采用的不同策略來決定要做什么。
在10,000張德州撲克比賽中,Pluribus與來自13位專業(yè)人員的五名選手競爭,他們?nèi)口A得了超過100萬美元的撲克游戲。每100手牌中,Pluribus平均從其人類競爭對手中贏利480美元。
紐約市Facebook AI Research的諾姆·布朗(Noam Brown)說:“這大約是精英人類專業(yè)人士所希望擊敗的弱者,”這意味著Pluribus比其人類對手更聰明。布朗與匹茲堡卡內(nèi)基梅隆大學(xué)的托馬斯·桑德霍爾姆共同創(chuàng)建了普里布斯。
布拉格捷克技術(shù)大學(xué)的計算機(jī)科學(xué)家ViliamLisý表示,既然現(xiàn)在AI已經(jīng)掌握了撲克,算法就可以在游戲中使用更復(fù)雜的隱藏信息來測試其戰(zhàn)略推理,他沒有參與這項工作。Lisý說,在像Kriegspiel這樣的游戲中(象棋副產(chǎn)品,玩家看不到彼此的棋子),未知數(shù)會比在對手胸前緊握幾張紙牌復(fù)雜得多。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。