您的位置: 首頁(yè) >互聯(lián)網(wǎng) >

深度學(xué)習(xí)算法比任何人都更快地解決了Rubik的立方體

2022-07-15 21:04:40 編輯:諸霞容 來(lái)源:
導(dǎo)讀 自從1974年由匈牙利建筑師發(fā)明以來(lái),Rubik's Cube一直在努力解決許多人的問(wèn)題,但3D邏輯謎題與加州大學(xué)歐文分校的研究人員創(chuàng)建的人工...

自從1974年由匈牙利建筑師發(fā)明以來(lái),Rubik's Cube一直在努力解決許多人的問(wèn)題,但3D邏輯謎題與加州大學(xué)歐文分校的研究人員創(chuàng)建的人工智能系統(tǒng)無(wú)法匹敵。

DeepCubeA是由UCI計(jì)算機(jī)科學(xué)家和數(shù)學(xué)家編寫(xiě)的深度強(qiáng)化學(xué)習(xí)算法,可以在幾分之一秒內(nèi)找到解決方案,沒(méi)有任何特定的領(lǐng)域知識(shí)或來(lái)自人類(lèi)的游戲內(nèi)輔導(dǎo)??紤]到立方體的完成路徑編號(hào)為數(shù)十億但只有一個(gè)目標(biāo)狀態(tài) - 六個(gè)邊中的每一個(gè)都顯示純色 - 這顯然無(wú)法通過(guò)隨機(jī)移動(dòng)找到,這不是一項(xiàng)簡(jiǎn)單的任務(wù)。

對(duì)于發(fā)表在Nature Machine Intelligence上的一項(xiàng)研究,研究人員證明,DeepCubeA解決了100%的所有測(cè)試配置,在60%的時(shí)間內(nèi)找到了通往目標(biāo)狀態(tài)的最短路徑。該算法還適用于其他組合游戲,如滑動(dòng)拼圖游戲,Lights Out和Sokoban。

“人工智能可以擊敗世界上最好的人類(lèi)象棋和圍棋玩家,但是一些比較困難的難題,比如魔方,并沒(méi)有被計(jì)算機(jī)解決,因此我們認(rèn)為他們對(duì)人工智能方法是開(kāi)放的,”資深作者 皮埃爾說(shuō)。 Baldi,UCI計(jì)算機(jī)科學(xué)杰出教授。“Rubik's Cube的解決方案涉及更多的象征性,數(shù)學(xué)和抽象思維,因此可以破解這樣一個(gè)難題的深度學(xué)習(xí)機(jī)器越來(lái)越接近成為一個(gè)可以思考,推理,計(jì)劃和制定決策的系統(tǒng)。”

研究人員有興趣了解AI如何以及為何采取行動(dòng)以及完善其方法需要多長(zhǎng)時(shí)間。他們從一個(gè)完成的謎題的計(jì)算機(jī)模擬開(kāi)始,然后擾亂了立方體。一旦代碼到位并運(yùn)行,DeepCubeA將隔離培訓(xùn)兩天,解決了一系列日益困難的組合。

“它獨(dú)自學(xué)習(xí),”Baldi指出。

有些人,特別是青少年,可以匆忙解決魔方,但他們甚至需要大約50步。

“我們的人工智能需要大約20次動(dòng)作,大部分時(shí)間都是以最少的步數(shù)解決它,”Baldi說(shuō)。“就在那里,你可以看到策略是不同的,所以我最好的猜測(cè)是AI的推理形式與人類(lèi)完全不同。”

這位資深計(jì)算機(jī)科學(xué)家表示,像這樣的項(xiàng)目的最終目標(biāo)是建立下一代AI系統(tǒng)。無(wú)論他們是否知道,人們每天都會(huì)通過(guò)Siri和Alexa等應(yīng)用程序以及在他們喜歡的在線服務(wù)幕后工作的推薦引擎感受人工智能。

“但這些系統(tǒng)并不是真正的智能; 他們很脆弱,你很容易打破或欺騙他們,“巴爾迪說(shuō)。“我們?nèi)绾蝿?chuàng)建更智能,更強(qiáng)大且能夠推理,理解和規(guī)劃的高級(jí)AI?這項(xiàng)工作朝著這個(gè)沉重的目標(biāo)邁出了一步。“


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。