深度學(xué)習(xí)算法比任何人都更快地解決了Rubik的立方體

2022-07-15 21:04:40 編輯：諸霞容來(lái)源：

導(dǎo)讀自從1974年由匈牙利建筑師發(fā)明以來(lái)，Rubik's Cube一直在努力解決許多人的問(wèn)題，但3D邏輯謎題與加州大學(xué)歐文分校的研究人員創(chuàng)建的人工...

自從1974年由匈牙利建筑師發(fā)明以來(lái)，Rubik's Cube一直在努力解決許多人的問(wèn)題，但3D邏輯謎題與加州大學(xué)歐文分校的研究人員創(chuàng)建的人工智能系統(tǒng)無(wú)法匹敵。

DeepCubeA是由UCI計(jì)算機(jī)科學(xué)家和數(shù)學(xué)家編寫(xiě)的深度強(qiáng)化學(xué)習(xí)算法，可以在幾分之一秒內(nèi)找到解決方案，沒(méi)有任何特定的領(lǐng)域知識(shí)或來(lái)自人類(lèi)的游戲內(nèi)輔導(dǎo)?？紤]到立方體的完成路徑編號(hào)為數(shù)十億但只有一個(gè)目標(biāo)狀態(tài) - 六個(gè)邊中的每一個(gè)都顯示純色 - 這顯然無(wú)法通過(guò)隨機(jī)移動(dòng)找到，這不是一項(xiàng)簡(jiǎn)單的任務(wù)。

對(duì)于發(fā)表在Nature Machine Intelligence上的一項(xiàng)研究，研究人員證明，DeepCubeA解決了100%的所有測(cè)試配置，在60%的時(shí)間內(nèi)找到了通往目標(biāo)狀態(tài)的最短路徑。該算法還適用于其他組合游戲，如滑動(dòng)拼圖游戲，Lights Out和Sokoban。

“人工智能可以擊敗世界上最好的人類(lèi)象棋和圍棋玩家，但是一些比較困難的難題，比如魔方，并沒(méi)有被計(jì)算機(jī)解決，因此我們認(rèn)為他們對(duì)人工智能方法是開(kāi)放的，”資深作者皮埃爾說(shuō)。 Baldi，UCI計(jì)算機(jī)科學(xué)杰出教授。“Rubik's Cube的解決方案涉及更多的象征性，數(shù)學(xué)和抽象思維，因此可以破解這樣一個(gè)難題的深度學(xué)習(xí)機(jī)器越來(lái)越接近成為一個(gè)可以思考，推理，計(jì)劃和制定決策的系統(tǒng)。”

研究人員有興趣了解AI如何以及為何采取行動(dòng)以及完善其方法需要多長(zhǎng)時(shí)間。他們從一個(gè)完成的謎題的計(jì)算機(jī)模擬開(kāi)始，然后擾亂了立方體。一旦代碼到位并運(yùn)行，DeepCubeA將隔離培訓(xùn)兩天，解決了一系列日益困難的組合。

“它獨(dú)自學(xué)習(xí)，”Baldi指出。

有些人，特別是青少年，可以匆忙解決魔方，但他們甚至需要大約50步。

“我們的人工智能需要大約20次動(dòng)作，大部分時(shí)間都是以最少的步數(shù)解決它，”Baldi說(shuō)。“就在那里，你可以看到策略是不同的，所以我最好的猜測(cè)是AI的推理形式與人類(lèi)完全不同。”

這位資深計(jì)算機(jī)科學(xué)家表示，像這樣的項(xiàng)目的最終目標(biāo)是建立下一代AI系統(tǒng)。無(wú)論他們是否知道，人們每天都會(huì)通過(guò)Siri和Alexa等應(yīng)用程序以及在他們喜歡的在線服務(wù)幕后工作的推薦引擎感受人工智能。

“但這些系統(tǒng)并不是真正的智能; 他們很脆弱，你很容易打破或欺騙他們，“巴爾迪說(shuō)。“我們?nèi)绾蝿?chuàng)建更智能，更強(qiáng)大且能夠推理，理解和規(guī)劃的高級(jí)AI?這項(xiàng)工作朝著這個(gè)沉重的目標(biāo)邁出了一步。“

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！