OpenAI推出強化學(xué)習(xí)訓(xùn)練為人工智能做準(zhǔn)備

2022-09-01 10:52:30 編輯：葉飄荷來源：

導(dǎo)讀開放人工智能今天宣布啟動SpiningUp，一個旨在教任何人深入強化學(xué)習(xí)的項目。開放人工智能是眾所周知的，在虛擬環(huán)境中制造出時髦的代理，學(xué)...

開放人工智能今天宣布啟動SpiningUp，一個旨在教任何人深入強化學(xué)習(xí)的項目。

開放人工智能是眾所周知的，在虛擬環(huán)境中制造出時髦的代理，學(xué)習(xí)如何獨自行走，如Humanoid v2或POLO，這是與華盛頓大學(xué)的合作。

強化學(xué)習(xí)包括在激勵環(huán)境中向代理人提供獎勵信號，以最大限度地提高其獎勵以實現(xiàn)目標(biāo)。

RL已經(jīng)在重大的人工智能突破中發(fā)揮了作用，如谷歌深度思維的AlphaGo和在Dota2這樣的環(huán)境中訓(xùn)練的代理。

旋轉(zhuǎn)上升包括一組重要的強化學(xué)習(xí)研究論文，一個必要的術(shù)語表，以了解RL，和一個運行練習(xí)的算法集合。

該項目的啟動不僅是為了幫助人們了解強化學(xué)習(xí)是如何工作的，而且是為了通過讓更多來自計算機科學(xué)以外的領(lǐng)域的人參與進來，朝著開放人工智能安全創(chuàng)建人工智能(AGI)的總體目標(biāo)取得進展。

“解決人工智能安全問題需要具備廣泛專業(yè)知識和觀點的人，而且許多相關(guān)專業(yè)與工程或計算機科學(xué)毫無關(guān)聯(lián)。盡管如此，每個參與者都需要學(xué)習(xí)足夠多的技術(shù)來做出明智的決定，以及幾個需要的自旋向上地址，“根據(jù)自旋向上文檔文本。

通過與開放人工智能學(xué)者和研究員合作，人們對人工智能有好奇的興趣，但在這一領(lǐng)域幾乎沒有經(jīng)驗。

除了在實現(xiàn)安全部署AGI的目標(biāo)方面取得進展外，該項目的創(chuàng)建是因為今天沒有一本教科書可以提供實施強化學(xué)習(xí)所需的知識;目前的知識被鎖定在一系列不同的講座和有影響力的研究論文中。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請聯(lián)系刪除！