您的位置: 首頁(yè) >科技 >

OpenAI推出強(qiáng)化學(xué)習(xí)訓(xùn)練為人工智能做準(zhǔn)備

2022-09-01 10:52:30 編輯:葉飄荷 來源:
導(dǎo)讀 開放人工智能今天宣布啟動(dòng)SpiningUp,一個(gè)旨在教任何人深入強(qiáng)化學(xué)習(xí)的項(xiàng)目。開放人工智能是眾所周知的,在虛擬環(huán)境中制造出時(shí)髦的代理,學(xué)...

開放人工智能今天宣布啟動(dòng)SpiningUp,一個(gè)旨在教任何人深入強(qiáng)化學(xué)習(xí)的項(xiàng)目。

開放人工智能是眾所周知的,在虛擬環(huán)境中制造出時(shí)髦的代理,學(xué)習(xí)如何獨(dú)自行走,如Humanoid v2或POLO,這是與華盛頓大學(xué)的合作。

強(qiáng)化學(xué)習(xí)包括在激勵(lì)環(huán)境中向代理人提供獎(jiǎng)勵(lì)信號(hào),以最大限度地提高其獎(jiǎng)勵(lì)以實(shí)現(xiàn)目標(biāo)。

RL已經(jīng)在重大的人工智能突破中發(fā)揮了作用,如谷歌深度思維的AlphaGo和在Dota2這樣的環(huán)境中訓(xùn)練的代理。

旋轉(zhuǎn)上升包括一組重要的強(qiáng)化學(xué)習(xí)研究論文,一個(gè)必要的術(shù)語表,以了解RL,和一個(gè)運(yùn)行練習(xí)的算法集合。

該項(xiàng)目的啟動(dòng)不僅是為了幫助人們了解強(qiáng)化學(xué)習(xí)是如何工作的,而且是為了通過讓更多來自計(jì)算機(jī)科學(xué)以外的領(lǐng)域的人參與進(jìn)來,朝著開放人工智能安全創(chuàng)建人工智能(AGI)的總體目標(biāo)取得進(jìn)展。

“解決人工智能安全問題需要具備廣泛專業(yè)知識(shí)和觀點(diǎn)的人,而且許多相關(guān)專業(yè)與工程或計(jì)算機(jī)科學(xué)毫無關(guān)聯(lián)。 盡管如此,每個(gè)參與者都需要學(xué)習(xí)足夠多的技術(shù)來做出明智的決定,以及幾個(gè)需要的自旋向上地址,“根據(jù)自旋向上文檔文本。

通過與開放人工智能學(xué)者和研究員合作,人們對(duì)人工智能有好奇的興趣,但在這一領(lǐng)域幾乎沒有經(jīng)驗(yàn)。

除了在實(shí)現(xiàn)安全部署AGI的目標(biāo)方面取得進(jìn)展外,該項(xiàng)目的創(chuàng)建是因?yàn)榻裉鞗]有一本教科書可以提供實(shí)施強(qiáng)化學(xué)習(xí)所需的知識(shí);目前的知識(shí)被鎖定在一系列不同的講座和有影響力的研究論文中。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。