2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯網 版權歸原作者所有。
布朗大學和麻省理工學院的研究人員開發(fā)出一種方法,通過構建周圍世界的抽象表示來幫助機器人規(guī)劃多步驟任務。他們的研究發(fā)表在人工智能研究雜志上,是朝著建造能夠像人一樣思考和行動的機器人邁出的一步。
對于機器人來說,規(guī)劃是一件非常困難的事情,主要是因為他們如何看待并與世界互動。甲機器人的世界的感知包括無非由其照相機采集的像素的繁多更多,并且其采取行動的能力被限制在設置控制其接頭和夾具各個電機的位置。它缺乏對這些像素如何與我們在世界上可能認為有意義的概念相關的天生的理解。
布朗的計算機科學助理教授,新研究的主要作者喬治科尼達里斯說:“與世界的低級界面使人們很難決定做什么。” “想象一下,如果你不得不考慮你想要到達的每一塊肌肉,那么計劃像去雜貨店一樣簡單的東西是多么困難,并提前和詳細想象數TB的視覺數據。一路走過你的視網膜。你會立刻陷入細節(jié)之中。人們當然不會那樣計劃。我們能夠引入抽象的概念,拋棄那么多無關緊要的細節(jié)和只關注重要的事情。“
即使是最先進的機器人也無法實現這種抽象。當我們看到機器人計劃和執(zhí)行多步驟任務的演示時,“幾乎總是如此,程序員已明確告訴機器人如何思考這個世界以便制定計劃,”Konidaris說。“但如果我們想要能夠更自主地行動的機器人,他們將需要自己學習抽象的能力。”
在計算機科學術語中,這些類型的抽象分為兩類:“程序抽象”和“感知抽象”。程序抽象是由低級別動作組成的程序,由較高級別的技能組成。一個例子是捆綁打開門所需的所有小動作 - 所有涉及到旋鈕的電機運動,轉動它并將門拉開 - 進入單個“打開門”技能。一旦建立了這樣的技能,您就不必擔心它是如何工作的。您需要知道的是何時運行它。他說,機器人專家 - 包括Konidaris本人 - 一直在研究如何讓機器人多年來學習程序抽象。
但根據Konidaris的說法,在感知抽象方面的進展較少,這與幫助機器人理解其像素化環(huán)境有關。這是這項新研究的重點。
在這項研究中,研究人員將一個名為Anathema Device(或Ana,簡稱Ana)的機器人引入一個房間,該房間內有一個櫥柜,一個冷卻器,一個控制櫥柜內燈光的開關,以及一個可以留在冷卻器中的瓶子?;驒还?。他們給Ana一套高級運動技能,用于操縱房間內的物體 - 打開和關閉冷卻器和櫥柜,翻轉開關并拿起一個瓶子。然后他們讓Ana松了一口氣,在房間里試用她的運動技能,在每次執(zhí)行技能之前和之后記錄她的相機和執(zhí)行器的感官數據。這些數據被輸入到團隊開發(fā)的機器學習算法中。
研究人員表明,Ana能夠學習一個非常抽象的環(huán)境描述,其中僅包含了她能夠執(zhí)行特定技能所必需的內容。例如,她了解到,為了打開冷卻器,她需要站在前面而不要拿任何東西(因為她需要雙手打開蓋子)。她還學會了與冷卻器蓋子關閉相關的視野中像素的正確配置,這是唯一可以打開它的配置。
她學到了與她的其他技能相關的類似抽象。例如,她了解到櫥柜內的燈光非常明亮,以至于它的傳感器變亮了。因此,為了操縱櫥柜內的瓶子,燈必須關閉。她還了解到,為了關燈,需要關閉櫥柜門,因為打開的門阻擋了她對開關的接觸。由此產生的抽象表示將所有知識從高清圖像提取到文本文件,只有126行。
“這些都是關于她周圍環(huán)境的重要抽象概念,”科尼達里斯說。“門需要在打開之前關閉。除非它打開,否則你不能將瓶子從柜子里拿出來,等等。而且只要執(zhí)行她的技能并看到會發(fā)生什么,她就能學會它們。”
一旦Ana手持她學到的抽象表現,研究人員就要求她做一些需要一些計劃的事情:從冷卻器中取出瓶子并將其放入櫥柜中。
正如他們希望的那樣,安娜航行到冷卻器并打開它以露出瓶子。但她沒有接受它。相反,她提前計劃了。她意識到,如果她把瓶子放在她的抓手里,那么她將無法打開櫥柜,因為這樣做需要雙手。因此,在打開冷卻器后,她導航到了櫥柜。在那里,她看到燈開關處于“開”位置,她意識到打開柜子會擋住開關,所以她在打開柜子之前關閉了開關,返回冷卻器并取回瓶子,最后放置它在櫥柜里。簡而言之,她提前計劃,發(fā)現問題并在問題發(fā)生之前加以解決。
“我們沒有向Ana提供她為計劃任務所需的任何抽象陳述,”Konidaris說。“她自己學習了這些抽象,一旦有了這些抽象,計劃很容易。她發(fā)現這個計劃只有大約4毫秒。”
Konidaris表示,該研究為將人工智能應用于機器人技術提供了重要的理論基礎。他說:“我們相信讓我們的機器人能夠抽象而不是具體地進行規(guī)劃和學習,這將是構建真正智能機器人的基礎。” “如果你以正確的方式思考問題,很多問題往往都很簡單。”
Konidaris的合著者是來自麻省理工學院的Leslie Pack Kaelbling和Tomas Lozano-Perez。該研究得到了國防高級研究計劃局和麻省理工學院情報計劃的獎勵。
2016-2022 All Rights Reserved.平安財經網.復制必究 聯系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯網 版權歸原作者所有。