您現在的位置是:首頁 >互聯網 > 2020-10-20 11:35:22 來源:
OpenAI使用新的模擬技術來教機器人如何解決魔方
自動化Rubik的多維數據集求解器在機器人競賽中非常常見,因此吉尼斯世界紀錄為此專門設置了一個類別。但是OpenAI Inc.在該領域的新進入卻引人注目。
今天,人工智能研究實驗室推出了一只機器人手(如圖所示),弄清楚了如何在沒有人工指導的情況下解開魔方的瓷磚。它使用OpenAI開發的突破性培訓技術來實現這一目標,該技術可以幫助自己構建新一代更靈活,更適應性強的自主機器。
如今,大多數現存的機器人僅限于執行極其狹窄的任務。這不僅是硬件限制的結果,而且在某些情況下甚至不是主要的原因。相反,它與以下事實有關:訓練AI在現實世界中移動和操作充滿了障礙。
工程師大多依靠仿真為其機器人構建機器學習模型。基本思想是創建一個虛擬設置,該虛擬設置模仿系統將在其中運行的環境,將AI設置在內部松散并使其通過反復試驗來學習。經過數百萬次嘗試,神經網絡甚至可以掌握復雜的任務,例如 兩條腿走路。
問題是在需要將AI安裝在主機機器人上時開始的。模擬無法完全解決現實世界中存在的無數變量,這意味著機器學習模型通常最終會面臨無法教給他們的意外挑戰。
輸入OpenAI的新培訓方法。通過為訓練仿真注入不確定性,實驗室為AI配備了驅動其機器人手的AI,以應對意外情況。在一個學習環節中,虛擬房間的重力可能類似于地球表面上的重力,而在下一課程中,虛擬房間的重力可能更強,甚至來自不同的角度。
“我們隨機化的參數之一是魔方的大小,” OpenAI的研究人員在博客文章中詳細闡述。“ ADR從固定大小的魔方開始,然后隨著訓練的進行逐漸增加隨機范圍。我們將相同的技術應用于所有其他參數,例如立方體的質量,機器人手指的摩擦力和手的視覺表面材料。”
該過程由第二個機器學習模型執行,隨著機器人手的AI的提高,仿真變得越來越困難。研究人員解釋說:“隨著神經網絡在任務中變得更好并達到性能閾值,域隨機化的數量會自動增加。”
該項目取得了一些令人鼓舞的初步結果。當模型在現實環境中釋放時,它駕駛的機器人手戴著橡膠手套,用幾根手指綁在一起,設法解決了魔方,甚至當研究人員試圖用各種物體將立方體撞到地面上時。
OpenAI相信培訓技術也可能會在更嚴重的項目中得到應用。當遇到不可預見的障礙或障礙時,該方法可能使工業機器人,無人機和其他自主機器能夠動態修改其行為。這種多功能性將是實現AI的圣杯的重要一步,這是自學人工智能的通用智能。
自從7月份與微軟公司建立了10億美元的合作伙伴關系以來,Rubik的Cube求解器是OpenAI詳述的首批重大項目之一 。根據協議,微軟將為實驗室提供資本和云基礎設施,以支持研究,以換取知識產權。