您現在的位置是:首頁 >要聞 > 2020-12-03 09:10:34 來源:
從錯誤和可轉移的技能中學習工人機器人的屬性
實踐是完美的-它是一句格言,已幫助人類變得高度靈巧,現在,它已被應用于機器人。利茲大學的計算機科學家正在使用自動計劃和強化學習的人工智能(AI)技術來“訓練”機器人,以在雜亂的空間(例如倉庫架子或冰箱)中找到物體并進行移動。
目的是發展機器人自主性,以便機器可以評估任務中出現的獨特情況并找到解決方案,類似于機器人將技能和知識轉移到新問題上。
利茲大學的研究人員今天(11月4日,星期一)在中國澳門舉行的智能機器人與系統國際會議上介紹他們的發現。
最大的挑戰是,在狹窄的區域中,機械臂可能無法從上方抓取物體。取而代之的是,它可能必須計劃一系列移動以到達目標對象,這可能是通過操縱其他項目來實現的。計劃此類任務所需的計算機功能非常強大,機器人通常會暫停幾分鐘。當它執行移動時,通常會失敗。
不斷發展實踐的想法非常完美,利茲的計算機科學家們將AI的兩個想法融合在一起。
一種是自動化計劃。機器人能夠通過視覺系統“看到”問題,實際上是圖像。機器人操作系統中的軟件可模擬其可能到達目標物體的一系列動作。
但是,機器人“預演”的模擬無法捕獲現實世界的復雜性,并且在實施模擬時,機器人無法執行任務。例如,它可以將物品從架子上敲下來。
因此,利茲團隊已將計劃與另一種稱為強化學習的AI技術相結合。
強化學習需要計算機嘗試一系列嘗試和錯誤嘗試(總共約10,000次)才能到達并移動對象。通過這些嘗試和錯誤嘗試,機器人可以“學習”其計劃好的動作更有可能成功結束。
計算機自行進行學習,首先隨機選擇可能有效的計劃動作。但是隨著機器人從反復試驗中學到東西,它變得更加善于選擇那些更有可能成功的計劃動作。
計算學院的Matteo Leonetti博士說:“人工智能擅長使機器人進行推理-例如,我們已經看到與大師級棋子有關的機器人。
“但是機器人不能很好地發揮人類的才能:高度機動和靈巧。那些物理技能已經硬連接到人腦,這是進化的結果以及我們實踐和實踐的方式。
“這就是我們將其應用于下一代機器人的想法。”
據Wissam Bejjani博士說。撰寫研究論文的學生,該機器人發展了概括能力,可以將其計劃應用到獨特的環境中。
他說:“我們的工作意義重大,因為它將計劃與強化學習相結合。許多嘗試開發該技術的研究都只是其中一種方法。
“我們的方法已經在大學的機器人實驗室中看到的結果得到驗證。
“有一個問題,在機器人必須移動一個大蘋果的情況下,它首先要移到蘋果的左側以移開雜物,然后再操縱蘋果。
“這樣做的目的是使雜物不會落在架子的邊界之外。”
計算學院副教授Mehmet Dogar博士也參與了這項研究。他說,這種方法將機器人的“思考”時間加快了十倍,而決定要花50秒,現在要花5秒。