您現在的位置是:首頁 >人工智能 > 2021-04-29 03:15:37 來源:
當他們學習時 幫助引導機器人
像幼兒一樣,機器人可以在學習在物理世界中發揮作用時使用一些幫助。這就是萊斯大學計劃的目的,該計劃溫和地引導機器人走向最有幫助的,類似人類的方式來協作完成任務。
水稻工程師Marcia O'Malley和研究生Dylan Losey通過在執行任務時對機器施加溫和的物理反饋來改進他們訓練機器人的方法。目標是簡化預期與人類并肩工作的機器人的培訓。
他們的研究論文出現在IEEE Explore中。
“從歷史上看,機器人的作用是接管我們不想做的平凡任務:制造,裝配線,焊接,涂裝,”機械工程,電氣和計算機工程與計算機科學教授奧馬利說。 。“隨著我們越來越愿意通過技術分享個人信息,就像我的手表記錄我采取的步驟一樣,該技術也會轉變為具體的硬件。
“機器人已經在我們家中吸塵或控制我們的恒溫器或修剪草坪,”她說。“技術滲透到我們的生活中有各種各樣的方式。我已經在廚房里和Alexa談過了,為什么不能擁有我們可以與之合作的機器呢?我們的很多工作都是為了讓人機交互安全。”
根據研究人員的說法,適應物理人機交互(pHRI)的機器人傳統上將此類交互視為干擾,并在交互結束時恢復其原始行為。萊斯研究人員通過一種允許人類實時物理調整機器人軌跡的方法增強了pHRI。
該計劃的核心是阻抗控制的概念,實際上是一種管理推動時發生的事情的方法。允許通過物理輸入進行阻抗控制的機器人調整其編程軌跡以響應,但在輸入結束時返回其初始軌跡。
Rice算法建立在該概念的基礎上,因為它允許機器人調整其超出輸入的路徑并計算到達其目標的新路線,類似于GPS系統,當駕駛員錯過轉彎時重新計算到達目的地的路線。
去年夏天,洛西在加州大學伯克利分校電子工程和計算機科學助理教授Anca Dragan的實驗室里大部分時間都在測試這個理論。他和其他學生訓練了一個機器人手臂和一只手,在桌面上放一個咖啡杯,然后使用增強的pHRI使其遠離電腦鍵盤并保持足夠低,以便杯子在掉落時不會破裂。(關于實驗的另一篇論文出現在機器學習研究論文集中。)
目標是通過物理交互使機器人的編程軌跡變形。“在這里,機器人有一個計劃或所需的軌跡,它描述了機器人認為它應該如何執行任務,”洛西在一篇關于伯克利實驗的文章中寫道。“我們引入了一種實時算法,可以修改或變形機器人未來的預期軌跡。”
在阻抗模式下,機器人在交互后始終恢復到其原始軌跡。在學習模式中,反饋不僅改變了機器人在交互時的狀態,而且改變了它如何進入目標,洛西說。例如,如果用戶指示它使杯子不能越過鍵盤,將來會繼續這樣做。“通過我們在每次新觀察后重新計算機器人所需的軌跡,機器人能夠產生符合人類偏好的行為,”他說。
進一步的測試使用了10名賴斯學生,他們使用O'Malley實驗室的康復力反饋機器人OpenWrist來操縱光標在計算機屏幕上的障礙物上并落在藍點上。測試首先使用標準阻抗控制,然后使用物理交互式軌跡變形進行阻抗控制,這是pHRI的模擬,允許學生訓練設備學習新的軌跡。
結果顯示,軌跡變形的試驗在物理上更容易,并且需要顯著減少的相互作用才能實現目標。實驗證明,相互作用可以編程具有多個自由度的自動機器人,在這種情況下彎曲手臂并旋轉手腕。
目前的一個限制是pHRI還不能改變機器人執行任務所需的時間,但這是Rice團隊的議程。
“這項工作的范式轉變是,機器人不應將人類視為隨機干擾,而應將人類視為理性存在,有理由互動,并試圖傳達重要的東西,”洛西說。“機器人不應該只是試圖擺脫困境。它應該了解正在發生的事情并更好地完成工作。”