您現在的位置是:首頁 >生活 > 2021-04-10 10:18:56 來源:
OpenAI的最先進系統為機器人提供了人性化的靈活性
OpenAI是一家位于舊金山的非營利性人工智能研究公司,由Elon Musk,Reid Hoffman和Peter Thiel以及其他行業巨頭支持,在6月宣布最新版本的Dota 2播放AI 時成為頭條新聞- 被稱為OpenAI Five - 成功擊敗了業余球員。今天,它首次推出了一個機器人系統,可以操縱具有人類靈活性的物體。
在即將發表的一篇論文(“靈巧的手工操作”)中,OpenAI研究人員描述了一種系統,該系統使用強化模型,人工智能通過反復試驗來學習,指導機器人手掌握和操縱具有下列狀態的物體。藝術精準。更令人印象深刻的是,它在計算機模擬中完全以數字方式進行了訓練,并沒有提供任何人類演示來學習。
“雖然對物體的靈巧操控是人類的一項基本日常任務,但對自主機器人來說仍然具有挑戰性,”該團隊寫道。“現代機器人通常設計用于受限設置中的特定任務,并且在很大程度上無法使用復雜的末端效應器......在這項工作中,我們演示了訓練控制策略的方法,這些策略執行手動操作并將其部署在物理機器人上。 ”
那怎么做呢?研究人員使用MuJoCo物理引擎來模擬真實機器人可能在其中運行的物理環境,并使用Unity來渲染圖像以訓練計算機視覺模型以識別姿勢。但該團隊寫道,這種方法有其局限性 - 模擬僅僅是物理設置的“粗略近似”,這使得“不太可能”生成能夠很好地轉化為現實世界的系統。
他們的解決方案是隨機化環境的各個方面,如物理(摩擦,重力,關節限制,物體尺寸等)和視覺外觀(照明條件,手和物體姿勢,材料和紋理)。這既降低了過度擬合的可能性 - 當神經網絡在訓練數據中學習噪聲,對其性能產生負面影響時發生的現象 - 并且增加了生成基于真實世界指尖位置和對象姿勢成功選擇動作的算法的機會。
接下來,研究人員使用384臺機器訓練模型 - 一個循環神經網絡 - 每臺機器有16個CPU核心,每小時可以產生大約兩年的模擬經驗。在八GPU上進行優化后,他們進入下一步:訓練卷積神經網絡,從三個模擬攝像機圖像中預測機器人“手”中物體的位置和方向。
一旦模型被訓練,就進行驗證測試。研究人員使用了一只暗影靈巧之手,這是一只五指共有24個自由度的機器人手,安裝在鋁制框架上以操縱物體。同時,兩組攝像機 - 運動捕捉攝像機和RGB攝像機 - 作為系統的眼睛,可以跟蹤物體的旋轉和方向。(盡管暗影靈巧手具有觸摸傳感器,但該團隊僅選擇使用其關節感應功能對手指位置進行細粒度控制。)
在兩個測試的第一個中,算法的任務是重新定向標有字母表字母的塊。團隊選擇了一個隨機目標,每次AI實現它時,他們選擇一個新目標,直到機器人(1)掉落塊,(2)花了一分多鐘操縱塊,或(3)成功旋轉50次。在第二次測試中,塊與八角形棱鏡交換。
結果?這些模型不僅表現出“前所未有”的表現,而且自然發現了在人類中觀察到的類型的抓握,例如三腳架(一種使用拇指,食指和中指的握把),棱柱形(拇指和手指相對的握把)彼此)和尖端捏握。他們還學習了如何旋轉和滑動機器人手的手指,以及如何使用重力,平移和扭轉力將物體插入所需位置。
他們寫道:“[O]你的系統可以[不僅]重新發現在人類身上發現的掌握,而是讓它們更好地適應自己身體的局限和能力。”
這并不是說它是一個完美的系統。它沒有經過明確的訓練來處理多個物體 - 它很難旋轉球形的第三個物體。在第二次測試中,模擬與真實機器人之間存在可測量的性能差距。
但最終,結果證明了當代深度學習算法的潛力,研究人員得出結論:“[這些]算法可以應用于解決復雜的現實世界機器人問題,這些問題超出了現有的非學習方法的范圍。 ”