• 您現在的位置是:首頁 >人工智能 > 2021-04-26 15:41:07 來源:

    新機器人符合行人行為規則

    導讀 正如司機遵守道路規則一樣,大多數行人在走廊或擁擠的通道時遵循一定的社會規范:向右行駛,向左行駛,保持一個可敬的泊位,并準備編織或改

    正如司機遵守道路規則一樣,大多數行人在走廊或擁擠的通道時遵循一定的社會規范:向右行駛,向左行駛,保持一個可敬的泊位,并準備編織或改變航向以避免迎面而來的障礙,同時保持穩定的步伐。

    現在,麻省理工學院的工程師設計了一種具有“社會意識導航”的自動機器人,可以跟蹤人流量,同時遵守這些行人行為的一般規范。

    在麻省理工學院斯塔塔中心內部進行的駕駛測試中,機器人類似于車輪上的膝蓋式自助終端,成功地避免了碰撞,同時保持了行人的平均流量。研究人員在一篇論文中詳細介紹了他們的機器人設計,他們將在9月份的IEEE智能機器人和系統會議上發表這篇論文。

    “社交意識導航是移動機器人在需要經常與行人互動的環境中運行的核心功能,”Yu Fan“Steven”Chen說,他曾擔任麻省理工學院前研究生,并且是該研究的主要作者。“例如,小型機器人可以在人行道上進行包裝和食品運輸。同樣,個人移動設備可以在人們擁擠的大空間內運送人員,例如商場,機場和醫院。“

    Chen的合著者是研究生Michael Everett,前博士后劉淼和Jonathan How,Richard Cockburn Maclaurin麻省理工學院航空航天教授。

    社交動力

    為了讓機器人在交通繁忙的環境中自主地行進,它必須解決四個主要挑戰:定位(了解世界的位置),感知(識別周圍環境),運動規劃(確定最佳路徑)給定目的地)和控制(物理地執行其所需的路徑)。

    陳和他的同事使用標準方法來解決本地化和感知問題。對于后者,他們為機器人配備了現成的傳感器,如網絡攝像頭,深度傳感器和高分辨率激光雷達傳感器。對于本地化問題,他們使用開源算法來映射機器人的環境并確定其位置。為了控制機器人,他們采用了用于驅動自動地面車輛的標準方法。

    “我們認為我們需要創新的領域是運動規劃,”埃弗雷特說。“一旦你弄清楚你在世界的哪個位置,并知道如何跟蹤軌跡,你應該遵循哪條軌跡?”

    這是一個棘手的問題,特別是在人行道較重的環境中,個別路徑通常很難預測。作為一種解決方案,機器人專家有時會采用基于軌跡的方法,在這種方法中,他們對機器人進行編程,以計算出滿足每個人所需軌跡的最佳路徑。這些軌跡必須從傳感器數據推斷出來,因為人們沒有明確地告訴機器人他們想要去哪里。

    “但這需要永遠計算。埃弗雷特說,你的機器人只是要停下來,弄清楚下一步該做什么,同時這個人已經走過它,然后決定“我應該走向右邊”。“所以這種方法不太現實,特別是如果你想要更快地開車。”

    其他人使用更快,“基于反應的”方法,其中機器人使用簡單模型編程,使用幾何或物理,快速計算避免碰撞的路徑。

    埃弗雷特說,基于反應的方法存在的問題是人性的不可預測性 - 人們很少堅持直線的幾何路徑,而是編織和徘徊,轉向迎接朋友或喝咖啡。在這樣一個不可預測的環境中,這樣的機器人往往會與人碰撞,或者看起來像是被人過度躲避。

    “在實際情況下對機器人的敲擊是他們可能過于謹慎或具有侵略性,”埃弗雷特說。“人們沒有發現它們符合社會公認的規則,比如給人們足夠的空間或以可接受的速度駕駛,并且他們得到的方式比他們幫助的更多。”

    訓練日

    該團隊找到了解決這些限制的方法,使機器人能夠適應不可預測的行人行為,同時不斷地隨著流動而行走并遵循典型的行人行為社會準則。

    他們使用強化學習,一種機器學習方法,在這種方法中,他們進行計算機模擬以訓練機器人采取某些路徑,給定環境中其他物體的速度和軌跡。該團隊還將社交規范納入了這個離線訓練階段,他們鼓勵模擬中的機器人向右傳遞,并在機器人向左傳遞時懲罰機器人。

    埃弗雷特說:“我們希望它能夠在人們中間自然地進行,而不是侵入性的。” “我們希望它遵循與其他所有人相同的規則。”

    強化學習的優勢在于研究人員可以執行這些訓練場景,這些場景需要大量的時間和計算能力,才能脫機。一旦機器人接受了模擬訓練,研究人員就可以對其進行編程,以便在機器人識別現實世界中的類似場景時執行模擬中確定的最佳路徑。

    研究人員使機器人能夠每十分之一秒評估一下環境并調整其路徑。通過這種方式,機器人可以以1.2米/秒的典型步行速度繼續在走廊中滾動,而不會暫停重新編程其路線。

    埃弗雷特說:“我們并沒有計劃完成一條通往目標的道路 - 再也沒有意義了,尤其是如果你假設世界在變化的話。” “我們只看看我們看到的東西,選擇一個速度,在十分之一秒內完成,然后再看一遍世界,選擇另一個速度,然后再去。通過這種方式,我們認為我們的機器人看起來更自然,并期待人們在做什么。“

    維持人群秩序

    埃弗雷特和他的同事在麻省理工學院Stata大樓繁忙蜿蜒的大廳里試駕機器人,機器人一次可以自動駕駛20分鐘。它隨行人流順暢地滾動,通常保持在走廊的右側,偶爾會讓人們左轉,并避免任何碰撞。

    埃弗雷特說:“我們希望將它帶到人們日常生活,上課,獲取食物的地方,我們表明我們對這一切都非常強大。” “有一次甚至有一個旅行團,它完全避開了他們。”

    埃弗雷特說,未來,他計劃探索機器人如何處理行人環境中的人群。

    “人群的動態與個人不同,如果你看到五個人走在一起,你可能需要學習完全不同的東西,”埃弗雷特說。“可能有一種社會規則,'不要讓人過分,不要把人分開,把他們視為一個群眾。' 這是我們未來的目標。“

  • 成人app