您現在的位置是：首頁 >要聞 > 2020-10-27 10:28:08 來源：

狗訓練方法可幫助教機器人學習新技巧

導讀約翰霍普金斯大學的計算機科學家采用一種通常用于教狗坐下和坐下的訓練技術，向機器人展示了一種如何自學幾種新技巧的機器人，包括堆砌塊。

約翰霍普金斯大學的計算機科學家采用一種通常用于教狗坐下和坐下的訓練技術，向機器人展示了一種如何自學幾種新技巧的機器人，包括堆砌塊。通過這種方法，名為Spot的機器人可以在幾天內學習通常需要一個月的時間。

通過使用正強化，這是任何使用過的對待改變狗行為的人都熟悉的方法，團隊極大地提高了機器人的技能，并且很快地完成了訓練，使訓練實際工作的機器人成為一個更可行的企業。這些發現新發表在名為“ Good Robot!”的論文中。

“這里的問題是我們如何讓機器人學習技能?” 主要作者安德魯·洪特(Andrew Hundt)說。在約翰·霍普金斯大學計算互動與機器人實驗室工作的學生。“我有狗，所以我知道獎勵的工作，這就是我設計學習算法的靈感。”

與天生具有高度直覺的大腦的人和動物不同，計算機是空白板，必須從頭開始學習一切。但是，真正的學習通常是通過反復試驗來完成的，機器人專家仍在研究如何從錯誤中有效學習。

該團隊在這里通過設計一種獎勵系統來實現這一目標，該獎勵系統可以像對待狗一樣對待機器人，為機器人工作。狗可能會因為做得好的工作而得到餅干，而機器人則獲得了數字積分。

洪特回憶說，他曾經教過他的小混混小狗叫利亞(Leah)命令“離開它”，這樣她就可以無視步行中的松鼠。他使用兩種類型的零食，普通的教練零食和更好的東西，例如奶酪。當莉亞興奮而無所事事時，她一無所有。但是當她冷靜下來并移開視線時，她得到了好東西。“那時候我給了她奶酪，然后說，'離開!好呀!'”

同樣，要堆積塊，發現機器人需要學習如何專注于建設性行動。當機器人探索積木時，它很快了解到正確的堆疊行為可以賺取高分，而錯誤的堆疊則不能賺到高分。伸出手，但不理解障礙?沒有分數敲一堆?絕對沒有分。通過將最后一個區塊放在四個區塊的堆棧之上，Spot獲得了最大的收益。

訓練策略不僅有效，而且花了幾天的時間來告訴機器人過去需要數周的時間。通過首先訓練類似于視頻游戲的模擬機器人，然后使用Spot運行測試，該團隊能夠減少練習時間。

免責聲明：本文由用戶上傳，如有侵權請聯系刪除！

標簽：機器人學習新技巧

上一篇:防護罩膜附著蛋白可保護細菌和葉綠體免受壓力

下一篇:我國古代四大美女之一的西施姓什么螞蟻莊園知識問答

猜你喜歡

定州北疃烈士陵園（關于定州北疃烈士陵園介紹）

定州冠農農業科技有限公司（關于定州冠農農業科技有限公司介紹）

定州八景（關于定州八景介紹）

定州供銷商貿有限公司（關于定州供銷商貿有限公司介紹）

定州佰仕達塑料制品有限公司（關于定州佰仕達塑料制品有限公司介紹）

定州人物志（關于定州人物志介紹）

10分鐘被AI騙走430萬

快手2023年第一季度營收252點2億元

木倉科技宣布駕考智能模擬器發布

定州中山公園（關于定州中山公園介紹）

錨定本源柔韌生長

Meta被歐盟罰款13億美元

新氧發布2023年Q1財報

新氧發布2023年Q1財報

定州東方園林苗圃場（關于定州東方園林苗圃場介紹）

定州三萬畝綠色苗圃場（關于定州三萬畝綠色苗圃場介紹）

最新文章

貴的部首是什么偏旁（貴字的偏旁是什么）

定州北疃烈士陵園（關于定州北疃烈士陵園介紹）

怎樣迅速擴大英語詞匯量（關于怎樣迅速擴大英語詞匯量介紹）

建龍阿城鋼鐵有限公司（關于建龍阿城鋼鐵有限公司介紹）

掟上今日子的旅行記（關于掟上今日子的旅行記簡介）

崔云峰（關于崔云峰簡介）

定州冠農農業科技有限公司（關于定州冠農農業科技有限公司介紹）

建鴻達現代城（關于建鴻達現代城介紹）

掘金大數據（關于掘金大數據簡介）

崔云（關于崔云簡介）

怎樣辨別多音字的讀音（關于怎樣辨別多音字的讀音介紹）

崔書紅（關于崔書紅簡介）

怎樣輔導孩子的學習：神童是這樣打造出來的（關于怎樣輔導孩子的學習：神童是這樣打造出來的介紹）

掘金供應鏈——如何從以產定銷到以銷定產（關于掘金供應鏈——如何從以產定銷到以銷定產簡介）

定州八景（關于定州八景介紹）

建鯉養殖技術規范第4部分：魚苗、魚種培育技術（關于建鯉養殖技術規范第4部分：魚苗、魚種培育技術介紹）

點擊排行

熱門推薦

隨機推薦