您現在的位置是:首頁 >市場 > 2020-11-30 09:41:39 來源:
提出實現更好的機器人自學的新方法
導讀 在日常生活中處理復雜任務時,人類表現出驚人的適應性。這種適應性是個人學習能力的直接體現,它使人類能夠獨立,逐步地提高自己的行為能力
在日常生活中處理復雜任務時,人類表現出驚人的適應性。這種適應性是個人學習能力的直接體現,它使人類能夠獨立,逐步地提高自己的行為能力。
因此,如果機器人可以具有此功能,則它們可以根據數據和案例的實時獲取自動生成新的行為模式。這種能力顯示出明顯的智力,這被稱為行為智力。
最近,中國科學院沉陽自動化研究所的研究人員開發了一種新方法,該新方法開發了一種提高機器人行為智能的新方法,相關結果發表在IEEE認知與發展系統交易上。
該研究人員提出了一種基于Q學習和自適應核線性(AKL)模型增量學習方法的新框架。該框架允許機器人學習新行為而不會忘記以前的行為。在這種新方法下,可以通過自主學習和模仿學習來評估機器人的行為,并可以使用新穎的L2-范數核遞歸最小二乘(L2-KRLS)算法實時更改模型結構和參數。
此外,他們進行了兩個實驗以驗證新方法的性能。結果表明,提出的框架可以漸進地學習不同環境中的行為。基于局部貪婪策略的Q學習比現有的Q學習算法要快。目前,該成果已應用于機器人自主導航中。