• 您現在的位置是:首頁 >生活 > 2020-12-25 09:13:40 來源:

    DeepMind可以在不知道規則的情況下掌握游戲

    導讀 人工智能的圣杯一直是使計算機學習人類的方式。但是,當今最強大的AI仍然依賴于某些已知規則,例如下棋或圍棋的規則。然而,人類的學習在推

    人工智能的圣杯一直是使計算機學習人類的方式。但是,當今最強大的AI仍然依賴于某些已知規則,例如下棋或圍棋的規則。然而,人類的學習在推理上常常是混亂的,隨著我們的前進學習生活規則。長期以來,DeepMind一直在嘗試使用游戲作為其環境和測試套件來創建此類AI。谷歌專注于人工智能研究的姊妹公司剛剛在MuZero上展示了其最新成果,MuZero是一款無需事先學習規則即可掌握游戲的AI。

    DeepMind以前的AlphaGo等AI已在媒體上廣泛報道,以在各自的游戲中擊敗人類冠軍。盡管令人印象深刻,但距離最終目標還有幾步之遙。特別是,AlphaGo的優勢是不僅了解Go的規則,而且了解人類玩家的領域知識和數據。它的繼任者AlphaGo Zero和AlphaZero仍然可以依靠規則書來學習。

    雖然這些AI在具有復雜策略但視覺效果簡單的游戲中表現出色,但當應用于規則不易推斷的視覺復雜的游戲時,它們就會失敗。那就是新的MuZero AI出現的地方,它使用了一系列的Atari游戲,例如Pac-Man女士來測試其理論。

    大多數AI研究人員使用兩種策略來解決學習問題,其中一種是依靠獲得游戲規則或知識來進行超前搜索。基于模型的計劃通過創建準確的環境模型來學習,但是代價是過于復雜。MuZero的優勢在于,它僅對重要的環境部分進行建模,例如知道傘將幫助您在雨中保持干燥,而不是對所有雨滴的運動進行建模。

    即使只有很少的步驟需要預先計劃,MuZero能夠熟練掌握游戲的效率和速度也給DeepMind留下了深刻的印象。它希望這種新的AI學習方法將被用于雜亂的現實環境中,在這些環境中不能以明確的方式制定規則。

  • 成人app