您現在的位置是:首頁 >綜合 > 2020-12-28 08:54:44 來源:
懶人利用GoogleAI部署強化學習導航系統
導讀 隆恩(Loon)是一家致力于項目的公司,目的是使用浮在平流層中的超壓氣球來提供Internet連接。我們很少聽到有關該項目的消息,有些人可能想知
隆恩(Loon)是一家致力于項目的公司,目的是使用浮在平流層中的超壓氣球來提供Internet連接。我們很少聽到有關該項目的消息,有些人可能想知道它是否仍與已經在使用衛星的Starlink Internet服務進行試驗的SpaceX相關。隆恩公司已經部署了一些非常有趣的東西,該公司稱這是世界上首次部署強化學習航空航天系統。
該公司長期以來一直有一個目標,即有效地將氣球引導到需要連接的位置。挑戰在于,在平流層中導航超壓氣球有兩種選擇:向上或向下。導航非常復雜,并且該任務非常適合自動化。懶人氣球跟隨盛行的風。
盧恩(Loon)說,公司內部的一個小組與Google AI一直在合作開發利用深度強化學習(RL)的功能更強大的導航系統。RL是一種機器學習,它使代理能夠通過在交互環境中通過自身行為和經驗的反饋,通過反復試驗來學習。該公司承認,尚不清楚早期的深度RL是否適用于其高空氣球。
測試證明,RL對于平流層氣球氣球是可行的。當今使用的導航系統面臨著一項復雜的任務,該任務通過一種算法解決,該算法通過計算機對氣球導航進行仿真來學習。RL系統前面的任務非常復雜,因為氣球通常缺乏理想機動所需的動力。
這意味著頻繁的決策機會跨越了很長的規劃期。盡管復雜,但強化學習已承諾比目前廣泛使用的人工設計算法更有效地幫助Loon操縱氣球。RL可以使導航系統快速管理新飛機并管理Loon機隊的不同用途。到目前為止,RL控制器已導航了一組氣球近3000個飛行小時,該公司稱其為出色的結果。