您現在的位置是:首頁 >互聯網 > 2020-11-03 14:04:15 來源:
Alphabet的DeepMind開源了其AI項目的關鍵構建塊
Alphabet公司的人工智能研究小組DeepMind Technologies Ltd正在與世界分享更多的研究成果。
今天,該部門開源了“關鍵算法組件”的集合,這些集合源于它所描述的一些最成功的AI計劃。該庫名為TRFL,發音為“松露”,旨在幫助從事采用強化學習(一種訓練神經網絡的流行方法)的項目的研究人員。
強化學習本質上是一種通過反復試驗來提高算法準確性的方法。每當AI在訓練環境中做出正確的決定時,它都會獲得一種虛擬獎勵,從而使神經網絡的發展保持在正確的軌道上。
TRFL包括依靠強化學習的算法通常使用的數學運算的實現。它們與DeepMind所說的可以執行更多“尖端”計算的組件以及各種其他構建模塊(包括用于確保AI培訓課程順利進行的工具)配對使用。
整個集合都建立在可運行的流行TensorFlow深度學習引擎上,該引擎由Alphabet的Google LLC創建并開源。根據DeepMind的說法,研究人員可以通過應用程序編程接口與TRFL進行交互,該接口使將內部組件與其他來源的技術和概念結合起來相對簡單。
該小組對圖書館的目標遠遠超出了簡化單個強化學習項目的范圍。TRFL是DeepMind做出的更廣泛工作的一部分,該工作旨在創建可供AI研究人員使用的通用構建基塊,多年來,該工作已經使該部門開源了其他內部軟件。
基本思想是,如果在各個項目中重復使用相同的組件,則研究人員將可以更輕松地復制同事的工作。更緊密地復制AI項目參數的能力反過來會增加調試工作。根據DeepMind的說法,外部評審人員通常在識別影響神經網絡或相關組件的缺陷方面起著重要作用。
該小組表示:“這些部分傾向于以微妙的方式進行交互(通常在文件中沒有很好地記錄,正如Henderson及其同事所強調的那樣),因此很難在如此大的計算圖中識別錯誤。” “ OpenAI最近發表的一篇博客文章通過分析一些最受歡迎的增強學習代理的開源實現,并發現十分之六的漏洞是由社區成員發現并得到作者確認的,從而突出了這個問題。”
TRFL 在GitHub上可用。它為DeepMind和Alphabet近年來發布的一長串開源項目增加了另一項內容。