您現在的位置是:首頁 >互聯網 > 2020-10-16 14:10:31 來源:
Facebook開源PyTorch3D以實現從三個角度思考的AI
Facebook Inc.的研究部門周四發布了PyTorch3D的代碼,PyTorch3D是一種自產的工具包,旨在簡化可在三維環境中運行的人工智能模型的開發。
在或至少了解3D空間的能力對于跨多個領域的深度學習應用至關重要。最明顯的領域是機器人技術,虛擬現實和增強現實。即使是分析對象二維照片的傳統圖像識別模型,也可以從了解對象的真實三維形式中受益,因為額外的上下文可能有助于提高其準確性。
但是,由于Facebook表示缺乏專用開發工具,因此在釋放3D深度學習優勢方面的進展相對緩慢。借助PyTorch3D,社交網絡的研究人員正在尋求解決差距并降低學習曲線,以在應用程序中實施該技術。
PyTorch3D的第一個組件是稱為網格的數據結構。數字3D模型由所謂的網格組成,這些網格具有多種不同的類型,可能很難使用。網狀結構為組織這些形狀提供了統一的格式,Facebook表示,這使AI開發人員更輕松地處理其數據。
開發人員可以使用Facebook包含在PyTorch3D中的一組損失函數和運算符來構建AI模型以處理其3D模型。損失函數是用于跟蹤AI在數據集上進行訓練時所犯錯誤的算法,該信息有助于引導學習過程朝正確的方向發展。操作員本質上是在編寫用于執行復雜任務的快捷方式,在這種情況下,涉及3D對象的計算。
Facebook研究人員Nikhila Ravi,Georgia Gkioxari和Justin Johnson在博客中寫道:“我們已經完成了優化3D數據的幾種常用運算符和損失函數的實現的工作,從而支持了不同批次的輸入 。” “隨著時間的推移,我們將繼續增加一組通用運算符。”
Facebook已通過渲染引擎增強了PyTorch3D的功能集,該引擎將3D數據轉換為2D圖像,開發人員可以查看或應用程序對其進行處理。渲染器不僅可以生成對象,還可以添加照明和陰影效果。它具有一個應用程序編程接口,該接口允許將項目導出到流行的深度學習框架,例如Facebook開發的PyTorch(該工具包的同名產品)。
Facebook的研究人員寫道:“我們使用PyTorch3D的目標是在深度學習和3D的交叉點上推動進步。” “憑借獨特的可區分渲染功能,我們為構建無需依靠時間密集的手動3D注釋即可進行高質量3D預測的系統的潛力感到興奮。”