• 您現在的位置是:首頁 >互聯網 > 2020-11-09 14:10:51 來源:

    AI編譯大戰英特爾谷歌微軟NvidiaIBM等為深度學習加速而武裝

    導讀 在任何開發人員的工具包中,編譯器都是最性感的工具之一。僅當您準備好查看出色的新應用程序在現場的性能時,才調用編譯器。數據科學家是人

    在任何開發人員的工具包中,編譯器都是最性感的工具之一。僅當您準備好查看出色的新應用程序在現場的性能時,才調用編譯器。

    數據科學家是人工智能驅動應用程序新時代的主要開發者。因此,許多人可能會聽到這樣的消息,即英特爾公司發布了充其量的開源神經網絡編譯器nGraph。大多數開發人員只是使用內置的機器學習編譯器,而它們附帶使用的任何開發框架。

    實際上,這甚至不是什么新聞:Wikibon在2017年11月關于深度學習開發框架的報告中討論了nGraph 。不過,這很重要,因為英特爾現已正式發布的跨平臺模型編譯器(例如nGraph)已成為新時代的預兆,在新時代中,您使用哪種前端工具來構建AI算法,以及使用哪種后端工具都可以。端云,平臺或芯片組用于執行它們。

    NGraph是當今開發人員可以使用的越來越多的跨平臺AI模型編譯器之一。越來越多的競爭對手提供的產品包括亞馬遜網絡服務公司的 NNVM編譯器,谷歌有限責任公司的 XLA 和英偉達公司的 TensorRT 3。

    它們的共同點是,它們可以編譯在一個TensorFlow,MXNet,PyTorch和CNTK等前端工具中創建的AI模型,以在異構后端DL平臺和硬件平臺(包括圖形處理單元)上優化執行,中央處理器,現場可編程門陣列等。他們通過從各種目標運行時環境中抽象出神經網絡的核心計算圖結構來做到這一點。

    一些觀察家將英特爾正式發布的nGraph解釋為一種防御手段,以鼓勵開發人員編譯其AI以在其CPU上執行,而不是在其強大競爭對手Nvidia的GPU上執行。英特爾通過報告使用最新版本的nGraph編譯的基于Intel的硬件(包括其Nervana AI芯片和用于邊緣計算的芯片上的Movidius系統)所編譯的神經網絡模型,顯著提高了性能,從而增強了這種認識。顯然,它具有阻止開發人員直接將其AI直接編寫到Nvidia的API的全部興趣。

    谷歌最近宣布將TensorFlow 與Nvidia的TensorRT 庫集成在一起,從而使Nvidia在編譯大戰中獲得了戰術上的優勢。這可以編譯內置在最流行的前端建模工具中的神經網絡,以在Nvidia GPU上優化推理。它還為在生產環境中的GPU上高效部署TensorFlow模型創建了運行時。另外,谷歌還向英特爾贏得了次要勝利,宣布這些供應商已經提供了TensorFlow 集成以及 英特爾提供的更快,更高效 的開源深度學習庫。

    但是,隨著AI開發人員要求能夠將其模型抽象為離散的子圖,然后均勻地自動編譯它們以在由GPU,CPU,FPGA和其他芯片組組成的混合AI硬件環境中進行分布式執行的能力,這些防御策略將隨著時間的流逝而減少。跨平臺AI編譯器將成為每個AI開發環境的標準組件,使開發人員無需了解每種環境的技術細節即可訪問每個深度學習框架和目標平臺。這一趨勢與IBM公司Watson AI產品副總裁Ritika Gunnar在最近的Think 2018大會上在SiliconANGLE Media的視頻工作室theCUBE上進行的AI開發人員可訪問性討論相一致:

    在未來的兩到三年內,人工智能行業可能會圍繞所有前端和后端環境支持的一種開源交叉編譯進行融合。最近幾周的其他行業發展引起了人們對AI交叉編譯生態系統開放的關注。

    這些包括:

    微軟 開源的GitHub存儲庫,以促進對GPU優化的深度學習模型進行跨框架基準測試。

    ARM與Nvidia的合作伙伴關系將開源Nvidia深度學習加速器架構集成到其剛剛宣布的Project Trillium平臺中,該平臺旨在支持跨框架的深度學習模型編譯,以在移動,“物聯網”和其他大眾市場中優化執行邊緣設備。

    IBM推出了新 的深度學習開源面料框架,該框架支持通過TensorFlow,PyTorch,Caffe2和其他框架中構建的深度學習微服務的優化部署,通過Kubernetes上的無狀態RESTful接口將其部署到GPU和CPU異構集群上的不同計算節點上。

    Linux Foundation 推出 了 Acumos AI項目,該項目定義了API,一個開源框架以及一個AI模型目錄,用于與框架無關的AI應用程序開發,在Kubernetes上的鏈接和部署。

    不久之后,就像IBM在最近的文章中所說的那樣,宣稱特定的深度學習庫比在特定的云中的特定硬件體系結構上運行的特定框架要快是很奇怪的。無論這些或其他任何性能要求是否值得,開發人員都將越來越具有自動轉換性能不佳模型以優化執行所選AI云的能力。

  • 成人app