您現在的位置是:首頁 >互聯網 > 2020-10-13 17:02:03 來源:
Nvidia在最新的MLPerfAI基準測試中創下16條新的性能記錄
Nvidia公司今天表示,最新的MLPerf基準測試結果證明,其最新平臺在所有市售系統中提供了世界上最快的人工智能培訓性能。
英偉達的新A100圖形處理單元及其DGX SuperPOD系統(如圖所示)是一個龐大的A100 GPU集群,連接了其HDR InfiniBand技術,在第三次年度MLPerf基準測試中均創下了商用系統的八項新性能記錄,共有16條新記錄。
這些測試由MLPerf組織,該組織是行業基準測試組,成立于2018年5月,并得到Amazon.com Inc.,百度Inc.,Facebook Inc.,Google LLC,Intel Corp.和Microsoft Corp.以及哈佛和斯坦福大學。
結果標志著Nvidia硬件的嚴重改進,該硬件先前于2018年12月在第一屆MLPerf培訓基準測試中創造了六項記錄,并在2019年7月創下了八項記錄。
Nvidia的A100 GPU 于5月推出,是該公司第三代DGX系統的基礎,該系統用于為佛羅里達大學的HiPerGator等超級計算機提供動力。A100芯片也可作為一項服務在Google Cloud上使用,適用于需要在數據分析,科學計算,基因組學,邊緣視頻分析和5G服務工作負載方面實現最高性能的公司。
英偉達表示,MLPerf的最新基準測試表明,其DGX A100系統的性能比其基于舊V100 GPU的原始DGX系統提高了四倍。但是,它表示測試表明,由于某些新的軟件優化,較舊的系統DGX-1現在的速度是其兩倍。
最新的MLPerf基準測試包括兩項全新測試以及一項“經過實質性修訂”的測試,Nvidia表示其硬件在所有方面均“出色”。例如,在新的推薦系統測試中,A100芯片和DGX SuperPOD系統獲得了最佳性能,這對于AI系統來說是越來越受歡迎的工作量。
Nvidia的硬件還使用來自變壓器或BERT的神經網絡模型的雙向編碼器表示法,在自然語言處理類別中獲得了最高分。它還在強化學習測試中創造了新記錄,該測試使用Mini-go和全尺寸19×19 Go棋盤。根據Nvidia的說法,“這是本輪中最復雜的測試,涉及從游戲到培訓的多種操作。”
英偉達表示,配備2,000多個Nvidia A100 GPU的DGX SuperPOD席卷了每個MLPerf基準類別,以在商用產品中實現大規模性能。
星座研究公司(Constellation Research Inc.)的分析師Holger Mueller告訴SiliconANGLE,MLPerf的基準非常重要,因為我們正處于AI競賽的中間階段,企業意識到更多的自動化總比沒有好。
“ Covid-19僅增加了緊急性,因此公司正在尋求平臺供應商來幫助他們解決下一代應用程序AI的負擔,” Mueller說。“今天輪到Nvidia了,它在許多MLPerf標準上創造了新記錄。值得注意的是,在過去的一年半中,Nvidia的性能提高了四倍。這種性能提升是AI基準測試獎章中需要發揮的作用。”
并非只有Nvidia創造了新記錄。谷歌還通過一些新硬件參加了MLPerf基準測試,并表示他們證明自己在創造了六項性能記錄之后,已經建造了世界上最快的機器學習培訓超級計算機。
Google最新的ML訓練超級計算機基于其最新的Tensor處理單元,是Cloud TPU V3 Pod的四倍,后者在去年的先前基準測試中創造了三項記錄。谷歌表示,該系統由4,096個TPU V3芯片和數百個CPU托管計算機組成,可提供超過430 petaflops的峰值性能。