您現在的位置是:首頁 >互聯網 > 2020-10-13 17:02:02 來源:
Google詳細介紹了具有大幅AI速度提升的第四代TPU
Google LLC今天分享了有關其TPU芯片的新版本的早期細節,該芯片用于運行人工智能工作負載,其性能是前一代的兩倍以上。
Google的TPU(即Tensor處理器單元)是專門針對AI設計的專用集成電路。搜索巨人今天詳細介紹的新TPU模型是該芯片的第四次迭代。通過Google Cloud Platform,企業可以使用第三次和第二次迭代,它們也展示了出色的性能。
谷歌表示,第四代TPU的平均性能比其第三代TPU高出2.7倍。這家搜索巨頭通過在最近的MLPerf行業競賽中衡量他們訓練五個流行的AI模型的速度來比較這些芯片。第四代TPU在運行Mask R-CNN模型時得到了最強的結果,Mask R-CNN模型是用于自動駕駛等用例的圖像分割AI,它的訓練速度比Google的早期芯片快3.7倍。
性能的提高是引擎蓋下重大變化的結果。谷歌工程師Naveen Kumar在博客中詳細介紹了該公司已大大提高了TPU的內存帶寬,即芯片從內存中獲取數據進行處理的速度,并提高了其執行專門計算的能力。
“ Google的第四代TPU ASIC提供了TPU v3的矩陣乘法TFLOP的兩倍以上,” Kumar在帖子中詳細介紹。矩陣乘法是AI模型用來處理數據的一種數學運算,而TFLOP是每秒一萬億個浮點運算。相比之下,與新芯片進行比較的第三代TPU v3每秒可管理420萬億次操作。
Kumar寫道,客戶可以很快獲得有關新TPU的更多信息。鑒于該平臺上已有兩個上一代TPU可供租用,該芯片很有可能最終登陸Google Cloud。但是,客戶可能需要等待一會兒:ExtremeTech報告說,第四代TPU在MLPerf競賽期間被列為研究類別,這意味著它至少有六個月不能商用。
新芯片的速度提升尤其引人注目,因為其性能優于第三代的芯片在同一比賽中打破了多項記錄。谷歌使用了4,090個第三代TPU來構建其所謂的世界上最快的AI培訓超級計算機。該系統為八項MLPerf基準測試中的六項設置了新記錄,并在30秒內訓練了四個測試模型。