• 您現在的位置是:首頁 >要聞 > 2021-08-21 15:29:38 來源:

    NVIDIA的安培A100已經成為有史以來最快的GPU 其速度比圖靈快43%

    導讀 在我們等待基于安培GPU架構的消費級顯卡發布的同時,NVIDIA旗艦級安培芯片A100繼續刷新世界紀錄。全球最大的基于7nm工藝節點的圖形芯片在5

    在我們等待基于安培GPU架構的消費級顯卡發布的同時,NVIDIA旗艦級安培芯片A100繼續刷新世界紀錄。全球最大的基于7nm工藝節點的圖形芯片在5月份發布,在規格和性能方面都有很多支持。目前,安培A100張量核心加速器已經成為OctaBench上記錄最快的GPU。

    英偉達的Ampere  A100成為有記錄以來最快的GPU,速度比Turing快43

    NVIDIA Ampere A100 HPC TensorCore GPU已經成為Octabonch有記錄以來最快的GPU,其性能比RTX關閉時的圖靈高43%

    OTOY首席執行官Jules Urbach分享了這一壯舉。OTOY是Octa Bench的開發人員,Octa Bench是一個基準測試工具,使用戶能夠使用辛烷渲染器評估GPU性能。OctaneRenderer本身就是一個GPU渲染引擎,支持NVIDIA的RTX光線追蹤硬件加速,提供清晰的渲染場景。

    據Jules統計,NVIDIA A100 Tensor Core GPU在OctaBench中的得分為446。他還指出,即使關閉RTX,該分數也比八進制中的圖靈GPU平均快43%。這里比較的圖靈結果利用了RTX。與導致幀率大幅下降的游戲不同,在OctaRenderer中啟用RTX可以帶來更好的性能,因為使用可用的光線跟蹤硬件可以更快地渲染和完成場景。

    沒有說明用哪個圖靈GPU來和NVIDIA Ampere A100 GPU做比較,但是看看所有測試卡的完整平均工作臺,可以看到一系列有趣的結果。平均來說,A100的前身特斯拉V100的速度要慢20%左右,但出于某種奇怪的原因,泰坦V的速度只有11%,考慮到泰坦RTX比A100 GPU慢38%,這是令人驚訝的。

    主要答案可能是Titan V使用了與特斯拉V100相同的GV100 GPU,可以針對這個數據中心和云規模基準進行優化,而Turing GPU則針對游戲和GP-GPU的使用進行了優化。不過,該公司CEO再次指出,這是特定工作負載下有史以來最快的GPU記錄,這對于NVIDIA A100 GPU加速器來說是一大壯舉。

    NVIDIA A100是迄今為止生產的最大的7nm芯片,其特點是在單個管芯中封裝了540億個巨大的晶體管。因為產量高,A100的配置大大減少,但是和特斯拉V100一樣,一旦產量增加,我們可能會看到更高的bin版本,有更多的內核,這將進一步提高這個特定基準的性能。

    英偉達安培GA100圖形處理器的完整實現包括以下單元:

    每一個完整的GPU都有8個GPU、8個TPC/GPC、2個SM/TPC、16個SM/GPC和128個SM

    每個完整的GPU有64個FP32 CUDA內核/SM和8192個FP32 CUDA內核

    每個完整的GPU有4個第三代Tensor內核/SM和512個第三代Tensor內核

    6個HBM2堆棧,12個512位內存控制器

    英偉達安培GA100圖形處理器的A100張量核心圖形處理器實現包括以下單元:

    7個通用分組碼、7個或8個通用分組碼/通用分組碼、2個標準分組碼/通用分組碼、最多16個標準分組碼/通用分組碼、108個標準分組碼

    每個GPU有64個FP32 CUDA內核/SM和6912個FP32 CUDA內核

    每個GPU有4個第三代Tensor內核/SM和432個第三代Tensor內核

    5個HBM2堆棧,10個512位內存控制器

    只能想象安培卡上市后啟用RTX的性能指標。如果我們想達到這個特定的基準,我們可以看到安培GeForce RTX 30系列卡很容易被他們的高性能計算同行訪問。

    猜你喜歡

  • 成人app