打破16項AI性能記錄！NVIDIA的A100 GPU要無人能敵了？

（取自NVIDIA臉書粉專）

2020年7月30日，MLPerf組織發布第三個版本MLPerf Training v0.7基準測試（Benchmark）結果。結果顯示，NVIDIA基於今年5月最新發布的Ampere架構A100 Tensor Core GPU，和HDR InfiniBand實現多個DGX A100系統互聯的龐大集群，DGX SuperPOD系統在性能上開創了八個全新里程碑，共打破16項紀錄。

打破MLPerf Training最新基準測試16項記錄

MLPerf是2018年5月成立的產業基準測試組織，在AI備受關注的當下，獲得了晶片巨頭和AI晶片公司以及AI業界的廣泛關注。為了能夠讓機器學習處理器的基準測試也像CPU那樣，MLPerf組織囊括了該產業中的所有知名企業和機構，比如英特爾、NVIDIA、Google、亞馬遜、阿里巴巴和百度、微軟、史丹佛大學等。

巨頭公司們樂於通過MLPerf的成績證明其AI實力，平頭哥在去年11月MLPerf首個版本基準測試成績公布之後，就強調其自主研發的AI晶片含光800，在Resnet50基準測試中，獲得單晶片性能第一。

作為AI的領軍者，NVIDIA自然也不會錯過MLPerf的基準測試。2018年12月，NVIDIA首次在MLPerf訓練基準測試中創下了六項紀錄，次年7月NVIDIA再次創下八項紀錄。在最新MLPerf Training v0.7基準測試中，有兩項新的測試和一項經大幅修訂的測試。

其中一項基準測試對推薦系統的性能進行了排名，推薦系統是日益普及的一項AI任務。另一項基準測試對使用BERT的對話式AI進行了測試，BERT是現有最複雜的神經網路模型之一。還有，強化學習測試中使用了Mini-go和全尺寸19x19圍棋棋盤，該測試是本輪最複雜的測試，內容涵蓋從遊戲到訓練的多項操作。

特別值得一提的是，NVIDIA是唯一一家在MLPerf Training v0.7測試中均採用市售商用產品的公司。其他大多數提交使用的要嘛是預覽類別（preview category），其所用的產品預計需要幾個月後才會面市，使用研究類別的產品，更是較長一段時間內都不會面市。

另外，在此次提交結果的九家公司中，除NVIDIA外，還有六家公司多家生態系統合作夥伴，也提交了基於NVIDIA GPU的MLPerf測試結果。包括三家雲端服務業者（阿里雲、谷歌雲和騰訊雲），以及三家伺服器製造商（Dell、FUJITSU和浪潮）。

18個月內實現AI性能4倍提升

創造紀錄的NVIDIA DGX SuperPOD系統，是基於Ampere架構以及Volta架構。5月份發布的Ampere架構GPU A100，基於台積電7nm工藝，面積高達826平方毫米，集成了540億個電晶體。相比Volta架構實現了高達20倍的性能提升，並且可以同時滿足AI訓練和推理的需求。

（A100對比V100）

由8個安培A100 GPU打造的NVIDIA DGX A100 AI系統單節點性，能達到了創紀錄的5 petaflops。

此次，NVIDIA在Selene上運行了系統的MLPerf測試，Selene是基於DGX SuperPOD的內部集群。DGX SuperPOD是針對大規模GPU集群的公共參考架構，可在數週內完成部署。

根據測試結果，相較於首輪MLPerf訓練測試中使用的基於V100 GPU的系統，如今的DGX A100系統能夠以相同的吞吐率，在18個月內實現了4倍的性能提升。

能夠取得里程碑的成就除了強大的硬體，還有兩大關鍵，就是軟體和網路連接。

A100 GPU搭配CUDA-X庫的軟體更新，為通過Mellanox HDR 200Gb/s InfiniBand網路建構的擴展集群提供支持。HDR InfiniBand可實現極低的延遲和高數據吞吐量，同時通過可擴展分層聚合和縮減協議（SHARP）技術，提供智慧深度學習計算加速引擎。

NVIDIA A100能否無人能敵？

NVIDIA A100發布之後，就有業內人士表示GPU的性能又上了一個台階，AI晶片新創公司想要超越NVIDIA的難度又增加了。

但相比硬體的超越，軟硬體生態才是巨頭公司更大的優勢所在。據悉，通過最新的軟體優化，基於NVIDIA V100的DGX-1系統也可實現2倍的性能提升。

就此次最新基準測試而言，提交了基於NVIDIA GPU的MLPerf測試結果的公司大多採用了NVIDIA的軟體中心NGC容易，以及用於參賽的公開框架。另外，包括這些MLPerf合作夥伴在內的近二十家雲端服務業者，和OEM組成的生態系統，已採用或計劃採用A100 GPU來打造線上實例、伺服器和PCIe卡。

NVIDIA表示，A100進入市場的速度也比以往NVIDIA的GPU更快，發布之初用於NVIDIA的第三代DGX系統，正式發佈僅六週後，A100就正式登陸了Google Cloud 。

當然，NVIDIA也在通過更多產業軟體吸引用戶。比如今年5月，NVIDIA發布了兩個應用框架，用於對話式AI的Jarvis和用於推薦系統的Merlin。還有面向汽車產業市場的NVIDIA DRIVE、面向醫療健康市場的Clara、面向機器人技術市場的Isaac，以及面向零售/智慧城市市場的Metropolis。

性能和生態都足夠好的A100，能讓NVIDIA在AI市場無人能敵嗎？價格會是阻礙嗎？

本文為雷鋒網授權刊登，原文標題為「打破16項AI性能記錄！英偉達A100 GPU要無人能敵？」