輝達在今日舉辦的Hot Chips 2024大會上正式公布了Blackwell架構的細節。據了解,輝達Blackwell平台涵蓋了從CPU和GPU運算到用於互連的不同類型網路,並非在討論單一GPU,而是探討AI的叢集層級。
Blackwell GPU是輝達效能最高的一款,使用NVIDIA高頻寬介面(NV-HBI)在兩個GPU晶片之間提供10TB/s的頻寬。GPU透過NVLink-C2C互連技術與Grace CPU進行連接。
Blackwell支援新的FP4和FP6精度,藉由降低運算精度來提升效能。NVIDIA Quasar Quantization用於找出可以使用較低精度的內容,從而減少運算和儲存。輝達表示,用於推論的FP4在某些情況下可以接近BF16的效能。
據介紹,Blackwell架構是通用運算全棧矩陣的終極解決方案,由多個輝達晶片組成,包括Blackwell GPU、Grace CPU、BlueField資料處理單元、ConnectX網路介面卡、NVLink交換器、Spectrum乙太網路交換器和Quantum InfiniBand交換器。
本文為品玩授權刊登,原文標題為「英偉達公佈 Blackwell 架構細節」
