NVIDIA遭曝光多款產品資訊,包括全新B300及RTX5090
愛范兒 / 何渝婷編譯
2024-12-27 10:00

(取自NVIDIA臉書粉專)

近日,多家媒體曝光了NVIDIA多款產品資訊,其中包含專為 o1 推理大模型打造的 GPU 全新 B300,和萬眾矚目的 RTX5090。

據 SemiAnalysis 報導,全新的 B300 將採用與 B200 同樣的台積電 4NP,但將是全新流片;功率方面,GB300 和 B300 HGX 的 TDP 分別達到 1.4KW 和 1.2KW,相比 B200 系列分別提高 0.2KW,同時架構也迎來創新,將會在 CPU 與 GPU 之間進行動態分配功率。

B300 系列還將升級顯示記憶體,將升級到 12 層的 12-Hi HBM3E,顯示記憶體容量升級為 288GB,顯示記憶體頻寬仍為 8TB/s。

據 SemiAnalysis 透露,GB300 系列的交付也有所不同。

此前,GB200 系列提供整個 Bianca Board,其中包括兩顆 GPU、一顆 CPU、CPU 的記憶體等所有組件都集成在一塊 PCB 板上。

本次 GB300 系列則只提供 Reference Board,其中包括兩顆 B300 GPU、一顆 Grace CPU、HMC(Hybrid Memory Cube),而 LPCAMM 記憶體模塊等組件將由客戶自行採購。

報導稱,這也將給 OEM 和 ODM 廠商帶來新的方向與機會。

本次 B300 系列還將為推理大模型而打造,據悉,顯示記憶體的升級對 OpenAI o1/o3 一類的推理大模型至關重要,因為推理思維鏈長度會增加 KVCache,影響 batch size 和延遲。

本次 B300 的顯示記憶體升級後,將帶來這些提升:

  • 實現更長的思維鏈
  • 每個思維鏈的延遲更低
  • 降低推理成本
  • 處理同一問題時,可以搜尋更多樣本,最終提高模型能力

近日,顯示記憶體消費級顯卡 RTX5090 的 PCB 也首次曝光。

據瞭解,曝光的 PCB 板上沒有印刷「NVIDIA」標誌,因此有推測其為非公版 RTX5090 的 PCB 板,但仍能分析出部分 RTX5090 的參數。

從目前曝光資訊來看,RTX5090 所使用的 GB202 GPU 晶片,封裝面積達 3628 平方毫米,實際的核心面積達 744 平方毫米,尺寸巨大;同時 RTX5090 將配備 16 顆顯示記憶體晶片,若單顆容量 2GB GDDR7,總計將達 32GB 顯示記憶體。

同時,RTX5090 的 GPU 核心照也遭曝光,據分析,RTX5090 完整的核心編號為 GB202-300-A1,與傳聞相符。

此外,RTX 5080、RTX 5070 Ti 則會改用次一級的 GB203 晶片;RTX 5070、RTX 5060 Ti 為 GB205;最低為 RTX 5060 的 GB206。

本文為愛范兒授權刊登,原文標題為「英偉達「顯卡大禮包」遭曝光