NVIDIA發表Llama-3.1-Nemotron-51B AI模型
品玩 / 何渝婷編譯
2024-09-25 16:46

(取自NVIDIA臉書粉專)

根據NVIDIA官方消息,NVIDIA近日宣佈推出 Llama-3.1-Nemotron-51B AI 模型。

該模型根據 Meta 的Llama-3.1-70B 訓練而成,該 AI 模型主要採用了神經架構搜尋(NAS)技術微調,平衡性能和效率,在高工作負荷下,只需要一片 H100 GPU 即可運行,大大降低了記憶體消耗、運算複雜性以及與運行此類大型模型相關的成本。

NVIDIA認為這種方式在保持了出色的精度前提下,顯著降低了內存佔用、內存頻寬和 FLOPs,並證明可以在創建另一個更小、更快的變體來加以推廣。

本文為品玩授權刊登,原文標題為「英偉達發佈 Llama-3.1-Nemotron-51B AI 模型