NVIDIA發表Llama-3.1-Nemotron-51B AI模型

（取自NVIDIA臉書粉專）

根據NVIDIA官方消息，NVIDIA近日宣佈推出 Llama-3.1-Nemotron-51B AI 模型。

該模型根據 Meta 的Llama-3.1-70B 訓練而成，該 AI 模型主要採用了神經架構搜尋（NAS）技術微調，平衡性能和效率，在高工作負荷下，只需要一片 H100 GPU 即可運行，大大降低了記憶體消耗、運算複雜性以及與運行此類大型模型相關的成本。

NVIDIA認為這種方式在保持了出色的精度前提下，顯著降低了內存佔用、內存頻寬和 FLOPs，並證明可以在創建另一個更小、更快的變體來加以推廣。

本文為品玩授權刊登，原文標題為「英偉達發佈 Llama-3.1-Nemotron-51B AI 模型」