蘋果公布多模態大模型 MM1,具備300億參數
品玩 / 何渝婷編譯
2024-03-15 18:00

根據 Arxiv 頁面顯示,蘋果正式公布了自研多模態大模型 MM1,其參數最高可達 300 億。

論文顯示,MM1多模態大模型由密集模型和混合專家(MoE)變體組成,不僅在預訓練指標中實現 SOTA,在一系列已有多模態基準上監督微調後也能保持有競爭力的性能。

MM1 在上下文預測、多圖像和思維鏈推理等方面具有不錯的表現;同樣,MM1 在指令調優後展現出了強大的少樣本學習能力。

本文為品玩授權刊登,原文標題為「蘋果公佈多模態大模型 MM1 ,具備300億參數