蘋果公布多模態大模型 MM1，具備300億參數

根據 Arxiv 頁面顯示，蘋果正式公布了自研多模態大模型 MM1，其參數最高可達 300 億。

論文顯示，MM1多模態大模型由密集模型和混合專家（MoE）變體組成，不僅在預訓練指標中實現 SOTA，在一系列已有多模態基準上監督微調後也能保持有競爭力的性能。

MM1 在上下文預測、多圖像和思維鏈推理等方面具有不錯的表現；同樣，MM1 在指令調優後展現出了強大的少樣本學習能力。