蘋果公開Apple Intelligence所用模型,參數規模達30億
品玩 / 何渝婷編譯
2024-06-12 11:57

(示意圖/取自pixabay)

根據《 venturebeat 》報導,蘋果在 WWDC 發表會之後發表文章,介紹了Apple Intelligence背後所採用的模型。

據報導,蘋果使用的是一個 30 億參數模型,但該公司並沒有明確說明它使用哪種模型作為基礎模型。

不過它最近發表了幾個開放模型,包括 OpenELM 系列語言模型,其中包括一個 30 億參數版本,OpenELM 是在 1.8 兆個令牌的開放數據集上訓練出來的。

部落格文章指出,新的基礎模型是在「授權數據,包括為增強特定功能而選擇的數據,以及我們的網路爬蟲 AppleBot 收集的公開數據」上訓練出來的。

據悉,OpenELM 已針對資源有限的設備進行了優化。

本文為品玩授權刊登,原文標題為「蘋果公開Apple Intelligence所用模型,參數規模達30億