截至 2 月 7 日下午,DeepSeek 在GitHub 平台的熱門項目「DeepSeek -V3」的點星數已達到 7 萬加,超過了 GitHub 上 OpenAI 最熱門項目。
DeepSeek-V3 模型於 2024 年 12 月 26 日發表,官方表示,DeepSeek-V3 為自研 MoE 模型,671B 參數,啟動 37B,在 14.8T token 上進行了預訓練。
該模型的多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型,並在性能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。
此外,官方表示,通過算法和工程上的創新,DeepSeek-V3 的生成吐字速度從 20 TPS 大幅提高至 60 TPS,相比 V2.5 模型實現了 3 倍的提升,為用戶帶來更加迅速流暢的使用體驗。
本文為愛范兒授權刊登,原文標題為「DeepSeek GitHub 平台熱門項目星數超 OpenAI」