Google版Sora深夜秀肌肉，支持4K影片生成

（取自Google Deepmind X）

台灣時間今日凌晨，Google Deepmind 推出了新的影片模型 Veo 2 和 Imagen 3。

根據官方介紹，Veo 2 帶來了多項重要突破：

相比其他影片模型常見的「錯誤生成」問題（如多餘手指或意外物體），Veo 2 顯著降低了這類錯誤的出現頻率，大幅提升了輸出結果的真實度。

在安全性方面，所有由 Veo 2 生成的影片都會嵌入不可見的 SynthID 浮水印，便於辨識其 AI 生成的屬性。

Google Labs 的影片生成工具 VideoFX 已集成了 Veo 2 的新功能，同時擴大了用戶訪問範圍。

不過，DeepMind 有意控制推廣的速度，計劃在明年將 Veo 2 的功能逐步引入 YouTube Shorts 等產品，以在擴展應用範圍的同時確保模型品質和安全性。

與此同時，Imagen 3 也實現了重大突破，新版本不僅支持創作多種藝術風格（包括現實主義、幻想、肖像等），能夠更精確地將文字描述轉化為圖像，以及生成更明亮、構圖更協調的視覺作品。

此外，Google 還推出了名為 Whisk 的工具，該工具在技術層面整合了最新的 Imagen 3 模型與 Gemini 的視覺理解能力。

Gemini 模型可以自動為圖像生成詳細描述，這些描述隨後會作為輸入傳遞給 Imagen 3，用戶可以通過導入或創作圖像，表達特定主題、場景和風格需求，並將這些元素融合重組，創作數位化產品。

本文為愛范兒授權刊登，原文標題為「Google 版 Sora 深夜秀肌肉，支持 4K 視頻生成」