Google版Sora深夜秀肌肉,支持4K影片生成
愛范兒 / 何渝婷編譯
2024-12-17 10:22

(取自Google Deepmind X)

台灣時間今日凌晨,Google Deepmind 推出了新的影片模型 Veo 2 和 Imagen 3。

根據官方介紹,Veo 2 帶來了多項重要突破:

  • 支持製作高達 4K 分辨率的影片
  • 能夠辨識指令中的鏡頭控制,例如廣角、第一人稱視角和無人機拍攝
  • 能更真實地模擬物理現象和人類表情變化

相比其他影片模型常見的「錯誤生成」問題(如多餘手指或意外物體),Veo 2 顯著降低了這類錯誤的出現頻率,大幅提升了輸出結果的真實度。

在安全性方面,所有由 Veo 2 生成的影片都會嵌入不可見的 SynthID 浮水印,便於辨識其 AI 生成的屬性。

Google Labs 的影片生成工具 VideoFX 已集成了 Veo 2 的新功能,同時擴大了用戶訪問範圍。

不過,DeepMind 有意控制推廣的速度,計劃在明年將 Veo 2 的功能逐步引入 YouTube Shorts 等產品,以在擴展應用範圍的同時確保模型品質和安全性。

與此同時,Imagen 3 也實現了重大突破,新版本不僅支持創作多種藝術風格(包括現實主義、幻想、肖像等),能夠更精確地將文字描述轉化為圖像,以及生成更明亮、構圖更協調的視覺作品。

此外,Google 還推出了名為 Whisk 的工具,該工具在技術層面整合了最新的 Imagen 3 模型與 Gemini 的視覺理解能力。

Gemini 模型可以自動為圖像生成詳細描述,這些描述隨後會作為輸入傳遞給 Imagen 3,用戶可以通過導入或創作圖像,表達特定主題、場景和風格需求,並將這些元素融合重組,創作數位化產品。

本文為愛范兒授權刊登,原文標題為「Google 版 Sora 深夜秀肌肉,支持 4K 視頻生成