NVIDIA新研究可將2D照片轉為3D模型,有望用於遊戲領域
彭新 / 何渝婷編譯
2022-06-29 09:30

(圖片來源:NVIDIA)

電腦圖形技術巨頭NVIDIA公布新研究成果,有望解決困擾3D內容創作者已久的2D圖形轉化為3D形態難題。

本月,NVIDIA在2022年電腦視覺與模式辨識會議(CVPR 2022)上公布一系列論文,提出名為「3D MoMa」的逆渲染(Inverse Rendering)方法,更容易將2D照片變成3D物體。

在電腦圖形學領域中,普通渲染過程通常是指把3D場景渲染後獲得螢幕上的2D圖像。而所謂逆渲染,則是借助一張2D圖像,獲得生成這張圖像所需的3D場景資訊,該資訊可以是3D網格模型、材質或照明等,即將一系列靜態照片重建為3D物體或場景模型。

從原理上來看,由於逆渲染過程與安防、自動駕駛領域常使用的電腦視覺(Computer Vision)技術接近,均基於2D圖形出發進行辨識處理,因此頗受學界重視,「該技術長期以來一直是統一電腦視覺和電腦圖形學的關鍵。」NVIDIA圖形研究副總裁David Luebke稱。

NVIDIA稱,相較過往3D對象製作流程,必須通過複雜的建模、渲染流程才能完成,在「3D MoMa」技術下,僅需配合具備AI加速核心GPU,即可在1小時內產生3D模型,並且可兼容多數3D繪圖引擎與建模工具,同時也能快速套用材質貼圖、物理效果,以及即時光影表現,讓創作者能更快調整,用於創作3D影片內容。

在NVIDIA提供的技術演示中,GPU通過對各100張圖片進行分析辨識,而完成了對小號、長號、薩克斯風、爵士鼓和單簧管5種樂器的3D建模,並可導入遊戲引擎、3D建模軟體和電影渲染軟體等工具中。

NVIDIA還稱,創作者可以對模型替換不同物理貼圖,改變光影變化效果等,進一步提高建模的擬真效果。

在NVIDIA內部,將逆渲染技術結合AI技術並實用化,是其努力方向,遊戲是潛在的用途之一。目前在遊戲業界,攝影測量技術是近年流行的3D建模方案,賽車遊戲《極限競速:地平線》和恐怖遊戲《惡靈古堡7 生化危機》均採用了此技術,開發人員通過拍攝大量高精度照片,重構後建模為精細的3D模型,提高了遊戲畫面品質。

攝影測量需要動用大量高精度攝影器材,且拍攝條件要求苛刻,難以大規模在產業內使用。

NVIDIA還指出,目前產業雖然慣用的攝影測量技術創建3D物體,但該方法需要耗費大量的時間和精力。如果「3D MoMa」被廣泛使用,設計師就不需要從頭開始建模,還可節約大量的建模和渲染時間。

此外,「3D MoMa」還支持設計師自主調整模型,提高模型成品品質。

本文為界面新聞授權刊登,原文標題為「英偉達新研究可將2D照片轉為3D模型,有望用於遊戲領域