照片容易失真?研究人員利用AI技術解決水下圖片模糊問題
靈火K / 鄭寧編譯
2019-12-31 16:00

(示意圖/來源為Pixabay)

你是否注意到,當拍攝水下照片的時候圖像會出現比以往拍攝效果更嚴重的模糊並且失真的情況?這是因為光衰減和反向散射等現象會對可見度產生不利影響。

為了解決這個問題,中國哈爾濱工程大學的研究人員設計了一種機器學習演算法,該演算法可以生成逼真的水下圖像;另一種演算法,則可以對這些圖像進行深度訓練,以達到恢復自然色彩並減少霧度的效果。他們說,這種方法在品質和數量上都與最新技術相匹配,並且能夠在單個顯卡上以每秒125幀的速度進行處理。

該團隊指出,大多數水下圖像增強演算法(例如那些調整白平衡的演算法)都不是基於物理成像模型實現,這使其不適用於一些任務。相比之下,這種方法利用了生成式對抗網路(GAN)(一種深度學習模型,模型通過框架中兩個模組:生成模型和判別模型的互相博弈學習產生相當好的輸出),以生成一組特定調查地點的圖像並在此基礎上引入第二種演算法,U-Net。

研究小組對GAN進行了一系列有標記場景的訓練,這些場景包括3733幅圖像和相應的深度地圖,主要包括扇貝、海參、海膽和室內海洋農場內的其他此類生物。他們還獲得了包括NY Depth在內的公開資料庫,其中包含了總共數千張水下照片。

訓練後,研究人員將雙模型方法的結果與基線模型方法的結果進行了比較。他們指出,前者技術的優勢在於它在顏色恢復上是統一的,這使它能在很好恢復綠色色調圖像的同時,不破壞原始輸入圖像的底層結構。通常情況下,這種方式在保持「適當的」亮度和對比度的同時,還能設法恢復顏色,而在這方面其他解決方案並不特別擅長。

值得注意的是,這並不是第一個想到利用AI技術從損壞的圖片中重建畫面的研究團隊。劍橋諮詢(Cambridge Consultants)公司的AI系統DeepRay利用了一套訓練有素的GAN來處理10萬張靜止圖像的資料庫,以消除不透明的玻璃窗格導致的失真。開源DeOldify項目使用了包括GANs在內的一系列人工智慧模型來對舊圖像和膠片進行著色和恢復。

在其他方面,微軟亞洲研究院(Microsoft Research Asia)的科學家在9月份詳細介紹了一個用於自主影片著色的端到端系統;NVIDIA的研究人員去年描述了一個框架,該框架僅基於一個被注釋過得彩色影片幀推斷顏色分類;今年6月,谷歌AI團隊推出了一種無需人工監督即可對灰度影片進行著色的演算法。

本文為雷鋒網授權刊登,原文標題為「研究人員分享如何利用 AI 技術解決水下圖片模糊和著色問題