Google發表Translatotron 3模型,可繞過文本轉換步驟
東尋 / 何渝婷編譯
2023-12-03 10:32

(示意圖/取自pixabay)

根據《 IT 之家》消息,Google 正式介紹推出了名為 Translatotron 3 的新 AI 模型,無需任何並行語音數據下,可以實現語音對語音的同聲傳譯翻譯。

Google於 2019 年推出了 Translatotron S2 ST 系統,於 2021 年 7 月推出第 2 個版本,在 2023 年 5 月 27 日發布的一篇論文中,宣布正在部署新方法,訓練 Translatotron 3。

研究人員稱,Translatotron 2 已經提供了卓越的翻譯品質、語音魯棒性(Robust)和語音自然度,而 Translatotron 3 實現「第一個完全無監督直接語音到語音翻譯的端對端模型」。

傳統上的 S2 ST 通過自動語音辨識 + 機器翻譯 + 文本到語音合成的級聯方法來解決,但 Translatotron 3 依賴一種新穎的端對端架構,直接將源語言語音映射到目標語言,而不依賴中間文本表示。Translatotron 3 模型還可用於創建幫助有語言障礙的人的工具,或者開發更具吸引力和有效性的個性化語言學習工具。

本文為AI新智界授權刊登,原文標題為「谷歌發佈 Translatotron 3 模型,可繞過文本轉換步驟