Google發表Translatotron 3模型，可繞過文本轉換步驟

（示意圖/取自pixabay）

根據《 IT 之家》消息，Google 正式介紹推出了名為 Translatotron 3 的新 AI 模型，無需任何並行語音數據下，可以實現語音對語音的同聲傳譯翻譯。

Google於 2019 年推出了 Translatotron S2 ST 系統，於 2021 年 7 月推出第 2 個版本，在 2023 年 5 月 27 日發布的一篇論文中，宣布正在部署新方法，訓練 Translatotron 3。

研究人員稱，Translatotron 2 已經提供了卓越的翻譯品質、語音魯棒性（Robust）和語音自然度，而 Translatotron 3 實現「第一個完全無監督直接語音到語音翻譯的端對端模型」。

傳統上的 S2 ST 通過自動語音辨識 + 機器翻譯 + 文本到語音合成的級聯方法來解決，但 Translatotron 3 依賴一種新穎的端對端架構，直接將源語言語音映射到目標語言，而不依賴中間文本表示。Translatotron 3 模型還可用於創建幫助有語言障礙的人的工具，或者開發更具吸引力和有效性的個性化語言學習工具。

本文為AI新智界授權刊登，原文標題為「谷歌發佈 Translatotron 3 模型，可繞過文本轉換步驟」