Sesame發表CSM模型:即時情感訂製,AI語音合成邁向新高度
品玩 / 何渝婷編譯
2025-03-14 15:35

根據 AIbase 報導,Sesame公司推出其最新語音合成模型CSM,該模型採用端到端基於Transformer的多模態學習架構,能夠理解上下文資訊,生成自然且富有情感的語音。

CSM模型支持即時語音生成,可處理文本和音訊輸入,用戶還能通過調整參數控制語氣、語調、節奏及情感等特性,展現高度靈活性。

目前,CSM主要針對英語訓練,表現優異,但在多語言支持上仍有限制。

目前其不支持中文,但期待未來擴展。

本文為品玩授權刊登,原文標題為「Sesame發佈CSM模型:實時情感定制 AI語音合成邁向新高度