人工智慧語言學習平台Speak今日發布新聞稿,宣布與OpenAI合作,透過其Realtime API建立Live Roleplays,也就是即時角色扮演,以建立下一代語言學習體驗。
Speak團隊指出,絕大多數的語言學習者無法達到流利程度的原因,主要因為他們獲得口語練習和對話夥伴的機會極其有限,而Speak的出現就是為了解決此一痛點,希望能利用人工智慧技術讓地球上的任何人都可以接觸到最好的口語導師及對話夥伴。
所以在約兩年前,Speak發表了世界上第一個用於對話練習的人工智慧角色扮演體驗,這也是Speak從一個口語練習工具轉變為真正輔導體驗的第一步。
不過仍然存在許多限制,包括轉錄學習者的語音、基於文本的大型語言模型工作流程、合成到人工智慧角色的語音,這個過程都較為緩慢且有許多錯誤,導致對話感覺起來不夠自然。
所以本次與OpenAI的合作,透過GPT-4o的Realtime API和直接語音轉語音功能,推出Live Roleplays,上述問題都得到了根本的解決。
Live Roleplays將 Realtime API與Speak的學習引擎相結合,可以在各種角色扮演場景中實現身臨其境、栩栩如生的口語練習。
而藉助GPT-4o上的即時API,Speak人工智慧導師不僅回應速度跟人類合作夥伴一樣快或更快,還可以理解純文字記錄之外的語音問題,包括語氣、發音等,並提供相對應的回饋。
針對Live Roleplays的表現,Speak強調其超越一般人工智慧助理語音模式的重要特色包括:
1.Speak會運用熟練度圖表(proficiency graph)系統來追蹤使用者的語言知識狀態,以確保對話處於正確的水準,並使用最合適的句型和詞彙。
2.Speak會為使用者提供具體學習目標,並為他們提供方向來進行最有效率的練習。
3.當使用者遇到困難時,Speak會提供適當的提示來幫助他們繼續進行對話。
(以上圖片取自Speak官網)