由OpenAI開發的人工智慧聊天機器人ChatGPT在2022年11月推出,並在全球引起了生成式人工智慧風潮。
ChatGPT目前以文字的方式與使用者進行互動,可以進行自動文字生成、自動問答、寫程式等,但需要注意的是,ChatGPT給予的答案不一定是完全正確的。
所以OpenAI也持續針對ChatGPT進行系統優化及升級,近期該公司在官網上宣布為ChatGPT推出新的語音和圖像功能。
OpenAI將在未來兩週內向Plus訂閱用戶和商業用戶推出這兩項新功能,語音將在iOS和Android上提供,圖像則將在所有平台上提供。
與ChatGPT語音交談
未來ChatGPT將不只有透過文字回覆,還能夠與使用者對話。
OpenAI與專業配音員合作提供5種真人配音,為ChatGPT的生成式AI加入語音對話功能,使用者可以直接向ChatGPT提問,在理解口語內容後,ChatGPT也將以語音回覆。
另外,這些語音對話過程也可透過ChatGPT的語音辨識系統Whisper,轉為文字檔。
若要開始使用語音功能,使用者可在應用程式中的選擇設定→新功能,接著選擇「加入語音對話」,並點擊主畫面右上角的耳機按鈕,從五種不同的聲音中選擇自己最喜歡的聲音。
解析圖片內容
使用者可以向ChatGPT展示一張或多張影像,藉此排查爐具無法啟動的原因、調整腳踏車高度的方法、探索冰箱的物品來規劃建議菜單,甚至用於複雜的圖表分析。
ChatGPT將基於GPT-3.5和GPT-4,把語言推理技能應用於各種圖像,例如照片、螢幕截圖以及包含文字和圖像的文件。
(以上圖片取自OpenAI官網)