ChatGPT再進化!升級兩大新功能優化人類與AI間的互動
何渝婷
2023-09-26 11:20

由OpenAI開發的人工智慧聊天機器人ChatGPT在2022年11月推出,並在全球引起了生成式人工智慧風潮。

ChatGPT目前以文字的方式與使用者進行互動,可以進行自動文字生成、自動問答、寫程式等,但需要注意的是,ChatGPT給予的答案不一定是完全正確的。

所以OpenAI也持續針對ChatGPT進行系統優化及升級,近期該公司在官網上宣布為ChatGPT推出新的語音和圖像功能。

OpenAI將在未來兩週內向Plus訂閱用戶和商業用戶推出這兩項新功能,語音將在iOS和Android上提供,圖像則將在所有平台上提供。

與ChatGPT語音交談

未來ChatGPT將不只有透過文字回覆,還能夠與使用者對話。

OpenAI與專業配音員合作提供5種真人配音,為ChatGPT的生成式AI加入語音對話功能,使用者可以直接向ChatGPT提問,在理解口語內容後,ChatGPT也將以語音回覆。

另外,這些語音對話過程也可透過ChatGPT的語音辨識系統Whisper,轉為文字檔。

若要開始使用語音功能,使用者可在應用程式中的選擇設定→新功能,接著選擇「加入語音對話」,並點擊主畫面右上角的耳機按鈕,從五種不同的聲音中選擇自己最喜歡的聲音。

解析圖片內容

使用者可以向ChatGPT展示一張或多張影像,藉此排查爐具無法啟動的原因、調整腳踏車高度的方法、探索冰箱的物品來規劃建議菜單,甚至用於複雜的圖表分析。

ChatGPT將基於GPT-3.5和GPT-4,把語言推理技能應用於各種圖像,例如照片、螢幕截圖以及包含文字和圖像的文件。

(以上圖片取自OpenAI官網)