融合視覺能力,OpenAI向開發人員提供GPT-4 Turbo with Vision
品玩 / 何渝婷編譯
2024-04-10 11:35

根據《letsclouds》報導,OpenAI 宣布,具有視覺能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 現在已經通過 OpenAI API 向開發人員普遍提供。

該模型延續了 GPT-4 Turbo 系列 128,000 個 token 的窗口大小以及截止至 2023 年 12 月的知識庫,最大的革新之處在於其新增的視覺理解能力。

在過去,開發者需要調用不同的模型來處理文本和圖像資訊,而 GPT-4 Turbo with Vision 則將兩者合二為一,極大簡化了開發流程,並帶來了廣泛的應用前景。

OpenAI 也分享了一些開發者正在使用該模型的有趣案例。例如,AI 軟體工程助理 Devin 利用 GPT-4 Turbo with Vision 輔助編程;健康健身應用程式 Healthify 使用該模型掃描用戶飲食照片,通過圖像辨識提供營養分析;創意平台 Make Real 則利用該模型將用戶的草圖轉化為可運行的網站。

目前,GPT-4 Turbo with Vision 尚未應用於 ChatGPT 或開放給大眾使用,不過 OpenAI 暗示該功能即將登陸 ChatGPT。

觀眾對這個彩蛋的反應不一,一些觀眾認為這很有趣,並說這可能是人類音樂製作人的別名;另一些觀眾則稱讚該電視劇在人工智慧署名方面的透明度。

本文為品玩授權刊登,原文標題為「融合視覺能力,OpenAI 向開發人員提供 GPT-4 Turbo with Vision