OpenAl發表Agent工具包
愛范兒 / 何渝婷編譯
2025-03-12 10:39

今日凌晨,OpenAI 發布了一系列專為建構 AI Agents 設計的新工具和 API,幫助開發者更容易創建能自動完成任務的 AI Agents(智能體)。具體包含了以下內容:

  • Responses API:結合 Chat Completions API 簡潔性與 Assistants API 工具使用能力的新型 API 接口;
  • Web 搜尋工具(Web Search Tool):讓模型訪問網路獲取最新資訊的工具;
  • 文件搜尋工具(File Search Tool):從大量文檔中檢索相關資訊的增強工具;
  • 電腦使用工具(Computer Use Tool):由 Computer-Using Agent (CUA) 模型提供支持的電腦操作自動化工具,讓 AI 能像人一樣操作電腦介面;
  • Agents SDK:基於 Swarm 框架升級,簡化多 Agent 工作流程編排的開源框架。

具體來說,在 Responses API 結的加持下,開發者只需調用一次 API ,即可利用多種工具和多輪模型交互解決複雜任務。

而在內置工具方面,Web 搜尋工具支持 GPT-4o 和 GPT-4o-mini 模型獲取網路最新資訊並提供清晰的引用,在 SimpleQA 基準測試中,這兩款模型的搜尋預覽版分別拿下了 90% 和 88% 的亮眼準確率;升級後的文件搜尋工具更是給力,支援多種文件格式,還能優化查詢、過濾元數據、自定義排序。

電腦使用工具則由與 Operator 相同的 Computer-Using Agent (CUA)模型提供支援,可捕獲模型生成的滑鼠和鍵盤操作,在 OSWorld、WebArena 和 WebVoyager 基準測試中分別取得 38.1%、58.1% 和 87% 的成績。

而 Agents SDK 提供易於配置的 LLM 與內置工具集成、Agent 間智慧交接控制、可配置安全檢查以及可視化追蹤等功能,適用於客戶支持自動化、多步研究、內容生成等多種應用場景。

對於現有 API 的安排,OpenAI 表示會繼續全力支持 Chat Completions API,為不需要內置工具的開發者提供新模型和功能。而基於 Assistants API 測試版的回饋,他們已經把關鍵改進整合到 Responses API 中,計劃在功能對齊後,於 2026 年中期正式停用 Assistants API,同時會提供詳細的遷移指南。

價格方面,Web 搜尋每千次查詢分別為 GPT-4o 搜尋 30 美元和 GPT-4o-mini 搜尋 25 美元;文件搜尋每千次查詢 2.5 美元,文件儲存 0.1 美元 / GB / 天(首 GB 免費);電腦使用工具則按每輸入百萬 token/3 美元和每輸出百萬 token/12 美元計費。

本文為愛范兒授權刊登,原文標題為「OpenAl 發佈 Agent 工具包