👏

OpenAI の AI エージェント構築用ツール

2025/03/12に公開

tl;dr

  • OpenAI が AI エージェント構築用のツール群を公開したよ
  • ウェブ検索、ファイル検索、Computer Use を内包した Responses API が追加されたよ
  • これからは Chat Completions API や Assistants API の代わりに Responses API を使うことが推奨されるよ
  • Tier による制限は基本的にはないけど、Computer Use だけは Tier 3 以上が必須だよ
  • Computer Use は Operator と同じ CUA モデルを使用しているよ
  • Agents SDK という OSS の軽量 SDK も公開されたよ(旧 Swarm の改良版)

情報源とそれぞれの簡単なまとめ

一次情報のみから。公式の X のポストがいちばん短くまとまっています。

https://x.com/OpenAIDevs/status/1899531225468969240

  • 開発者用の AI エージェント構築ツールをリリース
  • Responses API は従来の Chat Completion と Assistants API の Tool Use を組み合わせたもの
  • 数行のコードの追加で、ウェブ検索、ファイル検索、Computer Use が使える
  • ウェブ検索はウェブから最新の情報をもとに引用文献つきで回答できる
  • ファイル検索は組み込みのクエリ最適化やリランクを用いて、長文ドキュメントから正確に情報を取得
  • Computer Use はウェブ QA テストやデータ入力などのタスクをコンピュータ上で実行できるエージェントを構築できる(Operator と同じ CUA モデル)
  • 研究プレビュー版ゆえ、Usage Tier 3-5 が必須
  • Agent SDK は旧 Swarm を改良したマルチエージェントワークフローを構築するための OSS の軽量 SDK

次は公式記事より重複を避けながらまとめます。事例は個人的にあんまり興味ないのですっ飛ばします。

https://openai.com/index/new-tools-for-building-agents/

  • Responses API ではデフォルトで学習されない
  • Responses API 自体を利用する上での Tier による制限はない(Computer Use を除く)
  • Responses API は Chat Completions API のスーパーセットであり、今後 Responses API から始めることが推奨される
  • Assistants API はしばらくは Responses API と同等の機能が維持されるが、2026 年の半ばには廃止される予定(移行ガイドは用意)
  • Responses API は ChatGPT のウェブ検索で使用されるモデルを使用
  • OpenAI Crawler に新しい User Agent が追加され、ウェブサイト運営者は OAI-SearchBot を指定することで OpenAI の検索で参照され得るかを制御できる
  • Computer Use は Operator と同じ Computer Use Agent (CUA) モデルを使用
  • OSWorld で 38.1%、WebArena で 58.1%、WebVoyager 87% の精度(Operator 発表時と同じ)
  • Computer Use を利用するには Tier 3 以上が必要
  • Agents SDK の改良点は、エージェント、ハンドオフ、ガードレール、トレース&オブザーバビリティ
  • Agents SDK は Responses API と Chat Completions API と互換性があり、他 LLM プロバイダーもサポート

動画に関してはだいたい上記までで網羅しているのでスキップ。実装のイメージが沸くのでよろしければご覧になってください!

https://www.youtube.com/watch?v=hciNKcLwSes


Cookbook がいくつか追加されていました。

https://cookbook.openai.com/examples/responses_api/responses_example

Responses API を使ってウェブ検索やマルチモーダル入力を含む対話をしている例。

https://cookbook.openai.com/examples/file_search_responses

Responses API のファイル検索を使って RAG を実装する例。


Agents SDK のリソースはこのあたりにあります。別途試してみます。

https://github.com/openai/openai-agents-python
https://platform.openai.com/docs/guides/agents

料金は?

https://platform.openai.com/docs/pricing#built-in-tools

お値段は画像の通り。



ファイル検索はストレージと Tool Call のふたつに分かれていて、前者は一日あたり 1GB の無料枠がついていて、追加分は 1GB あたり $0.1、後者は 1000 トークンあたり $2.5。

ウェブ検索は Context Size を low / medium / high から選べて、デフォルトは medium が適用される。個人的には 4o / 4o-mini で正直あんまり変わらないという印象を持ちました。

Computer Use は 1M トークンあたり入力 $3、出力 $12、だいたい GPT-4o と同じくらい。

以上となります。

GitHubで編集を提案

Discussion