👏

OpenAI の AI エージェント構築用ツール

2025/03/12に公開

 tl;drOpenAI が AI エージェント構築用のツール群を公開したよ
ウェブ検索、ファイル検索、Computer Use を内包した Responses API が追加されたよ
これからは Chat Completions API や Assistants API の代わりに Responses API を使うことが推奨されるよ
Tier による制限は基本的にはないけど、Computer Use だけは Tier 3 以上が必須だよ
Computer Use は Operator と同じ CUA モデルを使用しているよ
Agents SDK という OSS の軽量 SDK も公開されたよ（旧 Swarm の改良版）

 情報源とそれぞれの簡単なまとめ一次情報のみから。公式の X のポストがいちばん短くまとまっています。
!LLM 要約を読んで原文を読んでそれをもとに意訳、まとめています。もし解釈違いをしていたらコメントにてご指摘くださいませ。
https://x.com/OpenAIDevs/status/1899531225468969240
開発者用の AI エージェント構築ツールをリリース
Responses API は従来の Chat Completion と Assistants API の Tool Use を組み合わせたもの
数行のコードの追加で、ウェブ検索、ファイル検索、Computer Use が使える
ウェブ検索はウェブから最新の情報をもとに引用文献つきで回答できる
ファイル検索は組み込みのクエリ最適化やリランクを用いて、長文ドキュメントから正確に情報を取得
Computer Use はウェブ QA テストやデータ入力などのタスクをコンピュータ上で実行できるエージェントを構築できる（Operator と同じ CUA モデル）
研究プレビュー版ゆえ、Usage Tier 3-5 が必須
Agent SDK は旧 Swarm を改良したマルチエージェントワークフローを構築するための OSS の軽量 SDK
次は公式記事より重複を避けながらまとめます。事例は個人的にあんまり興味ないのですっ飛ばします。
https://openai.com/index/new-tools-for-building-agents/
Responses API ではデフォルトで学習されない
Responses API 自体を利用する上での Tier による制限はない（Computer Use を除く）
Responses API は Chat Completions API のスーパーセットであり、今後 Responses API から始めることが推奨される
Assistants API はしばらくは Responses API と同等の機能が維持されるが、2026 年の半ばには廃止される予定（移行ガイドは用意）
Responses API は ChatGPT のウェブ検索で使用されるモデルを使用
OpenAI Crawler に新しい User Agent が追加され、ウェブサイト運営者は OAI-SearchBot を指定することで OpenAI の検索で参照され得るかを制御できる
Computer Use は Operator と同じ Computer Use Agent (CUA) モデルを使用
OSWorld で 38.1%、WebArena で 58.1%、WebVoyager 87% の精度（Operator 発表時と同じ）
Computer Use を利用するには Tier 3 以上が必要
Agents SDK の改良点は、エージェント、ハンドオフ、ガードレール、トレース＆オブザーバビリティ
Agents SDK は Responses API と Chat Completions API と互換性があり、他 LLM プロバイダーもサポート
動画に関してはだいたい上記までで網羅しているのでスキップ。実装のイメージが沸くのでよろしければご覧になってください！
https://www.youtube.com/watch?v=hciNKcLwSes
Cookbook がいくつか追加されていました。
https://cookbook.openai.com/examples/responses_api/responses_example
Responses API を使ってウェブ検索やマルチモーダル入力を含む対話をしている例。
https://cookbook.openai.com/examples/file_search_responses
Responses API のファイル検索を使って RAG を実装する例。
Agents SDK のリソースはこのあたりにあります。別途試してみます。
https://github.com/openai/openai-agents-python

https://platform.openai.com/docs/guides/agents

 料金は？https://platform.openai.com/docs/pricing#built-in-tools
お値段は画像の通り。




ファイル検索はストレージと Tool Call のふたつに分かれていて、前者は一日あたり 1GB の無料枠がついていて、追加分は 1GB あたり $0.1、後者は 1000 トークンあたり $2.5。
ウェブ検索は Context Size を low / medium / high から選べて、デフォルトは medium が適用される。個人的には 4o / 4o-mini で正直あんまり変わらないという印象を持ちました。
Computer Use は 1M トークンあたり入力 $3、出力 $12、だいたい GPT-4o と同じくらい。
以上となります。

GitHubで編集を提案

tl;dr

情報源とそれぞれの簡単なまとめ

料金は？

Discussion