🦆

OpenAIのResponses APIとAgents SDKを調べてみる

2025/03/13に公開

なぜ作成したのか

  • OpenAIのエージェントAPI機能がリリースされたらしいので調べてみる

参考

https://openai.com/index/new-tools-for-building-agents
https://innovatopia.jp/ai/ai-news/49171/
https://www.theverge.com/news/627556/openai-ai-agents-responses-api-agents-sdk?utm_source=chatgpt.com
https://www.reuters.com/technology/artificial-intelligence/openai-launches-new-developer-tools-chinese-ai-startups-gain-ground-2025-03-11/?utm_source=chatgpt.com
https://qiita.com/syukan3/items/b9f3db74fe2a33ed3a2f

概要

OpenAIは、AIエージェント開発を加速させる新ツール「Responses API」と「Agents SDK」をリリースしました。これらのツールは、開発者が高度なAIエージェントを容易に構築し、複雑なタスクを自律的に実行することを可能にします。 [1]

主要な機能

  • Responses API: 従来のChat Completions APIの使いやすさと、Assistants APIのツール使用機能を統合した新しいAPIです。これにより、モデルが複数のツールを使用し、マルチターンの対話を通じて複雑なタスクを1回のAPIコールで解決できます。 citeturn0search0

    • 組み込みツール:
      • ウェブ検索: 最新の情報をウェブから取得し、引用付きで提供します。
      • ファイル検索: 大量のドキュメントから関連情報を迅速に検索します。
      • コンピュータ操作: モデルがユーザーに代わってコンピュータ上でタスクを実行します。
  • Agents SDK: 複数のAIエージェントのワークフローを調整・管理するためのオープンソースのフレームワークです。これにより、エージェント間のタスクの引き継ぎや安全性の確保、パフォーマンスの追跡が容易になります。 citeturn0search6

類似製品との比較

  • LangChain: PythonやJavaScript向けのライブラリで、プロンプトテンプレートやLLMChain、ツール呼び出しを統合する「エージェント」フレームワークを提供しています。多様なLLMやベクターDBとの連携が可能で、コミュニティも活発です。

  • Semantic Kernel(Microsoft): Microsoftが公開しているLLMアプリケーション開発フレームワークで、「プラグイン」を通じて複数のスキルをLLMに連携しやすい設計となっています。Azure Cognitive Servicesとの連携がスムーズで、エージェント開発を「スキル」の組み合わせとして構築するコンセプトが特徴です。

  • LlamaIndex: データソースを取り込み、ベクターインデックスを構築して対話型検索や質疑応答を実現するフレームワークです。大量のドキュメントを段階的に要約し、回答に活用する仕組みを提供しています。

OpenAIの「Responses API」と「Agents SDK」は、これらのツールと比較して、OpenAIの最新モデルや組み込みツールとの統合が容易であり、エージェント開発の効率化と高度化を支援する強力なツールセットを提供しています。

OpenAIが新たにリリースした「Responses API」は、Chat Completions APIの簡潔さとAssistants APIのツール活用・状態管理機能を統合した、エージェント指向のAPIです。

Responses APIの技術仕様

  • エンドポイント: POST https://api.openai.com/v1/responses

  • 主要パラメータ:

    • model: 使用するモデル名(例: gpt-4ogpt-4o-mini
    • input: ユーザーからの入力
    • tools: 有効にしたいツールの指定
    • store / previous_response_id: 会話の継続に利用
    • stream: ストリーミング応答の有無
  • 認証: OpenAIのAPIキーが必要

詳細な技術仕様については、OpenAIのAPIリファレンス参照

料金情報

Responses API自体には追加料金は発生せず、選択した言語モデルの入力および出力トークン数に基づいて課金されます。

さらに、組み込みツールの利用には以下の追加料金が適用されます:

  • Web検索ツール:

    • gpt-4oモデルの場合:
      • 低コンテキストサイズ: 1,000回のツール呼び出しあたり$30.00
      • 中コンテキストサイズ(デフォルト): 1,000回のツール呼び出しあたり$35.00
      • 高コンテキストサイズ: 1,000回のツール呼び出しあたり$50.00
    • gpt-4o-miniモデルの場合:
      • 低コンテキストサイズ: 1,000回のツール呼び出しあたり$25.00
      • 中コンテキストサイズ(デフォルト): 1,000回のツール呼び出しあたり$27.50
      • 高コンテキストサイズ: 1,000回のツール呼び出しあたり$30.00
  • ファイル検索ツール:

    • ツール呼び出し: 1,000回の呼び出しあたり$2.50
    • ストレージ使用料: 1GBあたり1日$0.10(最初の1GBは無料)
  • コンピュータ操作ツール:

    • 入力トークン: 100万トークンあたり$3.00
    • 出力トークン: 100万トークンあたり$12.00

これらの料金情報は、OpenAIの公式API料金ページに基づいています。

注意点

Responses APIは、従来のAssistants APIの完全な後継として位置づけられており、2026年半ばにはAssistants APIが廃止される予定です。
また、利用するモデルやツールの組み合わせによって料金が異なるため、具体的なユースケースに応じて最適なプランを検討することが重要です。

所感

  • エージェント機能としてのAPIの動作は純粋に気になるので実際に実装して試してみたいところ
脚注
  1. https://qiita.com/syukan3/items/b9f3db74fe2a33ed3a2f ↩︎

GitHubで編集を提案

Discussion