OpenAIのResponses APIとAgents SDKを調べてみる
なぜ作成したのか
- OpenAIのエージェントAPI機能がリリースされたらしいので調べてみる
参考
概要
OpenAIは、AIエージェント開発を加速させる新ツール「Responses API」と「Agents SDK」をリリースしました。これらのツールは、開発者が高度なAIエージェントを容易に構築し、複雑なタスクを自律的に実行することを可能にします。 [1]
主要な機能
-
Responses API: 従来のChat Completions APIの使いやすさと、Assistants APIのツール使用機能を統合した新しいAPIです。これにより、モデルが複数のツールを使用し、マルチターンの対話を通じて複雑なタスクを1回のAPIコールで解決できます。 citeturn0search0
-
組み込みツール:
- ウェブ検索: 最新の情報をウェブから取得し、引用付きで提供します。
- ファイル検索: 大量のドキュメントから関連情報を迅速に検索します。
- コンピュータ操作: モデルがユーザーに代わってコンピュータ上でタスクを実行します。
-
組み込みツール:
-
Agents SDK: 複数のAIエージェントのワークフローを調整・管理するためのオープンソースのフレームワークです。これにより、エージェント間のタスクの引き継ぎや安全性の確保、パフォーマンスの追跡が容易になります。 citeturn0search6
類似製品との比較
-
LangChain: PythonやJavaScript向けのライブラリで、プロンプトテンプレートやLLMChain、ツール呼び出しを統合する「エージェント」フレームワークを提供しています。多様なLLMやベクターDBとの連携が可能で、コミュニティも活発です。
-
Semantic Kernel(Microsoft): Microsoftが公開しているLLMアプリケーション開発フレームワークで、「プラグイン」を通じて複数のスキルをLLMに連携しやすい設計となっています。Azure Cognitive Servicesとの連携がスムーズで、エージェント開発を「スキル」の組み合わせとして構築するコンセプトが特徴です。
-
LlamaIndex: データソースを取り込み、ベクターインデックスを構築して対話型検索や質疑応答を実現するフレームワークです。大量のドキュメントを段階的に要約し、回答に活用する仕組みを提供しています。
OpenAIの「Responses API」と「Agents SDK」は、これらのツールと比較して、OpenAIの最新モデルや組み込みツールとの統合が容易であり、エージェント開発の効率化と高度化を支援する強力なツールセットを提供しています。
OpenAIが新たにリリースした「Responses API」は、Chat Completions APIの簡潔さとAssistants APIのツール活用・状態管理機能を統合した、エージェント指向のAPIです。
Responses APIの技術仕様
-
エンドポイント:
POST https://api.openai.com/v1/responses
-
主要パラメータ:
-
model
: 使用するモデル名(例:gpt-4o
、gpt-4o-mini
) -
input
: ユーザーからの入力 -
tools
: 有効にしたいツールの指定 -
store
/previous_response_id
: 会話の継続に利用 -
stream
: ストリーミング応答の有無
-
-
認証: OpenAIのAPIキーが必要
詳細な技術仕様については、OpenAIのAPIリファレンス参照
料金情報
Responses API自体には追加料金は発生せず、選択した言語モデルの入力および出力トークン数に基づいて課金されます。
さらに、組み込みツールの利用には以下の追加料金が適用されます:
-
Web検索ツール:
-
gpt-4o
モデルの場合:- 低コンテキストサイズ: 1,000回のツール呼び出しあたり$30.00
- 中コンテキストサイズ(デフォルト): 1,000回のツール呼び出しあたり$35.00
- 高コンテキストサイズ: 1,000回のツール呼び出しあたり$50.00
-
gpt-4o-mini
モデルの場合:- 低コンテキストサイズ: 1,000回のツール呼び出しあたり$25.00
- 中コンテキストサイズ(デフォルト): 1,000回のツール呼び出しあたり$27.50
- 高コンテキストサイズ: 1,000回のツール呼び出しあたり$30.00
-
-
ファイル検索ツール:
- ツール呼び出し: 1,000回の呼び出しあたり$2.50
- ストレージ使用料: 1GBあたり1日$0.10(最初の1GBは無料)
-
コンピュータ操作ツール:
- 入力トークン: 100万トークンあたり$3.00
- 出力トークン: 100万トークンあたり$12.00
これらの料金情報は、OpenAIの公式API料金ページに基づいています。
注意点
Responses APIは、従来のAssistants APIの完全な後継として位置づけられており、2026年半ばにはAssistants APIが廃止される予定です。
また、利用するモデルやツールの組み合わせによって料金が異なるため、具体的なユースケースに応じて最適なプランを検討することが重要です。
所感
- エージェント機能としてのAPIの動作は純粋に気になるので実際に実装して試してみたいところ
Discussion