AgentKit 速報メモ
OpenAI公式のエージェント構築ツールAgentKitが発表されました。
そんなAgentKitを使ってみたいと思っている方向けの日本語資料があまり揃っていなかったので、自分用メモを速報的にまとめてみました。
AgentKitとは
AgentKitは開発者がAgentを構築、展開、最適化するための包括的なツールセットで、視覚的にワークフローを設計でき、手動による評価パイプラインや複雑なオーケストレーション、チューニング、そしてフロントエンド作業を省略化できるそうです。
以下の3つの要素が提供されるそう
- エージェント ビルダー:エージェント、ワークフローを設計するためのビジュアルキャンバス?
- コネクタ レジストリ: OpenAIの製品間でデータとツールを接続する方法を管理するパイプライン
- レジストリには、Dropbox、Google Drive、SharePoint、Microsoft Teamsなどのすべての既成コネクタに加え、サードパーティのMCPも含まれています。
- ChatKit: カスタマイズ可能なチャットベースのエージェントエクスペリエンスを製品に組み込むためのツールキット。フロントエンド構築のためのSDK?
- ストリーミングのレスポンス処理、モデルの思考の表示など普段触ってるChatGPTにある機能をアプリやウェブサイトに組み込むことができるそう
AgentKit紹介ページを読んだ筆者の簡易イメージ図(間違ってたらごめんなさい)*
- ストリーミングのレスポンス処理、モデルの思考の表示など普段触ってるChatGPTにある機能をアプリやウェブサイトに組み込むことができるそう
その他、評価データセット、トレースのグレーディング、自動プロンプト最適化、サードパーティモデルのサポートなどの新機能により評価機能を拡張し、エージェントのパフォーマンスを測定および改善できるそう。
あとはガードレールも有効化できるそうで、意図しない動作や悪意のある動作から保護するオープンソースのモジュールが提供されるそう。個人情報(PII)をマスクまたはフラグ付けし、JailBreak(ここでは、特殊なプロンプトでAIの安全機能を回避する攻撃手法の文脈で話してると思う)を検出し、その他の安全対策を適用することで、信頼性が高く安全なエージェントの構築と展開を容易にできるとのこと。
事例から見るAgentKitの使い方
エージェントビルダーのUI
Ramp では、チームはわずか数時間で白紙の状態からバイヤーエージェントへと成長しました。
LY 株式会社は、Agent Builder を使用して 2 時間以内に作業アシスタント エージェントを構築しました。
Canva 開発者コミュニティ向けのサポートエージェントの構築を1時間足らずで完了
その他Hubspot, LegalOnなどの企業がスピーディーにエージェント構築した例が紹介されていました。
AgentKitの提供状況
ChatKitと新しいEvals機能(エージェント評価機能)は全ての開発者に一般公開されています。
Agent Builderはベータ版で提供。Connector Registryは一部のAPI、ChatGPT Enterprise、Eduのお客様向けにベータ版のロールアウトを開始するそう。グローバル管理コンソール経由での提供になりそう。試してみる。
また、まもなく、ChatGPT にスタンドアロンのワークフローAPIなども追加する予定だそうですのでこちらも楽しみですね。
まとめ
今回はエージェント構築ツールAgentKitについてまとめました。まずは概要を届けようと思い、速報的に自分なりにまとめてみました。
公式ガイドも見つけたので、次回はこちらを元に実際にAgentを構築してみたいと思います。こちらも近日中に公開予定ですので、ウォッチいただければと思います。
補足
RFT(Reinforcement Fine-tuning)も話に上がっており、GPT-5向けのRFTを一般公開前に改良しているそう。ベータ版で二つの新機能が展開されてる。
- カスタムツール呼び出し: 適切な推論ができるように、適切なタイミングで適切なツールを呼び出すようにモデルをトレーニングできる
- カスタム採点者: ユースケースに合わせたカスタムな評価基準を設定できる
参考文献
OpenAI 公式AgentKit PR記事
OpenAI 公式AgentKit 解説動画
OpenAI 公式AgentKit 開発ガイド
Discussion