🧩

Atlas のツール呼び出し構造を理解する

に公開

はじめに

ChatGPT Atlas では、LLMが「内部API群(tools)」を通して外部世界とやりとりします。
本稿では、そのツール呼び出し構造を開発者視点で分解します。


1. Atlasのツール呼び出しモデル

AtlasはFunction Callingの拡張版を採用しています。
各ツールはOpenAI独自の命名規則で定義され、LLMは最適なツールを自律的に呼び出します。

namespace web.search
namespace kaur1br5.list_tabs
namespace bio (memory persistence)

各ツールはI/O制限、認証権限、タイムアウトなどが厳密に設定されており、誤操作や外部漏洩を防ぐ仕組みになっています。


2. 呼び出しの流れ

User → GPT-5 Core → Tool Dispatcher → Execution Layer → Result Rendering
  1. Dispatcherが適切なツールを選択。
  2. Execution Layerが権限付きサンドボックスで動作。
  3. Rendererがユーザーに整形して返却。

3. 拡張ツール例

ツール 説明
web.search() 外部Web情報を取得(最新ニュース・統計など)
file_search.msearch() アップロードされたファイルを全文検索
python 数値計算・グラフ描画・データ分析
bio 永続メモリ(ユーザー文脈を保持)
kaur1br5 ブラウザ制御(タブ・履歴・ブックマーク)

4. Atlasが従来のLLMと異なる点

通常のLLMは「質問→回答」までが閉じた構造でした。
Atlasでは「LLM→実行→環境変化→再推論」という循環的構造を持ち、行動結果を再解釈できます。


まとめ

Atlasのツール呼び出し構造は、エージェント型AIの設計思想をそのまま具現化しています。
この設計は、将来的な自己駆動型ブラウザAIの基礎になるでしょう。

Discussion