[AI Agent Jump Start 基礎編#2] AIエージェント基礎
Agentとは何か
AI Agentの定義
AI Agentとは
大規模言語モデル(LLM:Large Language Model)を中核に持ち、指示を理解して自律的に行動するシステムのことです。
通常のLLMは質問に答えるだけですが、エージェントは外部ツールやデータベースにアクセスし、複数の行動を組み合わせてゴールを達成することができます。
近年、業務や日常の中で「単純な情報提供」だけでなく、「実際に動いてくれるAI」が求められています。
AI Agentはそのニーズに応える形で登場し、プログラミングや専門知識がなくても高度な作業を任せられるため、ビジネスや個人の作業効率化において大きな可能性を秘めています。
通常のLLMとの違い
- 通常のLLM:入力された文章に対して、その場で最も適切と思われる回答を生成する
- AI Agent:回答するだけでなく、必要に応じて調査・計画・外部システムとの連携を行い、結果をまとめて提示する
例
「東京から大阪までの最安の行き方を教えて」と頼んだ場合:
- 通常のLLM → 知識データから答えるだけ
- AI Agent → 実際に運賃検索サイトにアクセスし、最新の情報を取得する
思考+行動のサイクル
思考+行動のサイクルとは
AI Agentの基本的な動き方は「思考(Think)」と「行動(Act)」を繰り返すサイクルです。
このサイクルにより、単なる一回の回答ではなく試行錯誤を重ねながらゴールに近づけます。
サイクルの流れ
- 思考(Think) ゴールに対して「今、何をすべきか?」を考える
- 行動(Act) 外部ツールを使ったり、検索・計算を実行する
- 観察(Observe) 結果を確認し、次の思考フェーズに反映する
サイクルの重要性
- 一回の回答で完結しない複雑なタスクに対応できる
- 新しい情報や予期しない結果に柔軟に対応できる
- 途中で方向性を修正し、無駄な作業を減らせる
できること
プランニング
- 定義:ゴールを達成するために「何を・どの順番で・どのように進めるか」を決める工程
-
効果:
- 作業の抜け漏れを防ぐ
- 優先度の高いステップから着手できる
- 外部ツールや情報収集のタイミングを最適化できる
- 途中の結果を見て柔軟に修正できる
外部ツール呼び出し
- 定義:LLM単体では不可能な「最新情報の取得」や「専門処理」を行うために外部サービスを利用
-
例:
- Web検索(天気予報やニュース)
- APIアクセス(予約システム、為替レート)
- データベース照会(顧客情報、売上データ)
- コード実行環境(計算、グラフ生成)
マルチステップ推論
- 定義:答えに至るまでの過程を複数の小さなステップに分けて進める
-
流れ:
- 分解 → サブ目標に分ける
- 仮説 → 次に確認すべきことを決める
- 行動 → 検索や計算を実行
- 検証 → 結果が妥当か確認
- 統合 → 中間結果をまとめる
- 停止判断 → ゴール到達か追加ステップか判断
ReActとは
ReAct (Reasoning + Acting) は、LLMが推論と行動を交互に繰り返してゴールに到達する代表的なフレームワークです。
「考える → 動く → 観察する」を小刻みに回すことで、長いタスクでも迷子になりにくいのが特徴です。
思考のChain-of-Thoughtと外部呼び出しの組み合わせ
Chain-of-Thought(CoT)
LLMが最終回答を出すまでに行う段階的な推論のプロセス。
これを外部ツール呼び出しと組み合わせることで、実用的な動作が可能になります。
基本の流れ
- 思考:「次に何をすべきか」を内部で考える
- 外部呼び出しの判断:「内部知識では足りない」と判断
- ツール呼び出し(Act):Web検索やAPI呼び出しを実行
- 観察(Observe):結果を確認し再推論
- 最終回答生成:すべてを統合して提示
プロンプト例と解説
プロンプト例(旅行プラン作成)
あなたは有能なアシスタントAIです。以下のルールで行動してください。
【ルール】
Reason(推論)では、今の状況や次に行うべき最小の行動を1つだけ考えてください。
Act(行動)では、選んだ行動を実行してください(ツール名と引数を明記)。
Observe(観察)では、行動の結果を要約し、次のReasonに必要な情報だけを残してください。
このReason → Act → Observeのサイクルを繰り返し、ゴールに到達したら最終回答を出してください。
【ゴール】
東京から京都までの週末旅行プランを作成する。
実行例
Reason: まず移動手段を確認する必要がある。新幹線の所要時間と料金を調べよう。
Act: Web検索ツールを使って「東京 京都 新幹線 所要時間 料金」を検索
Observe: 新幹線のぞみは約2時間30分、料金は約14,000円
Reason: 次に、京都の主要観光地の候補を集めよう。
Act: Web検索ツールで「京都 観光地 人気ランキング」を検索
Observe: 清水寺、金閣寺、伏見稲荷大社、嵐山が上位
Reason: 観光地を2日間に分けて効率よく回るスケジュールを組もう。
Act: 旅行プラン作成ツールに観光地リストを入力して最適ルートを作成
Observe: 1日目:清水寺→伏見稲荷大社→祇園、2日目:嵐山→金閣寺
Final Answer: 東京から京都までの週末旅行プランは以下の通りです…
まとめ
AI Agentは「思考+行動のサイクル」により、人間のように計画し、外部ツールを活用しながらゴールを達成します。
通常のLLMを超え、実際に“動けるAI”として今後ますます重要な役割を担っていくでしょう。
Discussion