🤖

AI Agent Summit 2025 Fall - Googleの方々によるセッション深掘りまとめ

に公開

AI Agent Summit 2025 Fall - Google の方々によるセッション深掘りまとめ

はじめに

はじめまして、クラウドエースの岸本です。

2025 年秋に開催された AI Agent Summit 2025 Fall では、AI Agent に関する様々な発表が行われました。
本記事では、Google の方々によるセッションの中から、特に印象に残ったものを 3 つ紹介します。

Google の方々によるセッション一覧

以下が AI Agent Summit 2025 Fall で発表された Google の方々によるセッション一覧です。
ピックアップするセッションは太字で表記しています。

Day 発表者(敬称略) タイトル 動画
Day1 岡本 充洋 Gemini Enterprise 最新情報 - AI エージェント成功の鍵は "利用者による開発"? 動画リンク
Day1 段野 祐一郎 Veo 3 プロンプト ガイド:あなたのアイデアをハリウッド級の映像に変える方法 動画リンク
Day1 山田 雄 「BigQuery, 分析しといて」が実現する世界へ 〜データ活用を革新する Data Agent〜 動画リンク
Day1 諏訪 悠紀 Vertex AI Search for Commerce の新機能「Conversational Commerce agent」で実現する Agentic Commerce 動画リンク
Day1 小野 友也 Google Cloud における Agent エコシステムの探求 動画リンク
Day1 中井 悦司, 高村 哲貴 AI エージェントは音声対話が熱い!Live API と STT/TTS に刮目! 動画リンク
Day2 Ran Li, Huang Xia Agent Engine Deep Dive 動画リンク
Day2 Haren Bhandari 実践 ADK, A2A, MCP で始める、エージェント開発 動画リンク
Day2 関本 信太郎 コーディングだけじゃない、Gemini CLI 活用術 動画リンク

Veo 3 プロンプト ガイド:あなたのアイデアをハリウッド級の映像に変える方法

概要

Google Cloud のメディア生成ソリューションである Generative Media on Vertex AI と、それらを用いてプロレベルに動画を生成する方法について紹介されました。
主に以下の点が印象に残りました。

  • エンタープライズ企業向け機能
    • 暴力的なコンテンツを自動的に検出・除外する安全性フィルターや、著作権侵害に関する金銭的補償など、Google Cloud によるサポートを提供。
  • Veo 3.1 の機能
    • 最大 3 つの参照画像を用いることができるようになり、キャラクター、風景の一貫性がより向上した。
    • 最初と最後の画像をフレームとして与えることで、シームレスに動画として繋ぐインターポレーションが可能となった。
  • Veo 2 Preview の機能
    • オブジェクトの追加と削除が可能となった。

ポイント:Veo プロンプトエンジニアリング

Veo で高品質な動画を生成するには、使用するフォーマット(JSON、YAML、XML など)よりも、一貫性のある構造とコンテンツをプロンプトに含めることが重要です。
以下は、セッションで紹介されたプロンプトに含めるべき 9 つの要素です。
※具体的なプロンプトの例は、セッション動画をご参照ください。

# 要素 説明
01 被写体(Subject) 「誰が」「何を」。ありきたりなアウトプットを避けるためには、具体性が鍵となります。
02 アクション(Action) 「動詞」。被写体に命を吹き込み、動き、相互作用、そして微細な表情さえも描写します。
03 シーン/コンテクスト(Scene / Context) 「どこで」「いつ」。被写体を地に足のついたものにし、物語のムードや雰囲気を確立します。
04 カメラアングル(Camera angles) ショットの視点を定義し、観客が被写体をどのように認識するかに直接影響を与えます。
05 カメラワーク(Camera movements) ショットにダイナミズムをもたらし、映画のような体験を創り出します。
06 レンズ&光学効果(Lens & optical effects) カメラが世界をどのように「見る」かを制御し、プロフェッショナルな洗練さとスタイリッシュなセンスを加えます。
07 ビジュアルスタイル&美学(Visual style & aesthetics) ビデオ全体の芸術的なフィルター。ユニークなルックを作り出す上で最も影響力のある要素の一つ。
08 時間的要素(Temporal elements) 短いクリップであっても、時間の流れの変化を暗示することができます。
09 オーディオ(Audio) 音を通してビジュアルを導きます。オーディオ ディレクションは、ビデオのアクション、ペース、ムードを強力に形作ることができます。

実際のデモでは、上記内容を含める場合と含めない場合の動画が比較されていました。
今後 Veo で映像を作成する際は、プロンプトの「言葉の解像度を上げるエージェント」、9つの要素をプロンプトに含める「プロンプト生成エージェント」、そして「生成結果検証エージェント」を作成してみたいと思います。

Vertex AI Search for Commerce の新機能「Conversational Commerce agent」で実現する Agentic Commerce

概要

Vertex AI Search for Commerce の新機能と未来のデジタルコマースの購買体験がどのように変化するかについて紹介されました。
主に以下の点が印象に残りました。

  • デジタルコマースにおける AI の歴史:
    • Predictive AI:過去のデータから売上や販売数を予測。
    • Generative AI:商品画像、動画、商品詳細ページなどのコンテンツを生成。
    • Agentic AI:マルチモーダル推論、ユーザーの管理下での代理購入。
  • Agentic Commerce:Agentic AI による新しい購買体験を実現するための新機能
    • 新しい購買体験:
        1. エージェントが代理購入など顧客の目的をサポート。
        1. Gemini や Google Shopping からエージェントが自社運営サイトの商品を購入するなど、他のエージェントの購入窓口となる。
    • 具体例として以下が挙げられていました。
      • ユーザーが「この青いドレスが 5000 円以下になったら購入してくれ」と言った場合に、エージェントは 5000 円以下になったら購入を行う。
      • ユーザーが「毎週月曜に予算 1 万円でリストの食料品をポイントで購入してくれ」と言った場合に、エージェントは予算通りにポイントで購入を行う。
  • Agent Payment Protocol:今年の 9 月に発表されたエージェントが支払いを行うためのプロトコル。

ポイント:Vertex AI Search for Commerce のロードマップ

Vertex AI Search for Commerce は、Google Shopping の検索機能やレコメンデーション機能を自社サイトに組み込むことができるサービスです。
主に以下の 4 つの機能とそのロードマップが紹介されていました。
※以下の表は、セッション動画から抜粋した表です。

機能名 説明 ユースケース
Vertex AI Search for Commerce コア機能 従来の全文検索型からパーソナライズされたセマンティック検索に刷新し、「ゼロ件ヒット」を減らす 特定の商品を購入したい場合
Conversational Commerce agent(GA) マルチモーダルな会話による絞り込みやガイドで顧客の課題を解決し、コンバージョンに繋げる 明確な商品が決まっていない場合
Conversational Commerce agent Upgrades(Roadmap) より複雑な質問に対応するための機能 ノートパソコンを比較して購入したい場合など
Agentic Commerce(Roadmap) 自律的な Agent による信頼できる「代理購入」で革新的な購買体験を提供する 社内外のツールやエージェントとの連携が必要な場合

特に Conversational Commerce agent と Agentic Commerce は、以下の点がポイントです。

Conversational Commerce agent のポイント

主に以下の 2 つがポイントでした。

  • 「売上向上」や「コンバージョンを意識した会話」が可能になった。
  • インテント(ユーザーの目的)検出機能により、ユーザーの目的に合わせた振る舞いを最適化できる。

Agentic Commerce のポイント

主に以下の 3 つがポイントでした。

  1. Multi-Agent Orchestration(マルチエージェントオーケストレーション)

    • Vertex AI Search for Commerce 導入済みショッピングサイトの Root Agent が他の Agent を呼び出し、Agent-to-Agent (A2A) で協調動作し、自律的な購買など複雑なタスクを実行する。
  2. Customer LLMs / Customer Agent to Merchant Agents (C2M: Customer-to-Merchant)

    • 顧客のパーソナルエージェントと、Merchant Agent(サブエージェント)が対話し、商品を紹介・販売する。
  3. Merchant-to-Merchant Agentic Shopping (M2M: Merchant-to-Merchant)

    • ユーザーが Gemini などの外部のエージェントに対して、「このブランドのおすすめのトップスを購入して」と依頼を出すと、A2A/AP2(Agent Payment Protocol) を使用して Vertex AI Search for Commerce 導入済みショッピングサイトの商品を購入する。

Vertex AI Search for Commerce を導入することで、ユーザー体験が飛躍的に向上するのではないかと思います。
EC サイトを運営しているアパレル企業などは、これまでリーチできなかったユーザーに商品を紹介することができるようになると思います。
例えば、Google Shopping で検索したユーザーに対して、アパレル企業は商品を紹介することができるようになります。
ユーザーも選択肢が増えるだけでなく、企業側もターゲット層を広げることができ売上が伸びる可能性があります。


実践 ADK, A2A, MCP で始める、エージェント開発

概要

Agent Development Kit (ADK)の概要だけでなく、本番環境で使用できるエージェントの構成について紹介されました。
主に以下の点が印象に残りました。

  • Gemini CLI:オープンソースの汎用的な AI Agent で、Google 検索が組み込まれており、MCP との連携、Extensions を利用することで 100 以上のツールを利用できる。
  • AI エージェント構築における 4 つのキーコンポーネント:
    • モデル:与えられた目的・指示に応じた推論、計画の立案及びレスポンスの生成に用いる。例として、Gemini が挙げられる。
    • ツール:他の API やサービスを呼び出し、データの取得、アクション、トランザクションを実行する。例として、API や MCP(Model Context Protocol) 等が挙げられる。
    • オーケストレーション:エージェントのプロファイルを保持、メモリやセッション、ツールデータの保持機能を持つ。例として、ADK が挙げられる。
    • ランタイム:ユーザーから呼び出された時にエージェントを実行する環境。例として、Cloud Run や Agent Engine が挙げられる。
  • ADK で作成したエージェントを Gemini Enterprise へ登録できる。

ポイント:ADK を使用した AI Agent デザインパターン

エージェント構成のパターンとして以下が紹介されていました。
それぞれ、ADK の公式ドキュメントに詳細な説明があるので、そちらをご参照ください。

基本パターン

  • Sequential pattern:複数のエージェントを順次実行するパターン。
    Sequential pattern
  • Parallel pattern:複数のエージェントを並行実行するパターン。
    Parallel pattern
  • Loop pattern:エージェントを特定条件で繰り返し実行するパターン。
    Loop pattern

組み合わせパターン

  • Review Critique Pattern:Loop エージェントの出力を評価するサブエージェントを配置し、チェックした結果をメインエージェントにフィードバックするパターン。
  • Iterative refinement pattern:Review Critique Pattern と基本的な考え方は同じですが、追加でプロンプト修正エージェントを配置し、チェックした結果が良くない場合にプロンプトを修正するパターン。
  • Hierarchical task decomposition pattern:複雑なタスクをサブタスクに分解し、サブタスクを順次実行するパターン。
  • Human-in-the-loop pattern:エージェントの出力を人間がチェックし、承認するステップを追加するパターン。

実際に ADK を使用してエージェントを作成しましたが、簡単にエージェントを作成できました。
一方、本番環境で使用する際は、エージェントの構成やツールの選定、オーケストレーションの設計などを考える必要があります。
今回のセッションで紹介されたエージェント構成が参考になるため、今後はそれらを参考にしながらエージェントを作成していきたいと思います。


まとめ

AI Agent Summit 2025 Fall で発表された Google の方々によるセッションを紹介しました。
各セッションで紹介された技術やアプローチは、今後のエージェント開発において重要な示唆を与えてくれるものばかりです。
今後試行錯誤を繰り返しながら、より良いエージェントを作りたいと思います。

Discussion