🐕

Google I/O '25の基調講演の要約

に公開

Google I/O '25の基調講演は、AI、特にGeminiモデルがGoogle製品全体にもたらす急速な進歩と変革を中心に展開されています。

Geminiモデルの進化と性能向上

  • Googleは、前回のI/O以降、十数以上のモデルと画期的な研究成果を発表し、20を超える主要なAIプロダクトと機能をリリースしました。
  • Geminiモデルは急速に進歩しており、初代Gemini ProからELOスコアが300ポイント以上向上し、Gemini 2.5 Proは現在、すべてのカテゴリでLMArenaのリーダーボードを席巻しています。
  • コーディングにおいても進歩が見られ、アップデートされた2.5 ProはWebDev Arenaで1位を獲得しました。Geminiは今年最も急成長しているモデルであり、毎分数十万行のコードを生成しています。
  • 数週間前、Geminiはポケモン青をクリアしました。これにより、API(人工ポケモン知能)の実現に近づいたと述べられています。
  • Googleの第7世代TPU Ironwoodは、大規模な思考と推論を強化するように設計されており、前世代に比べて10倍のパフォーマンスとポッドあたり42.5エクサフロップスの演算能力を備えています。これにより、モデル提供の高速化が実現しています。
  • Geminiモデルは、1秒あたりの生成出力トークン数で上位3位を占めており、価格も大幅に下がっています。Googleは、価格と性能のトレードオフの中で最も効果的な価格で最高のモデルを提供していると主張しています。
  • Gemini 2.5 Proは、Google史上最もインテリジェントなモデルであり、世界最高クラスの基盤モデルであるとされています。LearnLMが組み込まれたことで、LMArenaのすべてのリーダーボードでトップに立っています。
  • Gemini Flashは最も効率的な主力モデルであり、スピードとコストの低さで好評です。アップデートされた2.5 Flashは、主要ベンチマークで性能が向上し、Arenaリーダーボードで2.5 Proに次ぐ2位です。新しいFlashは6月上旬に、Proもその後すぐに一般提供開始予定です。
  • Gemini 2.5 Proには、Deep Thinkという強化された推論モードが導入され、モデルのパフォーマンスを限界まで押し上げ、画期的な結果をもたらしています。現在、Trusted Tester向けに提供されています。
  • Googleは、現在のあらゆる大規模言語モデルの基盤であるTransformerアーキテクチャの発明など、AI時代の基盤を築いてきたと述べられています。Geminiは、完全な世界モデル(周囲の状況を理解し、シミュレートし、計画を立てられるモデル)へと進化させるべく取り組んでいます。

AIの採用とプロダクトへの展開

  • AIの採用は世界中で進んでおり、GoogleのプロダクトとAPI全体で処理されるトークン数は、わずか1年で約50倍の月間480兆トークンに増加しました。
  • 700万人を超える開発者がGoogle AI StudioとVertex AIでGemini APIを使って開発しており、これは前回のI/O以降5倍以上の成長です。
  • Googleプロダクト全体でAIの採用が増加しており、Geminiアプリの月間アクティブユーザー数は4億人を超えています。Geminiアプリでの2.5 Proの使用量も45%増加しました。
  • Google検索におけるAIによる概要は、毎月15億人を超えるユーザーが利用しており、これはGoogle検索が世界中のどのプロダクトよりも多くの人々に生成AIを提供していることを意味します。

主要な研究プロジェクトと新機能

基調講演では、長年の研究が現実のプロダクトにどのように変革をもたらしているか、3つの例が紹介されました。

  1. Project Starline → Google Beam & Google Meet翻訳

    • Project Starlineで発表された3D動画技術は、Google BeamというAIファーストの新動画通信プラットフォームに発展しました。6台のカメラとAIを使用して、2D動画ストリームをリアルな3D体験に変換します。HPとの協力で、最初のGoogle Beamデバイスが今年後半に早期顧客向けに提供されます。
    • Starlineの基盤技術はGoogle Meetに導入され、リアルタイム音声翻訳機能が提供されています。現在、英語とスペイン語の翻訳が加入者向けに提供されており、今後対応言語が増える予定です。
  2. Project Astra → Gemini Live機能 & ユニバーサルAIアシスタント

    • Project Astroは、ユーザーの世界を理解できるユニバーサルAIアシスタントの将来的な機能を探る研究プロジェクトです。
    • 本日より、その機能がGoogleプロダクトに導入され始めました。Gemini Liveのカメラと画面共有機能として、ユーザーは見たものについて何でも話すことができます。これはAndroidとiOSの全ユーザーに本日より展開されます。
    • Project Astraの最新プロトタイプは、自転車修理など、日常的なタスクをステップバイステップで支援できる能力を示しました。最終的な目標は、Geminiアプリをパーソナルでプロアクティブ、そしてパワフルなユニバーサルAIアシスタントにすることです。
    • Project Astraの技術は、視覚障がい者のアクセシビリティ向上にも活用されています。
  3. Project Mariner → エージェント機能

    • Project Marinerは、ウェブと対話して作業を実行できるエージェントの研究用プロトタイプです。コンピュータの利用能力(ブラウザなどのソフトウェアとの対話)が重要な能力です。
    • 大きな進歩を遂げ、マルチタスク(最大10個同時)や「Teach and Repeat」機能を導入しました。その能力はGemini APIを通じて提供され、Trusted Testerが開発を進めています。
    • AnthropicのModel Context Protocol (MCP) との互換性も発表されました。
    • これらのエージェントテクノロジーは、Chrome検索とGeminiアプリに本格的に導入され始めています。

Geminiアプリの新機能

  • Geminiアプリには、エージェントモードという新機能が導入されます(登録者向けの試験運用版が近日公開)。例えば、部屋探しにおいて、GeminiアプリがZillowなどのサイトから条件に合う物件を探し、Project Marinerでフィルタを調整し、MCPを使って内覧予約まで代行します。
  • パーソナルコンテキストの実現に向けて取り組んでおり、ユーザーの許可と管理下でGoogleアプリ全体の関連コンテキスト(Gmail、検索履歴、Googleドライブなど)を活用し、Geminiをパーソナライズします。Gmailのスマートリプライがユーザーの口調やスタイルを模倣する例が紹介されました。この機能は、今夏にGmailで登録者向けに利用可能になります。
  • Gemini Liveの新機能(カメラ・画面共有機能)は、本日よりAndroid/iOSアプリで無料提供されます。数週間以内にカレンダー、マップ、Keepなど一部Googleアプリとの連携も可能になります。
  • Deep Research機能では、本日より指針とするファイルをアップロードできるようになり、GoogleドライブとGmailからも情報を引き出せるようになります。
  • CanvasはGeminiの共同制作空間で、Deep Researchで得たレポートなどを、ワンタップでウェブページ、図解、クイズ、ポッドキャストなどさまざまな形式に変換できます。
  • ChromeとGeminiの連携機能により、パソコンでウェブ閲覧中に、閲覧中のページの文脈を理解して質問に答えるサポートが提供されます。これは米国の登録者向けに今週リリースされます。
  • 新しい高性能画像生成モデルImagen 4がGeminiアプリで利用可能になります。Imagen 4は、色彩や細部の表現力、特に文字のデザインが向上しています。超高速版も開発されています。
  • 最先端の動画生成モデルVeo 3も本日リリースされます。映像品質と物理法則の再現度が向上し、さらにネイティブの音声生成機能を搭載しており、効果音や背景音、会話も生成できます。

検索機能の進化

  • AIによる概要に加え、AIモードが検索における次の大きな一歩です。Gemini 2.5を核とし、高度な推論に基づく画期的な検索機能で、複雑な質問に対応できます。本日より米国のユーザーに提供開始されます。
  • AIモードは、**「クエリファンアウト」**という手法を使用し、複雑な質問をサブトピックに分割し、多数のクエリを同時に実行してウェブ全体を検索することで、より深い検索を実現します。リアルタイム情報やナレッジグラフ、ショッピンググラフ、ローカルデータ、コミュニティ分析情報も活用します。
  • AIモードのLabsで利用可能になる新機能には、パーソナルコンテキスト(過去の検索や他のGoogleアプリとの連携によるパーソナライズ)、Deep Research(数百件の検索を実行し、引用文献付きの専門家レベルのレポートを作成)、複雑なデータ分析と可視化(スポーツや財務データなどを見やすい表やグラフで表示)、そしてProject Marinerのエージェント機能(チケット探し、レストラン予約、現地サービス予約などを代行) があります。
  • Project Astraのライブ機能を活用したSearch Liveも導入されます。ユーザーが見たものをカメラで認識し、リアルタイムの対話形式で役立つ情報を提供します。
  • AIモードは、ショッピングにも役立つインテリジェンスを提供します。ユーザーの好みに合わせた商品の視覚的なアイデアを提示し、耐久性などの情報を提供します。
  • 新しいショッピング機能として、バーチャル試着機能がLabsで試すことができます。ユーザー自身の写真をアップロードし、ファッション用に特別にトレーニングされたモデルが、服が自分に似合うか、素材のシワなどを正確に予測して表示します。
  • 価格追跡機能チェックアウトエージェント機能も導入され、希望価格になったら通知を受け取り、エージェントが代わりに購入手続きを進めることができます。これらのショッピング機能は今後数か月以内に展開予定です。

生成メディアと創造性

  • 生成メディアは、クリエイターの創造性の限界を高めています。
  • Music AI Sandboxは、音楽家向けの生成音楽モデルLyriaを活用できるツールです。Lyria 2は高忠実度の音楽とプロ級の音声を生成し、本日より企業やクリエイター向けに利用可能です。
  • Googleは、AI生成メディアの識別に関する研究開発も続けており、見えない透かしを埋め込むSynthIDを開発しました。新しいSynthID検出ツールは、本日早期テスター向けにリリースされます。
  • ダーレン・アロノフスキー監督のスタジオなど、映画業界との連携も進めており、制作者のニーズに合ったVeoの機能開発に役立てています。Veoは、登場人物やシーン、スタイルを指定して筋の通った動画を作成したり、正確なカメラ指示を与えるなど、監督の意図を柔軟に表現できるよう進化しています。
  • Veo、Imagen、Geminiの長所を組み合わせたAI映画制作ツールFlowが本日リリースされます。ユーザーは素材(画像、説明文からの生成)を指定し、プロンプトで指示を出してクリップを作成し、Scene Builderで編集できます。キャラクターやシーンの一貫性を保ちながら、不要部分のカットやクリップの延長も可能です。

Google AIサブスクリプションプラン

  • Google AI ProGoogle AI Ultraという2つのAI定期購入プランが導入されます。
  • Google AI Proは世界中で利用可能予定で、AIプロダクト一式、高い使用量上限、特別機能が含まれます(旧Gemini AdvancedであるGeminiアプリのPro版も含む)。
  • Google AI Ultraは、Googleの最先端AIに最速でアクセスできるパイオニア向けのプランです。最も高い使用量上限を持ち、Google全体の新機能やプロダクトに誰よりも早くアクセスできます。現時点では米国でのみ利用可能ですが、近日中にグローバル展開予定です。Ultraプランには、Veo 3搭載のFlow、いずれGeminiアプリで利用可能になる2.5 Pro Deep Thinkモード、YouTube Premium、大容量ストレージが含まれます。

AndroidとXRへの展開

  • AndroidはAIを体験する最高のプラットフォームであり、多くのGeminiの機能強化がAndroidでリリースされます。Geminiはスマートウォッチ、自動車、テレビにも搭載される予定です。
  • Android XRは、Gemini用に開発された新しいフォームファクタ(ヘッドセットやグラスなど)向けのプラットフォームです。Samsungと共同開発され、Qualcomm Snapdragon向けに最適化されています。
  • ヘッドセット(SamsungのProject Moohan)では、Geminiが広がるアプリ空間やGoogleマップでのテレポート、見たものに関する情報提供などをサポートします。Project Moohanは今年後半に購入可能予定です。
  • Android XRグラスは、軽量で一日中着用できるように設計されており、カメラ、マイク、スピーカー、オプションのレンズ内ディスプレイを備えています。スマートフォンと連携し、ハンズフリーでアプリを利用できます。AIに最適なフォームファクタであり、Geminiの力をどこにいても活用できます。早期デモでは、コーヒーショップの名前を特定したり、カフェまでの経路案内をしたり、ライブ翻訳を行う様子が紹介されました。Gentle MonsterとWarby Parkerが最初のアイウェアパートナーです。開発者向けには、今年後半にグラスの開発を開始できるようになります。

AIの社会への貢献

  • AIは科学的発見を加速させています。AlphaProof(数学)、Co-Scientist(仮説立案)、AlphaEvolve(知識発見)、AMIE(臨床診断)、AlphaFold 3(分子構造予測)、Isomorphic Labs(創薬)などが紹介されました。AlphaFoldは生物学・医学研究の標準ツールとなっています。
  • AIは、安全かつ責任ある方法で進められれば、史上最も有益な技術になる可能性があると信じられています。
  • Astraの技術を使ったプロトタイプにより、Airaとの提携で視覚障がい者の移動支援が進められています。
  • Googleは、AIを活用して社会貢献するプロジェクトも進めています。Viasatは、衛星画像とAIで山火事をほぼリアルタイムで検知することを目指す衛星コンステレーションです。AIを活用したドローン配送は、ハリケーンのような緊急事態での救援活動に役立てられました。
  • AIは、次世代ロボット、病気治療法、量子コンピュータ、完全自律走行車両など、数年内の未来を実現する可能性を秘めています。

最後に、AIカウンタのランキングで、Geminiがスコア95でトップに立ったことが示されました。Googleは、AIが私たちの日常生活を改善し、科学的発見を加速させ、発見と驚きに満ちた新たな黄金時代を切り開くと期待しています。

Discussion