🌏

DATA + AI SUMMIT 2025 キャッチアップ

に公開

はじめに:今年のキーメッセージ

すべてのユーザーに “Data Intelligence” を

Databricks OneとLakebaseにより、技術部門だけでなくビジネス現場までデータ+AIを民主化。
Databricks Unveils Databricks One: A New Experience to Bring Data and AI to Every Corner of the Business
Databricks Launches Lakebase: a New Class of Operational Database for AI Apps and Agents

エージェント時代を後押し

Mosaic AIスタック(Agent Bricks/MLflow 3.0/Vector Search/Serverless GPU)で開発〜運用・最適化を一気通貫に。
Mosaic AI Announcements at Data + AI Summit 2025
Announcing Storage-Optimized Endpoints for Vector Search

宣言型 & ノーコード化の加速

Lakeflow GA、Lakeflow Designer、Spark Declarative Pipelines OSS 化で やりたいこと だけを書けばパイプラインが組み上がる世界へ。
Databricks Unveils Lakeflow Designer for Data Analysts to Build Reliable Pipelines Without Coding
Databricks Donates Declarative Pipelines to Apache Spark™ Open Source Project

オープンかつガバナンス強化

Unity Catalog vNext(Metrics/Discover/Iceberg Managed)、Clean Rooms GCP GA、Delta Lake 4.x で「どこでも使え、しかも統治できる」レイクハウスを推進。
What’s New with Databricks Clean Rooms
Databricks platform release notes

第1章 AI & エージェントソリューション

機能 概要 技術 / 研究ポイント 参照先
Agent Bricks
[Beta]
タスクを記述するだけで企業内エージェントを自動生成。評価シナリオを自動作成し、品質・コストを継続チューニング。 自社データでの再現実験:評価自動生成ロジックと RL-based 最適化アルゴリズムの追跡。 Mosaic AI Announcements at Data + AI Summit 2025
MLflow 3.0 エージェント監視/プロンプト管理を統合。外部環境で稼働する LLM/Agent も一括モニタリング。 既存 MLOps 基盤との統合、リアルタイム評価メトリクス拡張。 MLflow 3.0: Unified AI Experimentation, Observability, and Governance
AI Functions v2 SQL 関数が 3 倍高速・4 倍低コスト化、画像など多モーダル入力に対応。 ai_parse_document 精度/コスト検証。 Mosaic AI Announcements at Data + AI Summit 2025
Storage-Optimized Vector Search
[Preview]
計算・ストレージ分離で最大 7× 低コスト、20× 高速インデックス。 RAG / セマンティック検索のレイテンシ実測とスケールテスト。 Announcing Storage-Optimized Endpoints for Vector Search
Serverless GPU Compute
[Beta→H100近日]
ノートブック/ジョブを GPU でオンデマンド実行、UC ガバナンス下で管理。 既存 GPU クラスタとの TCO 比較、QoS 設定。 Mosaic AI Announcements at Data + AI Summit 2025

第2章 データエンジニアリング & パイプライン

機能 概要 技術 / 研究ポイント 参照先
Lakeflow GA 取り込み〜変換〜オーケストレーションを単一 UI と宣言型 DSL で実現。 Glue/DLT 既存ジョブの移行試算、パイプライン耐障害性評価。 Databricks Unveils Lakeflow Designer for Data Analysts to Build Reliable Pipelines Without Coding
Lakeflow Designer
[Private Preview]
ノーコードのドラッグ&ドロップ ETL+GenAI アシスタント。 非エンジニア部門でのデータ品質管理プロセス整備。 Databricks Unveils Lakeflow Designer for Data Analysts to Build Reliable Pipelines Without Coding
Spark Declarative Pipelines (OSS) Databricks の DLT コアを Apache Spark に寄贈。SQL/Python でバッチ&ストリーミングを宣言定義。 Databricks 外(EMR など)でのパフォーマンス検証、運用フットプリント。 Databricks Donates Declarative Pipelines to Apache Spark™ Open Source Project

第3章 BI・アプリ体験

機能 概要 技術 / 研究ポイント 参照先
Databricks One
[Private Preview]
ビジネスユーザー向け新ポータル。AI/BI Dashboards、Genie、Apps を統合。 権限設計(UC × RLS/CLS)とカスタム App SDK 拡張。 Databricks Unveils Databricks One: A New Experience to Bring Data and AI to Every Corner of the Business
AI/BI Genie GA 自然言語質問→可視化生成+“Deep Research”で要因分析を自動提示。 多言語モデル精度、CoT 表示の説明可能性。 Databricks Unveils Databricks One: A New Experience to Bring Data and AI to Every Corner of the Business
Lakebase (Postgres)
[Public Preview]
Neon 技術で OLTP+湖上ストレージを分離した HTAP DB。AI エージェント向け行レベル更新を実現。 運用系と分析系のレイテンシ統合、ブランチ機能の CI/CD 活用。 Databricks Launches Lakebase: a New Class of Operational Database for AI Apps and Agents
Databricks Apps UC 管理下でホストできるカスタム Web/App。 エージェント UI や RAG フロントの迅速デプロイ方法。 Databricks Unveils Databricks One: A New Experience to Bring Data and AI to Every Corner of the Business

第4章 ガバナンス & 相互運用性

機能 概要 技術 / 研究ポイント 参照先
Unity Catalog vNext Metrics:ビジネスメトリクスをデータ層で一元定義
Discover:内部マーケットプレイス
Iceberg Managed Tables:UC管理でIcebergを完全サポート
Metrics と Genie/Lakeflow の連携、Iceberg↔Delta 性能比較。 Announcing Lakebase Public Preview
Clean Rooms GCP GA & Multi-party 3クラウド横断のゼロコピー共有+高度なプライバシー承認。 広告・医療データ共有時の準拠性評価。 What’s New with Databricks Clean Rooms
Delta Lake 4.x Liquid Clustering、Predictive Optimization、UniForm で “1 テーブルで全エンジン” を強化。 CLUSTER BY AUTO のクエリ削減効果計測、PO有効性。 Databricks platform release notes
Apache Spark 4.0 GA ANSI SQL デフォルト、VARIANT 型、Streaming 新チェックポイントなど大幅拡張。 UDF 互換性、Streaming スループット計測。 Introducing Apache Spark 4.0

第5章 オープンソース & コミュニティ

機能 概要 技術 / 研究ポイント 参照先
Spark Declarative Pipelines OSS化 DLT 技術を Spark コミュニティへ寄贈。 プラグイン/カタログ連携の OSS コントリビューション機会。 Databricks Donates Declarative Pipelines to Apache Spark™ Open Source Project
Open Lakehouse 路線継続 Delta・Iceberg・Spark への投資と外部エンジン互換(Trino/Flink 等)が前進。 Trino/Flink 連携ベンチマーク計画とユースケース整理。 Access Databricks data using external systems

Discussion