🫠

Data Engineering Summit 2025 参加セッションメモ:AI-Ready基盤の実装ヒント

に公開

Data Engineering Summit 2025 参加セッションメモ:AI-Ready基盤の実装ヒント

Data Engineering Summit 2025で自分が参加した7セッション(Opening Keynote、AI-Ready基盤、次世代データ基盤、RevOps、DeNA AI Workspace、カオナビ投資獲得、メタデータ戦略)を軸に、AI時代のデータ基盤づくりに関する学びを整理した。まずは現地参加で得られた一次情報を共有し、後日あらためて全セッション(未参加枠を含む)の資料を読み込んだ網羅版を公開する予定です。

  • AI-Ready基盤の実装ロードマップと社内浸透の工夫
  • セマンティックレイヤー整備とメタデータ運用のリアル
  • データエンジニアがビジネスに染み出すプロセスと役割変化

参加セッションから見えた潮流

  1. AI-Readyはメタデータ・定義・ガバナンスを揃える仕組みづくり:primeNumberのセッションでは、AI-Readyはツール選定ではなく「データ品質」「定義」「ガバナンス」を整える体制構築だと強調された。
  2. セマンティックレイヤーで共通言語とリネージュを可視化する:テックタッチはdbt docsをセマンティックレイヤーのSSoTとし、カラムレベルリネージュや用語の意味づけをAIと人が共有する仕組みを紹介した。
  3. AIが参照する前提で精度・情報量を高め、分業を再設計する:DeNAは「人ではなくAIが参照するからこそ、従来以上の精度・情報量が必要」と述べ、生成AIを用いた分業設計の重要性を説いた。

セッション別ハイライト

Opening & Keynote – Data Engineering Guide 2025(株式会社風音屋 横山翔氏)

  • AIエージェント導入をデータエンジニアリングの本流として位置付け、データカタログとメタデータ三層構造の重要性を強調。
  • DataDevOpsの観点で生成AIを組み込んだ業務サイクル短縮、バックオフィスまで含めた教育・啓蒙の必要性を提示。
  • 「三年間は動乱期、ベストを求めない」姿勢を提案し、クラウドストレージに元データを保持して後追い修正を可能にする運用を推奨。

なぜAI活用は失敗するのか?PoC止まりを防ぐAI-Readyデータ基盤の作り方(株式会社primeNumber 山本健太氏)

  • AI-Readyな状態を「AIが正しく安全に社内データへアクセスできる仕組み」と定義し、データ品質・ガバナンス・役割定義の三要素を徹底。
  • 小さく始めてQuick Winを出すと同時に、ビジネス部門への定期的なデモやモック提供で活用イメージを浸透させる実践例を共有。
  • フェーズ評価と到達条件を明文化し、社内生成AI活用事例の発掘と啓蒙を初動タスクとして挙げた。

AI推論で再構築する次世代データ基盤(千株式会社 竹澤有貴氏)

  • 「変わるのは状態、残るのは事実」という前提で、Append-Onlyなイベントデータとセマンティックモデルを統合するアーキテクチャを解説。
  • GraphRAGとRAGの組み合わせで推論の文脈一貫性を高めるアプローチや、イベントソーシング的なデータ保持の利点を提示。
  • データエンジニアの役割が「コンテキストエンジニアリング」へシフトし、ユビキタス言語管理やコンテキスト設計の重要性が増すとした。

サイロ化解消のその先へ。ビジネス/データそれぞれの視点で語る RevOps(エンハンプ株式会社 川上エリカ氏ほか)

  • RevOpsではデータ基盤が共通認識を提供する装置であり、売上・利益を中心とした議論を可能にする存在だと整理。
  • 指標の分断(リード・アカウント・商談ベース)を解消するため、抽象概念を言語化してデータ化する仕組み作りの重要性を強調。
  • 「足で稼ぐ」営業的な現場ヒアリングと、Slack等の表層コミュニケーションに流されない本質的な共通ゴール設定が鍵とされた。

生成AI時代の業務改革:DeNAのAI Workspaceと実践的データ基盤(株式会社ディー・エヌ・エー 深瀬充範氏)

  • 社内AI Workspaceを段階的に立ち上げ、Lookerと内製分析システムを役割分担させながらセマンティックレイヤーを拡張。
  • MCPを経由したデータアクセスを早期に実装し、利用者からのフィードバックを素早く得る「まずは動かす」方針を採用。
  • LookMLからSQLを排除し、dbtへの集約とKPI要件整理を並走させたことで生成AI連携の基盤を整えたと述べた。

AIの前にやるべきこと。データ組織ゼロから投資を得るまでの軌跡と未来図(株式会社カオナビ 本江雄人氏)

  • データ基盤の利用量を増やして投資を獲得するため、「必要な人が必要なデータにアクセスできる状態」を第一歩として整備。
  • 暗中模索の中でダッシュボード提案を繰り返し、刺さらない事例から学習しながらレポート駆動型分析で成果を積み上げた。
  • 投資獲得フェーズでは属人化を解消し、イニシャルとランニングコストを試算して合意形成を行ったプロセスを紹介。

AIを最大限活用するためのメタデータ戦略(テックタッチ株式会社 前原武氏)

  • dagster、Snowflake、dbtなどで構成されたパイプラインの肥大化に対し、dbt docsをメタデータのSSoTとして運用する原則を提示。
  • カラムリネージュ・リレーションシップ・セマンティックの三種類のメタデータを整備し、二重管理を避ける仕組みを構築。
  • AIエージェントの実運用では、ユーザーのスキルに応じた対話設計と品質担保が依然として課題であり、正しいデータ利用を誘導する工夫が必要とした。

横断的な示唆

  • 共通言語づくりがAI-Readyの第一歩:primeNumberの事例が示す通り、AIに理解させるためにはデータ定義や責任範囲を明文化し、ビジネスと共有できる言葉を揃えることが出発点。
  • セマンティックレイヤー運用で精度と情報量を底上げ:テックタッチはdbt docsを使ったカラムリネージュと定義整備で「AIと人間が同じ説明を参照できる」状態を作り、品質を引き上げている。
  • データエンジニアはAIと共に分業する未来へ:DeNAが語ったように、AIが参照する前提に立つと、従来以上の精度・情報量と分業設計が不可欠。データエンジニアはAI活用を前提としたコンテキスト設計者として動く必要がある。

次のアクションアイテム(自社視点)

  1. データ量と利用量の底上げ:需要が高いドメインを特定し、イベントデータや利用ログの網羅性を強化する。
  2. メタデータSSoTの整備・運用強化:dbt docsまたは既存基盤をSSoTとして定義し、カラムリネージュと定義更新フローを定着させる。
  3. RevOps視点の社内マーケティング強化:Quick Winのデモや定期報告を通じてデータ活用の価値を可視化し、事業部の利用量を拡大する。

まとめ

Data Engineering Summit 2025 では、AI活用を本格化させる組織にとってメタデータ整備とセマンティックレイヤー運用が不可欠であるという共通認識が明確になった。イベントドリブンなデータ保持、GraphRAGによる推論強化、RevOpsに代表されるビジネス連携など、技術と運用の両面での投資が求められる。まずはQuick Winを示しながら基盤の信頼性と表現力を高め、AIエージェントが活用できる文脈を整えることが次の一歩となる。なお、本稿は参加セッションの速報的な整理であり、後日発表資料を精読した網羅版を改めて公開する。

セッション一覧

Discussion