Tokyo dbt Meetup #14 に参加してきた #dbt_tokyo
日本時間2025年06月17日(火)、dbtのコミュニティイベント「Tokyo dbt Meetup #14」が開催されました。
数多くのユーザーが参加し非常に内容盛り沢山となったこのイベント、当日はオフライン開催会場に現地参戦していましたので、その内容をレポートしたいと思います。
なお、当日のつぶやきを以下Posfieでまとめています。合わせてお読み頂くことで当日の雰囲気をより感じて頂けるかと思いますので宜しければどうぞ。
概要情報
イベントページは以下です。
開催会場はクラスメソッド株式会社 日比谷オフィス。
オフィスからは東京タワーも見えます。
当日はご覧のように数多くのdbtユーザーが集まる形となりました。
セッション:dbtの最新アップデート
- 登壇者:伊藤 俊廷氏(dbt Labs, Inc.)
1人目の発表はdbt Labs, Inc.から伊藤氏。当日は機能紹介することになったdbt Fusion Engineのシャツを着込んでの発表となっていました。
dbt Launch Showcase 2025のまとめ
2025年05月28日(水)、『dbt Launch Showcase 2025』というイベントが開催されていました。直近のdbtの最新機能やトピックをお披露目するイベントです。
Analytics(分析)、Organizations(組織)、Developers(開発者)の分野でそれぞれ以下のような様々な機能が紹介されていました。開発・エンジニアのみならず、dbtやデータ分析に関わる多方面のユーザーに刺さるメッセージを発信する形となっています。
-
デベロッパー向け:開発者体験の向上
- 開発者がより快適かつ効率的にdbtを使える体験を提供し、モダンなデータ開発環境を構築出来る
-
アナリスト向け:非エンジニアによるデータ活用と関与
- 技術的な知識がないアナリストやビジネスユーザーが自律的にデータモデルを探索、活用できる
-
管理者向け:組織レベルの管理・統制機能
- スケーラブルなガバナンスとコスト管理を通じて、企業全体で容易にdbt Cloudを利用できる
概要レベルの情報を踏まえたアナウンス機能の一覧がこちら。以降、各機能をデモを交えたりしながら説明する形でセッションが進行していました。
機能紹介:Fusion Engine
dbtを支える新しい次世代エンジンとして紹介。dbtプラットフォームにおける今後のイノベーションの基盤として非常に注目度の高い機能となっています。
- SQLの理解:最高レベルの理解性能を備え、リアルタイムでエラーを検出可能に
- 各種連携:新しいVS Code機能拡張、既存のプロジェクトとの互換性も(未対応機能は鋭意開発中)
- 高速:Rustによる完全な再構築、パース処理が従来比で30倍高速化、コンパイルが(現時点で)従来の2倍速に
dbtを使った従来のワークフローでは、エラー検出やコードの検証にDWHのコンピューティングコストが必要だったが、dbt Fusion EngineではSQLのコンパイルによりコードを書きながらその場で検証ができるように。
新しいdbt Fusion Engineを活用することで桁違いに高速な開発体験を実現することができるようになります。このあたりは後述の他セッションでも言及される形となっていましたが、これはもう『活用しない手はない』といった内容ですね。
従来は色々試行錯誤しないと辿り着けなかった情報やエラーなども、dbt Fusion Engineを活用することで以下のようにそのものズバリなエラーメッセージを出してくれるようになります。
後述するdbt VS Code Extensionやその他の機能においてもdbt Fusion Engineは機能の中核を担うとても重要な機能となっていく予定です。
その他dbt Fusion Engineに関する参考情報は以下の通り。
- Accelerate data workflows with the dbt Fusion engine | dbt Labs 公式機能概要
- dbt Fusion engine - YouTube 公式機能概要(サマリ動画)
- About the dbt Fusion engine | dbt Developer Hub 公式機能説明(ドキュメント)
- GitHub - dbt-labs/dbt-fusion: The next-generation engine for dbt 機能説明(GitHubリポジトリ)
- Meet the dbt Fusion Engine: the new Rust-based, industrial-grade engine for dbt | dbt Developer Blog 公式機能紹介(ブログ)
- New code, new license: Understanding the new license for the dbt Fusion Engine | dbt Labs 公式機能紹介(ブログ)
- New code, new license: Understanding the new license for the dbt Fusion Engine | dbt Labs 公式機能説明(ブログ):主にライセンス面に焦点を当てた記事。
- Quickstart for the dbt Fusion engine | dbt Developer Hub dbtのQuickStart記事
- その他各種解説・検証・考察的情報
機能紹介:dbt VS Code Extension
Microsoft社が提供する無償のコードエディタ『Visual Studio Code』(一般的にはVS Code等と略して呼ばれることが多い)の拡張機能として提供される、dbt Fusion Engineベースの機能。ほぼ瞬時の解析、ライブエラー検出、強力な IntelliSense 機能などにより時間とリソースを節約できるようになります。(2025年06月時点ではパブリックベータ版)
dbt VS Code Extensionは以下説明のようにVS CodeのみならずCursorやdbt Studio(dbt Cloud = SaaS)でも利用可能となっていく予定です。また有料プランにおいては「各会社で15名」というソフトリミット(緩い制限)が敷かれていくことになるようです。
dbt Fusion Engineはdbt Coreよりもパフォーマンスの面で相当な改善が期待できそうです。
内部構造レベルでFusion Engineがどのように作用しているのか、という解説記事も公開されています。
- The Three Levels of SQL Comprehension: What they are and why you need to know about them | dbt Developer Blog
- The key technologies behind SQL Comprehension | dbt Developer Blog
その他dbt Fusion Engineに関する参考情報:
- About the dbt VS Code extension | dbt Developer Hub 機能概要紹介(ドキュメント)
- Install the dbt VS Code extension | dbt Developer Hub 機能概要紹介(インストール・セットアップ手順)
機能紹介:State-aware orchestration(状態認識オーケストレーション)
"dbtにおけるジョブオーケストレーション(複数のタスクを1つの完全なエンドツーエンドのプロセスまたはジョブに設定すること)の新しいパラダイム"として紹介。このState-aware orchestration(状態認識オーケストレーション)機能とは、ジョブが実行されるたびにコードまたはデータの変更を検出し、どのモデルを再度構築(ビルド)していくかを自動的に決定・判断していくというものになっています。従来であれば配下(下流)のモデルをすべて実行しなければならなかった状況がこの機能によって「変更されるモデルのみが対象」となるため、コンピューティング コストが節約され、実行時間が短縮されることが期待できます。(2025年06月時点ではパブリックベータ版)
その他dbt State-aware orchestrationに関する参考情報:
- About state-aware orchestration | dbt Developer Hub
- Setting up state-aware orchestration | dbt Developer Hub
機能紹介:dbt Canvas
これまでは「dbt Visual Editor」と呼ばれていた機能。正式リリースを以て「dbt Canvas」という名称に変更となりました。モデルの構築や編集をGUIのドラッグ&ドロップとdbt Colilot(dbtエクスペリエンスに完全に統合された強力なAI搭載アシスタント機能)を組み合わせることでdbtやSQLに詳しくない人でも作業を実践できるようになります。(dbt Cloud/Enterprise版でのみ利用可能)
YouTube動画による実践イメージ:
その他dbt Canvasに関する参考情報:
-
About dbt Canvas | dbt Developer Hub 公式機能紹介(ドキュメント)
- Navigate the interface | dbt Developer Hub メニュー構成や外観(インタフェース)に関する説明
- Edit and create dbt models | dbt Developer Hub 画面操作レベルでのCanvas操作解説
- Build with dbt Copilot | dbt Developer Hub dbt Copilot連携解説
- Quickstart for dbt Canvas | dbt Developer Hub dbtのQuickStart記事
機能紹介:dbt Insights
生成AI搭載のクエリインタフェース。SQLや自然言語で質問を投げ掛けることでアドホックな分析を行えるようになり、エンジニアチームを持たずに、信頼できるデータで突発的な質問に自己完結できる環境を手にいれることができます。(2025年06月時点ではプレビュー版として展開、今後はdbt Cloud/Enterprise版でのみ利用可能)
その他dbt Insightsに関する参考情報:
- About dbt Insights | dbt Developer Hub 公式機能紹介(ドキュメント)
- Access the dbt Insights interface | dbt Developer Hub 画面操作レベルでの操作解説
- Navigate the dbt Insights interface | dbt Developer Hub 画面操作レベルでの操作解説
機能紹介:dbt MCP Server
アプリケーションがLLM(Large Language Model=大規模言語モデル)にコンテキストを提供する方法を標準化するオープンプロトコルとして近年非常に注目度が高まっているMCP(Model Context Protocol=モデルコンテキストプロトコル)について、dbtも対応が進んでいます。それがこの「dbt MCP Server」です。
MCPそのものに関する概要・解説については下記ドキュメントなどをご参考に。
- モデルコンテキストプロトコル(MCP) - Anthropic
- Introduction - Model Context Protocol
- MCP入門
- やさしいMCP入門 - Speaker Deck
- MCPに入門する/ Introduction to MCP - Speaker Deck
dbt MCP Serverを活用することで、SQLやdbtの各種コマンド、APIなどを意識せずに使えるようになり、データ活用のハードルを下げ開発を効率化できるようになります。
dbt MCP serverに関するデモ動画:
(※伊藤氏による日本語のデモ動画はLinkedInの記事から参照可能です)
2025年06月01日時点において、dbt MCP Server経由で利用できるコマンドの一覧は以下の通り。
その他dbt MCP Serverに関する参考情報:
- Introducing the dbt MCP Server – Bringing Structured Data to AI Workflows and Agents | dbt Developer Blog 公式解説(ブログ)
- Model Context Protocol | dbt Developer Hub 公式解説(MCP/ドキュメント)
- GitHub - dbt-labs/dbt-mcp: A MCP (Model Context Protocol) server for interacting with dbt. 公式解説(GitHubリポジトリ)
- dbt MCP Server解説 ― AI × 構造化データの未来を拓く 実践・考察
- 今すぐ始めるdbt-mcpサーバ:初心者向け導入と活用方法 | Hakky Handbook 実践・考察
機能紹介:Cost management dashboard(コスト管理ダッシュボード)
dbtプロジェクトがデータウェアハウスのコストにどのような影響を与えているかについて、貴重な洞察を提供する機能。モデル、テスト、スナップショット、その他のリソースなどの機能が時間の経過とともにコストにどのような影響を与えるかを視覚化することで、ウェアハウスの支出を最適化するのに役立ちます。適切な対応、関係者への報告、開発ワークフローの最適化が可能となります。(2025年06月時点ではプレビュー版として展開&Snowflakeのみ対応、今後はdbt Cloud/Enterprise版でのみ利用可能)
その他dbt Cost management dashboardに関する参考情報:
まとめ
以上の内容について、英語版ではありますが既に公開されたイベントの内容を動画で閲覧することが可能となっています。(要ユーザー登録)
ブログベースで上記当日の配信内容を解説した記事も公開されています。
ちなみに日本語でのフォローアップ解説ウェビナーも2025年06月26日(木)のお昼に開催予定です。こちらも要チェックですね!
セッション:これからのSQL開発 — dbt Fusion engineの本質とその先の世界
- 登壇者:三角 勇貴氏(stable株式会社)
2人目の発表はstable株式会社より三角氏。前述伊藤氏の内容を保管増強・深堀りする形でdbt Fusion Engineの良さを解説するセッションとなっていました。
登壇資料はこちら。既に資料が公開されていますので詳細な言及などは割愛します。
三角氏の登壇資料についてはとても分りやすく参加者一同絶賛おすすめしていました。合わせて登壇のタイミングで投稿されていた印象的なX投稿(登壇者本人のものを含む)を幾つかピックアップ。
https://x.com/Y4M4MOTO/status/1934915268012339271
https://x.com/Y4M4MOTO/status/1934916845259378896
セッション:「意志ある羅針盤たれ」<データサイド> 〜SSoTの実現で、組織のベクトルを揃え、事業の前進を加速させる〜
- 登壇者:山口 貴矢氏(株式会社GA technologies)
3人目の発表はGA technologiesより山口氏。入社7年目、データ職としての経験は1.25年目という経歴から「参加者(多くのデータ専門家)に新たな知見を提供することよりも、皆が既に持っている情報や知識を「整理」し、日々の業務で使いやすく、議論しやすくすること」を意識した登壇内容となっていることを前置きし、GA technologies社の取り組みにおいてSSOT(Single Source of Truth:唯一の信頼できる情報源)を実現し、事業全体を推進する ためにどういったことを考え、実践してきたかについて発表しました。
(2025/06/19追記)登壇資料はこちら。
GA technologiesのSSoTへの道のり
以下2つの"技術"がポイント。
- SSoTを実現する技術:あるKPIを2つ以上の方法で実現しない状態
- SSoTを組織に定着させる技術:各事業部で"野良のダッシュボードがない"状態
ちなみに山口氏曰く、後者の技術に関しては同日開催された下記イベントでも発表・解説があったとのこと。合わせて参照確認しておきたいコンテンツですね。
- SSoTへの道のり
- 社内システムのデータを紐解き、dbtxSnowflakeで達成。
- OBT(One Big Table)の概念を採用し、技術的SSoTを局所的に達成したがまだ道半ばな状態
- 参考:OBT(One Big Table)とは
SSoT構築におけるRENOSY事業での課題
- そもそも"SSoT"とは何?
- "Single Source of Truth"の略称
- 組織内でデータの唯一の正しい情報源を定め、すべての関係者が同じデータを元に意思決定できるようにする考え方。
- "SSoTでない状態"が引き起こすこと
- 意思決定の質が低下する
- 意思決定が遅くなる
どのようにSSoTを実現したか
以上の状況を踏まえ、GA technologies社ではどのようにSSoTを実現してきたかについてステップごとに解説を交えた形で紹介。それぞれのステップがとても分りやすく紹介されていたのでスライド資料(の写真)を交えて紹介します。
1.重要指標のデータマッピング
- 膨大なデータの中から事業運営に不可欠な指標(KPI)を明確にすることが非常に重要。
- 事業にとって不要なデータを作成することによる工数(時間と労力)の無駄を最小限に抑えることを目的とし、既存のユースケースを詳細に洗い出し、それらのユースケースで必要となる具体的なカラム(データ項目)を特定。
2.RAW層データリネージ整理
- 多くの企業(特に社歴の若い企業)に見られるように、エンジニア組織がドキュメント文化を成熟させる前に勢いで開発されたプロダクトが多く存在し、結果文書化されていないテーブルが多数生まれてしまっていた
- データアナリストが主導し、GitHub上でのエンジニアとの直接コミュニケーションを通じて、データリネージを整理。社内に存在しなかったテーブルリネージを新たに作成した点は大きい。また、RAW層のテーブルの中から事業運営上重要なものを特定し、整理するということも行った
- データアナリストとしての最終目標がSSoTな状態でデータを提供し、分析価値を創出することであったため、その達成に必要な要素があれば、それが通常の役割範囲を超えていても積極的に取り組んだ
3.既存Data Warehouse構成の見直し
- 「なんとなく作られた共通部分」のデータウェアハウスが存在したがそのロジックは非常に複雑に絡み合っており、dbt Cloudのリネージ機能を使っても「地図のないスパゲッティ」を解きほぐすような状態で、再利用が困難であると判断。「1から作り直す」という意思決定を行った。
4.データレイヤー設計
- dbtのベストプラクティスやKimballのディメンショナルモデリングの考え方を参考にデータの整流化とモデリングを両立する構成を見直した。
- 図中のFunnel/Aggregation/Exposure層はオリジナル構成。
- 将来的にはここにセマンティックレイヤー層導入の追加を検討している。現状レイヤーの競合が起きる可能性があり、導入を見送っているが「現時点では作らない」と決めたことで負債が蓄積されても来ている。
5.Semantic LayerとMetrics導入の試行と現実
- 前述のように現状導入を保留している状態。
- セマンティックレイヤーについては期待値も高く導入を強く希望しながら検討を進めていたが、「データ読み込みに非常に時間がかかる」や「挙動が不安定」等の事象に直面し、現時点では実用レベルに耐えないと判断。事業を支えることを最優先とし、セマンティックレイヤーの導入を一旦スキップすることにした。
- この課題に対してはOBT(One Big Table)**と呼ばれる設計を導入することで対処している。
6.OBT(One Big Table)設計とSSoTの現実解
- 現状の現実的なSSoTの解決策としてOBT(One Big Table)を採用。以下のようなメリットがあった。
- SQLの簡易化
- 迅速なデータ提供と応答性
- 明確なデータ構造と再利用性
- SSoTの維持(新たなユースケースでデータが必要になった際、安易に新しいデータマートを作成するのではなく、必ず既存のOBT内にカラムを追加・利用することを徹底し、SSOTの状態を徹底させた)
- OBTはあくまでも中間的な解決策。将来的にはセマンティックレイヤーの導入を最終的な課題として検討している。
7.テーブル設計方針と実装アプローチ
- 約4ヶ月間をかけて、必要なテーブルとカラムのリストアップと設計を本格的に対応。
- このプロセスで重要視したアプローチは主に以下の通り。
- 命名規則の徹底
- dbtプロジェクトのディレクトリ構成ルールの策定
- 設計と実装の同期
8.導入効果の測定
- OBT(One Big Table)導入から2〜3ヶ月経過時点での効果測定を実施。以下に挙げたようなポジティブな影響を確認。
- SQLの簡易化
- 現場ニーズへの解答力の高さ
- OBT間でのリネージの明確化
- SSoTを維持可能な運用
今後の課題
現状OBTで課題をクリアできているが長期的に維持できるものではないとも考えている。セマンティックレイヤーの導入が最重要課題。
Tableau Semantic LayerやSnowflake semantic viewsなどを注視しつつ、将来的にはSSOTの最終形としてセマンティックレイヤーへの移行を目指していきたい。
懇親会
3つのセッション発表を終えた流れでイベントはそのまま懇親会へと突入。軽食や飲み物類が振る舞われる形で賑やかに行われました。各所で今回紹介された機能やデータモデリングの話題でディスカッションが展開されており大いに盛り上がった懇親会になっていました。Xの投稿を見ると二次会なども展開されていたようで、参加した方々のdbt(及びdbtの周辺トピック)への熱量の高さも伺える形となっていたと思います。私個人としても様々なトピックで会話することが出来てとても満足度が高いイベントとなりました。
まとめ
という訳で、dbtのコミュニティイベント『Tokyo dbt Meetup #14』の参加レポートでした。
次回開催(#15)は既にイベントページが公開されています。2025年07月03日(木) 株式会社CARTA HOLDINGS様でのオフライン開催+オンライン開催のハイブリッド形式となっています。 「dbt × LLM」 がテーマとなっている次回開催、現時点で既に(オフラインオンラインを合わせて)140名を超える人気・盛況振りとなっています。私も勿論参加申込済みです。今から開催が待ち遠しいですね。
当日登壇頂いた皆様、ありがとうございました!
Discussion