🌴

Tableau Conference 2024で発表されたデータソース回りの進化3選

2024/05/07に公開

この記事は何

2024年4月29日から5月1日、アメリカのサンディエゴにてTableau Conference 2024が開催され、今年も多くの機能が発表されました。

Einstein Copilotや、Tableau Publicのローカル保存機能などの多くの新機能が話題になりましたが、個人的には「データソース周りの進化」も見過ごせなかった印象です。

そこで、この記事では、データソース周りの可能性を大きく広げる以下の3機能を紹介します。

1. Shared Dimension

最初は、Tableau 2024.2よりサポート予定の「Shared Dimension」です。

画像引用元: https://www.tableau.com/products/coming-soon#item-102480

こちらは 「ディメンショナル・モデリング」 の文脈で、複数のファクトテーブルにおける複数のディメンションテーブルの共有を可能にする機能です。(そのため、Multi-fact Analysisとも呼ばれています)

ディメンショナル・モデリングとは

データモデリング手法の1つであり、「ディメンション・テーブル」と「ファクト・テーブル」を使ってテーブル群を構成する。

  • ディメンション・テーブル:ファクト・テーブルに紐付くディメンションの詳細なデータを持つテーブル。
  • ファクト・テーブル:ビジネスで発生したイベントと、それに紐付く数値・ディメンションテーブルへのキーを持つテーブル

ディメンショナル・モデリングは、データウェアハウスにおける最も代表的なデータモデリングの手法の1つであり、国内外で多くの組織が採用している。

余談だが、ファクトテーブルをディメンションテーブルで囲む形状が星のように見えることから、この構成は「スタースキーマ」とも呼ばれる。

従来に対して、何が変わるのでしょうか。

昨今、ディメンショナル・モデリングを採用したテーブル群に対して、Tableauで接続することは珍しくないと思います。しかし、2024.1までのTableauでは、「複数のディメンションテーブルを、複数のファクトテーブルで共有出来ない」という制約がありました。

画像引用:Tableau ヘルプ - Tableau のデータ モデルでの論理レイヤーと物理レイヤー(記事執筆時点)

例えば、以下のように「注文ファクトテーブル」と「出荷ファクトテーブル」の2つのファクトテーブルが存在するデータモデルがあったとします。日付と顧客のディメンションテーブルは、両方のファクトテーブルに共有されています。

これのデータモデルをそのままTableauのデータソースとして活用する場合、以下のようにリレーションシップを定義する必要があります。しかし、これは例の制約のため実現できません。

以下のように、どちらか片方のディメンションテーブルと出荷ファクトテーブルを関連付けることは可能です。しかし、これでは出荷ファクトに必要なすべてのディメンションが紐付いていないため、使い物になりません。

この制約は、Tableauが接続するデータウェアハウス側でディメンショナル・モデリングを採用したい場合に、大きな障壁となっていました。

しかし、今回発表された「Shared Dimension」によって、以下のように複数のファクトテーブルが、複数ディメンションテーブルを共有したデータソースを作成可能になりました。

これは、ディメンショナル・モデリングを採用する(または考えている)組織にとって、画期的なアップデートと言えるでしょう。

従来では、データウェアハウス側でディメンショナル・モデリングを採用していても、上記の制約を回避するための実装を行う必要がケースがありました。

しかし、今回の機能によって、データウェアハウス側に用意されたデータモデルを、直接的活用出来るため、ディメンショナル・モデリングの恩恵を、より多く享受可能になります。

Tableauにおいて、ディメンショナル・モデリングがどのように効果を発揮するかに興味がある方は、NTTデータの渋谷さんが執筆した以下のブログも参考にしてください。
https://zenn.dev/ryotas_data/articles/34624130412e14

本機能に関する更なる解説は、Salesforce+のセッションNew Multi-Fact Analyses Using the Tableau Data Modelにて閲覧可能です。気になる方は、是非ご確認ください。

2. Composable Data Sources

続いては、Composable Data Sourcesです。

こちらのリリースは2025.1を予定しているため、向こう半年はサポートされない機能ですが、従来出来なかった「PDS(パブリッシュされたデータソース)を跨いだリレーションシップ」を実現するものであり、KeyNoteでも最も盛り上がった発表の1つでした。

画像引用元: Tableau Conference 2024 - Main Keynote

複数のワークブックで同じデータソースを参照可能になるPDSは、データソース(計算の定義)の乱立を防ぐという意味で是非活用したい機能であるものの、これまでは上記の制約があったために、活用に踏み切れなかった組織も多かったと思います。

そんな最大とも言える制約を解消される今回のアップデートは、Tableau Cloud/Tableau Serverを利用する全ての組織にとって、PDSを利用した戦略を見直す大きなきっかけになることでしょう

また、Tableau Prepフローで作成したPDSを多く活用する組織にとっても、このアップデートはとても大きな意味を持ちます。

Prepフローで出力したPDSは単一のテーブルで構成されてしまうため、従来の機能の範囲でデータを統合するには、「別々のPDSとして出力し、(制約の多い)ブレンドを利用して統合する」または「1つのテーブルに無理矢理入れて、LOD表現で解決する」などの複雑な実装を行う必要がありました。

しかし本機能のサポートによって、Prepで別々に出力したPDS同士のリレーションシップが可能になるため、よりシンプルで効果的な設計と実装が可能になります。

他にも、「フィールドの説明や計算フィールドを、他のデータソースで再利用出来る」 ことも、本機能の大きなメリットとして述べられていました。

これも、昨今データマネジメント領域で重要なテーマとなっているメタデータ管理や指標の定義の分散を抑えるという意味でも、効果が期待出来る仕様です。

本機能に関してもっと話を聞きたかったのですが、私が探した範囲ではSalesforce+の関連セッションが見当たりませんでしたので、KeyNoteで注目を集めた実際の発表の様子の動画を貼っておきます。
https://www.youtube.com/watch?v=QjtQUOA433Y&t=4743s

3. VizQL Data Services API

最後は、2024.3よりサポート予定のVizQL Data Services APIです。TableauによるHeadless BIのサービスであり、PDSが持つディメンションとメジャーの定義を使ったデータ集計の実行とその結果の取得を、APIを通じて外部アプリケーションから可能にする機能です。
※Headless BIに関する解説は、以下の記事も参考にしてください。
https://zenn.dev/churadata/articles/e779a733c5fb35

こちらは構想の発表は23年のTableau Conferenceであったものですが、今回行われたSalesforce+で閲覧可能なセッションInfuse Data Everywhere with VizQL Data Serviceでは、VizQL Data Servicesの具体的な利用方法と、以下の3つの活用事例が紹介されました。

活用方法1:データ集計→配信を自動化
行レベルセキュリティなどを適用する必要があるステークホルダーへのデータ集計と配信を、VizQL Data Servicesを使って自動化する事例

活用方法2:社内アプリケーションへの組み込み
社内アプリケーションにおける通知や表示の裏側に利用されるデータの集計を、VizQL Data Servicesを使って自動化する事例

活用方法3:AIアプリケーションにおけるRAGでの活用
VizQL Data Servicesによる集計結果を使って、データに関して自然言語での会話が可能なRAGアプリケーションを構築する事例

VizQL Data Servicesの活用ヒントをもらえる必見のセッションになっています。

個人的には、あまりHeadless BIらしい使い方ではないものの、このMicrosoftの記事にあるような、セマンティックモデルのバリデーションの文脈での活用も検討出来ると思いました。APIが開放されると、可能性が無限に広がりますね。

最後に

以上、リリースが待ちきれないTC24のデータソース周りの発表3選でした。

Tableau Conferenceは来年もサンディエゴで開催されるようです。現地に行きたい方は、こちらから申し込みましょう

ちゅらデータ株式会社

Discussion