🕌

🚀 Databricks と Tableau をつないでみよう!~Databricks入門~by中野哲平

に公開

~Gold層のデータを Tableau で可視化する方法~

こんにちは!今回は、Databricks(データレイクハウス)で整備したデータを、Tableauでダッシュボード化する手順をわかりやすくまとめました。メダリオンアーキテクチャで Gold 層まで仕上げたら、いよいよ Tableau にバトンを渡すタイミングですね!


🧭 1. 事前準備

✅ Databricks 側の準備

  • Unity Catalog(もし使っていれば)で Gold 層テーブルのアクセス権限が Tableau の接続ユーザーに付与されていること
  • 対象のテーブルが Delta Table として作成されていること

✅ Tableau 側の準備

  • Tableau Desktop または Tableau Server がインストール済み
  • Databricks コネクタが利用できるバージョン(2021.1 以降推奨)

🔌 2. Tableau から Databricks に接続する方法

🔐 ステップ 1:Databricks で接続情報を取得

Databricks ワークスペースにログインして、以下を確認します:

項目 取得方法
SQL Warehouse Databricks UI > SQL > SQL Warehouses
ホスト名(Server Hostname) https://<ワークスペース名>.databricks.com
ポート 443(固定)
HTTP パス(HTTP Path) SQL Warehouse 詳細画面で確認
アクセストークン 自分のアカウント > User Settings > Access Tokens で作成

🧪 ステップ 2:Tableau で接続を設定

  1. Tableau Desktop を開く
  2. 「Databricks」を選択(コネクタから検索可能)
  3. 以下のように入力:
項目 入力例
サーバー adb-1234567890.11.azuredatabricks.net
ポート 443
HTTP パス /sql/1.0/warehouses/abc123xyz456
トークン Databricks で生成した Personal Access Token

✅ 接続テストをして、成功すればOK!


🧬 3. Tableau 上で Gold テーブルを読み込む

  1. 接続後、Databricks の Catalog → Schema(例:gold) → Table をたどってテーブルを選択
  2. 必要に応じて、Tableau 側で計算フィールドフィルタリングを追加
  3. ダッシュボードやグラフにドラッグ&ドロップして可視化!

💡 Tips

シーン ベストプラクティス
毎日更新したい Tableau Server + スケジュール更新機能を活用
遅い時の対処法 Databricks 側で事前集計(=Gold層を最適化)すると爆速に
ユーザーごとのデータ制御 Unity Catalogの Row-Level Security を活用すると◎

🧹 最後に:トラブルシューティング

問題 対策
「接続に失敗」 トークン切れ or HTTP Path 間違いの可能性
「テーブルが見つからない」 Unity Catalog の権限不足 or クエリスキーマ未選択
「表示が遅い」 Gold 層の最適化(ZORDER, キャッシュ, 集計済みにする)を検討

✍️ おわりに

Databricks でデータを整備して、Tableau で見せることで、
データエンジニアとビジネスサイドのコラボが一気に加速します!

Gold層までしっかり設計されていれば、Tableau側の操作もスムーズになりますよ💡
実際のプロジェクト現場でも超定番の連携なので、ぜひ試してみてください!


もし「Tableau Server でのスケジュール実行方法」や、「接続エラーのデバッグ方法」などをさらに詳しく知りたい場合もお気軽にどうぞ!


Discussion