🕌
🚀 Databricks と Tableau をつないでみよう!~Databricks入門~by中野哲平
~Gold層のデータを Tableau で可視化する方法~
こんにちは!今回は、Databricks(データレイクハウス)で整備したデータを、Tableauでダッシュボード化する手順をわかりやすくまとめました。メダリオンアーキテクチャで Gold 層まで仕上げたら、いよいよ Tableau にバトンを渡すタイミングですね!
🧭 1. 事前準備
✅ Databricks 側の準備
- Unity Catalog(もし使っていれば)で Gold 層テーブルのアクセス権限が Tableau の接続ユーザーに付与されていること
- 対象のテーブルが Delta Table として作成されていること
✅ Tableau 側の準備
- Tableau Desktop または Tableau Server がインストール済み
- Databricks コネクタが利用できるバージョン(2021.1 以降推奨)
🔌 2. Tableau から Databricks に接続する方法
🔐 ステップ 1:Databricks で接続情報を取得
Databricks ワークスペースにログインして、以下を確認します:
項目 | 取得方法 |
---|---|
SQL Warehouse 名 | Databricks UI > SQL > SQL Warehouses |
ホスト名(Server Hostname) | https://<ワークスペース名>.databricks.com |
ポート |
443 (固定) |
HTTP パス(HTTP Path) | SQL Warehouse 詳細画面で確認 |
アクセストークン | 自分のアカウント > User Settings > Access Tokens で作成 |
🧪 ステップ 2:Tableau で接続を設定
- Tableau Desktop を開く
- 「Databricks」を選択(コネクタから検索可能)
- 以下のように入力:
項目 | 入力例 |
---|---|
サーバー | adb-1234567890.11.azuredatabricks.net |
ポート | 443 |
HTTP パス | /sql/1.0/warehouses/abc123xyz456 |
トークン | Databricks で生成した Personal Access Token |
✅ 接続テストをして、成功すればOK!
🧬 3. Tableau 上で Gold テーブルを読み込む
- 接続後、Databricks の Catalog → Schema(例:gold) → Table をたどってテーブルを選択
- 必要に応じて、Tableau 側で計算フィールドやフィルタリングを追加
- ダッシュボードやグラフにドラッグ&ドロップして可視化!
💡 Tips
シーン | ベストプラクティス |
---|---|
毎日更新したい | Tableau Server + スケジュール更新機能を活用 |
遅い時の対処法 | Databricks 側で事前集計(=Gold層を最適化)すると爆速に |
ユーザーごとのデータ制御 | Unity Catalogの Row-Level Security を活用すると◎ |
🧹 最後に:トラブルシューティング
問題 | 対策 |
---|---|
「接続に失敗」 | トークン切れ or HTTP Path 間違いの可能性 |
「テーブルが見つからない」 | Unity Catalog の権限不足 or クエリスキーマ未選択 |
「表示が遅い」 | Gold 層の最適化(ZORDER, キャッシュ, 集計済みにする)を検討 |
✍️ おわりに
Databricks でデータを整備して、Tableau で見せることで、
データエンジニアとビジネスサイドのコラボが一気に加速します!
Gold層までしっかり設計されていれば、Tableau側の操作もスムーズになりますよ💡
実際のプロジェクト現場でも超定番の連携なので、ぜひ試してみてください!
もし「Tableau Server でのスケジュール実行方法」や、「接続エラーのデバッグ方法」などをさらに詳しく知りたい場合もお気軽にどうぞ!
Discussion