💎

TableauからPresto(Trino)でTreasure Data CDP上のデータにアクセスする

に公開

はじめに

今回はTableauからPresto(Trino)エンジンを経由してTreasure Data CDPのデータへアクセスする方法について書きます。
仕事用のPCを交換した際に自分でもやり方忘れていたので、これを機にまとめて残します。
TableauとTreasure Data CDPの接続方法は様々ありますが、今回の方法はどちらかというとアドホックにTreasure Data CDPからデータを抽出してTableauで可視化したいなという時に適しているかと思います。

手順

下記手順で、TableauからTreasure Data CDP内のデータへアクセス可能になります。

1. Prestoサイトからドライバーをダウンロード

Prestoサイトから最新版のJDBCドライバーを入手します。
急にURL変わるかもしれないので、執筆時点でアクセス可能なリンクをいくつか書いておきます。

2. ドライバーの配置

1でダウンロードしてきたドライバーを適切なフォルダ(ディレクトリ)に配置します。
WindowsとMacとで場所が変わるので、下記参考にドライバーを配置してください。

OS ファイルパス 備考
Windows C:\Program Files\Tableau\Drivers
Mac /Users/*****/Library/Tableau/Drivers *****にはPCのユーザ名が入る

3. Tableauの接続設定

Tableauのデータ接続で「presto」を選択します。
select tableau data connect.

以下のような画面が表示されるので、必要な情報を入力します。
set connection info.

入力する情報はこちらです。

項目 設定値 備考
サーバー api-presto.treasuredata.com
もしくは
api-presto.treasuredata.co.jp
USリージョンは.com、JPリージョンは.co.jpを選択
ポート 443
カタログ td-presto たぶんダミーの値でもok
認証 ユーザ名 ここは選択式
ユーザ名 Treasure Data CDPのMASTER API KEY 確認の仕方はアコーディオン(トグル)内を確認
SSLが必要 チェックボックスにチェック入れる
ユーザ名に入力するMASTER API KEYの確認

MASTER API KEYは以下から確認します。
※ updateにより画面イメージが変更されている場合があります
confirm td api key
マスキングしていますが、一番右側のAPI Keyの赤枠部分をクリックするとAPIキーがクリップボードにコピーされます。

4. Tableauのスキーマとテーブルを指定する

認証情報を入力したら、データソースタブでスキーマを選択します。
Tableauから参照したスキーマを入力して検索し、選択します。
select schema on tableau
スキーマが正しく指定できると、テーブルを指定できるようになります。スキーマの時と同様に参照したいテーブルを入力して検索し、右側のテーブルにドラッグアンドドロップします。
select table on tableau
以下のような画面が表示されたら準備okです。ワークシートに移動してグラフを描画できるようになっています。
tableau ready for plot

さいごに

さいごに、本題とは関係ありませんが補足です。

Prestoとは

Prestoは大規模なデータソースを高速でクエリ実行するためのオープンソースSQLエンジンです。Facebookのプロジェクトとしてスタートしました。Prestoという商標はFacebook社が保有しており、2020年からフォークしたプロジェクトがTrinoみたいです。厳密に違うところはあるのかもしれませんが、Treasure Data触る分にはPrestoとTrinoはほぼ同じものという認識でも困らないのかなと思います。
Treasure Dataを触っているとPrestoやTrino、Hiveといったエンジン名が出てきますが、こちらの記事など参考にして用途にあったエンジンを選択するとよいかなと思います。

Discussion