【Dataplex】 タグテンプレート使ってみた
Dataplexのタグテンプレートとはそもそも何をするためのものなのか?
他のタグサービスとの違いなどについて、実際に触ってみて説明していきたいと思います!
Dataplex タグテンプレートとは?
タグテンプレートとはBigQueryのテーブルや列に対して付与するタグのテンプレートのことです。
デフォルトで付与されているメタデータのことをテクニカルメタデータやシステムメタデータなどと呼ぶことがありますが、タグテンプレートは[1]ビジネスメタデータと呼ばれる類のものになります
ポリシータグとどう違うの?
BigQueryのメニューからポリシータグをテーブルの列に付与することができますが、ポリシータグとどう違うのかというと、以下のように用途、目的がはっきり分かれています。
| 項目 | 目的 | タグ付与対象 |
|---|---|---|
| ポリシータグ | アクセス制御 | BigQueryテーブルの列のみ |
| タグテンプレート | データ検索、管理 | BigQueryデータセット、テーブル、列 |
Dataplex タグテンプレートを作ってみよう!
スタート
Dataplexのコンソール画面から「タグテンプレート作成」をクリック!

テンプレートの確認
タグテンプレートを作成するためのテンプレートも用意されています。
タグテンプレートのテンプレートっていうややこしい(笑)ですが、便利なので使っていきましょう!
このテンプレートをそのまま使ってもOKですし、テンプレートをカスタマイズするのもOK!!

Data Governanceテンプレートを使用
例えば、Data Governanceテンプレートをクリックすると、
すでに3つのフィールドが定義されていることが確認できます
タグテンプレートの構成要素はKey-Valueのフィールドで構成されています
例えば「Is Encrypted」がKeyにあたり、Valueには「True」or 「False」が値として入ります。
要はKeyは一つだが、Valueには複数の選択肢が存在することになります!

タグテンプレートの定義
テンプレートを使用すると、表示名とIDは自動で入力されます
ロケーションはタグテンプレートを保存しておくロケーションを指定します

フィールドの定義
フィールドの定義には以下のような項目を設定します。
「フィールド表示名」
「フィールドID」
「フィールドの説明」
「タイプ」

タイプは以下のような種類から選択することができます

最終的にテンプレートはそのまま使います!
こんな感じのフィールドの定義になっています。

作成されたタグテンプレートの確認

タグテンプレートをBigQueryテーブルに対して付与してみよう
Dataplexの左側メニューの「検索」→ 「BigQuery」を選択」→ タグを付与したいテーブルを選択します

テーブルに対してタグを付与

タグの付与の対象を選択
テーブルそのものにタグをつけることも可能ですし、列一つ一つに対して付与することも可能です

タグテンプレートの選択
今回は一つしか作成していないですが、通常は数多のタグテンプレートが作成されることが想定されます。そのため、ここでどのタグテンプレートを使用するのかを選択していきます。

フィールドのValueの入力
タグの中にはフィールドをいくつか設定したことかと思いますが、このタイミングでValueを入力していきます。

今回は次のような値で設定したいと思います。

タグが付与されていることの確認

タグテンプレートベースで検索してみよう
Dataplexの検索から、今回作成したタグテンプレートでフィルターをかけると、タグを付与したテーブルがリストされました。

タグテンプレートのフィールドの値で検索してみよう
以下のようにフィールドの値を指定して、より具体的に検索することも可能です

検索結果の確認

注意点
ちなみにタグテンプレートはdatasetを指定することが可能ですが、datasetに指定することでその配下のテーブルにタグテンプレートは付与されませんので注意が必要です。
-
ビジネスメタデータとは、ユーザーから見て特有のビジネス的な意味合いがあるメタデータと思ってください。例えばこのデータは個人情報だよーみたいなことをメタデータとして付与するということです! ↩︎
Discussion