【Dataplex】 タグテンプレート使ってみた
Dataplexのタグテンプレートとはそもそも何をするためのものなのか?
他のタグサービスとの違いなどについて、実際に触ってみて説明していきたいと思います!
Dataplex タグテンプレートとは?
タグテンプレートとはBigQueryのテーブルや列に対して付与するタグのテンプレートのことです。
デフォルトで付与されているメタデータのことをテクニカルメタデータやシステムメタデータなどと呼ぶことがありますが、タグテンプレートは[1]ビジネスメタデータと呼ばれる類のものになります
ポリシータグとどう違うの?
BigQueryのメニューからポリシータグをテーブルの列に付与することができますが、ポリシータグとどう違うのかというと、以下のように用途、目的がはっきり分かれています。
項目 | 目的 | タグ付与対象 |
---|---|---|
ポリシータグ | アクセス制御 | BigQueryテーブルの列のみ |
タグテンプレート | データ検索、管理 | BigQueryデータセット、テーブル、列 |
Dataplex タグテンプレートを作ってみよう!
スタート
Dataplexのコンソール画面から「タグテンプレート作成」をクリック!
テンプレートの確認
タグテンプレートを作成するためのテンプレートも用意されています。
タグテンプレートのテンプレートっていうややこしい(笑)ですが、便利なので使っていきましょう!
このテンプレートをそのまま使ってもOKですし、テンプレートをカスタマイズするのもOK!!
Data Governanceテンプレートを使用
例えば、Data Governanceテンプレートをクリックすると、
すでに3つのフィールドが定義されていることが確認できます
タグテンプレートの構成要素はKey-Valueのフィールドで構成されています
例えば「Is Encrypted」がKeyにあたり、Valueには「True」or 「False」が値として入ります。
要はKeyは一つだが、Valueには複数の選択肢が存在することになります!
タグテンプレートの定義
テンプレートを使用すると、表示名とIDは自動で入力されます
ロケーションはタグテンプレートを保存しておくロケーションを指定します
フィールドの定義
フィールドの定義には以下のような項目を設定します。
「フィールド表示名」
「フィールドID」
「フィールドの説明」
「タイプ」
タイプは以下のような種類から選択することができます
最終的にテンプレートはそのまま使います!
こんな感じのフィールドの定義になっています。
作成されたタグテンプレートの確認
タグテンプレートをBigQueryテーブルに対して付与してみよう
Dataplexの左側メニューの「検索」→ 「BigQuery」を選択」→ タグを付与したいテーブルを選択します
テーブルに対してタグを付与
タグの付与の対象を選択
テーブルそのものにタグをつけることも可能ですし、列一つ一つに対して付与することも可能です
タグテンプレートの選択
今回は一つしか作成していないですが、通常は数多のタグテンプレートが作成されることが想定されます。そのため、ここでどのタグテンプレートを使用するのかを選択していきます。
フィールドのValueの入力
タグの中にはフィールドをいくつか設定したことかと思いますが、このタイミングでValueを入力していきます。
今回は次のような値で設定したいと思います。
タグが付与されていることの確認
タグテンプレートベースで検索してみよう
Dataplexの検索から、今回作成したタグテンプレートでフィルターをかけると、タグを付与したテーブルがリストされました。
タグテンプレートのフィールドの値で検索してみよう
以下のようにフィールドの値を指定して、より具体的に検索することも可能です
検索結果の確認
注意点
ちなみにタグテンプレートはdatasetを指定することが可能ですが、datasetに指定することでその配下のテーブルにタグテンプレートは付与されませんので注意が必要です。
-
ビジネスメタデータとは、ユーザーから見て特有のビジネス的な意味合いがあるメタデータと思ってください。例えばこのデータは個人情報だよーみたいなことをメタデータとして付与するということです! ↩︎
Discussion