👻

データ分析基盤(概念モデル)におけるデータカタログ

2020/10/28に公開

概要

データ分析基盤(概念モデル)におけるデータカタログに関する整理を実施します。
image.png

本記事にて、下記の記事におけるデータカタログの詳細を記載します。

定義

データカタログの定義

データモデルとData Integration and Interoperability(データ統合と相互運用性)のメタデータに関する、カタログの作成(定義・抽出・蓄積)、および、カタログの利用(探索・把握・共有・配信)によるデータガバナンス支援システム層。

コンポーネント詳細

番号 データ基盤におけるレイヤー コンポーネント名 説明 サービス例
23 データカタログ データカタログ データモデルとData Integration and Interoperability(データ統合と相互運用性)のメタデータに関する、カタログの作成(定義・抽出・蓄積)、および、カタログの利用(探索・把握・共有・配信)によるデータガバナンス支援システム群。 Informatica Data Catalog、Glue Catalog

要求要件

データカタログ

下記の機能を保持する必要があります。

番号 要否 分類 主要要件 説明
1 必須 カタログの作成 カタログの定義 メタデータを定義する機能
2 必須 カタログの作成 カタログの抽出 メタデータをシステムから抽出する機能
3 必須 カタログの作成 カタログの蓄積 メタデータを蓄積する機能
4 必須 カタログの利用 カタログの探索 メタデータを利用者が探索する機能
5 必須 カタログの利用 カタログの把握 メタデータを利用者が理解することを支援する機能
6 必須 カタログの利用 カタログの共有 メタデータを共有する機能
7 任意 カタログの利用 カタログの配信 メタデータを他システムに配信する機能

詳細については、下記の記事を参考にしてください。

参考情報

データカタログ

DMBOK 2ndにて、下記のように紹介されております。

最も一般的な定義である「データに関するデータ」は単純過ぎて誤解を招きやすい。メタデータとして分類できる情報の種類は幅広い。ITプロセスと業務プロセス、データのルールと制約、論理的および物理的なデータ構造、以上に含まれる情報がメタデータに含まれる。メタデータはデータ自体(例えばデータベース、データエレメント、データモデル)、データが象徴する概念(例えば業務プロセス、アプリケーションシステム、ソフトウェアコード、IT基盤)、データと概念の関係性(リレーションシップ)を記述する。

引用元:DMBOK 2nd 第12章 メタデータ管理

参考資料

Discussion