データマネジメント DMBOK2 まとめ
はじめに
データマネジメントについて勉強するために読み進めているDMBOK2の内容を自分用にまとめています。
メモとして、関連しそうなAzure (Microsoft)サービス・リソースを記載しています。
勉強しながらまとめているものなので、もしご指摘などありましたらフィードバックお願いいたします。
DMBOK2全体
https://www.dama-japan.org/Introduction.html より
3. データガバナンス
データマネジメント活動を推進するために、データ資産の統制を行う。全体方針とルール決め、組織的な意思決定を行う。
(もう少し確認して変更する)
4. データアーキテクチャ
ビジネスとデータを結びつけるアーキテクチャを描く。
アクション:
既存のアーキテクチャを書き出し、理想のアーキテクチャを設計し、ギャップを埋めていく。
メモ (関連するMicrosoftサービス・リソース):
- Azure Reference Architecture
5. データモデリングとデザイン
- データ同士の関係性を表す。
データモデルの粒度:
- 概念レベル
- 論理レベル
詳細なデータ要件が記述。具体的な技術や実装からは独立。 - 物理レベル
論理モデルをDB上のテーブルで表したもの。ER図。
6. データストレージとオペレーション
DBA (データベース管理者)としてDBの保守運営を行う。
業務ニーズに合わてDBを選定、管理していく。RDBMSなのか、ものによってはNoSQLも。
メモ:
- Azure DB系サービス (Azure SQL DB, Azure Synapse Analytics 専用 SQL プール)
7. データセキュリティ
データに関する、セキュリティポリシー、取り扱い・アクセスルールを定め、監査する。
メモ:
- データソースの適切なアクセス権設定
- Azure Purview (メタデータ管理部分で、個人情報や機密性レベルを識別・管理する)
8. データ統合と相互運用性
データの移動・変換を行う。ETL/ELT。
メモ:
- Azure Data Factory, Synapse Pipeline
- Azure Databricks
9. ドキュメントとコンテンツ管理
DBの外にある非構造データを管理する。ワードファイル、エクセルファイル、PPDF等。
メモ:
- Purviewでどこまで可能?
10. 参照データとマスタデータ
定義を一貫するためのマスターデータを作成し、参照できるように管理する。
マスターデータとして、システム間で一貫したデータソースを提供することで、業務領域やアプリケーションを横断してデータを利用可能にする。
メモ:
- Azure DB系サービス (特にRDBMS)
- Power BI
11. データウェアハウジングとビジネスインテリジェンス
データウェアハウス (DWH)の構築と、BIツール等での意思決定のためのデータ活用
アクション:
利用者のニーズに合わせて、意思決定システムを設計・開発する。
メモ:関連するMicrosoftサービス・リソース
- Azure Synapse Analytics (サーバレス/専用SQLプール)
- Power BI
- Azure Databricks
12. メタデータ
データの説明をメタデータとして保存し管理していく。
アクション:
- メタデータの分類
ビジネス、テクニカル、オペレーショナル - 要件決め
- リポジトリ
集中型 or 分散型 - 検索システム
メタデータ管理ツールの導入等 - 記述タイミング決め
DWHへの投入時、など
メモ:
- Azure Purview (集中型のメタデータリポジトリとして)
13. データ品質
データ品質は、データ利用者の要求を満たしている度合い。目的との合致度。
品質の基準を定め、現状を測定し、品質向上に向けたプロセスを設計する。
アクション:
まずはニーズを知り、データ品質の評価軸をもとに評価する。そごのデータ品質を測定、評価、向上させるための計画を立てる。
参考
- データマネジメントが30分でわかる本, ゆずたそ (著, 編集), はせりょ (著)
- データマネジメント知識体系ガイド 第二版, DAMA International
Discussion