📗

データマネジメント DMBOK2 まとめ

2022/06/02に公開

はじめに

データマネジメントについて勉強するために読み進めているDMBOK2の内容を自分用にまとめています。
メモとして、関連しそうなAzure (Microsoft)サービス・リソースを記載しています。
勉強しながらまとめているものなので、もしご指摘などありましたらフィードバックお願いいたします。

DMBOK2全体


https://www.dama-japan.org/Introduction.html より

3. データガバナンス

データマネジメント活動を推進するために、データ資産の統制を行う。全体方針とルール決め、組織的な意思決定を行う。
(もう少し確認して変更する)

4. データアーキテクチャ

ビジネスとデータを結びつけるアーキテクチャを描く。

アクション:
既存のアーキテクチャを書き出し、理想のアーキテクチャを設計し、ギャップを埋めていく。

メモ (関連するMicrosoftサービス・リソース):

  • Azure Reference Architecture

5. データモデリングとデザイン

  • データ同士の関係性を表す。

データモデルの粒度:

  1. 概念レベル
  2. 論理レベル
    詳細なデータ要件が記述。具体的な技術や実装からは独立。
  3. 物理レベル
    論理モデルをDB上のテーブルで表したもの。ER図。

6. データストレージとオペレーション

DBA (データベース管理者)としてDBの保守運営を行う。
業務ニーズに合わてDBを選定、管理していく。RDBMSなのか、ものによってはNoSQLも。

メモ:

  • Azure DB系サービス (Azure SQL DB, Azure Synapse Analytics 専用 SQL プール)

7. データセキュリティ

データに関する、セキュリティポリシー、取り扱い・アクセスルールを定め、監査する。

メモ:

  • データソースの適切なアクセス権設定
  • Azure Purview (メタデータ管理部分で、個人情報や機密性レベルを識別・管理する)

8. データ統合と相互運用性

データの移動・変換を行う。ETL/ELT。

メモ:

  • Azure Data Factory, Synapse Pipeline
  • Azure Databricks

9. ドキュメントとコンテンツ管理

DBの外にある非構造データを管理する。ワードファイル、エクセルファイル、PPDF等。

メモ:

  • Purviewでどこまで可能?

10. 参照データとマスタデータ

定義を一貫するためのマスターデータを作成し、参照できるように管理する。
マスターデータとして、システム間で一貫したデータソースを提供することで、業務領域やアプリケーションを横断してデータを利用可能にする。

メモ:

  • Azure DB系サービス (特にRDBMS)
  • Power BI

11. データウェアハウジングとビジネスインテリジェンス

データウェアハウス (DWH)の構築と、BIツール等での意思決定のためのデータ活用

アクション:
利用者のニーズに合わせて、意思決定システムを設計・開発する。

メモ:関連するMicrosoftサービス・リソース

  • Azure Synapse Analytics (サーバレス/専用SQLプール)
  • Power BI
  • Azure Databricks

12. メタデータ

データの説明をメタデータとして保存し管理していく。

アクション:

  1. メタデータの分類
    ビジネス、テクニカル、オペレーショナル
  2. 要件決め
  3. リポジトリ
    集中型 or 分散型
  4. 検索システム
    メタデータ管理ツールの導入等
  5. 記述タイミング決め
    DWHへの投入時、など

メモ:

  • Azure Purview (集中型のメタデータリポジトリとして)

13. データ品質

データ品質は、データ利用者の要求を満たしている度合い。目的との合致度。
品質の基準を定め、現状を測定し、品質向上に向けたプロセスを設計する。

アクション:
まずはニーズを知り、データ品質の評価軸をもとに評価する。そごのデータ品質を測定、評価、向上させるための計画を立てる。

参考

  • データマネジメントが30分でわかる本, ゆずたそ (著, 編集), はせりょ (著)
  • データマネジメント知識体系ガイド 第二版, DAMA International
GitHubで編集を提案
Microsoft (有志)

Discussion