🍣

データ分析基盤(概念モデル)におけるソースレイヤー

2020/10/28に公開

概要

データ分析基盤(概念モデル)におけるソースレイヤーに関する整理を実施します。
image.png

本記事にて、下記の記事におけるソースレイヤーの詳細を記載します。

定義

ソースレイヤーの定義

データ分析基盤がソースとするデータを保持したシステム、および、データストアを保持した層。

コンポーネント詳細

番号 データ基盤におけるレイヤー コンポーネント名 説明 サービス例
1 ソースレイヤー 業務システム 業務を実施するために利用するシステム。 SAP、Dynamics
2 ソースレイヤー マスターデータ管理システム(MDM) マスタデータの値と識別子の制御によるシステム間で一貫した利用を行うための運用を支援するシステム。データ分析基盤においては、管理されたマスターデータと参照データによる適合ディメンションの利用が可能となる。マスターデータと参照データを別のデータストアから連携することもある。 Informatica MDM
3 ソースレイヤー ストレージサービス データをファイルとして保存できるサービス。 AWS S3、Azure Storage、BOX、SharePoint Onlineドキュメント
4 ソースレイヤー メッセージング メッセージを一方向または双方向で送受信するサービス。利用される通信プロトコルには、HTTP、MQTT、AMQPがある。 Fluentd
5 ソースレイヤー データ仮想化サービス データストアやサービスに対して、データの抽出、変換、統合を仮想的に実行するサービス。 denodo

要求要件

業務システム

データ分析基盤での管理対象がであるため、特になし。

マスターデータ管理システム(MDM)

データ分析基盤での管理対象がであるため、特になし。

ストレージサービス

データ分析基盤での管理対象がであるため、特になし。

メッセージング

データ分析基盤での管理対象がであるため、特になし。

データ仮想化サービス

データ分析基盤での管理対象がであるため、特になし。

参考情報

業務システム

特になし。

マスターデータ管理システム(MDM)

DAMAが下記のように定義しており、本概念モデルにおける認識と相違はあまりないです。

Master Data Management (MDM)
Processes that control management of master data values to enable consistent, shared, contextual use across systems, of the most accurate, timely, and relevant version of truth about essential business en-tities. (DAMA-DMBOK Guide, 1st edition, pg. 171.)

マスターデータ管理(MDM)
マスターデータ値の管理を制御して、システム間で一貫性のある共有されたコンテキスト使用を可能にし、重要なビジネスエンティティに関する最も正確でタイムリーで関連性のあるバージョンの真実を実現するプロセス。 (DAMA-DMBOKガイド、第1版、171ページ)

引用元:The DAMA Dictionary of Data Management, 2nd Edition

ストレージサービス

特になし

メッセージング

ガートナーにて下記のように定義されているが、モバイルデバイス以外からのデータ受信を想定している点で本概念モデルと相違点がある。

Messaging
Messaging refers to an alphanumeric or graphic one-way or two-way service that sends, receives and displays messages on a mobile device.

下記は機械翻訳結果。

メッセージング
メッセージングとは、モバイル デバイスでメッセージを送受信および表示する、英数字またはグラフィックの一方向または双方向のサービスを指します。

引用元:Gartner Glossary Messaging

データ仮想化サービス

MDMとしてDAMAが下記のように定義しており、本概念モデルにおける認識と相違はあまりないです。

データ仮想化サーバーはデータ抽出、変換、統合を仮想的に実行する。

引用元:DMBOK 2nd

参考資料

Discussion