「DX時代のデータマネジメント大全」を読んで大事と思った箇所まとめ
はじめに
- 「DX時代のデータマネジメント大全」を読んで個人的に勉強になったところをまとめました。全体の要約ではないため悪しからず、、、
1.DXの正しい歩み方
デジタイゼーション/デジタライゼーション/DXの違い
- デジタイゼーションは特定の業務の効率化やコスト削減、アナログ情報のデジタル化など「部分的なデジタル化」を指す
- デジタライゼーションはデジタイぜーションでデジタルに変換したデータを活用し、業務やビジネス「全体」を効率化し組織の生産性を向上させる状態を表す
- またDXの実現は一気通貫で到達するものではなく、デジタイゼーション/デジタライゼーション/DXの段階分けで進めていく必要がある
DXフレームワーク
出典: https://cloud.signate.jp/column/dx-strategy
DXの本質
- DXにおける重要なポイントは「業務の効率化」や「コスト削減」「品質の向上」などの従来の改善活動ではなく「企業/組織のあり方やそこで働く人のマインドセットを変革させること」
DXを阻む3つの壁
1. データ利活用の失敗
- データから直接課題を見つけようとするのは間違い
- とりあえず集められるデータをかき集めて、ツールに流し込んでいるケース
- 目的である「ビジネス価値の創出」から手段である「データ利活用」を区別できていないケース
- データ利活用の成功パターンとして、最初から現場起点の課題を見つけられていること
2. レガシーシステムの呪縛
- 「ドキュメントが整理されておらず内部構造を把握できない」「他のシステムとのデータ連携が困難」「技術的な制約や性能に限界がある」「既存システムが複雑すぎて追加機能に基幹やコストがかかる」
- DXにおける有効なアプローチ
- 切り離す、つながる、組み合わせる
- 具体的に既存システムを全て一気通貫で変えるのではなくビジネス変革に直結するコア部分から段階的に必要な部分を必要なときに変えモダナイズしていく方法
3. デジタル人材不足
- 経済産業省の発表では2030年に79万人不足する
- 日本はアウトソーシングの文化がある
- DXに必要な人材は外部のベンダー企業に任せるのではなく、ユーザー企業自らが確保するべき
- 方向性として「内部育成」と「外部からの確保」の2通りある
DXを進める4つのステップ
- DXの本質である企業変革には終わりがないため、DXにも終わりはない
- 以下が必要
- why...なぜDXが必要なのか
- where...DXでどこを目指すのか
- who/what...どのような体制でどの事業領域を対象とするのか
- when/how...どういう時間軸でどのように実行するのか
1. 動機付け意識付け
- なぜDXを推進しなければならないのかを企業全体に浸透させていく段階
- DXビジョンとは「なぜ自社にとってDXが必要なのか」の目的理由を明確化すること
2. 方向付け
- 経営理念を実現するためにDXビジョンがあり、DXビションを達成するためにDX戦略がある
- 階層の関係性
- 富士フィルムの具体例
- DXビジョン...「デジタルを活用することで社員の一人一人が飛躍的に生産性を高め、そこから生み出される優れたサービス、製品を通じてイノベーティブなお客様体験の創出と社会課題解決に貢献し続ける」
- DX戦略とは...「企業が競争力を維持強化するため(why)、データとデジタル技術を活用し製品、サービス、組織、業務、プロセス(who,what)を変革する(do what)なアプローチのこと」
3. 戦略策定
DX戦略策定のステップ1 現場把握
- DXフレームワークを利用して自社がデジタイゼーション/デジタライゼーション/DXのどの位置に把握しているかを把握する
DX戦略策定のステップ2 外部環境分析
- 外部環境の分析としてPEST分析が役立つ
- PEST分析を活用すると自社のビジネスにどのような影響を与えるかどのような道に進めば追い風になるかを判断する手がかりになる
DX戦略策定のステップ3 実行方針の策定
- 戦略における最も重要な観点「選択と集中」を用いて限られたリソースを何に集中させるかを何をやらないかを決める必要がある
- 2つの選択肢がある
- 強みを伸ばす
- 弱点を克服する
DX戦略策定のステップ4 トライアンドエラー
- リーンスタートアップの考え方...「Quick Durty」(雑で構わないから動くものを)
- リーンスタートアップの考え方を取り入れて、トライアンドエラーを繰り返しながら施策に取り組む
2.DX推進の鍵を握るデータ・ドリブン経営
ビッグデータとは
- 量、多様性、速度/頻度、正確性を高いレベルで有していることが特徴
- ビックデータを利活用することで従来活用できなかったデータを扱えるようになったと同時に社会、自社、モノ、ヒトなどの軸で異なるデータを掛け合わせることにより今までにない示唆や発想が生まれてより優れたサービスや製品を送り出すことができる。
データ・ドリブン経営を支えるDIKWモデル
- Data...データ自体、単体では意味を持たない、ローデータとも呼ばれる
- Information...それ自体では意味を持たないデータに何らかの基準で整理と意味付けをし4Wの答えとなるもの
- Knowledge...知識とは情報をさらに体系化したもの、第三者に教えられる知見のこと
- Wisdom...知恵とは知識を正しく理解した上で自ら判断を加えて行動することで価値へと昇華したもの
データから価値を生み出すデータバリューチェーン
- データバリューチェーンとはデータの生成、収集、蓄積、前処理、分析、利活用されるまでのプロセスを連鎖として捉え、データの価値を創出するにはどこに目をつければいいか考えうフレームワーク
データ・ドリブン経営の真意
- データを起点主軸に物事を駆動すること。
- データ・ドリブン経営...ビジネスの課題に対し、データを収集分析し、その分析結果に基づいた意思決定を下すことで組織の経営を駆動すること
3.データ・ドリブン経営の成敗を左右するデータの利活用
データ利活用の現状と課題
- データの利活用とは課題の解決を目的としたデータを収集、蓄積、処理、分析、活用する一連のプロセスのこと
データ利活用の「とりあえずの罠」
- データ利活用の目的も課題も定めないままで膨大なリソースをかけデータを前処理し、データ分析して導いた推論モデルが経営課題の解決にそのまま役立つことはない
データ利活用に必須な仮設思考
- 仮説がデータ分析の拠り所であり、データの利活用がどの場面においても仮説思考が欠かせない
- 仮設思考は限られた時間の中で、限られたデータや情報を観察分析し、早い段階で仮説を立ててそれが正しいかを検証し、間違いに気づいたら素早く修正し新たに別の仮説を立てるcをすることで最終的な答えの質を向上できる。
データ利活用に必要なデータの前処理
データクレンジング
- 収集したローデータから重複や誤記、表記の揺れなどを探し出して、削除や修正、正規化を行いデータ品質を高める
データの名寄せ
- データクレンジングの後続処理
- 名寄せとは複数のデータソースに分散されている同一人物などのデータに対し重複を判断し同一のIDを付与してデータを統合すること
データ分析の本質とは
- データ分析の本質とは何らかの目的を持ってデータを比較して意味合いを見出すこと
4.データ利活用を支えるデータマネジメントの全体像
- データマネジメントとはデータをビジネスに生かせる状態を維持管理するための組織的な活動
データマネジメントの定義から見えてくる3つの要点
- データをビジネスに生かす状態にすること
-
データの状態を維持管理すること
- データがビジネスに利用される状態になるまで一度きりの活動ではなくPDCAを回す
-
組織的な活動が必要であること
- 経営そうがデータマネジメントの本質を理解し、データマネジメントの投じるリソースを確保することはもちろん経営層がリーダーシップをとってデータマネジメントの取り組むを続けなければ継続的な成長はない
- データ利活用とは課題の解決を目的としたデータを収集、蓄積、処理、分析、活用する一連のプロセスのこと
DMBOOK
- Data Management Body of Knowredgeの略でデータマネジメントに関連する知識を体系化したガイドブック
DAMAホイール図
出典: https://www.dama-japan.org/Introduction.html
データマネジメントの全体図
データマネジメントの3階層
-
レイヤー1: 戦略層
- データマネジメントを通じて目的を設定する
- 目標に達するため何に経営資源を当てるか選択する
-
レイヤー2: 実行層
- データマネジメントの戦略を受け、6つの構成要素のアクションプランを策定し実行する。
- レイヤー3: 組織/人層
レイヤー2: 実行層のアクションプランに関して
- データガバナンス
- データアーキテクチャ
- マスターデータ管理
- データ品質管理
- メタデータ管理
- データセキュリティ
データマネジメントでデータ利活用の課題を紐解く
- データ利活用の課題は多岐にわたる場合が多いため、その課題解決の入り口で勝敗を分けるのは要素分解になる
5.データマネジメント戦略層
戦略定義における3つの視点
- 目的がなければ戦略が不要
- 経営資源が無限であれば戦略が不要
- 選択と集中をしないのであれば戦略が不要
戦略のカスケーディング
- カスケーディング...連なった小さな滝が落ちる意
- 企業における戦略のカスケーディングは上層の戦術が下層の目的となり、仮装はその目的において戦術が決定される
データマネジメントの目的設定の3つの方法
1. 事業戦略との整合
- データマネジメントの論点を考える上で重要なのが、その目的を事業戦略と整合させることによってデータマネジメントをビジネスにどう生かすのか考えること
2. 現状課題の分析
- 現状ではどのような課題があり、どういう影響があるのかを洗い出して優先順位をつけることでデータマネジメントを通じて何を一番に目指すべきなのかという目的を明確にする
3. 他社事例の研究
- 他社事例を研究することで共通的な課題の解決に役立つ手がかりを見つけてそこから適切な解決策を導ければ、目的への近道となる
対象データの明確化
- 3つの問いかけにて明確化
- Q1: 設定された目的を達成するに必要な情報とは?
- Q2: その情報を生み出すために、必要なデータとは?
- Q3: そのデータがどういう状態や構造でなければならないか?
実行計画(ロードマップを描く)
- 対象のデータの生成、収集、蓄積、前処理、分析、利活用のデータバリューチェーンを経て、段階的にデータの価値を生み出しつつ、いつまでに何の目的を達成するかを示す実行計画を立てることになる。
投資対効果の算出
- データマネジメントの施策において他の事業と同じように予算確保のためどういう目的でいくら投資をして何年でその投資を回収できるかという投資対効果(ROI)を試算する必要がある
- データマネジメントにおいて、その定性効果、定量効果はデータマネジメントの目的、目標から導き出すことが一般的
投資対効果 効果の算出
- 3つの要素
- 成長期会
- コスト削減
- リスク低減
- 実際に高価試算を行う際に財務、業務、IT部門のそれぞれの目線から有力なユースケースを出し合って、全社レベルのデータマネジメントの効果を抽象的な言葉から、明確な定性、定量的な効果まで落とし込むことが大事
投資対効果 コストの特定
- ROIを明らかにするにはコストの部分も思案する必要がある
- コストには以下3つのカテゴリが考えられる
- 初期コスト
- ランニングコスト
- 機会損失コスト
- データマネジメントを導入せず、現状のデータ課題を解決しない場合は、発生した機会損失をコストとして見なすのが重要
6.データマネジメント実行層
データガバナンス
- データがバナンズは直訳すると「データの統治」になる
- データ資産を効果的かつ安全にビジネス利活用できる状態に維持する全社レベルの活動を指す
データガバナンスの3つの要素
- 立法
- 立法とはデータ管理規約、ルールの策定。データの取り扱いについて従うべきルールや考え方を決めること
- 行政
- 行政とは、立法で作られたデータの利活用のルールを現場に落とし込んで根付かせること
- 司法
-
司法とはルールが守られているかをチェックと監視すると同時に、現場から意見を吸いあげて、既存ルールの継続的な改善を図っていくこと
-
データガバナンスはデータマネジメントの全領域に対してルールを定めて、統制しながらデータ利活用がスムーズに進むように管理、監督するもの
なぜデータガバナンスが必要
- ユースケース1: 膨大なデータが無法地帯
- 「あるはずのデータがどこにあるのかわからない」「収集したデータが間違いだらけででどころも不明」「データの形式が不統一」
- 上記のような状況が無法地帯
- ユースケース2: データ利活用がバラバラ
- 営業部ごとに違うデータ分析ツールを利用している点など
- ユースケース3: セキュリティ/コンプライアンスのリスクが高まる
- データセキュリティに関するガバナンスを疎かにするにすると特定の社員にとって必要のないデータを閲覧できたり誰でもデータを持ち出せてしまったりすることができる
- 上記によりうっかりミスでのデータ漏洩も考えられる
- データセキュリティに関するガバナンスを疎かにするにすると特定の社員にとって必要のないデータを閲覧できたり誰でもデータを持ち出せてしまったりすることができる
データガバナンスへの取り組み方
- 1: 現状と課題の把握
- 2: 目的の明確化
- 3: 組織の設計
- データガバナンスの組織構造は中央集権型、地方分権型、ハイブリッド型の3つの組織構造モデルをベースにして検討するのが一般的
- 4: ガイドラインの作成と周知
- ボトムアップで「トライアル的に段階的に適用してみる」など現場の実体験を積み上げながら、徐々に現場のメンバーに当事者意識を持たせることが重要
- 5: 実施と改善
データアーキテクチャ
- データ活用基盤とは、IoT、ビッグデータ、クラウドなどの技術を活用し、社内外のデータを収集、蓄積、処理しそれを分析利活用することで、企業の競争優位性を確率するためのプラットフォームおよびサービスのこと
- データアーキテクチャとはデータ利活用のプロセス全体(データ収集から蓄積/加工、分析まで)を俯瞰し、データ活用基盤における要件を取りまとめた全体構想として、データ活用基盤を構成する要素を定めたもの
- アーキテクチャとは個別のシステム、ここの実装を目指すものではなく、汎用的な設計思想に基づいた構成、構造のこと
データ活用基盤の全体像
-
データソース
- アプリ、ログ、ファイル、IoT、SNS、Openデータ、文書
-
収集
- レプリケーション、ETL、DB連携、API連携、ファイル連携
-
前処理
- 変換、クレンジング、マスキング、名寄せ、補正
-
分析
- 可視化、傾向把握、予測
-
活用先
- 顧客、社内ユーザー、社内/社外システム、3rdParty
-
データ利活用の目的・ゴールに立ち戻ってまず必要最小限の機能(MVP)から手をつけてデータ利活用の効果を刈り取りつつ、段階的に拡張する、つまり「スモールスタート&クイックウィン」の考え方が重要になる。
データ活用基盤の6つの要素 1:収集
データ収集の方法
-
バッチ処理
-
ストリーミング処理
-
どちらを採用するかはデータ利活用の目的、つまり実現したいことによって判断するべき
- 商品レコメンド...ストリーミング
- 前日までの売り上げ把握...バッチ
密結合と蘇結合
- インターフェース連携の方式を検討する際に、データソースとデータ活用基盤の依存関係を低くして、互いに独立性が高い状態、つまり蘇結合を保つ設計思想が重要
データ活用基盤の6つの要素 2:前処理(整形・加工)
- アノテーションとは、「注釈」や「注解」という意味で、テキストや音声、画像、動画などあらゆる形態のデータの一つ一つに対してメタデータをタグとして付与して意味を持たせること
データ活用基盤の6つの要素 3:蓄積
-
データレイク
- データレイクの大きな特徴としてデータ構造に縛られず、データを格納する際に決まった形式に整える必要がないため様々な形に格納できること
-
データウェアハウス
- 企業が何らかのデータ分析を行うには業務横断的に数種類のデータを繋ぎ合わせて、データを整えておく必要がある
- DWHはデータ分析という目的に特化したデータベース
-
データマート
- データマートとはDWHにあるデータから業務部門や用途ごとに応じて必要なものだけ抽出、集計し活用しやすい形に格納したもの
データ活用基盤の6つの要素 4:運用管理
- 運用管理はデータを良い状態に維持管理するための「データ品質管理」「メタデータ管理」「マスターデータ管理」を行う構成要素
- データマネジメントにおける運用管理はデータの利活用側から求められる要件を満たすデータの状態を維持管理することを指す
- データ品質管理
- DMBOOKでは、データ品質管理は「品質管理の技術を応用して、データが目的に側しているかを測定評価改善し、その品質補償を行うための各種活動について計画立案、実行、統制を行うこと」
- メタデータ管理
- メタデータとはデータについてのデータのこと。つまりデータそのままではなくそのデータを表す属性や関連するデータのこと
- メタデータ管理とは「どこにどのようなデータがどう存在しているのか」という情報を適切に管理すること
- マスターデータ管理
- マスターデータとは企業のビジネス活動を支える最も重要な名詞として企業が持っている経営資源そのもの(ひと、もの、金)を表現するデータのこと
- ECサイトの購入の流れなどのビジネス活動を「いつ」「どこで」「誰が」「何をした」という5W1Hの要素で表現する際に名詞となる部分が全てマスターデータ
- ECサイトでのトランザクション...田中一郎がECで赤いTシャツを買い自宅住所への配送を指定した
データ活用基盤の6つの要素 5:データセキュリティ
- データセキュリティはアクセスを許可していないデータを保持し、データの機密性、整合性、可溶性を維持する手段として利用する
データ暗号化
- データ暗号化はデータの中身を他人にはわからなくするため、データを読み取り可能な形式や符号化された形式に変換し、複合化しないとやり取り読み取りや処理ができないようにするための機能
データアクセス制御
- データアクセスできるユーザーの制御
-
認証
- 認証とはログインできるユーザーを識別する機能。
-
認可
- 認可とはアクセス制御リストの条件を参照し、ユーザーがアクセスできる範囲を決めること
-
ユーザーベースのアクセス制御
- ユーザーごとに対象データへのアクセス権限を設定すること
- ユーザー単位で制御を行うため大人数の場合大変
-
ロールベースのアクセス制御
- ユーザーベースを克服するために生まれたもの
- ユーザーはロールに属しロールに対するアクセス権限を対象データに設定すること
-
監査
- データセキュリティの監査とはデータのアクセス履歴を記録し、アクセス制限の検証・改善を行うためのもの
-
監視
- データへの不正侵入をあらかじめ防ぐためユーザーのIDS/IPS、ファイアウォールのログなどをリアルタイムで監視すること
データ活用基盤の6つの要素 6:データ分析
- 3つの活用レベル(レベルが上がるにつれ難易度が上がる)
- level1:見える化
- 統計をベースとしたlevel2:傾向把握
- 機械学習を用いたlevel3:予測分析
マスターデータ管理
マスターデータ管理のよくある課題「データのサイロ化」
- 縦割りの組織で各事業部の権限が強く事業部ごとに個別最適化がすすんでいる点
- この課題の本質は縦割りのによる業務とシステムの分断
- 課題を解決するには強いリーダーシップをとってトップダウンで旗振り役を果たす経営層の人間がいるか否かがポイント
マスターデータ管理のよくある課題「データ粒度不揃い・データ重複」
- ある会社では商品マスタと顧客マスタがバラバラの粒度で確立されておらず前者で共通的な分析軸がなかったこと
- マスタデータが統合されていないとこのような売り上げ分析の課題だけでなく、グループ選対での集中購買M&Aに伴う請求一本化、グループ全体の与信管理などの様々なビジネス活動に支障をきたす
マスターデータ管理のよくある課題「データ精度と鮮度の低下」
- 1回登録された情報が何年も更新されないケース
- この課題に対する打ち手として、マスターデータを閉じた社内の世界で考えるのではなく、外部の2次データを活用して住所、法人、行政の統計情報などを取り入れて社内のマスターデータを拡張させるデータエンリッチメントの観点が考えられる。
統合すべきマスターデータとは
- 統合対象のデータを紐解く
- MDM...実際は達成すべき目的に応じて、統合すべきマスターデータが変わってくる
- MDM統合管理の対象データについて、まず目的をクリアにした上で投資対効果の観点で効果を引き出しやすいマスターデータはどれなのかを考えることが重要
- 最大公約数を見極める
- 対象データを定めるポイントは、全部盛りの最小公倍数ではなく、各領域における必要となる共通語として、組織を縦断で利用する最大公約数を見つける。
- 例えばバリューチェーンで見た場合、その共通語といえば品目マスタ、商品マスタとなる。グローバルでマスターを統合して、それぞれの国,拠点の商品在庫の偏りを集中コントロールすることで余剰在庫の低減につながる。
マスターデータ管理導入における5つの論点
- 5つの論点
- 戦略、業務、ガバナンス、組織、テクノロジー
- 1: 戦略策定
- MDMの戦略としてMDMの目的をどのように事業戦略をと関連づけるかという問いかけ
- ロードマップの策定にあたって、MDMの取り組みを小さく始めて大きく育てるという考え方が一般的
- 2: 対象データの選定
- 具体的に戦略で設定された目的を達成するために「必要な情報とは何か」、そして「その情報を生み出すために必要なマスターデータとは何か」最後に「そのマスターデータがどういった構造や状態でなけれなならないか」の3つの問いに賭けに答えていけば対象のマスターデータも自ずと明確になってくる
- 3: 投資対効果の資産
- リスク
- 投資対効果の試算の際にMDMを活用する業務部門及び、財務指標に対する影響を試算できる財務部門を巻き込んでIT、業務、財務の3つの観点から投資対効果の試算を進めること必要がある
- リスク
- 2: 業務
- 業務の論点では、4つのステップを踏んで業務要件の整理を行うことが一般的。
- 「現状業務の整理」「課題の抽出・定義」「課題の打ち手検討」「あるべき姿の設定」の順番で設定する
- 留意点としてマスタ管理の業務における5W2Hを繰り返し問い続けること
- 業務の論点では、4つのステップを踏んで業務要件の整理を行うことが一般的。
- 3: データガバナンス
- MDMのデータガバナンスに関しては、通常のデータがバンスを踏まえて取り組めば良い
- 立法はマスタデータの管理規約の策定。行政は策定されたマスタの管理規約を現場レベルへ落とし込んで浸透させること。
- 司法はマスタ管理規約の遵守状況を監視するとともに現場からの改善要望を吸い上げてマスタ管理規約の改変を常に行なっていくこと
- 4: 組織
- MDMを一過性の活動で終わらせないために組織として継続的な取り組みが必要
- 「横串の組織設計」が重要
- MDMの活動はシステムを作る側のIT部門の理論ではなくデータとシステムを使う側の業務部門の理論で物事を考えないとうまくいかない
- 5: テクノロジー
- 効果が出やすい顧客、商品マスタなどに初期導入のスコープを絞った上でSaasをフル活用し数ヶ月スパンでMDMきばんを導入するケースが多くなっている
マスターデータ管理の3つのアーキテクチャ
-
1: 分散型MDM
-
2: HUB型MDM
-
3: 集中管理型MDM
- 集中管理型MDMは全社レベルでの正本となるマスターデータ(ゴールデンレコード)を唯一の場所(MDM)で管理し、そのゴールデンレコードを周辺システムと業務に提供する形となる
-
分析型、HUB型、集中管理型の順番で導入の難易度が上がる。どのタイプを採用するか、自社の業務/システムの実態や体力を総合的に分析し、自社の現状を踏まえたメリットデメリットの整理が必要
-
スモールスタートクイックウィンの考えが推奨
- 初めに難易度の低い分析型またはHUB型から初めて、MDM効果を刈り取りながら、人、組織としての経験値権を積み上げながら、段階的に集中管理型を目指した方が成功につながりやすい
データ品質管理
なぜデータ品質管理が重要なのか
- 途中のロジックがいくら優れていても、「garbage in Garbage out」が変えられない鉄則
データ品質とは
- データ品質とは事実(世の中のファクト)をどれだけ正確に表現できるかの尺度。データ品質を図るには6つの主要な基準がある。
-
正確性(Accuracy)
- 正確性とは、現実の世界の物事を正確に表している可動化の尺度
- それを満たしていない例として指名、商品名、住所などが挙げられる
-
正当性(validity)
- 正当性とはあらかじめに定義されている規則(フォーマット、型、範囲)に正しく準拠しているかどうかの尺度
- 問題例として表記揺れ、年齢の欄に0以下の数字が記載されていること
-
適時性(Timeliness)
- 適時性とはデータ利用者が要求する時点での現実を表現できているかの尺度
- 例として、利用者が現時点での住所データを要求しているにもかかわらず、市町村の合併前のデータが提供されると適時性を満たしていないことになる
-
一貫性(Consistency)
- 一貫性とは一つに定義に対して、複数の表現に対して差異がないこと
- 問題例として西暦和暦が混在するケース
-
唯一性(Uniqueness)
- 唯一性とは一意であるべきデータがダブりなく、重複しないことを指す。
-
完全性(Completeness)
- 完全性とはデータ利用者からみて抜け漏れがないことを指す、
- 例えば、業務上で重要な項目の値が漏れたり必須項目にかかわらず、空欄が存在したりするケース
データ品質管理の導入アプローチ
-
データプロファイリング
- データプロファイリングとはデータの健康診断のようにSQL,Pythonなどの言語、Excel、専用のツールを使って統計的な手法でデータのパターンを分析し、データ品質の傾向と特徴を把握する
- カラムの値の分布と値ごとのレコード数と割合
- カラムの値のパターン
- 各カラムの一位性
- 親子関係のあるテーブルの生合成
- センシティブ情報の検出
- キー項目の検出(主キー、複合機の項目)
- データプロファイリングとはデータの健康診断のようにSQL,Pythonなどの言語、Excel、専用のツールを使って統計的な手法でデータのパターンを分析し、データ品質の傾向と特徴を把握する
-
データアセスメント
- データプロファイリングの結果を踏まえて、データアセスメントを進める
- データアセスメントとはデータを客観的に評価(アセスメント)すること
- 大きな流れとして、データ品質の管理の目的を定めた上で対象データにまつわる業務、データオーナーなどを特定していく
- その次にデータ品質におけるルールや基準値を定義した上でルールや基準値を用いて既存データを評価することでデータ品質の現状を把握する
-
データオーナー
- データの所有権を持つもののことであり、データを生み出す組織の管理責任者を指す
- 業務を所管するビジネスプロセスのオーナがーがデータオーナーになるのは適切
- しかし実際問題、IT部門がオーナーになるケースが挙げられる
-
データ品質ルール
- データ品質ルールとはデータ品質の基準(正確性、正当性)をもとに業務、システム上で具体的に定義されたルールを指す
- データ品質の基準値とはデータ品質ルールを満たす基準ととなる値のこと
-
データモニタリング
- データ品質を維持させていくために課題の対策を一回売ったら終わりではなく継続的な取り組みが必要
- 前のステップで定めれらたデータ品質ルールと基準値からデータ品質スコアカードを定義して定期的に品質測定を行いデータ品質が維持されているかを継続的に監視する
- モニタリングの結果が基準の範囲内であればデータの品質レベルが目標をクリックできていると判断できる
- 結果が下回る場合は再び前のステップへ戻って課題の検討対策を行う
-
データ品質管理サイクルの維持
- Plan
- データプロファイリング
- データアセスメント
- 課題の整理検討
- 実行計画策定
- Do
- 業務プロセス変更
- システム実装、変更
- Check
- 新たな課題の追加処置検討
- 追加品質要件への検討
- Action
- データ品質のモニタリング
- データ品質基準の改変
メタデータ管理
- メタデータは5W1Hの情報を網羅的に表す
- Who
- 誰がこのデータのオーナーか
- What
- ビジネス側のデータの定義とは
- Where
- データはどこに保存されるか
- Why - このデータはなぜ重要か
- データを使う目的は
- データはどこに保存されるか
- When
- このデータはいつ生成されたか
- どういう頻度で更新されたか
- このデータはいつまで維持するか
- How
- データソースはどれぐらいあるか
- データソースを使われている周辺システムはどれぐらいあるか
- Who
- またメタデータは3つに分けられる
- ビジネスメタデータ
- テクニカルメタデータ
- オペレーションメタデータ
なぜメタデータ管理が必要か
- メタデータを適切に管理しないと、ありとあらゆる社内のデータに対して「このデータはどういう意味か」「このデータは誰のものか」「このデータはどこから来たのか」という素朴な疑問が生じる
- メタデータを適切に管理できていればデータ利用者が自分の欲しいデータの所在を把握し自らデータへアクセスできるため、業務現場でのデータ利活用が広がる
メタデータ管理の導入アプローチ
ステップ① メタデータ戦略の策定
- メタデータ管理の「現在地」「目的地」および「現在地から目的地への道筋」の3つを中心に問いかけて現在地から将来あるべき姿にどのように導くのかを明確にしていく
ステップ②メタデータ管理の要件定義
ステップ③メタデータアーキテクチャの作成
- 様々なデータソースからインターフェースを分離させ、ユーザーがデータソースを意識しなくとも、メタデータにアクセスできるのはメタデータアーキテクチャの設計思想
- メタデータ管理のアーキテクチャを検討する際にどのパターンが業務システム要件を過不足なく満たしているかを確認すると同時に投資対効果(ROI)の観点が不可欠
- メタデータ管理のアークテクチャフが決まったらそれに沿った形の目てデータ管理ツール(データカタログ)の導入を進めていく。
- カタログはメタデータを一見管理するための様々な機能を提供している
ステップ④メタデータの作成と配信
- 1: メタデータの作成
- データカタログを用いて社内のメタデータをリポジトリに収集し、データ流などを整理した上で、メタデータの統合を行う
- 2: メタデータの配信
- 統合されたメタデータはデータユーザーおよび利用層のアプリケーションなどに配信する
- 現時点で主流となる方法はデータカタログのメタデータポータルにて直接検索、レポート、分析を行うこと
- 加えてデータカタログがDWH、BIなどのシステムと接続し、DWH、BIなどにすでにあるトランザクションデータと繋ぎ合わせてデータセットを作成した上でエンドユーザーに配信するケースも多い
ステップ⑤運用業務の定着化
- メタデータ管理の仕組みを導入した後、メタデータは時間が経つにつれデータのライフサイクルに沿って陳腐化していく
- 従ってデータカタログが常に最新のメタデータの登録簿として最新化され続けるべき
- 業務運用定着化のポイントはIT部門からサポート受けながら業務部門のなかでメタデータ管理を推進するチームを立ち上げること
データセキュリティ
- データセキュリティとはセキュリティポリシーや手順を定義し、実行し、データと情報資産に対して、適切な認証と権限付与を行い、アクセスを制御し監査すること
- データセキュリティの3要素「機密性」「完全性」「可用性」
データセキュリティの4つの分類
- 物理セキュリティ
- 物理セキュリティとは施設や設備、機材などに対する物理的な干渉に備える対策のこと
- 人間が物理セキュリティの中で最もリスクの高い要素として認識するべき
- デバイスセキュリティ
- デバイスセキュリティとはデバイス内の情報が外部に漏れたり、ウイルスに感染したり普段使っているサービスが急に使えなくなったりしないように様々な脅威からデバイスを守るための対策
- 認証セキュリティ
- 認証セキュリティとは認証の仕組みを完全に守るための対策
- 構成要素
- ユーザーID
- パスワード
- 他要素認証
- 通信セキュリティ
- 通信セキュリティとは安全な通信を実現するための対策のこと
- 機密データと規制対象データの基本概念
- 任意のデータに対してそれは機密データか機密データの場合は機密レベルはどのくらいにするか、組織として必ず一意で決められる
- それと比べて規制の場合は一つのデータが複数の規制対象に該当する場合が普通にあるので結果として一つのデータが複数の規制によって制限されることになる
- 機密データ
- 機密データは外部に漏洩すると企業や関係者に不利益が生じるデータのこと
- 規制対象データ
- 規制対象データとは外部の法律、業界基準によっって規制されるデータのこと
データセキュリティ適用の3つのステップ
- セキュリティ要件定義
- セキュリティポリシーの策定
- セキュリティ対策の実施
1: 要件定義
-
組織体制の確立
- データセキュリティの組織を立ち上げ、体制を整えるのが重要なアクション
- そのためにも早い段階で経営層を巻き込むことが大事
- いち早く経営層を巻き込む理由として、企業がどうやってセキュリティリスクに対抗するか特定の部署ではなく前者レベルで意思決定をする必要があるため
- 留意点として外部の力を借りつつも社内に人間が責任意識を持って活動の主体としてポリシーの策定・運用を行う必要がある
-
セキュリティ要件の特定
- 1: ビジネス要件の整理
- 規制と機密性の2軸のマトリックスでデータ利用者のロールを当てはめることで、データセキュリティ要件を明確化できる
- 2: 規制要件の整理
- アプローチとして「対象規制の確認」->「対象データの特定」->「セキュリティポリシーとの紐付け」->「実施済み・未実施要件の整理」
- 特に「実施済み・未実施要件の整理」では社内で該当するセキュリティ対策がすでに実施済みなのかを確認し、未実施部分のみを抽出した上で追加の規制要件を定義する必要がある。
- 規制要件を整理するポイントとして類似した規制要件カテゴライズしてベースラインを定めること
- 規制例の一つの個人情報保護法では個人情報の収集や第三者提供には本人の同意が必要なこと
- 匿名加工処理で処理したデータは一定の条件のもとで本人同意がなくともデータ分析事業者など第三者に提供できるようになった
- 仮名加工情報とは氏名などの特定の個人情報を識別できないように加工を施した情報のこと
- 3: システム要件の整理
- システム要件を整理する際に、すでに満たしているセキュリティ要件に対して新たなビジネス要件とセキュリティ要件を付き合わせてフィットアンドギャップ分析を行う
- フィットアンドギャップ分析とは利用者のニーズに対して適合している点と乖離している点を明らかにすること
- 1: ビジネス要件の整理
2: ポリシーの策定
-
レイヤー1 基本方針
- 基本方針は適切なデータセキュリティを実現するための会社の基本的な姿勢や考え方を示す
- 基本方針例として、「データ資産を守る」「お客様並びに社会の信頼に応える」という内容を明確にした上で「経営者の責任」「社内体制の整備」「従業員の取り組み」「法令及び契約上の要求事項」「違反及び事故への対応」の5の観点から「どのような方向性でセキュリティに取り組めばいいか」に答えている
-
レイヤー2 対策基準
- 対策基準とは基本方針を踏まえて具体的な策定をガイドラインの形までまとめたもの
-
レイヤー3 実施手順
- このステップでは対策基準ごと実施するセキュリティ対策の内容を具体的な手順まで落とし込んんで明文化していく
- 具体的にマニュアル、手順書などの形でデータセキュリティを保つための必要な方法や手段を明記することになる
- 実施手順のさくせていに当たって5W2Hを意識しその目的、対象データ、対象者、対象業務、システム、適用時期、手順、ペナルティを明確に定めてマニュアル、手順書を作成する
3: 対策の実施
- データセキュリティは一過性の活動ではなく、企業や組織の内部的変化、外部からの新たな脅威、新しい法律に施工と改正などの外部的変化に合わせて定期的に見直す必要がある
データセキュリティとデータ利活用のトレードオフ
- 車の車輪のように企業のビジネスモデルの変革(DX)を促すデータ利活用を「攻める」と同時にデータセキュリティが様々な脅威やリスクから企業のデータ資産を守ることも欠かせない
- 重要度の高いビジネス領域を対象にデータ利活用の利便性を重視しつつ、データセキュリティポリシーをどこまで対応すれば良いのかを組織横断で議論し、その判断基準を明確化する必要がある
7 データマネジメント層 組織とヒト層
データマネジメント組織の3つの要素 1:組織文化
- 組織文化が指しているのはデータを最も重要な経営資産とみなし課題解決及び新たな価値創造にデータ利活用する「データ・ドリブン文化」
- 「データ・ドリブン文化」を醸成する目的は、意思決定プロセスの改善、顧客と市場の理解、より優れた製品とサービス業務の創出、業務効率化、コスト削減など多岐にわたる
-
データ・ドリブン文化醸成のポイント1: 経営層が旗振り役
- 企業の経営層が自らデータ・ドリブンな意思決定を行うことは、会社全体がデータ・ドリブンな文化にシフトしていく上で最も重要なこと
- 大事なのは役員自身が役員会などでエグゼクティブレベルの場面でデータ・ドリブン文化の啓蒙活動を行うこと
- ドリブン経営の本質は「ビジネスの定数とは何か、変数とは何か、どの変数を変えれば、結果がどう変わるのか」というビジネス現場に隠れている相関関係をデータで考察すること
データ・ドリブン文化醸成のポイント 2: データ教育プログラムの提供
- 組織文化を醸成するにはデータ利活用の教育プログラムを組織のあらゆるレベルで提供しなければならない
- 経営層、中間管理層、スタッフ層などの異なる組織層に、職務に見合ったデータ教育プログラムを提供しデータリテラシーを上げることで、データに基づく意思決定の目的やメリットを広く理解してもらう必要がある
データ・ドリブン文化醸成のポイント 3: インセンティブの付与
- データを巧みに活用した人がより早い昇進と昇給を享受すれば他の従業員の意識変革とモチベーションアップのきっかけにもなる
データ・ドリブン文化醸成のポイント 4: トップダウンとボトムアップの両立
- 現場の社員がどれほどデータ利活用を浸透さようとそれだけではそれだけではデータ利活用文化の定着が難しい
- データ利活用やデータマネジメントの戦略・方向性の関する大きな決断はトップダウンで下し、現場のニーズや課題はボトムアップで吸い上げる2つの働きが双方向で循環しつつトップダウンとボトムアップの両立を図ることで組織の全ての階層にデータドリブンの文化を浸透させることになる
データマネジメント組織の3つの要素 2: 組織構造
- 組織構造とは組織内の役割、責任、意思決定プロセス、指示系統を含む骨組みのこと
- 型1: 中央集権型
- 型2: 地方分権型
- 型3: ハイブリッド型
- 組織構造の進化論
- 全社レベルまたはDM対象の事業領域に対して現状の指揮構造が中央集権型または地方分権型可を自己評価し自社の組織文化、社風、意思決定プロセスを加味した上で最も実現可能性の高い組織構造からスタートすることを推奨している
- ハードルが低い地方分権型の組織構造からスタートし絶えず組織構造を改良しつつ段階的に中央集権型、ハイブリッド型まで進化させていていく道のり
データマネジメント組織の3つの要素 3:組織体制と登場役者
- 組織体制のレイヤー1: 経営層
- CDOとはデータを土台として企業に変革を起こす際にデータのサイロ化などのデータ課題を解決する「データの番人」であり、全社的な観点からデータ利活用をリードする最高責任者
なぜCDOが必要なのか
-
現場の草の根で生まれたデータ利活用の種火を消さずに、現場の人を強力に支えながら全社横断的に発展させていく司令官がなくてはならない存在
-
組織体制のレイヤー2: 事業部門
- 事業部門に登場する立役者「データ管理者」「データアーキテクト」「データスチュワード」
- IT領域が専門ではない業務部門と、自社業務への理解が足りていないIT部門が混合チームを形成し、役割的に補完しながら活動を進めていくことがポイントとなる
-
組織体制のレイヤー3: データマネジメント横断組織
- レイヤー3は全社横断でデータマネジメントを推進する組織。- CDOの意識決定を支えるCoEという位置付けでデータマネジメントオフィスのようなバーチャル組織の形を取ることが多い
データマネジメント組織を成功に導く3つの要諦
要諦1: 経営層からの関与
- データをビジネスに生かすことができる状態を継続的に維持管理する必要がある
- データマネジメントを各事業部へ落とし込んでいく中で互いの利害関係で衝突し合意形成がうまく行かない場合がしばしばある
- そのような利害衝突を乗り越えて関係者全体の共通利益を最大にするには、経営層がデータマネジメントに深く関与し全体最適の観点から意思決定を行い経営層からその結果を全社レベルで発信していくことが重要
- データマネジメントは一般的に全社レベルで推進していくことが多い。社内の利害関係が異なるステークホルダーを巻き込んで立ち止まらず活動を指針していくには強いリーダーシップをとって旗振り役を果たすキーマンが欠かせない
要諦2: 前向きなチェンジマネジメント
- データマネジメントは今までの企業内の既存業務、システム、データなどに様々に影響をもたらしてデータ・ドリブンな企業へ変革するための、一種のチェンジマネジメントとなる
- 企業にとって利活用の効果が大きいデータ領域(顧客データ、商品データ領域)に焦点を当ててステークホルダー全員が同じ方向を目指せるように目的地を明確に示せるビジョンを書き、それを全員で共有することが大切
要諦3: ステークホルダーの成功
- データマネジメントも例外なく「お客様」から上がってきた要望・相談事項などに耳を傾け「お客様」問題を解決し、「お客さま」を成功させることこそ、データマネジメント組織を成功に導くことになる
必要とされるデータスキルとは
- 「ビジネス力」「データサイエンス力」「データエンジニアリング力」の3つのスキル
- 上記に加えビジネスと専門領域をつなげる「ビジネストランスレーション」というスキル
ビジネストランスレーション
- ビジネストランスレーションを一言でいうとビジネスの目的、事業戦略、及び現場の業務理解を理解した上でデータの専門家とビジネスユーザーを繋いで両者の間に立って問題や解決策のやりとりをサポートできるスキル
- ビジネストランスレーターが必要とされる背景に「データにどのようなビジネス定義があるか」「ビジネス側の課題をどのようにデータに紐付けるか」「どのような目的でデータを活用してビジネスの価値を生み出すのか」を突き詰めないとデータをビジネスに課すことはできない
- データ利活用、データマネジメントの具体的な施策をして全ての業務の現場まで落とし込む必要があるため、データ専門領域と業務現場をつなぐ橋渡し役であるビジネストランスレータが欠かせない
Discussion