🎉

データ分析におけるナレッジ体系化の計画書

2021/01/30に公開

はじめに

日本のDX推進を行うためのベースとなるデータ分析領域における知識を体系化するプロジェクトを発足します。基本的な情報については、パブリックに公開を行う方針とします。本ページは、随時、更新を行います。

私はデータ分析基盤、および、データ分析システムの設計・開発・運用におけるコンサルティングを実施しているのですが、日本におけるデータ分析方法が成熟しておらず、DX推進の妨げになっていると考えてます。データ分析方法が成熟することが私のビジネス拡大につながるため、方法の整理を実施することとしました。

なお、私の考えは少ない経験に基づいたものであり、統計的情報に裏付けを実施していないことに注意してください。

背景

データレイクという概念を組み込んだデータ分析基盤を構築することが提唱されているが、日本においては従来のDWH中心にしたデータ分析基盤を構築しているなど、データ分析の方法論が成熟していない状況がある。適切な方法を検討せずにデータ分析プロジェクトを推進されることで、データ分析システムのサイロ化や拡張が困難な状況となっている。

日本のシステム導入方法が企業の全体最適化を考慮されていないことを実感することがあった。あるERPを含めたデータ分析システム構築プロジェクトに携わった際のことである。日本からERP導入の説明を行ったところ、業務の全体像を整理したプロセスマップを提示された上でどの業務を改善するのかを質問されたが、適切な回答を実施できなかった。回答ができなかった要因としては、導入するシステムの業務領域の範囲でしか検討を進めていなかったことにある。

図1. プロセスマップのサンプル

日本におけるデータ分析基盤が海外と異なる状況に遭遇した。海外で開催されているクラウドへの移行に関する研修を受講した際に、Hadoopで運用しているシステムの移行を検討している会社が多くあるとの話を聞いた。数年前の状況として、日本においては商用ライセンスのDWHが導入されている間に、海外ではHadoopも含めたデータレイクが導入されているという状況の違いに驚いた。

海外の方法論が絶対的に正しく即座に反映すべきとは考えていないが、データ分析というものに対して現状の把握と将来の方針について真剣に考える必要がある。

目的

下記の情報を整理して公開を行い、適切な情報発信を行う。特に、ITに教育を実施している方やデータ分析コミュニティに対して、ナレッジ共有を行うこととする。

  • データ分析プロジェクト標準
  • データ分析基盤のシステムデザイン
  • データ分析アプリケーションのデザイン
  • ソフトウェアにおける開発手法

また、下記についても、可能な限り整理を実施する。

  • データマネジメント

成果物の一例

データ分析基盤の検討方法として、下記の記事を投稿している。各コンポーネントの細かい要件も記載しており、本概念に基づきコンサルティングを実施している。

Discussion