データ応用達成度によるデータ活用レベル
この記事はブログに書いた記事のコピーです。zenn.devの使い勝手を知りたいのでお試しで投稿しています。
イカよろしくー
この記事はビジネスにおけるデータ応用の達成度によるデータ活用レベルを自分なりに考えてみたもの。完全に個人的な感覚。
あんまり推敲していないんで、そのうち意味の変わらない範囲で文章を直すと思います。
概要
全部でtier5 ~ tier0の6階層にわけてみた。数値が大きいほど下の階層で数値が下がるほど高いレベルでデータを応用している状態。あくまで個人の感想であり、伝聞で聞いた話とかも総合して書いてるのでそこらへんはいい感じによろしく。
データ活用レベル
tier5: データによる成果の観測
シンプルな企業におけるデータ活用はこのレベル。現預金や債権債務のような会計データや営業成績など事業や業務の結果が集計され観測している状態。
この状態の企業ではデータは意思決定のために使われるというよりは結果を観測するために使われれている。観測しているデータは必要だから見ているという状態に限られており、意思決定の多くは勘や経験によるもの。データドリブンにアクションを行うというカルチャーはない。
tier4: 単発的なデータ分析による意思決定
データ活用を意識的に着手した企業が最初に到達する階層。サービス開発や広告配信など現場でデータを用いた意思決定が単発的に実施されている状態。
この状態ではPdMやマーケティングなど現場がデータを用いて現状把握やアクションの効果検証などが実施されている。単発的な分析としてSQLを書いてデータ抽出したりスプレッドシートを用いた分析が主。この状態では草の根的な活動や片手間ということが多く、分析リソースは十分ではないと思う。
重要な点はデータドリブンなカルチャー浸透し始めているだろうという点。少なくともデータを分析してアクションを決定することがスモールにスタートしている。組織的であったり長期的にデータを中心においた状態ではないが、データを用いてアクションを決める・計測するというデータドリブンの萌芽が見える。
tier3: 継続的なデータの監視と分析
tier4では単発的なデータ分析を行っていたが、それが継続的に行われ活用されている状態。継続的な数値の監視・分析からアクションをおこなう。
この状態ではチームなどの組織的な活動としてデータを用いて状況把握や効果検証をおこなっている。監視すべきデータを定期的に取得し複数のメンバーで観察・検証をおこなう。tier4ではショットで分析をおこなっていたがtier3では継続性がありデータの知見が貯まるという良い循環が生まれる。また、チームでデータを活用する状態にあり分析を行うリソースも明確に工数として確保されているはず。
tier3はデータドリブンなカルチャーがtier4に比べて広まり、データを活用するということが組織的な活動になっている。どのデータを継続的に監視するのかチームで認識を揃えKPIを設定してアクションしている。tier3へ到達しているならばデータドリブンな経営や開発を行っていると自信を持って良いはず。
tier2: 単発の予測や開発
このステージは数値を見るだけでなく統計学や機械学習、数理モデルなどを現場や開発に用いている状態。プリミティブな例では広告やUIのA/Bテストや数理モデルを用いた需要予測などがあり、開発としては機械学習を用いたサービスの提供など。
tier3まではデータを数値で見ることに終始していたが、ここから先の階層では数学やアルゴリズムを応用することが求められる。そのため人材のスキルセットも統計学や機械学習などtier3までとは大きく変わってくる。
tier2ではこれらの応用が単発的に行われている。組織的にこれらの技術を用いることへ継続的かつ十分な投資が行われておらず草の根活動的に行われていたり味見として実施されている。多くの企業がこのステージへ突撃してくるけどPoCで失敗してもとに戻るケースが多い。そもそもそういう企業はtier3に到達してないことが多いのでさもありなん。
tier1: 継続的な予測や開発体制
このステージへ到達した企業は既存の技術を活用して様々なプロセスや事象を自動化・効率化・精緻化している状態。先進的なテックカンパニーとしてデータ活用の到達点。
機械学習や統計モデルが自社サービスや業務に組み込まれている状態で、いわゆるAI活用と聞いて多くの人が思い浮かべるようなものが実装されている。継続的な投資がおこなれており、これらの機能やサービスが優位性を産むポイントの1つとなっているはず。
「DX推進部」であったり「AI活用チーム」のようなタスクフォースが組織され開発を行っていても、その開発が継続的でなければまだまだtier2。tier1の重要な点はそれら技術を継続的に応用することへ組織的な理解と投資であり、カルチャーとして根付いていること。なんでもやるより継続するのが大変なんです。
tier0: 技術発展による自動化の拡大
このステージは既存の技術に限らず、新しい技術を研究・開発をとおして「できること」を広げている状態。研究から社会実装という長いスパンでデータ活用を実践できているとtier0。具体例でいえばGoogleなど技術レベルの高いテックカンパニーや研究開発に特化したスタートアップとかかな。
このステージへ到達した企業は技術的に不可能であったことを可能にしていく研究ができる企業。自社内に独自の研究機関が存在しアカデミックの世界でも存在感があるはず。
tier0に到達する企業は統計学や機械学習を高いレベルで開発することで優位性を得られると確信していて、データからアクションを決定したり必要に応じて機械学習をサービスに適用することは当然のように選択肢として行っていると思う。いかんせん、私はそういう会社にいたことがないけど、たぶんそう。
おもったこと
思いつきで書き始めたけど気がついたことが2点
「挑戦」と「継続」が分水嶺
主にtier3までのデータドリブンとtier2以上の統計学・機械学習の応用というステップにわけているんだけど、その中の階層の分離は挑戦と継続でわかれてる。データを用いた新しいことに挑戦して草の根で動き始めている段階と、挑戦の実績から継続し組織的に投資され認められている状態の2つ。
よくPoCやるだけで企画がポシャったり、リリースしたけど誰もイテレーションしないみたいなケースってよく見かけるけど、それってやっぱり階層としては分けるべき。で、そういう継続できていないケースって組織的な動きになっていないのがだいたいは原因で、組織的な動きになっておらず投資され続けていないのはやっぱり大事な課題だと思う。
ステージを飛ばすことはできない
tier1にちょっと書いたんだけど、前のステージが達成されていない企業が飛び級することはできない。少なくとも継続できないのでそこから更に進むことはできなくなる。つまりデータドリブンな組織でないなら機械学習や統計学を応用することはできない。
これは至極当然で、機械学習とか統計学とかいわゆるデータサイエンスという領域に手を出すにはそもそもデータが揃っている必要があるし、それを継続的に投資するには効果を測定するためにデータ分析する環境がないとやれない。だからデータドリブンな環境があってこそのデータサイエンスの適用。逆はありえない。
おわりに
まずはデータドリブンな組織作りを挑戦する、そして実績を積んで定着させる。そのあとに統計学や機械学習に挑戦する。という流れが大事だと思う。とはいえ、上位のステージにいるから偉いというわけではなく、会社のシチュエーションに応じて最適な状態を選ぶことが大事だと思う。
もちろん、完全にこのステージごとに区切る必要はなくてうまくいっている領域で先んじて高度な技術に挑戦するのはありよりのあり。そもそも、今回はレベルを分けてみたけど実際は1つの直線上にあるもので明確にわかれることはない。
ツッコミとかご意見ありましたらTwitterなどへコメントいただけたら幸いです。
Discussion