🐕

# 生産技術マンが「大規模データ管理」を読む理由:「とりあえずDBは辞めたい」

に公開

なぜこの本を手に取ったのか

製造業で働いていると、最近やたらと「データ活用」という言葉を聞くようになりました。新しい工場を作る時も、設備導入の時も、必ずと言っていいほどデータ分析の話が出てきます。まぁそりゃ分かるけどさって感じなんですよ。

で、今回大きな再編があるので今までより、「データ活用」をよりよくしようという話があったんです。
ただ、気になったのは「とりあえずDBを作ればいいんじゃない?」という発想でした。

以前、研究室の先輩が大規模データ分析してるっていうんでちょっと話聞いてみたら、こういうツール使ってるよと紹介されて、調べてみるとDBってよりはファイル指向なのか?ってところに気づきました。で、現代のモダンな管理ってどうなってんだろうと思ってました。

そんな時に出会ったのが『大規模データ管理 第2版 ―データ管理と活用のためのモダンなデータアーキテクチャパターン』という本です。タイトルからして、まさに今知りたいことが書いてありそうでした。

この本について

この本は、Piethein Strengholt氏による"Data Management at Scale, 2nd Edition"の日本語版です。訳者まえがきによると、この本の特徴は以下の通りです:

実践的なアプローチ

企業がデータを効率的に管理し、その潜在的な価値を最大限に引き出すための実践的なガイドラインを提供しています。本書は、特定のテクノロジーやソフトウェアの使い方を紹介するのではなく、データ管理や活用の基礎となる思想や戦略に重点を置いています。

これは良いですね。製造業の現場では、特定のツールの使い方より、根本的な考え方を理解したいところです。

現代のデータ課題への対応

データが「21世紀の石油」と呼ばれる現代において、スマートフォンやIoTデバイスの普及、企業のデジタル化の加速により、前例のない量や種類のデータが生成され利用できるようになっています。

製造業でもIoTデバイスが増えてきているので、まさにタイムリーな内容です。

従来手法の限界を指摘

現行のデータ管理アーキテクチャでは、将来の大規模データ管理というニーズに対応できないことについて論じています。その上で、大規模データ管理と活用を実現するために、さまざまなアーキテクチャパターンを紹介していきます。

これがまさに「とりあえずDB」では通用しない理由を説明してくれそうです。

組織変革への言及

技術的な内容と同時に、企業全体でのデータ駆動カルチャーへの移行を進めるための戦略や方針についても掘り下げられています。

技術だけでなく、組織の話も含まれているのは製造業にとって重要なポイントです。組織変えるのが一番大変そうなので実現できるかはちょっと不安ですが。

「はじめに」を読んで感じた衝撃

この本について

著者の実体験から生まれた本

この本の「まえがき」を読むと、LinkedInでのリアルな課題解決体験が書かれています。

困っていたこと:

LinkedInのデータは、24時間休むことなく生成されています。しかし、私がLinkedInに入社した当時は、毎日の終わりに時間を要する大規模なバッチ式のデータダンプを行い、自家製のデータフィードを利用した単純な検索機能に頼っていました。LinkedInのデータを活用するためのインフラストラクチャーは、もう限界を迎えていました。

これって製造業でもありがちな話ですよね。日次でデータをまとめて処理する従来のやり方が限界に来ているという。ただ製造業なので一部上記のやり方でも可能なのか?という気はします。

本書が提供するもの

本書でPiethein氏が提供してくれるものは、データを単に単独のデータベースやアプリケーションで管理する方法ではありません。今日のテクノロジーランドスケープを構成する、データベースや、アプリケーション、マイクロサービス、ストレージレイヤー、そのほかあらゆる種類のソフトウェアを駆使した、包括的なデータ管理戦略を提供してくれています。

もう何書いているかわからん。って自分で笑っちゃいました。ただ、色んなソフトウェアを駆使しようという発想は読み取れたので、そこでなぜそれを使うのかをしっかりと認識しなければいけないなと思ってます。

知らない世界がこんなにあった

「はじめに」を読んだだけで、自分がいかに無知だったかを思い知らされました。

データメッシュデータファブリックという概念が出てきた時点で「初めて聞いたな」という状態。これらが「新しい概念を企業が理解するのは困難」と書いてあって、まさに自分のことを言われているようでした。

さらに、ドメイン駆動設計なんて言葉も出てきて「よくわからんな」というのが正直な感想。製造業の現場にいると、こういう概念に触れる機会がほとんどないんですよね。

パラダイムシフトへの困惑

特に困惑したのが、データ管理のアプローチが大きく変わってきているという話です。

従来の中央集権的なデータベース管理から、分散型のアーキテクチャへと移行しているらしいのですが、その具体的なイメージがまだ掴めていません。

期待できそうな章たち

一方で、各章の説明を読んでいると「これは面白そう」「これは使えそう」と思える部分もありました。

9章:メタデータ管理

「メタデータの使い方、重要性、民主化がもたらす効果を考察」とあって、これは興味あると感じました。製造業でも設備データや品質データの意味を管理するのは重要そうです。結局、問題の解決をしたとて、それがメール・Word・Exelだったり、そのデータと紐づくってことがあんまりないんですよね

11章:データを価値に変える

「データを価値に変えるプロセス」について説明されているようで、ビジネス的な価値ってことかなと期待しています。まさに製造業で求められているのはこの部分ですよね。ただ、これが一番難しいんですよね。現場に近いところなんで、とりあえず生産指標をなんとか達成できればいいに終始しがちというか

10章:分散データ管理

「分散している多様なデータ資産において、マスターデータ管理(MDM)を用いてデータの一貫性を維持する」とあって、一貫性?という状態。

この読書シリーズについて

この本は12章構成になっており、それぞれが独立したテーマを扱っています。製造業の現場にいる私の視点から、各章を読んで学んだことや疑問に思ったことを記事にしていこうと思います。

予定している記事

「大規模データ管理」各章概要と主要トピック

本書は12章構成で、各章が扱う内容と主要なトピックを以下にまとめました。

主要トピック一覧表

本書では以下の12の主要テーマが章をまたいで扱われています:

トピック 主要章 関連章
データ管理 1章 -
データ戦略 1,2,3章 12章
データアーキテクチャ 2,3章 7章
データ統合 4,5,6,7章 -
データモデリング 4,7章 9章
データガバナンス 8章 -
データセキュリティ 8章 -
データ品質 4章 -
メタデータ管理 9章 -
MDM 8章 -
ビジネスインテリジェンス 11章 -
アドバンストアナリティクス 11章 -
エンタープライズアーキテクチャ 7,12章 -

各章の詳細説明

1章:データ管理とデータ戦略の基礎

内容: データ管理とはなにか、データ管理はどのように変化しているのか、デジタルトランスフォーメーションにどのような影響を与えるのか、その動向を説明します。また、近年のこの分野の状況を分析し、データ戦略を策定するためのガイダンスを示します。
https://zenn.dev/panda4649/articles/15af6b162cced4
主要トピック: データ管理、データ戦略

2章:大規模データ管理の方法論

内容: 大規模なデータランドスケープをデータドメインを使って管理するための方法論として、ドメイン駆動設計とビジネスアーキテクチャを紹介します。

主要トピック: データ戦略、データアーキテクチャ

3章:データアーキテクチャの構造化

内容: データアーキテクチャを構造化し、データドメインと連携させる方法として、トポロジーとデータランディングゾーンを取り上げます。

主要トピック: データ戦略、データアーキテクチャ

データ流通関連(4章〜7章)

4章:データプロダクトとCQRS

内容: データプロダクトや、CQRS(Command Query Responsibility Segregation、コマンドクエリ責務分離)、原則に着目し、ソリューション設計の例を紹介します。

主要トピック: データ統合、データモデリング、データ品質

5章:API管理

内容: API管理について詳しく説明します。

主要トピック: データ統合

6章:イベントと通知の管理

内容: イベントと通知の管理について説明します。

主要トピック: データ統合

7章:統合とまとめ

内容: すべてを統合したまとめです。アーキテクチャについてのガイダンスや経験を補足します。

主要トピック: データ統合、データモデリング、エンタープライズアーキテクチャ

高度なデータ管理(8章〜12章)

8章:データガバナンスとセキュリティ

内容: 変化の激しい時代にあっても、長期的に持続可能で実用的な方法でデータガバナンスとセキュリティを実現する方法について検討します。

主要トピック: データガバナンス、データセキュリティ、MDM

9章:メタデータ管理

内容: メタデータの使い方、重要性、民主化がもたらす効果を考察します。

主要トピック: メタデータ管理、データモデリング

10章:マスターデータ管理

内容: 分散している多様なデータ資産において、マスターデータ管理(MDM)を用いてデータの一貫性を維持するためのガイダンスを提供します。

主要トピック: (主要トピックの記載なし)

11章:データの価値化

内容: データを価値に変えるプロセスについて取り上げます。

主要トピック: ビジネスインテリジェンス、アドバンストアナリティクス

12章:将来像とまとめ

内容: メタデータを活用した事例と、データ管理とエンタープライズアーキテクチャの将来像について述べます。

主要トピック: データ戦略、エンタープライズアーキテクチャ

製造業目線での読み方

技術書は往々にして抽象的で理解しにくいものですが、この本は「実践的なガイダンス」を重視しているようです。私も製造業の現場で実際に使えるかどうかという視点を大切にしながら読み進めていきます。

専門用語でわからないところは正直に「わからない」と書き、新しい発見は「へー、そうなんだ」という素直な反応も含めて記録していくつもりです。

同じように製造業でデータ活用に興味を持っている方や、「とりあえずDB」から一歩先に進みたい方の参考になれば幸いです。


Discussion