🕌

読み合せ会「実践的データ基盤への処方箋」第4回

2022/02/16に公開

過去の読み合せ会

なぜ読み合せ会?という形式をとって開催しているか?も記載してます。

使用する本

https://gihyo.jp/book/2021/978-4-297-12445-8
を使っています

読み合せ会

輪読会ではなく、読み合せ会!

1-9 ユースケースを優先的に検討しツールの整備を逆算する

参加者の意見をまとめてます

  • ユースケースと独自化がジレンマ、お客様は近い未来の目標を見がちなので、後々まで使えるもの・・ってのはなかなか難しい。ビジネスや目標が変わっても柔軟に対応できるようにするにはどうしたものか・・・・
  • Adhocではなく、ルーティン化しているもののユースケース(マート化)はとても価値がある
  • 自分にとって使いやすいツールが必ずしも他の役割を担う人にとってはベストではない
  • 実務ではまず「最初にユースケースを検討する」のがGood
  • 導入後のモニタリングも必要
  • ユースケースのアウトプットに見合う開発や運用を行うべき → 人にもDBにも優しく
  • 5W1Hが必要(データ可視化のストリーテリングと一緒)
  • 基盤構築側の都合のみの基盤は利用されない → あるある
  • 制御する部分と開放する部分の切り分けが難しい
  • 利用者の要望100%で作った場合であっても必ずしもうまくいかないことも多い。

1-10 データの調査コストを減らすためにメタデータを活用する

参加者の意見をまとめてます

  • メタデータは本当に難しい、データカタログを機能させるには、ついでに出来てるとか適切なインセンティブとかないと
  • メタデータがないと困るのは、データ利用者(not データ生成者)
  • メタデータがあることで大幅に調査時間を削減することができる
  • メタデータとはなんぞや?何を含む?
  • メタデータには、データ定義書を「内包」する。それ以外に、以下のものも含まれる
    • どこから来たか?
    • どの部署がよく利用している?
    • 生成時間
  • データカタログをワークさせるには、Googleみたいな「検索」で探せるのが良さそう
  • メタデータに説明(ノウハウ、注意点)を追加するのは、データ利用者側もしたらいいかも
  • 個人情報の有無も重要なメタデータ ※ギリギリのラインではなく安全なラインで扱いたい

シリーズ

Discussion