Open11

DataOpsについて

YuichiYuichi

ガートナー

https://www.gartner.com/en/information-technology/glossary/dataops

DataOps は、組織全体のデータ管理者とデータ利用者間のデータ フローの通信、統合、自動化の改善に焦点を当てた共同的なデータ管理手法です。

  • データ管理者と利用者を結ぶ様々な要素に注目したデータ管理手法で、データによる価値を迅速に提供することを目的にしている。
YuichiYuichi

データ活用の障壁をDataOpsで回避する【第1回】

https://dcross.impress.co.jp/docs/column/column20201007/001806.html

「DataOps」とは、事業を持続的に発展および貢献させるためにデータ(Data)と業務(Operations)を結びつけるというコンセプトを指す言葉である。米Gartnerが2018年7月に公開したハイプサイクルで黎明期にポジショニングされたばかりの新しい概念だ

https://dcross.impress.co.jp/docs/column/column20201007/001806-2.html

DataOpsのポイントは、データを届ける側の部門(Data)と、データを活用する側の部門(Ops)が協働すること
データ活用には、大きく分けて2種類のプロセスがある

表1:データ品質の評価観点(日鉄ソリューションズが作成)

https://dcross.impress.co.jp/docs/column/column20201007/001947.html

データ活用プロジェクトを進める上で参考になるフレームワークの1つに「CRISP-DM(CRoss-Industry Standard Process for Data Mining)」がある。CRISP-DMフレームワークでは、データ活用のプロセスを(1)ビジネスの理解、(2)データの理解、(3)データの準備、(4)モデル作成、(5)評価、(6)展開との6つのフェーズに分けて定義する。

https://dcross.impress.co.jp/docs/column/column20201007/002019.html
https://dcross.impress.co.jp/docs/column/column20201007/002124.html

データ活用を定着させるシナリオは、企業のデータ活用ステージ(成熟度)によって異なる。成熟度を測る統一された指標は存在しないものの、本稿では次の4つのステージに分けて整理してみる。(1)取り組みなし、(2)価値の確認、(3)組織的な強化、(4)拡大・成長サイクルの構築である

YuichiYuichi

Azure データ分析基盤における DataOps の実践方法を考えてみる
https://tech.dentsusoken.com/entry/2021/12/09/azure_dataops

スモールスタートで徐々に拡張していきたいというご要望
↑目的に対する実現手段という意味で個人的にはむしろ DataOps の方がマッチするのではと考えています。

YuichiYuichi

DataOps - データに対する投資対効果の変革をもたらす新しいアプローチ
https://www.cognite.com/ja-jp/blog/dataops-transformative-new-approach

データの活用を目指すことと何が違うのか
テクノロジーを活用し、データを信頼して活用できる状態を常に保ち、ビジネス側はそのデータを活用して業務や意思決定を行い続けることを目指しているのです。

YuichiYuichi

データとアナリティクスのビジネス価値を増幅するDataOps
https://atmarkit.itmedia.co.jp/ait/articles/2104/09/news004.html

「DataOpsのポイントは、人々のデータコラボレーションの在り方や、組織内でのデータの使い方を変えることにある」と、Gartnerのアナリストでディスティングイッシュト バイスプレジデントのテッド・フリードマン(Ted Friedman)氏は指摘する。

YuichiYuichi

DataOpsとはコラボレーション指向、部門の枠を超えたアナリティクス
https://www.cio.com/article/475028/dataopsとはコラボレーション指向、部門の枠を超えた.html

DataOps Manifestoによると、DataOpsチームは機能するアナリティクスを重視し、データアナリティクスによってもたらされる分析情報でそのパフォーマンスを測定します。

https://dataopsmanifesto.org/en/

  • DataOpsチームの主な専門分野
  • データベース
    • 統合
    • データからプロセスへのオーケストレーション
    • データポリシーのデプロイ
      - データとモデルの統合
      データセキュリティとプライバシー管理

知らないツールいっぱい
DataOpsツール
以下は、DataOpsの代表的なツールです。

  • Census:信頼できる唯一の情報源(データウェアハウスなど)から、CRMや広告プラットフォームなどの最先端のシステムにデータを同期するプロセスであるリバースETLに特化した運用分析プラットフォーム
  • Databricks Lakehouse Platform:データウェアハウスとAIのユースケースを統合するデータ管理プラットフォーム
  • Datafold:データ品質の問題を検出し、修正するためのデータ品質プラットフォーム
  • DataKitchen:マルチツール、マルチ環境データパイプラインをエンドツーエンドでオーケストレーションするデータ観測・自動化プラットフォーム
  • Dbt:データパイプラインを作成するためのデータ変換ツール
  • Tengu:データとパイプラインを管理するDataOpsオーケストレーション プラットフォーム
YuichiYuichi

DataOpsとは?注目されている背景やメリット、実践のステップを解説
https://blog.trocco.io/glossary/data-ops?utm_source=google&utm_medium=display&utm_campaign=pmax&utm_term=2023_08&gad_source=1&gclid=CjwKCAjwtqmwBhBVEiwAL-WAYdIU5M06hGK7Cf_FzV0RHLlD8vSGF1Q4Cg1FkaV_5UkPSDEALfGiBBoC9rUQAvD_BwE

  • DataOpsを実践すること
  • データ品質が向上する
    • データ活用のプロセスを効率化できる
  • DataOpsを取り組む際のプロセスを以下の3つのステップ
    • 組織のデータ活用の状況の整理と目標設定
    • データ活用のプロセスの改善と自動化
    • 継続的な学習とフィードバックループの確立
YuichiYuichi

DataOps
https://en.wikipedia.org/wiki/DataOps

DataOps は、データに対する統合されたプロセス指向の視点と、自動化およびアジャイル ソフトウェア エンジニアリングの手法を組み合わせた一連のプラクティス、プロセス、テクノロジーであり、品質、速度、コラボレーションを向上させ、データ分析分野での継続的改善の文化を促進します。

  • なんだかんだwikiが一番わかりやすく説明しているかも
YuichiYuichi

DevOpsの3つの道になぞらえてDataOpsの3つの道について語ってみる
https://qiita.com/moritata9/items/77ac04ed3910739aa113

DataOpsを阻む3つの壁

  • データの透明性の壁  :どこにどんなデータがあり、どのデータがどのビジネスに使われているのかわからない
  • データのアジリティの壁:データ利活用のアイディアが思い浮かんでもデータ入手に時間がかかる
  • データのサイロ化の壁 :各部門で個別バラバラに管理されてきたデータは部門横断での利活用に使えない