🦁

Two ways of measuring data team value の個人的まとめ

2023/03/13に公開

初めに

Two ways of measuring data team valueのメモ

Analytics Engineering Podcastのエピソード41で、DrewとTransformの共同創設者であるNick Handelが、2社の新しい組み合わせから、セマンティックレイヤーに望まれていることについて話した。

Data initiatives は情報のアクセスを民主化することに焦点を当てすぎており、ビジネスインパクトを十分に考慮していない。情報のアクセスを民主化するならば、売上に対して非常に小さいものである必要がある

企業が今どきの開発環境を合理的に運用するためには、いくらかの共通のデータインフラが必要ではあるが、それをG&A(General and Administrative)に組み入れチームへの支出を可能な限り減らすべき。

G&A部門は仕事の効率性を評価するものであり、(例として)'売上比率'はある会社との比較を可能とする。また良いものを良いと定義するために必要なもの。

営業・マーケッターなどはROIに近い指標をに基づいて評価される。データ界隈でも似たような指標をたてることができるはず。

データ機能(データインフラと全社的な使用可能性)は実現可能な最小限であるべき。

例)
→ G&Aの支出が売上の10~12%
→ データ支出は売上の1%ほど

dbtを1つのsyntaxで書くか、複数のものを使用するか。(SQLGlot, PRQL, Malloyなど)

→ ユーザーに多くの選択肢を許可することを検討する場合、それが一貫性のあるユーザー体験を損なわないようにする必要

dbt を jQuery ( 2010 年代半ばまでの事実上の Web フレームワーク)と比較すると、既視感が得られます。どちらのフレームワークも、バージョン管理やモジュラーコードなどのベストプラクティスを採用することで、ユーザーをソフトウェアエンジニアにスキルアップさせました。

北米のアナリティクスエンジニアは、当社のサンプルではデータエンジニアよりも多くを稼いでいます。

AI / チャットボット / 大規模言語モデルの主要な人物たちは、非常に近い将来（<12ヶ月）にこれらのモデルの性能向上を自信を持って予測している。「オープンマインドを保ち、性能特性が急速に変化していること」を肝に銘じておく必要がある。