Two ways of measuring data team value の個人的まとめ
初めに
Two ways of measuring data team valueのメモ
☆セマンティックレイヤー
Analytics Engineering Podcastのエピソード41で、DrewとTransformの共同創設者であるNick Handelが、2社の新しい組み合わせから、セマンティックレイヤーに望まれていることについて話した。
☆情報のアクセスを民主化する
Data initiatives
は情報のアクセスを民主化することに焦点を当てすぎており、ビジネスインパクトを十分に考慮していない。情報のアクセスを民主化するならば、売上に対して非常に小さいものである必要がある
指標① G&A
企業が今どきの開発環境を合理的に運用するためには、いくらかの共通のデータインフラが必要ではあるが、それをG&A(General and Administrative)に組み入れチームへの支出を可能な限り減らすべき。
G&A部門は仕事の効率性を評価するものであり、(例として)'売上比率'はある会社との比較を可能とする。また良い
ものを良い
と定義するために必要なもの。
指標② ROI
営業・マーケッターなどはROIに近い指標をに基づいて評価される。データ界隈でも似たような指標をたてることができるはず。
データ機能(データインフラと全社的な使用可能性)は実現可能な最小限であるべき。
例)
→ G&Aの支出が売上の10~12%
→ データ支出は売上の1%ほど
☆dbtの再構想
dbtを1つのsyntaxで書くか、複数のものを使用するか。(SQLGlot, PRQL, Malloyなど)
→ ユーザーに多くの選択肢を許可することを検討する場合、それが一貫性のあるユーザー体験を損なわないようにする必要
dbt を jQuery ( 2010 年代半ばまでの事実上の Web フレームワーク)と比較すると、既視感が得られます。どちらのフレームワークも、バージョン管理やモジュラー コードなどのベスト プラクティスを採用することで、ユーザーをソフトウェア エンジニアにスキルアップさせました。
☆アナリティクスエンジニアリング2023年レポート
北米のアナリティクスエンジニアは、当社のサンプルではデータエンジニアよりも多くを稼いでいます。
☆AI / チャットボット / 大規模言語モデル
AI / チャットボット / 大規模言語モデルの主要な人物たちは、非常に近い将来(<12ヶ月)にこれらのモデルの性能向上を自信を持って予測している。「オープンマインドを保ち、性能特性が急速に変化していること」を肝に銘じておく必要がある。
Discussion