🗂️

メダリオンアーキテクチャとは?超概要

に公開

はじめに

otot_devです。
以前 BI・BA ツールの新規開発に携わることがあり、「ゴールド、シルバー、ブロンズ」にレイヤーを分けて管理するアーキテクチャがあったはずだと思い、思い出しついでに備忘録を残そうと思います。

メダリオンアーキテクチャ(Medallion Architecture)

メダリオンアーキテクチャとは、データを効率的に管理・活用するためのアーキテクチャです。
この記事では、それぞれのレイヤーが何をしているのか、その概要に焦点を当てていこうと思います。

ブロンズレイヤー(Bronze Layer)

  • 何をするレイヤーか
    データを「そのまま」保存する層。
    センサーデータやログなど、加工されていない生の情報がここに集まる。
  • 目的
    元データをそのまま保管し、完全性と再現性を確保する。
    • Web アクセスログ
    • センサーからのリアルタイムデータ
    • 外部システムから取得した CSV ファイル

シルバーレイヤー(Silver Layer)

  • 何をするレイヤーか
    ブロンズの生データを、わかりやすく・使いやすく整える層。
    不要なデータを除去し、複数のデータを結びつける。
  • 目的
    分析や活用のために、信頼性の高いデータを作成する。
    • 顧客情報と注文履歴を結合する
    • 不要なカラムや重複行を削除する
    • フォーマットやデータ型を統一する

ゴールドレイヤー(Gold Layer)

  • 何をするレイヤーか
    ビジネスでの意思決定やレポートにすぐ使えるように、必要な指標や集計結果をまとめたデータを置く層。
  • 目的
    実務や分析で直接活用できる、価値の高いデータを提供する。
    • 月ごとの売上推移
    • 顧客セグメントごとの LTV(顧客生涯価値)
    • ダッシュボードに表示する KPI データ

なぜこのように分けるのか?

  • データの加工ステップを明確にすることで、品質を保ちやすくなります。
  • 目的ごとに適切なデータを選べるため、無駄な処理を減らせます
  • チームで作業する場合も、役割分担や再利用がしやすくなります。

まとめ

レイヤー 内容 目的
ブロンズ 生データ 完全な元データを保管
シルバー 整形・正規化 分析しやすい形に加工
ゴールド 集計・分析用 実務で使える状態にする

参考記事

https://zenn.dev/yyteam/articles/medallion-lakehouse-nyc
https://zenn.dev/penginpenguin/articles/741bf19ea03a5f
https://zenn.dev/ritoru/articles/c6a5b1888adf3e
https://zenn.dev/headwaters/articles/36fee218f0bce4

GitHubで編集を提案

Discussion