❄️

クロスクラウドにおけるSnowflakeデータシェアリングの実装手法(24年11月版)

2024/11/05に公開

クロスクラウドでのデータシェアリング実装

はじめに

2024年9月に開催されたSnowflake World Tour Tokyoで、CCCMKホールディングスはクロスクラウドでのデータ共有に関する取り組みを発表させていただきました。

設計は23年より始まり、データ連携等が最後まで決まりませんでしたが、最終的に24年4月にローンチしたシステム構成を以下の記事で紹介させていただきました。

https://zenn.dev/taro_cccmkhd/articles/387797fdae371e

さて、この記事を掲載したところ、今はListing機能が実装されてるよ!というご指摘を前田さんから頂きました。(感謝!)
前回の記事で末文に注釈入れた通りになりまして、早速最新機能を元に構成案を見直ししてみようと思います。

ついでに前回の記事を23年版に修正・・

実装の全体像


笑えるぐらい超シンプル!
※ELT関連は目的に応じて選択(GA機能優先)

Listing機能について

クロスクラウドデータシェアの実装は、今後はListing機能でいいんじゃないか??と思ったのですが、改めて仕様面の整理をしようと思いました。
また全然話題に上がらないData Exchangeについてもついでに比較

listing / Data Sharing/ Data Exchange の機能比較

ざっくりまとめ

1. 基本特徴比較

特徴 プライベートリスティング 直接データ共有 データ交換
主な用途 特定コンシューマーとの共有 1対1のデータ共有 特定グループ内でのデータハブ形成
対象ユーザー 個別の取引先 単一の取引先 招待制のメンバーグループ
機能利用制限 なし なし 要Snowflakeサポートへの申請

Data Exchangeは、サポートに申請が要るのか。。
Data SharingやListingより、Data Exchangeが必要なケースがイマイチ分かんなかった
プライベートリスティングはマーケットプレイスを介さないので、ほんとにData Sharingの上位互換

2. 技術的特徴

機能 プライベートリスティング 直接データ共有 データ交換
データ容量制限 10TB 制限なし 制限なし
クロスリージョン 自動レプリケーション対応 手動設定 手動設定
オブジェクト制限 特定タイプのみ なし なし

Listingは容量制限というか、クロスクラウドのレプリケーションの上限値があるようだけど、
これはサポートに言えば制限を増やすことは出来るみたい。
というかでかいDBを誤ってレプリしちゃって、コスト事故起こさないためのセーフティネットだろうな。

3. 管理機能

機能 プライベートリスティング 直接データ共有 データ交換
使用状況モニタリング Provider Studio 個別確認 交換管理者機能で確認可能
メンバー管理 個別追加 個別追加 メンバーシップ管理機能あり
ドキュメント管理 一元管理 個別管理 交換内で一元管理可能
アクセス制御 詳細な制御可能 基本的な共有制御 メンバーシップベースの制御

こうやって見ると使用状況もモニタリング出来る、Listing一択ですね。
そしてListingで全て良さそうなので、Data exchangeが全く頭に入ってこない・・

まとめと追記

本記事では、前回記事時点の実装をさらにアップデートした比較を自身でしてみたものを共有しました。
1年前に実装を決めて半年後にリリースした、1年後に記事を発表したら、もう陳腐化していたというのは笑えない話ですが、それぐらいsnowflakeの進化が早いという事だと思います。

そういう意味では情報を寝かしておく事に意味はないと改めて気付くことが出来ましたし、積極的に発信し、自分自身もアップデートしていくという事をどんどんやっていった方が良い!と思いました。

という訳でこの記事にも注釈を付けておきます。

Discussion