ちゅらデータ・データエンジニアギルド通信 Vol.7(〜11/29)

がく@ちゅらデータです。

弊社には、ギルドっていう横軸組織があります。そこの定例で、データ界隈を中心に、関係しそうな話題などを共有しています。

まぁ、おもに私がこれ良さそ〜と思う話題をメモっていてそれを共有しています。
それ、公開しちゃってもいいんじゃね?って思ったので、記事を書いていこうかな〜と思っております。
※テンプレ

と、Vol.6まで書いたのですが、夏休みでずっと子ら(幼稚園)家にいて、夜中はもう疲れて寝てしまい・・・なんてことをしていて、再開せにゃなーとおもってたら、なぜか冬になっていた・・・・
たいむりーーーーーーぷ!!!!!!!!
そう、タイムリープなのですよ、うん、時空の旅人なんです、はい(屍

今週のデータ界隈のトピック

今年もアドベンドカレンダーの季節になりました

※私は今年は、dbtとちゅらデータで書きましたが、Snowflakeでも書きたいなって思ってます。Snowflakeとdbtは、2枚目までいってますね

イベント

その他

https://inside.pixiv.blog/2023/11/27/120000?utm_source=feed

Fundamentals of Data Engineeringの社内読書会をやったとのこと。
2023年2月から2023年11月まで・・・・これをずっと継続してなさるなんて凄い!!!!

事前準備無しで、読み合わせる・・・これは私も「データ基盤への処方箋」でやるスタイルで、一番皆が読んで習得には一番いい形なんですよね

今週のGCP

https://cloud.google.com/support/bulletins#gcp-2023-046

  • GKE以外のインスタンス等に影響があるかは不明
  • debianだとまだ修正はでていない(2023/11/29 16時現在)

https://kakiblo.com/gcp-qualification-doc/
「試験ガイドと公式ドキュメントを熟読することが一番大事」
→ やらにゃねぇ

https://blog.g-gen.co.jp/entry/cloud-logging-explained
G-gen杉村さんの記事。
DevelopersIOと並んで、特にGoogleCloud系では、最近富に存在感をだしてらっしゃいますよね
わかりやすい記事もとても多い

https://speakerdeck.com/mot_techtalk/bigquery-nodetapin-zhi-yadetahuo-yong-wogao-meru-dataplex-deng-nohuo-yong
Dataplex(データ品質管理) と DataHub(メタデータ、リネージ)で実現
Dataplexは、

  • データメッシュ
  • データカタログ
  • データプロファイリング
  • データ品質管理
    • テスト定義をSQLに変換してテストなど

https://cloud.google.com/vertex-ai/docs/generative-ai/compute-token?hl=ja#pricing_and_quota

GCPにおいては、ドキュメント量課金だが、なんトークンまで投入できるかはわかりにくかった
そこで、トークンがどのくらい「消費」されるかを見る機能
Azureとかには元々あったものらしい
ちなみに、Azureはトークン課金らしい

今週のAWS

https://dev.classmethod.jp/articles/reinvent2023-adam-selipsky-keynote/
今日は圧倒的に、Re:Inventですね(開催中)

https://aws.amazon.com/jp/about-aws/whats-new/2023/11/amazon-s3-express-one-zone-storage-class/
→ Amazon S3 Express One Zone がGA。リクエストコスト 50%減、アクセススピード10倍
(独り言) Snowflakeで外部テーブルに使ったりして、パフォーマンスに差異があるか試したい

  • Amazon Bedrock
  • Amazon Q
  • Redshift Zero-ETLの仲間が増える(MySQL、DynamoDB)
  • Amazon Data Zone AI recommendationがPreview
    • LLMによる説明などの自動生成可能

今週のSnowflake

2023/12/15(Fri) Build Meetup

https://usergroups.snowflake.com/events/details/snowflake-japan-presents-tokyo-build-meetup/

Felipeが来日ですよ!

  • MediumやSnowflake、全世界的にもSnowflake関連でNo.1ぢゃないですか?
  • GA4 →  Snowflake の記事とかも書かれてます
  • 弊社菱沼、kajiyaさんもFelipeと新機能のデモを行うそうです
  • 私も参加し、LT登壇予定
    • また、External Network Access ネタで行きます。

リリースノート

https://docs.snowflake.com/en/release-notes/2023/7_42

  • Native Apps: Support for reference and privilege validation in the manifest file — Preview
  • Schema detection for JSON and CSV — General Availability
  • Table schema evolution — General Availability
  • Iceberg tables — Preview
  • Self-service: Enabling the ORGADMIN role — General Availability
  • Self-service: Deleting an account — General Availability
  • Key pair authentication: Improved troubleshooting
  • Structured types — Preview
  • Row access policies: Reference a protected mapping table in a row access policy — General availability
  • Recurring subscription-based pricing plans for paid listings —– General Availability

すでにパブリックプレビューになっていたものが、GAになったのが多いですね。
ただ、今回の目玉としては  Iceberg  Table でしょうか
(Structured types — Preview も Iceberg関連)

その他

https://note.com/bunsekiya_tech/n/nf529f8157f18

階層問い合わせ connect by句 って使ったことあります?
私はありません!!!!(恥

一番好きなSQL句は、QUALIFY です

https://techblog.cartaholdings.co.jp/entry/select-cloud-cost-optimize-cmf
Snowflake界隈でも大活躍している、データモデリングといえば? な peiさんの記事
こちらはSELECT dev のSaaS

ただの可視化ツールではありませんでした。導入しただけで、ウェアハウスの利用料が最大40%程度削減ができたりと、可視化で留まらないパフォーマンスを出してくれてるので、コストでお困りの方は必見です。また、ウェアハウスのサイズが大きいほど効果的です。

これだけでもワクワクしません?
詳しくは記事を読んでくださいね

今週のセキュリティ

https://www.nikkei.com/article/DGXZQOUC270BU0X21C23A1000000/

https://amzn.asia/d/6yQ6Ee9
を読んで、最小権限の付与とか、コンパートメントとかしっかりしないと事故るで〜

その他

今週のBI(Tableau)

https://dev.classmethod.jp/articles/tableau-bridge-snowflake-privatelink-connection/

Tableau Server と SnowflakeをPrivateLinkでつなぐ・・・な構成はみたことあったのですが、Tableau CloudとSnowflake間をPrivateLinkをつなぐってのは・・・?

と思っていたのですが、Tableau Brigeというプロダクトを使って実現できるそうな
※なかなか複雑・・・・・

Tableau Cloud使うなら、Tableau CloudからのグローバルIPを許可IPに設定して、Snowflakeへの接続に関して制限をかける・・・ぐらいしか思いつかなかったです。

まだまだもっと勉強せにゃならん

ちゅらデータ株式会社

Discussion