🎃

(2026年1月30日号)データエンジニアリングユニオン通信 Season2 #15

がく@ちゅらデータエンジニアです。

こんばんわ!
なんとかブログ更新頻度は保ててるかな・・・保ててるよね!
1月がもう終わった・・・・なんか時がすぎるの早すぎん???

データエンジニアリングユニオンとは(テンプレ)

隔週金曜日の12時〜13時で、データエンジニアリングのTOPICSを扱ったデータエンジニアリングユニオン Season2 を開催しています。
告知は、主にSnowVillage(SnowflakeのユーザコミュニティのSlack)にて告知しています。
※現時点ではYoutubeなどでの公開はしていません

今回は、運営陣が都合がつかなかったので、メインMCは私。
臨時にちゅらの同僚のローさんが合いの手いれてくれました、ありがとー

ちゅらデータ社内のデータエンジニアギルド内でやっている活動を社外にも広げた活動です。

弊社、真嘉比の金言
「キャッチアップは筋トレ!」

データエンジニアリングのキャッチアップ筋をみんなで、鍛えていきましょう!!

データエンジニアリングトピックス 2026年1月20日版

直近のイベント

https://www.snowflake.com/about/webinars/snowflake-discover-ai-japan/?utm_source=ps

は、昨年12月にあったBUILDのAI版で、オンラインイベントです。

このような感じなので、現在AIの活用がどんどん進んできている中、参考になるセッションは多いのではないかなと思います。
個人的には、AI-Readyというワードが流行っていますが、実際これがどういう形で実現していけばいいか?というのはとても興味があります。


プリンシパルセキュリティアーキテクトの柳瀬さんのセッションはぜひ聞きたいですね
「データと AI 戦略の基盤:Snowflake Horizon によるクロスプラットフォームガバナンスの実現」

今週絶対紹介したい!データ界隈の話題

所感

https://dev.classmethod.jp/articles/modern-data-stack-info-summary-20260128/

DataSuperHero2026にまた選出された神さがらさんの記事
継続して情報発信を続けられるさがらさん、足を向けて寝れませんね。

個人的に気になったのは、ClickHouse、OneHouseのお話。
OneHouseは、確か昨年か一昨年前のSnowflakeSummitで出展していて、面白そうなプロダクトだった・・・と聞いたのが印象的でした。

ClickHouseがLangfuseの買収を発表

AIエージェント開発でよくきいていたLangfuseを買収・・・・え?ClickHouseって・・・どちらかとデータ系とおもっていたのに、AIAgent系のプロダクトを買収してどうして・・ってこもったりしました。

https://metafind.jp/2026/01/29/a-true-data-warehouse-requires-integration-of-meaning/

データウェアハウスの父、ビル・インモン氏のLinkedInでの発言が物議を醸している・・とこと。
インモンさん、なかなか辛辣?なお言葉を。

  • データの統合なしではデータ構造は瓦礫と化す
  • コンサルタントやベンダーがデータ統合を無視すると、役立たないデータ構造の責任は構築されたデータウェアハウスに押し付けられる
    • → インモンさん激おこ

SnowflakeやDatabricksに対しても厳しい言葉をかけていますが、もっとやってくれやぁぁぁとの期待の裏返しかもな〜とおもったり

Snowflake

What's New

直近2週間のリリースノートへの所管

大きめなのは

  • Behavior change bundlesで、コストにはねそうな変更が気になってます。また、権限の追加をしなければならないものが出てきてるので、前と手順が変わってしまうってことが有り得そう
  • 外部リネージ
    • dbtやAirflowから。リネージまとめたいよね。pipでライブラリを入れてそこにSnowflakeのOpenLinageAPIエンドポイントに投げ込む感じ。検証してみたいな
  • 外部OAuth対応、ローカルアプリケーションにも
    • このあたりはAIAgentやMCPへの対応かなとも

記事・TIPS

直近2週間の記事・Tipsへの所感

https://zenn.dev/kayamamoto/articles/ashisuto202601

こちらのAIのコストについてのまとめはありがたいですね、このあたりをしっかりと押さえておかないと行けないと思います。
SnowflakeのAI関連のコストは、Warehouseと違って、コスト体系が別になり、少し複雑になっていて、気をつけないとですね。ここもうチョットシンプルにしてほしいですね。

https://medium.com/snowflake/query-google-sheets-directly-in-snowflake-e4a6735b9707
こちらは、Mediumの記事
お!スプシがSnowflakeから読めるようになった??公式??と思いましたが、実装でなんとかしたお話。BigQueryをスプシから読める/分析できるというのはとてもいい体験なので、Snowflakeさんもこちら使えるようにしてくれるといいんだけどねぇ〜
※もしかして、マーケットプレイスにあったりするんだろうか・・・・(調べてない

AWS

What's New

記事

AWS/記事 の所感

https://speakerdeck.com/hatahata021/updates-that-will-change-network-operations

個人的にはこちらのまとめが、非常ーーーーーーーーに気になっております。

特にこれ
これ以外にも「ALB・NLBの機能拡張」辺りはチェック必要かなと思います。

https://dev.classmethod.jp/articles/ec2-auto-scaling-new-mechanisms-group-deletion-protection/

この保護機能もありがたい、積極的に設定しておきたいなとおもいました。

スケールイン中で 0 台になっており不要だと勘違いして Auto Scaling グループを削除してしまうとかたまに事故ることがあったのですが、

まさにこれ。これですよね

GoogleCloud

BigQuery

ちょっきん2週間の所感

BigQueryの情報は、g-genの杉村さんのXへの投稿で主にキャッチアップしてます
ほんといつもありがとうございます、すごい助かってます🙇

https://docs.cloud.google.com/bigquery/docs/salesforce-transfer?hl=ja

これまで、SalesforceのデータをBigQueryに連携するには、FivetranやTROCCOといったツールを使ったりするのが主流だったのかな・・・とも思いますが、こちらが出来たのでそれが不要で、連携できるようになったのかなって思ってます。
※自分が、Salesforce→BigQueryはやったことがないので、誤った事を言っていたらごめんなさい

https://zenn.dev/ubie_dev/articles/eca00ce1ebe8a5

またこちらのUbieさんの記事は、さすがUbieさんという記事
病名に冠する表記ゆれってのは、医療ドメイン(動物の病名とかでも)ではほんとよくあることらしく、このあたりはほんとよい!と同僚が絶賛していました。

記事

Azure/Microsoft

※私はAzureは殆ど使ってないので、このあたりは非常に弱い

Databricks

その他のデータベース

PostgreSQL

Postgresについての所感

https://x.com/Keisuke69/status/2015765541240406400?s=20
OpenAIがManagedのPostgreSQLを使っていたというお話がすごく興味深かったです。そちらを開設いただいているこのツィートがすごいわかりやすかった。

DuckDB

  • Announcing Vortex Support in DuckDB
    • TL;DR: Vortexは、非常に将来性のある設計を持つ新しい列指向ファイル形式です。SpiralDBとDuckDB Labsが提携し、Vortexファイルの読み書きを非常に高速に実現します。
    • 比較的新顔なデータファイルフォーマット Vortex をサポートするようです
    • VortexはParquetよりAI/GPUを意識して高速性・並列性を追及したファイルフォーマット。意欲的だ!
  • Announcing DuckDB 1.4.4 LTS
    • 安定版がリリースされました。来月には1.5.0になる予定!

所感

https://duckdb.org/2026/01/23/duckdb-vortex-extension

Vortexという列指向データ用の拡張可能なオープンソースフォーマットがでてきましたね。
こちらは、列指向でIcebergなどでも使われているParquetの持つ設計上の問題を解決しようと開発されてきたものだそうな。
※2025年8月にSpiralDBよりLinux Foundationに寄贈

非常に意欲的
DuckDBはこういった新しい技術に対してもいちはやく対応しているし・・・・やっぱりやっておかないとだめだろうなぁ・・・という気がすごく強くなっています。

結論
Vortexは、Parquetのような既存の列指向フォーマットに代わる非常に興味深い選択肢です。軽量圧縮エンコーディング、遅延解凍、そして圧縮データに対する計算式の実行に重点を置いているため、幅広いユースケースで非常に興味深い選択肢となっています。DuckDBに関しては、Vortexは分析クエリにおいて既に非常に高いパフォーマンスを示しており、TPC-HベンチマーククエリではParquet v2と同等かそれ以上の性能を示しています。

なかなか興味深いなぁー

その他

Supabase

データモデリングツール

dbt

その他ツール

BI

ちゅらデータ株式会社

Discussion