🏂
【Snowflake Summit 2025】Platform Keynote発表まとめ
はじめに
この記事はDay2に実施された「Platform Keynote」のまとめ記事です。
多くの方がすでに記事にされていますが、頭の整理も兼ねて記載します。
今年のテーマ
個人的な今年のテーマは「AI Ready Data」、「シンプル化」という印象を受けました。
前者は言わずもがなですが、後者は機能としては実装されていたものの複雑で使いづらいものをラップして、よりシンプルにしていこう という方針を感じました。
(無論シンプル化の背景にはやはりデータ/AIの民主化し、全世界でデータ活用を推進していくという想いがあると思います。)
新機能・サービス
ここからはKeynoteで発表された新機能をまとめます。
あくまで自分の解釈なので、若干表記揺れ等があるかもしれません。ご容赦ください。
また適宜情報は修正、更新していく予定です。
コスト周り
Organization Usage View
- 組織全体のSnowflake利用状況やコスト消費を、リージョンやクラウドをまたいで単一画面で確認できる。
- 恐らくSnowSightに追加される?
- 支出から傾向を把握し、傾向変化があれば通知する機能も搭載
Adaptive Compute
- ユーザーがポリシーと意図を指定すると、Snowflakeが必要なリソースのサイズやスケーリングポリシーを自動で判断する
- 結果として利用最適化されコスト削減、パフォーマンス向上される。
- 大規模利用におけるインフラ部分をなるべく「シンプル」にし、管理工数を減らしたいという背景から派生したもの。
Simplified Ingest Pricing(Snowpipe)
- 取り込みデータファイル単位での課金から、取り込みデータ「量(GB)」に基づいた課金に変更。(シンプルにしたというニュアンス)
- 取り込みコストが約50%程半減する見込み。
データ統合、データエンジニアリング周り
Snowflake OpenFlow
- データ取り込み、処理するためのサービス。
- 構造化/非構造化の両方に対応。
- Apache Nifiで構築されており、複数のコネクターが提供されている。
- SPCSな環境か、カスタマーマネージドな環境か選択できる。
- デモを見る限りSnowsightとは別UIで提供な気がします
dbt on Snowflake
- Snowflake内でdbtパイプラインを構築、テスト、デプロイするための環境を提供。
- Fusionエンジンも導入されると言及あり。
New Snowpipe Streaming
- Snowpipe Streamingの新バージョン。
- 最大10GB/秒のスループットなど、性能向上。
インフラ周り
Snow Convert
- Snowflakeへの移行ツール
- 無償利用可能
Generation 2 Warehouses (第二世代ウェアハウス)
- より高速なハードウェアとソフトウェア最適化を備えた、従来のウェアハウスの次世代版。
- 特にIcebergテーブル内のParquetファイルなど、オープンデータのスキャン性能が向上しており、Snowflakeベンチマークで2.1倍、マネージドSparkに対して1.9倍高速な性能
- XSで1.35クレジット。今までソフト面では無償で性能UPしてましたが、ハード自体が変わるので金額UP(?)
Snowflake Postgres
- 前日のOpening KeynoteでCrunchy Data買収が発表。(オープンソースpostgresの技術リーダー)
- 具体的な内容はまだでていない?(キャッチアップ不足かも)
- トランザクション系を扱うサービスとしてハイブリッドテーブルが存在したが、性能面が課題があった。(トランザクション用途としても分析用途としても中途半端)
- 上記の課題解消し、トランザクション・分析どちらの用途でもSnowflakeが利用できるように整備されていく(?)
- 詳しくはエクスチュア喜田さんのブログを参照。
Workspaces ※インフラではないけど
- Snowsight上に追加されたIDE。
- ワークシート、Streamlit、Notebookなどをファイルベースで整理、管理できる
- git管理も可能。
AI周り
Cortex AI SQL (Cortex AI SQL)
- SQLクエリ内で自然言語を使用できるAIクエリ言語。以下一例
- AI Join (AI Join)
- キーを指定せずに、AIが自然言語プロンプトに基づいてテーブルを結合するセマンティックジョイン。
- テーブル指定まで不要なのか、キーだけ自然言語で指定可能なのかわかっていない。
- AI Aggregate (AI Aggregate)
- Groupbyで集計する際に利用。
- 日時別のレビューを月で集計する際に、集計単位内の要素を要約してくれるイメージ。
- こんな感じだった。
sql select date_trunc('month', "日時"), AI_AGG("レビュー") from xxx group by 1
Semantic Views ※6/5(木)情報追記
- データに関するコンテキスト(メトリクスやディメンション、ビジネス定義など)を、Create時に定義するビュー。
- これにより自然言語とデータを紐づけ、生成AI等がデータを活用できるようにする。
- 検証済みクエリー(Verified Query)
- 一部の質問にはセマンティックビュー内で管理者があらかじめ「この質問にはこのSQLが正しい」というソース・オブ・トゥルースを設定し、信頼性を確保。
- Cortex Analystはもちろん、HEX、Sigma、Omni等のBIからでも利用可能になっている!これは一元管理できてうれしい!!
- SQL文だけでなく、Tableauファイル(twbなど)からGUIベースで作成可能。自動的にダッシュボード内の利用カラムや利用テーブル情報を取得するらしい。
- 自動で精度検証し、90%以上の精度になるように調整してくれるらしい、
Semantic SQL
- Semantic ViewsをクエリするSQL記述法。
- 自然言語ではなくSQLチックに、ディメンションやメジャー、コンテキストを指定してデータをクエリできる(?)。
Sharering Semantic Views
- Semantic ViewsをAI対応Viewとしてマーケットプレイスで展開できる。
- True Starさんがすでにマーケットプレイスに公開しているようです。
Cotex Agents
- Cortex Search(非構造化の自然言語検索)とCortex Analyst(構造化の自然言語検索)をツールとして利用するAgentAPI
- ユーザーのプロンプトに応じてどちらのサービスを利用するか選択する
- Cortex SearchとCortex Analystしか使えない状態だった(?)が、その他のツールが追加可能に。
- カスタムツール連携
- 外部APIを叩いたり、別エージェントを呼び出したりといったカスタムコードを書いて機能を拡張可能
- ウェブ検索
- カスタムツール連携
Snowflake Intelligence ※6/5(木)追記
※6/5(木)追記:解釈が誤っていたので修正しています。
- 専用のWebインターフェイス。
- Snowsightからのアクセスに加え、Snowflake Intelligenceのみにアクセスさせることも可能。
- エージェントカタログ
- 公開されているエージェントから、利用したいエージェントを選択できる
- 既存のSnowflakeの権限管理を利用可能。
- 思考過程を表示し、以下のような作業が可能。
- どのデータベースを利用するかを自動判断。
- Cortex Analyst等を用いてtext to SQLを用いてデータを取得し可視化。
- Slack等の会話履歴を組み合わせて原因分析。
- Agentの作成もGUIで可能
- 作成したCortex AnalystやCortex Search、カスタムツールを選択して自作エージェントを作成できる。
- ベースとなるモデルも選択できる。追加でこういうケースでは必ずチャートをつくる、会話の最後に推奨アクションを提案するなどの独自プロンプト指示も可能。
- どのロールがこのエージェントを利用できるか」を指定可能。
- ベストプラクティス
- ロードマップ
Inline copilot
- Snowsight内でホットキー(Command + I または Control + I)でアクティベートできるコパイロット機能。
- いわゆるgit hub copilotに近いです。こういうSQLを書いて、と指定するとSQLが作成して、承認すると反映されるイメージです。
セキュリティ・ガバナンス系
Horizon Catalog(個別機能ではなく概念)
Horizon Catalogは、“Snowflake上でネイティブに動くメタデータカタログ”と“高度なガバナンス”と“多様な発見・コラボレーション機能”を統合した仕組み、
つまりざっくりいうと以下3機能。
- メタデータ管理機能
- ガバナンス機能
- 検索・発見機能
ここでいうカタログ(メタストア)とは
- Horizonでいうところのカタログは「メタデータ管理」を指す。
- Snowflakeでは、テーブルやAIモデル、ノートブック、ワークシート、ダッシュボード、フィーチャーストア――など、あらゆるオブジェクトをメタデータとして管理している。
- このメタデータ管理機能上に、ガバナンス機能や検索・発見機能が動作している。
カタログフェデレーション(メタデータ管理機能)
- Snowflake以外の「AWS Glue Catalog」「Apache Iceberg Catalog(Apache Polarisなど)」ともメタデータを同期可能。オンプレとも同期可能。
- 後述のUniversal Search機能を用いて、Snowflake外のデータも検索可能に。
Universal Search(検索・発見機能)
- Universal Searchはすべてのオブジェクト(テーブル/ビュー/ノートブック/ダッシュボード/MLモデル/Stage/Pipe/Task/Streamなど)を横断的に検索できる機能。
- UIアクセス場所が変更。HOME画面上部に追加
- フィルター機能が強化
- プレビュー機能の追加。選択時に右側にプレビューが表示される。
- Snowflake外データ資産の検索(Extarnal Data in Universal Search)
Internal Marketplace(検索・発見機能)
Organizational Profiles
- データオーナーごとに“ブランド化”されたプロファイルで、どの部署(チーム)が提供しているデータ製品なのか、問い合わせ先やドキュメントリンクなどが一目でわかる
(追記中)
おわりに
昨年に比べてみなさんの生成AI活用レベル(文字起こし、翻訳など)があがっており、各記事の投稿スピードに驚愕しています笑
Summitも終盤戦になってきましたが、自分も追いつけるように頑張ります!
Discussion