📃

[Summit 2025 セッションレポート] What's New: Snowpark Container Services

に公開

へーしゃブログに間に合わなかったシリーズです。

https://datumstudio.jp/blog-cat/snowflake/

はじめに

このセッションは Snowpark Container Services(SPCS)のアップデートとベストプラクティスの紹介、そして高度なユースケースとしてエージェントのデモを行うセッションです。

SPCSといえば Snowflake 内のコンテナ環境で任意のコードで書かれたアプリケーションを動かせるという機能です。したがってエージェントだって動かせます。...ってマジ?

コンテナグループのリーダーとして、このセッションを聞かないわけにはいきません!というわけで、レポートをどうぞ。

概要

セッション紹介ページより引用

https://reg.summit.snowflake.com/flow/snowflake/summit25/sessions/page/catalog/session/1738777859535001rgzh

英語

Learn how to deploy the best-in-class OSS models in Snowpark Container Services for AI-driven insights in Snowflake. Join us for new feature overviews, best practices, and a demo featuring an advanced agentic use case.

日本語(自動翻訳)

SnowflakeでAI主導の洞察を得るために、Snowpark Container Servicesでクラス最高のOSSモデルを展開する方法を学びます。新機能の概要、ベストプラクティス、高度なエージェントのユースケースを紹介するデモにご参加ください。

内容

はじめに:SPCSとは

まずは SPCS とは何かのおさらいから始まります。

SPCSは、Snowflake 内のコンテナ環境で任意の言語で作成されたアプリケーションを動かすことができ、データをアプリケーションで利用するために外に出す必要がなくなるという、強力な拡張機能です。さらに CPU だけでなく巨大な GPU も利用でき、AI/ML などの高度なアプリの実行にも適しています。

図の上部にコンテナランタイムを利用可能な Snowflake の機能が並んでいますね。
ここ最近のアップデートで、Notebooks のコンテナランタイムは一般公開済み、Snowflake ML は ML Jobsがプレビュー開始しており、Snowflake Openflow はコンテナランタイム対応がプライベートプレビュー中と発表されていました。この図を見る限り、将来 Streamlit in Snowflake もコンテナランタイムが選択可能になりそうです。ウェアハウスに比べて同サイズのコンピューティングプールのほうが料金が安いので、かなり嬉しいアップデート!

次に、SPCS の主な利点について。
データを安全にアプリに渡せたりすることはもちろんですが、個人的に一番の良さは「コンテナ(実態は k8s)を圧倒的に簡単に扱うことができ、コンテナの学習コストを抑えてアプリケーション(とその先)に集中できること」なので、1番目から首を縦に振りまくりながら(もちろん心の中で)聞いていました。
なお、スピーカーの Muzz Imam さんは以前 Azure Kubernetes Service の開発者だったそうです。k8s の学習難易度を一番理解しておられる方、ってことですね...

Observability What's New

続けて Observability についてのアップデート情報です。
現在提供されているログとメトリクスに加え、新たな Observability 機能が導入されるようです。このあとすぐ!

プラットフォーム イベントログで、サービス/ジョブレベルのステータス(サービスの失敗など)、およびコンピュートプールレベルのステータス(例: プールの一時停止/再開)でのイベントの出力はパブリックプレビュー中。
Snowsight の「Log and Traces」からアクセスできます。

アプリケーション メトリクスとトレース は一般公開済み。

コンテナを永続化するサービスに対し、永続化しない方式がジョブでした。ジョブをセッションから切り離して非同期実行が可能な ASYNC オプション が登場しています。

そして最後に Execution History が発表されました。これはジョブが終了した後もログを保持できる機能です。今まで、ジョブが終了するとコンテナが終了しログは閲覧できなくなっていました。ログを残すにはコンテナを生かし続けるしかなく課金が発生するという...このアップデートで、コンテナを終了して課金されないようにしつつ、ジョブの実行ログを残せるようになります。
もうすぐパブリックプレビューとのこと!

デモ:SPCS と AI エージェント

ここからは SPCS と AI エージェントワークフローを駆使して外部のサービスと Snowflake を連携させるプラットフォームを構築するというデモの発表です。

Slack で Snowflake 内のデータに関する質問文・画像・音声を入力したら、Snowflake に問い合わせしたり、メールを送付したりする AI エージェントワークフローを構築します。
エージェントを導入したいが、既存のコミュニケーションツール(Slack)からは離れたくない。簡単にノーコードでエージェントワークフローを導入したい(n8nを使用します)、LLM をセルフホストしたいし自社向けにファインチューニングしたい(今回のデモではレントゲン画像を扱いたいので、それ向けにモデルをチューニングしたい)、当然 Snowflake のガバナンス境界の中で安全に運用したい...という、あったらいいなの全部盛りなデモとなっています。

デモ

まずはデモ1の構成です。AIワークフロー自動化ツールの n8n を SPCS に立て、さらにチャット用の LLM を oLLAMA で起動、Cortex MCP Server(OSS)、Radiology MCP Server、および音声転文字起こし MCP Server のすべてを SPCS で立てます。

デモ1 では MCP Server を立てていた部分を、デモ2 ではエージェントに置き換えます。

では実演。
まずはデモ1 テキスト書き起こしから。これは n8n のエージェントワークフロー管理画面です。Qwen3-88 (チャット担当)、レントゲン画像用にファインチューニングされた LLAMA 3.2 11B を用いた Radiology MCP Server、OpenAI Whisper large v3 を用いた音声文字起こし MCP Server、(見切れていますが)Cortex MCP Server が n8n で紐づけられています。

Slack に音声と『これを文字起こしして』を投稿すると、ワークフローが実行されて、Slack 上で応答が返ってきます。

各 MCP Server のノードに設定されているパラメータをチラ見せ。

続いて画像を送ってみます。胸部X線レントゲン写真をアップロードすると、Radiology MCP Server が解答をしてくれています。

このモデルのファインチューニングに利用したデータ。Base64 エンコードされた画像を2000枚使用しています。

続いて音声による質問をしてみます。

『Snowpark Container Servicesについて何を知っていますか?』という音声を投げると、エージェントが起動し、参考文献を含めて回答を返します。どうやら Cortex Knowledge Extensions を呼び出し、裏で適した処理を実行してもらっている様子。

(このセッションに参加している方々なら、ワークフローより速くオタク特有の早口で解説してくれそうではある)

最後に、メールとの連携です。『Snowflakeのモデルレジストリにモデルを登録する方法をメールで教えていただけますか?』

ロードマップ

最後に、みなさまお待ちかねのロードマップです。

  • Summit 2025 時点でパブリックプレビュー・プライベートプレビュー
    • リージョンの可用性とエンタープライズ機能
      • GCP(パブリックプレビュー)
      • US Gov リージョン対応
      • すべての VPS エディションへの対応
      • TSS (Tri-secure secret 暗号化)
      • プライベートリンク (インバウンドとアウトバウンド)
    • Observability
      • Snowsight によるサービスとジョブの管理
      • Snowsight 上のログ、メトリック、トレース、システムイベント
    • Orchestration
      • 非同期ジョブとバッチジョブ
      • サービスの自動停止 (イングレス、サービス間、アイドル状態をプローブ)
    • Notebook、Streamlit、Snowflake Openflow
      • SPCS 上で実行されるファーストパーティ サービス
    • コンピューティングの改善
      • オンデマンドの即時コンピューティング
      • システム メトリックにもとづく自動スケーリング
  • 2025年下半期の予定
    • BCDR(事業継続性と災害復旧)
    • Stable and Friendlyなエンドポイント
    • ECR/ACR および Dockerhub とのイメージレジストリ統合
    • Snowsightとの完全な統合
    • 優れた Observability と DevEx(Developer Experience)
    • きめ細かなコストガバナンスと Observability

や、やっと Snowsight でコンピュートプール以外の SPCS リソースが管理できるようになる...!
Streamlit、Snowflake Openflow のコンテナランタイム対応も、ランニングコスト的にかなり嬉しいポイントですね。
今後のものでは、Stable and Friendlyなエンドポイントの対応が一番気になるところです。サービスのホスト名は作成するたびにランダムな文字列で割り当てられるので、ホスト名でアクセス許可を設定する必要があるようなセキュリティ要件の厳しい環境では、毎回許可設定のやり直しが必要になったり、それを理由に SPCS の利用が難しいなんてことがあります。本気で一刻も早く公開されてほしい。(現地でスピーカーさんにプッシュするのをすっかり忘れてた。。。後悔)

おわりに

現地では一人でセッション参加していましたが、すっかりテンションが上がってしまいました。。。
このテンションのままに SnowVillage コンテナ勉強会も盛り上げていこうと思います!毎月第3月曜日に開催中です。ぜひご参加ください。

DATUM STUDIO

Discussion