❄️ Snowflakeって何?話題のAIデータクラウドを分かりやすく解説! 〜Snowflake Discoverレポート〜
【初心者向け】Snowflakeって何?話題のAIデータクラウドを分かりやすく解説! 〜Snowflake Discoverレポート〜
「Snowflakeって最近よく聞くけど、一体何ができるの?」「AIとかデータとか難しそう…」
そんな風に思っているあなたへ! この記事では、SnowflakeのAIデータクラウドがどんなものなのか、そして私たちのビジネスやデータ活用にどんな変化をもたらすのかを、エンジニア向け無料ライブウェビナー「Snowflake Discover」のセッション内容をもとに、初心者の方にも分かりやすく解説します。
(あくまで個人的にまとめたものですので、内容の詳細は下記のURLからお願いします。)
はじめに:Snowflake Discoverとは?
Snowflake Discoverは、SnowflakeのAIデータクラウドの可能性を探求し、深く理解するためのエンジニア向け無料ライブウェビナーです。Snowflakeの最新情報をキャッチアップするのに最適で、たくさんのセッションが用意されています。
こちらから登録して、動画本編を視聴できます!
この記事では、その中でもDay1の最初のセッションSession 1 ゼロから始めるSnowflake_ モダンなデータ&AIプラットフォームの構築の内容をギュッとまとめてお届けします!
AI時代を勝ち抜くカギは「データ」と「AI」の組み合わせ
最近、「AI」や「生成AI」という言葉を毎日のように耳にしますよね。チャットボットを作ったり、画像を生成したり、AIは私たちの仕事や生活を大きく変える可能性を秘めています。
でも、AIを使うこと自体が目的ではありません。本当に大切なのは、AIを使ってビジネスの価値を生み出すことです。
では、どうすればAIでビジネス価値を生み出せるのでしょうか? その答えは、「皆さんが持っているデータ」と「AI」を組み合わせることです。
例えば、お店の売上データとAIを組み合わせれば、より正確な需要予測ができるかもしれません。顧客データとAIを組み合わせれば、一人ひとりに合った最適な商品をおすすめできるかもしれません。
このように、データとAIを組み合わせることで、今までできなかった新しい価値を生み出すことができるのです。そして、Snowflakeは、このデータからビジネス価値を生み出すためのAIプラットフォーム、それが「AIデータクラウド」なんです。
企業のデータ活用、どう変わってきたの?
これまで多くの企業では、下図のように様々な場所からデータを集めてきて(データソース)、使いやすいように整理整頓し(データ処理)、分析ツールなどで活用する(BIやデータサイエンス)という流れが一般的でした。
しかし、テクノロジーの進化とともに、このデータの活用のあり方も変わってきています。特に大きな変化は次の2つです。
変化1:どこでも、誰でも、データを使えるように! (データの相互運用性)
- 特定の場所に縛られないデータ形式 (オープンテーブルフォーマット): 今までは「この会社のシステムでしか使えないデータ」といったものが多かったのですが、これからはもっとオープンに、どんなシステムからでもアクセスできるデータ形式が注目されています。(例: Apache Iceberg)
- データを見つけやすくする仕組み (データカタログ):社内のあちこちにデータが点在していても、どこにどんなデータがあるのか簡単に見つけられるようにする仕組みが重要になっています。
- 色々な得意技を持つ分析エンジン (複数のクエリエンジン): データの種類や分析したい内容によって、最適な分析エンジン(道具)を選んで使えるようになってきています。
変化2:AIがもっと身近に! (AIの活用)
- 文字以外のデータも使えるように (非構造化データ): 今までは数字などの整理されたデータ(構造化データ)が中心でしたが、これからは文書、画像、音声といった整理されていないデータ(非構造化データ)も本格的に活用できるようになってきました。世界のデータの80%は非構造化データと言われています!
- 色々なデータを組み合わせて新しい発見を (構造化データと非構造化データの結合): 例えば、顧客の購入履歴(構造化データ)と、その顧客がSNSに投稿した商品の感想(非構造化データ)を組み合わせることで、新しい分析ができるようになります。
- もっとたくさんの人が、もっと簡単にデータを活用 (自然言語でのデータ分析など): 専門家でなくても、「今日の売上トップ5の商品は?」のように、普段使っている言葉(日本語など)でデータ分析ができるような需要が高まっています。
実は、このような変化は今に始まったことではありません。昔も、オンプレミスからクラウドへ、機械学習の登場、データレイクの出現など、テクノロジーの進化とともにデータの使い方は変わってきました。
これからも新しいテクノロジーが登場し、データの活用方法は変わり続けるでしょう。だからこそ、特定の変化にガチガチに合わせるのではなく、これから起こりうる様々な変化に柔軟に対応できるプラットフォームが求められているのです。
なぜSnowflakeが選ばれるの? 3つの理由
では、なぜ多くの企業がSnowflakeを選んでいるのでしょうか? 大きく3つの理由があります。
-
データからAI、そしてビジネス価値へ。全部Snowflakeで!
- データを集め、整理し、AIで分析し、その結果をビジネスに活かすまでの一連の流れを、Snowflakeという1つのプラットフォームで、しかも最短で実現できます。
-
とにかく簡単!なのにパワフルで安心! (SaaS型プラットフォーム)
- SaaS(Software as a Service)なので、面倒なシステムの構築や管理は不要です。すぐに使い始められ、データが増えても柔軟に対応でき(大規模に拡大可能)、大企業でも安心して使える信頼性があります。
-
仲間がたくさん!10,600社以上と繋がれる!
- すでに世界中で10,600社以上の企業がSnowflakeを利用しています(2024年10月時点のウェビナー情報より)。これらの企業とデータを共有したり、協力したりすることで、あなたのビジネスをさらに拡大できる可能性があります。
Snowflakeでビジネス価値を生み出す3つのステップ
Snowflakeを使ってデータとAIを組み合わせ、ビジネス価値を生み出すためには、大きく3つのステップがあります。
-
データファンデーションの強化 (データをきちんと管理する)
- これが全ての土台です。まずは社内にある様々なデータをSnowflakeに集め、一元的に管理できるようにします。
-
エンタープライズAIの促進 (AIで価値を導き出す)
- 管理されたデータを使って、AIを活用し、新しい発見や予測を行います。
-
アプリケーションの構築 (価値をみんなに届ける)
- AIで得られた価値を、社内の他の部署や、お客様など、色々な人に届けたり、使ってもらったりするための仕組み(アプリケーション)を作ります。
それぞれのステップについて、もう少し詳しく見ていきましょう。
ステップ1:データファンデーションの強化 〜バラバラなデータを一つにまとめる〜
AI活用やデータ活用を進めるためには、まずデータを一元管理することが非常に重要です。
なぜなら…
-
「終わりのないサイロ化」からの脱却:
- テクノロジーが進化するたびに、データが色々な場所に分散してしまう「サイロ化」が起こりがちです。サイロ化を放置すると、データから価値を引き出すのが難しくなります。Snowflakeは、これらのサイロを繋ぎ、データを一元的に管理する仕組みを提供します。
-
「隠れたコスト」を削減:
- システムを運用するには、目に見えるコストだけでなく、管理や運用にかかる人手や時間といった「隠れたコスト」もかかります。Snowflakeは、これらのトータルコストを最適化できる仕組みを持っています。
-
「断片的なルール」から「統一されたルール」へ (ガバナンス):
- データの管理ルールがバラバラだと、セキュリティリスクに繋がります。Snowflakeは、プラットフォーム全体に統一されたルール(ガバナンス)を適用し、データを安全に管理できます。
これを実現するのが、Snowflakeの優れたアーキテクチャです。Snowflakeは、1つのプラットフォームの中に、大きく分けて5つの層(レイヤー)を持っています。それぞれの層が独立して動くことで、柔軟性と高い性能を両立しています。
-
最適化されたストレージ (中心):
- どんな種類のデータ(整理されたデータ、整理されていないデータ、半分整理されたデータなど)も保管できます。
- データを自動で圧縮したり、Snowflake独自の技術(マイクロパーティション)で、データへのアクセスが非常に高速です。
- データは自動で暗号化されるのでセキュリティも安心です。
- Snowflakeの外にあるデータ(Apache Iceberg形式など)にも接続できます。
-
伸縮性のあるコンピュート (計算処理):
- 実際にデータを処理したり、アプリケーションを動かしたりする頭脳の部分です。
- ストレージと分離:データの量に関係なく、計算処理のパワーだけを自由に変えられます。「ちょっと計算パワーを上げたいだけなのに、ストレージの料金も上がっちゃう…」なんてことはありません。
- 用途ごとに分離:開発用、データ分析用、AI用など、目的ごとに計算リソースを割り当てられます。お互いに影響を与えないので、「あの処理が重くて、こっちの作業が進まない!」ということもありません。
- 特別なチューニングなしでも非常に高い処理性能を発揮します。ウェビナーでは、2022年8月から2024年10月までの期間で、クエリの実行時間が約40%短縮したというデータも紹介されていました!これはパフォーマンス向上とコスト削減の両立を意味します。
-
Cortex AI (AI機能群):
- Snowflakeが提供する生成AIの機能群です。後ほど詳しく説明します。
-
クラウドサービスレイヤー (自動化・管理):
- データプラットフォームの管理や運用作業は、本来やりたいビジネス価値の向上とは別の作業で、時間もコストもかかります。
- Snowflakeは、インフラ管理、パッチ適用、インデックス作成、手動でのデータ分割(パーティショニング)といった手間のかかる作業を自動化・抽象化してくれるので、ほぼメンテナンスフリーで利用できます。ユーザーはデータ活用に集中できます!
- Snowflake Horizonという統合管理機能で、プラットフォーム全体に統一的なルールを適用し、安全な利用環境を提供します。
-
Snowgrid (どこでも繋がる):
- 会社によっては、複数のクラウドサービスを使っていたり、国内外に拠点があったりしますよね。また、取引先が別のクラウド事業者を使っていることもあります。
- Snowgridは、異なるクラウドや地域(リージョン)を簡単に接続できる技術です。これにより、クラウドやリージョンが違っても、簡単にデータを共有したり、統一されたガバナンスを効かせたりできます。
- 災害時などにビジネスを止めずに継続するための仕組み(BCP/DR)も、Snowgridがあるからこそ実現できます。
Snowflakeは、データウェアハウスだけでなく、データレイク、データレイクハウス、データメッシュ、データファブリックなど、様々なデータアーキテクチャのパターンに柔軟に対応できます。ビジネスの目的に合わせて最適な形を選べるので、将来の「サイロ化」も吸収できるのです。
ステップ2:エンタープライズAIの促進 〜データを使ってAIで価値を引き出す〜
データが一元管理できるようになったら、いよいよAIを使ってデータから価値を引き出すフェーズです。
企業でAI活用を成功させるためには、どんなことが必要でしょうか?
-
専門家でなくても使えるAI (誰でも使えるAI):
- AI技術は専門性が高いですが、ビジネスのことをよく知っている現場の人や経営層など、より多くの人が気軽にAIを使える環境が求められています。
- 例えば、ビジネス部門の人が、普段使っている言葉でAIに問いかけ、試行錯誤しながらビジネス価値を探せるような仕組みが必要です。
-
すぐに新しいAI機能にアクセスできる環境:
- 新しいAIモデルを使うために、複雑な準備や設定が必要だと、なかなか活用が進みません。Snowflakeでは、AIモデルをデプロイする手間などを省略し、すぐに使える簡易性が重要だと考えています。
-
データの移動は不要! (ガバナンスとセキュリティ):
- AIを使うために、データを別の専用環境に移動させると、せっかく効かせていたデータの管理ルール(ガバナンス)が効かなくなってしまうことがあります。特に本番環境で使う場合は、セキュリティ面で問題になることも。
- Snowflakeなら、すでにガバナンスが効いて安全性が確保されたデータを、移動させることなくそのままAIと組み合わせることができます。
Snowflakeは、1つのプラットフォームの中で、統一されたデータ、モデル、インフラの上に、生成AIと**機械学習(ML)**の両方の機能を提供しています。
(画像はイメージです)
生成AIと機械学習は、どちらが優れているというものではなく、ビジネスの目的に応じて使い分けることが大切です。Snowflakeなら、これらを別々の環境で扱う必要がないため、準備に時間をかけず、比較検証もスムーズに行えます。試行錯誤がしやすい最適なプラットフォームなのです。
Snowflakeの生成AI「Cortex AI」
Snowflakeの生成AI機能群は「Cortex AI」と呼ばれます。
-
選べる豊富なAIモデル:
- Snowflake自身が開発した大規模言語モデル(LLM)だけでなく、Anthropic社のClaude、Meta社のLlama、Mistral AI社のモデル、OpenAI社のモデル(今後対応予定)など、商用モデルからオープンソースのモデルまで、状況に応じて自由に選べます。
- 「どのLLMが一番優れているか?」という問いに絶対的な答えはありません。性能、価格、速度、信頼性、日本語の使いやすさなど、評価ポイントは様々で、時期によっても最適なモデルは変わってきます。だからこそ、すぐにモデルを切り替えられ、同じようにアクセスできることが重要です。
-
すぐに使えるAI機能:
- Cortex Agent、Cortex Analyst、Cortex Searchなど、AIモデルをベースにした便利な機能が提供されています。(詳細は他のセッションで紹介)
-
分析の流れで自然にAIを活用:
- 特別なAI画面に切り替えたり、機能を有効化したりする必要はありません。普段使っているSQL(データを操作するための言語)から直接AI機能を呼び出せます。
- 例えば、
SELECT
文(データを取ってくる命令)の中で、AIに「このデータを使って〇〇を要約して」といった指示を出すだけで、AIからの回答が得られます。
-
データ分析アシスタント機能:
- 分析画面から呼び出すと、自然言語(日本語など)で「このデータベースにはどんなテーブルがあるの?」と聞けばテーブル一覧と解説が表示されたり、「このテーブルについて、〇〇の観点で分析したい」と伝えれば、適切なSQLを生成して実行し、結果を表示してくれたりします。
- 特別な準備は不要で、Snowflakeにログインすればすぐに使えます。Snowflakeでは、AIを活用した分析が当たり前にできる環境が提供されているのです。
機械学習もSnowflakeで完結「Snowflake ML」
生成AIだけでなく、予測、分類、異常検知、独自のアルゴリズムを使った分析など、機械学習のタスクもSnowflakeだけで完結できます。データの前処理(特徴量エンジニアリング)から、モデルのトレーニング、推論までを一気通貫で実装可能です。
ステップ3:アプリケーションの構築 〜価値を広げる、みんなで使う〜
AIでデータから価値を引き出したら、それを自分だけで使って終わりではありません。他の部署や企業に届けたり、同じようにAIを使って価値を生み出せる仕組みを他の人にも提供したりすることが重要です。
そのために必要になるのが、インターフェースを備えたデータアプリケーションです。
データアプリケーションを作って配布するためには、どんなことが求められるでしょうか?
-
簡単にアプリ開発&利用:
- データ分析とウェブアプリケーション開発は、必要な技術も人も全く異なります。UI(ユーザーインターフェース)を持つウェブアプリは複雑になりがちで、効果が不確かな状態での開発はハードルが高いものです。
- Snowflakeは、データを使って簡単にアプリケーションを開発し、利用できる仕組みを提供します。
-
運用が楽で、スケーラビリティも高い:
- テストでは問題なくても、本番で使うとなると運用設計や、たくさんの人が同時に使っても大丈夫か(スケーラビリティ)といった問題が出てきがちです。
- Snowflakeは、運用負荷が小さく、スケーラビリティの高いアプリケーションを動かせるプラットフォームを目指しています。
-
展開しやすい:
- 最初は部署内だけで使っていたアプリを、会社全体やお客様に展開しようとすると、セキュリティ、アクセス性、どうやって収益化するか(マネタイズ)、そもそも相手が別のクラウドを使っている、といった様々な問題に直面します。
- Snowflakeは、将来の拡大を見据えた際に、障壁が少なく、展開しやすいアプリケーションプラットフォームを提供します。
これを実現するのが「Streamlit in Snowflake」です。
Streamlit(ストリームリット)は、Pythonというプログラミング言語で、データを使ったウェブアプリケーションを簡単に作れる人気のライブラリです。Snowflakeは、このStreamlitを自社のプラットフォームに組み込みました。
-
Pythonで簡単アプリ開発:
- データアナリストやデータエンジニアにとって馴染み深く、比較的習得しやすいPythonで、データ活用のウェブアプリを作成できます。
-
Snowflake内のデータに安全・簡単にアクセス:
- Snowflakeに組み込まれているので、Snowflake内のデータに簡単かつ安全にアクセスし、表示したり、分析結果をアプリに組み込んだりできます。
-
AIアプリも最短で:
- Cortex AIの機能を呼び出して、AIを活用したアプリケーションも素早く作って展開できます。
-
軽量かつセキュア:
- Pythonの自由度を持ちつつ、ソースコード1つでデプロイできる手軽さ。そして、Snowflake内で完結できるセキュリティを備えています。
Streamlit in Snowflakeを使うと、データ活用の仕方がこう変わります。
- これまで: ビジネスユーザーがデータ分析を依頼 → データアナリスト/エンジニアが分析 → 結果を報告 (時間がかかる、自由な分析がしにくい)
- Streamlit in Snowflake: データアナリスト/AIエンジニアがStreamlitでアプリを作成 → ビジネスユーザー/経営層が自分でアプリを操作して主体的にデータ分析 (欲しい時にすぐ分析できる、リアルタイムなデータ取得、創造的な分析が可能に)
さらに、Snowflakeでは「ネイティブアプリケーション」という機能を使って、作成したデータアプリケーションをパッケージ化し、配布することができます。
その配布チャネルの一つが「Snowflakeマーケットプレイス」です。
すでに720社以上のデータ提供者と、3000種類以上のデータやアプリケーションが展開されている大規模なデータ交換プラットフォームです(2024年10月時点のウェビナー情報より)。
ここであなたが作ったアプリケーションを公開したり、他の企業が作ったアプリケーションを利用したりできます。もちろん、特定の企業間だけで非公開にデータやアプリケーションをやり取りすることも可能です。
Snowflakeの中では、このようなコラボレーションが当たり前に行われており、プラットフォーム内のコンテンツ(データやアプリ)がどんどん充実していっています。
まとめ:変化を恐れず、ビジネスを変革しよう!
今回のセッションでは、Snowflake AIデータクラウドの概要と、その根幹をなすアーキテクチャについて解説がありました。
キーメッセージは「データアーキテクチャを破壊せずに、今後テクノロジーの進化とともに発生してくる変化に柔軟に対応して、そして皆様のビジネスをぜひ変革していただければ」というものです。
Snowflakeは、データがどこにあっても、どんな種類であっても、そしてこれからどんな変化が起きても、柔軟に対応できるプラットフォームを提供することで、皆さんのデータ活用とAIによるビジネス価値創造を力強くサポートします。
この記事が、Snowflakeについて少しでも理解を深めるきっかけになれば嬉しいです。
※本記事は、Snowflake Discover Japan 202504 のウェビナー「【Session 1】 ゼロから始めるSnowflake_ モダンなデータ&AIプラットフォームの構築」の内容を元に作成しました。より詳しく知りたい方は、ぜひ実際のウェビナーも視聴してみてください(登録が必要です、動画は視聴のみでダウンロードなどはできません)。
https://www.snowflake.com/about/webinars/snowflake-discover-japan-202504/
Discussion