NTT DATA TECH
❄️

SQLと自然言語のハイブリッド!Snowflake AI FILTERを試してみた

に公開

はじめに

2025年6月2日~6月5日で開催されたSnowflake Summit 2025において、ワクワクする新機能が多数発表されました。
その中で発表されたCortex AISQLにおけるAI_FILTERが、手間暇かかる加工を省略できデータ活用のハードルを下げてくれるような機能と感じたため、早速試してみたいと思います!

お試しに使うデータ

AI_FILTERを試すにあたって、回線のマスタと回線の障害報告を模したデータを作成しました。
※お試し用なので、データとして不自然な点はご容赦ください..!

  • 回線マスタ:circuit_master
circuit_name bandwidth_mbps redundancy
新宿本社~渋谷支店 1000 冗長あり
東京第1DC~品川営業所 2000 冗長なし
心斎橋支店~梅田本館 1000 冗長あり
川崎倉庫~横浜支店 500 冗長なし
大阪DC~京都支店 1500 冗長あり
  • 障害報告:circuit_inquiry
    回線名について、区間の逆順や記号違いなどさまざまな表記ゆれがあるように作成しています。
circuit_name contact_person report_date issue_summary
渋谷支店↔新宿本社 佐藤 健 2025-06-01 pingが全く返らず、接続できない状態が継続中です
東京第1DC-品川営業所 中村 麻美 2025-06-01 VPNが確立せず、品川営業所から本社にアクセスできません
梅田本館→心斎橋支店 岡田 亮介 2025-06-02 すべての通信が断絶。telnetも失敗しています
川崎倉庫-横浜 鈴木 達也 2025-06-03 午後から通信が著しく遅くなっています。応答に数秒かかる状態です
新宿 本社〜渋谷 支店 伊藤 佳奈 2025-06-03 Teams通話に遅延が発生し、音声が途切れることがあります
Osaka DC ↔ Kyoto支店 小林 拓 2025-06-04 BGPセッションが断続的に切断され、経路が安定しません
Tokyo DC ← Shinagawa Br. David Chen 2025-06-04 ルータが応答せず、現地で再起動対応中です

where句で試してみた

AI_FILTERは、入力されたプロンプトをブール値(True or False)で分類した結果を返却するので、where句と組み合わせてフィルタリングができます。
障害報告で入力された回線名をもとに関東圏のデータを取得してみます。

select
  *
from
  circuit_inquiry
where
  ai_filter(prompt('{0} is in the Kanto region', circuit_name)) -- 回線が関東に含まれるか判別
;

取得結果は以下となりました。

期待通り、関東圏のデータのみ取得できています。
回線名は表記ゆれがありますが、問題なく取得できていますね!
続いて、障害報告から通信遅延に関するデータを取得してみます。

select
  *
from
  circuit_inquiry
where
  ai_filter(prompt('{0} is regarding a delay', issue_summary)) -- 障害報告に遅延に言及しているか判別
;

取得結果は以下となりました。

概ね遅延に関する障害情報が取得できていますね!
"ルータの応答なし"は機器障害を想定していましたが、"応答せず"という文言に引っ張られたのか取得されてしまったようです。
ただ、手動で分類したとしても揺れるところだとは思いますので、あくまでも生成AIによる分類結果ということを忘れずに活用することが重要ですね。

join句で試してみた

前述の通りAI_FILTERはブール値を返却するので、join時のon句に用いることでテーブル間の結合にも活用することができます。
表記ゆれのある障害報告の回線名とマスタの回線名を用いて結合できるか試してみます。

select
  t1.circuit_name,
  t1.issue_summary,
  t2.circuit_name as circuit_name_master,
  t2.bandwidth_mbps,
  t2.redundancy
from
  circuit_inquiry t1  -- 障害報告
  inner join circuit_master t2  -- 回線マスタ
  -- 区間が同じものを同じ回線として紐づけ
  on ai_filter(prompt( '{0} is same section with {1}', t1.circuit_name, t2.circuit_name))
;

取得結果は以下となりました。

すごい、見事に想定通り、すべて紐づけが出来ています!
本来であれば名寄せをしないと紐づかなかったデータが、事前加工なく従来のSQLとほぼ同じ記法で紐づけて取得できるというのは感動ですね!
自然言語で関係性を記述すれば紐づけられるので、親子関係の紐づけや担当者のアサイン、好みに応じたマッチングなどさまざまな用法が想像でき、活用の幅が広がっていきそうです。

おわりに

今回は新機能のAI_FILTER試してみました。
これまで事前に名寄せや分類の付与など事前に加工が必要なデータでも手軽に活用できる、まさに痒いところに手が届く機能だと感じました。
本文中で言及した通り、あくまでも生成AIによる結果なので100%にするには地道な対応が必要になりますが、十分活用できる範囲と感じましたので、ぜひみなさんもお試しください!

仲間募集

NTTデータ コンサルティング事業本部 では、以下の職種を募集しています。

Snowflake、生成AIを活用したデータ基盤構築/活用支援(Snowflake Data Superheroesとの協働)
Databricks、生成AIを活用したデータ基盤構築/活用支援(Databricks Championとの協働)
プロジェクトマネージャー(データ分析プラットフォームソリューションの企画~開発~導入/生成AI活用)
クラウドを活用したデータ分析プラットフォームの開発(ITアーキテクト/PM/クラウドエンジニア)

ソリューション紹介

Trusted Data Foundationについて

~データ資産を分析活用するための環境をオールインワンで提供するソリューション~
https://www.nttdata.com/jp/ja/lineup/tdf/
最新のクラウド技術を採用して弊社が独自に設計したリファレンスアーキテクチャ(Datalake+DWH+AI/BI)を顧客要件に合わせてカスタマイズして提供します。
可視化、機械学習、DeepLearningなどデータ資産を分析活用するための環境がオールインワンで用意されており、これまでとは別次元の量と質のデータを用いてアジリティ高くDX推進を実現できます。

TDFⓇ-AM(Trusted Data Foundation - Analytics Managed Service)について

~データ活用基盤の段階的な拡張支援(Quick Start) と保守運用のマネジメント(Analytics Managed)をご提供することでお客様のDXを成功に導く、データ活用プラットフォームサービス~
https://www.nttdata.com/jp/ja/lineup/tdf_am/
TDFⓇ-AMは、データ活用をQuickに始めることができ、データ活用の成熟度に応じて段階的に環境を拡張します。プラットフォームの保守運用はNTTデータが一括で実施し、お客様は成果創出に専念することが可能です。また、日々最新のテクノロジーをキャッチアップし、常に活用しやすい環境を提供します。なお、ご要望に応じて上流のコンサルティングフェーズからAI/BIなどのデータ活用支援に至るまで、End to Endで課題解決に向けて伴走することも可能です。

NTTデータとSnowflakeについて

NTTデータとSnowflakeについて
NTTデータでは、Snowflake Inc.とソリューションパートナー契約を締結し、クラウド・データプラットフォーム「Snowflake」の導入・構築、および活用支援を開始しています。
NTTデータではこれまでも、独自ノウハウに基づき、ビッグデータ・AIなど領域に係る市場競争力のあるさまざまなソリューションパートナーとともにエコシステムを形成し、お客さまのビジネス変革を導いてきました。
Snowflakeは、これら先端テクノロジーとのエコシステムの形成に強みがあり、NTTデータはこれらを組み合わせることでお客さまに最適なインテグレーションをご提供いたします。
https://www.nttdata.com/jp/ja/lineup/snowflake/

NTTデータとDatabricksについて

NTTデータは、お客様企業のデジタル変革・DXの成功に向けて、「databricks」のソリューションの提供に加え、情報活用戦略の立案から、AI技術の活用も含めたアナリティクス、分析基盤構築・運用、分析業務のアウトソースまで、ワンストップの支援を提供いたします。
https://www.nttdata.com/jp/ja/lineup/databricks/

NTTデータとInformaticaについて

NTTデータとInformaticaについて
データ連携や処理方式を専門領域として10年以上取り組んできたプロ集団であるNTTデータは、データマネジメント領域でグローバルでの高い評価を得ているInformatica社とパートナーシップを結び、サービス強化を推進しています。
https://www.nttdata.com/jp/ja/lineup/informatica/

NTTデータとTableauについて

NTTデータとTableauについて
ビジュアル分析プラットフォームのTableauと2014年にパートナー契約を締結し、自社の経営ダッシュボード基盤への採用や独自のコンピテンシーセンターの設置などの取り組みを進めてきました。さらに2019年度にはSalesforceとワンストップでのサービスを提供開始するなど、積極的にビジネスを展開しています。
これまでPartner of the Year, Japanを4年連続で受賞しており、2021年にはアジア太平洋地域で最もビジネスに貢献したパートナーとして表彰されました。
また、2020年度からは、Tableauを活用したデータ活用促進のコンサルティングや導入サービスの他、AI活用やデータマネジメント整備など、お客さまの企業全体のデータ活用民主化を成功させるためのノウハウ・方法論を体系化した「デジタルサクセス」プログラムを提供開始しています。
https://www.nttdata.com/jp/ja/lineup/tableau/

NTTデータとAlteryxについて

NTTデータとAlteryxについて
Alteryxは、業務ユーザーからIT部門まで誰でも使えるセルフサービス分析プラットフォームです。
Alteryx導入の豊富な実績を持つNTTデータは、最高位にあたるAlteryx Premiumパートナーとしてお客さまをご支援します。
導入時のプロフェッショナル支援など独自メニューを整備し、特定の業種によらない多くのお客さまに、Alteryxを活用したサービスの強化・拡充を提供します。
https://www.nttdata.com/jp/ja/lineup/alteryx/

NTTデータとDataRobotについて

NTTデータとDataRobotについて
DataRobotは、包括的なAIライフサイクルプラットフォームです。
NTTデータはDataRobot社と戦略的資本業務提携を行い、経験豊富なデータサイエンティストがAI・データ活用を起点にお客様のビジネスにおける価値創出をご支援します。
https://www.nttdata.com/jp/ja/lineup/datarobot/

NTT DATA TECH
NTT DATA TECH

Discussion