データカタログAlationにおけるAI関連の動向(後編)—AI関連の動向—
はじめに
近年、企業活動におけるデータ活用の重要性はますます高まっています。
その中で 「メタデータ」(※1)の管理は、効率的かつ持続的なデータ活用を実現する上で欠かせない要素です。
メタデータを管理するソリューションに「データカタログ」がありますが、 本稿で取り上げる 「Alation Agentic Data Intelligence Platform」 (以下「Alation」と記載)は、 従来のデータカタログという枠を超え、カタログ機能・ガバナンス機能・エージェント型自動化を統合。人間もAIも、信頼できるデータを発見し、理解し、活用できるようにします。
※1. メタデータ
-
メタデータとは
- データの値そのものではなく、データの意味や構造、特性といったデータに関する付随情報。
-
メタデータの種類
- メタデータには、「テクニカルメタデータ」、「ビジネスメタデータ」、「オペレーショナルメタデータ」がある。
-
テクニカルメタデータ
- システムがデータを格納・処理するためのメタデータ。システム運用・保守の効率を高める。
- テーブルの物理名、カラムの物理名、カラムのデータ型、構造情報(インデックス、主キー、外部キー)、ETLマッピング、データリネージュなど。
-
ビジネスメタデータ
- 業務の文脈でデータの意味や関連する業務ルールや利用ルールを理解するためのメタデータ。
- データの利活用を促進したり、共通的な概念や用語や定義を整理することで組織間の意思疎通をスムーズにしたり、ガバナンス・コンプライアンスを強化したりする。
- テーブルの論理名、テーブルの説明(意味、用途、関連する業務ルール、利用ルールなど)、カラムの論理名、カラムの説明(意味、用途、関連する業務ルール、利用ルールなど)、データオーナー、ビジネス用語、データに関するポリシー・法規制など。
-
オペレーショナルメタデータ
- データが実際にシステム内でどのように処理・運用・移動・変換されているかを記録・管理するためのメタデータ。
- データパイプラインの可視化、運用の最適化、ガバナンス強化と監査対応に役立つ。
- ジョブログ、バックアップ・保存・実行日付・災害復旧などの規定、廃棄基準、データリネージュなど。
国際的なデータ専門家で組織された非営利団体 DAMA International が策定した「DAMA-DMBOK : Data Management Body of Knowledge: 2nd Edition」(日本語版タイトル「 データマネジメント知識体系ガイド 第二版 」)の第12章メタデータでの説明に独自の解釈を加えております。
今回の記事の内容
今回は 前後編の2回に分けて、AlationにおけるAI関連の動向をご紹介いたします。
前回は前段として、 データカタログの概要とメリットを整理し、Alationの強みを紹介しました。
本稿ではいよいよAlationのAI関連の動向をご紹介いたします。
AI関連の動向
さて、本題です。
Alation, Inc.(以降「Alation社」と記載)が発表したAgentic Platform としては、現在、以下のエージェントを提供しています。
- Documentation Agent
- Data Quality Agent
- Data Products Builder Agent
本記事では上記とあわせて、Alationの機能を活用して独自のAIエージェントを構築できるようにする AI Agent SDK もご紹介します。
(出典:〔画像〕「Alation Agentic Data Intelligence Platform」Alation, Inc., https://www.alation.com/product/agentic-data-intelligence-platform/ ,最終アクセス:2025-09-25)
Documentation Agent
Documentation Agent は、 ドキュメント作成・整備の手作業を削減 し、一貫した記述を実現します。現時点で次の2つの機能があります。いずれも人間のレビューを前提とし、信頼性を保ちます(Human-in-the-Loop)。
ALLIE AI Suggested Descriptions
ALLIE AI Suggested Descriptions は、 テクニカルメタデータの説明欄に記述すべき内容をGenAIで生成し、データスチュワードに提案する機能です。
(2025年9月現在生成できるのは、あいにく英文のみです。日本語文も生成できるようにしてほしいというリクエストは挙がっている ものの、現時点では未対応です。なお、リンク先はログインが必要なページです。ユーザー登録後閲覧できます)。
詳細は ALLIE AI Suggested Descriptions — Alation User Guide をご覧ください。
Lexicon and Auto-Titling
Lexicon and Auto-Titling は、 テーブルやカラムの物理名に含まれる略語から元の語を推測し、論理名としてデータスチュワードに提案する機能です。
(こちらも現時点では英語のみの対応です。)
(出典:〔画像〕「Lexicon and Auto-Titling — Alation User Guide」Alation, Inc., https://docs.alation.com/en/latest/steward/AutoTitlingandLexicon/index.html ,最終アクセス:2025-09-25)
詳細は Lexicon and Auto-Titling — Alation User Guide をご覧ください。
Data Quality Agent
Data Quality Agent は、 データ品質に関連する機能です。
前提として、2024年末まで、Alationが提供するデータ品質関連機能は次の2つでした。
- Open Data Quality Initiative の取り組みを通じた Bigeye や Soda などのデータ品質分析オンラインサービスからのデータ品質情報の取り込み
- Data Quality Processor での Snowflake や Databricks からのデータ品質情報の取り込み
後者に代わって、2025年に新たに提供を開始したのが、Alation Data Quality Agent です。
前述の2つとは異なり、Alation自身でデータ品質分析をします。
品質分析をし、別途品質を改善することで、 壊れたBIダッシュボードや機械学習の不具合を未然に防止 し、また、 AIアプリケーション/AIエージェントに供給されるデータの品質を担保 します。
特徴は次の通りです。
- 行動分析エンジンにより重要なデータアセット(テーブルなど)をインテリジェントに優先順位付けし、無駄なモニタリングリソースの浪費を抑制します。
- ユーザーがデータ品質チェックのルールを定義せずとも、AIエージェント主導のワークフローが、最適なチェック項目をインテリジェントに推奨・適用することもできます。その際、人間のレビューを前提とし、信頼性を保ちます(Human-in-the-Loop)。
- データ品質分析にて異常が発生した場合、画面で確認できるほか、メールやSlackなどにも通知できます。
これにより、効率的なデータ品質管理が可能となります。
以下のスクリーンショットは、Data Quality Agentを動作確認した際のものです。
まず、AIが監視すべき重要なデータアセットを特定します。
次に、チェックルールを定義していきます(今回は手作業)。
最後に、実行スケジュールや通知先を設定します。
実行すると、今のデータの状況はチェックルールで指定したしきい値を満たしていない旨のメールが届きました(想定通り)。
詳細は Intelligent Data Quality Monitoring — Alation User Guide をご覧ください。
Data Quality Agentについては、後日、別記事にて詳細に取り上げる見込みです。
Data Products Builder Agent
Data Products Builder Agent は、 「データプロダクト」を効率的に作るための機能です。
「データプロダクト」とは、商品のようにパッケージ化されたデータを指し、品質が担保され、説明が付与され、再利用可能な形に整えられたデータのことです。
この「データプロダクト」を作成、管理、消費できるようにする基盤が、 Data Products Marketplace です。
(出典:〔画像〕「Find a Data Product — Alation User Guide」Alation, Inc., https://docs.alation.com/en/latest/DataProductsandMarketplace/FindandUseData.html ,最終アクセス:2025-09-25)
(出典:〔画像〕「Use Data Products — Alation User Guide」Alation, Inc., https://docs.alation.com/en/latest/DataProductsandMarketplace/FindandUseData.html ,最終アクセス:2025-09-25)
このMarketplaceでは、YAML(※2)ベースの標準仕様 ODPS (※3)形式のファイルをアップロードして、データプロダクトを作成・管理します。
※2. YAML
YAMLは「YAML Ain’t Markup Language」の略で、人間が読み書きしやすいことを重視したデータ記述フォーマット。
※3. ODPS: Open Data Product Specification
ODPS(Open Data Product Specification)は、データプロダクトの定義・管理に必要なメタデータを標準化する、ベンダーニュートラルでマシンリーダブルなYAMLベースのオープンソース仕様。
ODPSを使用することにより、異なるシステム/カタログ間での相互運用性が高まる。
公式サイト
AlationがODPSを採用した理由は下記記事を参照のこと。
How Standardized Data Product Specifications Drive Business Value | Alation & Dr. Jarkko Moilanen
このODPSファイルを手作業で書くことも可能ですが、2025年に発表された Data Products Builder Agent の支援を受けて効率的に作成することもできます。
カタログ管理者が、AIエージェントにデータプロダクトの目的を分かりやすく入力する( 例:「ホリデーキャンペーン中の顧客エンゲージメントの増加を測定する」 )と、1)Alation内のメタデータとGenAIを活用して、データプロダクトに適したデータアセット(テーブルなど)を提案し、2)説明文を生成し、3)データプロダクトオーナーを提案し、4)その他のメタデータの作成もおこないODPSファイルを作成します。その後、カタログ管理者は内容をリファイン(Human-in-the-Loop)して、データプロダクトをData Products Marketplaceに公開するだけです。
(出典:〔画像〕「Trusted & AI-Ready - Data Products Builder Agent | Alation」Alation, Inc., https://docs.alation.com/en/latest/DataProductsandMarketplace/FindandUseData.html ,最終アクセス:2025-09-25)
(出典:〔画像〕「Trusted & AI-Ready - Data Products Builder Agent | Alation」Alation, Inc., https://docs.alation.com/en/latest/DataProductsandMarketplace/FindandUseData.html ,最終アクセス:2025-09-25)
詳細は Data Products App — Alation User Guide をご覧ください。
Data Products MarketplaceおよびData Products Builder Agentについては、後日、別記事にて詳細に取り上げる見込みです。
AI Agent SDK
AI Agent SDK は、 Alationの機能を活用してAIエージェントを構築できるようにするものです。
このSDKは、 Anthropic PBC (以降「Anthropic社」と記載)が提唱したAIアプリケーション/AIエージェントを外部システムに接続するためのオープンプロトコル 「MCP」(※4)に対応しており、AIアプリケーション/AIエージェントがAlationのメタデータを活用できるようになります。
※4. MCP (Model Context Protocol)
2024年にAnthropic社が発表したオープンプロトコル。AIアプリケーション/AIエージェントと外部システムの接続を標準化したもの。
公式サイト
通常は上記の通り、AIアプリケーション/AIエージェントからAlationを呼び出しますが、今回は簡易的に確認するため、 MCP Inspector を使って、簡易的に動作確認をしてみました。
まず、「顧客情報が含まれているテーブルはどれですか?」と聞いてみます。
Snowflakeのテーブル「CUSTOMER」の情報が返却されました。
応答に含まれるURLを開いたところ、テーブル「CUSTOMER」のページが開きました。
次に、「営業利益に関するドキュメントを教えてください。」と聞いてみます。
ビジネス用語「営業利益」の情報が返却されました。
応答に含まれるURLを開いたところ、ビジネス用語「営業利益」のページが開きました。
単純ではありますが、AIアプリケーション/AIエージェントと組み合わせることで、それらの利点を高められます。
たとえば、次のようなユースケースが考えられます。
- Claude DesktopやCursorなど、チームで既に利用しているMCP対応AIアプリケーションから、自然言語で社内データに関して質問すると、社内の複数のデータソースのスキーマ/テーブル/カラム/SQLクエリ/ビジネス用語/BIオブジェクトを横断してメタデータを取得し、回答する。
- AIアプリケーション/AIエージェントが、MCP経由で、テーブルの説明に加えてサンプル値や頻出の結合先テーブルなどのメタデータを取得する。そして、AIアプリケーション/AIエージェントがこれらの根拠情報に基づいて分析用SQLを組み立てれば、前提情報がない状態で作成する場合と比べて、結合キーの選定やフィルタ条件の妥当性が高まり、分析の正確性と再現性が向上する。
詳細は GitHub - Alation/alation-ai-agent-sdk: Python library for integrating the Alation API into agentic workflows をご覧ください。
【参考】Alation社の概要
- 2012年設立
- 従業員数 850名
- 650以上の顧客(Fortune 100(※5)の40%以上の利用)
- 3年連続 Snowflake パートナー・オブ・ザ・イヤー受賞
※5. Fortune 100
「Fortune 100」とは、アメリカの経済誌『Fortune』によって毎年発表される「Fortune 500」の中から上位100社を特に指す用語。「Fortune 500」とは、米国内で営業している企業の中から総収入が最も高い500社をランキングしたもの。
おわりに
以上、「データカタログAlationにおけるAI関連の動向」でした。
いかがでしたか。本稿を通じて、「AIによるデータカタログの管理の効率化」や「AIのための(データカタログの)メタデータの提供」の世界を、具体的にイメージしていただけたのではないでしょうか。
ざっくりおさらいすると…
機能 | 何をする? | 誰が得する? | 代表的な成果物/効果 |
---|---|---|---|
Documentation Agent | テーブル/カラム説明のたたき台生成 | データスチュワード | 「説明が空欄」を減らす、検索ヒット率向上 |
Data Quality Agent | 重要データの検知→チェック自動提案→通知 | データオーナー、カタログ管理者 | ルール記述なしで監視開始、異常の早期検知 |
Data Products Builder Agent | 目的を入れると候補データ+説明+定義ファイルを生成 | カタログ管理者 | 「使える形」のデータが早く揃う、再利用促進 |
AI Agent SDK | AIからのメタデータ参照 | データ分析者 | AIでのデータ分析時に根拠を踏まえて回答 |
個人的には、今後、 GenAIによる対話型の分析支援が一層加速する と見ています。実例としては、 Snowflake Cortex Analyst や Databricks One などが挙げられます。
このような環境下では、 データに対して文脈(コンテキスト)を提供し、かつ信頼性を担保する基盤の重要性がこれまで以上に高まります。
なかでも今回ご紹介したAlationは、 MCPに対応しており各種GenAIから直接問い合わせが可能であり 、またデータの信頼性を管理する方法もある( データリネージュ や 信頼性フラグ など)ため、各種GenAIとの連携に非常に適しています。
これにより、 GenAIがデータの文脈(コンテキスト)を踏まえて分析でき、より精度の高い、信頼性のあるデータ活用が実現できる と考えています。
データカタログAlationに関するお問い合わせは、
Alation問合せ窓口 nttd_alation@hml.nttdata.co.jp までお問い合わせください。
仲間募集
NTTデータ ソリューション事業本部 では、以下の職種を募集しています。
Snowflake、生成AIを活用したデータ基盤構築/活用支援(Snowflake Data Superheroesとの協働)
Databricks、生成AIを活用したデータ基盤構築/活用支援(Databricks Championとの協働)
プロジェクトマネージャー(データ分析プラットフォームソリューションの企画~開発~導入/生成AI活用)
クラウドを活用したデータ分析プラットフォームの開発(ITアーキテクト/PM/クラウドエンジニア)
ソリューション紹介
Trusted Data Foundationについて
~データ資産を分析活用するための環境をオールインワンで提供するソリューション~
可視化、機械学習、DeepLearningなどデータ資産を分析活用するための環境がオールインワンで用意されており、これまでとは別次元の量と質のデータを用いてアジリティ高くDX推進を実現できます。
TDFⓇ-AM(Trusted Data Foundation - Analytics Managed Service)について
~データ活用基盤の段階的な拡張支援(Quick Start) と保守運用のマネジメント(Analytics Managed)をご提供することでお客様のDXを成功に導く、データ活用プラットフォームサービス~
TDFⓇ-AMは、データ活用をQuickに始めることができ、データ活用の成熟度に応じて段階的に環境を拡張します。プラットフォームの保守運用はNTTデータが一括で実施し、お客様は成果創出に専念することが可能です。また、日々最新のテクノロジーをキャッチアップし、常に活用しやすい環境を提供します。なお、ご要望に応じて上流のコンサルティングフェーズからAI/BIなどのデータ活用支援に至るまで、End to Endで課題解決に向けて伴走することも可能です。NTTデータとSnowflakeについて
NTTデータでは、Snowflake Inc.とソリューションパートナー契約を締結し、クラウド・データプラットフォーム「Snowflake」の導入・構築、および活用支援を開始しています。
NTTデータではこれまでも、独自ノウハウに基づき、ビッグデータ・AIなど領域に係る市場競争力のあるさまざまなソリューションパートナーとともにエコシステムを形成し、お客さまのビジネス変革を導いてきました。
Snowflakeは、これら先端テクノロジーとのエコシステムの形成に強みがあり、NTTデータはこれらを組み合わせることでお客さまに最適なインテグレーションをご提供いたします。
NTTデータとDatabricksについて
NTTデータは、お客様企業のデジタル変革・DXの成功に向けて、「databricks」のソリューションの提供に加え、情報活用戦略の立案から、AI技術の活用も含めたアナリティクス、分析基盤構築・運用、分析業務のアウトソースまで、ワンストップの支援を提供いたします。
NTTデータとTableauについて
ビジュアル分析プラットフォームのTableauと2014年にパートナー契約を締結し、自社の経営ダッシュボード基盤への採用や独自のコンピテンシーセンターの設置などの取り組みを進めてきました。さらに2019年度にはSalesforceとワンストップでのサービスを提供開始するなど、積極的にビジネスを展開しています。
これまでPartner of the Year, Japanを4年連続で受賞しており、2021年にはアジア太平洋地域で最もビジネスに貢献したパートナーとして表彰されました。
また、2020年度からは、Tableauを活用したデータ活用促進のコンサルティングや導入サービスの他、AI活用やデータマネジメント整備など、お客さまの企業全体のデータ活用民主化を成功させるためのノウハウ・方法論を体系化した「デジタルサクセス」プログラムを提供開始しています。
NTTデータとDataRobotについて
DataRobotは、包括的なAIライフサイクルプラットフォームです。
NTTデータはDataRobot社と戦略的資本業務提携を行い、経験豊富なデータサイエンティストがAI・データ活用を起点にお客様のビジネスにおける価値創出をご支援します。

NTT DATA公式アカウントです。 技術を愛するNTT DATAの技術者が、気軽に楽しく発信していきます。 当社のサービスなどについてのお問い合わせは、 お問い合わせフォーム nttdata.com/jp/ja/contact-us/ へお願いします。