NTT DATA TECH
📖

データカタログAlationにおけるAI関連の動向(前編)—データカタログの概要とAlationの強み—

に公開

はじめに

近年、企業活動におけるデータ活用の重要性はますます高まっています。
その中で 「メタデータ」(※1)の管理は、効率的かつ持続的なデータ活用を実現する上で欠かせない要素です。

メタデータを管理するソリューションに「データカタログ」がありますが、 本稿で取り上げる 「Alation Agentic Data Intelligence Platform (以下「Alation」と記載)は、 従来のデータカタログという枠を超え、カタログ機能・ガバナンス機能・エージェント型自動化を統合。人間もAIも、信頼できるデータを発見し、理解し、活用できるようにします。

※1. メタデータ
  • メタデータとは
    • データの値そのものではなく、データの意味や構造、特性といったデータに関する付随情報。
  • メタデータの種類
    • メタデータには、「テクニカルメタデータ」、「ビジネスメタデータ」、「オペレーショナルメタデータ」がある。
  • テクニカルメタデータ
    • システムがデータを格納・処理するためのメタデータ。システム運用・保守の効率を高める。
    • テーブルの物理名、カラムの物理名、カラムのデータ型、構造情報(インデックス、主キー、外部キー)、ETLマッピング、データリネージュなど。
  • ビジネスメタデータ
    • 業務の文脈でデータの意味や関連する業務ルールや利用ルールを理解するためのメタデータ。
    • データの利活用を促進したり、共通的な概念や用語や定義を整理することで組織間の意思疎通をスムーズにしたり、ガバナンス・コンプライアンスを強化したりする。
    • テーブルの論理名、テーブルの説明(意味、用途、関連する業務ルール、利用ルールなど)、カラムの論理名、カラムの説明(意味、用途、関連する業務ルール、利用ルールなど)、データオーナー、ビジネス用語、データに関するポリシー・法規制など。
  • オペレーショナルメタデータ
    • データが実際にシステム内でどのように処理・運用・移動・変換されているかを記録・管理するためのメタデータ。
    • データパイプラインの可視化、運用の最適化、ガバナンス強化と監査対応に役立つ。
    • ジョブログ、バックアップ・保存・実行日付・災害復旧などの規定、廃棄基準、データリネージュなど。

国際的なデータ専門家で組織された非営利団体 DAMA International が策定した「DAMA-DMBOK : Data Management Body of Knowledge: 2nd Edition」(日本語版タイトル「 データマネジメント知識体系ガイド 第二版 」)の第12章メタデータでの説明に独自の解釈を加えております。

Alationの画面例

AIによるデータカタログの管理の効率化

Alation, Inc.(以降「Alation社」と記載)は、 今年2025年3月、
新たに「Agentic Platform」を発表しました。

同社が蓄積した知見に基づき、現在最も革新的な技術のひとつである 「AI/AIエージェント」を活用して、データカタログの管理・運用のプロセスを自動化・支援するものです。

これまでデータカタログを構築したことのある方の中には、 データカタログの効果を最大化するように管理・運用し続けていくことの難しさ を感じていた方も多いかと思います。

Alationには従来から管理・運用の支援機能がありましたが、それに加えて AI/AIエージェントによって管理・運用のプロセスを自動化・支援する ことにより、データスチュワード(※2)やデータオーナー(※3)の業務を効率化し、ひいては継続的なガバナンスを実現できます。

※2. データスチュワード(data steward)

データスチュワードとは、特定のデータについて日々の品質維持とメタデータ管理、ルールの実装・遵守を主導する実務責任を持つ役割である。
DMBOK2 では下記のように定義されている。

  • 主要メタデータの作成と管理
  • ルールと標準の文書化
  • データ品質課題の管理
  • データガバナンス業務の諸活動の実施

なお、「steward」とは、他人から預かった資産を、責任をもって管理運用する人物(財産管理人)を表す一般英単語。

※3. データオーナー(data owner)

データオーナーとは、特定のデータについて最終的な説明責任と意思決定権限を負う役割である。直訳の「データの所有者」はシステムの責任者を想起させやすいが、システムオーナーが「器」(基盤・運用)の責任を負うのに対し、データオーナーは「中身」(定義・利用方針・ライフサイクルなど)の責任を負うため、両者を区別する(兼務は可だが、意思決定領域を明確に区分する)。
原則として、当該データの価値と業務文脈を最も深く理解するビジネス部門の個人が担うことが望ましい。

Alation Agentic Data Intelligence Platform
(出典:〔画像〕「Alation Agentic Data Intelligence Platform」Alation, Inc., https://www.alation.com/product/agentic-data-intelligence-platform/ ,最終アクセス:2025-09-25)

AIのための(データカタログの)メタデータの提供

さらに、同月、「AI Agent SDK」も発表しました。
これは、 Alationの機能を活用してAIエージェントを構築できるようにするものです。

このSDKは、 Anthropic PBC (以降「Anthropic社」と記載)が提唱したオープンプロトコル 「MCP」(※4)に対応しており、AIアプリケーション/AIエージェントがAlationのガバナンスが効いたメタデータを活用できるようになります。

従来の「人がデータを理解するためのデータカタログ」に加えて、
「AIがデータを理解し、活用するための基盤」を提供する という点で大きな意義があります。

※4. MCP (Model Context Protocol)

2024年にAnthropic社が発表したオープンプロトコル。AIアプリケーション/AIエージェントと外部システムの接続を標準化したもの。
公式サイト

今回の記事の内容

今回は 前後編の2回に分けて、AlationにおけるこれらAI関連の動向をご紹介いたします。
本稿では前段として、 データカタログの概要とメリットを整理し、Alationの強みを紹介します。

データカタログの概要とメリット

まずはAlationを含むデータカタログの概要とメリットをご説明します。

データカタログの概要

現代の企業では、 膨大な量のデータ が日々生成されています。
これらのデータは さまざまな部署、システム、ツールに分散 しており、従来の方法ではそのデータを 効果的に活用することは難しくなっています。

これらのデータを営業活動や意思決定に活かしていくにはデータマネジメントが欠かせません。
その一環として、近年 「データカタログ」が注目されています。

「データカタログ」は、 「メタデータ」を一元的に管理 し、 データの探索、理解、管理、利用を効率化します。
ここで言う「メタデータ」とは、データの値そのものではなく、データの意味や構造、特性といった付随情報のことです。

データカタログを導入し、 適切に運用してメタデータを管理していく ことで、
データカタログは、いわば、 データの「住所録」や「辞書」 として機能します。
つまり、データの保存先、利用方法、データの意味や品質などの重要な情報を効率的に管理・提供することができます。
必要なデータを素早く見つけられるようになり、より深くデータを理解できるようになることで、
迅速で正確な意思決定を可能にします。

さらに、一部のデータカタログは、データの活用ノウハウを蓄積することもできます。
データカタログは、いわば、 データの「レシピ」 としても機能します。
社員間の知識共有が進み、データ活用率が向上 します。

したがって、データカタログは、 組織全体のデータ活用戦略を支える重要な基盤とも言えます。

データカタログのメリット

前パートでは、データカタログの概要と絡めてメリットの一部をご説明しましたが、データカタログの主なメリットを整理しなおすと、以下のようになります。

  • データの可視化と探索の効率化
    • データカタログは、組織内のさまざまな データ資産を可視化 し、データ分析者が必要な情報に迅速にアクセスできる環境を提供します。また、 高度な検索機能 により、キーワードや条件に基づいて目的のデータを素早く発見できます。これにより、データ分析者は データ探索にかかる時間を短縮 し、分析に集中できるようになります。
  • データ理解の促進
    • データカタログには、自動およびデータスチュワードによる手作業で、 テクニカルメタデータおよびビジネスメタデータが体系的に整備 されます。これにより、データ分析者はデータオーナーなどの有識者に負荷をかけず、 データの意味や業務上の背景を把握 できます。
  • コラボレーションの促進
    • データカタログは 部門横断的な情報共有 を可能にし、組織全体での データ活用を推進 します。コメント機能やタグ付け機能を活用することで、 データ分析者間や部門間で知見を共有 しやすくなります。
  • 影響範囲の明確化
    • データカタログにより、 データリネージュ(データの発生源から利用先への流れ)が明確 になるため、システム開発者は 改修や障害発生時の影響範囲を容易に特定 することができます。
  • コンプライアンスとデータガバナンスの強化
    • データの可視化やリネージュの明示 に加え、 分類・属性情報の付与、データオーナーの明確化、ライフサイクルの管理 (保存期間など)、 利用条件(ポリシー)の表示 といった機能を通じて、 統制されたデータマネジメントが可能 になります。これにより、 個人情報保護法GDPRBCBS 239 などの外部規制への対応も含めた、データガバナンスを実現しやすくなります。

NTTデータが考えるAlationの強み

さて次に、本稿の冒頭で「従来のデータカタログという枠を超えている」と表現した「Alation」の強みをご紹介します。

色々な解釈があるかと思いますが、私は次のように考えています。

  • 直感的かつ多面的なデータ探索が可能
    • 一般的なデータカタログでは、データソースの階層構造をたどるか、キーワードで検索するのが主な探索手段です。一方、Alationではそれに加えて、 カスタマイズ可能なホームページ によって部門別やユースケース別にデータを整理・表示できます。 さらに、 テーブルの人気度を算出・表示する ことで、データ分析者はよく使われている有用なテーブルを迅速に特定できます。 これにより、 分析者は直感的かつ目的志向でデータにアクセスできます。
      ホームページのカスタマイズ
      人気度の表示
  • 分析ノウハウのナレッジ化が可能
    • 一般的なデータカタログでは、共通的なビジネスメタデータを記述できる箇所は「ビジネス用語」のみということもあります。一方、Alationは、 データ活用に関する知見を「記事」として記述できる 柔軟なナレッジ共有機能を提供します。 データ活用事例、関連テーブル、関連SQLクエリ、関連BIレポートなどを一つの記事に集約し、組織全体で再利用可能なナレッジとして蓄積できます。また、 よく使うSQLクエリをデータ分析者間で共有できます。 これらにより、 不慣れなデータ分析者でも有識者のノウハウに基づいてデータを理解し、活用することができます。
      分析ノウハウのナレッジ化
  • ソースシステムを跨るリネージュの生成が可能
    • 一般的なデータカタログの中には、データリネージュ(データの発生源から利用先への流れ)の自動生成機能を具備していなかったり、あるいは具備しているものの、単一のソースシステム内のデータリネージュの生成に留まっているものもあります。一方、Alationは、 複数のソースシステムを横断するデータリネージュの自動生成に対応しています。 これにより、システム開発者は、 システム改修時や障害発生時の影響分析が容易となります。 また、データの流れを可視化することで、組織全体としての データガバナンス強化 にも直結します。
      ソースシステムを跨るリネージュ
  • カタログと分析のシームレスな接続が可能
  • カタログの整備状況や利用状況の可視化が可能
  • AI対応
    • Agentic Platform(AIによるデータカタログの管理の効率化)ではAIが支援し、人間が承認することで生産性向上と信頼性を両立します(Human-in-the-loop)(後編で説明)。また、AI Agent SDK(AIのためのメタデータの提供)により、 クリーンでガバナンスが効いたメタデータをAIアプリケーション/AIエージェントへ文脈(コンテキスト)として提供できます (後編で説明)。

    Alation Agentic Data Intelligence Platform
    (出典:〔画像〕「Alation Agentic Data Intelligence Platform」Alation, Inc., https://www.alation.com/product/agentic-data-intelligence-platform/ ,最終アクセス:2025-09-25)

上記の通り、 Alationは従来の「データカタログ」という枠を超え、データの探索・理解・共有・統制・活用を一体化したデータ活用基盤として、人間もAIも、信頼できるデータを発見し、理解し、活用できるようにします。

【参考】Alation社の概要

※5. Fortune 100

「Fortune 100」とは、アメリカの経済誌『Fortune』によって毎年発表される「Fortune 500」の中から上位100社を特に指す用語。「Fortune 500」とは、米国内で営業している企業の中から総収入が最も高い500社をランキングしたもの。

おわりに

以上、「データカタログの概要とメリットの整理およびAlationの強み」でした。

いかがでしたか。次回はいよいよ AlationにおけるAI関連の動向 をご紹介いたします。

データカタログAlationに関するお問い合わせは、
Alation問合せ窓口 nttd_alation@hml.nttdata.co.jp までお問い合わせください。

仲間募集

NTTデータ ソリューション事業本部 では、以下の職種を募集しています。

Snowflake、生成AIを活用したデータ基盤構築/活用支援(Snowflake Data Superheroesとの協働)
Databricks、生成AIを活用したデータ基盤構築/活用支援(Databricks Championとの協働)
プロジェクトマネージャー(データ分析プラットフォームソリューションの企画~開発~導入/生成AI活用)
クラウドを活用したデータ分析プラットフォームの開発(ITアーキテクト/PM/クラウドエンジニア)

ソリューション紹介

Trusted Data Foundationについて

~データ資産を分析活用するための環境をオールインワンで提供するソリューション~
https://www.nttdata.com/jp/ja/lineup/tdf/
最新のクラウド技術を採用して弊社が独自に設計したリファレンスアーキテクチャ(Datalake+DWH+AI/BI)を顧客要件に合わせてカスタマイズして提供します。
可視化、機械学習、DeepLearningなどデータ資産を分析活用するための環境がオールインワンで用意されており、これまでとは別次元の量と質のデータを用いてアジリティ高くDX推進を実現できます。

TDFⓇ-AM(Trusted Data Foundation - Analytics Managed Service)について

~データ活用基盤の段階的な拡張支援(Quick Start) と保守運用のマネジメント(Analytics Managed)をご提供することでお客様のDXを成功に導く、データ活用プラットフォームサービス~
https://www.nttdata.com/jp/ja/lineup/tdf_am/
TDFⓇ-AMは、データ活用をQuickに始めることができ、データ活用の成熟度に応じて段階的に環境を拡張します。プラットフォームの保守運用はNTTデータが一括で実施し、お客様は成果創出に専念することが可能です。また、日々最新のテクノロジーをキャッチアップし、常に活用しやすい環境を提供します。なお、ご要望に応じて上流のコンサルティングフェーズからAI/BIなどのデータ活用支援に至るまで、End to Endで課題解決に向けて伴走することも可能です。

NTTデータとSnowflakeについて

NTTデータでは、Snowflake Inc.とソリューションパートナー契約を締結し、クラウド・データプラットフォーム「Snowflake」の導入・構築、および活用支援を開始しています。
NTTデータではこれまでも、独自ノウハウに基づき、ビッグデータ・AIなど領域に係る市場競争力のあるさまざまなソリューションパートナーとともにエコシステムを形成し、お客さまのビジネス変革を導いてきました。
Snowflakeは、これら先端テクノロジーとのエコシステムの形成に強みがあり、NTTデータはこれらを組み合わせることでお客さまに最適なインテグレーションをご提供いたします。
https://www.nttdata.com/jp/ja/lineup/snowflake/

NTTデータとDatabricksについて

NTTデータは、お客様企業のデジタル変革・DXの成功に向けて、「databricks」のソリューションの提供に加え、情報活用戦略の立案から、AI技術の活用も含めたアナリティクス、分析基盤構築・運用、分析業務のアウトソースまで、ワンストップの支援を提供いたします。
https://www.nttdata.com/jp/ja/lineup/databricks/

NTTデータとTableauについて

ビジュアル分析プラットフォームのTableauと2014年にパートナー契約を締結し、自社の経営ダッシュボード基盤への採用や独自のコンピテンシーセンターの設置などの取り組みを進めてきました。さらに2019年度にはSalesforceとワンストップでのサービスを提供開始するなど、積極的にビジネスを展開しています。
これまでPartner of the Year, Japanを4年連続で受賞しており、2021年にはアジア太平洋地域で最もビジネスに貢献したパートナーとして表彰されました。
また、2020年度からは、Tableauを活用したデータ活用促進のコンサルティングや導入サービスの他、AI活用やデータマネジメント整備など、お客さまの企業全体のデータ活用民主化を成功させるためのノウハウ・方法論を体系化した「デジタルサクセス」プログラムを提供開始しています。
https://www.nttdata.com/jp/ja/lineup/tableau/

NTTデータとDataRobotについて

DataRobotは、包括的なAIライフサイクルプラットフォームです。
NTTデータはDataRobot社と戦略的資本業務提携を行い、経験豊富なデータサイエンティストがAI・データ活用を起点にお客様のビジネスにおける価値創出をご支援します。
https://www.nttdata.com/jp/ja/lineup/datarobot/

NTT DATA TECH
NTT DATA TECH
設定によりコメント欄が無効化されています