Closed14

Graphwise AI Summit 2025 参加録

manabianmanabian

Keynote

  • コアメッセージ
    • 企業で AI を“本番運用”するには LLM のグラウンディング(自社データ×セマンティクス)が必須。
    • 精度が要求され複雑な領域が “スイートスポット”。RAG → GraphRAG により、精密な検索・推論・説明性を実現。
    • Enterprise Knowledge Graph(RDF/OWL/SPARQL/SHACL) を “セマンティック・バックボーン” に据え、AIガバナンスコスト最適化(トークン削減&高速化)マルチホップ推論 を強化。
  • 製品/ビジョン:Data Management Suite → Knowledge Management Suite → Graph AI Suite へ段階展開。AIフライホイール(LLMでKG構築を加速 → アプリ化 → ベンチマークで継続改善)を志向。
  • 主要ユースケース
    • セマンティック・デジタルツイン(複雑な依存関係の可視化)
    • 技術知識管理(現場支援・熟練者知の形式知化)
    • コンプライアンス・インテリジェンス(規制文書を実行可能な知識へ)
manabianmanabian

Connecting the Dots: Building a Collaborative Knowledge Hub with LLMs and Graphs

  • テーマ:「LLM×ナレッジグラフで“つながる”社内知識基盤を作る」。
  • 狙い:検索性(Findability)、統合(Integration)、高速性能、厳格なキュレーションを満たす“パーソナライズされた・摩擦のない”知識体験を提供。
  • プロセス:①収集(手動投稿+外部リポジトリから自動収集)→②オーケストレーション(機密自動マスキング、自動タグ付けでGraphwise連携)→③人手レビュー&承認→④CMS公開→⑤全体を通した分析。
  • Graphwise/PoolPartyの役割:タクソノミ/オントロジ管理、タグ付けETLパイプライン、GraphDBに“デジタルツイン(本文+概念と関係)”を永続化
  • Vector×Graphの併用:RAGでベクトル検索→親ドキュメントのタグから知識グラフへ“文脈拡張”し、回答の精度・網羅性を向上(GraphRAG的)。
  • AI活用の具体:Cognitive Servicesでの自動マスキング、生成AIでタクソノミ改良(Taxonomy Advisor活用)、ハイブリッド/セマンティック検索、チャンク単位タグ付けの精度向上を検討。
  • 運用とガバナンス中央タクソノミ+用途別タクソノミを連結。メトリクスでタグ誤りを検知→定期的に見直して再学習・再適用。
manabianmanabian

From 1781 to AI: Unlocking Takeda’s Wisdom with GraphRAG

要約

  • 概要:武田薬品工業で、知識グラフ+RAG(GraphRAG)により R&D/製造(CMC領域中心)の社内知見を検索・活用する取り組み。
  • 現状:インデックス化済みファイルは約100万件で増加中。毎月のペースで新たなデータソースを取り込み。
  • 方式:セマンティック検索の上に知識グラフを構築し、SPARQLと検索APIを併用して文脈を取得→生成AIで回答とフォローアップ質問を生成。
  • データ設計:各システムからの生データをそのまま使わず、メダリオン型の段階整備(ステージング→モデリング)を推奨。業務側の意味付け(組織・製品・文書タイプ等のタクソノミ/オントロジ)整備が鍵。
  • 非構造データ対応:スキャンPDF・手書き・多言語資料が大量に存在し、前処理が計算負荷のボトルネック。素朴実装では単一CPUで年単位にもなり得るため、並列化・増分処理・再インデックス戦略が必須。
  • ガバナンス:チャットUIは文書内容を露出するため厳格なアクセス制御が必要(例:Immuta等)。まずは非機密・高価値データから開始し、価値を示してから機密系へ拡張。
  • データオンボーディング:規制業界ゆえ許認可・権限調整が時間の大半。設計が固まれば知識グラフへの取り込み自体は3~4週間程度まで短縮可能。
  • 組織運用:ステークホルダーには初期から“動くもの”を継続披露し関心を維持。業務データに明るい人材(データサビ―な現場)をキープレイヤーとして巻き込み、重複文書・版管理の選択ロジックにビジネス知を反映。
  • 実務の示唆:①ETL/データハブを先に整える ②タクソノミ設計とID衝突(例:同名部署多数)への備え ③増分・再構築しやすい索引設計 ④ユーザー内蔵のフィードバック収集機構で検証ループを高速化。

サイトの紹介文

Since 1781, Takeda has been gathering knowledge across centuries, cultures, and languages - a treasure trove of wisdom hidden in data. While the digital part of that legacy is younger, its diversity and scale make knowledge extraction a real challenge. GraphRAG helps us rediscover and connect these insights, bridging history and innovation. By combining knowledge graphs with modern AI, we can unlock Takeda’s multilingual, heterogeneous data and make it newly accessible for science, patients, and the future. This talk will share Takeda R&D’s knowledge discovery journey - from lessons learned to challenges still ahead.

出所:Graphwise AI Summit 2025

1781年以来、武田薬品は何世紀にもわたって、文化、言語を超えて、データに隠された知恵の宝庫である知識を収集してきました。その遺産のデジタル部分は若いですが、その多様性と規模により、知識の抽出は大きな課題となっています。GraphRAGは、これらの洞察を再発見して結びつけ、歴史とイノベーションの橋渡しをするのに役立ちます。ナレッジグラフと最新のAIを組み合わせることで、武田薬品の多言語異種データを解き放ち、科学、患者、そして未来が新たにアクセスできるようにすることができます。この講演では、学んだ教訓からまだ先の課題まで、武田薬品研究開発の知識発見の旅を共有します。

上記翻訳

manabianmanabian

iiRDS - Intelligent Information Request and Delivery Standard - What is it, Use Cases and its Value for AI

  • iiRDSとは:技術文書を標準語彙+オントロジーで表し、役割・スキル・製品構成・手順・トラブルシュート等を知識グラフとして関連付けるIEC国際標準。
  • 背景課題:従来は1000ページ超のPDFを配布。検索性が低く、同義語非対応・文脈非考慮・ユーザー別最適化なしで、現場で使いづらい。
  • 取り組み:RWSのCCMSにPoolParty(タクソノミ/オントロジー)を統合し、製品用語集とiiRDS語彙でメタデータを強化。API経由でコンテンツ配信基盤や顧客ポータル(SmartMate)へ提供。
  • 実装ポイント:文書をトピック/断片化し、製品部位(例:油圧系)の階層関係や役割・スキルでフィルタしてパーソナライズ。安全情報など重要事項を文脈に結び付ける。
  • RAG連携:GraphDBにiiRDSベースの文書モデルを構築し、サプライヤPDFはベクトル化。LLMのみ/ベクトルRAG/iiRDS+GraphRAGを比較したトラブルシュート検証では、iiRDSベースが最も安定・高精度。
  • 効果:必要情報への到達が高速化(少クリック)、初回修理成功率の向上、役割・スキル別提示、セルフサービス促進、現場学習(eラーニング)との接続。
  • 今後:部品情報やセンサーイベントと連動し、状況依存の推奨(Trusted AI)を実現。ポータル内の他機能ともタクソノミで横断連携。
manabianmanabian

Graphwise Platform: The Path to Trustworthy AI Automation - Keynote

  • Graphwise AI Summit 2日目の基調講演(Vassal Mamcha氏)が、信頼できるAI自動化に向けた新発表を実施。

  • 近年のLLMベンチマーク(MMLU等)は改善が続く一方、現実反映の限界やデータ漏えい・汚染(少数文書でDoS的挙動を誘発)のリスクを強調。

  • 設計原則:人間中心(Human-in-the-loop)、小さなタスクへの分割、意思決定と履歴をナレッジグラフで追跡。

  • 新機能① Taxonomy Builder:

    • トップダウン方式…上位概念を選んで子を段階展開、指示に基づきAIが候補を提示。
    • ボトムアップ方式…コーパスからキーターム抽出→分類木へ自動マッピング(専門領域・大規模タクソノミー向け)。
  • 新プロダクト② GraphRAG(“talk to your graph”の進化版):

    • エージェント×明示ワークフロー(ガードレール、前後処理、意図分類)を統合。
    • 複数LLMを組み合わせ可能、安定APIとデバッグツール、スケーラブルに運用。
  • 新拡張③ GraphDBのベクトル検索強化:

    • ハイブリッド検索(全文×ベクトル×ファセット)と任意グラフ断片の取り込みに対応。
    • 取引一貫性(ACID)を保ちつつインデックス同期、複数埋め込みモデル・実行形態をサポート。
  • RAG限界の指摘:単純な集計・多段推論・結合が必要な問いは、テキスト断片検索だけでは困難→Graph+Workflowで補完。

  • ロードマップ:

    • GraphDB 11.2(拡張ベクトル対応)=11月中旬目標。
    • PoolParty 10.1=自動タクソノミー構築を提供、Helmチャートでのデプロイに対応。
    • Graphite/Graphicsプラットフォーム第2リリースを順次展開。
manabianmanabian

AI-enabled Optimisation for SharePoint

  • SharePoint上の企業文書をAIとセマンティックモデルで「見つけやすく・使いやすく・賢く」する取り組みの紹介。
  • Copilot Studioエージェント+Power Automate+Graphwise for Microsoft 365(PoolPartyタクソノミー連携)で自動ワークフローを構築。
  • ユーザーはTeamsのエージェントにSOPをアップロード→エージェントが自動で「ファクトチェック/あいまいさ・重複検出/必須メタデータ検証」を実行。
  • メタデータ(プロセスオーナー・文書ステータス・次回レビュー日)不備はアップロードをブロックし、修正後にライブラリへ登録。
  • 登録後はGraphwiseのタグ(タクソノミー)で自動タグ付けし、関連文書の所有者へ影響通知メールを自動送信。
  • クエリ処理の透明性を強化:ユーザー質問→暫定タグ抽出→文脈拡張→正式タグ決定→該当文書検索→回答、という手順を可視化。
  • 目的は「信頼できるAI」の実現:データ品質・ガバナンスの自動化、監視・人間の関与、エビデンスベースの指標で継続改善。
manabianmanabian

Semantic Assistance: Leveraging AI to Expedite Taxonomy Development and Management

  • 目的:AIを“アシスタント”として使い、タクソノミーの設計〜運用ガバナンスを高速化・省力化する実践を紹介(Enterprise Knowledge社の事例)。
  • 知識資産の整理軸:自由記述/フリ―タグ/従来タクソノミー/“表現力の高いタクソノミー(定義・同義語・注記などを付与)”の比較と、AI適合性の違いを整理。
  • 大規模正規化の例:18,000件のバラバラな記述をLLMで近似集約→約1,800概念に圧縮(重複検出・標準化)。
  • バリデーション:新規提案用語を既存と意味類似で照合し、真に新規か/既存の言い換えかを自動判定(人手レビュー併用)。
  • 自動分類の枠組み:ORX(運用・非財務リスク)参照モデルを用いて「原因→リスク事象→影響」をテキストから抽出し、初期タクソノミーを組成。
  • 生成支援:入力フォームの構造化属性(原因・影響など)を埋め込んで標準化された説明文を自動生成→記述負荷を削減。
  • End-to-Endプロセス:〔収集/キュレート→設計→拡充(同義語・定義生成)→検証(SKOS整合・スタイルガイド・コーパス分析)〕各段でAI出力→タクソノミスト+SMEがレビューする“人間参加”ループ。
  • ベストプラクティス:タスク細分化、バッチ処理(段階的生成)、手法の併用(LLM+トピッククラスタリング等)、継続的な運用レビュー(年1〜2回+随時)。
  • 注意点:AI同士の自己参照で品質劣化が起き得るため、開発↔運用の“無限大(∞)型”サイクルで常時検証・是正を行う。
manabianmanabian

Semantic Data Products

  • テーマ:**Semantic Data Products(Deeprod標準)**でデータメッシュを“規格化”し、AI時代の分散データ統合を実現する。
  • メッセージ①:AI戦略=まずデータ戦略。社内データを整理・接続することが最重要。中央集約だけではスケールしない。
  • メッセージ②:分散型(データプロダクト)へ移行。ただし標準が無いと“data mesh → data mess”。共通ID(URI/URL)と共有オントロジーが鍵。
  • Deeprodの要点:データプロダクトの所有者・ライフサイクル等を定義し、入力/出力データセットデータサービス配布形式(例:Kafka+JSON)までスキーマ化。各データセットはどの概念(オントロジーのクラスURI)に準拠するかを明示。
  • ねらい:コストの反転(提供側がJSON-LDで意味付けして公開)により、利用側の統合作業を軽減。社内版schema.orgを整備し、各プロダクトがそれに“conformsTo”。
  • アーキテクチャ像:エッジの業務アプリ→Deeprod準拠のデータプロダクトデータカタログ/マーケットプレイスリンクドデータ層(URI連結)セマンティックレイヤ(オントロジー)→AIが意味に基づき検索・活用。
manabianmanabian

Five Keys to Successful Copilot Adoption and Usage

  • Copilot導入のROI目安:従業員1万人規模で年$3.6M投資(Gartner)。更新時に$6–8M相当の効果説明が必要。
  • 失敗の主因①「成功の定義不在」:導入目的・期待値(時短、オンボーディング迅速化、会議効率化等)を明文化し周知。
  • 失敗の主因② ROT(Redundant/Outdated/Trivial)堆積:12–18か月超のメール、3年超未利用文書をアーカイブ/SharePointクロール対象の取捨選択/権限棚卸しを実施。
  • データ衛生の効果:重複排除・ラベル/自動分類(E5/Syntex)で検索面積を縮小→回答精度向上+保管コスト削減(冷温ストレージ活用)。
  • 成功の鍵:コラボ“場”の整備(Teams/Slackで会話・資料・会議を一元管理)と運用ルールの徹底。
  • まず効くユースケースTOP5:会議要約、長文メール・文書要約、類似文書比較、メール下書き生成、文書→PowerPoint化。
  • 変更管理:15–70–15則を前提に“チェンジ・チャンピオン”を各職種で指名(早期採用者≠最適)。事前サーベイ→教育→オフィスアワーで中間層を巻き込む。
  • 標準メトリクス:Copilotダッシュボードの利用率/アプリ別利用、要約・作成時間削減、検索時間短縮、ストレージ削減額、重複率低下など。
manabianmanabian

The Characteristics of a True Semantic Layer

要約

  • 「セマンティックレイヤー」の本質は“データ倉庫と業務プロセス/アプリの間に置く統一的・わかりやすい翻訳層”。BI向けの狭義定義ではなく、知識表現と文脈(context)を扱える広義定義が必要。

  • ハイブリッドAI(記号+統計)時代では、ナレッジグラフとNLPを組み合わせて“幻覚”を減らし、信頼性を高める設計が重要。従来のレイクハウス/BI中心の層は“知識”を扱えず限界。

  • 推進原則:オープン標準(DID、Zero-Copy Integration 等)、グローバル識別子、FAIRデータ、粒度の細かいアクセス制御、知識中心文化(収集→ライフサイクル管理→再利用)。

  • 成功例の示唆:大規模企業でもKM部門と“データ共有文化”を基盤に品質データを整備すれば、LLM活用が定着(推奨の採用率↑など)。四半期ごとに価値を示す“小さな成功の積み上げ”が有効。

  • 要件まとめ:

    • 曖昧さのないAI-readyデータ(例:設備の部品関係や必要資材を明示)。
    • 物語性/知識管理を重視(“表”中心のBI層からの脱却)。
    • 旧来の複雑・断片化・重複を減らす人間中心アーキテクチャ。

サイトの紹介文

A true semantic layer suggests a different development paradigm, a desiloed and thus rearchitected paradigm that dovetails nicely with agent-based development. Engineers and developers will need the semantic layer's monitoring, articulation and control capabilities to manage the agent environment, in fact.

This talk will cover ten primary characteristics that define a true semantic layer. It will also review other claimed semantic layers that by comparison lack sufficient desiloing, power and cohesion, and will explore why they don’t measure up. These will not have the staying power and vision that 20+ years of semantic standards have already demonstrated.

出所:Graphwise AI Summit 2025

真のセマンティックレイヤーは、異なる開発パラダイム、つまりサイロ化を脱し、再構築されたパラダイムを示唆しており、エージェントベース開発とうまく調和します。実際、エンジニアと開発者は、エージェント環境を管理するために、セマンティックレイヤーの監視、表現、制御機能を必要とします。

この講演では、真のセマンティックレイヤーを定義する10の主要な特性について説明します。また、他のセマンティックレイヤーが主張しているものの、サイロ化の脱却、パワー、凝集性が不十分である理由についても考察します。これらのレイヤーは、20年以上にわたるセマンティック標準が既に示してきた持続力とビジョンを持ち合わせていないでしょう。

上記の翻訳

manabianmanabian

Conversational tools driven by RDF-based Knowledge Graphs

要約

  • 目的:RDFベースのナレッジグラフとLLMを組み合わせた**会話型ツール(Hybrid GraphRAG)**の実証を紹介(BMWの研究プロジェクト由来)。

  • 課題設定:LLMは質問理解に強いが真偽判断が苦手/KGは事実・文脈・トレーサビリティを提供→両者統合で正確性と説明可能性を両立。

  • アプローチ:LLMがオーケストレータとなり、質問ごとに「ベクトル検索」「SPARQL」「両方」を選択し計画→検証→回答を実行。回答には出典URLを付与。

  • 仕組み:

    • ベクトルDBには語彙・クラス・重要属性など“探す入口”となる要素を選別して埋め込む(何でも埋めない)。
    • KG(トリプルストア)で精密な多段推論や整合チェック(SHACL/オントロジー)を実施。
  • 効果:事実整合(ACID/検証)・マルチホップ推論・幻覚抑制・監査可能性(追跡可能な根拠提示)を実現。純RAGや純KG検索の弱点を補完。

  • アーキテクチャ:Pythonベースのエージェント+LightLLMでモデル切替、ベクトルDB/グラフDBはプラガブル。計画→検索→検証→合成のループで回答生成。

  • デモ(VSS:Vehicle Signal Specification):

    • 例1「運転者Aggressivenessの特性/算出要因」:関連プロパティをベクトル検索→SPARQLで検証→DrivingStyle/VehicleAccelerationから導出を説明。
    • 例2「タイヤ空気圧から共有コンシューマ経由の接続」:アプリ(Vehicle Health Dashboard)を特定し、同アプリが消費する他パラメータを列挙。
  • 実務Tips:

    • 簡略化したオントロジーの断片をLLMに渡すと反復回数が減る。
    • SPARQLは常にLIMIT等で制御。
    • “入口語彙”の設計(何を埋め込むか)が精度を左右。

サイトの紹介文

This presentation shows how RDF-based knowledge graphs support conversational tools with factual references. It outlines an architecture designed and implemented as part of an applied-research project within the BMW Group. The work uses RDF data modeling, SPARQL query generation, and ontology-driven integration to unify metadata across systems and improve query understanding beyond simple keyword matching. By combining knowledge-graph traversal with vector embeddings, the approach keeps answers grounded in formal semantics while enabling flexible retrieval. The session stays at the metadata level (not data streams) and uses synthetic data that mirror common enterprise challenges. It shares lessons learned from the design and build and includes demonstrations of semantic query-processing patterns that organizations can adopt to build robust, enterprise-scale conversational AI.

出所:Graphwise AI Summit 2025

このプレゼンテーションでは、RDFベースのナレッジグラフが事実参照を用いた会話型ツールをどのようにサポートするかを紹介します。BMWグループの応用研究プロジェクトの一環として設計・実装されたアーキテクチャの概要を説明します。この研究では、RDFデータモデリング、SPARQLクエリ生成、オントロジー駆動型統合を用いて、システム間のメタデータを統合し、単純なキーワードマッチングを超えたクエリ理解を向上させます。ナレッジグラフのトラバーサルとベクトル埋め込みを組み合わせることで、形式意味論に基づいた回答を維持しながら、柔軟な検索を可能にします。本セッションでは、メタデータレベル(データストリームではなく)に留まり、一般的な企業の課題を反映した合成データを使用します。設計と構築から得られた教訓を共有するとともに、組織が堅牢なエンタープライズ規模の会話型AIを構築するために採用できるセマンティッククエリ処理パターンのデモも紹介します。

上記の翻訳

manabianmanabian

The Accidental KM Practice

  • Avalaraでの小さな文書課題(製品名の単一の真実源がない等)が、全社的な**ナレッジマネジメント(KM)**へ有機的に拡大したストーリー。
  • DITA/XML を採用した構造化ドキュメント基盤を構築し、オンラインヘルプ/サポート/製品内ヘルプ等へ一元ソース配信(多言語対応)。セマンティックマークアップ+メタデータ+タクソノミーが鍵。
  • 用語集(ターミノロジーDB)不在がボトルネック→専任タクソノミストを採用し、共通タクソノミーを部門横断で整備(マーケ/製品/学習/サポート/開発)。PoolParty と CMS を連携して自動反映。
  • 最大の難所は製品タクソノミー:スプレッドシートに分散・不整合→PoolPartyでオントロジー化し、組合せ爆発(多対多)を表現。成果が認知され、各部門が順次参加し“単一の真実源”を確立。
  • 生成AI/RAGの限界:ベクトルRAGは70%前後の精度が天井→決定論(deterministic)へ寄せるため、構造化XMLとオントロジーを活用したGraphRAGを採用。
  • 手法:DITAのマップ構造を“構造オントロジー”として利用し、Markdown等も含むトピックをRDFへ変換→GraphDBへ自動ロードトピック粒度メタデータ/リンク関係を保ったまま検索・推論。
  • 実運用:夜間バッチで継続インジェスト、検証はSHACL等で実施。LLMは主に要約に使用し、取得はグラフDB中心(必要に応じてベクトルは入口分類用途)。
  • 成果と組織:ベクトル単独より精度・説明可能性・コストで優位。小さな成功(製品名の真実源)から始め、KMの中核組織へ発展(少人数エンジニア+翻訳責任者+リード・オントロジスト、分散配置のタクソノミストを行列管理)。
manabianmanabian

Closing Remarks

  • 今年のサミットの特徴:本番稼働・直前案件が大幅増加、大手企業での大規模導入が現実に。
  • 一貫した方法論が確立:LLM × ナレッジグラフ(GraphRAG/ハイブリッド)+Human-in-the-loop+セマンティックレイヤーが“定番レシピ”に。
  • 有力ユースケース:ナレッジマネジメント(技術文書・コンテンツ・科学領域)とセマンティックレイヤーが主流。ESG/コンプライアンスやセマンティック・デジタルツインは台頭初期。
  • 教訓:予測可能な推論説明可能性AIガバナンスが必須。マルチエージェントは将来有望だが、まずは単体アプリで堅牢化が先。
  • 重要課題:Copilot等で露呈するROT(冗長・古い・些末)の除去とメタデータ整備が成果の近道。MDMとセマンティックレイヤーは代替ではなく補完
  • 標準動向:schema.org/DCAT/Deeprodなど標準間の相互補完が進展し、実務適用が現実味。
  • 検証の次ステップ:SHACL等の自動検証をループに組み込み、人手レビューの負荷を低減する余地。
  • 総括:ナレッジグラフは**“非交渉”な基盤**として主流化へ。小さな成功を積み上げ、組織内キャパシティを育成することが近道。
このスクラップは12日前にクローズされました