⏳
ナレッジグラフで時系列データを扱うグラフデザイン(RDFベース)
はじめに
ナレッジグラフで時系列データを扱う際に、どのようなグラフデザインがあるか、gistベースで紹介している方がいたので理解します。
前提
RDFではトリプル - Subject(主語) Predicate(述語) Object(目的語)で表現するため、見た目に関係性がわかりやすい反面、ProptertyGraphとの違いなど、一部制約があります。
今回はGistオントロジーでの時系列データの扱いについて考えます。
gistマイクロパターン:イベントの時間
元のブログ
このアプローチは、「マークがエマを監督する」という関係にノード、プロパティ、エッジでいう、エッジに当たるノード(観測ノード)を追加して、gist:actualStartDateとgist:actualEndDateというイベントの時間範囲のノードを持っています。
月次で増えるパターン
一回のイベントなら上記で良いと思いますが、定期的に実施されて時間を持ちたい場合、
下記のように再化(reification)によってエッジをノード化をし、観測ノードを作成する必要がありそうです。
観測ノード:ST_monthly_report_2025_04、ST_monthly_report_2025_05
こうなると、グラフがかなり煩雑になるのと、「売上」「採用」と部門の時間でも観測ノードを持つことになるので、本質は同じですが、PropertyGraphでエッジで表現した方がグラフ的にはシンプルに表現できると思いました。
The Business Case for Data-Centric
今回の趣旨とは違いますが、gistを運営している会社のsemantic artsの動画で面白かったのでメモ。
そもそもなぜナレッジグラフを使いたいのか、データ管理の問題はということを話してそうです。
どこかで、この動画をまとめたいです。
semantic arts動画一覧
Discussion