テンポラル・ネットワークを味わう - テンポラルな表現方法
概要
前回の記事では, テンポラル・ネットワーク, つまり時間発展するネットワークの特徴について図表を用いて紹介した. 特に, 時間によってネットワークの構造が変化してしまうことによる, 情報伝達の非対称性が, 静止したネットワーク(以下、総計ネットワーク)との特筆すべき差異だと述べた.
本記事では, テンポラル・ネットワークの解析準備としてテンポラル・ネットワークのデータ表現について紹介する. 解析するためには, より解析しやすいデータ表現を用意することが重要であろう. それに加え, 「そもそもネットワークを時間の観点から記述できる」方法を知っておこう, という狙いである.
今回も, 『テンポラル・ネットワーク』(森北出版)を参考に, 適宜, スムーズな内容理解のために新規の図表を用意する.
総計ネットワークでの従来表記法
テンポラル・ネットワークでの表現方法を紹介する前に, 従来の静止したネットワークでの表現方法を簡単に紹介する.
ネットワーク(あるいは、グラフ)は、頂点の集合(
このとき, 頂点数を
枝には向きがある場合があり,
以降は, 無向ネットワークを前提として話を進める.
従来の静止したネットワークの代表的なデータ表現としては, 隣接行列
隣接行列の面白い性質として, 行列
そして, ネットワークのハブ分析などに使用される, 各頂点の次数
隣接行列は, 元のネットワークの構造に関する情報を漏れなく含めており, ネットワークを記述する主要なデータ表現である.
そんな強力な隣接行列であるが, ネットワークのサイズが大きくなると, 隣接行列
そうした計算面で有利なデータ表現として, 枝リストがある. これは, ネットワーク
上図は, 頂点数
テンポラル・ネットワークのデータ表現
従来の静止したネットワークでのデータ表現を簡単に確認したので, 本題として, ネットワークの時間変化を考慮したデータ表現について確認していく. 書籍では, 『イベント表現』と『スナップショット表現』の主な紹介内容を用いる. もう少し発展的な表現方法である『ストリーム・グラフ』については, 書籍では詳細には述べられていないため, 図を用いてイメージしていただこう.
イベント表現
イベント表現は, 主にネットワークの枝に対し, 時間の概念を付与したものである. つまりは, 従来の枝の表記方法である
つまりは, 頂点間のつながりが永続的なものではなく, タイミングによって発生したり, 継続したり, そして消えたりするという状態を表現しているとみなせる. 前回の記事で, 二者間のやりとりが時刻によって発生しているテンポラル・ネットワークを紹介した.そのときの言葉を再利用すると, 枝の発生をイベントとみなし, イベント時刻で時間順に並べたイベント列として表現したものが, イベント表現である.
改めて記号の定義を説明すると,
イベントの最終発生時刻を
上図は, 頂点数
スナップショット表現
次に紹介するテンポラル・ネットワークのデータ表現は, あるタイミングでのネットワークの構造をそのまま表現するスナップショット表現である.
ここで,
あるいは, 静止したネットワークにおける隣接行列に似た表現として, あるタイミングでの隣接行列を, 添字の
ここで,
次に具体的なスナップショット
これについては, 例を確認したほうが理解が進むだろう.
上記の図では, さきにあげた14個のイベント表現を,
そして,
例をみるとわかるが, スナップショット表現は, 各時刻においてネットワーク全体を見ることを強調した表現方法で, テンポラル・ネットワークを, ネットワーク構造が時間変化していくものとして把握している, といえる.
ストリーム・グラフ
書籍では具体的な図はないが, 面白い表現方法だと感じたストリーム・グラフを紹介する.
ストリーム・グラフは. 頂点集合
このように定義できると, 各頂点や枝が, ある時刻に存在しているかどうかをさらに定義できる. つまり, 頂点
このままでは, どういうことじゃ? と思われるが, 図(原著論文の例を書き直した)を参考にすると意味がわかるだろう.
この例では, 時刻
他方, 頂点
ストリーム・グラフを使えば欲しい量を系統的に導け, 例えば, 頂点や枝がネットワークに現れる時間の集合を
その他, ストリーム・グラフの性質については,Latapy et al., 2017を確認してほしい. 図をもちいてとてもわかりやすく説明されている.
まとめ
本記事では, テンポラル・ネットワークのデータ表現について紹介した. データ表現では, 元のネットワーク構造の情報を落とさずに表現できることが求められる.静止したネットワークでは, 隣接行列や枝リストがあった.
テンポラル・ネットワークでは, それらに時間情報を組み込んだイベント表現や, スナップショット表現, そして ストリーム・グラフなどがある.
- イベント表現では, テンポラル・ネットワークの枝リストを, ある時点で発生するイベントとして再定義した
- スナップショット表現はそのイベント表現を一定期間まとめ, ネットワーク全体の時間変化を捉えたもの
- ストリーム・グラフは, テンポラルな頂点や枝を時間との集合表現で示したものであり, 特にテンポラルな頂点, つまりは, ネットワーク上で頂点が発生したり, 消えたりするという概念は, イベント表現やスナップショット表現にはない独特な表現方法である
ここまでの内容でテンポラル・ネットワークの表現方法をいくつか確認できた. 次回以降は, テンポラル・ネットワークの具体的な解析量として, 長さや中心性の扱っていけたらと思う.
雑記
書籍を読んだとき, テンポラルなネットワークをどのように表現するのかイマイチわかっていなかった. いろいろと表現する方法はあるだろうが, 大事なのは, 元のネットワーク構造の情報を極力失わず, かつ今後の解析処理に適した形式で表現できることが望ましいだろう. そうした観点では, イベント表現やスナップショット表現など, (正直なところ)従来の静止したネットワークではなじみのない, テンポラル・ネットワークに独特な表現形式を導入されていることは新鮮かつ納得できた.
Discussion