👋

【論文要約】Neural Graph Collaborative Filtering

2023/05/13に公開

元論文:Neural Graph Collaborative Filtering

Wang, X., He, X., Wang, M., Feng, F. and Chua, T.S., 2019, July. Neural graph collaborative filtering. In Proceedings of the 42nd international ACM SIGIR conference on Research and development in Information Retrieval (pp. 165-174).

どんな論文?

協調フィルタリングにおいて、ユーザーとアイテムの交互作用から埋め込み表現を獲得するために、二部グラフ構造を利用して埋め込みを伝搬させる Neural Graph Collaborative Filtering という手法を提案した論文。より高次の接続性を表現することができるモデルを作成し、既存手法を上回る性能を示した。

先行研究と比べてどこがすごい?

既存手法のmatrix factorization (MF) はユーザー/アイテム間の ID を直接ベクトルとして表現し、その類似性を内積を用いることで計算する。これではモデルの表現力が不十分であるため、ニューラルネットワークを用いた様々な手法などが提案されていた。

しかし、それらの既存手法はIDや属性などの特徴のみを用いて埋め込みを作成しており、ユーザー/アイテム間の相互作用を考慮していないという欠点があった。NGCFは埋め込み表現を伝搬させることで、その協調信号(相互作用)を明示的に学習することができる。

技術・手法・モデルのキモはどこ?

Architecture
ユーザー/アイテム間の高次の相互作用について学習するために、GNNsのmessage-passing architectureを構築。

Prediction
各層において出力された埋め込み表現を結合することで、最終的なユーザーとアイテムの埋め込み表現を得る。

そしてそれらの内積を取ることによって、ユーザーのアイテムに対する好みを予測する。

Optimization
pairwise BPR loss を利用。
https://zenn.dev/kami/articles/8103fed32f3949

どうやって有効だと検証した?

以下の3つを実験により確認した。

  • RQ1: NGCFは最先端のCFと比較して、どのようなパフォーマンスを発揮するか
  • RQ2: 異なるハイパーパラメーター設定がNGCFに与える影響
  • RQ3: 埋め込み表現は高次の接続性からどのような利益を得ているか

RQ1: NGCFは最先端のCFと比較して、どのようなパフォーマンスを発揮するか

既存手法とパフォーマンスを比較

RQ2: 異なるハイパーパラメーター設定がNGCFに与える影響

Layerの数

埋め込み伝搬のためのレイヤーとAggregation機構

Dropout

RQ3: 埋め込み表現は高次の接続性からどのような利益を得ているか

得られた埋め込み表現を t-SNEを用いて2次元に圧縮して可視化。

  • ユーザー/アイテム間の接続性が埋め込み空間に反映されていることを確認(同じ色の点がクラスターを形成)
  • 3つの伝搬層を重ねた場合、関係するアイテムの埋め込みがより近くになる傾向がある

議論はある?

  • モデルベースCFにおけるメッセージパッシングメカニズムを用いた構造的知識の活用の最初の試みであり、新しい研究の可能性が生まれそう。
  • 実際に、この後LightGCNなどの手法が提案され性能が向上している。

次に読むべき論文は?

Discussion