【論文要約】Heterogeneous Information Network Embedding for Recommendation
元論文:Heterogeneous Information Network Embedding for Recommendation
Shi, Chuan, et al. "Heterogeneous information network embedding for recommendation." IEEE Transactions on Knowledge and Data Engineering 31.2 (2018): 357-370.
どんな論文?
HIN(Heterogeneous Information Network)での推薦モデルとして、メタパスごとのランダムウォークから得られる頂点の埋め込みを利用した HERec と呼ばれる手法を提案した論文。
先行研究と比べてどこがすごい?
従来のHIN(Heterogeneous information network)ベースの手法ではメタパスベースの類似性に依存しているが、これだけではユーザーとアイテムの潜在的な構造特性を完全に掘り下げることができない。また、そもそも異種的(Heterogeneous)ではなく同種的(homogeneous)なグラフを対象とした手法がほとんどであった。
HERecは、メタパスに導かれたランダムウォーク戦略を用いてノード列を生成することで、メタパスの持つ異類的(Heterogeneous)特性や豊富な意味を考慮する。異なるメタパスに基づく異なる埋め込みを、単一の表現に統合する一般的な埋め込み融合手法を提案している。
技術・手法・モデルのキモはどこ?
Heterogeneous Network の埋め込み作成
- メタパスに導かれたランダムウォーク戦略を用いてノード列を生成
- メタパスを決める(UMU:User-Moview-User 等)
- レコメンドの性能向上が目的なので、メタパスはユーザーとアイテムから始まるもののみを利用
- ランダムウォークでノード列を生成
- deepwalkやnode2vecなどから着想
- メタパスを決める(UMU:User-Moview-User 等)
- スタートの頂点と別の種類の頂点を取り除いたノード列にする
- 埋め込みの学習は同種的(homogeneous)なノード列でできるので、同じタイプの頂点は同じ空間に埋め込める
- 異なるメタパスに基づく異なる埋め込みを、単一の表現に統合
- 既存研究では線形に結合していることが多かったがレコメンドのための表現として適切であるとは言えなかった。結合には general function を用いるように定式化することでタスクに対して適切な形で定義・学習をすることができる。
- この研究では、fusion function として具体的に3種類の方法を提案している。
レコメンドのために Matrix Factorization を統合
前項で定義した general function を学習して、ユーザーの埋め込みとアイテムの埋め込みが得られるようにする。
MFではそれらの内積で rating が予測できるようにするが、この手法ではそれぞれの埋め込み自体も予測に利用する。
どうやって有効だと検証した?
それぞれのデータセットについて、既存手法と提案手法で学習に用いる割合を変更しつつ実験を行い、MAEとRMSEの精度を比較した。
提案手法については、fusion functionとして用いるものによって、どのように性能が変わるのかの比較を行った。
cold-start problem にどれだけ対応しているのかも確認し、既存手法を上回る性能があることを示した。
利用するメタパスを少しずつ追加した際の性能についても確認した。
議論はある?
結論で以下のように述べている。
- 複数のメタパスの埋め込みを深層学習でうまく融合させる方法を検討したい
- 開始と終了が同じ型のメタパスしか用いることができていないので、任意のメタパスについて適用可能にするのも興味深い
Discussion