💭

コンテンツベースのレコメンドシステム:画像分析を活用した類似商品推薦の構築ガイド

2025/02/27に公開

🟢 はじめに

コンテンツベースのレコメンドシステムは、ユーザーの過去の閲覧・購入データを基に、類似したコンテンツ(商品)を推薦する手法です。
今回は特に画像データを活用して、類似商品のレコメンドを実装する方法を詳細に解説します。


📌 1. 画像ベースの類似商品レコメンドとは?

画像ベースのレコメンドは、**商品の視覚的な特徴(色、形状、テクスチャなど)**を解析し、類似した商品を提案する仕組みです。
例えば:

  • ファッションECサイト:「このドレスに似たデザインのドレス」
  • インテリアショップ:「このソファに似た色・形のソファ」
  • 電子機器ストア:「このスマホケースに似たデザインのケース」

💡 メリット

  • テキストデータに依存しない(タイトルや説明が不十分でもOK)
  • 直感的なレコメンドが可能(ユーザーは「見た目」が重要)
  • 多言語対応が不要(画像の特徴を直接解析)

📌 2. 画像をどのように分析するのか?

画像の特徴を抽出する方法はいくつかあります。ここでは主流の3つのアプローチを紹介します。

🔹 ① 伝統的な画像特徴量(SURF / ORB / SIFT)

特徴量ベースの手法は、画像のエッジや形状を抽出し、類似度を計算します。

  • SIFT(Scale-Invariant Feature Transform): 回転やスケール変化に頑健
  • ORB(Oriented FAST and Rotated BRIEF): 高速に特徴点を抽出
  • SURF(Speeded Up Robust Features): SIFTより計算効率が良い

💡 デメリット

  • 色や質感の情報が十分に活用できない
  • 深層学習と比べると精度が低い

🔹 ② 畳み込みニューラルネットワーク(CNN)を用いた特徴抽出

現在の主流は、事前学習済みのCNN(Convolutional Neural Networks)を使い、画像の特徴量を抽出する方法です。

よく使われるCNNモデル

  • ResNet(Residual Networks): 深い層でも勾配消失しにくい
  • EfficientNet: 計算コストが低く、精度が高い
  • VGG(Visual Geometry Group): シンプルで特徴抽出に適している
  • Inception: 異なるカーネルサイズを同時に適用し、多様な特徴を捉える

🔹 方法

  1. CNNの事前学習済みモデルをロード
  2. 最後の全結合層(FC層)を削除し、画像の埋め込み(ベクトル表現)を取得
  3. **類似度計算(コサイン類似度 / ユークリッド距離)**で近いアイテムを検索

💡 メリット

  • 色、形状、テクスチャなどを総合的に考慮できる
  • 深層学習のパワーを活用し、高精度なレコメンドが可能

🔹 ③ Siamese Network(サイアミーズネットワーク)

Siamese Networkは2つの画像の類似度を直接学習するニューラルネットワークです。

仕組み

  • 同じ商品カテゴリの画像は類似しているとラベル付け
  • CNNを2つ並べたネットワークで画像の距離関数を学習
  • 新しい画像が追加されても、すぐに類似アイテムを検索可能

💡 メリット

  • オンライン学習が可能(新商品追加に強い)
  • 事前にすべての特徴を計算しなくても良い(ユーザーがアップロードした画像とのマッチングが得意)

📌 3. 類似商品をレコメンドするデータパイプライン

ここからは、実際に画像ベースのレコメンドシステムを構築するためのデータパイプラインを設計します。

💾 ステップ 1: データ収集

まず、以下のデータを集めます。

  • 商品画像(ECサイトの商品写真)
  • メタデータ(商品名、カテゴリ、ブランドなど)
  • ユーザーの閲覧履歴(どの商品をクリック・購入したか)

技術スタック

  • AWS S3 / Google Cloud Storage(画像保存)
  • Kafka / Kinesis(ユーザー行動のログ収集)

🖼 ステップ 2: 画像特徴の抽出

事前学習済みのCNNを使って、各画像を**ベクトル(数値表現)**に変換。

from tensorflow.keras.applications import ResNet50
from tensorflow.keras.preprocessing import image
from tensorflow.keras.applications.resnet50 import preprocess_input
import numpy as np

# 事前学習済みのResNetをロード(最後の全結合層を削除)
model = ResNet50(weights='imagenet', include_top=False, pooling='avg')

def extract_features(img_path):
    img = image.load_img(img_path, target_size=(224, 224))
    img_array = image.img_to_array(img)
    img_array = np.expand_dims(img_array, axis=0)
    img_array = preprocess_input(img_array)
    
    features = model.predict(img_array)
    return features.flatten()

🔍 ステップ 3: 類似度検索

各商品の特徴ベクトルを保存し、ユーザーが見た商品と類似するアイテムを検索

from sklearn.metrics.pairwise import cosine_similarity

# すべての商品画像の特徴量を取得
image_vectors = np.load("image_vectors.npy")  # 事前に計算済みの特徴量
user_viewed_item = extract_features("user_selected_image.jpg")  # ユーザーが閲覧した商品

# コサイン類似度を計算し、類似度が高い順にソート
similarities = cosine_similarity([user_viewed_item], image_vectors)[0]
top_k = np.argsort(similarities)[-5:]  # 上位5商品を取得

📊 ステップ 4: レコメンド結果の表示

  • 上位5つの類似商品を表示
  • ユーザーに新しい商品を推薦

フロントエンド

  • FastAPI / Flask(レコメンドAPI)
  • Vue.js / React(レコメンド結果の表示)

📌 4. まとめ

✅ 画像ベースのレコメンドシステムの流れ

  1. ユーザーの閲覧履歴を取得
  2. 事前学習済みCNN(ResNet, VGG)で画像特徴を抽出
  3. 特徴ベクトルをデータベースに保存
  4. 新しいリクエストが来たら、類似度計算を行い、最も近い商品を推薦
  5. ユーザーがクリックしたデータを収集し、システムを改善

✅ 技術スタック

  • 画像処理: TensorFlow / PyTorch
  • データ処理: Kafka / Redis
  • 検索エンジン: Faiss(Facebook AIの類似検索ライブラリ)

この方法なら、視覚的に類似したアイテムをレコメンドできる強力なシステムを構築できます! 🎯

Discussion