🐳

Cohere Rerank 3.5: より正確なAI検索の実現へ

2024/12/03に公開

はじめに

Cohereは、最新のAI検索基盤モデル「Rerank 3.5」を発表しました。このモデルは、企業の検索システムやRAGシステムにおける情報の関連性を大幅に向上させることを可能にします。

https://cohere.com/blog/rerank-3pt5

サマリ

  • Cohereは、企業の検索・RAGシステムの精度を大幅に向上させる新モデル「Rerank 3.5」を発表し、クロスエンコーディング手法により高い検索精度を実現
  • 従来の検索手法と比較して、BM25比で+30.8%、ハイブリッド検索比で+23.4%の精度向上を達成し、特に金融などの専門分野での高いパフォーマンスを期待
  • 100以上の言語に対応し、クロスリンガル検索で前バージョンから+26.4%の改善を実現。

Rerankとは

Rerankは、検索システムの精度を向上させるためのAIモデルです。従来の検索システムでは、キーワードマッチングや単純な関連性スコアリングによって検索結果を提供していましたが、これらの方法では文脈や意味の理解が不十分で、ユーザーが求める最適な情報を見つけ出せないことがありました。

Rerankは、この課題を解決するために以下の機能を提供します:

  • 高度な文脈理解: ユーザーの検索クエリと文書の意味的な関連性を深く理解
  • 正確なランキング: 検索結果を関連性に基づいて適切に並び替え
  • 柔軟な統合: 既存の検索システムと容易に組み合わせ可能

特に、RAG(Retrieval-Augmented Generation)システムにおいて、生成AIモデルに提供する文脈情報の質を向上させる重要な役割を果たします。

Rerank 3.5の特長

Rerank 3.5は以下の最先端機能を提供します:

  1. 高度な推論能力

    • 従来の検索システムでは対応が困難だった複雑なユーザーの質問や制約条件を理解
    • より正確な検索結果の提供を実現
  2. 幅広いデータ互換性

    • 長文ドキュメント(メール、レポートなど)
    • 半構造化データ(テーブル、JSON)
    • プログラミングコード
    • 豊富なメタデータを含むコンテンツに対応
  3. 多言語対応の強化

    • 100以上の言語に対応
    • アラビア語、フランチャ語、日本語、韓国語など、グローバルビジネス言語での業界最高水準のパフォーマンス

企業のAIシステムを数分で改善

Rerank 3.5は、「クロスエンコーディング」と呼ばれる手法を使用して、ユーザーの質問に対する最も関連性の高いビジネスデータを効率的に見つけ出します。この手法では:

  • ユーザーの質問に対するビジネスドキュメントの関連性スコアを計算
  • 従来のキーワード検索や埋め込み検索を超える高精度な情報理解を実現
  • 初期の密な検索段階の後に適用可能
  • ユーザーに提供される回答の精度を最大化

パフォーマンスの向上

  1. 推論を必要とするデータに対する検索精度

    • BM25比: +30.8%
    • ハイブリッド検索比: +23.4%
    • 金融サービスなどの専門分野でも同様の改善を期待
  2. 多言語データに対する検索精度

    • Rerank 3との比較で、クロスリンガル検索で+26.4%の改善
    • 異なる言語間での情報アクセス障壁を軽減

利用開始について

Rerank 3.5は以下のプラットフォームで利用可能です:

  • Cohereプラットフォーム
  • Amazon Bedrock
  • Amazon SageMaker

また、任意のVirtual Private Cloud(VPC)やオンプレミス環境にも展開可能です。

既存ユーザーへの注意事項

古いRerank モデル(rerank-english-v2.0およびrerank-multilingual-v2.0)のユーザーは、2025年3月31日までに新しいバージョンへの移行が必要です。推奨される移行先は「rerank-v3.5」です。

なお、これらのベースモデルから作成されたファインチューニングモデルは、この廃止の影響を受けません。

Discussion