Open1

「trieve」を試す

kun432kun432

GitHubレポジトリ

https://github.com/devflowinc/trieve

trieve

検索、レコメンデーション、RAGのオールインワンソリューション

主な機能

  • 🔒 セルフホスティング(VPCまたはオンプレミス対応)
    AWS、GCP、Kubernetes全般、Docker Composeでのセルフホスティングガイドを提供。詳細はドキュメントページをご覧ください。
  • 🧠 セマンティック密ベクトル検索
    OpenAIやJinaの埋め込みモデル、Qdrantと統合し、高品質なセマンティックベクトル検索を実現。
  • 🔍 タイプミス耐性のある全文/ニューラル検索
    アップロードされたすべてのチャンクはnaver/efficient-splade-VI-BT-large-queryでベクトル化され、タイプミス耐性のある高品質なニューラルスパースベクトル検索が可能。
  • 🖊️ サブセンテンスのハイライト
    検索結果の一致する単語や文をハイライトし、太字で表示してUXを向上。simsearchクレートを活用。
  • 🌟 レコメンデーション
    レコメンデーションAPIで類似チャンクやファイル(グルーピングを使用する場合)を検索。ユーザーの「お気に入り」「ブックマーク」「アップボート」されたコンテンツに役立ちます。
  • 🤖 便利なRAG APIルート
    OpenRouterと統合し、任意のLLMを使用してRAGを実現。トピックベースのメモリ管理やカスタムコンテキストRAGを試すことが可能。
  • 💼 独自モデルの利用
    テキスト埋め込み、SPLADE、クロスエンコーダーの再ランキング、またはLLMを持ち込み、自社のインフラに統合可能。
  • 🔄 ハイブリッド検索とクロスエンコーダー再ランキング
    BAAI/bge-reranker-largeを使用した再ランキング最適化で、最高の検索結果を実現。
  • 📆 新しい情報へのバイアス
    検索結果を簡単に最新の情報にバイアスをかけ、古い情報を防ぐ。
  • 🛠️ 調整可能なマーチャンダイジング
    クリック、カートへの追加、引用といったシグナルを使用して関連性を調整。
  • 🕳️ フィルタリング
    日付範囲、部分文字列一致、タグ、数値など、さまざまなフィルタータイプをサポート。
  • 👥 グルーピング
    複数のチャンクを同じファイルとしてマークし、検索をファイルレベルで行うことで、同じ上位結果が重複して表示されないように設定。

冒頭にあるように、検索とかRAGとかを一通りオールインワンで提供するパッケージという印象。クラウドサービスがあるけど、セルフホストも有償ライセンスでできる、という感じっぽいので、ライセンスはBSL-1.1ってのも納得。

https://trieve.ai/