Open1
「trieve」を試す
GitHubレポジトリ
trieve
検索、レコメンデーション、RAGのオールインワンソリューション
主な機能
- 🔒 セルフホスティング(VPCまたはオンプレミス対応)
AWS、GCP、Kubernetes全般、Docker Composeでのセルフホスティングガイドを提供。詳細はドキュメントページをご覧ください。- 🧠 セマンティック密ベクトル検索
OpenAIやJinaの埋め込みモデル、Qdrantと統合し、高品質なセマンティックベクトル検索を実現。- 🔍 タイプミス耐性のある全文/ニューラル検索
アップロードされたすべてのチャンクはnaver/efficient-splade-VI-BT-large-queryでベクトル化され、タイプミス耐性のある高品質なニューラルスパースベクトル検索が可能。- 🖊️ サブセンテンスのハイライト
検索結果の一致する単語や文をハイライトし、太字で表示してUXを向上。simsearchクレートを活用。- 🌟 レコメンデーション
レコメンデーションAPIで類似チャンクやファイル(グルーピングを使用する場合)を検索。ユーザーの「お気に入り」「ブックマーク」「アップボート」されたコンテンツに役立ちます。- 🤖 便利なRAG APIルート
OpenRouterと統合し、任意のLLMを使用してRAGを実現。トピックベースのメモリ管理やカスタムコンテキストRAGを試すことが可能。- 💼 独自モデルの利用
テキスト埋め込み、SPLADE、クロスエンコーダーの再ランキング、またはLLMを持ち込み、自社のインフラに統合可能。- 🔄 ハイブリッド検索とクロスエンコーダー再ランキング
BAAI/bge-reranker-largeを使用した再ランキング最適化で、最高の検索結果を実現。- 📆 新しい情報へのバイアス
検索結果を簡単に最新の情報にバイアスをかけ、古い情報を防ぐ。- 🛠️ 調整可能なマーチャンダイジング
クリック、カートへの追加、引用といったシグナルを使用して関連性を調整。- 🕳️ フィルタリング
日付範囲、部分文字列一致、タグ、数値など、さまざまなフィルタータイプをサポート。- 👥 グルーピング
複数のチャンクを同じファイルとしてマークし、検索をファイルレベルで行うことで、同じ上位結果が重複して表示されないように設定。
冒頭にあるように、検索とかRAGとかを一通りオールインワンで提供するパッケージという印象。クラウドサービスがあるけど、セルフホストも有償ライセンスでできる、という感じっぽいので、ライセンスはBSL-1.1ってのも納得。