RAG-as-a-Service「Vectara」を試す
すべてのビルダーのための信頼のGenAIプラットフォーム
Retrieval Augmented Generation-as-a-Service(RAGaaS)があなたのビジネスを強化
幻覚と著作権の懸念を軽減し、バイアスを最小限に抑え、説明可能性を高め、言語横断的なリーチを広げる。GenAIのための信頼できるエントリーポイント。
なんかEmbeddingモデルもあるっぽい。多言語対応しているみたいで、ざっと見た限りCohereのMultilingualモデル(v2かv3かはわからない)と同じぐらいの性能はあるっぽい。
以下のデータをRAGのコンテキストとして使用して試してみる。
観光動向調査(令和4年度)
とりあえず無料アカウントを作成、もろもろアンケートのあと、デモはスキップしたところだとこういう画面になる。”Corpus”というのがRAGにおけるナレッジベース的な位置付けっぽい。まずこれを作成する。
どのタイプのアプリを作成するか聞かれる。あとからでも変えれるようなので、とりあえず適当にChatにした。
Corpusの名前を設定する。それ以外にも一部設定はできるようだが、とりあえずデフォルトで。
Corpusが作成されたらデータをアップロードする。今回はPDFファイルなので、FileUploaderで。
PDFをアップロード。
アップロード完了。"Query"から簡単に試すことができる。
チャット画面がでてくるので、適当に聞いてみる。
こんな感じで、スコアと引用・脚注付きで回答してくれる。ただ回答が英語のまま。
日本語で、を明記すると一応日本語で回答してくれた。
APIも利用可能。
他のメニューもサラッと見てみる。
Retrievalでは、デフォルトでハイブリッド検索が有効になっている。あとリランキングも使える。
Generationでは要約モデルが選択可能、ってことは基本要約する前提なんだろうね。で、ここは有料プランのみ。あと言語やretrievalの件数をここで設定できる。
Chatは特にメニューなし。
Evaluationは回答時に表示されていたスコアを表示するかしないかみたい。回答がコンテキストにもとづいているかどうかの信頼度らしい。
Filtersは、Corpus作成時のオプションとも関連するけど、いわゆるメタデータフィルタだと思う。
アプリケーションの作成はこちら
その場で作れるのかな?と思ったけど、どうやらクライアント用のコードが提供されているっぽいので、これを使って実装するということみたい。
所感
- たしかに簡単に作れるし、単純なRAGからいろいろ精度上げようと思った場合に必要になりそうなこと(ハイブリッドとかリランキングとか)も一通りカバーされている。
- ただ、RAGのチャットアプリってのはもはやコモディティ化している印象がある。その中で有料SaaSとして何がウリになるのか?ってところがキーになりそう。ぱっと考えるとこのあたり?
- 基本的にインフラ不要、RAGアプリの開発も不要。必要なのはフロントエンドぐらい。
- ハイブリッド・リランキングあたりは手堅く抑えてあるのも良い。
- 引用・脚注がきちんと付与される。これ案外実装するのは手間だと思う。
これだけだとそこまで魅力的かな?と思ったりするのだけど、ビジネス向けを謳っているだけにおそらく検索精度とか回答品質を上げるというところに自信があるのだろうと思われる。例えばこの辺。
あとは冒頭でも書いた通り、Embeddingモデルも自前開発しているってのもその辺を裏付ける要素だと思う。
ただここは実際に評価してみないと判断はできないかな。
まあ手っ取り早く動いてビジネスでも使えるものがほしい、というのであればこういうチョイスはあっても良いと思う。果たして市場的に訴求力があるのか?ってのは個人的にはわからないので、ビジネスとして成り立つかどうかは興味がある。
有料のプライシングが全然載ってないと一瞬思ったけど、Growth Planってのが、無料枠含む従量プランってことなのね。これなら確かに始めやすいかもしない。
ただちょっと気になる機能とかでも結構Contact Salesな感じがある。
もはやRAGのチャットボットを作る、ってことにそれほどの価値はないかなと。何かよほどのウリや別の目的がないと、作った時点で負債になっていきそう。
Slack/Discordにつなぐためのコネクターも提供しているみたい