😸

AgentforceにおけるData Cloudの役割をわかる範囲で整理してみた

に公開

※この記事は個人の所感に基づいてまとめた内容です。

はじめに

SalesforceのPartner Learning Campが提供している[Activate Agentforce]Implementation Readiness Workshops(日本語)(基礎・アドバンス)を一通り写経しながら手を動かしてみた中で、Data Cloudの役割について見えてきたことを整理しておく。
自分用のメモも兼ねているが、今後Agentforceを触る誰かの参考になればうれしい。
(このハンズオンは難解なヘルプと比べて素晴らしいおすすめ)
※ Data CloudはC360A時代から触ってはいるが最近機能アップデートが早過ぎる

Sales Cloudのファイルアップロードで完結するRAGデータ生成

Sales Cloudのファイルアップロードで完結するRAGデータ生成
Agentforceでは、Sales Cloudのデータライブラリ(@Salescloud)機能からPDFやCSVといったファイルをアップロードすると、自動で検索可能な状態に変換される。この処理は裏側でRetriever(検索インデックス)、ベクトル化、チャンク化といったRAGに必要な一連の前処理を含んでおり、ユーザー側は特に意識せずともRAG対応済みのデータとして利用できるようになる。

この機能のメリットは、データ整備の手間がほとんどかからないこと。Sales CloudをベースにRAG対応のナレッジベースを構築したい場合は、追加の仕組みを用意せずに運用できる。

Data CloudのデータもRAG化できるが一手間いる

一方で、Data Cloud経由で取り込んだデータは、Agentforceでそのまま検索対象にはならない。理由は簡単で、Sales Cloudとは異なり、自動で検索インデックスが作成されないため。ここで必要になるのが「検索インデックス機能」の手動設定。

検索インデックスを設定すれば、Data Cloud経由のデータもSales Cloudと同様に、Retriever → ベクトル化 → チャンク化が順次実行される。この一手間を加えることで、RAG対応のデータとして利用できるようになる。

ポイントは、設定そのものはUI上で完結し、専門的な知識がなくてもできること。Data Cloudで取り込んだ非構造データや外部連携データをRAGに使いたいケースでは、この手順を知っておくとスムーズ。

AgentforceにData Cloudが必要かどうかは「RAG対象」が分水嶺

では、そもそもAgentforceにData Cloudは必須なのか。これはユースケース次第。Sales CloudやService Cloud内にある構造化データだけでRAGのベースデータが揃うなら、Data Cloudを使う必要はない。前述の通り、Sales Cloudのファイルアップロード機能だけでRAG化は完結するからだ。

しかし、Salesforceの外にある非構造データ(Word、CSV、PDF)、あるいは他の業務システムにあるデータも含めてRAGに活用したい場合には、Data Cloudの導入が現実的な選択肢になる。

Data Cloudは、多様なデータソースを取り込み、標準化して保存できるデータハブとして機能する。その後、Agentforceで検索インデックスをONにすれば、RAG処理の流れに乗せることができるため、外部データの活用にはほぼ必須といってよい。

個人的にはVertexは利用してないけど、AgentforceをきっかけにBigqueryなどGCPあたりと連携させてのRAGとして利用するとかはあってもよさそうな気がする。

まとめると

AgentforceでのRAG利用において、Sales Cloudだけで済むならData Cloudは不要。ファイルアップロードで自動処理が走り、手間も少ない。一方で、Sales Cloud外の非構造データや他システムの情報も検索対象にしたい場合は、Data Cloudを経由して取り込むことが前提になる。設定は簡単だが手動でインデックス化が必要。どこまでの情報をRAGに含めたいかによって、Data Cloudの有無が分かれる。

Discussion