Open3

LlamaIndexのmulti-agent-conciergeを試す

kun432kun432

https://x.com/jerryjliu0/status/1813736127058354339

https://www.llamaindex.ai/blog/building-a-multi-agent-concierge-system

https://github.com/run-llama/multi-agent-concierge

マルチエージェント・コンシェルジュ・システム

なぜこれを構築するのか?

対話型チャットボットは、今や顧客サービスのソリューションとしておなじみであり、エージェントはチャットボットの実装において頻繁に使用されるコンポーネントである。エージェントは、記憶、内省、ツールの使用など、有能なボットに必要な機能を提供する。

私たちは、より大規模なチャットボットに興味を持つようになった。何百ものツールを使って、何十ものタスクをこなし、そのうちのいくつかは互いに依存している。そのようなエージェントはどのようなものだろうか?膨大なシステム・プロンプトと膨大な数のツールから選択することになり、エージェントにとっては混乱しかねない。

ある銀行が次のようなシステムを導入するとしよう:

  • 特定の銘柄の価格を調べる
  • ユーザーを認証する
  • 口座残高を確認する
    • ユーザーを認証する必要がある
  • 口座間の送金
    • ユーザーを認証する必要がある
    • また、ユーザーが最初に口座残高をチェックすることも必要である。

これらのトップレベルのタスクにはそれぞれサブタスクがある、例えば:

  • 株価のルックアップは、最初に株価シンボルを調べる必要があるかもしれない。
  • ユーザー認証は、ユーザー名とパスワードを集める必要がある。
  • 口座残高は、ユーザーのどの口座をチェックするかを知る必要がある。

これらすべてのタスクとサブタスクに対して単一のプライマリ・プロンプトを用意するのは非常に複雑だ。そこで代わりに、各トップレベルのタスクを担当するエージェントと、ユーザーを適切なエージェントに誘導できる「コンシェルジュ」エージェントを持つマルチエージェントシステムを設計した。

kun432kun432

LlamaIndexの新しいフレームワーク、ということではなさそう。LlamaIndexを使ったマルチエージェントのPoC的実装だと思う。参考にはなると思うので少し触ってみようと思う。