AIがAIを改善するADAS (Automated Design of Agentic Systems)
こんにちは。ZENKIGENデータサイエンスチームの廣田です。今回はAIがAIを改善するADAS (Automated Design of Agentic Systems) を紹介します。
所属チームでXアカウントを運用しており、AIに関する情報を発信していますのでご興味あれば覗いてみてください。
AIがAIを改善
従来、あらゆるタスクを解くエージェントを作るには、人間がルールベースで考えた方策を定義したり、強化学習によって方策を学習させる方法がなされてきました。AIがAIを改善することは、一見強化学習と似ているようですが、ADASでは、エージェントの設計を行うメタエージェント[1]が存在しており、メタエージェントによってエージェントの設計改善が繰り返されます。
以下にADASのアルゴリズムを示します。
論文 Figure 1 より引用。
- 図中の"Meta Agent"が、(LLMがソースコードを生成することによって)、エージェントを生成します(図中左のMeta Agentから図中右のNew Agentへの矢印)。
- 生成されたエージェントが複数のタスクを解き、その結果とソースコードを保存します(図中右のNew Agentから図中下のAgent Archiveへの矢印)。
- 保存された結果を参照しながら(図中下のAgent Archiveから図中左のMeta Agentへの矢印)、内省しながら新たにエージェントを生成します(図中左のMeta Agentから自身へのループ矢印)。
このように、ADASはエージェントの設計の改善を繰り返すことで、より高度なエージェントを生成します。
タスクとその結果
ARC論理パズル課題、読解、数学、科学問題、マルチタスク問題解決に関するベンチマークなどの種々のタスクに対して、ベースラインを大幅に超える性能が確認されました。
ARC論理パズル
ARC論理パズルにおいて、以下図(a)では、Meta Agent Search は、イテレーションを回す度に内省を繰り返し徐々に改善されている様子が伺えます。さらに、各イテレーションにおいてどのような変化があったかも説明されています。
論文 Figure 3 より引用。
複数ドメインにおけるタスク評価
以下図は、複数のドメインにおけるMeta Agent Search(一番下の行)とその他最先端のハンドメイド設計エージェントの性能比較です。全てのドメイン(読解、数学、マルチタスク、科学)において、最高性能を記録しました。
論文 Table 1 より引用。
注意点
本論文では、注意点が挙げられています。本研究にて生成されたエージェントのコードに、悪意のある挙動が埋め込まれる可能性が非常に低いですが(使っているLLM側でそういうコードが生成されないようにalignmentされているため)、サンドボックス環境など、信頼していないコードは安全に実行する必要があります。
面白ポイント
- ソースコードやプロンプトは公開されていますので、OpenAIのAPI Keyさえあれば試すことができます。
- 自己フィードバックによって、AI自身が改善を繰り返せるようになるシンギュラリティ[2]に近づいているように感じて、ワクワクしました。
- 高次のメタエージェント: エージェントを生成するメタエージェントもまたエージェントなのだから、メタエージェントを学習させる「メタ・メタエージェント」を作ったり、「メタ・メタ・メタエージェント」を作る方向性も考えられると考察で述べられています。
お知らせ
少しでも弊社にご興味を持っていただけた方は、お気軽にご連絡頂けますと幸いです。まずはカジュアルにお話を、という形でも、副業を検討したいという形でも歓迎しています。
Discussion