😁
ChatDev: Agentsが語りあってソフト作るよ!祝1000ビュー
話すこと
- 複数エージェントが語り合ってソフトを作るChatDevの解説
論文読んで、自分が理解した内容です。違うとかありましたらご指摘願います。
読者対象
- ソフトウエアをだれかに作ってもらいたい人
- AIエージェントの活用例を読みたい人
- IT技術者で、どうやって仕事していくべきか考えるヒント欲しい人
1. どんなもの?
- ○○を作ってと頼むと、デザイン、プログラミング、テストの各工程を順番に複数のエージェントが語り合いながらソフトを完成させてくれるもの
2. 先行研究と比べてどこがすごいの?
-
新規に比較用に作成した精度ですべてがベースモデルと比べて高い
-
同じように複数の役割のエージェントが開発していくMetaGPTがあったが、こちらはプロンプトが固定である。ChatDevはエージェントのプロンプトを都度LLMで作成して柔軟になっている。
3. 技術や手法の"キモ"はどこにある?
- ソフト開発上の役割でエージェントに個性を与えている。
- 設計、コーディング、テストの段階を順に進めるウオーターフォールを使用
各段階は細かいタスクに分かれる - エージェント同士が語りあうことがすごく良い!
各タスクでは2つの別々の個性のエージェントが指示者とアシスタントなり、語りあう
アシスタントはよりよいタスク実施のため、要求をより明確にしていく
4. どうやって有効だと検証した?
- ソフトウェア要件説明データセット(30タスク * 40小分類)をLLM活用して作成。
これを使って、GPT-Engineer,MetaGPTと比較 - 新たな3つの視点で評価とその総合評価を行った
2.1 Completenessは、ソフトウェアのコード完成度
2.2 Executabilityは、 正常にコンパイルされ、実行できるか?
2.3 Consistency は、元の要件とどれだけ一致しているか?
2.4 Qualityは、上記3つの指標を掛け合わせた値
- 人間とGPT4での評価も上
- できるファイルや行数は一つのエージェントのより大きく、それが完全性に良さそう
5. 議論はあるか?
- アジャイルで進めていく方式もつくり、かつ最初にどちらかを選択するのも良い?
- ペアで作業しているが、もっと多人数(多役割)の会議にも利点あるのでは?
- 仕様から始めるのでなく、ビジネス企画や、課題解決からAI,IT使うなどもっと上流工程含めて自動できそう! 記事:課題解決にAIも考えてみよう! とかも自動化できそう!
6. 次に読むべき論文はあるか?
論文情報・参考資料・次に読む?記事
- ChatDev: Communicative Agents for Software Development
- その仕事、AIエージェントがやっておきました。―ChatGPTの次に来る自律型AI革命
- AI Scientist : 速報!独自意見言いたい!
あとがき
- 落合陽一式の論文の読み方最強だった件 でも説明されている方式で書いてみました。
google analyticsで1000ビュー行きました!わーい!
記事よかったら、いいね♡ 押してね!
Discussion