Open2

LLMがアプリを開発してくれる「GPT Pilot」を試す

kun432kun432

ここで知った。

https://twitter.com/rohanpaul_ai/status/1842003990063595554

GitHubレポジトリ

https://github.com/Pythagora-io/gpt-pilot/

GPT PILOT

GPT Pilotはコードを生成するだけでなく、アプリを構築する!

https://www.youtube.com/watch?v=4g-1cPGK0GA

GPT Pilotは、開発者が実装を監督する中で、LLMをどの程度活用すれば完全に動作する実用アプリを生成できるかを研究することを目的としている。

主な考え方は、AIはアプリのコードの大部分(おそらく95%)を書くことができるが、残りの5%については、完全なAGIが得られるまでは開発者が必要であり、今後も必要とされるということだ。

このプロジェクトにおける私たちの学習内容にご興味をお持ちの方は、最新のブログ記事をご確認ください。

GPT Pilotの仕組みは?

GPT Pilotがアプリを作成する手順は以下の通りである。

  1. アプリ名と説明を入力する。
  2. プロダクトオーナーエージェントは、現実世界と同様、何もしない:)
  3. プロジェクトの説明が十分でない場合、仕様作成担当エージェントは要件をよりよく理解するためにいくつかの質問をする。
  4. アーキテクトエージェントは、アプリで使用されるテクノロジーを書き出し、すべてのテクノロジーがマシンにインストールされているかを確認し、インストールされていない場合はインストールする。
  5. テクニカルリードエージェントは、開発者が実装しなければならない開発タスクを書き出す。
  6. 開発者エージェントは、各タスクを受け取り、それを実装するために必要な作業を書き出す。説明は人間が読める形式である。
  7. コードモンキーエージェントは、開発者の説明と既存のファイルを受け取り、変更を実装する。
  8. レビュアーエージェントは、タスクの各ステップをレビューし、何か間違いがあれば、コードモンキーに差し戻す。
  9. トラブルシューターエージェントは、何か問題が発生した場合に、GPTパイロットに適切なフィードバックを行う手助けをする。
  10. デバッガーエージェントは、彼に会うのは嫌だが、何か問題が発生した場合には、あなたの頼れる味方となる。
  11. テクニカルライターエージェントは、プロジェクトのドキュメントを作成する。

GPT PilotはSmol developer[1]やGPT engineer[2]とどう違うのか?

  • GPT Pilotは開発者と協力して、完全に動作する実用可能なアプリを作成する。 - AIが(少なくとも近い将来は)開発者の関与なしにアプリを作成できるとは思わない。つまり、GPT Pilotは現実世界における開発者と同様に、アプリを段階的にコード化する。この方法により、開発プロセス全体を通じて発生する問題をデバッグすることができる。もし行き詰まった場合は、担当開発者がコードを確認し、問題を修正することができる。他の類似ツールでは、コードベース全体が一度に提供されるが、この方法では、AIにとっても開発者であるあなたにとっても、バグの修正がはるかに困難になる。
  • スケールする - GPT Pilotは単純なアプリを作成することを目的としているのではなく、あらゆる規模で動作することを目的としている。コードをフィルタリングするメカニズムを備えているため、LLMとの会話では、コンテキスト内のコードベース全体を保存する必要はなく、LLMには現在取り組んでいるタスクに関連するコードのみを表示する。アプリが完成したら、追加したい機能に関する指示を書き込むことで、作業を継続することができる。

原文では明確には書かれていないけど、最後のところは多分↓との比較

で、デモ等を見てると「Pythagora」ってのが出てくるんだけど、GPT Pilotをコアにした、商用版?的な位置づけのように思える(Pricingとかはないけど、v1 early accessって感じみたい)。画面見てるとVSCodeの拡張とかも提供されているっぽい。

https://www.pythagora.ai/

GPT Pilotだけでどこまでできるのかわからないけど試してみる。

脚注
  1. https://github.com/smol-ai/developer ↩︎

  2. https://github.com/gpt-engineer-org/gpt-engineer ↩︎