🧪

Devin AIにテストを丸ごと書かせてCIがパスするまで作業してもらう方法

2024/12/25に公開
1

Devinとは、ソフトウェア開発におけるタスクを自動化・効率化してくれるAIプラットフォームです。2024年12月に正式リリースされました。 私が所属しているUbieにも先日導入されました。様々な作業ができますが、あるリポジトリで不足しているテストを書いてもらったところ、その便利さに感動して椅子から転げ落ちました。

https://devin.ai/

本記事では、Devinの実際の使い方と、利用する上でのポイントを紹介します。

https://x.com/tonkotsuboy_com/status/1871777460330938846

1. テストの作成をSlackで依頼する

Slackで「これこれのテストを書いてほしい」と依頼すると、Devinがテストコードを生成し、GitHubに新しいPRを作ってくれます。

依頼例は次のとおりです。

こんにちは、 @Devin 以下の仕事をして
- ubie-inc/リポジトリ名 repo にアクセスして
- (テスト対象のパス) のテストを書いて
- 次のテストの書き方を参考にして
  - foo/index.test.tsx
  - bar/index.test.tsx
- 実装追加した変更で PR を作って。
- PRのタイトルとサマリは日本語にして。
- ブランチ名は、testから始まるようにして
- コミットメッセージに Co-Authored-By: GitHubアカウント名 <メールアドレス> を含めて
- CIの「Lint and Test 」では、warningも出ないように修正して
- import '@testing-library/jest-native/extend-expect'; は含めないで
- import React from 'react'; は含めないで
- PRはdraftで作って

実際にSlackに依頼した例

依頼する際のポイント

プロジェクト内のお作法がわかるようなテスト事例をいくつか渡してあげるとスムーズです。事例が無い場合、ゼロから作ってもらうことも可能ですが、Devinとのやりとりに時間がかかってしまうので、最初の1, 2個目のテストは自前で作ってしまう方が早いです。

オススメはVS CodeのGitHub Copilot拡張機能CursorJetBrains AI Assistantなどを使い、プロジェクト全体を解読してもらいながらテストを書いてもらうことです。ちなみに筆者はDevinがない時代はこの手法でテストを構築しています。

2. 作業が開始するので更新を待つ

Devinの作業が開始します。更新をしばらくまちます。

3. CIの失敗は自動で修正してくれる

個人的に激アツなのは、CIが失敗したときに成功するまで自動的に修正してくれるところです。これにより、わざわざ「CIが落ちているので修正して」といった追加の依頼をする必要はありません。


CIの失敗を検知し、自動で修正してくれる様子

また、状況によっては失敗するCIをあえて無視したいケースもあるでしょう。そういった場合には、「◯◯のCIが落ちるのは無視して」とSlack上やDevin上でコメントすれば、該当のCIの失敗だけを無視してくれるようになります。

4. 追加の作業依頼を行う

作業が終わると実際にPRができますが、Devinの作業中やPRの作成後に追加の作業依頼をできます。依頼方法はいくつかあります。

方法① Slackのコメントから依頼する

最も手軽なのは、Slackのコメントから修正を依頼する方法です。例えば次の例では、不要な import文を削除してもらうよう依頼しています。Devinがコメントを拾って、作業を開始してくれます。

個人的にはこれがとても便利で、例えば私はリビングでテレビを見ながら、iPhoneのSlackでDevinに作業修正を依頼していました。

方法② GitHubのPR上から依頼する

GitHubのPR上から作業を依頼する方法です。PRの差分箇所に作業依頼をコメントすると、これもDevinが拾って作業をしてくれます。

方法③ DevinのUI上から依頼する

DevinのUI上から作業を依頼する方法です。Devinが作業を開始するとセッションが発行され、 https://app.devin.ai/sessions/セッションID でアクセスできます。Editorタブでエディターを開けるので、編集をしたい箇所をDevin上で参照して作業依頼を追加できます。次の例では、テストのモック方法の修正を依頼しています。

フィードバックの知見が溜まる

大変便利なのが、各種作業依頼のフィードバックをDevinが学習して覚えてくれていることです。例えば、「モックの際はjest.spyOn()を優先的に使ってください」と指定していたとします。すると、その命令をDevinが「Knowledge」として保存し、次回もその内容を使うかどうかを選択できます。そのまま採用・不採用もできますし、よりよい指示に編集して保存することもできます。


指摘した指示をKnowledgeとして保存するかを提案している様子

保存したKnowledgeはリポジトリごとに保存され、次回の作業時に使ってくれます。

Knowledgeは自由に追加・修正・削除が可能なので、毎回長ったらしいプロンプトを書く手間が省けますし、リポジトリごとのコードの方針も統一ができます。

https://docs.devin.ai/onboard-devin/knowledge

もっと改善されると嬉しいところ

テストの内容が正しいかどうか、ドメイン知識や最終チェックにはエンジニアがPRをチェックする必要があります。当初、非エンジニアに不足しているテストを追加・量産してもらい、リリースまで実施してもらおうとしていたのですが、成果物の内容的にはまだ厳しいと言わざるを得ない場面がありました。とは言え、うまく行ってないところを修正すればいいだけなので、ゼロからテストを書くよりは格段にラクです。

作業速度についても、もっと改善されると嬉しいなとは感じました。文中でも書いたように、ゼロから複雑な作業を依頼するよりは、ある程度の事例や指示を明確に出した方が、最終的な仕上がりは早くなる印象です。

テストはほんの一部。やってくれることは無限大

本記事で紹介したのは、筆者が一番やってほしいと思っていたテストの自動生成ですが、やってくれることは無限にあります。

例えば実例として、我々のチームでは次のようなことをやってもらいました。

  • いつかやらなきゃと思っていたリファクタリング
  • エラーハンドリングを追加する
  • ローカルストレージにデータを保存していた設定をDBに移行する
  • package.jsonから不要なnode_modulesを削除する
  • 特定条件で画面が崩れるバグの修正
  • ドキュメントの作成
  • いつか作らなきゃと思っていたCI/CDを作ってもらう
  • 他多数

値段について

一月あたり従量課金で$500〜です。高いか安いかはチームの事情によるとは思いますが、24時間働いてくれるフルスタックエンジニアが月$500〜というのは、個人的にはリーズナブルだと思います。 たとえば単価5,000円のエンジニアに20日稼働してもらったら80万円、単価10,000円なら160万円くらいですからね。ぜひチームのメンバーと相談してみましょう。

https://devin.ai/pricing

面倒なテストはAIに任せよう

GitHub上のコードを解析して、勝手にテストコードを書いて、CIがパスするまで作業して、追加の作業依頼もしてくれるAIというのは、ずっと求めていた夢でした 。

なお、ローカルでDevinのようなAIエージェントを試す場合は、ClineやCursor Yoloがオススメです。弊社 @syucream が書いた記事がわかりやすいです。

https://zenn.dev/ubie_dev/articles/624c9034cc9b43

私の所属しているUbieは、Devinのような新しい生成AIを実務に取り入れています。社内LLM「dev爺」では各種最新LLMモデルが使い放題になっているため、金銭的な負担もなく好きなだけAIを試せます。

https://x.com/tonkotsuboy_com/status/1872192017314594864

興味のある人は、ぜひUbieで一緒に楽しい開発をしていきましょう。

https://recruit.ubie.life/

GitHubで編集を提案
Ubie テックブログ

Discussion

nehaneha

面白い記事ですね!テスト生成を簡単にして開発効率を上げるって、本当に大事だと思います。最近、オープンソースでAIを使って安定したテストケースだけを残せるツールを見つけました(これ)。こういう自動化、どう思いますか?🚀