こちら、新人のDevin君です ──ほやほやスタートアップのCTOがAIエージェントと一年間働いてみた話
PM界隈 Advent Calendar 2025 12月10日を担当します ITかあさん改め株式会社ミラクルでCTOをしておりますCTOかあさんです。
それでは12月10日のPM界隈 Advent Calendarいってみよう!
世はまさにAI駆動開発の戦国時代

気づいたら「AIがコード書いてますけど?」が当たり前の時代に突入していた2025年。
2024年は ChatGPT に質問したり、部分的にコード提案やレビューをお願いする程度だったのが、2025年には一気に AI駆動開発 が一般的になりました。
弊社は動物病院向けの予約システムや電子カルテを提供している、ほやほやのスタートアップ企業なのですが、例にもれず Claude Code や Cursor を取り入れています。
そんな中、今年初めに突然代表が言い出しました。
Devinがすごいらしいから、とりあえず採用したい
そもそもDevinってなんぞや
今年に入ってから日本でも名前をちらほら聞くようになり、「なんかすごいらしいよ」と一部で話題になり始めた頃。
Devin は 完全自律型の “AIエージェント開発者(AI Engineer)”。
まさにこんな感じ。

設定に丸1日かけて、弊社でも導入することになりました。
私は社内の旗振り役として、お客様の要望を Devin にチケット化させたり、簡単なチケットは Devin に消化させる方針をメンバーに周知したりする立場です。
Devin には仮想環境が割り当てられ、GitHub 連携も可能。Docker を入れて我々と同じ環境を整えることで、仮想マシンの中でお仕事させることができます。
Slack と連携すると、Devin のアカウントにメンションするだけで Slack 内から仕事依頼できる──まさに「自律型AI」。

こいつ絶妙に仕事できない(2025年6月時点)
丸一日かけて設定したにも関わらず、なんかイマイチ。
弊社導入は2025年2月下旬。試行錯誤しても「なんか絶妙に仕事できないよね?」という空気が社内に漂い始めました。

オイ!Devinやめろ!!
とにかく 余計なことを勝手にする。頼んでないのに勝手に作業する。


オイ!Devinもう寝ろ!
さらに当時の Devin は、「おやすみ」と言わないと勝手にセッションを消費し続けて上限に到達するというなかなかのひどい仕様でした。
毎回「おやすみ」と言って終わらせる必要があったんです。

Claude Code が浸透すると、Devinはお役御免に
夏以降、Cursor・Claude Code が社内に定着し始めると、Devin にいちいち命令したり「おやすみ」させるのが逆に手間になってきました。
しかし、せっかく時間をかけて設定した手前、捨てるのも惜しい。
最安プランに切り替えてしばらく様子見へ。
Claude Code が優秀すぎて「もうこれでよくない?うちのAI駆動開発はこれで決まりでは?」と思っていましたが──。
秋、CTOの私の業務が詰まり始める
CTO と言いつつ、実態はプレイングマネージャー。
エンジニアにチケットを切る、PRチェック、品質管理、QA不在なので最終チェックも担当。
加えて自分自身もコードを書く。
とにかく PR が溜まるし、チケットを切る暇がない!
仕方ない、、ダメもとでDevinにやらせてみるか
6月以降、社内からほぼ姿を消した Devin。
それでも最低限の PR チェックくらい手伝ってほしいと思い、11月末に久しぶりに起動してみたところ──
う、嘘だろ!お前あのDevin?
Devinがとんでもなく仕事できるようになってる

あの「余計なことしかしなかった Devin」が、とんでもなく仕事できる存在に進化していました。
PRチェックはもちろん、URLを渡すと Slack 上でテストもして、エビデンス付きで報告してくれる。
以前は Slack から GitHub のチケット作成や PRチェックをお願いする程度でしたが、今は テスト+エビデンスまでワンセットです。

仮想環境があるので、データ投入テストやエラーの確認も自動で可能。
ID/PWが必要なページでもちゃんと認証して確認してくれる。
CSV作成も、渡したURLの内容から指定フォーマットに合わせて生成。
特に驚いたのは PR レビュー能力の大幅向上。
秋以降の Devin のレビューは本当に優秀です。

Devin に何が起きたのか
10月末〜11月のアップデートで一気に安定化
- セッションの自動クリーンアップ
- 操作終了条件の明確化
- Sonnet 4.5 によるタスク完了認識の向上
- 意味不明な作業の暴走がほぼゼロに
結論: もう「おやすみ」と言わない
ACU が溶け続ける地獄期は過去のものに。
もっと設定したら、もっとすごくなるのでは?
そう思い、Devin が参画しているリポジトリに、レビュー方針やチェック項目を追加することに。
以下は一部ですが、普段私がレビューで見ているポイントを devin.json に落とし込みました。
"review_rules": [
{
"name": "Laravel / PHP Quality Check",
"description": "Laravel・PHP コードの構造・品質を徹底レビューする",
"checks": [
"return type が宣言されているか",
"unused variable がないか",
"if文のネストは深くないか(early return検討)",
"可視性が適切か",
"不要な static がないか",
"PHPDoc とシグネチャが一致しているか",
"N+1 の可能性がないか",
"Repository の責務が適切か",
"transaction の検討が必要か",
"例外が正しく Controller に伝播しているか"
]
}
]
もちろんバックエンドの他にもフロントエンドの設定もある 普段どんなことを気にしながらレビューしているかを全部設定することで まさに私のコピー それ以上のことができるように成長してたんですね
ブランチルール commitルールを設定するとそのルール通りにcommitもPRも作れるようになりました

流石に全部は貼れないのですが バックエンドであれば修正に対する懸念事項 エンジニアがうっかりミスで消してしまった部分についてもレビューをし その差分が他に影響を与えることを教えてくれるようになり githubにもコメントをつけてくれるようになりました
チケットの作成依頼をすれば周辺状況から何を修正すればいいのか明確に教えてくれる

明らかに私が作るチケットよりも精度が高い もう私チケット作る必要ないじゃん(むしろワイがいらない説)
広がるDevinの可能性
Devinが突然11月の終わりから社内では一気に広がりを見せ データの収集 テスト PRチェックのほとんどをDevinに任せられるようになりました これによりテストとPRチェック チケットの作成の業務の大幅な改善ができるようになり まだDevinとともに歩むようになって間もないですが 社内のDevin熱が一気に高まり(主にワイが)
今やDevinは弊社に欠かせない存在となりました
残念ながらDevinができないこと
一気に2025年の終わりに進歩したDevinでしたがどうしてもまだできないことがあります
それがGithub Actionとの連携でした
Github ActionとDevinは連携できる?的なことをサポートに質問。
私としてはPRが作成された瞬間に 第一弾のDevinのレビューが自動で走って欲しかったのですが Devinサポートからそれはできませんとの回答が

全自動でできれば嬉しかったんですけどね 当面はDevinはPR作ったらPR作成者が良きタイミングでDevinにレビューしてもらうことをルールとしました
つまり私のところにメンションが飛んでくる時にはDevinのレビューがすでに終わった状態でチェック依頼ができるというわけです
終わりに
なんかPM界隈アドベントカレンダーなのにあんまりPM界隈としてお役に立てたかわかりませんが
やや設定が面倒なところはあるのですが 一度設定したら 上級SE 開発PMはきっと手放せなくなると思います。現在はcustomer successチームも扱いやすいようにSlackのワークフローでDevinを呼び出せるようにして データ収集に活用できるようにしています
ちなみにまだやってないんですがDevinが完全自律型AIなのでDevinの仮想マシンにClaude設定してあげてとりあえず 何か来たら全部yesで返しておいてって命令すればDevinがClaudeを駆動させて AIがAIを動かす そんなこともできるんじゃないかなーとか勝手に思ってます
おまけ 「おい!Devinやめろ!」

Devinとのスレに別の人と会話を一瞬でもすると 勝手に作業しちゃう 相変わらず 勝手なことをするのはこの記事執筆自伝では健在です
Discussion