Findy Team+で可視化された数値から見た直近1年のAI活用と生産性向上の取り組み
はじめに
ジーニーグループ、CATS株式会社の開発部部長をしております前田です。
ジーニーグループではJAPAN AI株式会社を筆頭に AI 活用を猛烈に推進しておりまして、それはグループ内においても例外なく、AI を用いた生産性改善、開発・運用、セールスやマーケティング活動などへ幅広く積極的に活かされています。
さて、CATS株式会社ではエンジニア組織の生産性向上に向けて Findy Team+ の利活用をしておりまして、大変ありがたい事に先日インタビュー記事を掲載頂きました。
「見える化」により自発的に改善できる組織へ。「思いやりPR」文化を育んだCATS株式会社の組織改革とは? | Findy Team+
本記事ではこの裏側で推進されていた AI 活用によって、どのような数値変化が起こったのかをご紹介します。
チームスタッツの変化
まずエンジニアチームにおける1人あたりのスタッツを確認してみましょう。
抽出範囲は2023年4月〜2024年3月の1年間と、2024年4月〜2025年3月の1年間とします。
2023年と言えば1月頃にChatGPTが爆発的に注目を集め、1億ユーザーを突破したのが記憶に新しいですね。
| 2023〜2024年 | 2024〜2025年 | 倍率 | |
|---|---|---|---|
| PR作成数 | 154.3 | 264 | 171% |
| 平均変更行数 | 2073.1行 | 431.3行 | 20% |
| レビュー数 | 268 | 760.4 | 283% |
| レビューPR数 | 133.5 | 318 | 238% |
| PRコメント数 | 321.7 | 816 | 253% |
| コーディング延べ日数 | 91 days | 124.7 days | 137% |
| コミット数 | 547.2 | 1134.5 | 207% |
| デプロイ頻度 | 54.7 | 94.3 | 172% |
| 変更リードタイム | 205.4 | 138.1 | 67% |
| 障害率 | 10.7% | 14.9% | 139% |
| 平均修復時間 | 34.8h | 17.9h | 51% |
※チームスタッツにはマネージャーメンバーも含まれており、全体の平均スタッツとなっています。
可視化された数値から改善ポイントを確認し、PRやコミット粒度、変更行数を小さくレビュー負荷を下げ、より高サイクルに開発を回していくアプローチを実直に進めた1年でしたが、このチームでは全体的にスタッツが改善できており、1人あたりの生産性が向上していると言える成果となりました。
また、2024年から現在までは cursor をはじめとする AI 支援機能を搭載したツールが整備されたことに大きな影響を受けています。
単なるチャットからエンジニアに伴走する AI コーディング支援へと進化したことで、1人で2人分以上の仕事ができる可能性を秘めた変化が起こりました。
特にコーディング支援による開発体験の変化は凄まじく、多くのエンジニアが恩恵を受けることになりました。生産性改善文脈で行った粒度分解アプローチだけでは、とてもここまで伸びなかったのではないかと感じています。

デプロイ頻度、変更リードタイム、障害率、平均修復時間の4指標としてみると、デプロイ頻度の向上に伴い一時的に障害率が上昇していますが、平均修復時間は半減しており、結果的には安定性も向上しています。
他の2指標については課題を感じておりますが、AI レビューの導入を試してみたり、Devin などの自律型 AI によるサイクル改善を進めてみて効果を測っているフェーズとなります。
ハイパフォーマーのスタッツ変化
抽出範囲はチームスタッツと同様になります。
| 2023〜2024年 | 2024〜2025年 | 倍率 | |
|---|---|---|---|
| PR作成数 | 530 | 772 | 145% |
| 平均変更行数 | 2866.9行 | 1976行 | 68% |
| レビュー数 | 404 | 2118 | 524% |
| レビューPR数 | 181 | 1011 | 558% |
| PRコメント数 | 707 | 1528 | 216% |
| コーディング述べ日数 | 179日 | 208日 | 116% |
| コミット数 | 1392 | 1768 | 127% |
このメンバーはレビュワーとしての役割が増えてスタッツが大きく変化しつつも、自身のコーディング時間を確保できています。
コミット粒度の改善を進めて効率化された側面もありますが、業務改善を進める中でメンバー個々の時間管理やレビュー能力などのスキルが向上し、チームのコミュニケーション効率が高まったことで、一貫した開発ペースを維持できる土壌が作り出された成果と言えるでしょう。
例えば「コードをコミットした日数」を示すコーディング述べ日数ひとつを取ってみても 116% に伸びており、レビュー時間を確保しつつもコーディングに取り組めているということになります。
そして、こちらも AI コーディング支援による変化は大きく、これまで数日掛けていたタスクが数時間で終わる場面もあったことから、スタッツの向上に貢献しています。この劇的な時間削減は単なる生産性向上にとどまらず、開発者がより創造的な問題解決や設計思考に集中できる余裕を生み出しています。
ハイパフォーマーはロジックを言語化することに長けている方が多いので、複雑なビジネスルールや要件を明確かつ構造化された形でプロンプト化することで、生成されるコードの質と適合性が高まります。これはデータに現れている平均変更行数の減少(68%)にも関連していると考えられ、より簡潔で効率的なコードが生成されていることを示唆しています。
このAIとのコミュニケーション能力は、今後のエンジニアが獲得すべき新たなスキルになっていくのだろうなと感じております。
効果試算
1人あたりのデプロイ頻度スタッツから年間の人件費削減効果を試算します。
エンジニア単価については業界平均的な単価を想定して 800,000 とさせていただきます。
| 一人当たり | |
|---|---|
| エンジニア単価 (月) | 800,000 |
| 人件費 (年) | 9,600,000 |
| デプロイ頻度 : before | 54.7 |
| デプロイ頻度 : after | 94.3 |
| デプロイ当たり単価 : before | 175,503 |
| デプロイ当たり単価 : after | 101,803 |
| デプロイ当たり削減効果 | 73,700 |
| デプロイ当たりコスト削減率 | 42% |
| 削減効果 (理論最大値) | 6,949,909 |
| 削減効果 (仮説値) = 最大の 50% | 3,474,954 |
※すべてのデプロイが同じ複雑さではないことや環境変数を加味し、50% を現実的な期待値としています。
この試算から、ひとり当たり 347 万の生産性改善効果を創出できた可能性が考えられます。
今回は改善余地が大いにある初年度であったという点は変数として考える必要がございますが、AI活用と共に生産性の改善に取り組んだ結果として意義のあるものとなったのではないでしょうか。
今後の伸びしろのために
チームでは話題の Devin や、OSS の OpenHands といった自律型エンジニアリング AI などにも触れており、これを活用した開発体験・生産性の向上が狙えないか日々試行錯誤しています。
純粋な利用方法としては、レビュー作業などのタスクをしている間に一定の雛形を作成させてみるなど、人間のバックグラウンドで非同期に稼働させる利用方法などが向いているように感じております。
直近では Devin Wiki と呼ばれる Beta 版の機能が搭載され、AIによって複雑なコードベースが可視化され、依存関係を直感的に把握できるよう支援してくれました。
チームとしては日々の開発作業において全体像を見失うことなく細部に集中できているのですが、更に自動生成ドキュメントが新規メンバーのオンボーディングプロセスを変革できそうだと期待しています。
というのも、従来はオンボーディングのために膨大なドキュメントを作成し、経験者からの解説に頼っていた初期学習フェーズが、コードベースの進化に合わせて自動更新される巨大な Wiki を自由に探索し、関心部分から学習できるスタイルに変わる可能性を秘めているからです。
「誰に聞けばいいのかわからない」は典型的な障壁ですから、これが大きく軽減されることになれば開発体験が大きく改善します。
技術革新が伸びしろに繋がることが期待できてワクワクしますね。
まとめ
1年間続けてきた生産性改善の可視化への取り組みでしたが、折よく AI 活用機運が芽吹いており、両者を合わせて進めることで大きな成果を得られたと感じております。
直近の課題として、AI コーディングでエンジニアリングが全体的に高速化されていることで、レビューすべきコード量が増加傾向にあり、またその妥当性確認に人のリソースが割かれる問題がありますので、次の1年では人とAIの協調・共存を解決しつつ、より良い開発体験を組織に提供できるよう取り組んで参ります。
ここまでお付き合い頂き、ありがとうございました。
Discussion