👬

カンリーはDevinを入社させて、文化を変えていきます

に公開

ギルドで進める生産性評価と共存文化形成

こんにちは、株式会社カンリーの波多野(@hatamasa1988)です。

少し前になりますが、2025年4月15日にAWSさん主催のイベントCoding Agent at Loft #2 〜 AIコーディング活用事例Night - 効果的な組織導入と実践〜で発表させていただきました!

登壇スライドはこちらです。
https://speakerdeck.com/hatamasa/devin-adoption-company-wide-trial-and-practice-with-guild-collaboration

今回は、登壇内容に合わせて、直近でDevinをついにエンジニア全体に解禁したのでその話をアップデートしつつテックブログで展開していけたらと思っています。
単なる効率化の話ではなく、"共に働く仲間"としてDevinを育てていく道のりをご紹介できればと思います!
Devinについての細かい記述はこの記事では省かせていただきます。

🧭 はじめに:Devinを導入したい!文化も整えなければ

AIエンジニアDevinと言われているだけあって、使い勝手は1人のエンジニアとコミュニケーションしているようなUXであります。また、Cursor, CopilotなどのAI・LLMツールも併用してコーディングを進める形をスタンダードにすべく、文化形成レベルでイネーブルメントが必要という仮説の元動き始めました。

まず私が立てた方針は 「AIエージェントとの共存に向けた組織的な学習と文化形成、その先にある生産性のさらなる向上」 です!

注意すべき点はDevinを導入することが目的では無く、AIコーディングエージェントは今後さらにスピードを増して、進化していくはずで、そのためにいつどのエージェントに乗り換える状態も加味する。つまり、変更容易性を担保する必要があると考えました。
そのため、AIコーディングの組織的な学習と文化形成を第一の目標と定めました。

そんな想いからスタートしたDevin導入プロジェクトであります。

🛠 Devin導入の目的とステップ

まずは「なんでDevin使おうと思ったの?」という話から。

目的はざっくりこんな感じです。

  • AIと人が共存する組織文化をつくる
  • 生産性をもっと上げる
  • ナレッジ共有を自動的にやりやすくする

次に、導入ステップはこんな感じで進めました。

Phase1:Devin、まずは一緒に働いてみた!

まずは1ヶ月間、私自身がDevinとマンツーでいろいろやってみました。
「一緒に働く」って感覚がちょっとずつつかめてきた気がします。

🧪 試したこと(例):

  • CIテストのスピードアップ
  • OpenAPIの自動生成
  • 共通UIパーツの抽出
  • APIログの構造調査
  • DBのPK変更

Slackで「Devin使ってみた!」って初日をみんなでお祝いしたのも、文化づくりには大事な一歩でした🎉

👀 Devinと働いてみた感想

💡 良かったところ

  • 並列タスクが爆速で回せる(Devin優秀)
  • 他人のプロンプトが見えることで、チーム内の学びが加速しそう

🤔 課題もあるよ

  • Devinに任せるには、こっちの指示の出し方が超重要
  • わかりやすくタスクを"分解"し"言語化"する力が求められる

📘 実際に使ってみた記録もテックブログに残してあるので気になる方は読んでみてください
https://zenn.dev/canly/articles/701cbd3c7760ed

Phase2:ギルドで横断的にやってみた

個人検証を経て、今はチーム単位の「ギルド検証フェーズ」に突入しています。

※カンリーではチーム横断的なプロジェクトを"ギルド"と呼称しています

開発チームから「バディ」を選出(EM+メンバー1名)し、プロジェクトを編成しました。

👥 どうやってやってるの?

下記のような形でナレッジ共有ができる仕組み作りをし、モメンタム作りを合わせて行っています。

  • 隔週でギルド定期MTGを開催
    • 直近Devinに任せたタスクをフューチャー
    • Devinの最新のアップデート共有
    • CTO室のAIイネーブルメントの共有
  • Devinへの依頼はSlackで共通チャンネル
    • プロンプトのオープン化によるナレッジ共有
    • 使っている感を可視化することでモメンタム醸成
    • (ガバナンス的側面でも)全員の使用感を把握できる

💸 評価どうしてるの?→ コストで見てみよう作戦

AIってどう効果測定したらいいか悩みますよね。
私もここが一番悩んだ点でもあります。
カンリーでは第一弾としてを以下の観点でチェックを行いました。
仮説として「人件費として説明可能な状態を作れるのではないか」と考えた部分がDevinならではかと思います。

指標 内容
想定工数 人がやったらどれくらいかかる?
実際のACU消費 Devinに任せたらどれだけ計算資源使った?
マネジメント工数 Devinへの指示・レビューどれくらいかかった?

それぞれ費用に換算して、下記の式が成立すれば人がやるよりもコストが安いと考えることができるはずです。

想定工数(の費用) > 実際のACU消費(の費用) + マネジメント工数(の費用)

これを比べて「エンジニアよりDevinのほうがコスト安い!」ってなったら、導入価値があるよね、という感じで、人件費に差し込み可能になります。

⭐️ Devinに任せたタスク管理は?

現在はスプシでリスト化して管理しています。
転記が面倒なのでDevinに依頼しているスレッドに📝スタンプをつけるだけでSlackワークフローでスプシに一発転記できるようにしました。
転記したタスクに対してもろもろの計算を行い、削減コストを算出できるように式も組みました。

🧠 ナレッジ管理もアップデート中

AIツールが複数動いてる中で「ルールファイルが乱立してわけわからん」問題が表面化していると思います。
カンリーでもDevinに加えて、Cursor, Copilot, Cline, CodeRabbit, PR-Agentなど複数ツールを運用しています。
変更容易性の担保も元々の目的にあるため、AIコンテキストファイルの共通化を進めることにしました。
一定の規則に沿って.ai-knowledgeディレクトリに配置し、GithubActionsで.cursor/rules.clinerulesを生成して配置しています。

☝️ 全体導入意思決定

タスクを転記したスプシを見渡して、依頼している8~9割のタスクでプラスの効果があると見込まれた状況でCTOと話し、予算の話を具体化させました。

プラスの効果が見込まれるタスクとしては、

  • 既存コードへの修正, CI/CD, IaaC, 基盤の設定などの追加や修正
  • ドキュメンテーション
  • PRレビュー

逆に効果が出にくいタスクもわかってきました。

  • 新規機能開発
  • E2Eテスト(あまり検証できていない)

依頼の仕方もポイントがありそうで、そのナレッジを今後社内で蓄積していけたらと思います。
人数が多いとその分プラスのナレッジもマイナスのナレッジも貯まる速度が速いのはメリットですね!

ギルド検証の結果にあわせて、開発ロードマップを急ぐ必要性、エンジニア採用の激化などから求められる開発生産性向上の機運の高まりも後押しになり、予算の具体化の話はスムーズに通ることができました!

🏃‍♂️ 導入時のイネーブルメントとガバナンス

エンジニア全体への導入をすることにより、利用人数は6人→50人ほどまで広がる ので一定のガバナンスを効かせる必要があります。
開発生産性向上を目的とした全社導入なので、もちろん業務委託の利用も解禁しています。
その上で気を付ける点は複数あります。

イネーブルメントの観点としては、リテラシー向上や活用が利用者任せにならないように、利活用のガイドラインやナレッジ、最新情報を行き渡らせることが必要になります。

ガバナンスの観点としては、方針やルールに沿って利用できるように、システム的な仕組みや注意喚起、相互監視の仕組みなどを整えることが重要になります。

また、目的を達成できているか確認するためのモニタリングと評価の観点からも、FourKeys, サイクルタイム, ベロシティなどの指標を活用して定点観測することが必要です。
今回カンリーでは、ベロシティ, チームでのDevinのPR数, 使用ACUsの観測を試みています。

これらについてはDevin活用虎の巻をNotionにまとめてギルド検証で溜まった知見と私の知見を全て盛り込みました。
今後の浸透面は勉強会やLTなどのイベントを継続的に開催してモメンタムを途切らせないこと、ギルド検証に参加した6人のメンバーが浸透のハブになることも期待しています。

🔭 これからやりたいこと

チームでDevinを育てる

AIコンテキストとDevin knowledgeをチームでブラッシュアップを行い、PDCAを回していきたいと考えています。
横断的な情報共有の観点に精度向上の取り組みの共有も含めていければと考えています。

AI-Review

現在CodeRabbitやPR-Agentでレビューしていますが、コードベースとコンテキストを把握してのレビューはDevinが良い働きをしてくれると感じています。
Devinへのレビュー依頼を促進していき、精度向上や自動修正もDevinでできればと考えています。

教育

すでにChatGPTでプランニングや壁打ちを行っていると思いますが、カンリーの既存コードベースへやドメイン面へのオンボードにはコンテキストを多く持ったDevinが活用できると思っています。
Devinへの壁打ちも推進していければと考えています。

タスクリスト作成の簡略化

現在Slackワークフロー + 手動追記を行なっている箇所を簡略化したいと考えています。
Session一覧はAPI取得できるのですが、ACUsがEnterpriseプランのみになっていそうなので、JWT取得してAPI投げたり、スクレイピングで対応できないか試行錯誤しようと思います。

🤔 AIエージェントとの共存とは何か?

Devin検証ギルドを通して何度もディスカッションをしつつ、これからのエンジニアにはそれぞれのAIコーディングエージェントの特徴を踏まえた使い分けが重要なスキルになるという見解もでました。
AIスキルの向上は、個人の責務でもあるという考え方もできますが、カンリーCTO室では組織の生産性のキーファクターと考え、AI活用のイネーブルメントを今後も推進していきます。

進化が早くキャッチアップが大変なAI・LLMですが、個人のキャッチアップがボトルネックにならないように、より集合知を活用すべく、AI駆動開発専門の情報発信チャンネルを作成しモメンタムを形成中です。

✍️ 最後に

「AIエージェントと働く」という未来が、少しずつリアルになってきています。

人件費として計算できそうではありますが、前述したようにDevinには向き不向きな(または使い方が難しい)タスクがあるため、エンジニアのバーターでDevinを使うようには現状はならない見込みではあります。
とはいえ、AIの進化とそれに対する利用のTipsも爆速で進化するため、いつエンジニアとのバーターになるかわからないと個人的には感じています。
そのためにもカンリーではAIとの共存文化をより強め、生産性を向上させることが急務だと考えています。
また、直近ではClaude Codeも動かせるように構築し、それぞれが一番生産性を向上できるツール選定ができるようにしています。

同じようにDevinやAI導入を考えている企業・チームにとって、少しでも参考になればうれしいです。

予算や承認フローがボトルネックにならないような制度や仕組み面に加えて、AIエージェントのアップデートに追従できるようにカンリーの文化自体も変えていく必要があります。
カンリーでAI共存文化の構築や、爆速に進化するAIを使いこなしていきたい人は一緒に働けたらと思います!
全方位的に採用オープンしていますので、XのDMでも、下記でもご応募くださいませ!
https://hrmos.co/pages/canly/jobs?jobType=FULL&category=1996533345016770561

カンリーテックブログ

Discussion