💪

AIエージェントワーキンググループはじめました

こんにちは。フォルシア株式会社エンジニアの宮本です。

ChatGPTやコーディングエージェントなどの生成AIがエンジニアリング現場に浸透し、業務効率化に活用する動きが広がっています。しかし「全社的に浸透しているか?」と問われると、まだまだ個人やチームのノウハウに依存しているのが一般的な現状かと思います。

フォルシアでも「AIの活用を前提とした業務変革の仕組みが必要」という問題意識から、今年4月に社内有志で『AIエージェントワーキンググループ』を立ち上げました。

まだ始まったばかりの組織ですが、背景と取り組み内容についてご紹介します。

AI活用に向けての課題と、ワーキンググループでの取り組み

LLMやAIエージェントに触れた方なら分かる通り、AIは誰でも使えばすぐに便利になるものではありません。

ここでは4つの主要な課題に対し、AIエージェントワーキンググループがどのように解決を試みているかを説明します。

1. 情報の変化速度とキャッチアップの難易度

生成AIの界隈は変化のスピードが極めて速く、技術トレンドがSNSや技術ブログ、OSSコミュニティで日々更新されています。この記事の執筆時にはClaude Codeが注目されていましたが、公開時にはGemini CLIがリリースされ話題となっています。3~4月に流行したMCP(Model Context Protocol)のように一般化して落ち着いたトレンドは、自分たちが乗り遅れないためにも流行している間に情報をキャッチアップしたいところでしょう。

一方、社内エンジニアの多くはAIの専門家ではなく、Web・DB・SREなど自分の専門技術の習得に時間を充てたいはずです。忙しい中で生成AIの情報をキャッチアップするのは容易ではなく、組織全体で見ると非効率でもあります。

そこで、AIエージェントワーキンググループでは、週次のミーティングで各メンバーが日々の情報収集で得た知見を共有しています。「このノウハウはフォルシアの業務に適用可能か」「このツールは横展開すべきか」といった観点で議論し、蓄積した情報を他のエンジニアに展開しています。

例えば、前述のMCPは急速に普及した概念でしたが、コアのアイデアは決して複雑ではありませんでした。そこでMCPをテーマとした社内セミナーを実施し、各エンジニアがMCPサーバーを簡単に構築・活用できるナレッジを共有しました。すべてのエンジニアが今後AIと無縁ではいられない以上、最短距離でのキャッチアップを全社展開していくことが重要と考えています。

2. LLMの性能と現実のギャップ

LLMを活用したコーディングエージェントは小規模な自己完結型タスクに優れる一方、実際の業務で運用されているWebアプリケーション開発では課題があります。

  • 長年運用されており設計思想が最新の流行とは異なる
  • 開発方針や設計判断が明文化されず、SlackやPRコメントといった非構造化データに埋もれているケースが多い
  • プロダクトのドメイン知識が非常に複雑

Claude Codeの登場で状況は変化しましたが、大規模アプリケーションで完全にタスクを任せられるわけではありません。特に運用中アプリの保守改修では、アプリに慣れ親しんだエンジニアの方がAIより精度や品質管理で優れている可能性も高いでしょう。

しかし1年後の状況は予測できません。AIが人間より『優秀』になったとき、私たちはAIを使いこなせるでしょうか?
ここでも重要なのは情報の蓄積と共有です。

AIエージェントワーキンググループでは、社内で使用されている古くなったWebアプリケーションのリプレースをAIコーディングで進めています。リプレース自体も目的ですが、「現状できること・できないことの切り分け」「実業務で効果を最大化する手法」の知見蓄積が主目的です。このリプレースでは、1人が画面共有しみんなで指示を出しあう「モブプログラミング」形式で開催しています。AIコーディングツールの運用ノウハウは属人化しやすいため、モブプログラミングは案外効果的なのでは?と思っています。

また、運用中のWebアプリケーションでも各種LLMツールによるAIコーディングを実践し、AIに任せられる作業範囲を見極めています。社内の各アプリケーションの障壁を把握することで、コーディングエージェントの性能向上に合わせてスムーズに自動化の範囲を拡大していければと考えています。

3. 非開発業務に対するAIの活用余地

AIによる生産性向上は開発作業に限定されるものではありません。

実業務では社内コミュニケーションやドキュメント作成の比重も大きく、AIの効果を最大化するにはあらゆる業務への適用が必要です。現状、1つの汎用エージェントにすべてを任せるのは困難なため、個々の業務を要素分解し、地道にAIをカスタマイズしていくことが不可欠です。

他の会社では、社内で複数の生成AIアプリケーションを作成し、社内で運用している事例もありました。

https://zenn.dev/ubie_dev/articles/ee95c03794f47f

フォルシアでも、ワーキンググループが主体となってMCPやAIエージェントの作成・導入を進めています。例えば、社内ドキュメント検索用MCPサーバー、RAG(Retrieval Augmented Generation)を活用した検索ツール、ローカルでコードを調査するツールなどです。

一方、業務のAI化はエンジニアに限らないため、ビジネスサイドも含めた現場の声をヒアリングし、「どの業務が煩雑か」「AIエージェントにどのような役割を期待するか」といった整理も行っています。私自身もタイムトラッキングアプリを使って自分の業務時間を分単位で計測してみたのですが、「自分の思考を文章化してアウトプットする」ことに想像以上の時間を要していることが分かりました。たとえば、「Slack上の会話へのAIエージェントの介入」や「音声ベースの指示の成形・文章化」という方向性は突き詰めれば業務効率化にかなり寄与するのでは?と期待しています。

4. 安全性に対する懸念

AIの活用には様々なセキュリティ上の懸念があります。

  • ユーザーの入力がサーバー側で保持され、学習対象になるリスク
  • エージェントの実行結果による環境汚染や情報漏洩のリスク
  • 脆弱性を持つMCPサーバーに接続するリスク

また、各プロバイダーやツールのセキュリティポリシーはさまざまで、一見して理解しづらいものもあります。

5月にはClineの利用規約でユーザー入力が収集・利用される可能性への懸念がコミュニティで話題となり、結果的にClineの利用規約が更新された事例もありました。

https://zenn.dev/shirochan/articles/9cb53e39cfa96f

企業のAI活用ではリスク回避が大前提であり、便利なツールでも導入が遅れたり見送られたりするケースが多々考えられます。

ワーキンググループでは、安全性のための社内ガイドラインを作成しています。考えられるセキュリティリスクと各ツールのポリシーをマトリクス的に調査し、使用するにあたってどのような注意が必要かをまとめました。マネジメント層のレビューを受けながら、 開発者を規制するルールではなく開発者が安心して使うためのルール を策定しています。

また、新しいツールには安全性以外に費用対効果の懸念もあるため、まず少人数でトライアルを行い、業務への有用性やリスクを見極めながら導入判断を進めています。

おわりに

AIエージェントワーキンググループでの活動をまとめると、

  • 日々集まるナレッジの蓄積と共有
  • 社内向けツールの整備
  • 外部サービスの安全性や費用対効果の検討

を個人に依存するのではなく中央集権的に実施していくことです。

ワーキンググループを立ち上げた私自身、AI専門家ではなく、知識のキャッチアップも最近始めたばかりです。しかし、さまざまなニュースやAI活用事例を見るうちに、技術革新への適応のため今すぐ取り組む必要があると感じ、立ち上げに至りました。時代に遅れないためには 知識のある人を待つのではなく、必要と感じた人が立ち上がり、賛同者を集めて動き出す 姿勢が重要だと考えています。

今後も活動に進捗があればブログで報告します!

この記事を書いた人

宮本 唯
2022年新卒入社
この記事は、GPT-4o、Claude Sonnet 4に一部下書きや推敲を依頼しつつ、ほとんどをぬくもりのある手書きで書いています。

FORCIA Tech Blog

Discussion