【ai トピック】今週の人気記事TOP5!(2025/3/16 更新)
【2025/3/16】集計 新着週間Like数 ランキング Top5
ZennチームにもDevinがジョインしました。そしてAIコーディング時代におけるエンジニアの役割について
Zenn社はAIコーディングエージェント「Devin」を1ヶ月間導入し、本番コードベースへの適用を試行した。結果、タスクを細かく分割して指示すれば、10営業日で約30個のPRマージという高い生産性を実現。ただし、丸投げではうまくいかず、詳細な指示とテストコードが必須であることが判明。Devinはサンドボックス環境での安全な実行、Slack連携によるスムーズな作業、比較的安価な価格が強み。課題としてKnowledge管理のUI改善や、大規模な変更への対応などが挙げられた。生成AI時代においても、プログラミング言語の読み書き能力は高度な専門性として価値を保ち続け、ジュニアエンジニア育成も新たな形で継続されると予想された。
Devinにコードレビューをさせ、コード品質と開発速度を同時に高める話
GLOBIS Techは、AIコードレビューツールDevinを導入し、コード品質向上と開発速度の両立を実現した。45件のPRのうち約55%は高品質だったが、残りの20件でDevinはバグや設計上の問題を約半数検知し、手戻りを削減。指摘内容は、バグ防止、パフォーマンス改善、設計・リファクタリング、ドメイン特化、可読性・メンテナンス性など多岐に渡る。 Devinのチューニングは、レビューお作法、Rails設計パターンの浸透、ドメイン知識の活用に重点を置き、Knowledgeとプロンプトを使い分けた。GitHub Actionsと連携し、PR作成・更新時に自動レビューを実行する仕組みを構築。結果、人間レビュアーの負担軽減と組織全体の知識共有に貢献した。
AI時代の仕事術(10方式)
本記事は、AI技術の発展に左右されない「仕事の本質」に焦点を当てた10個の仕事術を紹介している。AI時代において重要となるのは、「高度な不確実性」への迅速かつ効果的な対応であり、そのための具体的な方法として、パーキンソンの法則を意識した期限設定、結果と成果の区別、問題構造の整理、目的の明確化、仮説検証、システムシンキング、LNOフレームワーク、不明点の優先的解決、情報発信などを提案している。これらの手法は、AI時代におけるホワイトワーカーの仕事の質を高めることを目指している。
MCPサーバーを作るMCPサーバーを作った
本記事は、AIモデルとの連携を容易にするMCP(Model Context Protocol)サーバーを自動生成するツール「mcp-create」の開発について報告しています。TypeScriptで記述され、Docker上で動作します。文字列反転やGitHub連携等の例が示され、プロトタイプ作成や既存MCPサーバーの調整に有用です。現在、Python対応やコード部分更新、シーケンシャル思考への対応は未実装ですが、今後の開発が期待されます。GitHubで公開されており、Pull RequestやIssueも歓迎とのことです。
プロンプト泥棒がやってくる! 〜生成AI時代のセキュリティ対策〜
生成AIツールの急速な普及に伴い、プロンプトインジェクションによるセキュリティ脅威が深刻化している。本記事は、AIツール(Cline, V0など)へのプロンプトインジェクション攻撃の実例と、その対策を解説する。攻撃者は巧妙なプロンプトでシステムプロンプトや機密情報を抽出可能であることが示された。対策として、システムプロンプトへの追加指示、出力フィルター、追加のLLMによる入力・出力フィルタリングなどが挙げられるが、完全な防御は困難。最小権限の原則、厳格な認証、データ分離などを組み合わせた多層防御が現実的な対策となる。 LLMの挙動は不確定要素が多く、情報漏洩リスクを常に考慮したシステム設計が不可欠である。
【2025/3/9】集計 新着週間Like数 ランキング Top5
Clineに全部賭ける前に 〜Clineの動作原理を深掘り〜
ClineはVSCode拡張機能で、ClaudeやChatGPTと連携し、コード生成、バグ修正、ターミナル操作などを自動化する。 革新性は、AIが自律的にツールを選択・実行する点と、プロジェクト全体をコンテキストとして理解する点にある。内部構造は、システムプロンプトで定義されたツールを用いてAIと対話することで実現。 clinerules
によるプロジェクト固有ルール設定や、明確な指示、タスク分解が効果的な活用に繋がる。セキュリティリスクも存在するため、初期段階ではツール承認を慎重に行う必要がある。今後の展望として、MCP拡張、セキュリティ強化、コンテキスト理解向上などが期待される。
MCPで広がるLLM ~Clineでの動作原理~
ClineはMCP(Model Context Protocol)を用いてLLMに外部サービスとの連携機能を提供する。MCPは統一されたプロトコルで、Notion、Supabase、GitHub等様々なサービスとLLMを接続できる。Clineでは拡張機能でMCPサーバーを追加し、自然言語で指示することで外部サービスを操作可能。 実装は、ClineがMCP SDKを用いてMCPサーバーと通信するシンプルな構造。 MCPはLLMの機能を飛躍的に向上させる一方、セキュリティリスクも伴うため注意が必要。
Claude Codeで感じたAIとソフトウェア開発の未来
Claude Codeを用いたiOSアプリ開発において、AIは高速なコード生成が可能だが、人間の設計思想をそのまま反映させるのは非効率だった。AIの特性に合わせ、シンプルなコード、モジュール分割を意識することで開発速度を3倍向上できた。ただし、AIの理解度や言語仕様への未対応による修正作業も発生。 AIは部下として扱い、軌道修正を挟みつつ、メンテ可能な範囲に留めることが重要。将来的には、AIの進化とコスト低減により、これらの課題は軽減されると予想される。
CursorのProject Rules運用のベストプラクティスを探る
CursorのProject Rules運用ベストプラクティスとして、(1)日々アップデートし、AIの改善点に対応する。(2)mdc
ファイルを複数md
ファイルに分割し、スクリプトで結合することで保守性を高める。(3)alwaysApply
, Auto Attach
, Description
を正しく設定する。alwaysApply
のみでは不十分で、他の設定も必須。Auto Attach
のglobs
指定は配列ではなくワイルドカードを使う。これにより、エージェントのパフォーマンス向上とチームでの共有が容易になり、オンボーディング資料としても活用できる。ただし、@
によるコンテキストの明示など、Project Rules以外の要素も重要である。
OpenHands(OpenDevin)を使った感想「本家Devinは安い」
OpenHands(OpenDevin)と有料AIエージェントDevinの比較検証結果。Google Cloud上にデプロイしたOpenHandsは、高額なLLM(Claude Sonnet 3.7)使用で1時間あたり約30ドルの費用が発生。一方、Devinは1時間あたり8ドルと安価。OpenHandsは低コストLLMやカスタマイズ性という利点を持つが、高性能なLLM使用時はDevinの方がコストパフォーマンスが良いと結論づけた。個人利用では月額500ドルは高額だが、Devinの機能や精度を考慮すると妥当な価格設定と言える。
【2025/3/2】集計 新着週間Like数 ランキング Top5
CLINEに全部賭けろ
Cline型コーディングエージェント(Cline)を用いたAIプログラミングは、プログラミングの再発明であり、圧倒的なコーディング速度を実現する。特に、Clineは環境情報を参照し、高速な試行錯誤サイクルを回し、人間では不可能な速度でテストを通過するコードを生成する。著者(5-10年経験のフルスタックエンジニア)は、Clineに全賭けする理由として、700行のコードを15分で作成できる能力、型推論等の高度なタスクへの対応、そして人間がボトルネックであることを克服できる点を挙げる。しかし、Clineは危険な実行権限を持ち、セキュリティリスクも伴う。Clineを使いこなすには、コンテキスト記述能力、ドメイン記述能力、AI性能に対する直感が必要となる。将来、Cline型コーディングが普及すれば、AIを使いこなせるプログラマーだけが生き残ると予測している。
Webアプリケーション・アーキテクトの自分は何に全部賭けるのか
フルスタックエンジニアの筆者は、AI活用における「一つのモデルに固執する」平成的な発想からの脱却を提唱。OpenAI、Claude、Geminiなど複数AIモデルの特性を理解し、使い分け、相互レビューすることで効率と精度を向上させると結論づけた。 GUIの使いやすさなどに囚われず、様々なAIモデルを積極的に活用し、AIと共存・発展していく必要性を強調している。今後、Webブラウザ上でのAIエージェント活用が進むと予測する。
Xに頼らずAI関連情報をキャッチアップする
本記事は、Xに頼らないAI関連情報収集方法を紹介する。arXiv、Reddit、Hacker News、GitHub Trending、技術ブログのRSSフィードなどを活用し、論文、最新モデル情報、ユーザーレビュー、実践的なテクニックなどを効率的に収集できる。特に、arXiv論文をキュレーションするサービスや、AI関連のRedditサブディットを有効活用する方法を詳述。さらに、これらの情報を一元的に閲覧できる自作Webアプリ(OSS)も公開している。複数の情報源を組み合わせることで、X以上の効率と質の高い情報収集が可能となる。
AIコーディングでも小さく刻んで開発すると効果的だと主張したい with Cursor
AIコーディング支援ツールを活用するには、タスクを小さく分割することが効果的である。大規模なタスクを丸投げすると、AIがコンテキストを理解できず、誤ったコード生成やテスト失敗のループに陥るため。 効果的な活用法として、(1)明確なプロンプト、(2).cursor/rules
によるルール設定、(3)実装計画→テスト→実装の3ステップによるタスク分割が挙げられる。 フロントエンドやRailsのテストなど、コンテキストが複雑な場面では、特にタスクの細分化が重要となる。AIツールの進化次第で状況は変わるものの、現状では小規模タスクへの適用が現実的である。
これからのGitHubのIssue作成はAIエディタ内で済ませよう
Windsurf等のAIエディタとMCP(Model Context Protocol)を用いたGitHub Issue作成方法を紹介。 AIが関連ファイルや修正点を提案し、高品質なIssueを5分程度で作成できる。 手順はMCP設定、AIへの指示によるIssue作成、Markdownファイル作成・編集、Issue更新の5段階。 Cascade Baseモデルを使用し無料で利用可能だが、MCP通信の不安定さが課題。 GitHub Issue作成、更新、検索など17種類以上のGitHubアクションに対応。
【2025/2/23】集計 新着週間Like数 ランキング Top5
君たちはCursorを本当に使えているか
経験豊富なエンジニアがCursor Composerを用いて、大規模コードベースでのコーディング時間を1/3~1/5に削減した手法を紹介。Claude 3.5 Sonnetモデルと、プロジェクト設定(.cursorrules, NotePads, .cursorignore)、適切なプロンプト設計が鍵。複数ステップに実装を分割し、各ステップ毎にプロンプトを送り、必要に応じて修正・テストを繰り返すことで高精度な実装を実現。現状のモデル性能では、一度のプロンプトで数千行規模の実装は困難なため、この手法が有効と結論づけている。
DevinにVitest移行させたら数分で5000円溶けた [人間がやったほうが安い]
AIエンジニア「Devin」を用いたOSSライブラリ開発で、新規パッケージ作成とドキュメント生成は成功し、それぞれ約3000円、約300円のコストで完了した。一方、JestからVitestへの移行は5000円のコストがかかったものの失敗に終わった。Devinは小規模変更やドキュメント生成には有効だが、大規模リファクタリングには不向きであることが判明。GitHub連携の切り替えが煩雑で、具体的な指示が必要となる点が課題として挙げられた。
自律型AIエンジニア「Devin」の活用事例 〜1ヶ月の実践から見えた効果的な導入方法〜
スマートラウンド社は自律型AIエンジニア「Devin」を導入し、1ヶ月間の活用結果を報告。Devinはジュニアエンジニアレベルの能力で、Slack経由でタスクを依頼。文言修正、小機能追加、機能廃止、新規画面基盤作成、コード調査支援に有効と判明。UI修正、曖昧な要件、大量ファイル修正には非推奨。効果的な活用にはFew-shotプロンプティングやPlaybook機能が有効だが、精度の高い出力には人間の確認が必要。今後の展望はDevinのKnowledge機能活用による能力向上と、最小限のプロンプトで最大限のアウトプットを目指すこと。 Devinの活用は長期的な視点が必要。
強化学習「GRPO」をCartPoleタスクで実装しながら解説
本記事は、LLM「DeepSeek-R1」で用いられた強化学習手法GRPOを、CartPoleタスクを用いてPyTorchで実装解説したものです。GRPOは状態価値関数を用いず、複数試行の報酬の平均値からの差分をAdvantageとして計算することで、Policy Networkの重みを更新します。CPU環境(Google Colab)で約7分でCartPoleタスクを解き、200ステップ以上棒を立て続けることができました。Pendulumタスクへの拡張も提供されていますが、こちらはGPU環境が必要となります。GRPOは疎な報酬環境に有効で、人間の行動改善の直感と合致する点も示唆されています。
Devin に Dependabot PR をレビューしてもらおう
Devin AIを用いたGitHub Dependabot PRの自動レビュー・修正システムを構築した。DevinにDependabot PRをレビューさせ、破壊的変更の有無を確認、コメントで概要と影響を報告させる。破壊的変更があれば修正PRを作成する。これにより、ライブラリ更新による影響把握とPRマージ判断の迅速化を実現した。ただし、複雑な修正や影響範囲の判断には課題が残るため、プロンプト調整や知識追加が必要。 Playbookへの登録により、コマンドで簡単に実行できるようになっている。
Discussion