Zenn
🥇

【ai トピック】今週の人気記事TOP5!(2025/4/6 更新)

2025/03/12に公開

【2025/4/6】集計 新着週間Like数 ランキング Top5

Cline / Roo-Codeにおけるコード理解と新規・保守タスクの現状

Roo Code (Cline)はTree-sitterを用いた局所的なコード理解に特化しており、小規模な修正や新規開発に適する。大規模リファクタリングや保守タスクには、全体インデックスの欠如と設計意図の理解不足から不向き。デッドコード検出も困難。 CursorやWindsurfのような全体インデックスを持つツールと異なり、ドキュメントコメントや依存関係マップ等の追加情報で補完することで効果を高められる。 局所的なタスク分割と明確な指示が重要となる。

AIを用いた開発の効率を最大化させるためにやっていることを全部書く

この記事は、AIアシスタント(Cursor, Windsurf, Cline)を用いた開発効率化のTipsを30個以上網羅したものです。著者は、詳細な要件定義(PRD: Markdown形式)とAIの動作ルール(Rules)の作成・更新、タスクリストと実装ログのGitHub Issue管理、小規模な実装単位、徹底的な計画立案、モデル(Gemini, Sonnet)の使い分け、セッションの頻繁な切り替え、コンテキストの適切な管理などを重視しています。 さらに、プロンプトの工夫、エラー修正への固執回避、TDD/DDDの継続、Git活用、音声入力などを実践し、AIの限界を理解した上で効率的な開発を目指していることが結論です。

AIエージェントの考えすぎを防いでRAGの精度を向上

ReaRAGは、AIエージェントの過剰推論を防ぎ、RAGの精度向上を実現する手法です。 LLMの思考ループ内でツール(Web検索など)を使用し、少ないステップで回答に到達するパターンを学習することで、ツール利用の精度を向上させます。ベンチマーク結果では、多段階推論タスクにおいて既存手法と比較し約15%の精度向上と、推論ステップ数の2~4割削減を確認。 ツール使用法を事前に学習させる必要があるため、導入は容易ではないものの、プロンプト調整では限界のある高精度化が必要なタスクに有効です。

M5Stack + Module LLM を使ってみた

M5Stack用AIモジュール「Module LLM」は、AX630Cプロセッサと4GBメモリを搭載し、LLM、画像処理、音声認識・合成をデバイス内で実行可能。StackFlowフレームワークとM5Stack用ライブラリを提供。LLMはQwen2.5、TTSはsingle_speaker_english_fast、ASRはsherpa-ncnn、KWSはsherpa-onnxをデフォルトモデルとする。音声アシスタント機能も備え、KWS→ASR→LLM→TTSの流れで動作する。Arduino IDE/PlatformIOに対応し、シリアル通信で制御。エラーハンドリングの重要性を指摘している。

「AIワークフロー」で実現する論文調査の自動化

松尾研究所インターンが開発した論文調査ツール「論文調査くん」は、AIワークフローを用いて論文調査を自動化する。日本語クエリを英語に翻訳、arXiv APIに適したキーワードに変換、検索結果から回答を生成する3つのLLM呼び出しで構成。構造化出力によりLLMのハルシネーションを抑制し、安定性を向上させた。OpenAI API、クラウドベクトルデータベース、Slack Botなどを活用し、迅速な開発・展開を実現。社内展開を経て、経験の浅い者でも効率的な論文調査が可能になった。

【2025/3/30】集計 新着週間Like数 ランキング Top5

Cursor / Clineを使う上でもっとも重要なことの一つ: コンテキストウインドウについて

Cursor/Cline等のLLMコーディングアシスタント利用において、LLMのコンテキストウィンドウ(一度に処理できるトークン数)の限界を超えると、「Lost in Middle」現象(中間情報の欠落)が発生し、性能低下、ループ、誤ったルール追加の悪循環に陥る。 対策として、1. タスクを小分けにする、2. ルールを最小限に絞り、本質的な情報のみ記述する、3. 現実的な期待値を持つ、ことが重要。 LLMは万能ではなく、人間の検証との連携が不可欠である。

Playwright MCPとCursorで、E2Eテストを自動生成してみた 〜AI×ブラウザ操作の新アプローチ〜

Playwright MCPとCursorを用いたE2Eテスト自動生成の検証結果。Cursor(claude-sonnet-3.7)に自然言語指示を与え、Playwright MCP Server経由でE2Eテストコードを自動生成。ログイン画面とログイン後の画面のテストを生成し、生成されたコードは一部修正が必要だったものの、実行可能だった。 AIによるテスト自動生成は、テスト作成工数の削減に有効であり、Playwright MCPは強力な選択肢となる。

Model Context Protocol (MCP) サーバを使ってみた・作ってみた

Model Context Protocol (MCP)はLLMの機能拡張を容易にするプロトコル。 本記事では、Cline環境下での公式MCPサーバー(Brave Search、Fetch、GitHub)の導入と、著者によるGit/GitHub操作用MCPサーバー作成を解説。Dockerを用いた公式サーバーの容易なセットアップと、自作サーバー作成におけるClineとLLMの活用が示された。自作サーバーは、Git操作やPull Request作成を簡素化し、.clinerulesによる煩雑さを解消する。MCPはLLM機能をプラグインのように拡張する有効な手段であると結論づけている。

Model Context Protocol(MCP)とは?生成 AI の可能性を広げる新しい標準

Model Context Protocol (MCP)は、生成AIと外部システムの連携を標準化するオープンなプロトコルです。従来の個別API連携に比べ、開発効率を大幅に向上させ、拡張性と保守性を高めます。クライアント・サーバーモデルとJSON-RPC 2.0プロトコルに基づき、リソース、ツール、プロンプトの3つの主要機能を提供。既に複数のMCPサーバーが公開されており、様々なサービスとの連携が容易になっています。セキュリティ面も考慮され、アクセス制御やLLMサンプリング制御により安全性を確保しています。今後のAI開発において重要な役割を果たすことが期待されます。

AIに書かせたコードは理解する必要がある

AI生成コードは理解が必要だ。複雑なアプリではAIツールは「死の穴」(エラーからの脱出困難)に陥りやすく、復旧にはコード理解が必須となる。また、AIに丸投げすると、目標が歪められ、脆弱性(SQLインジェクションなど)を含むコードが出力されるリスクもある。テストを通過しても、ブラックボックス状態では脆弱性を検知できない。大量の悪意あるコードをインターネット上に配置することでAIモデルの出力を操作するデータポイズニングの可能性も考慮すべきだ。しかし、AIコーディング支援は生産性向上に不可欠であり、AIを道具として使いこなすことが重要となる。

【2025/3/23】集計 新着週間Like数 ランキング Top5

【Cursor】FigmaにアクセスしてUIコードを自動生成!

CursorとFigma MCP Serverを連携することで、FigmaのデザインデータからFlutter UIコードを自動生成できるようになった。FigmaのAPIキーを取得し、CursorのMCP設定ファイル(mcp.json)に設定することで、CursorのAgent機能からFigmaのURLを指定しコード生成が可能となる。 高精度なコード生成が可能だが、範囲が広いと精度が低下する傾向がある。 claude-3.7-sonnet-thinkingモデルが推奨され、デザインシステムの利用や範囲の分割が有効。 画像の自動ダウンロードも可能だが、サイズの指定方法は未確認。

自分がはてブした記事をPodcastにして配信する環境を作った

はてブ記事をPodcast化するシステムを、ClineとClaudeを用いて開発した。 はてブのRSSフィードから記事を取得し、OpenAI/Google APIで要約・音声合成を行い、Cloudflare R2で配信、Next.jsでWebサイトを構築する。 AIによるコード生成を活用することで、開発時間を大幅に削減(約15時間、AI動作時間2時間未満)。コストも数百円で済んだ。 ただし、プロンプト調整や音声品質の最適化など、人間の介入が不可欠だった。 現時点ではローカル運用だが、将来的な自動化や機能拡張を検討中。

Vimmer にお勧めしたい AI エージェント「Aider」

Vimユーザーの筆者は、様々なAIコーディングツールを試した結果、ターミナル上で動作するAIエージェント「Aider」にたどり着いた。Aiderはエディタに依存せず、OpenAIやClaude等のAPIを直接利用するため、単一障害点がなく、コスト効率も良い。柔軟な設定も可能で、オープンソースである点も利点。他のツール(Cursor、Cline、Claude Code、Devin)と比較し、安定性と使いやすさでAiderを高く評価している。エディタの変更を望まないVimユーザーにとって、強力な選択肢となる。

今からでも遅くない!まだDevinと遊んでいない技術意思決定者へ

フルスタックエンジニア5-10年経験の筆者は、AIエンジニアリングツールDevinを1ヶ月使用した経験から、費用対効果の高いツールと結論づけている。100-200行程度の明確なタスク、ライブラリアップデート調査、CI修正、単体テスト作成などに有効で、1タスクあたり3,000円程度のコストで済むケースが多い。 ただし、ACU消費には注意が必要。 Devinはジュニアエンジニアレベルのコード生成能力だが、高いドキュメント力や調査力で補われ、適切な指示とフィードバックで高い生産性を実現する。初期設定とタスク分解が重要。

現時点のAIエージェントを活用した開発方法と考え方とTIPS

本記事は、RooCode(Cline拡張)を用いたAIエージェント活用による開発手法を紹介している。VSCode+DevContainerによる安全な開発環境構築、ADR/DesignDocとmemory-bankによるコンテキスト共有、.cline-rulesによるコードスタイル統一、MarkdownベースのPRDからのコード生成などを実践している。 Copilot連携によるAPIコスト削減、自動承認設定による安全な操作を実現している。 複数ツールとの連携強化と、コンテキストの明確化による高品質なコード生成を目指している点が結論と言える。

【2025/3/16】集計 新着週間Like数 ランキング Top5

ZennチームにもDevinがジョインしました。そしてAIコーディング時代におけるエンジニアの役割について

Zenn社はAIコーディングエージェント「Devin」を1ヶ月間導入し、本番コードベースへの適用を試行した。結果、タスクを細かく分割して指示すれば、10営業日で約30個のPRマージという高い生産性を実現。ただし、丸投げではうまくいかず、詳細な指示とテストコードが必須であることが判明。Devinはサンドボックス環境での安全な実行、Slack連携によるスムーズな作業、比較的安価な価格が強み。課題としてKnowledge管理のUI改善や、大規模な変更への対応などが挙げられた。生成AI時代においても、プログラミング言語の読み書き能力は高度な専門性として価値を保ち続け、ジュニアエンジニア育成も新たな形で継続されると予想された。

Devinにコードレビューをさせ、コード品質と開発速度を同時に高める話

GLOBIS Techは、AIコードレビューツールDevinを導入し、コード品質向上と開発速度の両立を実現した。45件のPRのうち約55%は高品質だったが、残りの20件でDevinはバグや設計上の問題を約半数検知し、手戻りを削減。指摘内容は、バグ防止、パフォーマンス改善、設計・リファクタリング、ドメイン特化、可読性・メンテナンス性など多岐に渡る。 Devinのチューニングは、レビューお作法、Rails設計パターンの浸透、ドメイン知識の活用に重点を置き、Knowledgeとプロンプトを使い分けた。GitHub Actionsと連携し、PR作成・更新時に自動レビューを実行する仕組みを構築。結果、人間レビュアーの負担軽減と組織全体の知識共有に貢献した。

AI時代の仕事術(10方式)

本記事は、AI技術の発展に左右されない「仕事の本質」に焦点を当てた10個の仕事術を紹介している。AI時代において重要となるのは、「高度な不確実性」への迅速かつ効果的な対応であり、そのための具体的な方法として、パーキンソンの法則を意識した期限設定、結果と成果の区別、問題構造の整理、目的の明確化、仮説検証、システムシンキング、LNOフレームワーク、不明点の優先的解決、情報発信などを提案している。これらの手法は、AI時代におけるホワイトワーカーの仕事の質を高めることを目指している。

MCPサーバーを作るMCPサーバーを作った

本記事は、AIモデルとの連携を容易にするMCP(Model Context Protocol)サーバーを自動生成するツール「mcp-create」の開発について報告しています。TypeScriptで記述され、Docker上で動作します。文字列反転やGitHub連携等の例が示され、プロトタイプ作成や既存MCPサーバーの調整に有用です。現在、Python対応やコード部分更新、シーケンシャル思考への対応は未実装ですが、今後の開発が期待されます。GitHubで公開されており、Pull RequestやIssueも歓迎とのことです。

プロンプト泥棒がやってくる! 〜生成AI時代のセキュリティ対策〜

生成AIツールの急速な普及に伴い、プロンプトインジェクションによるセキュリティ脅威が深刻化している。本記事は、AIツール(Cline, V0など)へのプロンプトインジェクション攻撃の実例と、その対策を解説する。攻撃者は巧妙なプロンプトでシステムプロンプトや機密情報を抽出可能であることが示された。対策として、システムプロンプトへの追加指示、出力フィルター、追加のLLMによる入力・出力フィルタリングなどが挙げられるが、完全な防御は困難。最小権限の原則、厳格な認証、データ分離などを組み合わせた多層防御が現実的な対策となる。 LLMの挙動は不確定要素が多く、情報漏洩リスクを常に考慮したシステム設計が不可欠である。

【2025/3/9】集計 新着週間Like数 ランキング Top5

Clineに全部賭ける前に 〜Clineの動作原理を深掘り〜

ClineはVSCode拡張機能で、ClaudeやChatGPTと連携し、コード生成、バグ修正、ターミナル操作などを自動化する。 革新性は、AIが自律的にツールを選択・実行する点と、プロジェクト全体をコンテキストとして理解する点にある。内部構造は、システムプロンプトで定義されたツールを用いてAIと対話することで実現。 clinerulesによるプロジェクト固有ルール設定や、明確な指示、タスク分解が効果的な活用に繋がる。セキュリティリスクも存在するため、初期段階ではツール承認を慎重に行う必要がある。今後の展望として、MCP拡張、セキュリティ強化、コンテキスト理解向上などが期待される。

MCPで広がるLLM ~Clineでの動作原理~

ClineはMCP(Model Context Protocol)を用いてLLMに外部サービスとの連携機能を提供する。MCPは統一されたプロトコルで、Notion、Supabase、GitHub等様々なサービスとLLMを接続できる。Clineでは拡張機能でMCPサーバーを追加し、自然言語で指示することで外部サービスを操作可能。 実装は、ClineがMCP SDKを用いてMCPサーバーと通信するシンプルな構造。 MCPはLLMの機能を飛躍的に向上させる一方、セキュリティリスクも伴うため注意が必要。

Claude Codeで感じたAIとソフトウェア開発の未来

Claude Codeを用いたiOSアプリ開発において、AIは高速なコード生成が可能だが、人間の設計思想をそのまま反映させるのは非効率だった。AIの特性に合わせ、シンプルなコード、モジュール分割を意識することで開発速度を3倍向上できた。ただし、AIの理解度や言語仕様への未対応による修正作業も発生。 AIは部下として扱い、軌道修正を挟みつつ、メンテ可能な範囲に留めることが重要。将来的には、AIの進化とコスト低減により、これらの課題は軽減されると予想される。

CursorのProject Rules運用のベストプラクティスを探る

CursorのProject Rules運用ベストプラクティスとして、(1)日々アップデートし、AIの改善点に対応する。(2)mdcファイルを複数mdファイルに分割し、スクリプトで結合することで保守性を高める。(3)alwaysApply, Auto Attach, Descriptionを正しく設定する。alwaysApplyのみでは不十分で、他の設定も必須。Auto Attachglobs指定は配列ではなくワイルドカードを使う。これにより、エージェントのパフォーマンス向上とチームでの共有が容易になり、オンボーディング資料としても活用できる。ただし、@によるコンテキストの明示など、Project Rules以外の要素も重要である。

OpenHands(OpenDevin)を使った感想「本家Devinは安い」

OpenHands(OpenDevin)と有料AIエージェントDevinの比較検証結果。Google Cloud上にデプロイしたOpenHandsは、高額なLLM(Claude Sonnet 3.7)使用で1時間あたり約30ドルの費用が発生。一方、Devinは1時間あたり8ドルと安価。OpenHandsは低コストLLMやカスタマイズ性という利点を持つが、高性能なLLM使用時はDevinの方がコストパフォーマンスが良いと結論づけた。個人利用では月額500ドルは高額だが、Devinの機能や精度を考慮すると妥当な価格設定と言える。

【2025/3/2】集計 新着週間Like数 ランキング Top5

CLINEに全部賭けろ

Cline型コーディングエージェント(Cline)を用いたAIプログラミングは、プログラミングの再発明であり、圧倒的なコーディング速度を実現する。特に、Clineは環境情報を参照し、高速な試行錯誤サイクルを回し、人間では不可能な速度でテストを通過するコードを生成する。著者(5-10年経験のフルスタックエンジニア)は、Clineに全賭けする理由として、700行のコードを15分で作成できる能力、型推論等の高度なタスクへの対応、そして人間がボトルネックであることを克服できる点を挙げる。しかし、Clineは危険な実行権限を持ち、セキュリティリスクも伴う。Clineを使いこなすには、コンテキスト記述能力、ドメイン記述能力、AI性能に対する直感が必要となる。将来、Cline型コーディングが普及すれば、AIを使いこなせるプログラマーだけが生き残ると予測している。

Webアプリケーション・アーキテクトの自分は何に全部賭けるのか

フルスタックエンジニアの筆者は、AI活用における「一つのモデルに固執する」平成的な発想からの脱却を提唱。OpenAI、Claude、Geminiなど複数AIモデルの特性を理解し、使い分け、相互レビューすることで効率と精度を向上させると結論づけた。 GUIの使いやすさなどに囚われず、様々なAIモデルを積極的に活用し、AIと共存・発展していく必要性を強調している。今後、Webブラウザ上でのAIエージェント活用が進むと予測する。

Xに頼らずAI関連情報をキャッチアップする

本記事は、Xに頼らないAI関連情報収集方法を紹介する。arXiv、Reddit、Hacker News、GitHub Trending、技術ブログのRSSフィードなどを活用し、論文、最新モデル情報、ユーザーレビュー、実践的なテクニックなどを効率的に収集できる。特に、arXiv論文をキュレーションするサービスや、AI関連のRedditサブディットを有効活用する方法を詳述。さらに、これらの情報を一元的に閲覧できる自作Webアプリ(OSS)も公開している。複数の情報源を組み合わせることで、X以上の効率と質の高い情報収集が可能となる。

AIコーディングでも小さく刻んで開発すると効果的だと主張したい with Cursor

AIコーディング支援ツールを活用するには、タスクを小さく分割することが効果的である。大規模なタスクを丸投げすると、AIがコンテキストを理解できず、誤ったコード生成やテスト失敗のループに陥るため。 効果的な活用法として、(1)明確なプロンプト、(2).cursor/rulesによるルール設定、(3)実装計画→テスト→実装の3ステップによるタスク分割が挙げられる。 フロントエンドやRailsのテストなど、コンテキストが複雑な場面では、特にタスクの細分化が重要となる。AIツールの進化次第で状況は変わるものの、現状では小規模タスクへの適用が現実的である。

これからのGitHubのIssue作成はAIエディタ内で済ませよう

Windsurf等のAIエディタとMCP(Model Context Protocol)を用いたGitHub Issue作成方法を紹介。 AIが関連ファイルや修正点を提案し、高品質なIssueを5分程度で作成できる。 手順はMCP設定、AIへの指示によるIssue作成、Markdownファイル作成・編集、Issue更新の5段階。 Cascade Baseモデルを使用し無料で利用可能だが、MCP通信の不安定さが課題。 GitHub Issue作成、更新、検索など17種類以上のGitHubアクションに対応。

【2025/2/23】集計 新着週間Like数 ランキング Top5

君たちはCursorを本当に使えているか

経験豊富なエンジニアがCursor Composerを用いて、大規模コードベースでのコーディング時間を1/3~1/5に削減した手法を紹介。Claude 3.5 Sonnetモデルと、プロジェクト設定(.cursorrules, NotePads, .cursorignore)、適切なプロンプト設計が鍵。複数ステップに実装を分割し、各ステップ毎にプロンプトを送り、必要に応じて修正・テストを繰り返すことで高精度な実装を実現。現状のモデル性能では、一度のプロンプトで数千行規模の実装は困難なため、この手法が有効と結論づけている。

DevinにVitest移行させたら数分で5000円溶けた [人間がやったほうが安い]

AIエンジニア「Devin」を用いたOSSライブラリ開発で、新規パッケージ作成とドキュメント生成は成功し、それぞれ約3000円、約300円のコストで完了した。一方、JestからVitestへの移行は5000円のコストがかかったものの失敗に終わった。Devinは小規模変更やドキュメント生成には有効だが、大規模リファクタリングには不向きであることが判明。GitHub連携の切り替えが煩雑で、具体的な指示が必要となる点が課題として挙げられた。

自律型AIエンジニア「Devin」の活用事例 〜1ヶ月の実践から見えた効果的な導入方法〜

スマートラウンド社は自律型AIエンジニア「Devin」を導入し、1ヶ月間の活用結果を報告。Devinはジュニアエンジニアレベルの能力で、Slack経由でタスクを依頼。文言修正、小機能追加、機能廃止、新規画面基盤作成、コード調査支援に有効と判明。UI修正、曖昧な要件、大量ファイル修正には非推奨。効果的な活用にはFew-shotプロンプティングやPlaybook機能が有効だが、精度の高い出力には人間の確認が必要。今後の展望はDevinのKnowledge機能活用による能力向上と、最小限のプロンプトで最大限のアウトプットを目指すこと。 Devinの活用は長期的な視点が必要。

強化学習「GRPO」をCartPoleタスクで実装しながら解説

本記事は、LLM「DeepSeek-R1」で用いられた強化学習手法GRPOを、CartPoleタスクを用いてPyTorchで実装解説したものです。GRPOは状態価値関数を用いず、複数試行の報酬の平均値からの差分をAdvantageとして計算することで、Policy Networkの重みを更新します。CPU環境(Google Colab)で約7分でCartPoleタスクを解き、200ステップ以上棒を立て続けることができました。Pendulumタスクへの拡張も提供されていますが、こちらはGPU環境が必要となります。GRPOは疎な報酬環境に有効で、人間の行動改善の直感と合致する点も示唆されています。

Devin に Dependabot PR をレビューしてもらおう

Devin AIを用いたGitHub Dependabot PRの自動レビュー・修正システムを構築した。DevinにDependabot PRをレビューさせ、破壊的変更の有無を確認、コメントで概要と影響を報告させる。破壊的変更があれば修正PRを作成する。これにより、ライブラリ更新による影響把握とPRマージ判断の迅速化を実現した。ただし、複雑な修正や影響範囲の判断には課題が残るため、プロンプト調整や知識追加が必要。 Playbookへの登録により、コマンドで簡単に実行できるようになっている。

GitHubで編集を提案
CareNet Engineers

Discussion

ログインするとコメントできます