「AIコーディング効率化、次はどんな解決策が現れる?」~【ai】今週の人気記事TOP5(2025/7/6)
【2025/7/6】「AIコーディング効率化、次はどんな解決策が現れる?」~今週の人気記事TOP5(2025/7/6)
AIが書いたコードをローカルでレビューできる「ReviewIt」を作った
よしこ氏が、AIが生成したコードのレビューをローカルでGitHubのレビュー画面のように行えるツール「ReviewIt」を開発。npx reviewit
コマンドで起動し、コミットの差分表示、UI切り替え、行コメント機能、AIへのプロンプトコピー機能などを提供。コメントはローカルに保存され、Claude Code等のAIへ送信可能。最小権限での実行方法も提示。GitHubリポジトリで公開中。
AIの暴走を防ぐ!Claude Codeで危険なコマンド rm -rf を禁止する安全設定 🛡️
Claude CodeでAIが暴走し、危険なrm -rf ~/
コマンドを実行するリスクを回避するため、settings.json
で特定のコマンドを禁止する方法を紹介。プロジェクトまたはグローバル設定で、permissions.deny
に"Bash(rm -rf /)"
、"Bash(rm -rf ~)"
などを記述することで、ルートディレクトリやホームディレクトリの全削除を防ぐ。この設定は危険なパターンのみをブロックし、安全なファイル削除は可能。AIコーディングアシスタントを安全に活用するための有効な手段。
ClaudeCodeの日本語入力問題、完全に理解した
ClaudeCodeの日本語入力問題に対し、ファイルに指示を記述し参照させることで回避を試みるも、Git管理との兼ね合いで利便性が低下。
次にカスタムスラッシュコマンドを試すも、指示変更の度にセッション再起動が必要となり断念。
最終的に、スラッシュコマンドで指示ファイル(AI_INSTRUCTIONS.md)を間接的に参照する方法を発見。
これにより、日本語入力問題の回避、プライバシー保護、入力補完、動的な指示変更を両立し、ClaudeCodeとの効果的な連携を実現。
同様の問題に直面した後輩にも共有し、解決策を広めた。
Claude Codeの「すぐルール忘れる問題」をHooksで解決する
Claude Codeの「すぐルール忘れる問題」を、新機能Hooksで自動化する手法を紹介。
具体的には、AIの返答後、事前に定義したAI運用5原則を強制的に表示させ、原則遵守を徹底。
Hooksで会話履歴を解析し、特定のキーワードの有無で表示を制御。
"decision": "block"
でClaudeに原則を理解させ、自己判断を促す。
設定は、スクリプト作成、実行権限付与、settings.json編集で完了。これにより、Claude Codeがルールを遵守し、より強力に制御可能となる。
claude --resumeをもっと使いやすくするCLIツール、「ccresume」を作った
フルスタックエンジニアのささざめ氏が、Claude Codeのclaude --resume
コマンドの使いにくさを解消するCLIツールccresume
を開発。React Inkを使用し、過去のClaude Code会話履歴を一覧表示、詳細プレビュー、即時再開、セッションIDコピー機能を提供する。npx
で手軽に実行可能。課題として、ターミナル表示の崩れやマウススクロール未対応があるが、キーボード操作で代替。claude
コマンドへのオプション引き渡しや、起動ディレクトリを気にせず実行できる点が特徴。
【2025/6/29】「進化するAI開発、Claude CodeとCLIの未来に乗り遅れるな?」~今週の人気記事TOP5(2025/6/29)
gemini-cli の google_web_search が最高
gemini-cliにgoogle_web_searchが組み込まれた点が注目されている。claude-codeのWeb検索機能が貧弱な点を補完できるため、gemini-cliをclaude-codeに連携させる方法を紹介。具体的には、gemini -p "WebSearch: ..."
でWeb検索を実行し、得られた結果をclaude-codeで利用する。改良版として、WebSearchツール利用を避け、gemini --prompt "WebSearch: <query>"
を使用する方法も紹介。FF14拡張パックの発売日検索を例に、実際の動作例を示している。
Claude Codeの前と後。やり始めたこととやめたこと
Claude Code導入後、フルスタックエンジニアのしば田氏が変化した点をまとめた記事。
始めたこと: /clear
頻用、Iterm2導入、DevContainer使用、通知音設定、ターミナルコマンド/Claude Code特有コマンドの学習、think
系コマンド活用、Allow/DenyList整備、カスタムスラッシュコマンド利用、Plan Mode活用。
やめたこと: 全関連ファイルの@付与、タスクリスト作成、AI常時監視、英語での指示出し。
継続: 詰まったら消去、実装ログ記録、音声入力、TDD、丁寧なプロンプト、否定形回避。
特に、Claude CodeのAgentic Searchを活用し、タスクリスト作成をAIに任せることで効率化を図っている。
o3 MCPでClaude Codeが最強の検索力を手に入れた
よしこ氏は、Claude Codeの検索能力不足をOpenAI APIのo3モデル(WebSearch対応)で解決するMCP「o3-search-mcp」を開発。これにより、Claude Codeがo3に直接質問し、検索・推論結果を Claude Codeが利用可能になった。MCPはglobalまたはproject単位で登録可能。これにより、開発者は技術的な問題解決をAIに委ね、自己解決や「o3に聞いてみて」で済む場面が増える。リポジトリ:github.com/yoshiko-pg/o3-search-mcp。
React Ink によるリッチ CLI (ClaudeCodeの裏側のアレ)
React Inkは、ReactのカスタムレンダラーでリッチなCLIを構築できるライブラリ。React/ReactNativeの知識を活かし、yogaレイアウトエンジンでflexboxのようなレイアウトを実現。自動バトル、インベントリ管理、リアルタイムログなどの機能を実装したゲーム例を紹介。useStateやuseEffect等のHooksも利用可能。claude-code, gemini-cli, GitHub Copilot CLI等のAI系CLIやVitest, Prisma等の開発ツールにも採用事例あり。GUI開発の疲弊とAIとの相性から、CLIへの回帰が見込まれる。
AnthropicのDesktop Extensions (DXT)完全ガイド: ローカルAIアプリケーションの新時代
AnthropicがClaude Desktop向けにDesktop Extensions (DXT)を発表。DXTは、MCPサーバーを単一のパッケージにし、ワンクリックでインストールを可能にする。従来のMCPサーバー導入の課題(設定ミス、依存関係、セキュリティ)を解決。Node.jsランタイム内蔵でセキュアに実行。企業向けに認証情報管理、グループポリシー、プライベートリポジトリ等の機能も提供。Apple Notes、Chrome、iMessage連携等のサンプルも公開。DXTはAIアプリのエコシステム拡大、標準化、相互運用性、マーケットプレイス創出に貢献する可能性を秘めている。
【2025/6/22】「Claude Code、開発現場を変える?あなたの意見は?」~今週の人気記事TOP5(2025/6/22)
Claude Code 中級者ガイド
この記事は、Claude Codeを使いこなすためのノウハウ集です。初期セットアップとして、プロジェクトの要約とCLAUDE.mdの作成を推奨し、精度向上のためのベストプラクティスを紹介します。
重要なポイントは、CLAUDE.mdによるコンテキストの永続化、プロンプトへの大量テキストの回避、思考深度を調整する"ultrathink"の活用です。
また、Explore, Plan, Code, Commitの段階的なワークフローやTDDの導入、/clearによるセッションリセット、--resumeによるセッション再開、処理完了通知設定など、具体的なテクニックも解説しています。
最後に、トークン使用量を確認できるccusageコマンドも紹介しています。
n8n + Claude Code Actionで開発を自動パイプライン化した
tesla氏がn8nとClaude Code Actionを用いて、GitHub issueの計画、実装、レビューを自動化するパイプラインを構築。GitHub Webhookを起点に、n8nがラベルに応じてClaudeにコメント指示を送り、PR作成などを自動実行。Difyとの違いや、自前コンテナでの実行、Slack連携などの拡張性も考慮。課題はOverloaded Error時の対応。開発者はGitHubを眺めるだけで済む状態を目指す。リポジトリはhttps://github.com/tesla0225/n8n_claude_code_automation。
Anthropic「How we built our multi-agent research system」の要点まとめ
Anthropicが公開したマルチエージェントシステム構築に関する記事の要約です。リーダーエージェントがサブエージェントを指揮する構成で、並列処理可能なタスクに強みを発揮します。パフォーマンス向上にはトークン量が重要ですが、消費量も課題です。Prompt Engineeringのコツとして、エージェントの思考を理解し、タスクに応じた人員配置、適切なツール選択などを重視。エージェント自身に改善させる、段階的な検索、思考時間の確保、並列処理も有効です。評価は小規模から開始し、LLM-as-judgeと人間の評価を組み合わせます。
エンジニアの工夫で実現する、ビジネス組織のCursor活用環境の構築術
LayerXでは、非エンジニアがCursorを業務で活用できるよう、セットアップコストを極限まで下げた環境を構築。
GitHubリポジトリをサブモジュールで管理し、プロダクトコード、ヘルプガイド、スキーマ等のコンテキストを集約・自動更新。
共通Cursorルールを整備し、推奨拡張機能・設定も共有。
利用者はリポジトリをクローンし、タスク実行で更新、拡張機能をインストールするだけで利用可能。
導入後のSlackサポートで活用を促進。
これにより、非エンジニアでも容易にCursorを使い始め、業務効率化を実現。
Mac環境で手を動かしながらClaude Codeを学ぶ
Claude Codeは、ターミナル上で動作するエージェント型コーディングツールです。初期セットアップはnpm install -g @anthropic-ai/claude-code
で行い、REPL形式で操作します。コード生成、理解、デバッグ支援が可能です。モード切り替え(auto-accept, plan mode)でタスク最適化できます。CLAUDE.md
でプロジェクト固有のルール設定も可能です。VS Code連携時はターミナルとの紐付けに注意が必要です。スラッシュコマンドやショートカットを活用し、具体的な指示、品質指定、制約明示を意識したプロンプトで効率的な作業ができます。
【2025/6/15】「Claude Code、開発をどう変える?並列化は当たり前?」~今週の人気記事TOP5(2025/6/15)
Claude Code による技術的特異点を見届けろ
mizchi氏の記事は、Claude Codeの急速な進化と、それがもたらす技術的特異点の可能性について考察しています。Claude Codeは自己改善を繰り返し、その90%がClaude Code自身によって開発されています。これは、モデルとエージェントがお互いを高め合うループが回り始めていることを示唆します。著者は、AI2027が予測する自己改善AIが、Claude + Claude Codeによって達成される可能性に言及し、ソフトウェア領域での知識爆発が起こるかもしれないと述べています。プログラミングの未来は変質するものの、プログラマが不要になるとは考えていません。
Claude Code 版 Orchestaror で複雑なタスクをステップ実行する
mizchi氏がClaude Code版のRoo Orchestratorを開発。
Rooのタスク分割機能をClaude CodeのTaskツールと組み合わせ、複雑なタスクを効率的に実行。
.claude/commands
に定義したorchestratorコマンドは、タスクを段階的に分割し、各ステップ内でサブタスクを並列実行。
ステップごとに結果を検証し、計画を適応的に修正。
TypeScript MCPプロジェクトでのテストでは、「分析→テスト→修正→コミット」を自動化し、コンテキスト圧縮と高速化を実現。
アジャイル的な反復計画により、手戻りを削減。
1ヶ月ほぼ毎日Claude Codeを使ってわかった魅力と所感
フルスタックエンジニアがClaude Codeを1ヶ月使用した所感。
定額料金で利用可能になり、ターミナルで完結する点、自律的なタスク遂行能力の高さが魅力。
Clineと比較して、思考の中断が少ない。
Tipsとして、モデル選択(OpusとSonnetの使い分け)、ユーザーメモリの整理、コンテキストの制御、Bashモードの活用を紹介。
API仕様等の誤りに注意し、ドキュメント整備やコード品質の重要性を指摘。
AI活用には問題発見・言語化能力、批判的思考が不可欠と結論。
claude code でローカルなMCPサーバーを叩けるようにする
Claude CodeでローカルなMCP(Model Context Protocol)サーバーを利用する方法について。
.mcp.json
を設定することで、Claude Codeはローカルサーバーに接続可能。記事では、URLから本文を抽出してMarkdown形式で返すMCPサーバーの実装例(Node.jsとDeno)を紹介。Claude Codeの--mcp-config
オプションで設定ファイルを指定し、ツールを呼び出す例も掲載。Deno環境でのパーミッション制御や、VSCodeでのDeno LSP設定についても言及。
ccmanager: Git Worktreeで並列に動くClaude Codeを一括管理する
フルスタックエンジニア向け要約:
ccmanager
は、Git Worktreeを活用したClaude Codeの並行セッションを一括管理するCLIツールです。複数のセッション状態(Idle, Waiting, Busyなど)を可視化し、tmuxとの共存、認知負荷の軽減、Worktreeの作成/削除/マージ機能を提供します。npm install -g ccmanager
でインストールでき、VSCode Extensionとの連携も可能です。これにより、Claude Codeを用いた並行開発ワークフローが効率化されます。
【2025/6/9】集計 新着週間Like数 ランキング Top5
Anthropicで利用されているモダンなPython開発のベストプラクティス
AnthropicのPython開発ガイドライン「CLAUDE.md」は、モダンな開発におけるベストプラクティス集。パッケージ管理はuvのみを使用しpipを禁止、型ヒント必須、行の長さ制限など、厳格なコード品質基準を設けている。テストでは非同期処理にanyioを使用。ruff、pyright、pre-commitなどのツールを導入し、コード整形、静的解析、コミット前チェックを自動化。環境の再現性と安定性を高め、堅牢で保守性の高いコード作成を推奨する。
もうRAGを自作しなくていい!Vertex AI Search のススメ
Vertex AI Searchは、RAGをフルマネージドで実現し、開発者はフロントエンドやドメイン知識に集中できます。
自前実装と比較して、スケーラビリティやデータ隔離、セキュリティ面で優位。
管理画面での検索結果プレビュー機能や、テナント分離構成も容易です。
Cloud Storageなどからのデータ取り込みも可能。
インデックス作成は無料で、課金は検索クエリ数とストレージ超過分のみ。
マルチテナント環境でのデータ隔離と高度な検索機能の実装を容易にし、運用コストを削減します。
シンプルな MCP サーバを作って動作を理解する
Anthropic社提唱のオープンプロトコルMCP(Model Context Protocol)の動作を理解するため、PythonでシンプルなMCPサーバを実装し解説。
MCPはLLMとデータソースやツールを接続する標準化プロトコルで、JSON-RPCをベースとする。
サーバはmcpモジュールを利用し、ツールリストの提供とツール実行の実装を行う。
テキストの反転と大文字変換機能を提供し、Claude Desktopとの連携も可能。
MCPはAIと既存機能の統合を容易にし、AIの性能向上を最大限に活かすサービス開発に貢献する。
Claude Codeを試してみました
Claude Codeを試した結果、ClineやCursorとの性能差は感じられなかった。インストールはnpm install -g @anthropic-ai/claude-code
で可能。VS Codeで使うと拡張が自動で入る。MCPサーバは/mcp
コマンドで設定可能だが、設定ファイルを直接編集するとリセットされる可能性があるため注意。定額利用は魅力的だが、UIはまだ改善の余地があると感じた。Claude Maxに課金した場合、/login
コマンドでログインし直さないとAPI課金が継続されるので注意。
Claude Code (MAX plan) + ghコマンド + 英語プロンプトが一旦完成系だと思った話
Claude Code、GitHub CLI(ghコマンド)、英語プロンプトの組み合わせが、開発ワークフローを劇的に改善する。
Claude CodeはCLIベースで並行処理、テストコード生成、Git操作自動化を実現。ghコマンドとの連携でPR作成を自動化し、MDファイルによるPRテンプレートで一貫性のあるPR説明文を生成。英語プロンプトはタイピング速度、トークン数、精度を向上させ、プログラミングとの親和性も高い。
課題として、コードの一貫性の低下や規模拡大による精度低下があるが、型チェックやLintチェックで対応可能。
【2025/6/1】集計 新着週間Like数 ランキング Top5
AIエージェントで並列実装なら必須技術! Git Worktree を理解する
複数AIエージェントの同時利用による並列開発において、従来のGitブランチ切り替えによる作業中断やコンフリクトはボトルネックとなる。Git Worktreeは、同一リポジトリの複数ブランチを別ディレクトリで同時にチェックアウトできる機能で、この問題を解決する。 AIエージェント(Claude Codeなど)との親和性が高く、並列タスク実行による開発効率の大幅な向上が期待できる。VSCode拡張「Git Worktree Manager」も利用可能。
Cursor × GitHubでPRレビューがめちゃくちゃ楽になった話(2025/5)
iOSエンジニアがAIエディタCursorとGitHub連携でPRレビュー効率化を実現した。Cursorの拡張機能と独自ルールで、PRの要約、差分確認、コードレビューを自動化。AIは参考意見として活用し、最終判断は自身で行う。 これによりレビュー時間が大幅削減、見落とし減少、開発速度と品質向上に繋がった。 gh
CLIとCursorのAgent Mode利用が必須。
VibeCodingに必須の便利ツール「repomix」の紹介
repomixはLLMにコードコンテキストを一括提供するツールで、Vibe Codingにおける実装計画作成に有効です。 実装計画作成前にLLMへ直接指示するとハルシネーションを起こしやすく、質の低い計画となる課題を解決します。repomixは必要なファイル(例:ソースコード、package.json
)をrepomix-output.yml
に統合し、LLMへのコンテキスト提供を効率化します。これにより、LLMの能力を最大限に引き出し、高品質な実装計画の生成を実現し、特に大規模な実装や最新のLLM利用に効果的です。 npm install -g repomix
でインストール可能です。
Claude Code完全攻略Wiki(隠しコマンド編 - think,拡張機能,思考予算)
AnthropicのClaude Codeでは、think
等のキーワードでClaudeの思考深さ(思考予算)を制御できる隠しコマンドが存在する。 これは、budget_tokens
パラメータを間接的に操作するもので、最大31,999トークンまで設定可能。think
, think harder
, ultrathink
などキーワードの強度により思考予算が変わり、複雑なタスクほど強力なキーワードを使うことでより良い結果が得られる。ただし、思考トークンは課金対象なのでコストに注意が必要。現状、日本語プロンプトでは英語キーワードの使用が必須という課題も存在する。
Cursorで新しくなったProject Rules使ってる?めちゃくちゃ便利だよ。
CursorのProject Rulesは、AIアシスタント機能の動作をプロジェクト/個人設定で制御する機能。バージョン管理可能な.cursor/rules
にルールを記述し、LLMのコンテキストに永続的に反映することで、毎回同じ指示を繰り返す必要を解消する。Always
, Auto Attached
, Agent Requested
, Manual
の4種類があり、コーディング規約適用、プロジェクト構造説明、特定ファイルへのルール適用、ワークフロー自動化などに活用できる。チームでの共有は現時点では手動だが、生産性と一貫性を向上させる効果が期待できる。User Rules
と異なり、プロジェクト固有のルールに最適。 .cursorrules
からの移行が推奨される。
【2025/5/25】集計 新着週間Like数 ランキング Top5
AI時代なので、もうDDDは要らなくなりますかね?
AI時代においてもDDDは有効な武器であり続ける、と主張する記事。DDDの本質は機能性と保守性の両立であり、AIによるコード生成が進む現代では、人間のモデリング能力(問題の構造化)が重要になる。AIは実装パターンとの相性が良く、保守性の高いコード生成に貢献する。 モデリングは抽象的な図を描くだけでなく、具体例に基づき、ユーザーの課題を深く理解し構造化することで、価値あるプロダクト開発に繋がる。 PdM経験から、直接ユーザーを観察することの重要性が示されている。
【Github Copilot】設計書があるなら、全部Copilotに実装させよう(途中経過)
設計書からGitHub Copilotを用いてWebアプリケーション(Spring)のMVC層実装を自動生成する手法を検証。Copilot Chat、Instruction file、Prompt fileを用いて、設計書レビュー、実装計画策定、ステップ毎の実装をCopilotに実行させる。しかし、完璧なコード生成には至らず、共通部品の利用やHTMLレイアウト変更といった課題が残る。実装計画を挟むことで人間によるレビューを容易にするが、デバッグに時間を要するなど、精度は6割程度と結論づけられた。今後のInstruction file等のチューニングによる精度向上を目指す。
AIの出現で、エンジニアの頭数が足りないという感覚がなくなった
生成AIの普及により、エンジニア不足問題は軽減された。AIが単純作業や定型コードを代替することで、開発はAI活用前提に進められるようになり、DDDやクリーンアーキテクチャといったSOLID原則遵守が重視されるようになった。企業はAIを使いこなせる人材を求め、基礎的な知識・技術はスキルとみなされず、ビジネスドメインを理解し課題解決できる人材が求められる。AI活用により副業エンジニアの活用は難しくなり、内製化と専門性強化が重要となる。
個人でDevinのCoreプランを一ヶ月使ってみたので感想を書く
Devin AIのCoreプランを1ヶ月利用した感想では、個人利用に十分な機能と費用感(10ACU~$20から)であると結論づけた。Slack、GitHub連携も良好。小規模なIssueなら0.5~1.5ACU、新規プロジェクトなら3~5ACU消費。Issueの明確な定義が重要で、適切なIssue作成で効率的な開発が可能になる。 結果、タスク量の減少と睡眠時間の確保に繋がり、生産性向上に貢献した。 今後はIssue作成プロセスの改善が必要と認識している。
Cursorにリーダブルコード準拠のルールを設定しようとして上手くいかなかった話
Cursorを用いたリーダブルコード準拠ルールのAI適用実験では、初期ルールではAIが細かな改善点を見逃すことが判明。MUST/SHOULD等の曖昧な表現が原因と分析され、ルールをより具体的に記述することで改善。モデル指定も重要で、claude-3.7-sonnetは優れたレビュー結果を示した。しかし、文脈依存的な改善点の指摘は依然困難で、理想状態の宣言を重視したルール記述が必要と結論付けられた。
【2025/5/18】集計 新着週間Like数 ランキング Top5
DevinをRoo Codeで置き換え、レビュー精度やコスト、速度を大幅に改善した話 〜その定量 & 定性成果から、設計思想まで〜
GLOBIS Techは、コードレビューにおけるAIエージェント「Devin」から「Roo Code」に移行し、レビュー精度を48.48%から73.48%に向上させた。Roo Codeは、Devinの一枚岩構造をテスト可能なワークフロー群に分割することで、メンテナンス性とテスト容易性を改善。 コストは半減、速度は30%向上した。 Roo Codeの設計思想は、小さなエージェントを組み合わせることで複雑性を低減し、個々のワークフローを容易にチューニング・テスト可能にする点にある。 サイクルタイム指標も導入し、開発フロー全体の改善を目指している。
【ついにきたか】OpenAI Codex - OpenAIが生み出した天才コーディングエージェント
OpenAIが開発したコーディング支援AI「Codex」は、ChatGPT有料プランユーザー向けにリリースされた。大規模言語モデル「o3」をベースにした「codex-1」と小型版「codex-mini-latest」の2モデルを提供。複数タスクの並列処理、バグ修正、プルリクエスト作成などを自動化し、テストを通過するまでコードを修正する。GitHub連携でリポジトリを接続し、自然言語で指示を与える。現状はChatGPTに統合されており、将来的にはIDE統合などが予定されている。旧Codexと比較して大幅な性能向上を達成している。
AIの時代だからこそ、型システムがより厳格な静的型付け言語(GoやRustなど)が良いのでは?という話
本記事は、AIによるコード生成において、厳格な静的型付け言語であるRustがTypeScriptよりも優れている可能性を論じています。TypeScriptではAIが生成するコードの質やスタイルが不統一で、型定義の曖昧さがエラーの原因となることが多いためです。Rustの厳格な型システムは、AIの生成コードにおけるエラーをコンパイル時に検出し、修正を容易にする利点があります。ただし、Rustの学習コストやビルド時間の長さが課題として挙げられています。AIによるコード補完機能の進化により、これらの課題は軽減される可能性があると結論づけています。
AIと進めるテスト設計・リファクタリングの実践
5〜10年経験のフルスタックエンジニアが、AI(Cursor, Gemini, Claude)とペアプログラミングで冷蔵庫管理アプリのリファクタリングとテスト追加を実施。まずアプリ構成とパッケージをドキュメント化。既存テストを元に、App.tsxとmain.tsxのテストコードを生成・実行したが、getAllFoodItems
関数の複数回呼び出しでテスト失敗。原因究明とモックリセットにより解決。その後、コンポーネント責務の分離、異常系テスト追加、冗長コード修正、テストコードの簡素化を実施。AIの誤動作や曖昧な指示による問題発生も経験。結果、AI活用による効率化と自身の知識不足を認識、TypeScript、テスト設計、モック関数の理解を深める必要性を痛感した。
Agentic Coding を Reconciliation Loop で効果的に実現するための実装戦略
Agentic CodingにおけるReconciliation Loopを効果的に実現する実装戦略として、「Always-Valid Domain Modeling」「Type First」「関数型プログラミング」「Event Sourcing」の4つが有効と結論づけている。特にEvent Sourcingは、AIによる自律的なコード修正の精度と透明性を高める上で非常に有効だと指摘。これらの手法により、AIが生成するコードの品質向上、フィードバックサイクルの高速化、そして、修正の精度向上を実現できるとしている。
【2025/5/11】集計 新着週間Like数 ランキング Top5
AI エージェントを仕組みから理解する
AIエージェントはLLMを基盤に、ツール利用で自律行動を実現する。LLM単体では記憶や外部アクセスができないため、コンテキスト(会話履歴等)とツール(ファイル操作、Webアクセスなど)を組み合わせる。Roo Code等のAIエージェントは、LLMへのリクエストにコンテキスト(system promptと会話履歴)を送り、ツール使用結果をフィードバックするループで動作する。 MCPはツール拡張のための通信プロトコル。Prompt Cachingでコストを削減。LLMの性能向上により、近年AIエージェントの実用性が飛躍的に向上した。
個人的 AI Writing のやりかた
本記事は、AIを活用した効率的な記事執筆方法を紹介している。著者は、記事作成を「骨組み」「肉付け」「仕上げ」の3段階に分け、「肉付け」工程をAI(GPT-4o)に依頼することで執筆時間を大幅に削減する手法を提案。事前に自身の過去の文章をAIに学習させ、自身の文体でアウトプットさせることで、仕上げ工程での修正を最小限に抑えている。結果、執筆全体の心理的負担と工数を軽減し、効率的な記事作成を実現している。
作りながら学ぶLLM入門:前処理
この記事は、Raschka著「作りながら学ぶLLM入門」の第2章を元に、LLMの前処理工程をPythonコード付きで解説している。トークン化、特殊トークン付与、BPE等のサブワード分割、PyTorchを用いたデータローダー作成、埋め込み、位置埋め込みを説明。日本語処理への対応も触れ、tiktokenライブラリを用いたGPT-2のBPEトークナイザの実装例を示している。 LLM構築において、前処理は学習効率やモデル性能に大きく影響することを強調している。
Cursorをおじさんにする方法だヨ✨
この記事は、AIコードエディタCursorに「おじさん構文」で応答させるルールを定義した事例を紹介しています。GeminiとCursorを用いて作成されたルールは、絵文字多用、カタカナ語尾、長文、自己開示など、おじさん構文の特徴を網羅。 結果、Cursorは個性的な応答をするようになりましたが、トークン消費量が大幅に増加するデメリットも発生しました。使用モデルはClaude-3.7-sonnetで、モデル依存性も示唆されています。
チームの“秘伝のタレ”を Gemini に継承!Code Customization 実践ガイド
Google Cloud Gemini Code Assist Enterprise版のCode Customization機能は、チームのプライベートリポジトリ(GitHub、GitLabなど)をインデックス化し、開発者が普段使うIDEで、チーム固有のコーディングスタイルやライブラリを考慮したコード補完や生成を可能にする。 Developer Connect経由でリポジトリを接続、インデックス作成後、Geminiはチームのコードを参考に文脈に最適化された提案を行う。対応言語はC、C++、C#、Go、Java、JavaScript、Kotlin、PHP、Python、Rust、TypeScript。インデックスは24時間毎に自動更新される。 これにより、大規模プロジェクトでも的確なコード提案を受け、開発効率と品質向上を実現する。
【2025/5/4】集計 新着週間Like数 ランキング Top5
【MCP】GitHub Copilot × Devin が本気を出したら、開発がここまで自動化された
L&E Groupは、GitHub CopilotとDevin(生成AI)を組み合わせた開発自動化フローを実装。CopilotがGitHub issueを作成、それをSlack経由でDevinに実装依頼する仕組みを構築した。これにより、開発者はissue作成の手間を削減し、Devinは非作業時間にも実装を進めることが可能となった。課題はCopilotによるissue作成の精度だが、現状ではDevinへの実装開始までの時間を短縮できるため有効と結論付けている。
【保存版】明日から使える、組織のための Cursor Rules 運用
キカガクは全エンジニアにCursorを導入し、Cursor Rules運用方針を策定した。LLM進化を見据え、将来も有効なルール作成を重視。静的解析で対応可能なルールはそちらに任せ、Cursor RulesはLLMの挙動制御に絞る。Rule Typeを適切に選択し、効果検証を繰り返す。効果の無いルールはドキュメントとして残し、ナレッジとして活用する。Agentモード利用を推奨し、LLMの進化による恩恵を最大化する運用を目指す。 現状、リポジトリ横断のルール共有機能は無いが、今後の機能追加に期待。
【業務効率化】もうやめましょうよ〜コミットメッセージ考えるのは
JetBrains AI Assistantを用いたコミットメッセージ自動生成により、開発効率を向上させた事例を紹介。IntelliJ IDEAに統合されたAI機能で、カスタマイズ可能なプロンプトにより、「[実装]」「[修正]」等のプレフィックス付与、日本語化、変更箇所の明確化を実現。AIによる自動生成により、コミットメッセージ作成の手間を削減し、本質的な開発作業に集中できるようになった。ただし、AIの精度には限界があり、誤ったメッセージが生成される場合もある点に注意が必要。
Vibe Coding で Web アプリを作り切る
本記事は、AIエージェントを用いた「Vibe Coding」によるWebアプリ開発事例を紹介。Claude Desktopとwcgw(MCPツール)を用いて、スレッド機能付きAIチャットアプリを自然言語のみで作成した。具体的な手順として、Claudeのプロジェクト機能、ナレッジ設定、タスク管理を駆使し、詳細な仕様ドキュメントと画像を用いた指示で開発を進めた。結果、Next.js, React, TypeScript等を用いたアプリが自動生成され、著者自身はコードを一行も記述しなかった。Vibe Codingは開発効率の大幅な向上に繋がる可能性を示唆している。
話題のDeepWikiをセルフホスト?Open DeepWikiを試してみた
Open DeepWikiは、GitHubリポジトリから自動でWikiを生成するOSSツール。React/Next.js(フロントエンド)、Python/FastAPI(バックエンド)、OpenAI/Gemini APIを使用。Geminiはドキュメント生成、OpenAIはコード埋め込みに利用される。本家DeepWikiと比べ、プライベートリポジトリ対応やGitLab対応など機能面で優れるが、UIは未成熟で、ソースコードとの対応付けが不明確な点が課題。小規模プロジェクトやコスト削減を重視する開発者にとって有用だが、機能不足や不安定性は考慮すべき。
【2025/4/27】集計 新着週間Like数 ランキング Top5
AI Agent × Cursor で要件整理から実装まで
本記事は、Cursorを用いたAI Agentによる要件整理から実装までの開発フローを具体例と共に解説している。 要求から実装までを、「実装要件Doc」「実装方針Doc」「タスクDoc」の3つのドキュメント作成に分割することで、AIとの効率的な協調開発を実現。各ドキュメント作成には、GeminiやClaude等のLLMを使い分け、音声入力による回答効率化なども紹介。 最終的には、タスク単位での実装、ドキュメント削除コミット、PR作成という流れで開発を進める手法を示し、その有効性と今後の課題を述べている。 既存の要件整理が完了している状態からの適用例であり、ゼロからの要求整理には更なるチームワークが必要と結論付けている。
Devinによって変化したエンジニアリングの現場
delyはAIツールDevinを導入し、エンジニアリング効率を大幅に向上させた。具体的には、Slack連携による自動PR作成で権限変更リクエスト対応の工数を削減、Devin Wikiによる最新コードベースの情報提供でドキュメント陳腐化問題を解決、Devin Searchによる検索機能でエンジニアへの問い合わせを減らした。これらの結果、非エンジニアからの依頼対応、情報検索、質問対応にかかるエンジニア工数を大幅に削減し、生産性向上に繋がった。今後、Devin APIを活用した更なる自動化を目指す。
手作りして学ぶMCPの仕組み
本記事は、Model Context Protocol (MCP)の仕組みを理解するため、TypeScriptを用いてstdioトランスポートによる最小限のMCPサーバーを実装した事例を紹介している。MCPはプロトコル層とトランスポート層の2層構造で、JSON-RPC 2.0準拠のメッセージングを用いる。 実装では、initialize
メソッド、ツールリスト取得(tools/list
)、ツール実行(tools/call
)のハンドラを実装し、MCP Inspectorで動作確認を行った。 ただし、本番環境では公式SDKの使用を推奨している。
RAGの検索精度を上げる 新しいリランキング手法
REBELは、RAG(Retrieval Augmented Generation)の精度向上を目指した新しいリランキング手法です。従来の関連性のみによるリランキングでは、古い情報や重複情報が優先される課題がありました。REBELは、LLMを用いて「情報の多様性」「新しさ」「信頼性」「具体性」等の複数基準を動的に決定し、リランキングすることで、回答品質と検索精度を向上させます。回答速度は低下しますが、特に大企業の社内データ検索など、正確性が優先されるケースで有効です。小型LLMとの組み合わせも可能で、実用的な段階に達しています。
MCP セキュリティに関するツールやサイトをまとめてみた
本記事は、Model Context Protocol (MCP) のセキュリティに関するツールと情報をまとめたもの。 紹介されているツールは、MCPサーバの設定をスキャンし、プロンプトインジェクションやツールポイズニングなどの脆弱性を検出するMCP-Scan、MCP-Shieldなど。 さらに、セキュリティチェックリストや関連論文、認証仕様に関するRFCなどを網羅したAwesome MCP Securityなどのリソースも紹介されている。 InvariantLabsが開発したGuardrailsは、MCPクライアントとサーバ間のファイアウォールとして機能し、APIシークレット漏洩やPII保護などを実現する。MCPセキュリティ対策は急速に進歩しており、これらのツールや情報が安全な運用に役立つと結論付けている。
【2025/4/20】集計 新着週間Like数 ランキング Top5
個人的 Vibe Coding のやりかた
フルスタックエンジニアが、ChatGPTやClaudeを用いた「Vibe Coding」によるアプリ開発手法を紹介。要件定義と技術選定(ChatGPT 4)では、チャットで要件を決定し、技術スタック(monorepo, hono/mastra, Flutter, Supabase等)を決定。 コード生成はCLIベースのClaude Codeを使用し、段階的に(API、クライアント、DB連携、デプロイ)開発を進める。最終調整はCursor等のエディタ型AIで行う。 この手法により、モバイルアプリ開発経験がほぼ無い状態から、コードをほとんど記述せずアプリ開発を実現したと結論付けている。
プログラミング用途の生成AI関連ツールの評価 2025/04/14
Mizchi氏の生成AIコーディングツール評価記事によると、Claude-3.7-sonnetはコーディング性能が優れ、1000行程度のファイル管理に適する。Gemini 2.5は無料、巨大コンテキスト理解に優れ業務プログラミングに向くが、コーディング性能はClaudeに劣る。Deepseek-chatはAIツール開発の壁打ちに有用。Cline, RooCodeは有用だが不安定。Copilotはモデル進化で性能向上。Claud Codeはgit workflowに依存。TypeScriptはAIの苦手分野。全体として、AIは1000行程度のコード管理が限界で、リファクタリングには人間介入が必要。複雑なライブラリ活用やデータ分析ではAIが有効だが、コード品質維持には注意が必要。
MCP入門
本記事はModel Context Protocol (MCP) の入門記事である。MCPはLLMアプリと外部サービスを連携する統一インターフェースで、Function Callingの限界を克服する。記事では、Filesystem MCP Serverを使った実例、MCPのアーキテクチャ(LLMアプリ、LLM、MCPクライアント、MCPサーバー、外部サービス)、そして猫画像取得サーバーとクライアントの自作例を示す。 自作例では、TypeScriptと@modelcontextprotocol/sdk
を用い、Claudeと連携するMCPサーバーとクライアントの実装方法を解説している。 結果として、MCPを用いることでLLMアプリが様々な外部サービスと容易に連携できるようになることを示している。
最小限のPython MCPサーバを作ってLLMを騙してみる
記事は、PythonとModel Context Protocol(MCP) SDKを用いた最小限のMCPサーバー構築手順と、LLM(大規模言語モデル)への影響を検証した結果を報告しています。 シンプルな足し算機能を持つサーバーを作成し、Cline/Cursorと連携させ、LLMがサーバーの結果を信頼して動作することを確認しました。しかし、悪意のあるコードを含むサーバーの危険性も指摘しており、MCPサーバー利用時の注意喚起と、結果の検証の重要性を強調しています。 実験を通して、自作MCPサーバーによるLLM挙動の理解を深めることができたと結論付けています。
MCP + DB > RAG?
RAGの精度はベクトル類似度マッチングに依存し、検索精度、生成コンテンツの完全性、大局的視点、複数回検索能力に課題がある。そこで、Model Context Protocol (MCP) + データベースを用いたソリューションが提案された。MongoDBを用いた例では、MCPがデータベースを直接クエリし、高精度な検索を実現した。 ただし、大量データ検索時のトークン消費増加や、MCPクライアントのシステムプロンプト依存によるトークン消費増加が課題として残る。構造化データ検索において、RAGに代わる有力な手法となる可能性を示唆している。
【2025/4/13】集計 新着週間Like数 ランキング Top5
MCP入門
Model Context Protocol (MCP)は、AIアシスタントが外部データやツールにアクセスするための標準プロトコル。JSON-RPC 2.0を用い、ホスト、クライアント、サーバの3層アーキテクチャで構成される。 クライアントはサーバと1対1で通信し、ホストは複数のクライアントを管理する。標準トランスポートはStreamable HTTPで、 initialize
メソッドによる初期化後、call_tool
などでツールやリソースへのアクセスを行う。 Anthropicが策定し、OpenAIなども採用しており、AIアプリケーション連携の業界標準として注目されている。Python SDKも提供されている。
API仕様書を読み取れるMCPサーバーを自作したら開発が爆速になった
フルスタックエンジニアが、gRPCとProtocol Buffersを利用したAPI仕様書を読み込むMCPサーバーを、LLM(Clineなど)を用いて自動生成した。 .protoファイルをリソースとして読み込み、AIがAPI仕様書に基づいてコードを自動生成することで、Androidアプリ開発の効率化を図った。 カスタム指示より管理・精度・柔軟性に優れ、特にAPI更新時の差分対応が容易になった。 開発者はAPI仕様の変更を把握するだけで、AIが自動で実装を行うため、開発速度が大幅に向上した。
AI時代はプログラミングスキルがさらに重要になる
AIによるコード生成はCRUD操作や競技プログラミングなど、既知の情報が多い領域では有効だが、エッジケースや知識の抜け漏れ(ハルシネーション)が多い複雑な処理には不向き。AIはコードの80%を生成するが、残りの20%に80%の労力がかかるため、生産性向上は限定的。よって、AI時代においてもプログラマーは重要性を増し、特にエッジケースの解決やAIの出力の精密な評価・修正といった下流工程のスキルが求められる。 AIによる上流工程の自動化も進む可能性はあるものの、定量的な評価が難しいことから、人間による判断と調整が不可欠となる。
最近1行もコードを書いていない
AIによるコーディング支援において、LLM単体では不十分であり、コンテキストの提供が重要であることを示す記事。著者は「コンテキスト駆動開発(CDD)」を提案。AIエージェント(Cline等)にタスクを指示し、失敗を修正するのではなく、必要なコンテキスト(ファイル構成、API仕様、コーディング規約等)を整備することで、AIの精度を高める手法。CDDはドキュメント整備の副次効果も持ち、大規模プロジェクトや長期的な開発に有効だが、速度は必ずしも向上せず、コード品質は人間の介入に依存する。現状は実験段階だが、将来的な標準になり得ると結論付けている。
PGlite + pgvector で100行で実装するベクトル検索 (node/deno/drizzle)
記事は、pgliteとpgvectorを用いた、100行程度のベクトル検索実装例を紹介しています。OpenAIのembedding APIで生成したベクトルを、pgliteのインメモリデータベースに保存し、コサイン類似度を用いて検索を行う仕組みです。Node.js/Deno環境で動作し、Drizzle ORMを使った実装例も示されています。pgliteのドライバ不要、セットアップ不要な点が利点で、ローカルでの検証に最適です。検索精度はデータ量に依存しますが、簡単なRAG(Retrieval Augmented Generation)雛形として有用です。
【2025/4/6】集計 新着週間Like数 ランキング Top5
Cline / Roo-Codeにおけるコード理解と新規・保守タスクの現状
Roo Code (Cline)はTree-sitterを用いた局所的なコード理解に特化しており、小規模な修正や新規開発に適する。大規模リファクタリングや保守タスクには、全体インデックスの欠如と設計意図の理解不足から不向き。デッドコード検出も困難。 CursorやWindsurfのような全体インデックスを持つツールと異なり、ドキュメントコメントや依存関係マップ等の追加情報で補完することで効果を高められる。 局所的なタスク分割と明確な指示が重要となる。
AIを用いた開発の効率を最大化させるためにやっていることを全部書く
この記事は、AIアシスタント(Cursor, Windsurf, Cline)を用いた開発効率化のTipsを30個以上網羅したものです。著者は、詳細な要件定義(PRD: Markdown形式)とAIの動作ルール(Rules)の作成・更新、タスクリストと実装ログのGitHub Issue管理、小規模な実装単位、徹底的な計画立案、モデル(Gemini, Sonnet)の使い分け、セッションの頻繁な切り替え、コンテキストの適切な管理などを重視しています。 さらに、プロンプトの工夫、エラー修正への固執回避、TDD/DDDの継続、Git活用、音声入力などを実践し、AIの限界を理解した上で効率的な開発を目指していることが結論です。
AIエージェントの考えすぎを防いでRAGの精度を向上
ReaRAGは、AIエージェントの過剰推論を防ぎ、RAGの精度向上を実現する手法です。 LLMの思考ループ内でツール(Web検索など)を使用し、少ないステップで回答に到達するパターンを学習することで、ツール利用の精度を向上させます。ベンチマーク結果では、多段階推論タスクにおいて既存手法と比較し約15%の精度向上と、推論ステップ数の2~4割削減を確認。 ツール使用法を事前に学習させる必要があるため、導入は容易ではないものの、プロンプト調整では限界のある高精度化が必要なタスクに有効です。
M5Stack + Module LLM を使ってみた
M5Stack用AIモジュール「Module LLM」は、AX630Cプロセッサと4GBメモリを搭載し、LLM、画像処理、音声認識・合成をデバイス内で実行可能。StackFlowフレームワークとM5Stack用ライブラリを提供。LLMはQwen2.5、TTSはsingle_speaker_english_fast、ASRはsherpa-ncnn、KWSはsherpa-onnxをデフォルトモデルとする。音声アシスタント機能も備え、KWS→ASR→LLM→TTSの流れで動作する。Arduino IDE/PlatformIOに対応し、シリアル通信で制御。エラーハンドリングの重要性を指摘している。
「AIワークフロー」で実現する論文調査の自動化
松尾研究所インターンが開発した論文調査ツール「論文調査くん」は、AIワークフローを用いて論文調査を自動化する。日本語クエリを英語に翻訳、arXiv APIに適したキーワードに変換、検索結果から回答を生成する3つのLLM呼び出しで構成。構造化出力によりLLMのハルシネーションを抑制し、安定性を向上させた。OpenAI API、クラウドベクトルデータベース、Slack Botなどを活用し、迅速な開発・展開を実現。社内展開を経て、経験の浅い者でも効率的な論文調査が可能になった。
【2025/3/30】集計 新着週間Like数 ランキング Top5
Cursor / Clineを使う上でもっとも重要なことの一つ: コンテキストウインドウについて
Cursor/Cline等のLLMコーディングアシスタント利用において、LLMのコンテキストウィンドウ(一度に処理できるトークン数)の限界を超えると、「Lost in Middle」現象(中間情報の欠落)が発生し、性能低下、ループ、誤ったルール追加の悪循環に陥る。 対策として、1. タスクを小分けにする、2. ルールを最小限に絞り、本質的な情報のみ記述する、3. 現実的な期待値を持つ、ことが重要。 LLMは万能ではなく、人間の検証との連携が不可欠である。
Playwright MCPとCursorで、E2Eテストを自動生成してみた 〜AI×ブラウザ操作の新アプローチ〜
Playwright MCPとCursorを用いたE2Eテスト自動生成の検証結果。Cursor(claude-sonnet-3.7)に自然言語指示を与え、Playwright MCP Server経由でE2Eテストコードを自動生成。ログイン画面とログイン後の画面のテストを生成し、生成されたコードは一部修正が必要だったものの、実行可能だった。 AIによるテスト自動生成は、テスト作成工数の削減に有効であり、Playwright MCPは強力な選択肢となる。
Model Context Protocol (MCP) サーバを使ってみた・作ってみた
Model Context Protocol (MCP)はLLMの機能拡張を容易にするプロトコル。 本記事では、Cline環境下での公式MCPサーバー(Brave Search、Fetch、GitHub)の導入と、著者によるGit/GitHub操作用MCPサーバー作成を解説。Dockerを用いた公式サーバーの容易なセットアップと、自作サーバー作成におけるClineとLLMの活用が示された。自作サーバーは、Git操作やPull Request作成を簡素化し、.clinerulesによる煩雑さを解消する。MCPはLLM機能をプラグインのように拡張する有効な手段であると結論づけている。
Model Context Protocol(MCP)とは?生成 AI の可能性を広げる新しい標準
Model Context Protocol (MCP)は、生成AIと外部システムの連携を標準化するオープンなプロトコルです。従来の個別API連携に比べ、開発効率を大幅に向上させ、拡張性と保守性を高めます。クライアント・サーバーモデルとJSON-RPC 2.0プロトコルに基づき、リソース、ツール、プロンプトの3つの主要機能を提供。既に複数のMCPサーバーが公開されており、様々なサービスとの連携が容易になっています。セキュリティ面も考慮され、アクセス制御やLLMサンプリング制御により安全性を確保しています。今後のAI開発において重要な役割を果たすことが期待されます。
AIに書かせたコードは理解する必要がある
AI生成コードは理解が必要だ。複雑なアプリではAIツールは「死の穴」(エラーからの脱出困難)に陥りやすく、復旧にはコード理解が必須となる。また、AIに丸投げすると、目標が歪められ、脆弱性(SQLインジェクションなど)を含むコードが出力されるリスクもある。テストを通過しても、ブラックボックス状態では脆弱性を検知できない。大量の悪意あるコードをインターネット上に配置することでAIモデルの出力を操作するデータポイズニングの可能性も考慮すべきだ。しかし、AIコーディング支援は生産性向上に不可欠であり、AIを道具として使いこなすことが重要となる。
【2025/3/23】集計 新着週間Like数 ランキング Top5
【Cursor】FigmaにアクセスしてUIコードを自動生成!
CursorとFigma MCP Serverを連携することで、FigmaのデザインデータからFlutter UIコードを自動生成できるようになった。FigmaのAPIキーを取得し、CursorのMCP設定ファイル(mcp.json
)に設定することで、CursorのAgent機能からFigmaのURLを指定しコード生成が可能となる。 高精度なコード生成が可能だが、範囲が広いと精度が低下する傾向がある。 claude-3.7-sonnet-thinking
モデルが推奨され、デザインシステムの利用や範囲の分割が有効。 画像の自動ダウンロードも可能だが、サイズの指定方法は未確認。
自分がはてブした記事をPodcastにして配信する環境を作った
はてブ記事をPodcast化するシステムを、ClineとClaudeを用いて開発した。 はてブのRSSフィードから記事を取得し、OpenAI/Google APIで要約・音声合成を行い、Cloudflare R2で配信、Next.jsでWebサイトを構築する。 AIによるコード生成を活用することで、開発時間を大幅に削減(約15時間、AI動作時間2時間未満)。コストも数百円で済んだ。 ただし、プロンプト調整や音声品質の最適化など、人間の介入が不可欠だった。 現時点ではローカル運用だが、将来的な自動化や機能拡張を検討中。
Vimmer にお勧めしたい AI エージェント「Aider」
Vimユーザーの筆者は、様々なAIコーディングツールを試した結果、ターミナル上で動作するAIエージェント「Aider」にたどり着いた。Aiderはエディタに依存せず、OpenAIやClaude等のAPIを直接利用するため、単一障害点がなく、コスト効率も良い。柔軟な設定も可能で、オープンソースである点も利点。他のツール(Cursor、Cline、Claude Code、Devin)と比較し、安定性と使いやすさでAiderを高く評価している。エディタの変更を望まないVimユーザーにとって、強力な選択肢となる。
今からでも遅くない!まだDevinと遊んでいない技術意思決定者へ
フルスタックエンジニア5-10年経験の筆者は、AIエンジニアリングツールDevinを1ヶ月使用した経験から、費用対効果の高いツールと結論づけている。100-200行程度の明確なタスク、ライブラリアップデート調査、CI修正、単体テスト作成などに有効で、1タスクあたり3,000円程度のコストで済むケースが多い。 ただし、ACU消費には注意が必要。 Devinはジュニアエンジニアレベルのコード生成能力だが、高いドキュメント力や調査力で補われ、適切な指示とフィードバックで高い生産性を実現する。初期設定とタスク分解が重要。
現時点のAIエージェントを活用した開発方法と考え方とTIPS
本記事は、RooCode(Cline拡張)を用いたAIエージェント活用による開発手法を紹介している。VSCode+DevContainerによる安全な開発環境構築、ADR/DesignDocとmemory-bankによるコンテキスト共有、.cline-rulesによるコードスタイル統一、MarkdownベースのPRDからのコード生成などを実践している。 Copilot連携によるAPIコスト削減、自動承認設定による安全な操作を実現している。 複数ツールとの連携強化と、コンテキストの明確化による高品質なコード生成を目指している点が結論と言える。
【2025/3/16】集計 新着週間Like数 ランキング Top5
ZennチームにもDevinがジョインしました。そしてAIコーディング時代におけるエンジニアの役割について
Zenn社はAIコーディングエージェント「Devin」を1ヶ月間導入し、本番コードベースへの適用を試行した。結果、タスクを細かく分割して指示すれば、10営業日で約30個のPRマージという高い生産性を実現。ただし、丸投げではうまくいかず、詳細な指示とテストコードが必須であることが判明。Devinはサンドボックス環境での安全な実行、Slack連携によるスムーズな作業、比較的安価な価格が強み。課題としてKnowledge管理のUI改善や、大規模な変更への対応などが挙げられた。生成AI時代においても、プログラミング言語の読み書き能力は高度な専門性として価値を保ち続け、ジュニアエンジニア育成も新たな形で継続されると予想された。
Devinにコードレビューをさせ、コード品質と開発速度を同時に高める話
GLOBIS Techは、AIコードレビューツールDevinを導入し、コード品質向上と開発速度の両立を実現した。45件のPRのうち約55%は高品質だったが、残りの20件でDevinはバグや設計上の問題を約半数検知し、手戻りを削減。指摘内容は、バグ防止、パフォーマンス改善、設計・リファクタリング、ドメイン特化、可読性・メンテナンス性など多岐に渡る。 Devinのチューニングは、レビューお作法、Rails設計パターンの浸透、ドメイン知識の活用に重点を置き、Knowledgeとプロンプトを使い分けた。GitHub Actionsと連携し、PR作成・更新時に自動レビューを実行する仕組みを構築。結果、人間レビュアーの負担軽減と組織全体の知識共有に貢献した。
AI時代の仕事術(10方式)
本記事は、AI技術の発展に左右されない「仕事の本質」に焦点を当てた10個の仕事術を紹介している。AI時代において重要となるのは、「高度な不確実性」への迅速かつ効果的な対応であり、そのための具体的な方法として、パーキンソンの法則を意識した期限設定、結果と成果の区別、問題構造の整理、目的の明確化、仮説検証、システムシンキング、LNOフレームワーク、不明点の優先的解決、情報発信などを提案している。これらの手法は、AI時代におけるホワイトワーカーの仕事の質を高めることを目指している。
MCPサーバーを作るMCPサーバーを作った
本記事は、AIモデルとの連携を容易にするMCP(Model Context Protocol)サーバーを自動生成するツール「mcp-create」の開発について報告しています。TypeScriptで記述され、Docker上で動作します。文字列反転やGitHub連携等の例が示され、プロトタイプ作成や既存MCPサーバーの調整に有用です。現在、Python対応やコード部分更新、シーケンシャル思考への対応は未実装ですが、今後の開発が期待されます。GitHubで公開されており、Pull RequestやIssueも歓迎とのことです。
プロンプト泥棒がやってくる! 〜生成AI時代のセキュリティ対策〜
生成AIツールの急速な普及に伴い、プロンプトインジェクションによるセキュリティ脅威が深刻化している。本記事は、AIツール(Cline, V0など)へのプロンプトインジェクション攻撃の実例と、その対策を解説する。攻撃者は巧妙なプロンプトでシステムプロンプトや機密情報を抽出可能であることが示された。対策として、システムプロンプトへの追加指示、出力フィルター、追加のLLMによる入力・出力フィルタリングなどが挙げられるが、完全な防御は困難。最小権限の原則、厳格な認証、データ分離などを組み合わせた多層防御が現実的な対策となる。 LLMの挙動は不確定要素が多く、情報漏洩リスクを常に考慮したシステム設計が不可欠である。
【2025/3/9】集計 新着週間Like数 ランキング Top5
Clineに全部賭ける前に 〜Clineの動作原理を深掘り〜
ClineはVSCode拡張機能で、ClaudeやChatGPTと連携し、コード生成、バグ修正、ターミナル操作などを自動化する。 革新性は、AIが自律的にツールを選択・実行する点と、プロジェクト全体をコンテキストとして理解する点にある。内部構造は、システムプロンプトで定義されたツールを用いてAIと対話することで実現。 clinerules
によるプロジェクト固有ルール設定や、明確な指示、タスク分解が効果的な活用に繋がる。セキュリティリスクも存在するため、初期段階ではツール承認を慎重に行う必要がある。今後の展望として、MCP拡張、セキュリティ強化、コンテキスト理解向上などが期待される。
MCPで広がるLLM ~Clineでの動作原理~
ClineはMCP(Model Context Protocol)を用いてLLMに外部サービスとの連携機能を提供する。MCPは統一されたプロトコルで、Notion、Supabase、GitHub等様々なサービスとLLMを接続できる。Clineでは拡張機能でMCPサーバーを追加し、自然言語で指示することで外部サービスを操作可能。 実装は、ClineがMCP SDKを用いてMCPサーバーと通信するシンプルな構造。 MCPはLLMの機能を飛躍的に向上させる一方、セキュリティリスクも伴うため注意が必要。
Claude Codeで感じたAIとソフトウェア開発の未来
Claude Codeを用いたiOSアプリ開発において、AIは高速なコード生成が可能だが、人間の設計思想をそのまま反映させるのは非効率だった。AIの特性に合わせ、シンプルなコード、モジュール分割を意識することで開発速度を3倍向上できた。ただし、AIの理解度や言語仕様への未対応による修正作業も発生。 AIは部下として扱い、軌道修正を挟みつつ、メンテ可能な範囲に留めることが重要。将来的には、AIの進化とコスト低減により、これらの課題は軽減されると予想される。
CursorのProject Rules運用のベストプラクティスを探る
CursorのProject Rules運用ベストプラクティスとして、(1)日々アップデートし、AIの改善点に対応する。(2)mdc
ファイルを複数md
ファイルに分割し、スクリプトで結合することで保守性を高める。(3)alwaysApply
, Auto Attach
, Description
を正しく設定する。alwaysApply
のみでは不十分で、他の設定も必須。Auto Attach
のglobs
指定は配列ではなくワイルドカードを使う。これにより、エージェントのパフォーマンス向上とチームでの共有が容易になり、オンボーディング資料としても活用できる。ただし、@
によるコンテキストの明示など、Project Rules以外の要素も重要である。
OpenHands(OpenDevin)を使った感想「本家Devinは安い」
OpenHands(OpenDevin)と有料AIエージェントDevinの比較検証結果。Google Cloud上にデプロイしたOpenHandsは、高額なLLM(Claude Sonnet 3.7)使用で1時間あたり約30ドルの費用が発生。一方、Devinは1時間あたり8ドルと安価。OpenHandsは低コストLLMやカスタマイズ性という利点を持つが、高性能なLLM使用時はDevinの方がコストパフォーマンスが良いと結論づけた。個人利用では月額500ドルは高額だが、Devinの機能や精度を考慮すると妥当な価格設定と言える。
【2025/3/2】集計 新着週間Like数 ランキング Top5
CLINEに全部賭けろ
Cline型コーディングエージェント(Cline)を用いたAIプログラミングは、プログラミングの再発明であり、圧倒的なコーディング速度を実現する。特に、Clineは環境情報を参照し、高速な試行錯誤サイクルを回し、人間では不可能な速度でテストを通過するコードを生成する。著者(5-10年経験のフルスタックエンジニア)は、Clineに全賭けする理由として、700行のコードを15分で作成できる能力、型推論等の高度なタスクへの対応、そして人間がボトルネックであることを克服できる点を挙げる。しかし、Clineは危険な実行権限を持ち、セキュリティリスクも伴う。Clineを使いこなすには、コンテキスト記述能力、ドメイン記述能力、AI性能に対する直感が必要となる。将来、Cline型コーディングが普及すれば、AIを使いこなせるプログラマーだけが生き残ると予測している。
Webアプリケーション・アーキテクトの自分は何に全部賭けるのか
フルスタックエンジニアの筆者は、AI活用における「一つのモデルに固執する」平成的な発想からの脱却を提唱。OpenAI、Claude、Geminiなど複数AIモデルの特性を理解し、使い分け、相互レビューすることで効率と精度を向上させると結論づけた。 GUIの使いやすさなどに囚われず、様々なAIモデルを積極的に活用し、AIと共存・発展していく必要性を強調している。今後、Webブラウザ上でのAIエージェント活用が進むと予測する。
Xに頼らずAI関連情報をキャッチアップする
本記事は、Xに頼らないAI関連情報収集方法を紹介する。arXiv、Reddit、Hacker News、GitHub Trending、技術ブログのRSSフィードなどを活用し、論文、最新モデル情報、ユーザーレビュー、実践的なテクニックなどを効率的に収集できる。特に、arXiv論文をキュレーションするサービスや、AI関連のRedditサブディットを有効活用する方法を詳述。さらに、これらの情報を一元的に閲覧できる自作Webアプリ(OSS)も公開している。複数の情報源を組み合わせることで、X以上の効率と質の高い情報収集が可能となる。
AIコーディングでも小さく刻んで開発すると効果的だと主張したい with Cursor
AIコーディング支援ツールを活用するには、タスクを小さく分割することが効果的である。大規模なタスクを丸投げすると、AIがコンテキストを理解できず、誤ったコード生成やテスト失敗のループに陥るため。 効果的な活用法として、(1)明確なプロンプト、(2).cursor/rules
によるルール設定、(3)実装計画→テスト→実装の3ステップによるタスク分割が挙げられる。 フロントエンドやRailsのテストなど、コンテキストが複雑な場面では、特にタスクの細分化が重要となる。AIツールの進化次第で状況は変わるものの、現状では小規模タスクへの適用が現実的である。
これからのGitHubのIssue作成はAIエディタ内で済ませよう
Windsurf等のAIエディタとMCP(Model Context Protocol)を用いたGitHub Issue作成方法を紹介。 AIが関連ファイルや修正点を提案し、高品質なIssueを5分程度で作成できる。 手順はMCP設定、AIへの指示によるIssue作成、Markdownファイル作成・編集、Issue更新の5段階。 Cascade Baseモデルを使用し無料で利用可能だが、MCP通信の不安定さが課題。 GitHub Issue作成、更新、検索など17種類以上のGitHubアクションに対応。
【2025/2/23】集計 新着週間Like数 ランキング Top5
君たちはCursorを本当に使えているか
経験豊富なエンジニアがCursor Composerを用いて、大規模コードベースでのコーディング時間を1/3~1/5に削減した手法を紹介。Claude 3.5 Sonnetモデルと、プロジェクト設定(.cursorrules, NotePads, .cursorignore)、適切なプロンプト設計が鍵。複数ステップに実装を分割し、各ステップ毎にプロンプトを送り、必要に応じて修正・テストを繰り返すことで高精度な実装を実現。現状のモデル性能では、一度のプロンプトで数千行規模の実装は困難なため、この手法が有効と結論づけている。
DevinにVitest移行させたら数分で5000円溶けた [人間がやったほうが安い]
AIエンジニア「Devin」を用いたOSSライブラリ開発で、新規パッケージ作成とドキュメント生成は成功し、それぞれ約3000円、約300円のコストで完了した。一方、JestからVitestへの移行は5000円のコストがかかったものの失敗に終わった。Devinは小規模変更やドキュメント生成には有効だが、大規模リファクタリングには不向きであることが判明。GitHub連携の切り替えが煩雑で、具体的な指示が必要となる点が課題として挙げられた。
自律型AIエンジニア「Devin」の活用事例 〜1ヶ月の実践から見えた効果的な導入方法〜
スマートラウンド社は自律型AIエンジニア「Devin」を導入し、1ヶ月間の活用結果を報告。Devinはジュニアエンジニアレベルの能力で、Slack経由でタスクを依頼。文言修正、小機能追加、機能廃止、新規画面基盤作成、コード調査支援に有効と判明。UI修正、曖昧な要件、大量ファイル修正には非推奨。効果的な活用にはFew-shotプロンプティングやPlaybook機能が有効だが、精度の高い出力には人間の確認が必要。今後の展望はDevinのKnowledge機能活用による能力向上と、最小限のプロンプトで最大限のアウトプットを目指すこと。 Devinの活用は長期的な視点が必要。
強化学習「GRPO」をCartPoleタスクで実装しながら解説
本記事は、LLM「DeepSeek-R1」で用いられた強化学習手法GRPOを、CartPoleタスクを用いてPyTorchで実装解説したものです。GRPOは状態価値関数を用いず、複数試行の報酬の平均値からの差分をAdvantageとして計算することで、Policy Networkの重みを更新します。CPU環境(Google Colab)で約7分でCartPoleタスクを解き、200ステップ以上棒を立て続けることができました。Pendulumタスクへの拡張も提供されていますが、こちらはGPU環境が必要となります。GRPOは疎な報酬環境に有効で、人間の行動改善の直感と合致する点も示唆されています。
Devin に Dependabot PR をレビューしてもらおう
Devin AIを用いたGitHub Dependabot PRの自動レビュー・修正システムを構築した。DevinにDependabot PRをレビューさせ、破壊的変更の有無を確認、コメントで概要と影響を報告させる。破壊的変更があれば修正PRを作成する。これにより、ライブラリ更新による影響把握とPRマージ判断の迅速化を実現した。ただし、複雑な修正や影響範囲の判断には課題が残るため、プロンプト調整や知識追加が必要。 Playbookへの登録により、コマンドで簡単に実行できるようになっている。
Discussion