Claude 4 Opus, Claude 4 Sonnet - 概要
はじめに
Anthropicから、Claude 4 Opus, Claude 4 Sonnetが発表(May 23, 2025)されました 🎉 🎉 🎉
早速、要点をまとめました!音声でインプットする
NotebookLMに音声コンテンツ化してもらいました。
以下のリンクから音声でもインプット可能です!
Claude 4 登場
Anthropic社は、次世代のClaudeモデルである Claude Opus 4 と Claude Sonnet 4 を発表しました。これらのモデルは、コーディング、高度な推論、AIエージェントの分野で新たな基準を打ち立てるものです。Anthropic社のチームメンバーは、これらのモデルが日々のワークフローをどのように変革するかを示しています。これは、まさに 「バーチャルコラボレーター」 としてのClaudeの大きな一歩です。
新しいClaude 4モデル:Opus 4 と Sonnet 4
- Claude Opus 4: これは 世界最高のコーディングモデル とされており、SWE-benchで72.5%、Terminal-benchで43.2%のスコアを記録しています。複雑で時間のかかるタスクやエージェントワークフローにおいて、数時間にわたって集中力を維持し、持続的なパフォーマンス を発揮できます。これにより、AIエージェントができることが劇的に広がります。Opus 4は、コーディングや複雑な問題解決に非常に優れており、最先端のエージェント製品を支えています。
- Claude Sonnet 4: Sonnet 3.7から大幅にアップグレードされており、 優れたコーディングと推論能力 を備えつつ、指示に対してより正確に応答します。パフォーマンスと効率性のバランスが取れており、日常的なユースケースにフロンティア性能をもたらす 実用的なモデル です。Sonnet 3.7からの 即時アップグレード として位置づけられています。
これらのモデルは、ハイブリッドモデル であり、ニアインスタントな応答と、より深い推論のための拡張思考(extended thinking)の2つのモードを提供します。
Claude 4の主な新機能
Claude 4モデルには、いくつかの重要な機能強化が含まれています。
- ツール利用による拡張思考(ベータ版): Claudeは、 Web検索のようなツールを使用 しながら、推論とツール利用を交互に行うことで、応答を改善できます。これにより、より深い思考が可能になります。
-
新しいモデル能力:
- 並列ツール利用: 複数のツールを同時に使用できます。
- より正確な指示追従: ユーザーの指示に以前よりも正確に従います。
- 記憶能力の劇的な向上: 開発者がローカルファイルへのアクセスを許可した場合、Opus 4は 「メモリファイル」を作成・維持 して重要な情報を保存することに長けています。これにより、 長期的なタスク認識、一貫性、エージェントタスクでのパフォーマンス が向上します。例えば、ポケモンをプレイ中に「ナビゲーションガイド」を作成する例が挙げられています。
- ショートカット行動の削減: タスクを完了するためにショートカットや抜け穴を利用するモデルの行動が大幅に減少し、Sonnet 3.7と比較して 65%削減 されました。
Claude Code:開発ワークフローでの活用
Claude Codeは現在一般提供 されており、Claudeの能力をより多くの開発ワークフローにもたらします。
- 統合開発環境(IDE)との連携: VS CodeおよびJetBrains向けの新しいベータ版拡張機能により、Claude CodeをIDEに直接統合できます。Claudeの提案する編集内容はファイル内に インライン表示 され、おなじみのエディタインターフェース内でのレビューと追跡が効率化されます。
- SDKによるカスタムエージェント開発: 拡張可能なClaude Code SDKがリリースされ、Claude Codeと同じコアエージェントを使用して独自の エージェントやアプリケーションを構築 できます。
- GitHubとの連携(ベータ版): SDKの例として、GitHub上でClaude Codeを使用できるようになりました。プルリクエスト(PR)でClaude Codeをタグ付けすると、レビューアのフィードバックへの応答、CIエラーの修正、コードの変更などが可能です。
YouTubeのデモンストレーションでは、Claude Codeを使用して 短時間で動作するウェブアプリのプロトタイプを作成 し、注文管理システムを構築する様子が示されています。これにより、開発者はプロトタイプ作成を委任し、顧客との対話など より価値の高い活動に集中 できるようになります。エンジニアリングチームは、Claude Codeユーザーのためのコア機能に注力できます。
AIエージェントとしてのClaudeの活用例
Claude 4モデルは、AIエージェントの能力を大きく向上させます。デモンストレーションでは、Claudeがどのように日々の業務で 「チームメイト」 として機能するかが示されています。
- 情報整理とレポート作成: Google Workspace(カレンダー、メール、Asana To-Doリスト)を分析し、その日の予定やタスクを 整理されたレポート にまとめて表示します。
- リサーチと準備: 教育研究に関する会議の準備として、提案書を分析し、関連する研究課題ごとに 徹底的な文献レビュー を実施します。かつてはこれだけで半日以上、消化するには数週間かかった作業が、Claudeを使えば 大幅に短縮 されます。これにより、より大きな戦略を考える時間が増えます。
- タスク管理との連携: Asanaとの連携(リモートMCPによる)を使用し、プロダクト要求仕様書(PRD)を読み込んで 構造化されたタスクを作成 します。各タスクをチームの適切な担当者に割り当て、通常のスプリントサイクルに基づいて 期限を設定 します。夕方の多くの時間を費やしていた作業が、わずか数分で完了します。
これらの例は、Claudeの知性と、Asanaのような お気に入りのツールやソフトウェアと連携する能力 が結びついたときに何が可能になるかを示しています。Opus 4は特に、数千ステップを要するような 長時間のタスクでも集中力を維持 し、Sonnet 4は指示追従性の向上やコードベースナビゲーションエラーの削減で、自律的なアプリ開発などの エージェントシナリオで優れています 。
入手と安全性
Claude Opus 4とSonnet 4は、Anthropic API、Amazon Bedrock、Google CloudのVertex AIで利用可能です。Pro、Max、Team、Enterpriseプランには両方のモデルと拡張思考が含まれ、Sonnet 4は無料ユーザーも利用できます。価格はOpus 4が入力/出力100万トークンあたり$15/$75、Sonnet 4が$3/$15です。
これらのモデルは、ASL-3のような高いAI安全レベルのための対策を含め、広範なテストと評価を経てリリースされています。
まとめ
Claude 4モデルは、 完全なコンテキストを維持 し、 長時間のプロジェクトで集中力を持続 させ、 変革的なインパクトを推進 する「バーチャルコラボレーター」に向けての大きな一歩です。日々の情報整理、リサーチ、コーディング、タスク管理など、 さまざまな業務を効率化 し、より創造的・戦略的な作業に集中することを可能にします。
ぜひClaude、Claude Code、またはお好みのプラットフォームで、その能力を体験してみてください。
Discussion