🦖

次世代AIモデルのClaude 4シリーズを発表

に公開

サマリー

Claude 4は、世界最高水準のコーディング能力を持つOpus 4と実用性に優れたSonnet 4の2つのモデルで構成され、従来困難だった数時間にわたる長期タスクの継続実行を実現しています。
拡張思考機能とツール使用の同時実行、大幅に改善されたメモリ機能、並列ツール実行といった革新的な機能により、AIエージェントの実用性が飛躍的に向上しました。
主要技術企業からの高い評価を受けており、従来の価格体系を維持しながら複数のプラットフォームで利用可能となっています。


はじめに

https://www.anthropic.com/news/claude-4

2025年5月23日、Anthropicから次世代のClaudeモデルファミリーである「Claude 4」が発表されました。今回リリースされたのは、Claude Opus 4とClaude Sonnet 4の2つのモデルです。これらのモデルは、コーディング能力、高度な推論、そしてAIエージェント機能において大きな性能向上を実現しています。

https://youtu.be/oqUclC3gqKs

Claude 4モデルファミリーの概要

Claude 4シリーズは、従来のモデルから大幅な進化を遂げています。
大きな点としてはこれらのモデルが「ハイブリッドモデル」として設計されていることです。
つまり、瞬時に回答する通常モードと、より深い推論を行う拡張思考モードの2つの動作モードを持っています。

Claude Opus 4:世界最高峰のコーディングモデル

Claude Opus 4は、現在世界で最も優秀なコーディングモデルとして位置づけられています。このモデルの最大の特徴は、長時間にわたって集中力を維持し、数千ステップに及ぶ複雑なタスクを継続的に実行できることです。実際に、数時間にわたって連続稼働することが可能で、これまでのAIエージェントでは実現困難だった長期プロジェクトの遂行を可能にしています。

性能面では、ソフトウェア工学の実務タスクを評価するSWE-benchで72.5%、ターミナル操作の評価であるTerminal-benchで43.2%という優秀なスコアを記録しています。これらの数値は、実際のソフトウェア開発現場でのタスクをどれだけ正確に遂行できるかを示す重要な指標です。

Claude Sonnet 4:実用性と性能のバランス

Claude Sonnet 4は、前世代のSonnet 3.7から大幅な改良が加えられたモデルです。SWE-benchで72.7%という優秀なスコアを達成し、Opus 4に迫る性能を示しています。Sonnet 4の設計思想は、高い性能と実用性のバランスを取ることにあります。

このモデルは、日常的な使用ケースから内部業務まで幅広い用途に対応できるよう最適化されており、より精密な制御が可能な「操縦性の向上」も実現されています。多くの分野でOpus 4に及ばないものの、実用性と能力の最適な組み合わせを提供しています。

新機能と技術的進歩

拡張思考機能とツール使用

Claude 4の重要な新機能として、「拡張思考機能とツール使用」があります。これは、モデルが深く考える際に、ウェブ検索などのツールを同時に使用できる機能です。従来のAIモデルでは、思考とツール使用は別々のプロセスでしたが、Claude 4では両者を交互に組み合わせることで、より良質な回答を生成できるようになりました。

並列ツール実行とメモリ機能の向上

新しいモデルでは、複数のツールを同時に使用する並列実行が可能になっています。また、開発者がローカルファイルへのアクセスを提供した場合、Claude 4は重要な情報を抽出・保存して継続性を保ち、暗黙知を構築する大幅に改善されたメモリ機能を発揮します。

特にClaude Opus 4では、メモリ機能が劇的に向上しており、「メモリファイル」を作成・維持して重要な情報を保存することができます。これにより、長期的なタスクの認識、一貫性、エージェントタスクでの性能が向上しています。興味深い例として、Opus 4がポケモンゲームをプレイしながら「ナビゲーションガイド」を作成したケースが紹介されています。

ショートカット行動の削減

両モデルとも、タスクを完了するためにショートカットや抜け道を使用する行動が65%削減されています。これは、AIエージェントがより誠実かつ適切な方法でタスクに取り組むことを意味する重要な改善です。

Claude Codeの正式リリース

研究プレビュー段階で多くの好評を得たClaude Codeが、正式にリリースされました。Claude Codeは、エンジニアがClaude AIと協働できる範囲を大幅に拡張するツールです。

https://youtu.be/L_WFEgry87M

IDE統合機能

VS CodeとJetBrains向けの新しいベータ版拡張機能により、Claude CodeをIDEに直接統合できるようになりました。Claudeが提案する編集内容がファイル内にインライン表示され、使い慣れたエディタインターフェース内での確認と追跡が可能になります。

GitHub統合

Claude CodeのSDKを使用して、開発者は独自のエージェントやアプリケーションを構築できます。また、ベータ版としてGitHub統合機能も提供されており、プルリクエストでClaude Codeをタグ付けすることで、レビューフィードバックへの対応、CI エラーの修正、コード修正などが可能になっています。

技術仕様と利用可能性

Claude 4モデルは、Anthropic API、Amazon Bedrock、Google CloudのVertex AIで利用可能です。価格体系は従来のOpusとSonnetモデルと同一で、Opus 4が入力/出力100万トークンあたり15ドル/75ドル、Sonnet 4が3ドル/15ドルに設定されています。

Claude.aiのPro、Max、Team、Enterpriseプランには両モデルと拡張思考機能が含まれており、Sonnet 4は無料ユーザーも利用可能です。

安全性への配慮

Claude 4の開発において、安全性は重要な考慮事項でした。これらのモデルには、ASL-3(AI Safety Level 3)などの高度なAI安全レベルの対策が実装されており、リスクを最小化し安全性を最大化するための広範囲なテスト・評価が行われています。

まとめ

Claude 4は、AIアシスタントの能力を大幅に拡張する重要な進歩を示しています。特に、長時間の集中力維持、高度なコーディング能力、そして改善されたメモリ機能により、これまで困難だった複雑で長期的なプロジェクトの遂行が可能になりました。

これらの進歩により、Claude 4は単なる質問応答ツールから、真の意味での「バーチャル協働者」へと進化を遂げています。開発現場から研究、執筆、科学的発見まで、幅広い分野でその威力を発揮することが期待されています。

その他

Claude4 招待キャンペーンが開始

なぜか抽選なのですが...
もしよければ未登録の方がいたら以下のリンクから登録してください。

https://claude.ai/referral/mx-0XIZ-NQ

Discussion