Claude Sonnet 4.5 & Claude Code 2.0の最新情報【まとめ】
はじめまして、ますみです!
株式会社Galirage(ガリレージ)という「生成AIに特化して、システム開発・アドバイザリー支援・研修支援をしているIT企業」で、代表をしております^^
本記事のサマリー
- Claude Sonnet 4.5は世界最高のコーディングモデルで、SWE-bench Verifiedで82.0%を達成しました。
- Claude Code 2.0は、VS Code拡張機能、刷新されたターミナルUI、チェックポイント機能を提供します。
- Claude APIに新しいコンテキスト編集機能とメモリツールが追加され、長時間稼働が可能になりました。
- Claude Agent SDKにより、開発者は独自のエージェント体験を構築できるようになりました。
- Imagine with Claudeは、コード中心から意図駆動へのソフトウェア開発の未来を示す実験的取り組みです。
はじめに
2025年9月30日、Anthropicはエンジニアにとって非常に嬉しい大ニュースを発表しました!
AIモデル「Claude Sonnet 4.5」のリリースと、開発ツール「Claude Code 2.0」への大幅アップデートです🎉
この他にも、そしてウェブアプリ・API・Chrome拡張機能などの新発表も複数ありました🚀
本記事では、これらの最新情報を網羅的にまとめて解説していきます!
1. 「Claude Sonnet 4.5」の最新情報
Claude Sonnetとは?
Claude Sonnetは、Anthropicが開発するAIモデルシリーズの中核を担うモデルです。コストパフォーマンスと性能のバランスに優れており、幅広い用途で活用されています。
今回リリースされたClaude Sonnet 4.5は、このシリーズの最新版であり、特にコーディング精度やコンピュータ使用精度、そして安全性において、大幅な性能向上を実現しています。
ちなみに、Claudeのモデルファミリーには、「Opus / Sonnet / Haiku」という3種類のモデルがあり、以下のような特徴があります。
-
Haiku(Light & fast)
- 最速のモデル。
- 軽量なアクションを業界トップクラスのスピードで実行可能。
-
Sonnet(Hard-working)
- パフォーマンスとスピードのバランスが最も良い。
- 効率的かつ高スループットなタスクに適している。
-
Opus(Powerful)
- 最も知能が高いモデル。
- 複雑な分析やステップが多いタスク、高度な数学・コーディングに対応可能。
Claude Sonnet 4.5の精度
コーディング精度(coding)
Claude Sonnet 4.5は、複数のベンチマークで世界最高水準(SOTA)の性能を示しています。
SWE-bench Verified(Agentic coding)という実世界のソフトウェアコーディング能力を測定する評価において、Claude Sonnet 4.5は「77.2%(parallel test-time computeという並列処理をする手法をした場合は、82.0%)」のスコアを達成しました。これは現時点で世界最高の性能です。
また、実際の使用では、複雑で多段階のタスクにおいて30時間以上の集中力(継続的なコーディングやテストなど)を維持することが確認されており、長時間にわたる開発作業でも安定した性能を発揮します。
コンピューター使用精度(computer use)
実世界のコンピュータタスクでAIモデルをテストするベンチマークOSWorldでは、Sonnet 4.5が「61.4%」でトップとなりました!
4か月前にSonnet 4が42.2%からの大幅な進歩と言えるでしょう。
その他の一般的なベンチマーク精度
Claude Sonnet 4.5は、推論や数学を含む幅広い評価においても能力向上を示しています。
すべてにおいてSOTAと言えるわけではないですが、Sonnet 4と比べた時の成長自体は確認できました(すなわち精度の側面においては、どんなケースであっても4.5にモデルアップデートをした方が良い)。
領域特化の知識
特定の領域に特化した知識についてのベンチマークにおいても、従来のClaudeのモデルと比べて、精度向上をしました!
「金融、法律、医学、STEM分野」の専門家による評価結果は下記の通りです。
Claude Sonnet 4.5のAPI料金
性能が大幅に向上しても、基本的にはClaude Sonnet 4と同じ料金に据え置かれています。
200Kトークン以下の場合は、以下のような料金(Claude Sonnet 4と同じ料金)です。
- 入力:100万トークンあたり$3
- 出力:100万トークンあたり$15
200Kトークンよりも多い場合は、以下のような料金です。
- 入力:100万トークンあたり$15
- 出力:100万トークンあたり$22.5
最新の情報は、下記のページをご参照ください。
また、Opus 4.1とHaiku 3.5と比べた時の価格は下記の通りです。
Claude Sonnet 4.5の安全性
不適合行動の大幅な削減
モデルがより高性能であるほど、より慎重な監視とアラインメントが必要です。
Anthropicでは、AIの能力向上に伴う新たなリスクを軽減すべく、Sonnet 4と4.5の間にアラインメント改善において大幅な進歩を遂げました。
不適合行動(Misaligned Behavior)とは、AIが示す可能性のある望ましくない振る舞いのことです。例えば、以下のような行動が含まれます。
- へつらい(Sycophancy): ユーザーの意見に無批判に同調し、正確性よりも好意を優先する行動
- 欺瞞(Deceptiveness): ユーザーを誤解させる可能性のある不正確または誤解を招く情報を提供する行動
- 権力追求(Power-seeking): AIが目標を達成するために不必要に制御やアクセス権を拡大しようとする傾向
- 妄想的思考の助長(Corrigibility): フィードバックや修正に対して抵抗し、自己改善を妨げる行動
Claudeの性能向上と徹底した安全性トレーニングにより、これらの懸念される行動を大幅に減らすことができました。
また、エージェント的能力やコンピュータ利用機能については、これらを利用するユーザーにとって最も深刻なリスクのひとつであるプロンプトインジェクション攻撃への防御において大きな進展を遂げました。
ASL-3保護
Claude Sonnet 4.5は、モデル能力と適切な安全策を対応させるAnthropicのフレームワークに従い、AI セーフティレベル3(ASL-3)の保護のもとでリリースされました。
これらの安全策の中では、特に「化学・生物・放射線・核(CBRN)兵器」に関連する潜在的に危険な入出力を検知されるようになっています。
誤検知についても、2025年5月のClaude Opus 4リリース時から半分に減らすことに成功しました。
Claude Sonnet 4.5の導入方法
Claude APIによる実装
開発者であれば、Claude APIからclaude-sonnet-4-5
というモデルを指定するだけで簡単に導入できます。
import anthropic
client = anthropic.Anthropic(
# defaults to os.environ.get("ANTHROPIC_API_KEY")
api_key="my_api_key",
)
message = client.messages.create(
model="claude-sonnet-4-5",
max_tokens=1024,
messages=[
{"role": "user", "content": "Hello, Claude"}
]
)
print(message.content)
もしもすでにClaude Sonnet 4を使われている場合は、基本的に、料金や精度を比較したときに、Claude Sonnet 4.5が優位なため、アップグレードを推奨します(完全上位互換のモデル)。
CursorやGitHub Copilotでの利用
Claude Sonnet 4.5は、CursorやGitHub CopilotなどのAI支援開発ツールでも利用可能です。
各ツールの設定画面からモデルを選択することで、Sonnet 4.5の高度なコーディング能力を活用できます。
Redditのサイトより引用
2. 「Claude Code 2.0」の最新情報
ここまで「Claude Sonnet 4.5」の話をしてきましたが、ここからはお待ちかねの「Claude Code 2.0」の説明に入ります!
「Claude Sonnet 4.5」への対応
まず、Claude Codeの新しいデフォルトモデルとしてClaude Sonnet 4.5が使えるようになりました!
そのため、より長く複雑な開発タスクを処理できるようになりました。
もしもモデルを切り替えたい場合は、/model
コマンドで変更できます。
基本的には、1M context(めっちゃ高額だがロングコンテキストな設定)は、設定しない限り、使用されないようなため、一安心ですね😌
もしもClaude Code 2.0へアップグレード(もしくはインストール)したい場合は、npm install -g @anthropic-ai/claude-code
と実行しましょう。
「VS Code拡張機能(β版)」の公式リリース
Claude CodeをIDEに直接組み込むネイティブのVS Code拡張機能をベータ版で提供されました!
専用のサイドバーパネルでインライン差分を確認でき、Claudeの変更をリアルタイムで見ることができます。
この拡張機能は、ターミナルよりIDEで作業することを好むユーザーに対し、より豊かで視覚的なClaude Code体験を提供します。
VS Code Extension Marketplaceからダウンロードして始められます。
また、紹介動画はこちらです👇
「Terminalのインターフェース」の刷新
Claude Codeのターミナルインターフェースも刷新されました!
「ステータス表示」の可視性向上
更新されたインターフェースでは、ステータスの可視性が向上し、Claudeが現在何をしているのかをリアルタイムで把握できるようになりました!
正直、ここは大きく変わった気はしませんが、確かに少しだけUIが綺麗になったような気がします。
「プロンプト履歴の検索機能」のリリース
さらに、検索可能なプロンプト履歴(Ctrl+r)が追加され、過去のプロンプトを再利用・編集しやすくなりました。
「チェックポイント機能」のリリース
Claude Codeがますます複雑なタスクを担う中で重要になってくるチェックポイント機能が導入されました!(これは、本当に嬉しい。。。)
チェックポイントとは
複雑な開発はしばしば探索と試行錯誤を伴います。
新しいチェックポイントシステムは、変更前に自動でコードの状態を保存し、Escを2回押すか/rewind
コマンドを使うことで即座に以前のバージョンに戻ることができます。
一点だけ注意事項として、チェックポイントはClaudeの編集に適用に対してのみ適用されて、ユーザーの編集やbashコマンドには適用されません。
Subagents / Hooks / Background tasksとの組み合わせ
チェックポイントは、その他のClaude Codeの機能と組み合わせると特に有効です。
- Subagentsでは、バックエンドAPIを開発するエージェントを立ち上げながら、フロントエンドを構築するエージェントを動かすことができる機能です。このような並行開発をして、バグが出てきた時に、過去の特定のタイミングまで戻りながらデバッグをすることができるのはとても便利だと言えるでしょう。
- Hooksとは、特定のタイミングで自動的にアクションを実行し、コード変更後のテスト実行やコミット前のリンティングを可能にします。Hooksによって、自動的にコード編集がされた場合、その前の時点まで戻したいことがあり、そのような時にチェックポイントが役に立ちます。
- Background tasksとは、長時間稼働するプロセス(開発サーバーの立ち上げやパッケージのインストールなど)を実行しながら、Claude Codeのタスク実行を可能とする機能です。こうした非同期プロセスを実行する前の時点に戻したいという場合にもチェックポイントは有用です。
これらの機能を使用する際に、ぜひチェックポイントを使ってみてください◎
3. ユーザー向け新機能
「Claude apps」の新機能
Claude appsでは、会話の中でコード実行やファイル作成(スプレッドシート、スライド、文書)が直接できるようになりました。
コード実行やファイル作成機能は、すべての有料プランで利用可能です。
「Claude for Chrome」の新リリース
Claude for Chrome拡張機能というGoogle Chromeの拡張機能の提供が開始されました!
(先月、ウェイトリストに登録していたMaxユーザー向けにのみ)
Claude for Chrome拡張機能では、Sonnet 4.5の強化されたコンピュータ使用機能を活用できます。
Claudeがブラウザ内で直接動作し、サイトを操作し、スプレッドシートを記入したりすることもできます。
このデモでは、まず以下のように拡張機能のチャット画面に指示をします。
そうすると、ブラウザの画面を確認しながら、情報抽出だけでなくスクロールなどの画面操作を自動的に行ってくれます。
そして、計画に応じて、GmailやGoogleスプレッドシートを開きます。
最終的には、メール送信などもしてくれます。
DiaやCommetなどの他のブラウザでも同様の機能はありますが、compute useの精度が高いという点が最大の特徴と言えるでしょう。
4. 開発者向け新機能
さらに、APIやSDKを使う開発者向けのニュースも2つありました!
「Claude API」の新機能
まず、Claude APIに、新しくコンテキスト編集機能とメモリツールが追加されました!
これにより、エージェントがより長時間稼働し、さらに高度な複雑性に対応できるようになりました。
より具体的には、以下のようにコンテキストがいっぱいになったりしている時に、古いコンテキストの要約をしたりして、コンテキストの余白を作成します。
「Claude Agent SDK(旧:Claude Code SDK)」の新機能
Anthropic社は6か月以上にわたりClaude Codeのアップデートを提供してきたため、AIエージェントを構築・設計するために必要なものを熟知しています。
例えば、以下のような手法論についてのナレッジがあります。
- 長時間タスクにおけるエージェントのメモリ管理方法
- 自律性とユーザー制御を両立する権限システムの扱い方
- 共有目標に向けて複数のサブエージェントを調整する方法
これらのナレッジをもとに構成されたエージェント開発用のSDKが、Claude Agent SDKです。
Claude Agent SDKとは
Claude Agent SDKとは、Anthropicの提供するエージェント開発ツール(SDK)です。
Claude Codeを支えているのと同じインフラでありながらも、コーディングだけでなく非常に幅広いタスクで効果を発揮します。
プロダクトの概要動画はこちら👇
具体的には、以下のようなエージェントを開発できます。
- Code Security Agent / コードセキュリティエージェント
- Code Review Agent / コードレビューエージェント
- Contract Review Agent / 契約書レビューエージェント
- Meeting Summary Agent / 会議要約エージェント
- Financial Reporting Agent / 財務報告エージェント
- Email Automation Agent / メール自動化エージェント
- Invoice Processing Agent / 請求書処理エージェント
5. 新しいソフトウェア設計の手法 "Imagine with Claude"
Claude Sonnet 4.5と同時に、期間限定の研究プレビュー「Imagine with Claude」が発表されました。
Imagine with Claudeとは
Imagine with Claudeとは、機能要件やコードを事前に用意せず、その場でその場でソフトウェアを生成するという実験的取り組みです。
例えば、以下のような画面があったときに、「View details」ボタンを押すと、ユーザーの意図に基づいてその場でソースコードを生成します。
コード中心型から意図駆動型へ
Claudeは、全体的なコンテキストからユーザーが何を見たいのかを推測します。
そして、「ユーザーがXをクリックした、ということはYを見たいのだろう」と推論し、必要なものを即座に提供します。
そのため、「Code-centric Engineering(コード中心の開発)」から「Intent-driven Creation(意図駆動の創造)」へのシフトを見据えた実験と捉えることができます。
将来的に、本当に既製のソフトウェアに頼るのではなく、必要な時に必要なソフトウェアを作り出せるようになるかもしれません。
「Imagine with Claude」は今後5日間、Maxサブスクライバー向けに提供されます。
公式の解説動画はこちら👇
よくある質問
-
Q: Claude Sonnet 4.5とClaude Sonnet 4の違いは何ですか?
- A: Claude Sonnet 4.5は、コーディング精度、コンピュータ使用精度、安全性において大幅な性能向上を実現しています。特にSWE-bench Verifiedでは82.0%を達成し、世界最高水準となっています。料金は基本的に同じですので、アップグレードを推奨します。
-
Q: Claude Code 2.0の主な新機能は何ですか?
- A: VS Code拡張機能(β版)、刷新されたターミナルインターフェース、チェックポイント機能が主な新機能です。チェックポイント機能により、Escを2回押すか/rewindコマンドで以前のバージョンに戻ることができます。
-
Q: Claude Agent SDKを使うとどんなエージェントが作れますか?
- A: コードセキュリティ、コードレビュー、契約書レビュー、会議要約、財務報告、メール自動化、請求書処理など、幅広いユースケースのエージェントを開発できます。
-
Q: Imagine with Claudeはいつまで利用できますか?
- A: 期間限定の研究プレビューとして、発表から5日間、Maxサブスクライバー向けに提供されます。claude.ai/imagineからアクセスできます。
-
Q: Claude Sonnet 4.5のAPI料金はいくらですか?
- A: 200Kトークン以下の場合、入力は100万トークンあたり$3、出力は100万トークンあたり$15です。200Kトークン超の場合は、入力$15、出力$22.5となります。
最後に
最後まで読んでくださり、ありがとうございました!
この記事を通して、少しでもあなたの学びに役立てば幸いです!
宣伝:もしもよかったらご覧ください^^
『AIとコミュニケーションする技術(インプレス出版)』という書籍を出版しました🎉
これからの未来において「変わらない知識」を見極めて、生成AIの業界において、読まれ続ける「バイブル」となる本をまとめ上げました。
かなり自信のある一冊なため、もしもよろしければ、ご一読いただけますと幸いです^^
参考文献
Discussion