🚀

Claude Sonnet 4.5 & Claude Code 2.0の最新情報【まとめ】

ますみ / 生成AIエンジニア

2025/10/02に公開

はじめまして、ますみです！
株式会社Galirage（ガリレージ）という「生成AIに特化して、システム開発・アドバイザリー支援・研修支援をしているIT企業」で、代表をしております^^

 本記事のサマリーClaude Sonnet 4.5は世界最高のコーディングモデルで、SWE-bench Verifiedで82.0%を達成しました。
Claude Code 2.0は、VS Code拡張機能、刷新されたターミナルUI、チェックポイント機能を提供します。
Claude APIに新しいコンテキスト編集機能とメモリツールが追加され、長時間稼働が可能になりました。
Claude Agent SDKにより、開発者は独自のエージェント体験を構築できるようになりました。
Imagine with Claudeは、コード中心から意図駆動へのソフトウェア開発の未来を示す実験的取り組みです。

 はじめに2025年9月30日、Anthropicはエンジニアにとって非常に嬉しい大ニュースを発表しました！
AIモデル「Claude Sonnet 4.5」のリリースと、開発ツール「Claude Code 2.0」への大幅アップデートです🎉
この他にも、そしてウェブアプリ・API・Chrome拡張機能などの新発表も複数ありました🚀
本記事では、これらの最新情報を網羅的にまとめて解説していきます！

 1. 「Claude Sonnet 4.5」の最新情報
 Claude Sonnetとは？Claude Sonnetは、Anthropicが開発するAIモデルシリーズの中核を担うモデルです。コストパフォーマンスと性能のバランスに優れており、幅広い用途で活用されています。
今回リリースされたClaude Sonnet 4.5は、このシリーズの最新版であり、特にコーディング精度やコンピュータ使用精度、そして安全性において、大幅な性能向上を実現しています。
ちなみに、Claudeのモデルファミリーには、「Opus / Sonnet / Haiku」という3種類のモデルがあり、以下のような特徴があります。

Haiku（Light & fast）
最速のモデル。
軽量なアクションを業界トップクラスのスピードで実行可能。


Sonnet（Hard-working）
パフォーマンスとスピードのバランスが最も良い。
効率的かつ高スループットなタスクに適している。


Opus（Powerful）
最も知能が高いモデル。
複雑な分析やステップが多いタスク、高度な数学・コーディングに対応可能。


 Claude Sonnet 4.5の精度
 コーディング精度（coding）Claude Sonnet 4.5は、複数のベンチマークで世界最高水準（SOTA）の性能を示しています。
SWE-bench Verified（Agentic coding）という実世界のソフトウェアコーディング能力を測定する評価において、Claude Sonnet 4.5は「77.2%（parallel test-time computeという並列処理をする手法をした場合は、82.0%）」のスコアを達成しました。これは現時点で世界最高の性能です。
また、実際の使用では、複雑で多段階のタスクにおいて30時間以上の集中力（継続的なコーディングやテストなど）を維持することが確認されており、長時間にわたる開発作業でも安定した性能を発揮します。

 コンピューター使用精度（computer use）実世界のコンピュータタスクでAIモデルをテストするベンチマークOSWorldでは、Sonnet 4.5が「61.4%」でトップとなりました！
4か月前にSonnet 4が42.2%からの大幅な進歩と言えるでしょう。

 その他の一般的なベンチマーク精度Claude Sonnet 4.5は、推論や数学を含む幅広い評価においても能力向上を示しています。
すべてにおいてSOTAと言えるわけではないですが、Sonnet 4と比べた時の成長自体は確認できました（すなわち精度の側面においては、どんなケースであっても4.5にモデルアップデートをした方が良い）。

 領域特化の知識特定の領域に特化した知識についてのベンチマークにおいても、従来のClaudeのモデルと比べて、精度向上をしました！
「金融、法律、医学、STEM分野」の専門家による評価結果は下記の通りです。

 Claude Sonnet 4.5のAPI料金性能が大幅に向上しても、基本的にはClaude Sonnet 4と同じ料金に据え置かれています。
200Kトークン以下の場合は、以下のような料金（Claude Sonnet 4と同じ料金）です。
入力：100万トークンあたり$3
出力：100万トークンあたり$15
200Kトークンよりも多い場合は、以下のような料金です。
入力：100万トークンあたり$15
出力：100万トークンあたり$22.5
最新の情報は、下記のページをご参照ください。

https://www.claude.com/pricing#api
また、Opus 4.1とHaiku 3.5と比べた時の価格は下記の通りです。

 Claude Sonnet 4.5の安全性
 不適合行動の大幅な削減モデルがより高性能であるほど、より慎重な監視とアラインメントが必要です。
Anthropicでは、AIの能力向上に伴う新たなリスクを軽減すべく、Sonnet 4と4.5の間にアラインメント改善において大幅な進歩を遂げました。
不適合行動（Misaligned Behavior）とは、AIが示す可能性のある望ましくない振る舞いのことです。例えば、以下のような行動が含まれます。

へつらい（Sycophancy）: ユーザーの意見に無批判に同調し、正確性よりも好意を優先する行動

欺瞞（Deceptiveness）: ユーザーを誤解させる可能性のある不正確または誤解を招く情報を提供する行動

権力追求（Power-seeking）: AIが目標を達成するために不必要に制御やアクセス権を拡大しようとする傾向

妄想的思考の助長（Corrigibility）: フィードバックや修正に対して抵抗し、自己改善を妨げる行動
Claudeの性能向上と徹底した安全性トレーニングにより、これらの懸念される行動を大幅に減らすことができました。
また、エージェント的能力やコンピュータ利用機能については、これらを利用するユーザーにとって最も深刻なリスクのひとつであるプロンプトインジェクション攻撃への防御において大きな進展を遂げました。

 ASL-3保護Claude Sonnet 4.5は、モデル能力と適切な安全策を対応させるAnthropicのフレームワークに従い、AI セーフティレベル3（ASL-3）の保護のもとでリリースされました。
これらの安全策の中では、特に「化学・生物・放射線・核（CBRN）兵器」に関連する潜在的に危険な入出力を検知されるようになっています。
誤検知についても、2025年5月のClaude Opus 4リリース時から半分に減らすことに成功しました。

 Claude Sonnet 4.5の導入方法
 Claude APIによる実装開発者であれば、Claude APIからclaude-sonnet-4-5というモデルを指定するだけで簡単に導入できます。
import anthropic

client = anthropic.Anthropic(
    # defaults to os.environ.get("ANTHROPIC_API_KEY")
    api_key="my_api_key",
)
message = client.messages.create(
    model="claude-sonnet-4-5",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Hello, Claude"}
    ]
)
print(message.content)
もしもすでにClaude Sonnet 4を使われている場合は、基本的に、料金や精度を比較したときに、Claude Sonnet 4.5が優位なため、アップグレードを推奨します（完全上位互換のモデル）。

 CursorやGitHub Copilotでの利用Claude Sonnet 4.5は、CursorやGitHub CopilotなどのAI支援開発ツールでも利用可能です。
各ツールの設定画面からモデルを選択することで、Sonnet 4.5の高度なコーディング能力を活用できます。


Redditのサイトより引用

 2. 「Claude Code 2.0」の最新情報ここまで「Claude Sonnet 4.5」の話をしてきましたが、ここからはお待ちかねの「Claude Code 2.0」の説明に入ります！

 「Claude Sonnet 4.5」への対応まず、Claude Codeの新しいデフォルトモデルとしてClaude Sonnet 4.5が使えるようになりました！
そのため、より長く複雑な開発タスクを処理できるようになりました。
もしもモデルを切り替えたい場合は、/modelコマンドで変更できます。
基本的には、1M context（めっちゃ高額だがロングコンテキストな設定）は、設定しない限り、使用されないようなため、一安心ですね😌

もしもClaude Code 2.0へアップグレード（もしくはインストール）したい場合は、npm install -g @anthropic-ai/claude-codeと実行しましょう。
https://www.npmjs.com/package/@anthropic-ai/claude-code

 「VS Code拡張機能（β版）」の公式リリースClaude CodeをIDEに直接組み込むネイティブのVS Code拡張機能をベータ版で提供されました！
専用のサイドバーパネルでインライン差分を確認でき、Claudeの変更をリアルタイムで見ることができます。
この拡張機能は、ターミナルよりIDEで作業することを好むユーザーに対し、より豊かで視覚的なClaude Code体験を提供します。
VS Code Extension Marketplaceからダウンロードして始められます。
https://marketplace.visualstudio.com/items?itemName=anthropic.claude-code
また、紹介動画はこちらです👇

https://www.youtube.com/watch?v=IpFG_K-1xog

 「Terminalのインターフェース」の刷新Claude Codeのターミナルインターフェースも刷新されました！

 「ステータス表示」の可視性向上更新されたインターフェースでは、ステータスの可視性が向上し、Claudeが現在何をしているのかをリアルタイムで把握できるようになりました！
正直、ここは大きく変わった気はしませんが、確かに少しだけUIが綺麗になったような気がします。

 「プロンプト履歴の検索機能」のリリースさらに、検索可能なプロンプト履歴（Ctrl+r）が追加され、過去のプロンプトを再利用・編集しやすくなりました。

 「チェックポイント機能」のリリースClaude Codeがますます複雑なタスクを担う中で重要になってくるチェックポイント機能が導入されました！（これは、本当に嬉しい。。。）

 チェックポイントとは複雑な開発はしばしば探索と試行錯誤を伴います。
新しいチェックポイントシステムは、変更前に自動でコードの状態を保存し、Escを2回押すか/rewindコマンドを使うことで即座に以前のバージョンに戻ることができます。
一点だけ注意事項として、チェックポイントはClaudeの編集に適用に対してのみ適用されて、ユーザーの編集やbashコマンドには適用されません。

 Subagents / Hooks / Background tasksとの組み合わせチェックポイントは、その他のClaude Codeの機能と組み合わせると特に有効です。

Subagentsでは、バックエンドAPIを開発するエージェントを立ち上げながら、フロントエンドを構築するエージェントを動かすことができる機能です。このような並行開発をして、バグが出てきた時に、過去の特定のタイミングまで戻りながらデバッグをすることができるのはとても便利だと言えるでしょう。

Hooksとは、特定のタイミングで自動的にアクションを実行し、コード変更後のテスト実行やコミット前のリンティングを可能にします。Hooksによって、自動的にコード編集がされた場合、その前の時点まで戻したいことがあり、そのような時にチェックポイントが役に立ちます。

Background tasksとは、長時間稼働するプロセス（開発サーバーの立ち上げやパッケージのインストールなど）を実行しながら、Claude Codeのタスク実行を可能とする機能です。こうした非同期プロセスを実行する前の時点に戻したいという場合にもチェックポイントは有用です。
これらの機能を使用する際に、ぜひチェックポイントを使ってみてください◎

 3. ユーザー向け新機能
 「Claude apps」の新機能Claude appsでは、会話の中でコード実行やファイル作成（スプレッドシート、スライド、文書）が直接できるようになりました。
コード実行やファイル作成機能は、すべての有料プランで利用可能です。

 「Claude for Chrome」の新リリースClaude for Chrome拡張機能というGoogle Chromeの拡張機能の提供が開始されました！

（先月、ウェイトリストに登録していたMaxユーザー向けにのみ）
Claude for Chrome拡張機能では、Sonnet 4.5の強化されたコンピュータ使用機能を活用できます。
Claudeがブラウザ内で直接動作し、サイトを操作し、スプレッドシートを記入したりすることもできます。
https://www.youtube.com/watch?v=oXfVkbb7MCg
このデモでは、まず以下のように拡張機能のチャット画面に指示をします。
そうすると、ブラウザの画面を確認しながら、情報抽出だけでなくスクロールなどの画面操作を自動的に行ってくれます。

そして、計画に応じて、GmailやGoogleスプレッドシートを開きます。

最終的には、メール送信などもしてくれます。

DiaやCommetなどの他のブラウザでも同様の機能はありますが、compute useの精度が高いという点が最大の特徴と言えるでしょう。

 4. 開発者向け新機能さらに、APIやSDKを使う開発者向けのニュースも2つありました！

 「Claude API」の新機能まず、Claude APIに、新しくコンテキスト編集機能とメモリツールが追加されました！
これにより、エージェントがより長時間稼働し、さらに高度な複雑性に対応できるようになりました。
https://www.anthropic.com/news/context-management
より具体的には、以下のようにコンテキストがいっぱいになったりしている時に、古いコンテキストの要約をしたりして、コンテキストの余白を作成します。

 「Claude Agent SDK（旧：Claude Code SDK）」の新機能Anthropic社は6か月以上にわたりClaude Codeのアップデートを提供してきたため、AIエージェントを構築・設計するために必要なものを熟知しています。
例えば、以下のような手法論についてのナレッジがあります。
長時間タスクにおけるエージェントのメモリ管理方法
自律性とユーザー制御を両立する権限システムの扱い方
共有目標に向けて複数のサブエージェントを調整する方法
これらのナレッジをもとに構成されたエージェント開発用のSDKが、Claude Agent SDKです。

 Claude Agent SDKとはClaude Agent SDKとは、Anthropicの提供するエージェント開発ツール（SDK）です。
Claude Codeを支えているのと同じインフラでありながらも、コーディングだけでなく非常に幅広いタスクで効果を発揮します。
プロダクトの概要動画はこちら👇
https://www.youtube.com/watch?v=OZ-aLrJ0oVg
具体的には、以下のようなエージェントを開発できます。
Code Security Agent / コードセキュリティエージェント
Code Review Agent / コードレビューエージェント
Contract Review Agent / 契約書レビューエージェント
Meeting Summary Agent / 会議要約エージェント
Financial Reporting Agent / 財務報告エージェント
Email Automation Agent / メール自動化エージェント
Invoice Processing Agent / 請求書処理エージェント

 5. 新しいソフトウェア設計の手法 "Imagine with Claude"Claude Sonnet 4.5と同時に、期間限定の研究プレビュー「Imagine with Claude」が発表されました。

 Imagine with ClaudeとはImagine with Claudeとは、機能要件やコードを事前に用意せず、その場でその場でソフトウェアを生成するという実験的取り組みです。
例えば、以下のような画面があったときに、「View details」ボタンを押すと、ユーザーの意図に基づいてその場でソースコードを生成します。

 コード中心型から意図駆動型へClaudeは、全体的なコンテキストからユーザーが何を見たいのかを推測します。
そして、「ユーザーがXをクリックした、ということはYを見たいのだろう」と推論し、必要なものを即座に提供します。
そのため、「Code-centric Engineering（コード中心の開発）」から「Intent-driven Creation（意図駆動の創造）」へのシフトを見据えた実験と捉えることができます。
将来的に、本当に既製のソフトウェアに頼るのではなく、必要な時に必要なソフトウェアを作り出せるようになるかもしれません。
「Imagine with Claude」は今後5日間、Maxサブスクライバー向けに提供されます。
公式の解説動画はこちら👇
https://www.youtube.com/watch?v=dGiqrsv530Y

 よくある質問Q: Claude Sonnet 4.5とClaude Sonnet 4の違いは何ですか？
A: Claude Sonnet 4.5は、コーディング精度、コンピュータ使用精度、安全性において大幅な性能向上を実現しています。特にSWE-bench Verifiedでは82.0%を達成し、世界最高水準となっています。料金は基本的に同じですので、アップグレードを推奨します。
Q: Claude Code 2.0の主な新機能は何ですか？
A: VS Code拡張機能（β版）、刷新されたターミナルインターフェース、チェックポイント機能が主な新機能です。チェックポイント機能により、Escを2回押すか/rewindコマンドで以前のバージョンに戻ることができます。
Q: Claude Agent SDKを使うとどんなエージェントが作れますか？
A: コードセキュリティ、コードレビュー、契約書レビュー、会議要約、財務報告、メール自動化、請求書処理など、幅広いユースケースのエージェントを開発できます。
Q: Imagine with Claudeはいつまで利用できますか？
A: 期間限定の研究プレビューとして、発表から5日間、Maxサブスクライバー向けに提供されます。claude.ai/imagineからアクセスできます。
Q: Claude Sonnet 4.5のAPI料金はいくらですか？
A: 200Kトークン以下の場合、入力は100万トークンあたり$3、出力は100万トークンあたり$15です。200Kトークン超の場合は、入力$15、出力$22.5となります。

 最後に最後まで読んでくださり、ありがとうございました！

この記事を通して、少しでもあなたの学びに役立てば幸いです！
!【📩 仕事の相談はこちら 📩】

お仕事の相談のある方は、下記のフォームよりお気軽にご相談ください。

https://forms.gle/G5g1SJ7BBZw7oXYA7
もしもメールでの問い合わせの方がよろしければ、下記のメールアドレスへご連絡ください。
info*galirage.com（*を@に変えてご送付ください）
宣伝：もしもよかったらご覧ください^^『AIとコミュニケーションする技術（インプレス出版）』という書籍を出版しました🎉
これからの未来において「変わらない知識」を見極めて、生成AIの業界において、読まれ続ける「バイブル」となる本をまとめ上げました。
かなり自信のある一冊なため、もしもよろしければ、ご一読いただけますと幸いです^^

 参考文献https://www.anthropic.com/news/claude-sonnet-4-5
https://www.anthropic.com/news/enabling-claude-code-to-work-more-autonomously

Galirage Inc.

株式会社Galirageのテックブログです！ Galirageでは、生成AIのシステム開発・コンサルティング・研修を行なっております。 ▼ 問い合わせ先 ▼ info@galirage.com

本記事のサマリー

はじめに

1. 「Claude Sonnet 4.5」の最新情報

Claude Sonnetとは？

Claude Sonnet 4.5の精度

コーディング精度（coding）

コンピューター使用精度（computer use）

その他の一般的なベンチマーク精度

領域特化の知識

Claude Sonnet 4.5のAPI料金

Claude Sonnet 4.5の安全性

不適合行動の大幅な削減

ASL-3保護

Claude Sonnet 4.5の導入方法

Claude APIによる実装

CursorやGitHub Copilotでの利用

2. 「Claude Code 2.0」の最新情報

「Claude Sonnet 4.5」への対応

「VS Code拡張機能（β版）」の公式リリース

「Terminalのインターフェース」の刷新

「ステータス表示」の可視性向上

「プロンプト履歴の検索機能」のリリース

「チェックポイント機能」のリリース

チェックポイントとは

Subagents / Hooks / Background tasksとの組み合わせ

3. ユーザー向け新機能

「Claude apps」の新機能

「Claude for Chrome」の新リリース

4. 開発者向け新機能

「Claude API」の新機能

「Claude Agent SDK（旧：Claude Code SDK）」の新機能

Claude Agent SDKとは

5. 新しいソフトウェア設計の手法 "Imagine with Claude"

Imagine with Claudeとは

コード中心型から意図駆動型へ

よくある質問

最後に

参考文献

Discussion