Claude Opus 4.6がリリース — 100万トークン・Agent Teams・PowerPoint統合など新機能まとめ
はじめに
2026年2月5日(木)、Anthropicは最新フラグシップモデル Claude Opus 4.6 を発表しました。前モデルClaude Opus 4.5のリリースからわずか約3ヶ月でのアップデートとなります。
本記事では、公式発表や各メディアの報道をもとに、Opus 4.6の主な変更点・新機能・ベンチマーク結果・開発者向け情報をまとめます。
モデル概要
| 項目 | 内容 |
|---|---|
| モデル名 | Claude Opus 4.6 |
| API識別子 | claude-opus-4-6 |
| リリース日 | 2026年2月5日 |
| 前モデル | Claude Opus 4.5(2025年11月リリース) |
| コンテキストウィンドウ | 100万トークン(ベータ)※ Opusクラス初 |
| 最大出力トークン | 128,000トークン |
| 価格 | 入力 $5 / 出力 $25(100万トークンあたり) |
| プレミアム価格 | 入力 $10 / 出力 $37.50(20万トークン超のコンテキスト使用時) |
| 利用可能環境 | claude.ai、Claude API、AWS/GCP/Azure |
価格はOpus 4.5から据え置きです。
主な新機能
1. 100万トークンコンテキストウィンドウ(ベータ)
Opusクラスとしては初めて、100万トークンのコンテキストウィンドウが利用可能になりました。これにより、大規模なコードベース全体や大量のドキュメントセットを一度に処理できます。
長文コンテキストでの性能を測るMRCR v2ベンチマーク(needle-in-a-haystack型のテスト)では、Opus 4.6が 76% を記録。Sonnet 4.5の18.5%と比較して圧倒的な差を見せています。
2. Agent Teams(リサーチプレビュー)
Claude Codeに Agent Teams 機能が追加されました。これは複数のAIエージェントがタスクを分担し、並列に作業する仕組みです。
Anthropicの製品責任者Scott White氏は「1つのエージェントが順番にタスクをこなすのではなく、フロントエンド担当・API担当・マイグレーション担当のように作業を分割し、それぞれが自律的に連携できる」と説明しています。
API利用者およびサブスクリプションユーザー向けにリサーチプレビューとして提供されます。
3. Claude in PowerPoint(リサーチプレビュー)
ClaudeがMicrosoft PowerPointに直接統合されました。既存のスライドレイアウト・フォント・テンプレートを読み取り、企業のデザインガイドラインに沿ったスライドの生成・編集が可能です。
以前はClaude側でPowerPointファイルを生成し、その後PowerPointに転送する必要がありましたが、今回のアップデートでPowerPoint内から直接Claudeを利用できるようになりました。Max、Team、Enterpriseプランで利用可能です。
4. Adaptive Thinking(適応的思考)
Opus 4.6はコンテキストの手がかりから、どの程度深く考えるべきかを自律的に判断する Adaptive Thinking を搭載しています。これはAnthropicモデルとしては初の機能です。
デフォルトではAdaptive Thinking(自動判断)が有効になっており、モデルがプロンプトの複雑さに応じて思考の深さを調整します。開発者は必要に応じてAPIの effort パラメータで4段階(low / medium / high / max)を明示的に指定し、レイテンシーとコストのトレードオフを制御することも可能です。シンプルなタスクで「考えすぎ」が気になる場合は medium の利用が推奨されています。
5. Context Compaction(ベータ)
長時間のAPI対話において、古い会話のトークンを要約してコンテキストウィンドウの空きを確保する Context Compaction がベータで提供されます。長時間のエージェントタスクでコンテキスト上限に達するのを防ぎます。
6. US Data Residency
米国内のみでワークロードを実行するオプションが追加されました。デジタル主権への対応ですが、利用料金が10%上乗せになります。
ベンチマーク結果
主要ベンチマークの比較です。
コーディング系
| ベンチマーク | Opus 4.6 | Opus 4.5 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 65.4% | 59.8% | 64.7% | 56.2% |
| SWE-bench Verified | 80.8% | 80.9% | 80.0% | 76.2% |
| OSWorld(Computer Use) | 72.7% | 66.3% | — | — |
Terminal-Bench 2.0とOSWorldでは業界トップですが、SWE-bench VerifiedではOpus 4.5からわずかに低下(80.9% → 80.8%)しています。
推論・知識系
| ベンチマーク | Opus 4.6 | Opus 4.5 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|---|
| ARC AGI 2 | 68.8% | 37.6% | 54.2% | 45.1% |
| BrowseComp(検索) | 84.0% | 67.8% | 77.9% | 59.2% |
| GDPval-AA Elo | 1,606 | — | 約1,462 | — |
特にARC AGI 2での伸びが顕著です。このベンチマークは「人間には簡単だがAIには難しい」問題を測定するもので、Opus 4.5の37.6%から68.8%へと大幅に向上しました。
ツール使用
| ベンチマーク | Opus 4.6 | Opus 4.5 | GPT-5.2 |
|---|---|---|---|
| MCP Atlas | 59.5% | 62.3% | 60.6% |
MCP Atlasベンチマーク(ツール使用のスケール性テスト)ではOpus 4.5から若干の後退が見られます。
セキュリティ分野での成果
Anthropicのフロンティアレッドチームがリリース前にOpus 4.6をテストしたところ、オープンソースコード内で 500件以上の未知のゼロデイ脆弱性 を発見しました。
具体的には以下のような脆弱性が報告されています。
- GhostScript(PDF/PostScript処理ユーティリティ)のクラッシュ脆弱性
- OpenSC(スマートカードデータ処理)のバッファオーバーフロー
- CGIF(GIFファイル処理ツール)のバッファオーバーフロー
いずれもAnthropicチームまたは外部セキュリティ研究者によって検証済みです。Anthropicのフロンティアレッドチーム責任者Logan Graham氏は「防御側と攻撃側の競争であり、防御側にできるだけ早くツールを渡したい」とコメントしています。
一方で、悪用防止のため新たなセキュリティコントロールも追加されています。Anthropicは悪意ある利用を迅速に特定・対応するための安全対策を講じたとしており、「正当な研究や防御的な作業にも摩擦が生じる可能性がある」と認めた上で、セキュリティ研究コミュニティと協力して対処していく方針を示しています。
開発者向けまとめ
APIアクセス
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-opus-4-6",
max_tokens=1024,
messages=[
{"role": "user", "content": "Hello, Opus 4.6!"}
]
)
主な開発者向け変更点
-
モデル文字列:
claude-opus-4-6 - 100万トークンコンテキスト: ベータ(20万トークン超はプレミアム価格)
-
Adaptive Thinking: デフォルトは自動判断。必要に応じて
effortパラメータでlow/medium/high/maxを明示指定可能 - Context Compaction: ベータ。長時間対話で自動的にコンテキストを要約
- 出力上限: 最大128,000トークン
- Agent Teams: Claude Codeでリサーチプレビュー
- GitHub Copilot: Pro/Pro+/Business/Enterpriseで利用可能(段階的ロールアウト)
市場への影響
Opus 4.6のリリースは、すでに大きな市場影響を及ぼしている文脈の中で行われました。
1月にリリースされたClaude Coworkとそのプラグインにより、法務・金融分析ソフトウェア株が急落。Reutersの報道によると、Thomson ReutersやLegalzoomなどが大幅に下落し、ソフトウェアセクターETFも大きな売り圧力を受けました。
Anthropicのエンタープライズ製品責任者Scott White氏は「ソフトウェアエンジニアリングでvibe codingが生まれたように、今度は"vibe working"の時代に移行しつつある」と述べています。
Reutersによると、Anthropicは30万社以上の有料法人顧客を抱えており、エンタープライズ顧客が事業の約80%を占めています。また、a16zが2026年1月に公開したエンタープライズAI調査では、Anthropicを本番環境で利用している企業の割合が約40%に達したと報告されています(ただしこの数値は調査対象・方法によりばらつきがある点に留意が必要です)。
まとめ
Claude Opus 4.6は「マイナーバージョンアップ」的なナンバリングに反して、かなり実質的なアップデートです。
- 100万トークンコンテキスト で大規模コードベースやドキュメントの一括処理が可能に
- Agent Teams で複数エージェントの並列作業が実現
- Adaptive Thinking でコスト・レイテンシーの柔軟な制御
- ARC AGI 2で68.8% など多くのベンチマークで業界トップ
- PowerPoint統合 でナレッジワーカー向けの実用性が大幅向上
- 500件超のゼロデイ発見 というセキュリティ面での実績
特にAPI開発者やClaude Codeユーザーにとっては、100万トークンコンテキスト・Agent Teams・Context Compactionの3つが日常のワークフローに直接影響する大きな変更です。エンタープライズ利用を考えている方は、Adaptive Thinkingのeffortパラメータによるコスト最適化も検討の価値ありです。
Discussion