Claude Opus 4.6:長文脈、Agent Teams、そしてClaude Codeの新しい基準
· 約4分
Anthropic は 2026-02-05 に Claude Opus 4.6 を発表し、コーディングと長時間のエージェント作業に向けた大きなアップグレードとして位置付けました。Claude Code のドキュメント視点では、このリリースは単なるモデル品質の向上ではなく、タスクの構造化、コンテキスト管理、信頼性の高い多段ワークフロー設計を変えるものです。
Anthropic が提供した内容(公式ハイライト)
Opus 4.6 は、計画性、長期タスクの持久力、大規模コードベースでの信頼性に焦点を当てています。主な更新点は次のとおりです。
- より優れたコーディングとコードレビュー:複雑なソフトウェア作業における計画、デバッグ、自己修正が改善。
- 1Mトークンのコンテキスト(beta):100万トークンのウィンドウをサポートする初の Opus クラスモデル。大規模リポジトリや長文向け。
- API の長時間タスク用ツール:適応的思考、effort コントロール(low/medium/high/max)、コンテキスト圧縮(compaction)により、多段エージェントを限界まで使い切らずに動かせる。
- 大きな出力:最大 128k の出力トークンで、大規模リファクタや複数ファイル変更に対応。
- Claude Code の Agent Teams(研究プレビュー):コードベースレビューのような読み取りが多いタスク向けの並列サブエージェント。
- 提供範囲と価格:claude.ai、API、主要クラウドで提供。基本価格は 100万トークンあたり $5/$25 のまま。Developer Platform では 200k トークン超のプロンプトにプレミアム料金が適用。
他のレビューやベンチマークの声
外部報道は、開発者向けのユースケースから、スプレッドシートやプレゼンを含む幅広い知識労働へと広がる流れを強調しつつ、Agent Teams や長文脈といった開発者向けの強化も引き続き評価しています。The Verge は文書中心のタスクでの性能向上と、Cowork を通じたビジネスワークフローへの拡大を指摘。TechCrunch は Agent Teams を開発者向けの目玉機能として取り上げています。TechRadar は、Opus 4.6 がテストでオープンソースライブラリの高深刻度脆弱性を 500 件以上見つけたという Anthropic の 主張を強調しています。
コミュニティのベンチマークブログでも、2026 年 2 月初旬時点で Opus 4.6 が SWE-bench Verified のリーダーボード上位にあることが示されており、実務的なコーディングタスクでの勢いを裏付けています。
Claude Code ユーザー向けの見立て
Opus 4.6 は Claude Code のデフォルトの進め方を、実務的に 3 つの点で変えます。
- 並列化前提で設計する。 Agent Teams により、コード読み取り、テスト、移行作業を分割でき、単一の逐次エージェントに頼る必要がなくなります。大規模リポジトリの監査やリファクタ計画で大きな変化です。
- 推論深度の予算化。 適応的思考と effort レベルにより、「推論 vs レイテンシ」が一級の制御パラメータになります。日常タスクは低 effort でコストを抑え、リスクの高いリファクタは high か max を選ぶ価値があります。
- コンテキストをライフサイクルで扱う。 1M ウィンドウと compaction で長期エージェントを維持できる一方、要所での要約、スナップショット、チェックポイントの計画が必要です。